高考微点十一 统计与统计案例
高考微点十一
统计与统计案例
牢记概念公式,避免卡壳 1.抽样方法 (1)抽样方法主要有简单随机抽样、分层抽样. (2)每种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2.统计中的四个数据特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:x-= 1n (x 1 +x 2 +„+x n ). (4)方差与标准差 方差:s 2 = 1n [(x 1 -x-) 2 +(x 2 -x-) 2 +„+(x n -x-) 2 ]. 标准差:s 2 =1n [(x 1 -x-)
2 +(x 2 -x-)
2 +„+(x n -x-)
2 ]. 3.线性回归方程 方程y^=b^x+a^称为线性回归方程,其中b^=∑ni = 1 x i y i -n x-
y- ∑ni = 1 x2i -nx- 2 ,a^=y--b^x-,(x-,y-)称为样本点的中心. 活用结论规律,快速抢分 1.频率分布直方图的关系 (1)小长方形面积=组距× 频率组距 =频率; (2)所有小长方形面积的和=各组频率和=1. 2.在残差分析中,相关指数 R 2 越大,残差平方和越小,线性回归模型的拟合效果越好.
3.平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据的分散程度越大,越不稳定;标准差、方差越小,数据的分散程度越小,越稳定. 4.独立性检验 利用随机变量 K 2 =n(ad-bc)
2(a+b)(c+d)(a+c)(b+d)
来判断“两个分类变量有关系”的方法称为独立性检验.如果 K 2 的观测值 k 越大,说明“两个分类变量有关系”的这种判断犯错误的可能性越小. 高效微点训练,完美升级 1.某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示).据此估计此次考试成绩的众数是(
)
A.100
B.110
C.115
D.120 解析 众数是一组数据中出现次数最多的数,结合题中频率分布折线图可以看出,数据“115”对应的纵坐标最大,所以相应的频率最大,频数最大,据此估计此次考试成绩的众数是 115. 答案 C 2.某小卖部为了了解热茶销售量 y(杯)与气温 x(℃)之间的关系,随机统计了某 4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1 杯数 24 34 38 64 由表中数据算得回归方程y^=b^x+a^中的b^=-2,预测当天气温为-5 ℃时,热茶销售量为(
) A.70
B.50
C.60
D.80
解析 由表中数据,得x-= 14 ×(18+13+10-1)=10,y-= 14 ×(24+34+38+64)=40,将(10,40)代入回归方程y^=b^x+a^中,且b^=-2, 所以 40=10×(-2)+a^,解得a^=60, 所以y^=-2x+60. 所以当 x=-5 时,y^=-2×(-5)+60=70, 预测当天气温为-5 ℃时,热茶销售量为 70 杯. 答案 A 3.某中学有高中生 3 500 人,初中生 1 500 人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则n 为(
) A.100
B.150
C.200
D.250 解析 法一 由题意可得70n-70 =3 5001 500 ,解得 n=100. 法二 由题意,抽样比为703 500 =150 ,总体容量为 3 500+1 500=5 000,故 n= 5 000×150 =100. 答案 A 4.若数据 x 1 ,x 2 ,x 3 ,„,x n 的平均数为x-=5,方差 s 2 =2,则数据 3x 1 +1,3x 2 +1,3x 3 +1,„,3x n +1 的平均数和方差分别为(
) A.5,2
B.16,2
C.16,18
D.16,9 解析 ∵x 1 ,x 2 ,x 3 ,„,x n 的平均数为 5, ∴ x1 +x 2 +x 3 +„+x nn=5, ∴ 3x1 +3x 2 +3x 3 +„+3x nn+1 =3×5+1=16, ∵x 1 ,x 2 ,x 3 ,„,x n 的方差为 2,
∴3x 1 +1,3x 2 +1,3x 3 +1,„,3x n +1 的方差是 3 2 ×2=18. 答案 C 5.甲、乙两名同学 6 次考试的成绩如图所示,且这 6 次成绩的平均分分别为x-甲 ,x-乙 ,标准差分别为 σ 甲 ,σ 乙 ,则(
)
A.x-甲 <x-乙 ,σ 甲 <σ 乙
B.x-甲 <x-乙 , σ 甲 >σ 乙
C.x-甲 >x-乙 ,σ 甲 <σ 乙
D.x-甲 >x-乙 ,σ 甲 >σ 乙
解析 由题图可知,甲同学除第 2 次考试成绩低于乙同学外,其他 5 次考试成绩都高于乙同学,所以x-甲 >x-乙 . 又由题图中数据知甲同学的成绩波动没有乙同学的成绩波动大,所以甲同学的成绩更稳定,所以 σ 甲 <σ 乙 ,故选 C. 答案 C 6.从某小学随机抽取 100 名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图,如图所示,由图中数据可知,身高在[120,130)内的学生人数为(
)
A.20
B.25
C.30
D.35 解析 由图可知,(0.035+a+0.020+0.010+0.005)×10=1,解得 a=0.030,所以身高在[120,130)内的学生人数在样本中的频率为 0.030×10=0.3,所以身高在[120,130)内的学生人数为 0.3×100=30. 答案 C 7.(基础题供选用)如图是甲、乙两位同学高二上学期历史成绩的茎叶图,有一个数字被污损,用 a(3≤a≤8 且 a∈N)表示被污损的数字.则甲同学的历史平均成绩不
低于乙同学的历史平均成绩的概率为(
)
A. 13
B. 56
C. 16
D. 23
解析 易知x-甲 =92 分, 依题意,x-乙 = 15 (86+88+92+98+90+a)≤92,得 a≤6, 因为 3≤a≤8,所以 3≤a≤6 且 a∈N,记甲同学的历史平均成绩不低于乙同学的历史平均成绩为事件 A,则事件 A 包含 4 个基本事件,且基本事件总数共有 6 个,∴P(A)= 46 =23 . 答案 D 8.(多选题)下列说法中正确的是(
) A.若分类变量 X 和 Y 的随机变量 K 2 的观测值 k 越大,则“X 与 Y 相关”的可信程度越小 B.对于自变量 x 和因变量 y,当 x 取值一定时,y 的取值具有一定的随机性,x,y间的这种非确定关系叫做函数关系 C.相关系数|r|越接近 1,表明两个随机变量线性相关性越弱 D.两个模型相关指数 R 2 1 >R 2 2 ,则前者拟合效果更好 E.若分类变量 X 与 Y 的随机变量 K 2 的观测值 k 越小,则两个分类变量有关系的把握性越小 解析 随机变量 K 2 的观测值 k 越大,则“X 与 Y 相关”的可信度越大,观测值 k越小,则两个分类变量有关系的把握性越小,因此 A 错,E 正确. 显然 x,y 间是相关关系,不是函数关系,B 错. 相关系数|r|越接近 1,表明两个随机变量线性相关性越强,故 C 错.相关指数越大,模型拟合效果越好,D 正确. 答案 DE 9.甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做试验,并用回归分
析方法分别求得相关系数 r 与残差平方和 m,如下表:
甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则根据试验结果,体现 A,B 两变量有更强的线性相关性的是________. 解析 丁的数据中 r 最大,m 最小,故更能体现变量 A,B 的线性相关性. 答案 丁 10.在一个容量为 5 的样本中,数据均为整数,已求出其平均数为 10,但墨水污损了两个数据,其中一个数据的十位数字 1 未被污损,即 9,10,11,1■,■,那么这组数据的方差 s 2 可能的最大值是________. 解析 设这组数据的最后两个数分别是 10+x,y(x 为[0,9]中的自然数,y 为整数),则 9+10+11+(10+x)+y=50,得 x+y=10,故 y=10-x, 故 s 2 = 1+0+1+x2 +(-x)
25= 25 +25 x2 ,显然 x 最大取 9 时,s 2有最大值 32.8. 答案 32.8 11.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取 50 名同学(男 30,女 20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)
几何题 代数题 总计 男同学 22 8 30 女同学 8 12 20 总计 30 20 50 根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________. 附表:
P(K 2 ≥k 0 ) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0
2.072 2.706 3.841 5.024 6.635 7.879 10.828 解析 由列联表计算 K 2 的观测值 k= 50×(22×12-8×8)230×20×20×30≈5.556>5.024.∴推
断犯错误的概率不超过 0.025. 答案 0.025 12.某省高考改革实施方案指出:该省高考考生总成绩将由语文、数学、外语 3 门统一高考成绩和学生自主选择的学业水平等级性考试科目成绩共同构成,该省教育厅为了解正在读高中的学生家长对高考改革方案所持的态度,从中随机抽取了100 名城乡家长作为样本进行调查,调查结果显示样本中有 25 人持不赞成意见,如图是根据样本的调查结果绘制的等高条形图.
(1)根据已知条件与等高条形图完成下面的 2×2 列联表,并判断我们能否有 95%的把握认为“对高考改革方案的态度与城乡户口有关”?
赞成 不赞成 合计 城镇居民
农村居民
合计
(2)用样本的频率估计概率,若随机在全省不赞成高考改革方案的家长中抽取3个,记这 3 个家长中是城镇户口的人数为 X,试求 X 的分布列及数学期望 E(X). 附:K 2 =n(ad-bc)
2(a+b)(c+d)(a+c)(b+d)
,其中 n=a+b+c+d. P(K 2 ≥k 0 ) 0.10 0.05 0.005 k 0
2.706 3.841 7.879 解 (1)完成 2×2 列联表,如下:
赞成 不赞成 合计 城镇居民 30 15 45 农村居民 45 10 55 合计 75 25 100 代入公式,得
K 2 =n(ad-bc)
2(a+b)(c+d)(a+c)(b+d)
= 100×(300-675)245×55×75×25≈3.03<3.841. ∴我们没有 95%的把握认为“对高考改革方案的态度与城乡户口有关”. (2)用样本的频率估计概率,随机在全省不赞成高考改革方案的家长中抽取一人,该人是城镇户口的概率为 0.6,是农村户口的概率为 0.4. X 的所有可能取值为 0,1,2,3. P(X=0)=(0.4) 3 =0.064, P(X=1)=C 1 3 ×0.6×(0.4) 2 =0.288, P(X=2)=C 2 3 ×0.6 2 ×0.4=0.432, P(X=3)=C 3 3 ×0.6 3 =0.216. ∴X 的分布列为 X 0 1 2 3 P 0.064 0.288 0.432 0.216 E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8. 13.随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加.下表是某购物网站 2019 年 1~8 月促销费用(万元)和产品销量(万件)的具体数据. 月份 1 2 3 4 5 6 7 8 促销费用 x 2 3 6 10 13 21 15 18 产品销量 y 1 1 2 3 3.5 5 4 4.5 (1)根据数据绘制散点图能够看出可用线性回归模型拟合 y 与 x 的关系,请用相关系数 r 加以说明; (2)建立 y 关于 x 的回归方程y^=b^x+a^ (系数精确到 0.01),如果该公司计划在 9 月份实现产品销量超 6 万件,预测至少需投入促销费用多少万元(结果精确到 0.01). 参考数据:∑8i = 1
(x i -11)(y i -3)=74.5,∑8i = 1
(x i -11)2 =340,∑8i = 1
(y i -3)2 =16.5, 340≈18.44, 16.5≈4.06,其中 x i ,y i 分别为第 i 个月的促销费用和产品销量,i=1,2,3,„,8. 参 考 公 式 :
(ⅰ) 样 本 (x i , y i )(i = 1 , 2 , „ , n) 的 相 关 系 数 r =
∑ni = 1
(x i -x-)(y i -y-)∑ni = 1
(x i -x-)
2 ∑ni = 1
(y i -y-)
2. (ⅱ)线性回归方程y^=b^x+a^, 其中b^=∑ni = 1
(x i -x-)(y i - y-
)∑ni = 1
(x i -x-)
2 解 (1)由题可知x-=11,y-=3,将数据代入 r=∑ni = 1
(x i -x-)(y i -y-)∑ni = 1
(x i -x-)
2 ∑ni = 1
(y i -y-)
2, 得 r≈74.518.44×4.06 ≈0.995. 因为 y 与 x 的相关系数近似为 0.995,说明 y 与 x 的线性相关性很强,从而可以用线性回归模型拟合 y 与 x 的关系. (2)将数据代入b^=∑ni = 1
(x i -x-)(y i -y-)∑ni = 1
(x i -x-)
2, 得b^= 74.5340 ≈0.22, a^=y--b^x-=3-0.22×11≈0.58, 所以 y 关于 x 的回归方程为 y^=0.22x+0.58. 由y^=0.22x+0.58>6,解得 x>24.64, 即至少需要投入促销费用 24.64 万元.
上一篇:回程车网站规划
下一篇:统计学_第三阶段练习