娈量间相关关系,统计案例
第十章
第四节
变量间的相关关系
、统计案例
一、重点:
1、利用散点图判断变量间是否具有相关关系. 2、求回归直线方程和利用回归直线方程作出估计。
难点:
回归分析与独立性检验的应用。
二、知识框图
三、典型例题
1、(1.对变量 x,y 有观测数据(x i ,y i )(i=1,2,…,10),得散点图①; 对变量u,v有观测数据(u i ,v i )(i=1,2,…,10),得散点图②.由这两个散点图可以判断(
) A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关, u 与 v 负相关 2、已知变量 x,y 呈线性相关关系,线性回归方程为 y=0.5+2x,则变量 x,y 是(
) A.线性正相关关系 B.由回归方程无法判断其正负相关 C.线性负相关关系 D.不存在线性相关关系 3、(2014·镇江模拟)如图所示,有A,B,C,D,E,5组数据,去掉________组数据后,剩下的 4 组数据具有较强的线性相关关系. 4、已知下列表格所示数据的回归直线方程为y^ =3.8x+a,则 a 的值为________. x 2 3 4 5 6 y 251 254 257 262 266 5、某高校“初步统计”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业 性别
非统计专业 统计专业 男 13 10 女 7 20 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 χ2=50×?13×20-10×7?223×27×20×30≈4.844, 因为 χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________. 四:自我检测 1、某产品的广告费用 x 与销售额 y 的统计数据如下表:
广告费用 x(万元) 4 2 3 5 销售额 y(万元) 49 26 39 54 根据上表得回归方程y=bx+a中b为9.4,据此模型预报广告费用为6万元时销售额为(
). A.63.6 万元
B.65.5 万元
C.67.7 万元
D.72.0 万元 2、已知 x、y 的取值如下表:
x 0 1 3 4 y 2.2 4.3 4.8 6.7 从所得的散点图分析,y 与 x 线性相关,且 y=0.95x+a,则 a=________. 3、某种产品的广告费支出 x 与消费额 y(单位:百万元)之间有如下对应数据:
x 2 4 5 6 8 y 30 40 60 50 70 (1)画出散点图; (2)求线性回归方程; (3)预测当广告费支出为 700 万元时的销售额. 五、总结提升
1. 回归直线必过( x , y )点,而可能所有的样本数据点都不在直线上.
2.掌握求回归直线方程与独立性检验的一般步骤。
3.明确独立性检验的思想。
六、学生作业
1、 某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录 了 1 到 6 月份每月 10 号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期 1月10日 2月10日 3月10日 4月10日 5月10日 6月10日 昼夜温 差 x(℃) 10 11 13 12 8 6 就诊人 数 y(个) 22 25 29 26 16 12 该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用选取的 2 组数据进行检验.若选取的是 1 月与 6 月的 2 组数据,请根据 2 至 5 月份的数据,求出 y 关于 x 的线性回归方程y^ =b ^ x+a ^ ; 2、有甲、乙两个班级进行数学考试,按照大于等于 85 分为优秀,85 分以下为非优秀统计成绩后,得到如下的列联表.
优秀 非优秀 总计 甲班 10
乙班
30
合计 105
已知从全部 105 人中随机抽取 1 人为优秀的概率为 27 . (1)请完成上面的列联表; (2)根据列联表数据,若按 95%的可靠性要求,能否认为“成绩与班级有关系”; 七:课时达标
1、已知 x,y 之间的数据如表所示,则回归直线过点(
) x 1 2 3 4 5
y 1.2 1.8 2.5 3.2 3.8 A.(0,0)
B.(2,1.8) C.(3,2.5)
D.(4,3.2) 2、高三某班学生每周用于物理学习的时间 x(单位:小时)与物理成绩 y(单位:分)之间有如下关系:
x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 根据上表可得回归方程的斜率为 3.53,则回归直线在 y 轴上的截距为________.(答案保留到 0.1) 3、通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由 K 2 =nad-bc 2a+bc+da+cb+d , 算得 K 2 = 110×40×30-20×20260×50×60×50≈7.8. 附表:
P(K 2 ≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 参照附表,得到的正确结论是(
) A.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” C.有 99%以上的把握认为“爱好该项运动与性别有关” D.有 99%以上的把握认为“爱好该项运动与性别无关”
上一篇:上海市消防局文件沪消发327号