1、回归分析及独立性检验回归分析与独立性检验1.回归分析的含义是什么?有哪些基本步骤?线性回归模型怎样用表达式表示?产生随机误差的原 因是什么?2.回归方程中:与b怎样求解?3.刻画回归效果的方式有哪些?(1)残差 (2)残差图(3) 残差图法(4) 残差平方和 (5)相关指数只1.判一判(正确的打“ J”,错误的打“ X ”)(1) 在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量.()(2) 求线性回归方程前可以不进行相关性检验.()(3) 在残差图中,纵坐标为残差,横坐标可以选为样本编号.()2、 一位母亲记录了儿子39岁的身高数据,并由此建立的身高 与年龄的回归模型
2、为二7. 19x+7393,用这个模型预测这个孩子10岁时的身高,则下列说法正确的C身髙在145. 83cm左右 D.身高在145. 83cm以下有下列说法:在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;用相关指数R来刻画回归的效果,R值越大,说明模型的拟合效果越好;比较两个模型的拟合效 果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好苴中正确命题的个数是A. 0 B. 1 C.2 D. 3【典例1】(1)(2014 合肥高二检测)已知一个回归方程护=1.5x+45,xGl,7,5, 13, 19,甥=A. 9 B. 45 C. 58. 5 D. 1
3、.5(2)如图所示的是四个残差图,其中回归模型的拟合效果最好的是()r(3)为研究质量x (单位:克)对弹簧长度y (单位:厘米)的影响,对不同质量的6个物体进行测量,数据 如下表所示:X51015202530y7. 258.128. 959. 9010.911.8出散点图,并求线性回归方程;求出R ; 进行残差分析.类型二非线性回归分析【典例2两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的2)在一次抽样调查中,测得样本的5个样本点的数值如下表:X0. 250.5124y1612521试写出y与x之间的回归方程.【易错误区】对回归系数的含义理解错误【典例】(2014 合肥高二检测)废
4、品率臨和每吨生铁成本表明()A.废品率每增加1%,生铁成本增加259元B.废品率每增加1%,生铁成本增加3元C.废品率每增加1%,生铁成本平均每吨增加3元 D.废品率不变,生铁成本为256元【提升练习】1.(2014 梅州髙二检测)在2012年8月15日那天,某物价部门对本市的5家商场的某商品的一天 销售量价格进行调査,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格X99.5m10.511销售量y11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归直线方程是:仁-32x+40, 且m+n二20,则英中的n二 .2、设三组实验数据(X1, y:), (X:
5、,y:), (x5,ys)的回归直线方程是:y=x+a,使代数式y( Z X1+ a ):+兀-(r x:+ 2 ):+ y3-( Z Xs+ a ):的值最小Xi + -彳刃均数)若有七组数据列表如下:X2345678y4656.287. 18.6(1)求上表中前三组数据的回归直线方程.若| yr(加+仍丨W0. 2,即称(x:, yj为中回归直线的拟合“好点”,求后四组数据中拟合“好点”的概率.1.分类变咼的概念是什么?什么是列联表,什么是2X2列联表?2.等高条形图的优点是什么?如何利用等髙条形图判断两个变量之间的关系?3.独立性检验的概念是什么?怎样进行独立性检验?1.判一判(正确的打
6、“ J ”,错误的打“ X ”)(1) 事件A与B的检验无关,即两个事件互不影响.()(2) 事件A与B关系越密切,就越大.()K的大小是判断事件A与B是否相关的唯一数据.()2、 下列不是分类变量的是()A.近视 B.身高 C.血压 D.药物反应类型-等高条形图的应用【典例1】(1)观察下列各图,其中两个分类变量X,Y之间关系最强的是()(2) (2014 青岛高二检测)某学校对高三学生作了一项调査发现:在平时的模拟考试中,性格内向的 学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等髙 条形图,利用图形判断考前心情紧张与性格类别是否有关系.类型二
7、独立性检验【典例2】(2014台州高二检测)在独立性检验中,统计量K有三个临界值:2. 706, 3. 841和6. 635;R C当K3. 841时,在犯错误的概率不超过0. 05的前提下说明两个事件有关,当K6. 635时,在犯错误 的概率不超过001的前提下说明两个事件有关,当K2706时,认为两个事件无关在一项打鼾与患 心脏病的调查中,共调查了 2000人,经计算K=20. 87,根拯这一数据分析,认为打軒与患心脏病之间()A.在犯错误的槪率不超过0. 05的前提下认为两者有关 B.约有95%的打軒者患心脏病C.在犯错误的概率不超过0. 01的前提下认为两者有关 D.约有99%的打軒者
8、患心脏病(2) (2014 执信髙二检测)某食品厂为了检査甲乙两条自动包装流水线的生产情况,随机在这两条 流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495, 510的产品为合格品,否则为不合格品表1是甲流水线样本频数分布表图1是乙流水线样本频率分布直方图.若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多 少;由以上统计数据作出2X2列联表,并回答在犯错误的概率不超过多少的前提下认为“产品的包装 质量与两条自动包装流水线的选择有关”【提升练习】1. (2014 德州高二检测)假设两个分类变量X与Y,它们的取值分别为&,&, y“yj, 其2X2列联表如图所示:对于以下数拯,对同一样本能说明X与Y有关的可能性最大的一组为()Yiy:总计X1aba+bX:Cdc+d总计a+cb+da+b+c+dA. a=50, b二40, c=30, d=20 B. a=50, b=30, c=20, d=40C. a=50, b二20, c=40, d=30 D. a=20, b二30, c=50, d=40(注:本资料素材和资料部分来自网络,仅供参考。请预览后才下载,期待您的好评 与关注!)
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1