ImageVerifierCode 换一换
格式:DOCX , 页数:18 ,大小:292.85KB ,
资源ID:9614707      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/9614707.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第7课时线性回归分析与统计案例.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第7课时线性回归分析与统计案例.docx

1、第7课时线性回归分析与统计案例第7课时线性回归分析与统计案例1甲、乙、丙、丁四位同学各自对 A , B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:甲乙丙丁r0.820.780.690.85则哪位同学的试验结果体现 A,B两变量有更强的线性相关性 ( )A .甲 B .乙C.丙 D .丁答案 D2. (2018湖北七市联考)广告投入对商品的销售额有较大影响某电商对连续 5个年度的广告费x和销售额y进行统计,得到统计数据如下表 (单位:万元):广告费x23456销售额y2941505971由上表可得回归方程为y=io.2x+a,据此模型,预测广告费为io万元时销售额约为()

2、A. 101.2 万元C. 111.2 万元答案 CB . 108.8 万元D . 118.2 万元一 1 一 1 A解析 根据统计数据表,可得 x =-x (2 + 3+ 4 + 5+ 6) = 4, y =-x (29+ 41 + 50 + 59+ 71) = 50,而回归直线y5 5=10.2x+ a经过样本点的中心 (4, 50) , 50 = 10.2 X 4+ ;,解得;=9.2,二回归方程为 b= 10.2x + 9.2,二当 x=10 时,y= 10.2X 10 + 9.2= 111.2,故选 C.3. (2018赣州一模)以下四个命题:1从匀速传递的产品生产流水线上,质检员每

3、 20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;2两个随机变量相关性越强,则相关系数的绝对值越接近于 1;3在回归直线方程y= 0.2x + 12中,当解释变量x每增加1个单位时,预报变量平均增加 0.2个单位;4分类变量X与Y,对它们的随机变量 K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.其中真命题为()A .B .C.答案 DD .解析 为系统抽样;分类变量X与Y,对它们的随机变量 K2的观测值k来说,k越大,“X与Y有关系的把握程度越大.4 .下面是一个2X 2列联表y1y2总计其中a, b处填的值分别为( )A.94 72C. 52 74X1a2173

4、X2222547合计b46120B.52 50D. 74 52答案 C解析 由 a+ 21= 73,得 a= 52, a+ 22= b,得 b = 74故选 C.5.(2018湖南衡阳联考)甲、乙、丙、丁四位同学各自对 A , B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数 r与残差平方和 m,如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现 A , B两变量有更强的线性相关性 ( )A .甲 B .乙C.丙 D .丁答案 D解析r越大,m越小,线性相关性越强.故选 D.6. (2018衡水中学调研)以下四个命题中,真命题是

5、( )A 对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“ x与y有关系”的把握程度越大B. 两个随机变量的线性相关性越强,相关系数的绝对值越接近于 0C. 若数据X1, X2, X3,Xn的方差为1,则2X1 , 2X2, 2X3,,2Xn的方差为2D .在回归分析中,可用相关指数 R2的值判断模型的拟合效果, R2越大,模型的拟合效果越好答案 D解析 对于A,对分类变量x与y的随机变量K2的观测值k来说,k越大,判断“x与y有关系”的把握程度 越大,故A错误;对于B,两个随机变量的线性相关性越强,相关系数的绝对值越接近于 1,故B错误;对于C,若数据X1, X2, X3,,Xn

6、的方差为1,则2X1, 2x2, 2x3,,2Xn的方差为4,故C错误;对于D ,根据离散变量的线性相关及相关指数的有关知识可知 D正确.7. 2015年年度史诗大剧芈月传风靡大江南北,影响力不亚于以前的甄嬛传 .某记者调查了大量芈月传的观众,发现年龄段与爱看的比例存在较好的线性相关关系, 年龄在10 , 14, 15 ,19, 20 , 24, 25 ,2930 , 34的爱看比例分别为 10%, 18% , 20%, 30% , t%.现用这5个年龄段的中间值代表年龄段,女口 12代表10 , 14 , 17代表15 , 19,根据前四个数据求得爱看比例 y关于x的线性回归方程为y = (

7、kx 4.68)% ,由此可推测t的值为()A.33 B. 35C. 37 D. 39答案 B1 解析 依题意,X=:x (12+ 17+ 22 + 27) = 19.5,41 y= (10% + 18% + 20% + 30%) = 19.5% ,& (2018广西南宁月考)某同学寒假期间对其 30位亲属的饮食习惯进行了一次调查,列出了如下列联表:偏爱蔬菜偏爱肉类合计50岁以下481250岁以上16218合计201030则可以说其亲属的饮食习惯与年龄有关的把握为 ( )附: k2= (a+b)( n+d)d(ba+ c)( b+d)2P(K k0)0.150.100.050.0250.010

8、0.0050.001k02.0722.7063.8415.0246.6357.87910.828A.90% B . 95%D . 99.9%C. 99%答案 C属的饮食习惯与年龄有关.9. 2017世界特色魅力城市 200强新鲜出炉,包括黄山市在内的 28个中国城市入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”, 某调查机构为了了解“自助游”是否与性别有关, 在黄山旅游节期间,随机抽取了 100人,得如下所示的列联表:赞成“自助游”不赞成“自助游”合计男性301545女性451055合计7525100参照公式,得到的正确结论是 ( )A 有99.5%以上的把握认为“赞成自

9、助游与性别无关”B.有99.5%以上的把握认为“赞成自助游与性别有关”C. 在犯错误的概率不超过 0.1的前提下,认为“赞成自助游与性别无关”D 在犯错误的概率不超过 0.1的前提下,认为“赞成自助游与性别有关” 参考公式: K2= “j:d ,其中 n= a + b + c+ d.(a+ b)( c+ d) ( a+ c)( b + d)2P(K k0)0.150.100.050.0250.0100.0050.001在犯错误的概率不超过 0.1的前提下,可以认为 “赞成自助游与性别有关10 某研究机构对高三学生的记忆力X681012y2356x和判断力y进行统计分析,所得数据如下表:B y

10、= 2.3x + 0.7则y对x的线性回归直线方程为(A y = 2.3x 0.7C. y = 0.7x 2.3 D . y = 0.7x + 2.3ny 君 xiy nxy y y(相关公式: b= n , a= y bx)Exi2 nx2i = 1 (四舍五入到整数).答案 C答案 73所以 66= 0.36 X 70+ a,解得 a = 40.8.所以 0.36X 90 + 40.8 = 73.2 73.12.某工厂为了对一种新研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)456789销量y(件)908483807568由表中数据,求得线性回归方程为

11、y=4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为1答案3 解析 由表中数据得x = 6.5, y= 80,由y= 4x +彳,得a= 106,故线性回归方程为y =- 4x + 106将(4,90),(5, 84), (6, 83), (7, 80), (8, 75), (9, 68)分别代入回归方程,可知有 6个基本事件,因 84 4X 5+ 10621=86, 68 k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828答案(1)见解析(2)有关解析(1)根据频率分布直方图可知,

12、前两组的学生总数为 (0.032 + 0.08) X 5X 50= 10,又前两组的学生中体育生有8名,所以前两组的学生中艺术生有 2名,故2X 2列联表如下:14. (2018山东日照一模)某学校高三年级有学生 500人,其中男生300人,女生200人.为了研究学生的数学体育生常年进行系统的身体锻炼,艺术生则很少进行系统的身体锻炼,若前两组的学生中体育生有成绩是否与性别有关,现采用分层抽样的方法,从中抽取了 100名学生,先统计了他们期中考试的数学分数,然后按性别分为男、 女两组,再将两组学生的分数分成 5组:100, 110), 110,120),120,130),130, 140),14

13、0, 150分别加以统计,得到如图所示的频率分布直方图.(1)从样本中分数低于110分的学生中随机抽取两人,求这两人恰好为一男一女的概率;(2)若规定分数不低于130分的学生为“数学尖子生”, 请你根据已知条件完成 2X 2列联表,并判断是否有90% 的把握认为“数学尖子生与性别有关”.2附:k2= n( ad be)附 (a+ b)( e + d)( a+ e)( b + d)P(K2 k)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828答案(1)3有关5解析(1)由已知得,抽取的100名学生中,男生60名,女生40名.分数低于110分的

14、学生中,男生有 60X 0.05= 3(人),记为A1, A2, A3;女生有40X 0.05= 2(人),记为B-B2.从中随机抽取两名学生,所有的可能结果共有 10种,它们是(A1 , A2), (A1, A3), (A2, A3), (A1, B1), (A1,B2), (A 2, B1), (A2, B2), (A3, B1), (A3, B2)(B1, B2);其中两名学生恰好为一男一女的可能结果共有 6种,它们是(A1, B1), (A1, B2), (A2, B1), (A2, B2), (A3,B1), (A3, B0.所求概率为p=詈|.由频率分布直方图可知,在抽取的 100

15、名学生中,分数不低于 130分的男生人数为60X 0.25= 15,分数不低于130分的女生人数为 40X 0.4= 16,据此可得2X 2列联表如下:数学尖子生非数学尖子生合计男生154560女生162440合计3169100260 X 40 X 31 X 69.k2= 100 X( 15X 24二 16X 45) 2.5252.706 , 没有90%的把握认为“数学尖子生与性别有关15.(2017四川广元二诊)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了 12月1日至12月5日的每天昼夜温差与实验室每天每 100颗种子中的发芽数, 得到如下资

16、料:日期12月1日12月2日12月3日12月4日12月5日温差x( C)101113128发芽数y(颗)2325302616该农科所确定的研究方案是: 先从这5组数据中选取2组,用剩下的3组数据求线性回归方程, 再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻两天数据的概率;若选取的是12月1日与12月5日的数据,请根据12月2日至12月4日的数据,求出y关于x的线性回 归方程y = bx + a;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2颗则认为得到的线性回归方程是可靠的试问(2)中所得到的线性回归方程是可靠的吗?b : * a y b 元附:回

17、归直线的斜率和截距的最小二乘估计公式分别为:3a 5答案(1)5 (2) y = |x- 3可靠解析(1)设“选取的2组数据恰好是不相邻两天的数据 ”为事件A.从 5 组数据中选取 2 组数据共有 10 种情况:(1 , 2), (1 , 3), (1 , 4), (1 , 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5),其中数据为12月份的日期数.每种情况都是等可能出现的,事件 A包括的基本事件有 6种. p(A)=器 3.选取的2组数据恰好是不相邻两天数据的概率是 3.5a (11 12)X( 25 27) + ( 13 12)X( 3

18、0 27) + ( 12 12)X( 26 27) 5 b= ( 11 12) 2+( 13 12) 2+( 12 12) 2 = 2,A 5a= y b x = 27 5X 12= 3.y关于x的线性回归方程为y = ;x 3.当 x= 10 时,y = |x 10 3= 22 , |22 23|2;a 5同理,当 x= 8 时,y =,X 8 3= 17, |17 16|2.(2)中所得到的线性回归方程是可靠的.16.(2018河北唐山模拟)某市春节期间7家超市的广告费支出 xi(万元)和销售额yi(万元)数据如下:超市ABCDEFG广告费支出Xj1246111319销售额yi193240

19、44525354若用线性回归模型拟合 y与x的关系,求y关于x的线性回归方程;用二次函数回归模型拟合 y与x的关系,可得回归方程: y A = - 0.17x2+ 5x + 20,经计算二次函数回归模型和线性回归模型的 R2分别约为0.92和0.75,请用R2说明选择哪个回归模型更合适,并用此模型预测 A超市广告费支出3万元时的销售额.n7 7 2 a jt/iyi-n - y a a参考数据及公式:x= 8, y = 42,12 xiyi = 2 794,12 xi = 708, b = n , a= y bx.i=1 i=1 厂 2 2t xi nxi = 1答案 (1) y = 1.7x

20、 + 28.4 (2)33.477 一 a it1Xiyi 7 x y 2 794 一 7X 8X 42 a a解析 (1) b = = ; 8。2 = 1.7, a= y bx = 42 1.7X 8= 28.4.t Xi2 7x2 708 7 X 8i = 1 y关于X的线性回归方程是y = 1.7x + 28.4./ 0.75 k)0.50.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828答案 B解析 只有错误,应该是y平均减少5个单位.3.(2018湖南衡

21、阳模拟)根据“ 2015年国民经济和社会发展统计公报”中公布的数据,从 2011年到2015年,4.我国的第三产业在 GDP中的比重如下:年份20112012201320142015年份代码x12345第三产业比重y/%44.345.546.948.150.5(1)在所给坐标系中作出数据对应的散点图;建立第三产业在 GDP中的比重y关于年份代码x的回归方程;O 2 3 4 5 6 -V5A 君(X x)( y y) 15 一 A A(2)x 3, y 47.06, b 5 1.5, a y bx 42.56,占(xi -x) 2 10所以回归直线方程为y 1.5x + 42.56.代入2018

22、年的年份代码x 8,得y 1.5X 8 + 42.56 54.56,所以按照当时的变化趋势,预计到 2018年,我国第三产业在 GDP中的比重将达到 54.56%.5.假设关于某种设备的使用年限 x(年)与所支出的维修费用 y(万元)有如以下的统计数据;x(年)23456y(万元)2.23.85.56.57.0已知 土 =90工 = 110.呂.工 rfy = 12, 3*Al 1 i 1求x , y ;(2)对x, y进行线性相关性检验;(3)如果x与y具有线性相关关系,求出回归直线方程;估计使用年限为10年时,维修费用约是多少?答案 x = 4, y = 5 (2)略 (3) y = 1.23x+ 0.08 (4)12.38 万元因为斗眄加_円=112. 3-5X 1X5 = 12. 3, 并一5 工= SW 5X 16=10,J13-57=140, 8-125=15. 8,1因为0.9870.75,所以x与y之间具有很强的线性相关关系.r 工巧头_5 r 1 7 s因 为卄=匚 =十于 =1. 23 皿 =y h亍=S-L 23X 1-0. 08.所以所求的回归直线方程为$ = h 230.08.12.38万元.当x= 10时,y = 1.23X 10 + 0.08 = 12.38,即估计使用年限为 10年时,维修费用约为

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1