学年高中数学苏教版选修23教学案32 回归分析 Word版缺答案.docx
《学年高中数学苏教版选修23教学案32 回归分析 Word版缺答案.docx》由会员分享,可在线阅读,更多相关《学年高中数学苏教版选修23教学案32 回归分析 Word版缺答案.docx(12页珍藏版)》请在冰豆网上搜索。
学年高中数学苏教版选修23教学案32回归分析Word版缺答案
_3.2回_归_分_析
1.线性回归模型
(1)随机误差
具有线性相关关系的两个变量的取值x、y,y的值不能由x完全确定,可将x,y之间的关系表示为y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差.
(2)随机误差产生的主要原因
①所用的确定性函数不恰当引起的误差;
②忽略了某些因素的影响;
③存在观测误差.
(3)线性回归模型中a,b值的求法
y=a+bx+ε称为线性回归模型.
a,b的估计值为,,则
(4)回归直线和线性回归方程
直线=+x称为回归直线,此直线方程即为线性回归方程,称为回归截距,称为回归系数,称为回归值.
2.样本相关系数r及其性质
(1)r=.
(2)r具有以下性质
①|r|≤1.
②|r|越接近于1,x,y的线性相关程度越强.
③|r|越接近于0,x,y的线性相关程度越弱.
3.对相关系数r进行显著性检验的基本步骤
(1)提出统计假设H0:
变量x,y不具有线性相关关系.
(2)如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n-2在教材附录2中查出一个r的临界值r0.05(其中1-0.95=0.05称为检验水平).
(3)计算样本相关系数r.
(4)作出统计推断:
若|r|>r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.
1.在线性回归方程中,b既表示回归直线的斜率,又表示自变量x的取值增加一个单位时,函数值y的改变量.
2.通过回归方程=+x可求出相应变量的估计值.
3.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.
线性回归分析
[例1] 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由数据可知,y对x呈现线性相关关系.
(1)求线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
[思路点拨] 代入数值求线性回归方程,然后把x=10代入,估计维修费用.
[精解详析]
(1)列表如下:
i
1
2
3
4
5
xi
2
3
4
5
6
yi
2.2
3.8
5.5
6.5
7.0
xiyi
4.4
11.4
22.0
32.5
42.0
x
4
9
16
25
36
经计算得:
=4,=5,=90,iyi=112.3,
于是有==1.23,
=-·=0.08,
所以线性回归方程为=+x=0.08+1.23x.
(2)当x=10时,=0.08+1.23×10=12.38(万元),
即若估计使用年限为10年时,维修费用为12.38万元.
[一点通] 线性回归分析的步骤:
(1)列出散点图,从直观上分析数据间是否存在线性相关关系;
(2)计算,,,,iyi;
(3)代入公式求出=x+中参数,的值;
(4)写出线性回归方程,并对实际问题作出估计.
1.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:
x
6
8
10
12
y
2
3
5
6
则y对x的线性回归方程为________.
解析:
∵==9,==4,
xiyi=6×2+8×3+10×5+12×6=158,
x=62+82+102+122=344,
∴===0.7,
=4-0.7×9=-2.3.
故y对x的线性回归方程为=0.7x-2.3.
答案:
=0.7x-2.3
2.某班5名学生的数学和物理成绩如表:
学生
学科
A
B
C
D
E
数学成绩(x)
88
76
73
66
63
物理成绩(y)
78
65
71
64
61
(1)画出散点图;
(2)求物理成绩y对数学成绩x的线性回归方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.
解:
(1)散点图如图.
(2)∵=×(88+76+73+66+63)=73.2.
=×(78+65+71+64+61)=67.8.
xiyi=88×78+76×65+73×71+66×64+63×61=25054.
又x=882+762+732+662+632=27174.
∴=≈0.625.
∴=-=67.8-0.625×73.2=22.05.
∴y对x的线性回归方程是=0.625x+22.05.
(3)当x=96时,=0.625×96+22.05≈82.
可以预测他的物理成绩是82.
相关性检验
[例2] 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下:
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:
这10名学生的两次数学成绩是否具有线性关系?
[思路点拨] 可先计算线性相关系数r的值,然后与r0.05比较,进而对x与y的相关性作出判断.
[精解详析] =(120+108+…+99+108)=107.8,
=(84+64+…+57+71)=68.
=1202+1082+…+992+1082=116584.
=842+642+…+572+712=47384.
iyi=120×84+108×64+…+99×57+108×71
=73796.
所以相关系数为
r=
≈0.751.
由检验水平0.05及n-2=8,
在附录2中查得r0.05=0.632,
因为0.751>0.632,
由此可看出这10名学生的两次数学成绩具有较强的线性相关关系.
[一点通] 利用相关系数r进行判断相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器,但计算时应该特别细心,避免出现计算错误.
3.对于回归分析,有下列叙述:
(1)在回归分析中,变量间的关系若是非确定性关系,则因变量不能自由变量惟一确定.
(2)线性相关系数可以是正的或是负的.
(3)回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关.
(4)样本相关系数r∈(-∞,+∞).
判断其说法是否正确.
解:
由回归模型及其性质易知
(1),
(2),(3)是正确的.相关系数的取值范围应为|r|≤1,所以(4)是错误的.
4.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少,随机器运转的速度而变化,下表为抽样试验的结果:
转速x(转/秒)
16
14
12
8
每小时生产有缺点的零件数y(件)
11
9
8
5
对变量y与x进行线性相关性检验.
解:
由题中数据可得=12.5,=8.25,xiyi=438,
4=412.5,x=660,y=291,所以
r=
=
=≈0.995.
由检验水平0.05及n-2=2在教材附录表2中查得r0.05=0.950,因为r>r0.05,所以y与x具有线性相关关系.
对两个相关变量进行线性回归分析时,首先判断两个变量是否线性相关,可以通过散点图和相关系数判断,然后再求线性回归方程,对问题进行预测,否则求出的回归方程无意义,预测也无价值.
[对应课时跟踪训练(十九)]
一、填空题
1.下列命题中正确的是________(填所有正确命题的序号).
①任何两个变量都具有相关关系;
②圆的周长与圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的线性回归方程可能是没有意义的;
⑤两个变量的线性相关关系可以通过线性回归方程,把非确定性问题转化为确定性问题进行研究.
解析:
显然①是错误的;而②中,圆的周长与圆的半径的关系为C=2πR,是一种确定性的函数关系.
答案:
③④⑤
2.已知x,y的取值如下表:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从所得的散点图分析,y与x线性相关,且=0.95x+,则=________.
解析:
∵=2,=4.5.又回归直线恒过定点(,),代入得=2.6.
答案:
2.6
3.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为=0.849x-85.712,则身高172cm的女大学生,由线性回归方程可以估计其体重为________.
解析:
=0.849×172-85.712=60.316.
答案:
60.316kg
4.有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其断面直径与高度之间的关系;
⑤学生与其学号之间的关系.
其中有相关关系的是____________.(填序号)
解析:
由相关关系定义分析.
答案:
①③④
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得线性回归方程y=x+中的为9.4,据此模型预报广告费用为6万元时销售额为________万元.
解析:
样本中心点是(3.5,42),则=-=42-9.4×3.5=9.1,所以线性回归方程是=9.4x+9.1,把x=6代入得=65.5.
答案:
65.5
二、解答题
6.下面是水稻产量与施肥量的一组观测数据:
施肥量
15
20
25
30
35
40
45
水稻产量
320
330
360
410
460
470
480
(1)将上述数据制成散点图;
(2)你能从散点图中发现施肥量与水稻产量近似成什么关系吗?
解:
(1)散点图如下:
(2)从图中可以发现施肥量与水稻产量具有线性相关关系,当施肥量由小到大变化时,水稻产量也由小变大,图中的数据点大致分布在一条直线的附近,因此施肥量和水稻产量近似成线性正相关关系.
7.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为
1
2
3
4
5
价格x
1.4
1.6
1.8
2
2.2
需求量y
12
10
7
5
3
已知iyi=62,=16.6.
(1)画出散点图;
(2)求出y对x的线性回归方程;
(3)如价格定为1.9万元,预测需求量大约是多少?
(精确到0.01t)
解:
(1)散点图如下图所示:
(2)因为=×9=1.8,=×37=7.4,
iyi=62,=16.6,
所以===-11.5.
=-=7.4+11.5×1.8=28.1.
故y对x的线性回归方程为=11.5x+28.1
(3)=28.1-11.5×1.9=6.25t.
8.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性