高中数学 第1章 统计 8 最小二乘估计教学案 北师大版必修3.docx
《高中数学 第1章 统计 8 最小二乘估计教学案 北师大版必修3.docx》由会员分享,可在线阅读,更多相关《高中数学 第1章 统计 8 最小二乘估计教学案 北师大版必修3.docx(13页珍藏版)》请在冰豆网上搜索。
高中数学第1章统计8最小二乘估计教学案北师大版必修3
8最小二乘估计
[核心必知]
1.回归直线
如果两个变量散点图中点的分布从整体上看大致在一条直线附近,那么称这两个变量之间具有线性相关关系,这条直线叫作回归直线.
2.最小二乘法
求线性回归方程y=bx+a时,使得样本数据的点到它的距离的平方和最小的方法叫作最小二乘法.其中a,b的值由以下公式给出:
a,b是线性回归方程的系数.
[问题思考]
1.任给一组数据,我们都可以由最小二乘法得出线性回归方程吗?
提示:
用最小二乘法求回归直线的方程的前提是先判断所给数据具有线性相关关系(可利用散点图判断).否则求出的线性回归方程是无意义的.
2.线性回归方程是否经过一定点?
提示:
线性回归方程恒过定点(,).
讲一讲
1.下表是某旅游区游客数量与平均气温的对比表:
平均气温(℃)
-1
4
10
13
18
26
数量(百个)
20
24
34
38
50
64
若已知游客数量与平均气温是线性相关的,求线性回归方程.
[尝试解答] ==,==,
x+x+…+x=1+16+100+169+324+676=1286,
x1y1+x2y2+…+x6y6=-20+96+340+13×38+18×50+26×64=3474.
b==≈1.68,
a=-b≈18.73,
即所求的线性回归方程为y=1.68x+18.73.
求线性回归方程的步骤
(1)画出散点图,判断其具有相关关系;
(2)计算,,x=x+x+…+x,
xiyi=x1y1+x2y2+…+xnyn.
(3)代入公式b=,a=-b;
(4)写出线性回归方程y=bx+a.
练一练
1.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
6
8
10
12
y
2
3
5
6
已知记忆力x和判断力y是线性相关的,求线性回归方程.
解:
==9,==4,
a=-b=4-0.7×9=-2.3.
则所求的线性回归方程为y=0.7x-2.3.
讲一讲
2.某种产品的广告费支出x(单位:
百万元)与销售额y(单位:
百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)求线性回归方程;
(3)预测当广告费支出为7百万元时的销售额.
[尝试解答]
(1)
(2)从散点图可以发现,y与x具有线性相关关系,利用计算器求得:
=5,=50,x=145,xiyi=1380,
设回归方程为y=bx+a,则
b===6.5,
a=-b=50-6.5×5=17.5,故所求线性回归方程为y=6.5x+17.5.
(3)当x=7时,y=6.5×7+17.5=63.
所以,当广告费支出为7百万元时,销售额约为6300万元.
用线性回归方程估计总体的一般步骤:
(1)作出散点图,判断散点是否在一条直线附近;
(2)如果散点在一条直线附近,用公式求出a、b并写出线性回归方程;
(3)根据线性回归方程对总体进行估计.
练一练
2.假设关于某设备的使用年限x和所支出的维修费用y(单位:
万元)有如下的统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系,试求:
(1)回归方程y=bx+a的系数a,b;
(2)使用年限为10年时,试估计维修费用是多少.
解:
(1)列表如下:
I
1
2
3
4
5
xi
2
3
4
5
6
yi
2.2
3.8
5.5
6.5
7.0
xiyi
4.4
11.4
22.0
32.5
42.0
x
4
9
16
25
36
=4,=5,x=90,xiyi=112.3
b===1.23,
a=-b=5-1.23×4=0.08.
(2)回归方程是y=1.23x+0.08,
当x=10时,y=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
【解题高手】【易错题】
有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:
人均GDP(万元)
10
8
6
4
3
1
患白血病的儿童数
351
312
207
175
132
180
(1)画出散点图,并判定两个变量是否具有线性相关关系;
(2)通过计算可得两个变量的线性回归方程为y=23.25x+102.25,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?
[错解]
(1)根据表中数据画散点图,如图所示,从图可以看出,虽然后5个点大致分布在一条直线的附近,但第一个点离这条直线太远,所以这两个变量不具有线性相关关系.
(2)将x=12代入y=23.25x+102.25,得y=23.25×12+102.25=381.25>380,所以上述断言是正确的.
[错因] 在第
(1)问中,是否具有线性相关关系,要看大部分点、主流点是否分布在一条直线附近,个别点是不影响“大局”的,所以可断定这两个变量具有线性相关关系.在第
(2)问中,381.25只是一个估计值,由它不能断言这个城市患白血病的儿童一定超过380人.如果这个城市的污染很严重,有可能人数远远超过380,若这个城市的环境保护的很好,则人数就有可能远远低于380.
[正解]
(1)根据表中数据画散点图,如错解图所示,从图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.
(2)将x=12代入y=23.25x+102.25,得y=23.25×12+102.25=381.25>380,即便如此,但因381.25只是一个估计值,会受其他情况的影响,所以不能断言这个城市患白血病的儿童一定超过380人.
1.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程y=bx+a必过点( )
A.(2,2) B.(1.5,0)C.(1,2)D.(1.5,4)
解析:
选D==1.5,==4.
2.工人工资y(元)随劳动生产率x(千元)变化的回归直线方程为y=80x+50,则下列判断正确的是( )
A.劳动生产率为1000元时,工资为130元
B.劳动生产率提高1000元时,工资约提高80元
C.劳动生产率提高1000元时,工资约提高130元
D.当月工资210元时,劳动生产率为2000元
解析:
选B回归直线的斜率为80,所以x每增加1个单位,y约增加80,即劳动生产率提高1000元时,工资提高约80元.
3.(福建高考改编)已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.b>b′,a>a′B.b>b′,aC.ba′D.b
解析:
选C由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,b′=2,a′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b===,a=-b=-×=-,所以ba′.
4.某商店统计了最近6个月某商品的进价x与售价y(单位:
元)的对应数据如下:
x
3
5
2
8
9
12
y
4
6
3
9
12
14
则=________,=________,=________,
=________,回归方程为________.
解析:
根据公式代入即可求得,也可以利用计算器求得=6.5,=8,=327,=396,
回归方程为y=1.14x+0.59.
答案:
6.5 8 327 396 y=1.14x+0.59
5.某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得线性回归方程y=bx+a中b=-2,预测当气温为-4℃时,用电量的度数约为________.
解析:
==10,==40,则a=-b=40+2×10=60,则y=-2x+60,则当x=-4时,y=-2×(-4)+60=68.
答案:
68
6.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表中数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据
(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤.(参考数值:
3×2.5+4×3+5×4+6×4.5=66.5)
解:
(1)散点图如图所示.
(2)由对照数据,计算得:
x=86,==4.5,==3.5.
又已知xiyi=66.5,
∴b===0.7,
a=-b=3.5-0.7×4.5=0.35.
∴所求的线性回归方程为y=0.7x+0.35.
(3)90-(0.7×100+0.35)=19.65(吨标准煤),
故预测生产100吨甲产品的生产能耗比技改前降低约19.65吨标准煤.
一、选择题
1.设有一个回归方程y=2-1.5x,当x增加1个单位时( )
A.y平均增加1.5个单位B.y平均减少1.5个单位
C.y平均增加2个单位D.y平均减少2个单位
解析:
选By′=2-1.5(x+1)=2-1.5x-1.5=y-1.5,即x增加1个单位,y平均减少1.5个单位.
2.对有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b( )
A.可以小于0B.只能大于0
C.只能等于0D.只能小于0
解析:
选A∵b=,∴b的取值是任意的.
3.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到线性回归方程y=bx+a,那么下面说法不正确的是( )
A.直线y=bx+a必经过点(,)
B.直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线y=bx+a的斜率为
D.直线y=bx+a与各点(x1,y1),(x2,y2),…,(xn,yn)的接近程度[yi-(bxi+a)]2是该坐标平面上所有直线与这些点的最接近的直线
解析:
选B直线y=bx+a一定过点(,),但不一定要过样本点.
4.(湖南高考)设某大学的女生体重y(单位:
kg)与身高x(单位:
cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学