高中数学人教A版选修12教学案第一章 11 回归分析的基本思想及其初步应用Word格式文档下载.docx
《高中数学人教A版选修12教学案第一章 11 回归分析的基本思想及其初步应用Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《高中数学人教A版选修12教学案第一章 11 回归分析的基本思想及其初步应用Word格式文档下载.docx(14页珍藏版)》请在冰豆网上搜索。
(3)R2=1-越接近1,表示回归的效果越好.
1.判断下列命题是否正确.(正确的打“√”,错误的打“×
”)
(1)残差平方和越小,线性回归方程的拟合效果越好.( )
(2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上.( )
(3)R2越小,线性回归方程的拟合效果越好.( )
答案:
(1)√
(2)×
(3)×
2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________.
正相关
3.在残差分析中,残差图的纵坐标为________.
残差
4.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于________,解释变量和预报变量之间的相关系数等于________.
0 1或-1
求线性回归方程
[典例] 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据
x
6
8
10
12
y
2
3
5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
[解]
(1)散点图如图:
(2)iyi=6×
2+8×
3+10×
5+12×
6=158,
==9,==4,
=62+82+102+122=344.
===0.7,=-=4-0.7×
9=-2.3,
故线性回归方程为=0.7x-2.3.
(3)由
(2)中线性回归方程知,当x=9时,=0.7×
9-2.3=4,故预测记忆力为9的同学的判断力约为4.
求线性回归方程的三个步骤
(1)画散点图:
由样本点是否呈条状分布来判断两个量是否具有线性相关关系.
(2)求回归系数:
若存在线性相关关系,则求回归系数.
(3)写方程:
写出线性回归方程,并利用线性回归方程进行预测说明.
[活学活用]
某工厂1~8月份某种产品的产量与成本的统计数据见下表:
月份
1
4
7
产量(吨)
5.6
6.0
6.1
6.4
7.0
7.5
8.0
8.2
成本(万元)
130
136
143
149
157
172
183
188
以产量为x,成本为y.
(1)画出散点图;
(2)y与x是否具有线性相关关系?
若有,求出其回归方程.
解:
(1)由表画出散点图,如图所示.
(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.
xi
yi
xiyi
31.36
728.0
36.00
816.0
37.21
872.3
40.96
953.6
49.00
1099.0
56.25
1290.0
64.00
1464.0
67.24
1541.6
∑
54.8
1258
382.02
8764.5
计算得=6.85,=157.25.
∴=
=≈22.17,
=-=157.25-22.17×
6.85≈5.39,
故线性回归方程为=22.17x+5.39.
回归分析
题点一:
线性回归分析
1.在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:
14
16
18
20
22
求出y对x的回归直线方程,并说明拟合效果的程度.
=(14+16+18+20+22)=18,
=(12+10+7+5+3)=7.4.
=142+162+182+202+222=1660,
iyi=14×
12+16×
10+18×
7+20×
5+22×
3=620,
可得回归系数===-1.15.
所以=7.4+1.15×
18=28.1
所以回归直线方程:
=-1.15x+28.1.
列出残差表:
yi-i
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-2.4
-4.4
则(yi-i)2=0.3,(yi-)2=53.2.
R2=1-≈0.994.
所以回归模型的拟合效果很好.
题点二:
非线性回归分析
2.为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下
时间x/天
繁殖个数y
25
49
95
190
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;
(2)求y与x之间的回归方程.
(1)散点图如图所示:
(2)由散点图看出样本点分布在一条指数函数y1=c1ec2x的周围,于是令z=lny,则
z
1.79
2.48
3.22
3.89
4.55
5.25
由计算器算得,=0.69x+1.112,则有=e0.69x+1.112.
(1)当两个变量已明显呈线性相关关系时,则无需作散点图,就可直接求回归直线方程,否则要先判定相关性再求回归方程.判断拟合效果的好坏需要利用R2确定,R2越接近1,说明拟合效果越好.
(2)非线性回归方程的求法
①根据原始数据(x,y)作出散点图;
②根据散点图,选择恰当的拟合函数;
③作恰当的变换,将其转化成线性函数,求线性回归方程;
④在③的基础上通过相应的变换,即可得非线性回归方程.
层级一 学业水平达标
1.在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求线性回归方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤D.②⑤④③①
解析:
选D 对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;
根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;
故正确顺序是②⑤④③①,故选D.
2.有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
②R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.
其中正确命题的个数是( )
A.0B.1
C.2D.3
选D ①选用的模型是否合适与残差点的分布有关;
对于②③,R2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.
3.下图是根据变量x,y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )
A.①②B.①④
C.②③D.③④
选D 根据散点图中点的分布情况,可判断③④中的变量x,y具有相关的关系.
4.(重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为( )
A.=0.4x+2.3B.=2x-2.4
C.=-2x+9.5D.=-0.3x+4.4
选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.
5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.6
10.0
11.3
11.9
支出y(万元)
6.2
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元B.11.8万元
C.12.0万元D.12.2万元
选B 由题意知,==10,
==8,
∴=8-0.76×
10=0.4,
∴当x=15时,=0.76×
15+0.4=11.8(万元).
6.以下是某地区的降雨量与年平均气温的一组数据:
年平均气温(℃)
12.51
12.84
13.69
13.33
12.74
13.05
年降雨量(mm)
542
507
813
574
701
432
464
根据这组数据可以推断,该地区的降雨量与年平均气温________相关关系.(填“具有”或“不具有”)
画出散点图,观察可知,降雨量与年平均气温没有相关关系.
不具有
7.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.
8.下列说法正确的命题是________(填序号).
①回归直线过样本点的中心(,);
②线性回归方程对应的直线=x+至少经过其样本数据点(x1,y1),(x2,y2),…,(xn,yn)中的一个点;
③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;
④在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好.
由回归分析的概念知