K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx
《K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx》由会员分享,可在线阅读,更多相关《K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx(18页珍藏版)》请在冰豆网上搜索。
K12教育学习资料高中数学第一章统计案例11回归分析的基本思想及其初步应用二课时作业
第一章统计案例1.1回归分析的基本思想及其初步应用
(二)课时作业新人教A版选修1-2
明目标、知重点
1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度.
1.如果两个变量不呈现线性相关关系,常见的两个变量间的关系还有指数函数关系、二次函数关系.
2.两个变量间的非线性关系可以通过对解释变量的变换(对数变换、平方变换等)转化为另外两个变量的线性关系.
3.比较不同模型的拟合效果,可以通过残差平方和的大小,相关指数的大小来判断.
探究点一 非线性回归模型
思考1 有些变量间的关系并不是线性相关,怎样确定回归模型?
答 首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,这时可以根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.
思考2 如果两个变量呈现非线性相关关系,怎样求出回归方程?
答 可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.
例1某地区不同身高的未成年男性的体重平均值如下表:
身高x/cm
60
70
80
90
100
110
体重y/kg
6.13
7.90
9.99
12.15
15.02
17.50
身高x/cm
120
130
140
150
160
170
体重y/kg
20.92
26.86
31.11
38.85
47.25
55.05
试建立y与x之间的回归方程.
解 根据表中数据画出散点图如图所示.
由图看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令z=lny.
x
60
70
80
90
100
110
120
130
140
150
160
170
z
1.81
2.07
2.30
2.50
2.71
2.86
3.04
3.29
3.44
3.66
3.86
4.01
画出散点图如图所示.
由表中数据可得z与x之间的线性回归方程:
=0.663+0.020x,则有=e0.663+0.020x.
反思与感悟 根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y=c1ec2x的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.
跟踪训练1 在彩色显影中,由经验知:
形成染料光学密度y与析出银的光学密度x由公式y=A
(b<0)表示.现测得试验数据如下:
xi
0.05
0.06
0.25
0.31
0.07
0.10
yi
0.10
0.14
1.00
1.12
0.23
0.37
xi
0.38
0.43
0.14
0.20
0.47
yi
1.19
1.25
0.59
0.79
1.29
试求y对x的回归方程.
解 由题给的公式y=A
,两边取自然对数,便得lny=lnA+
,与线性回归方程相对照,只要取u=
,v=lny,a=lnA.就有v=a+bu.
题给数据经变量置换u=
,v=lny变成如下表所示的数据:
ui
20.000
16.667
4.000
3.226
14.286
10.000
vi
-2.303
-1.966
0
0.113
-1.470
-0.994
ui
2.632
2.326
7.143
5.000
2.128
vi
0.174
0.223
-0.528
-0.236
0.255
可得ln=0.548-
,
即=
e=e0.548·
≈1.73
,
这就是y对x的回归方程.
探究点二 非线性回归分析
思考1 对于两个变量间的相关关系,是否只有唯一一种回归模型来拟合它们间的相关关系?
答 不一定.我们可以根据已知数据的散点图,把它与幂函数、指数函数、对数函数、二次函数图象进行比较,挑选一种拟合比较好的函数,作为回归模型.
思考2 对同一个问题建立的两种不同回归模型,怎样比较它们的拟合效果?
答 有两种比较方法:
(1)计算残差平方和,残差平方和小的模型拟合效果好;
(2)计算相关指数R2,R2越接近于1的模型拟合效果越好.
例2为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:
天数x/天
1
2
3
4
5
6
繁殖个数y/个
6
12
25
49
95
190
(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;
(2)描述解释变量x与预报变量y之间的关系;
(3)计算相关指数.
解
(1)所作散点图如图所示.
(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是令z=lny,则
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
由计算器得:
=0.69x+1.115,则有=e0.69x+1.115.
(3)
6.08
12.12
24.17
48.18
96.06
191.52
y
6
12
25
49
95
190
=
(yi-i)2=4.8161,
(yi-
)2=24642.8,
R2=1-
≈0.9998,
即解释变量天数对预报变量繁殖细菌个数解释了99.98%.
反思与感悟 研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后通过图形来分析残差特性,用残差1,2,…,n来判断原始数据中是否存在可疑数据,用R2来刻画模型拟合的效果.
跟踪训练2 对两个变量x,y取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:
甲y=0.1x+1,乙y=-0.05x2+0.35x+0.7,丙y=-0.8·0.5x+1.4,试判断三人谁的数学模型更接近于客观实际.
解 对甲模型:
残差平方和
(yi-i)2=0.0109;
对乙模型:
残差平方和
(yi-i)2=0.0049;
对丙模型:
残差平方和
(yi-i)2=0.0004.
显然丙的残差平方和最小,故丙模型更接近于客观实际.
1.散点图在回归分析中的作用是( )
A.查找个体个数B.比较个体数据大小关系
C.探究个体分类D.粗略判断变量是否相关
答案 D
2.变量x与y之间的回归方程表示( )
A.x与y之间的函数关系
B.x与y之间的不确定性关系
C.x与y之间的真实关系形式
D.x与y之间的真实关系达到最大限度的吻合
答案 D
3.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( )
A.1B.-0.5
C.0D.0.5
答案 C
4.非线性回归分析的解题思路是________.
答案 通过变量置换转化为线性回归分析
[呈重点、现规律]
非线性回归问题的处理方法
(1)指数函数型y=ebx+a
①函数y=ebx+a的图象:
②处理方法:
两边取对数得lny=lnebx+a,即lny=bx+a.令z=lny,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出b,a.
(2)对数曲线型y=blnx+a
①函数y=blnx+a的图象:
②处理方法:
设x′=lnx,原方程可化为y=bx′+a,
再根据线性回归模型的方法求出a,b.
(3)y=bx2+a型
处理方法:
设x′=x2,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.
一、基础过关
1.下列说法正确的是( )
①线性回归方程适用于一切样本和总体;
②线性回归方程一般都有时间性;
③样本的取值范围会影响线性回归方程的适用范围;
④根据线性回归方程得到的预测值是预测变量的精确值.
A.①③④B.②③
C.①②D.③④
答案 B
2.某地财政收入x与支出y满足回归方程y=x++e(单位:
亿元),其中=0.8,=2,|e|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿B.9亿
C.10.5亿D.9.5亿
答案 C
解析 代入数据=10+e,因为|e|<0.5,
所以||<10.5,故不会超过10.5亿.
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=
x+1上,则这组样本数据的样本相关系数为( )
A.-1B.0
C.
D.1
答案 D
4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( )
A.y=2x-2B.y=(
)x
C.y=log2xD.y=
(x2-1)
答案 D
解析 可以代入检验,当x取相应的值时,所求y与已知y相差最小的便是拟合程度最高的.
5.如果散点图的所有点都在一条直线上,则残差均为________,残差平方和为________,相关指数为________.
答案 0 0 1
6.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=lny,求得线性回归方程为=0.25x-2.58,则该模型的回归方程为________.
答案 =e0.25x-2.58
解析 ∵=0.25x-2.58,z=lny,∴=e0.25x-2.58.
某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
推销金额y/万元
2
3
3
4
5
(1)求年推销金额y关于工作年限x的线性回归方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
解
(1)设所求的线性回归方程为=x+,
则=
=
=0.5,=
-
=0.4.
∴年推销金额y关于工作年限x的线性回归方程为=0.5x+0.4.
(2)当x=11时,=0.5x+0.4=0.5×11+0.4=5.9(万元).
∴可以估计第6名推销员的年推销金额为5.9万元.
二、能力提升
8.有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
②相关指数R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.
其中正确命题的个数是( )
A.0B.1
C.2D.3
答案 D
解析 ①选用的模型是否合适与残差点的分布有关;对于②③,R2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.
9.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( )
A.直线l1和l2有交点(s,t)
B.直线l1和l2相交,但是交点未必是点(s,t)
C.直线l1和l2由于斜率相等,所以必定平行
D.直线l1和l2必定重合
答案 A
解析 由于回归直线一定过(
,
),
∴直线l1和l2都过(s,t)点.
10.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得:
xi=52,
yi=228,
x
=478,
xiyi=1849,则y与x的线性回归方程是________.
答案 =11.47+2.62x
11.某种产品的广告费支出x(单位:
百万元)与销售额y(单位:
百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)求y关于x的线性回归方程.
解
(1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算.
i
1
2
3
4
5
xi(百万元)
2
4
5
6
8
yi(百万元)
30
40
60
50
70
xiyi
60
160
300
300
560
=5;
=50;
x
=145;
xiyi=1380
于是可得=
=
=6.5,
=
-
=50-6.5×5=17.5.
于是所求的线性回归方程是=6.5x+17.5.
12.某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份
2002
2004
2006
2008
2010
需求量(万吨)
236
246
257
276
286
(1)利用所给数据求年需求量与年份之间的线性回归方程=x+;
(2)利用
(1)中所求出的线性回归方程预测该地2012年的粮食需求量.
解
(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求线性回归方程,先将数据预处理如下:
年份-2006
-4
-2
0
2
4
需求量-257万吨
-21
-11
0
19
29
由预处理后的数据,容易算得
=0,
=3.2,
=
=
=6.5,
=
-
=3.2.由上述计算结果,知所求线性回归方程为-257=(x-2006)+=6.5(x-2006)+3.2.
即=6.5(x-2006)+260.2.
(2)利用所求得的线性回归方程,可预测2012年的粮食需求量为6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).
三、探究与拓展
13.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:
千元)与月储蓄yi(单位:
千元)的数据资料,算得
i=80,
i=20,
iyi=184,
=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
解
(1)由题意知n=10,
=
i=
=8,
=
i=
=2,
又lxx=
-n
2=720-10×82=80,
lxy=
iyi-n
=184-10×8×2=24,
由此得b=
=
=0.3,
a=
-b
=2-0.3×8=-0.4,
故所求线性回归方程为y=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).