第三章13可线性化的回归分析.docx
《第三章13可线性化的回归分析.docx》由会员分享,可在线阅读,更多相关《第三章13可线性化的回归分析.docx(17页珍藏版)》请在冰豆网上搜索。
第三章13可线性化的回归分析
可线性化的回归分析
营预习导学J挑战自我,点点落实
[学习目标]
1.进一步体会回归分析的根本思想.
2.通过非线性回归分析,判断几种不同模型的拟合程度.
[知识链接]
1.有些变量间的关系并不是线性相关,怎样确定回归模型
答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,那么两个变量不呈现线性相关关系,不能直接利用线性回归方程来建立两个变量之问的关系,这时可以根据已有函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.
2.如果两个变量呈现非线性相关关系,怎样求出回归方程
答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.
[预习导引]
1.非线性回归分析
对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.
2.非线性回归方程
曲线方程
曲线图形
公式变换
变换后的线性函数
y=axb
J
0-3仍
曰XS
c=lna
v=Inx
u=Iny
u=c+bv
y=aebx
la
c=Ina
u=Iny
u=c+bx
>0.^>01
by=aex
q#t
f2Mfi<'W
c=Ina
1v=一
x
u=Iny
u=c+bv
y=a+b
Inx
仲工3
v=Inxu=y
u=a+bv
k课堂讲义z=重点难点,个个击破
要点一线性回归分析
例1某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万兀)
4
2
3
5
销售额y(万元)
49
26
39
54
(1)由数据易知y与x具有线性相关关系,假设b=,求线性回归方程y=a+bx;
⑵据此模型预报广告费用为4万元时的销售额.
49+26+39+54
=,y=4=42,
•.a=y—bx=42――
・•・回归直线方程为y=+.
(2)当x=4时,y=+X仁,
故广告费用为6万元时销售额为万元.
跟踪演练1为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹顶峰
日(y)的关系,某地区观察了2006年2021年的情况,得到了下面的数据:
年份
2006
2007
2021
2021
2021
2021
x/C
y/日
19
6
1
10
1
8
(1)对变量x,y进行相关性检验;
(2)据气象预测,该地区在2021年3月下旬平均气温为27C,试估计2021年4月化蛹顶峰日为哪天.
解制表.
i
1
2
3
4
5
6
xi
yi
19
6
1
10
1
8
一
x=,
66
E1y2=563,y=,E1x2=5,
6
fjxyi=1
6
iZ^xyi-6xy
(1)r=/66=-8.
7(1平—6乂2)(1y2—6y2)
由|r|>,可知变量y和x存在很强的线性相关关系.
(2)b=错误!
=—,2=错误!
一b昔误!
〜.所以,线性回归方程为y=一.当x=27时,y=—X27.据此,可估计该地区2021年4月12日或13日为化蛹顶峰日.
要点二可线性化的回归分析
例2在一化学反响过程中,化学物质的反响速度y(g/min)与一种催化剂的量x(g)有关,现收集了8组观测数据列于表中:
催化剂的量x/g
15
18
21
24
27
30
33
36
化学物质的反响速度y(gmin1)
6
8
30
27
70
205
65
350
解根据收集的数据,作散点图(如图),根据已有的函数知识,可以发现样本点分布在某一条指数函数曲数y=c1ec2x的周围,其中C1和C2是待定的参数.
令2:
=lny,那么z=lny=lnG+c2x,
即变换后的样本点应该分布在直线z=a+bx(a=lnci,b=C2)的周围.
33藐•催化荒的
由y与x的数据表可得到变换后的z与x的数据表:
x
15
18
21
24
27
30
33
36
z
作出z与x的散点图(如图).
151招2124273033S6催化剂的垃g
由散点图可观察到,变换后的样本点分布在一条直线的附近,所以可用线性回归
方程来拟合.
由z与x的数据表,可得线性回归方程:
z=+,
所以y与x之间的非线性回归方程为
-+
y二e
规律方法可线性化的回归分析问题,画出数据的散点图,选择跟散点拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.
跟踪演练2电容器充电后,电压到达100V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:
t/s
0
1
2
3
4
5
6
7
8
9
10
U/V
100
75
55
40
30
20
15
10
10
5
5
试求:
电压U对时间t的回归方程.〔提示:
对公式两边取自然对数,把问题转
化为线性回归分析问题〕
解对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,那么y
a=y—bx=,所以y对x的线性回归方程为y=—.
由y=lnU,得U=ey,U==•e,因此电压U对时间t的回归方程为U=•e
一.
要点三非线性回归模型的综合应用
例3某地区不同身高的未成年男性的体重平均值如下表:
身高x/cm
60
70
80
90
100
110
体重y/kg
身高x/cm
120
130
140
150
160
170
体重y/kg
试建立y与x之间的回归方程.
解根据题干表中数据画出散点图如下图.
O204U60HOIDO12014016()ISWx
由表中数据可得z与x之间的线性回归方程:
z=+,那么有y=+.
规律方法根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y=ciec2x的周围,其中ci和C2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.
跟踪演练3对两个变量x,y取得4组数据(1,1),(2,,(3,,(4,,甲、乙、丙三人分别求得数学模型如下:
甲y二+1,
乙y=—।—I-,
丙y=-+,试判断三人谁的数学模型更接近于客观实际.
解甲模型,当x=1时,y=;当x=2时,y=;
当x=3时,y=;当x=4时,y=.
乙模型,当x=1时,y=1;当x=2时,y=;
当x=3时,y=;当x=4时,y=.
内模型,当x=1时,y=1;当x=2时,y=;
当x=3时,y=;当x=4时,y=.
观察4组数据并对照知,内的数学模型更接近于客观实际
:
当堂检测二当堂训壕,体骗成功
1.在一次试验中,当变量x的取值分别为1,1,1,1时,变量y的值分别为2,234
3,4,5,那么y与1的回归方程为〔〕x
A.y=;1B-y=X+3
xx
C.y=2x+1D.y=x—1
答案A
一,一1
解析由数据可得,四个点都在曲线V=1+1上.x
答案B
〔单位:
百万元〕之间有如下对应数据:
3.根据统计资料,我国能源生产开展迅速.下面是我国能源生产总量〔单位:
亿吨标准煤〕的几个统计数据:
年份
1996
2001
2006
2021
〕里
根据有关专家预测,到2021年我国能源生产总量将到达亿吨左右,那么专家所选
择的回归模型是以下四种模型中的哪一种〔〕
A.y=ax+b〔aw0〕B.y=ax2+bx+c〔aw0〕
C.y=ax〔a>0且aw1〕D.y=logax〔a>0且aw1〕
答案A
据弄错了,那么最可能错的数据是
x/万元
2
4
5
6
8
y/万元
30
40
60
50
70
答案〔6,50〕
事分层练习J解疑刿偏、练习检测
一、根底达标
1.下表提供了某厂节能降耗技术改造后生产某产品过程中记录的产量x〔吨〕与相应的生产能耗y〔吨〕的几组对应数据.根据表中提供的数据,求出y关于x的线性回归方程是y=+,那么表中t的值是〔〕
x
3
4
5
6
y
t
4
A.4.5B.4C.3D.
答案C
2.以下数据x,y符合哪一种函数模型〔〕
x
1
2
3
4
5
6
7
8
9
10
y
2
3
4
…1一…
=2十mB.y=2ex
3
C.y=2e§D.y=2+lnx
x
答案D
解析取乂=1,2,…,10分别代入各解析式判断.
3.指数曲线y=aebx的图像为
答案B
解析..、=aebx,」.a>.时y>0,排除A、C,且xCR,排除D,选B.
4.为研究广告费用x与销售额y之间的关系,有人抽取了5家餐厅,得到的数
据如下表:
广告费用x/千
元
销售额y/千元
能表现这组数据之间的关系的是
A.直线L
B.曲线C
C直线L和曲线C都一样
D.无法确定
答案B
5.线性回归方程的斜率的估计值是,样本点的中央为,5),那么线性回归方
程是
答案y=+
解析在回归方程中,b=,那么a=y—bx=.
6.对于回归方程y=257+,当x=28时,y的估计值是.
答案390
解析当乂=28时,y=257+X28390,;y的估计值为390.
7.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数读数结果如
下.
尿汞含量(Xi)
2
4
6
8
10
消光系数(yi)
64
138
205
285
360
⑴画出对应数据的散点图;
(2)求线性回归方程;
(3)根据
(2)的结果,估计当Xi为12mg/L时的消光系数yi.
解⑴
350-•
300-■
250200-•
150-•
100■*50-
o]~~2~~4~~68~~10~~x
(2)y=一十.
(3)当Xi=12时代入y=—十,得yi=432.
二、水平提升
8.观察以下图中的4个散点图,适合用线性回归模型拟合其中两个变量的是()
①
解析在研究两个变量之间的关系时,可以根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.这种方法既直观又方便,因而对解决相关性检验问题比拟常用.
9.下表是某厂1〜4月份用水量(单位:
百吨)的一组数据,
月份x
1
2
3
4
用水量y
4
3
其线性回归方
由某散点图可知,用水量y与月份x之间有较好的线性相关关系,程是y=—Pa,贝Ua=
解析x=,y=,b=一,
•二a=+.
10.某个样本点中的变量x,y线性相关,相关系数r<0,那么在以(x,y)为
坐标原点的坐标系下的散点图中,大多数的点都落在第象限.
答案二、四解析••・r<0时b<0,
「•大多数点落在第二、四象限.
k.1
解根据散点图可知y与x近似地呈反比例函数关系,设y=[,令t=7那么xx
y=kt,原数据变为
t
4
2
1
y
16
12
5
2
1
2
由散点图也可以看出y与t呈近似的线性相关关系.列表如下:
厅p
ti
yi
tiyi
t2
y2
1
4
16
64
16
256
2
2
12
24
4
144
3
1
5
5
1
25
4
2
1
4
5
1
5
1
E
36
5
430
16
14
12
10
8
6
4
2
O
5
4yL5ty
b=^_=4.
*t2-5⑴2
a=y—bt=.;y=+.
「.y与x的回归方程是y=+错误!
.
12.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6
天卖出热茶的杯数与当天气温的比照表.
气温/C
26
18
13
10
4
—1
杯数
20
24
34
38
50
64
画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.
解画出散点图如下图.
.
60
50
40
30
20
10
51015202530
1,〜
x=6(26+18+13+10+4—1)行
1,~
y=6(20+24+34+38+50+64)当
6
gxyi=26X20-18X2413X3410X38-4X501X64=1910,
6
■=262+182+132+102+42+(—1)2=1286,
6
"y2=202+242+342+382+502+642=10172,
可得r=.
由于r的值较大,所以x与y具有很强的线性相关关系.
三、探究与创新
13.某地区不同身高的未成年男性的体重平均值如下表:
身高x/cm
60
70
80
90
100
110
体重y/kg
身高x/cm
120
130
140
150
160
170
体重y/kg
(1)试建立y与x之间的回归方程;
(2)假设体重超过相同身高男性体重平均值的倍为偏胖,低于倍为偏瘦,那么这个
地区一名身高为175cm,体重为82kg的在校男生体重是否正常
解⑴根据表中的数据画出散点图(如下图).
心5.・40・3520・
10
20406080100120140160180
由图可看出,样本点分布在某条指数函数曲线y=ciec2x的周围,于是令z=lny,
得下表:
X
60
70
80
90
100
110
120
130
140
150
160
170
Z
作出散点图如下图.
20406080100120140160180M
由表中数据可得z与x之间的线性回归方程为
z=+,那么有y=+.
(2)当x=175时,预测平均体重为
y=+X17y
由于XV82,
所以这个男生偏胖.