K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx

上传人:b****8 文档编号:27574888 上传时间:2023-07-03 格式:DOCX 页数:18 大小:98.72KB
下载 相关 举报
K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx_第1页
第1页 / 共18页
K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx_第2页
第2页 / 共18页
K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx_第3页
第3页 / 共18页
K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx_第4页
第4页 / 共18页
K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx

《K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx》由会员分享,可在线阅读,更多相关《K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx(18页珍藏版)》请在冰豆网上搜索。

K12教育学习资料高中数学 第一章 统计案例 11回归分析的基本思想及其初步应用二课时作业.docx

K12教育学习资料高中数学第一章统计案例11回归分析的基本思想及其初步应用二课时作业

第一章统计案例1.1回归分析的基本思想及其初步应用

(二)课时作业新人教A版选修1-2

明目标、知重点

 1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度.

1.如果两个变量不呈现线性相关关系,常见的两个变量间的关系还有指数函数关系、二次函数关系.

2.两个变量间的非线性关系可以通过对解释变量的变换(对数变换、平方变换等)转化为另外两个变量的线性关系.

3.比较不同模型的拟合效果,可以通过残差平方和的大小,相关指数的大小来判断.

探究点一 非线性回归模型

思考1 有些变量间的关系并不是线性相关,怎样确定回归模型?

答 首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,这时可以根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.

思考2 如果两个变量呈现非线性相关关系,怎样求出回归方程?

答 可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.

例1某地区不同身高的未成年男性的体重平均值如下表:

身高x/cm

60

70

80

90

100

110

体重y/kg

6.13

7.90

9.99

12.15

15.02

17.50

身高x/cm

120

130

140

150

160

170

体重y/kg

20.92

26.86

31.11

38.85

47.25

55.05

试建立y与x之间的回归方程.

解 根据表中数据画出散点图如图所示.

由图看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令z=lny.

x

60

70

80

90

100

110

120

130

140

150

160

170

z

1.81

2.07

2.30

2.50

2.71

2.86

3.04

3.29

3.44

3.66

3.86

4.01

画出散点图如图所示.

由表中数据可得z与x之间的线性回归方程:

=0.663+0.020x,则有=e0.663+0.020x.

反思与感悟 根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y=c1ec2x的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.

跟踪训练1 在彩色显影中,由经验知:

形成染料光学密度y与析出银的光学密度x由公式y=A

(b<0)表示.现测得试验数据如下:

xi

0.05

0.06

0.25

0.31

0.07

0.10

yi

0.10

0.14

1.00

1.12

0.23

0.37

xi

0.38

0.43

0.14

0.20

0.47

yi

1.19

1.25

0.59

0.79

1.29

试求y对x的回归方程.

解 由题给的公式y=A

,两边取自然对数,便得lny=lnA+

,与线性回归方程相对照,只要取u=

,v=lny,a=lnA.就有v=a+bu.

题给数据经变量置换u=

,v=lny变成如下表所示的数据:

ui

20.000

16.667

4.000

3.226

14.286

10.000

vi

-2.303

-1.966

0

0.113

-1.470

-0.994

ui

2.632

2.326

7.143

5.000

2.128

vi

0.174

0.223

-0.528

-0.236

0.255

可得ln=0.548-

即=

e=e0.548·

≈1.73

这就是y对x的回归方程.

探究点二 非线性回归分析

思考1 对于两个变量间的相关关系,是否只有唯一一种回归模型来拟合它们间的相关关系?

答 不一定.我们可以根据已知数据的散点图,把它与幂函数、指数函数、对数函数、二次函数图象进行比较,挑选一种拟合比较好的函数,作为回归模型.

思考2 对同一个问题建立的两种不同回归模型,怎样比较它们的拟合效果?

答 有两种比较方法:

(1)计算残差平方和,残差平方和小的模型拟合效果好;

(2)计算相关指数R2,R2越接近于1的模型拟合效果越好.

例2为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:

天数x/天

1

2

3

4

5

6

繁殖个数y/个

6

12

25

49

95

190

(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;

(2)描述解释变量x与预报变量y之间的关系;

(3)计算相关指数.

解 

(1)所作散点图如图所示.

(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是令z=lny,则

x

1

2

3

4

5

6

z

1.79

2.48

3.22

3.89

4.55

5.25

由计算器得:

=0.69x+1.115,则有=e0.69x+1.115.

(3)

6.08

12.12

24.17

48.18

96.06

191.52

y

6

12

25

49

95

190

(yi-i)2=4.8161,

(yi-

)2=24642.8,

R2=1-

≈0.9998,

即解释变量天数对预报变量繁殖细菌个数解释了99.98%.

反思与感悟 研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后通过图形来分析残差特性,用残差1,2,…,n来判断原始数据中是否存在可疑数据,用R2来刻画模型拟合的效果.

跟踪训练2 对两个变量x,y取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:

甲y=0.1x+1,乙y=-0.05x2+0.35x+0.7,丙y=-0.8·0.5x+1.4,试判断三人谁的数学模型更接近于客观实际.

解 对甲模型:

残差平方和

(yi-i)2=0.0109;

对乙模型:

残差平方和

(yi-i)2=0.0049;

对丙模型:

残差平方和

(yi-i)2=0.0004.

显然丙的残差平方和最小,故丙模型更接近于客观实际.

1.散点图在回归分析中的作用是(  )

A.查找个体个数B.比较个体数据大小关系

C.探究个体分类D.粗略判断变量是否相关

答案 D

2.变量x与y之间的回归方程表示(  )

A.x与y之间的函数关系

B.x与y之间的不确定性关系

C.x与y之间的真实关系形式

D.x与y之间的真实关系达到最大限度的吻合

答案 D

3.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为(  )

A.1B.-0.5

C.0D.0.5

答案 C

4.非线性回归分析的解题思路是________.

答案 通过变量置换转化为线性回归分析

[呈重点、现规律]

非线性回归问题的处理方法

(1)指数函数型y=ebx+a

①函数y=ebx+a的图象:

②处理方法:

两边取对数得lny=lnebx+a,即lny=bx+a.令z=lny,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出b,a.

(2)对数曲线型y=blnx+a

①函数y=blnx+a的图象:

②处理方法:

设x′=lnx,原方程可化为y=bx′+a,

再根据线性回归模型的方法求出a,b.

(3)y=bx2+a型

处理方法:

设x′=x2,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.

一、基础过关

1.下列说法正确的是(  )

①线性回归方程适用于一切样本和总体;

②线性回归方程一般都有时间性;

③样本的取值范围会影响线性回归方程的适用范围;

④根据线性回归方程得到的预测值是预测变量的精确值.

A.①③④B.②③

C.①②D.③④

答案 B

2.某地财政收入x与支出y满足回归方程y=x++e(单位:

亿元),其中=0.8,=2,|e|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过(  )

A.10亿B.9亿

C.10.5亿D.9.5亿

答案 C

解析 代入数据=10+e,因为|e|<0.5,

所以||<10.5,故不会超过10.5亿.

3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=

x+1上,则这组样本数据的样本相关系数为(  )

A.-1B.0

C.

D.1

答案 D

4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:

x

1.99

3

4

5.1

6.12

y

1.5

4.04

7.5

12

18.01

对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是(  )

A.y=2x-2B.y=(

)x

C.y=log2xD.y=

(x2-1)

答案 D

解析 可以代入检验,当x取相应的值时,所求y与已知y相差最小的便是拟合程度最高的.

5.如果散点图的所有点都在一条直线上,则残差均为________,残差平方和为________,相关指数为________.

答案 0 0 1

6.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=lny,求得线性回归方程为=0.25x-2.58,则该模型的回归方程为________.

答案 =e0.25x-2.58

解析 ∵=0.25x-2.58,z=lny,∴=e0.25x-2.58.

某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:

推销员编号

1

2

3

4

5

工作年限x/年

3

5

6

7

9

推销金额y/万元

2

3

3

4

5

(1)求年推销金额y关于工作年限x的线性回归方程;

(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.

解 

(1)设所求的线性回归方程为=x+,

则=

=0.5,=

=0.4.

∴年推销金额y关于工作年限x的线性回归方程为=0.5x+0.4.

(2)当x=11时,=0.5x+0.4=0.5×11+0.4=5.9(万元).

∴可以估计第6名推销员的年推销金额为5.9万元.

二、能力提升

8.有下列说法:

①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;

②相关指数R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;

③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.

其中正确命题的个数是(  )

A.0B.1

C.2D.3

答案 D

解析 ①选用的模型是否合适与残差点的分布有关;对于②③,R2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.

9.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是(  )

A.直线l1和l2有交点(s,t)

B.直线l1和l2相交,但是交点未必是点(s,t)

C.直线l1和l2由于斜率相等,所以必定平行

D.直线l1和l2必定重合

答案 A

解析 由于回归直线一定过(

),

∴直线l1和l2都过(s,t)点.

10.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得:

xi=52,

yi=228,

x

=478,

xiyi=1849,则y与x的线性回归方程是________.

答案 =11.47+2.62x

11.某种产品的广告费支出x(单位:

百万元)与销售额y(单位:

百万元)之间有如下对应数据:

x

2

4

5

6

8

y

30

40

60

50

70

(1)画出散点图;

(2)求y关于x的线性回归方程.

解 

(1)散点图如图所示:

(2)列出下表,并用科学计算器进行有关计算.

i

1

2

3

4

5

xi(百万元)

2

4

5

6

8

yi(百万元)

30

40

60

50

70

xiyi

60

160

300

300

560

=5;

=50;

x

=145;

xiyi=1380

于是可得=

=6.5,

=50-6.5×5=17.5.

于是所求的线性回归方程是=6.5x+17.5.

12.某地最近十年粮食需求量逐年上升,下表是部分统计数据:

年份

2002

2004

2006

2008

2010

需求量(万吨)

236

246

257

276

286

(1)利用所给数据求年需求量与年份之间的线性回归方程=x+;

(2)利用

(1)中所求出的线性回归方程预测该地2012年的粮食需求量.

解 

(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求线性回归方程,先将数据预处理如下:

年份-2006

-4

-2

0

2

4

需求量-257万吨

-21

-11

0

19

29

由预处理后的数据,容易算得

=0,

=3.2,

=6.5,

=3.2.由上述计算结果,知所求线性回归方程为-257=(x-2006)+=6.5(x-2006)+3.2.

即=6.5(x-2006)+260.2.

(2)利用所求得的线性回归方程,可预测2012年的粮食需求量为6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).

三、探究与拓展

13.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:

千元)与月储蓄yi(单位:

千元)的数据资料,算得

i=80,

i=20,

iyi=184,

=720.

(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;

(2)判断变量x与y之间是正相关还是负相关;

(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.

解 

(1)由题意知n=10,

i=

=8,

i=

=2,

又lxx=

-n

2=720-10×82=80,

lxy=

iyi-n

=184-10×8×2=24,

由此得b=

=0.3,

a=

-b

=2-0.3×8=-0.4,

故所求线性回归方程为y=0.3x-0.4.

(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.

(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 自我管理与提升

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1