线性回归方程Word文档格式.docx

上传人:b****1 文档编号:14076349 上传时间:2022-10-18 格式:DOCX 页数:17 大小:134.32KB
下载 相关 举报
线性回归方程Word文档格式.docx_第1页
第1页 / 共17页
线性回归方程Word文档格式.docx_第2页
第2页 / 共17页
线性回归方程Word文档格式.docx_第3页
第3页 / 共17页
线性回归方程Word文档格式.docx_第4页
第4页 / 共17页
线性回归方程Word文档格式.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

线性回归方程Word文档格式.docx

《线性回归方程Word文档格式.docx》由会员分享,可在线阅读,更多相关《线性回归方程Word文档格式.docx(17页珍藏版)》请在冰豆网上搜索。

线性回归方程Word文档格式.docx

2、知识点梳理

1.线性回归方程

①变量之间的两类关系:

函数关系与相关关系

②制作散点图,判断线性相关关系

③线性回归方程:

(最小二乘法)

最小二乘法:

求回归直线,使得样本数据的点到它的距离的平方最小的方法

注意:

线性回归直线经过定点

2.相关系数(判定两个变量线性相关性):

注:

⑴>

0时,变量正相关;

<

0时,变量负相关;

⑵①越接近于1,两个变量的线性相关性越强;

②接近于0时,两个变量之间几乎不存在线性相关关系。

3.线形回归模型:

⑴随机误差:

我们把线性回归模型,其中为模型的未知参数,称为随机误差。

随机误差

⑵残差:

我们用回归方程中的估计,随机误差,所以是的估计量,故,称为相应于点的残差。

⑶回归效果判定-----相关指数(解释变量对于预报变量的贡献率)

(的表达式中确定)

①得知越大,说明残差平方和越小,则模型拟合效果越好;

②越接近于1,,则回归效果越好。

4.独立性检验(分类变量关系):

(1)分类变量:

这种变量的不同“值”表示个体所属的不同类别的变量。

(2)列联表:

列出两个分类变量的频数表,称为列联表。

(3)对于列联表:

的观测值。

(4)临界值表:

0.50

0.40

0.25

0.15

0.10

0.05

0.025

0.010

0.005

0.001

0.455

0.708

1.323

2.072

2.706

3.841

5.024

6.635

7.879

10.828

如果,就推断“有关系”,这种推断犯错误的概率不超过;

否则,在样本数据中没有发现足够证据支持结论“有关系”。

(5)反证法与独立性检验原理的比较:

反证法原理

在假设下,如果推出矛盾,就证明了不成立。

独立性检

验原理

在假设下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率。

典型例题

1.(2011·

山东)某产品的广告费用x与销售额y的统计数据如下表:

广告费用x/万元

4

2

5

销售额y/万元

49

26

39

54

根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为(  ).

A.63.6万元B.65.5万元

C.67.7万元D.72.0万元

解析 ∵==,==42,

又=x+必过(,),∴42=×

9.4+,∴=9.1.

∴线性回归方程为=9.4x+9.1.

∴当x=6时,=9.4×

6+9.1=65.5(万元).

答案 B

2.(2011·

江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:

父亲身高x/cm

174

176

178

儿子身高y/cm

175

177

则y对x的线性回归方程为(  ).

A.=x-1B.=x+1

C.=88+xD.=176

解析 因为==176,

==176,

又y对x的线性回归方程表示的直线恒过点(,),

所以将(176,176)代入A、B、C、D中检验知选C.

答案 C

3.(2011·

陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是(  ).

A.x和y的相关系数为直线l的斜率

B.x和y的相关系数在0到1之间

C.当n为偶数时,分布在l两侧的样本点的个数一定相同

D.直线l过点(,)

解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的

绝对值越接近1,两个变量的线性相关程度越强,所以A、B错误.C中n

为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误.根据回

归直线方程一定经过样本中心点可知D正确,所以选D.

答案 D

4.(2011·

广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:

小时)与当天投篮命中率y之间的关系:

时间x

1

命中率y

0.4

0.5

0.6

小李这5天的平均投篮命中率为________;

用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.

解析 小李这5天的平均投篮命中率

==0.5,

可求得小李这5天的平均打篮球时间=3.根据表中数据可求得=0.01,=

0.47,故回归直线方程为=0.47+0.01x,将x=6代入得6号打6小时篮球的

投篮命中率约为0.53.

答案 0.5 0.53

5.(2011·

辽宁)调查了某地若干户家庭的年收入x(单位:

万元)和年饮食支出y(单位:

万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:

=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.

解析 由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.

答案 0.254

6.(2011·

安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:

年份

2002

2004

2006

2008

2010

需求量(万吨)

236

246

257

276

286

(1)利用所给数据求年需求量与年份之间的回归直线方程=x+;

(2)利用

(1)中所求出的直线方程预测该地2012年的粮食需求量.

解 

(1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面求回归直线方程.为此对数据预处理如下:

年份-2006

-4

-2

需求量-257

-21

-11

19

29

对预处理后的数据,容易算得=0,=3.2.

==6.5,=-b=3.

由上述计算结果,知所求回归直线方程为

-257=(x-2006)+=6.5(x-2006)+3.2,

即=6.5(x-2006)+260.2.①

(2)利用直线方程①,可预测2012年的粮食需求量为

6.5×

(2012-2006)+260.2=6.5×

6+260.2=299.2(万吨).

课堂练习

1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为(  )

A.=x+1     B.=x+2C.=2x+1D.=x-1

2.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是(  )

A.甲B.乙C.甲、乙相同D.不确定

3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得xi=52,yi=228,x=478,xiyi=1849,则其线性回归方程为(  )

A.=11.47+2.62xB.=-11.47+2.62x

C.=2.62+11.47xD.=11.47-2.62x

4.下表是某厂1~4月份用水量(单位:

百吨)的一组数据:

月份x

用水量y

4.5

2.5

由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是=-0.7x+a,则a等于______.

5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:

零件的个数x(个)

加工的时间y(小时)

(1)在给定的坐标系中画出表中数据的散点图;

(2)求出y关于x的线性回归方程=bx+a,并在坐标系中画出回归直线;

(3)试预测加工10个零件需要多少小时?

课后练习

一、选择题

A.=x+1        B.=x+2

C.=2x+1D.=x-1

答案 A

解析 画出散点图,四点都在直线=x+1.

2.下列有关样本相关系数的说法不正确的是(  )

A.相关系数用来衡量变量x与y之间的线性相关程度

B.|r|≤1,且|r|越接近于1,相关程度越大

C.|r|≤1,且|r|越接近0,相关程度越小

D.|r|≥1,且|r|越接近1,相关程度越小

3.由一组样本(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程=a+bx,下面有四种关于回归直线方程的论述:

(1)直线=a+bx至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点;

(2)直线=a+bx的斜率是;

(3)直线=a+bx必过(,)点;

(4)直线=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差(yi-a-bxi)2是该坐标平面上所有的直线与这些点的偏差中最小的直线.

其中正确的论述有(  )

A.0个B.1个

C.2个D.3个

解析 线性回归直线不一定过点(x1,y1),(x2,y2),…,(xn,yn)中的任何一点;

b=就是线性回归直线的斜率,也就是回归系数;

线性回归直线过点(,);

线性回归直线是平面上所有直线中偏差(yi-a-bxi)2取得最小的那一条.故有三种论述是正确的,选D.

4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有(  )

A.b与r的符号相同    B.a与r的符号相同

C.b与r的符号相反D.a与r的符号相反

5.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是(  )

A.甲B.乙

C.甲、乙相同D.不确定

6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得xi=52,yi=228,x=478,xiyi=1849,则其线性回归方程为(  )

解析 利用回归系数公式计算可得a=11.47,b=2.62,故=11.47+2.62x.

二、填空题

7.下表是某厂1~4月份用水量(单位:

解析 =2.5,=3.5,∵回归直线方程过定点(,),∴3.5=-0.7×

2.5+a.

∴a=5.25.

8.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1