统计学案例相关回归分析Word下载.docx

上传人:b****5 文档编号:19353395 上传时间:2023-01-05 格式:DOCX 页数:14 大小:86.25KB
下载 相关 举报
统计学案例相关回归分析Word下载.docx_第1页
第1页 / 共14页
统计学案例相关回归分析Word下载.docx_第2页
第2页 / 共14页
统计学案例相关回归分析Word下载.docx_第3页
第3页 / 共14页
统计学案例相关回归分析Word下载.docx_第4页
第4页 / 共14页
统计学案例相关回归分析Word下载.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

统计学案例相关回归分析Word下载.docx

《统计学案例相关回归分析Word下载.docx》由会员分享,可在线阅读,更多相关《统计学案例相关回归分析Word下载.docx(14页珍藏版)》请在冰豆网上搜索。

统计学案例相关回归分析Word下载.docx

41

7

11.1

22

45

8

10.8

23

40

9

37

24

10

25

47

11

34

13.6

26

10.5

12

12.2

27

12.1

13

28

14

11.8

29

15

30

目标值确定之后,我们收集了某年某季度的回流温度和液化气收率的30组数据(如上表),进行简单直线回归分析。

3•方法的确立

设线性回归模型为y=几+ZV+£

估计回归方程为y=»

+blX

将数据输入计算机,输出散点图可见,液化气收率y具有随看回流温度x

的提高而降低的趋势。

因此,建立描述y和x之间关系的模型时,首选直线型是

合理的。

从线性回归的计算结果,可以知道回归系数的最小二乘估计值

b0=21.263和bi=-0.229,于是最小二乘直线为

y=21.263-0.229x

这就表明,回流温度每增加1°

Cz估计液化气收率将减少0.229%。

15-

14-

13・

12・

11-

10-

9-

(3)残差分析

为了判别简单线性模型的假定是否有效z作出残差图f逬行残差分析。

从图中可以看到z残差基本在-O.5-+O.5左右,说明建立回归模型所依赖的假定是恰当的。

误差项的估计值s二0.38&

(4)回归模型检验

a.显考性检验

在90%的显著水平下,进行t检验,拒绝域为ItI=Ibl/Sbl|>

ta/2=1.7011o

由输出数据可以找到5和Sbi,t二sbi=-0.229/0.022=-10.313,于是拒绝原假设,说明液化气收率和回流温度之间存在线性关系。

b.拟合度检验

判定系数2二0.792。

这意味看液化气收率的样本变差大约有80%可以由它和回流温度的线性关系来解释。

•=7^=-0.89

这样,「值为y和x之间存在中高度的负线性关系提供了进一步的证据。

由于心30,我们近似确定y的90%置信区间为:

y+(z%)s=21.263-0.229x±

1.282x0.388=21.263-0.229x±

0.497

035404550

4.结果分析

由回归直线图可知,要保持液化气收率在12.24%以上,回流温度必须控制

在34°

C以下。

因为装置工艺卡片要求回流温度在33—40°

C之间,为确保液化气质量合格,可以将回流温度控制在33-34°

C之间。

为此,应当采取各项有效措施,改善外部操作环境,将液化气收率控制在目标值范围内。

案例二:

轿车生产和GDP等关系研究

中国的轿车生产是否和GDP、城镇居民人均可支配收入、城镇居民家庭恩

格尔系数、私人载客汽车拥有量、公路里程等都有密切关系?

如果有关系,它们之间是种什么关系?

关系强度如何?

(数据见《中国统计年鉴》)

(1)分析轿车生产量和私人载客汽车拥有量之间的关系:

首先,求的因变量轿车生产量y和自变量私人载客汽车拥有量xl的相关系数

「二0.99201&

说明两者间存在一定的线性相关关系且正相关程度很强。

¥

盘1

y,

xl1

10.992018

然后以轿车生产量为因变量y,私人载客汽车拥有量xl为自变量进行一元线性

回归分析,结果如下:

SUMMARYOUTPUT

回归统计

Multiple

6992018

RSquare

CL984101

Adjusted

0.983041

标准误差

14.38616

观测值

方差分析

归差址

dfSS貼F

1192150.3192150.3928・4352904

153104.422206.9615

16195254.8

Coefficien-

tStat

P-value

Intercept1.775687

4.676408

0.379712|_

0.7094815431

xl0.206783

0.006786

30.47024

6.60805E-15

①由回归统计中的R二0.984101看出,所建立的回归模型对样本观测值的

拟合程度很好;

②估计出的样本回归函数为:

y=1.775687+0.206783xl,说明私人载客汽车拥有量每增加1万辆,轿车生产量增加2067.83辆;

③由上表中a和y的p值分别是0.709481543和6.60805E-15,显然a的p值大于显著性水平a二0.05,不能拒绝原假设c(二0,而[T的p值远小于显著性水平a二0.05,拒绝原假设[3二0,说明私人载客汽车拥有量对轿车生产量有显著影响。

(2)分析轿车生产量和城镇居民家庭恩格尔系数之间的关系:

首先,求的因变量轿车生产量y和自变量城镇居民家庭恩格尔系数x2的相关系数「二-0.77499,说明两者间存在一定的线性相关关系但负相关程度一般。

然后以轿车生产量为因变量y,城镇居民家庭恩格尔系数X2为自变量进行

元线性回归分析,结果如下:

RSquare|

0.774989

0.573982'

72.10323

r17

Coefficien-标准误差

Lower

Intercept

661.243

120.1556

5.503221

6.07E-05

405.:

x2

-12.692

2.672314

-4.74943

0.000258

-18.:

由回归统计中的R二0.600608看出z所建立的回归模型对样本观测值的拟

合程度一般,综合其相关系数值可知此二者关系不太符合所建立的线性模型,说明二者间没有密切的线性相关关系。

(3)分析轿车生产量和公路里程之间的关系:

首先,求的因变量轿车生产量y和自变量公路里程x3的相关系数

「二0.941214,说明两者间存在一定的线性相关关系且正相关程度较强。

V

x3

y

xS

0.941214

然后以轿车生产量为因变量y,公路里程x3为自变量进行一元线性回归分

析,结果如下:

P-valueLower

Intercept-125.156

22.58047

-5・54268

5.64E-05

-173.

1.403022

0.130019

10.79092

1.22E-08

1.12E

①由回归统计中的R=0.885883看出f所建立的回归模型对样本观测值的

拟合程度较好;

②估计出的样本回归函数为:

夕=-125.156+1.403022x3,说

明公路里程每增加1万公里,轿车生产量增加1.403022万辆;

③由上表中合和B"

的p值分别是5.64E-05和1.82E-08,显然$和的p值均远小于显著性水平c(二0.05,拒绝原假设a=0、卩二0,但由于B对两者的影响更为显著,所以可以说明公路里程对轿车生产量有显著影响。

(4)分析轿车生产量和GDP之间的关系:

首先,求的因变量轿车生产量y和自变量GDPx4的相关系数uO.939995,说明两者间存在一定的线性相关关系且正相关程度较强。

yk4

x4

0.9399951.

 

然后以轿车生产量为因变量y,GDPx4为自变量进行一元线性回归分析,结果如下:

0,939995

0.88359

0.87583

38.92691

df

ss

MS

F

回归分析

172525.2

172525.2

113.8552

2.

残差

22729.56

1515.304

总计

195254.8

Coefficient

标;

隹误差

P-valueLo

Interceptx4

-70.7127

0.001829

18.30702

0.000171

■3.86260.001534-:

10.67029|2.11E-08lQ.

①由回归统计中的90.88359看出,所建立的回归模型对样本观测值的拟

合程度较好;

夕二-70.7127+0.001829x4,说明

GDP每增加1亿元,轿车生产量增加18.29辆;

③由上表中a和的p值分别是0.001534和2.11E-08,显然a和(T的p值均小于显著性水平*0.05,拒绝原假设a=0、B二0,但由于B对两者的影响更为显著,所以可以说明GDP对轿车生产量有较显著影响。

(5)分析轿车生产量和城镇居民人均可支配收入x5之间的关系:

首先,求的因变量轿车生产量y和自变量城镇居民人均可支配收入x5的相关系数「二0.917695脱明两者间存在一定的线性相关关系且正相关程度较强。

x5

0.917695

1.

然后以轿车生产量为因变量y,城镇居民人均可支配收入x5为自变量进行

—元线性回归分析,结果如下:

0.917695

0.842164

0.831641

标淮误差

45.32719

方差分祈

NS

护if

回归分祈

164436.5

80.03511

2.1

30818.31

2054.554

Coefficien-标淮误差

•tStat

P"

value

Lowe

Intercept-92.9054

23.8703

-3.892091

lO.0014441-14

0.032928

0.003681

8.9462342.12E-07'

0.0

①由回归统计中的90.842164看出,所建立的回归模型对样本观测值的

夕二-92.9054+0.032928x5,说明

城镇居民人均可支配收入每增加1元,轿车生产量增加329.28辆;

③由上表中a和巧的p值分别是0.001444和2.12E-07,显然a和[T的p值均小于显著性水平a二0.05,拒绝原假设c(二0、B二0,但由于B对两者的影响更为显著”所以可以说明城镇居民人均可支配收入对轿车生产量有显著影响。

案例三:

子女身高和父母身高的回归分析

早在19世纪后期,英国生物学家Galton通过观察1078个家庭中父亲、母亲身高的平均值x和其中一个成年儿子身高y,建立了关于父母身高和子女身

高的线性方程:

y二33.73+0.516X

从方程可以看出,子女身高有回归平均的倾向。

那么,时隔一百多年后的今天,人类的物质生活和精神生活都已发生巨大的变化,父母身高和子女身高之间将呈现出什么样的关系呢?

在现实生活中,我们都知道父母身高对子女身高是有影响的,但父亲和母亲的影响分别有多大?

他们对儿子和女儿的影响程度是否相同?

能否用定量的形式回答这个问题呢?

如果可以利用回归方法,进一步揭示父亲身高、母亲身高和子女身高之间量化关系的秘密將有助于那些关注自己后代身高的年轻父母们进行早期预测,同时也可为那些未婚青年男女在选择理想配偶时提供科学的参考依

2、数据的收集

为了问题的研究,我们要求所调查的家庭满足下列条件:

(1)家庭中有一个或多个子女

(2)家庭成员身体健康,发育正常,无先天性和遗传性疾病,无残疾(3)子女的年龄均在23岁(含23岁)以上。

考虑到调查范围的广泛性,我们随机抽取了机关干部、职员、工人农民、城市居民、军人大学生家庭,并特意选择了一所全国招生的院校应届毕业生,他们来自于全国各地,家庭背景相对复杂,这样使鶴羊本更具代表性。

在收回的410份(发放460份)调查表中,符合要求的有290个家庭,其中,有儿子405人,有女儿270人。

3、方法的确定

根据所收集的数据,使用二元回归分析方法,研究父亲身高、母亲身高和儿子或女儿身高的关系。

(1)建立回归方程

设XI为父亲身高,X2为母亲身高,丫为儿子或女儿身高。

则父母身高和子

女身高的回归模型为:

Y=pO+plXl+p2X2+8

根据样本数据建立估计二元回归方程:

V=b0+blxl+b2x2

(2)显者性检验

对回归方程进行F检验,拒绝区域为F>

Fa(2,n-3);

对回归系数进行t检验,拒绝区域为t>

ta/2(n-3)。

(3)预测

若某一家庭父亲和母亲身高分别为X10和x20,则子女身高的点估计为:

y'

=b0+blxl0+b2x20区间估计方法已超出大纲要求,在此不要求。

4、结果分析

(1)父母身高对儿子身高的影响

yA二53.640+0.368x1+0.349x2显著性检验:

在c(二0.01的显著水平下,F二62.714>

Fa(2,400)=4.68tl二7.85>

ta/2(400)=2.689t2=6.71>

ta/2(400)二2.689

结果说明回归方程显著,两个偏回归系数显著。

因此,所建立回归方程是有意义的,即父母身高和儿子身高有显著的线性关系。

(2)父母身高对女儿身高的影响

yA二47.140+0.249x1+0.455x2显著性检验:

在c(二0.01的显著水平下,F二46.81>

Fa(2,300)=4.68tl二4.92>

ta/2(300)二2.68t2=7.61>

ta/2(300)=2.689

结果说明回归方程显著,回归系数显著,故所建立回归方程有效,即女儿身高和父母身高有显著的线性关系,特别是母亲身高对女儿身高的影响更为重要。

(3)从以上结果可以看出,在某种程度上,父母身高对子女身高有重要影响,且在不同时期,子女身高有回归平均身高的趋势,即个子矮的父母,其子女身高未必低于自己,个子高的父母,其子女身高未必高于自己。

下表给出了部分家庭子女身高的预测值,其中,区间估计的把握程度为95%。

表:

部分家庭子女身高的预测值

父亲

身高

儿子身高

女儿身高

点估计

下限

160

155

166.57

165.32

167.83

157.50

155.99

159.02

168.32

167.16

169.48

159.78

158.43

161.13

165

170.15

169.41

170.91

161.02

160.14

161.90

171.90

171.01

172.91

163.30

162.26

164.33

170

172.00

171.53

172.46

162.27

161.74

162.79

173.74

173.12

174.36

164.54

163.77

165.30

175

173.84

173.27

174.40

163.51

162.94

164.07

175.58

174.93

176.22

165.78

164.98

166.59

180

175.67

174.73

176.50

164.75

163.79

165.71

177.42

176.47

17836

167.03

165.91

168.14

177.41

169.30

167.76

170.83

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1