应用回归分析结课论文Word文档下载推荐.docx

上传人:b****6 文档编号:20857702 上传时间:2023-01-26 格式:DOCX 页数:36 大小:89.29KB
下载 相关 举报
应用回归分析结课论文Word文档下载推荐.docx_第1页
第1页 / 共36页
应用回归分析结课论文Word文档下载推荐.docx_第2页
第2页 / 共36页
应用回归分析结课论文Word文档下载推荐.docx_第3页
第3页 / 共36页
应用回归分析结课论文Word文档下载推荐.docx_第4页
第4页 / 共36页
应用回归分析结课论文Word文档下载推荐.docx_第5页
第5页 / 共36页
点击查看更多>>
下载资源
资源描述

应用回归分析结课论文Word文档下载推荐.docx

《应用回归分析结课论文Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《应用回归分析结课论文Word文档下载推荐.docx(36页珍藏版)》请在冰豆网上搜索。

应用回归分析结课论文Word文档下载推荐.docx

4374

471.4

1987

2199.35

4675.7

13813

954.65

1093

5115

420.9

1^88

2357.24

5865?

3

1B225

1131.65

1110.26

白534.6

50S.7

1989

2604.9

0534.7

22017

1232,98

1127+04

7074+2

409.91

1990

2937.1

7652,1

23924

1345.01

1143,33

725X3

384.74

1991

3149.43

S157

20G25

1564.33

1158,23

8245.7

554.72

1992

3483.37

9084.7

34599

2174.44

1171.71

9704.E

513.33

1993

4348.95

10995.5

48402

3253.5

1185.17

12462.1

488.29

1994

521E.1

15750.5

70176

4653.32

1198.5

1白264.7

550.43

1995

6242.2

20340.9

5793・75

1207,43

20S20

546.S&

1096

7407.99

.22353,7

99595

8232.25

1211.21

24774,1

458.21

1997

8651,14

23738.4

113733

9126.46

1223.S9

27298?

9

469?

89

1998

9875.95

24542,9

119048

1OC&

1.99

1276.27

29152.5

521.55

1999

11444.08

24519.1

126111

11152.86

1236.26

31134.7

534.29

2000

13395.23

24915.8

85673,7

12497.6

1284.53

3341S2.6

471.19

2001

04

26179.G

954S.98

153&

1-56

1247,S1

37595,2

501.45

2002

13903.64

27390.8

11075.5

10527.18

1257.S6

42027.1

4决一81

2003

21715.25

29691.8

14771.2

23033.37

1292.27

45B42

545.06

3.回归分析的模型方法介绍和总结

3.1多元线性回归模型

3.1.1多元线性回归模型的一般形式

设随机变量y与一般变量xi,X2,,,xp的线性回归模型为:

y=\■+为■jX2亠.亠)pXp■;

(3.1)

式中,1。

,+,,,r是p1个未知参数,飞称为回归常数,h,,,r称为回归系数。

y称为被解释变量(因变量),x1,x2"

t,xp是p个可以精确测量并控制的一般变量

称为解释变量(自变量)。

P"

时,式(3.1)为一元线性回归模型;

p_2时,我们就

称式(3.1)为多元线性回归模型。

是随机误差,与一元线性回归一样,对随机误差

项我们常假定

「E(打=0(3.2)

2

var(名)=▽

上y=:

0」1洛「2X2…」pXp(3.3)

为理论回归方程。

对一个实际问题,如果我们获得n组观测数(XSX2,…,xip;

y」i=1,2,…,n),则线性回归模型式(3.1)可表示为:

L=+臥1+卩2心+…+%X1pg

y2=%+P1X21+P2X22+…+PpX2p+◎(3.4)

写成矩阵形式为:

y=;

(3.5)

X是一个np1阶矩阵,称为回归设计矩阵或资料矩阵。

在实验设计中,X的

元素是预先设定并可以控制的,人的主观因素可作用其中,因而称X为设计矩阵。

3.1.2多元线性回归模型的基本假定

为了方便地进行模型的参数估计,对回归方程式(3.4)有如下一些基本假定

(1)解释变量X!

,X2,,,Xp是确定性变量,不是随机变量,且要求

rankX=p•1:

n。

这里的rankX=p•1:

n,表明设计矩阵X中的自变量列之间不相关,样本量的个数应大于解释变量的个数,X是一满秩矩阵。

(2)随机误差性具有零均值和等方差,即

『E*i)=0

「坊2,i=j

'

cov佃,引)=«

i,j=1,2,…,n

I0,心j

L

这个假定通常称为高斯一马尔柯夫条件。

!

节=0,即假设观测值没有系统误差,随机误差项「的平均值为零,随机误差项「的协方差为零,表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相同的精度。

(3)正态分布的假定条件为:

r會〜N(0,b2)

會严2,…,%相互独立

对于多元线性回归的矩阵模型式(3.5),这个条件便可表示为:

由上述假定和多元正态分布的性质可知,随机变量y服从n维正态分布,回归模型

式(3.5)的期望向量

ey

vary=二n

因此

y〜N(X宾2J

3.2.多元线性回归参数的最小二乘估计

多元线性回归模型未知参数飞,:

i,,,>,的估计与一元线性回归方程的参数估计原理

一样,仍可采用最小二乘估计。

对于y•;

所谓最小二乘法,就是寻找参数-0,

L,,,'

-p的估计值,使离差平方和Q(-o,'

-1,,,'

-p)极小,即:

最小二乘佔计要寻找几k矗…*矗使得

讷|00=A西I.

頑0】=Aa£

|

c/?

21A=A

(卩i-A~0i心i一他心2-…-A^ip"

a=o

经整理后得用矩阵形式表示的正规方程组S(y-X^)=0務项得xxp=卅y当pcx『存在时,即得回归参数的最小二乘估计为:

p=(卅xpry

4.SAS程序及结果输出

4.1.建立数据集,进行相关分析

程序1

dataa;

inputyearyx1-x6@@;

cards;

1985

2004.82

3619.59716

1058.51

3801.4443.65

2122.01

808.071075.07

4374471.4

2199.35

4675.713813

954.6510935115

420.9

1988

2357.24

5865.318225

1131.65

1110.26

6534.6508.7

2664.96534.722017

1282.98

1127.04

7074.2469.91

2937.17662.123924

1345.01

1143.33

7250.3384.74

3149.48

8157

26625

1564.33

1158.23

8245.7554.72

19923483.379084.7345992174.441171.719704.8513.33

19934348.9510995.5484023253.51185.1712462.1488.29

19945218.115750.5701764653.321198.516264.7550.43

19956242.220340.9918945793.751267.4320620546.88

1996

7407.99

22353.7

8282.25

24774.1

458.21

8651.14

23788.4

1137339126.48

1223.89

27298.9

469.89

9875.95

24542.9

11904810061.99

1276.27

29152.5

11444.08

24519.1

11152.86

1236.26

31134.7

534.29

13395.23

24915.8

85673.7

12497.6

1284.53

334152.6

16386.04

26179.6

9548.98

15361.56

1247.61

37595.2

501.45

18903.64

11076.5

18527.18

1257.86

499.81

 

J

21715.25

23083.87

1292.27

45842

545.06

run;

proc

print;

corrdata=a

noprob;

varyx1-x6;

结果:

Pearson相关耒数"

N=19

y

x1

x2

x4

x6

1.00000

089828

□.11671

0.99512

080998

□.39807

0.33880

xl

0.8982S

0.51209

0.91924

0.94193

0.40467

040134

011671

0.W209

0.17225

0.54240

0.25220

024719

x3

099512

0.91924

1.00000

082484

0.37352

034805

0.94193

Q54240

0.824&

4

0.45804

0.49725

x5

039807

040467

0.25229

0.45904

-0.03309

0.40134

0.24710

0.34806

0.4S725

表一

分析:

从相关阵看出,y与x2的相关系数偏小,x2是工业增加值,这说明工业增加值对财政收入无显著影响。

42将数据做标准化处理,建立回归方程

程序2:

procstandarddata=amean=0std=1out=out1;

varyx1-x6;

|

procprintdata=out1;

procregdata=out1;

modely=x1-x6;

结果:

方差分析

自由度

平方

均方

卜値

Pr>

1-

標型

6

1792269

2.98711

4E363

<

.0001

逞差

12

0.07731

0.00644

校正合计

18

1800000

均方抿误差

0.08027

R方

0.9957

因亞最均值

2.80477E-16

调整R方

0.0936

霆异至数

2.861804E16

拳敕估讦值

自由曲

t值

1t|

1irtercept

1

253145E-16

OO18411

ooo

1OOQO

O.11708

a15534

a75

0.4656

-o.11696

□.04867

-2.40

O.C333

O.872^

O.11033

7-91

.COO1

O.O165S

007210

023

匚).8220

O.O463O

□.02376

1.97

O.0719

O.022

&

02454

O42

0.6846

表二

因为数据为标准化数据,所以方程中不含有常数项。

所以有回归方程为:

Y=0.117.8x1-0.11696x2+0.87288x3+0.01659x+0.04690x5+0.01022x6

由决定系数R方=0.9957,调整R方=0.9936,得回归方程高度显著。

又有F=463.63,P<

0.0001,表明回归方程高度显著,说明x1,x2,x3,x4,x5,x6

整体上对y高度显著。

在显著性水平:

=0.05时只有x2,x3通过了显著性检验,模型需要进一步检验

4.3.异方差检验

采用等级相关系数法

程序3:

modely=x1-x6/r;

outputout=z1r=residual;

procgplotdata=z1;

plotresidual*y;

dataz2;

setz1;

absr=abs(residual);

proccorrdata=z2spearman

varabsrx1-x6;

□17

0.15

0.14

g13

Q12

0.11

n.io

0.09

o.oe

0.06

0.03

004

0.03

0.02

O-QIggo

-0.QI

-Q-02

-0.04

-Q05

-0-08

-0„07

-0QB

-U.09

-0.10

-Q-II

-□12

-QIa

-0.14

-O„I5

-1Ct1lf3

图一

从残差图可看出,误差项没有呈现任何趋势以及规律初步判断不存在异方差

简单统计量

变量

N

均值

标淮差

中位裁

屋小値

呈大值

absr

19

004367

004777

0.03213

0.00210

016073

1.00000

-000461

-1.29679

148041

-054938

-0.95060

178809

-Q.33940

-0,93162

2.40420

010920

-1.78476

1.37783

19

-026064

-0.43002

4.05947

016137

-2.32331

1,34703

Spearman相关蕃敎.N=19

Prob》|r|underHO:

Rho=0

0.59474

00072

020877

03910

061228

00053

048070

00372

053860

00174

023333

03364

029123

02264

099825

095263

098772

0001

036842

01206

0.20877

03910

0.29123

0.2264

029298

02235

042281

0.0713

034912

01429

024561

03108

0.61228

00063

0.99&

25

0.29298

□2235

094561

098947

037018

01188

0.48070

□0372

0.95263

0.42281

□0713

095614

043S60

00603

0.53860

□0174

0.34912

□1429

0.98947

034211

01517

0.23333

0.1206

0.24561

0.37018

043860

表三

程序4

dataz3;

n=19;

dors=0.0072,0.3910,0.0053,0.0372,0.0174,0.3364

T=sqrt(n-2)*rs/sqrt(1-rs*rs);

t仁tinv(0.975,n-2);

output;

end;

procprintdata=z3;

run;

SAS系统

Obs

n

rs

T

t1

059474

3.05028

2.10982

088018

210982

3

3.19297

2.26025

053830

2.63566

210982

098935

2.10982

表4

可知模型存在异方差问题

4.4自相关检验

程序5:

modely=x1-x6/dw;

Durbin—WatsonD

1521

观测数

M-wr自相关

0.160

表5

DW值为1.521查表不能判断是否存在自相关

4.5.多重共线性检验

4.5.1方差扩大因子法

程序6

modely=x1-x6/vifrun;

塞数估计值

参数怙计值

标准误差

tfi

|t|

方差ent

1ntercept

2.53145E-16

0.01841

0.00

1.0000

0.11708

0.15534

0.75

0.4056

67.41892

-0.11696

004867

0.0333

661761

0.87288

011033

7.91

3400697

0.01659

0.07216

0.8220

14.54580

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1