线性回归分析方法.docx

上传人:b****6 文档编号:6905606 上传时间:2023-01-12 格式:DOCX 页数:16 大小:58.47KB
下载 相关 举报
线性回归分析方法.docx_第1页
第1页 / 共16页
线性回归分析方法.docx_第2页
第2页 / 共16页
线性回归分析方法.docx_第3页
第3页 / 共16页
线性回归分析方法.docx_第4页
第4页 / 共16页
线性回归分析方法.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

线性回归分析方法.docx

《线性回归分析方法.docx》由会员分享,可在线阅读,更多相关《线性回归分析方法.docx(16页珍藏版)》请在冰豆网上搜索。

线性回归分析方法.docx

线性回归分析方法

9-1实验报告

一、实验内容与目的

利用线性回归分析方法分析研究高等院校人文社会科学研究中立项课题数受哪些因素影响,并建立回归模型。

这里收集了某年31个省市自治区部分高校有关社会科学研究方面的数据,其中,被解释变量为立项课题数,解释变量为投入人年数、投入高级职称的人年数、投入科研事业费、专著数、论文数、获奖数,分别采用了强制进入策略和向后筛选策略。

二、操作过程

(包含的主要内容①数据文件的建立②分析前数据的预处理③统计分析运用方法操作)

数据文件的建立:

将“课题总数”,“投入人年数”“投入高级职称的人年数”“投入科研事业费”“专著数”“论文数”“获奖数”设为标准型变量,定计量尺度为定距型数据。

1analyze-regression-linear

2将“课题总数”选入dependent,“投入人年数”“投入高级职称的人年数”“投入科研事业费”“专著数”“论文数”“获奖数”选入independent

3打开method的下拉框

选择一选择enter,点statistics勾选estimatesmodelfitcollinearitydiagnostics

(可以得到图1至图4)

选择二选择backward,

点statistics勾选“estimates”“modelfit”“rsquaredchange”“descriptives”“Collinearity”

点save在predicted框中勾选“standardized”“adjusted”“s.e.ofmeanpredictions”

点save在residuals框中勾选“standardized”“studentized”“studentizeddeleted”

点save在influence框中勾选“dfbeta(s)”“dffit”“covariance”

(可以得到图5至图8)

4点击plots按钮,将“zresid”选入y,将“zpred”选入x,勾选nomalprobabilityplot

(可以得到图10和图12)

5analyze-nonparametric-1-samplek-ctests

6将standardizedresidual选入testvariablelist,选择testdistribution框中的nomal

(可以得到图9)

7analyze-correlate-bivariate

8standardizedresidual和standardizedpredicted选入variable再勾选speamam

(可以得到图11)

三、结论与分析

(对输出结果进行解释说明)

从图1可以看出,进行拟合优度检验,R2=0.969,由于方程有多个解释变量,可参考可调整的判定系数,可调整的判定系数为0.924,比较接近1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,不能被解释的部分较少。

 

从图2可以看出,表二显示了被解释变量的变差来源、自由度、方差和离差平方和等,可以看出,被解释变量的总离差平方和为2.1×107,回归平方和及方差分别为2×107和3298385.48,剩余平方和及方差分别为1286497和53604.047,F检验统计量的观测值为61.532,对应的概率P-值接近0。

依据该表可进行回归方程的显著性检验,如果显著性水平为0.05,由于P-值小于显著性水平,应拒绝回归方程显著性的原假设,认为各回归系数不同时为0,被解释变量和解释变量全体的线性关系是显著的,可以建立线性回归模型。

从图3可以看出,图3显示了偏回归系数、偏回归系数的标准差、标准化偏回归系数、t检验的统计值和方程的膨胀因子等。

依据该表可以进行回归系数的显著性检验,可以看到:

如果显著性水平α为0.05,除投入人年数以外,其他变量的回归系数显著性t检验的概率P-值都大于显著性水平α,因此不应该拒绝原假设,认为这些偏回归系数与0无显著性差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。

由于模型中保留了一些不该保留的变量,因此该模型目前是不可用的,应该重新建立模型。

同时,从容忍度和膨胀因子来看,投入高级职称的人年数与其他解释变量的多重共线性很严重,在重新建立模型时可以考虑删除该变量。

从图4可以看出,图4显示了特征值、条件指数、各特征值解释各解释变量的方差比。

依据该表可进行多重共线性检验。

从方差比来看,第七个特征值既能解释投入人年数方差的84%,也可以解释投入高级职称的人年数方差的98%,同时还可以解释专著数方差的44%,因此有理由认为,这些变量间存在多重共线性。

从条件指数来看,第5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。

从图5可以看出,利用向后筛选策略共经过六步完成回归方程的建立,最终模型为第六个模型。

从方程建立的过程来看,随着解释变量的不断减少,方程的拟合优度也逐步下降。

这一方面说明了判定系数自身的特性,同时也说明建立回归方程并不是以追求高的拟合优度为唯一目的,还要考察解释变量是否对被解释变量有贡献。

依次剔除方程的变量时专著数、投入高级职称的人年数、投入科研事业费、获奖数、论文数。

如果显著性水平为0.05,可以看到剔除变量的偏F检验的概率P-值均大于显著性水平,因此均不能拒绝原假设,这些变量的偏回归系数与0无显著性差异,它们对被解释变量的线性解释没有贡献,应该剔除。

最终保留在方程中的变量是投入人年数。

由于D.W=1.747,存在一定的正自相关。

图6中的第六个模型是最终的方程,如果显著性水平α为0.05,由于回归方程的显著性检验的概率P-值小于显著性水平,因此被解释变量与解释变量的线性关系是显著的,建立线性模型是恰当的。

图7显示了每个模型中各解释变量的偏回归系数、偏回归系数显著性检验的情况。

如果显著性水平α为0.05,则前五个模型中由于都存在回归系数不显著的解释变量,因此这些方程都不可用。

第六个模型是最终的方程,其回归系数显著性检验的概率P-值小于显著性水平α,因此认为投入人年数与被解释变量间的线性关系是显著的,它保留在模型中是合理的,得出最终的回归模型为:

立项课题数=-94.524+0.492×投入人年数,意味着投入人年数每增加一个单位,会使立项课题数平均增加0.492个单位。

图8显示了将变量剔除方程的过程,第二到第四列各数据项的含义依次是:

在剔除其他变量的情况下,如果该变量保留在模型中,其标准化回归系数、t检验值和概率值。

在图10中,反映了数据点围绕基准线还存在一定的规律性,但从图9的标准化残差的非参数检验结果来看,标准化残差与标准正态分布不存在显著性差异,可以认为残差满足了线性模型的前提要求。

 

图12中,随着标准化预测值的变化,残差点在0水平线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势。

从图11的标准化残差和标准化预测值的Spearman等级相关分析结果来看,计算残差与预测值的Spearman等级相关系数为-0.176,且检验并不显著,因此认为异方差现象并不明显。

四、小结

(注:

说明分析方法的①用途②运用条件(运用前提)③零假设及其经济意义)

回归方程显著性检验

①用途:

检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它们之间的关系式否恰当。

②运用条件(运用前提):

线性模型

③零假设及其经济意义:

各个偏回归系数与零无显著差异

经济意义:

当偏回归系数同时为零,y与x的全体不存在线性关系

回归系数的显著性检验

①用途:

研究回归方程中的每个解释变量与被解释变量之间是否存在显著线性关系

②运用条件(运用前提):

回归方程

③零假设及其经济意义

原假设:

第i个偏回归系数与零无显著差异

经济意义:

当偏回归系数为零,他们之间不存在线性关系

Ks检验

①用途:

利用样本数据推断样本来自的总体是否服从某一理论分布,

②运用条件(运用前提):

探索连续型随机变量的分布

③零假设及其经济意义:

样本来自的总体与标准正态分布无显著差

五、附件

(分析结果输出的图表等)

ModelSummary

Model

R

RSquare

AdjustedRSquare

Std.ErroroftheEstimate

1

0.969

0.938961

0.923702

231.5255

APredictors:

(Constant),获奖数,投入科研事业费(百元),论文数,专著数,投入人年数,投入高级职称的人年数

图1

 

 

 

ANOVA(b)

Model

SumofSquares

df

MeanSquare

F

Sig.

1

Regression

19790313

6

3298385

61.5324

2.17E-13

Residual

1286497

24

53604.05

Total

21076810

30

APredictors:

(Constant),获奖数,投入科研事业费(百元),论文数,专著数,投入人年数,投入高级职称的人年数

BDependentVariable:

课题总数

图2

Coefficients(a)

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

1

(Constant)

-35.3132

76.58011

-0.46113

0.648859

投入人年数

0.698017

0.208214

1.361058

3.352405

0.00265

投入高级职称的人年数

-0.46725

0.625815

-0.46395

-0.74663

0.462539

投入科研事业费(百元)

0.002943

0.001838

0.236502

1.601399

0.122371

专著数

0.022378

0.376756

0.01401

0.059397

0.953128

论文数

-0.06353

0.053025

-0.25192

-1.19809

0.242579

获奖数

0.712393

0.503067

0.119425

1.416099

0.169595

a

DependentVariable:

课题总数

图3

 

 

CollinearityDiagnosticsa

Model

Dimension

Eigenvalue

ConditionIndex

VarianceProportions

(Constant)

专著数

论文数

获奖数

投入人年数

投入高级职称的人年数

投入科研事业费(百元)

1

1

6.137

1.000

.01

.00

.00

.00

.00

.00

.00

2

.452

3.684

.33

.01

.00

.04

.00

.00

.03

3

.294

4.572

.32

.00

.00

.39

.00

.00

.01

4

.073

9.142

.26

.00

.06

.29

.01

.00

.39

5

.028

14.719

.09

.55

.02

.15

.03

.00

.37

6

.014

21.020

.00

.00

.82

.06

.12

.01

.17

7

.002

58.796

.00

.44

.10

.05

.84

.98

.03

a.DependentVariable:

课题总数

图4

ModelSummary(g)

Model

R

RSquare

AdjustedRSquare

Std.ErroroftheEstimate

1

0.969

0.938961

0.923702

231.5255

2

0.968996

0.938953

0.926743

226.8644

3

0.967816

0.936669

0.926925

226.582

4

0.964884

0.931

0.923334

232.0833

5

0.962661

0.926717

0.921482

234.8694

6

0.958879

0.919448

0.916671

241.9582

a

Predictors:

(Constant),获奖数,投入科研事业费(百元),论文数,专著数,投入人年数,投入高级职称的人年数

b

Predictors:

(Constant),获奖数,投入科研事业费(百元),论文数,投入人年数,投入高级职称的人年数

c

Predictors:

(Constant),获奖数,投入科研事业费(百元),论文数,投入人年数

d

Predictors:

(Constant),获奖数,论文数,投入人年数

e

Predictors:

(Constant),论文数,投入人年数

f

Predictors:

(Constant),投入人年数

g

DependentVariable:

课题总数

图5

 

 

ANOVA(g)

Model

SumofSquares

df

MeanSquare

F

Sig.

1

Regression

19790313

6

3298385

61.5324

2.17E-13

Residual

1286497

24

53604.05

Total

21076810

30

2

Regression

19790124

5

3958025

76.90346

2.33E-14

Residual

1286686

25

51467.45

Total

21076810

30

3

Regression

19741985

4

4935496

96.13465

3.47E-15

Residual

1334825

26

51339.41

Total

21076810

30

4

Regression

19622519

3

6540840

121.4355

8.7E-16

Residual

1454291

27

53862.64

Total

21076810

30

5

Regression

19532228

2

9766114

177.039

1.29E-16

Residual

1544582

28

55163.63

Total

21076810

30

6

Regression

19379040

1

19379040

331.0179

2.1E-17

Residual

1697770

29

58543.79

Total

21076810

30

 

a

Predictors:

(Constant),获奖数,投入科研事业费(百元),论文数,专著数,投入人年数,投入高级职称的人年数

b

Predictors:

(Constant),获奖数,投入科研事业费(百元),论文数,投入人年数,投入高级职称的人年数

c

Predictors:

(Constant),获奖数,投入科研事业费(百元),论文数,投入人年数

d

Predictors:

(Constant),获奖数,论文数,投入人年数

e

Predictors:

(Constant),论文数,投入人年数

f

Predictors:

(Constant),投入人年数

g

DependentVariable:

课题总数

图6

 

 

Coefficients(a)

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

1.000

(Constant)

-35.313

76.580

-0.461

0.649

投入人年数

0.698

0.208

1.361

3.352

0.003

投入高级职称的人年数

-0.467

0.626

-0.464

-0.747

0.463

投入科研事业费(百元)

0.003

0.002

0.237

1.601

0.122

专著数

0.022

0.377

0.014

0.059

0.953

论文数

-0.064

0.053

-0.252

-1.198

0.243

获奖数

0.712

0.503

0.119

1.416

0.170

2.000

(Constant)

-36.246

73.442

-0.494

0.626

投入人年数

0.692

0.176

1.349

3.932

0.001

投入高级职称的人年数

-0.443

0.458

-0.439

-0.967

0.343

投入科研事业费(百元)

0.003

0.002

0.240

1.778

0.088

论文数

-0.064

0.052

-0.253

-1.230

0.230

获奖数

0.701

0.453

0.117

1.548

0.134

3.000

(Constant)

-29.791

73.047

-0.408

0.687

投入人年数

0.553

0.102

1.079

5.411

0.000

投入科研事业费(百元)

0.002

0.001

0.152

1.525

0.139

论文数

-0.088

0.045

-0.348

-1.934

0.064

获奖数

0.716

0.452

0.120

1.586

0.125

4.000

(Constant)

-63.385

71.340

-0.889

0.382

投入人年数

0.644

0.085

1.255

7.527

0.000

论文数

-0.096

0.046

-0.381

-2.081

0.047

获奖数

0.589

0.455

0.099

1.295

0.206

5.000

(Constant)

-67.925

72.109

-0.942

0.354

投入人年数

0.628

0.086

1.224

7.330

0.000

论文数

-0.070

0.042

-0.278

-1.666

0.107

6.000

(Constant)

-94.524

72.442

-1.305

0.202

投入人年数

0.492

0.027

0.959

18.194

0.000

a

DependentVariable:

课题总数

图7

 

 

ExcludedVariables(f)

Model

BetaIn

t

Sig.

PartialCorrelation

CollinearityStatistics

Tolerance

2.000

专著数

0.014

0.059

0.953

0.012

0.046

3.000

专著数

-0.103

-0.592

0.559

-0.118

0.082

投入高级职称的人年数

-0.439

-0.967

0.343

-0.190

0.012

4.000

专著数

0.080

0.632

0.533

0.123

0.164

投入高级职称的人年数

0.104

0.299

0.767

0.059

0.022

投入科研事业费(百元)

0.152

1.525

0.139

0.287

0.246

5.000

专著数

0.016

0.131

0.897

0.025

0.188

投入高级职称的人年数

0.035

0.100

0.921

0.019

0.022

投入科研事业费(百元)

0.123

1.220

0.233

0.229

0.254

获奖数

0.099

1.295

0.206

0.242

0.440

6.000

专著数

0.023

0.182

0.857

0.034

0.188

投入高级职称的人年数

-0.119

-0.343

0.734

-0.065

0.024

投入科研事业费(百元)

0.152

1.528

0.138

0.278

0.267

获奖数

0.030

0.411

0.684

0.077

0.542

论文数

-0.278

-1.666

0.107

-0.300

0.094

a

PredictorsintheModel:

(Constant),获奖数,投入科研事业费(百元),论文数,投入人年数,投入高级职称的人年数

b

PredictorsintheModel:

(Constant),获奖数,投入科研事业费(百元),论文数,投入

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 幼儿读物

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1