回归分析方法及其应用中的例子.docx

上传人:b****5 文档编号:5904425 上传时间:2023-01-02 格式:DOCX 页数:29 大小:351.53KB
下载 相关 举报
回归分析方法及其应用中的例子.docx_第1页
第1页 / 共29页
回归分析方法及其应用中的例子.docx_第2页
第2页 / 共29页
回归分析方法及其应用中的例子.docx_第3页
第3页 / 共29页
回归分析方法及其应用中的例子.docx_第4页
第4页 / 共29页
回归分析方法及其应用中的例子.docx_第5页
第5页 / 共29页
点击查看更多>>
下载资源
资源描述

回归分析方法及其应用中的例子.docx

《回归分析方法及其应用中的例子.docx》由会员分享,可在线阅读,更多相关《回归分析方法及其应用中的例子.docx(29页珍藏版)》请在冰豆网上搜索。

回归分析方法及其应用中的例子.docx

回归分析方法及其应用中的例子

3.1.2虚拟变量的应用

例3.1.2.1:

为研究美国住房面积的需求,选用3120户家庭为建模样本,回归模型为:

logQ二0]+“2logP+0JogY

其中:

Q——3120个样本家庭的年住房面积(平方英尺)横截面数据

P——家庭所在地的住房单位价格

Y——家庭收入

经计算:

logy二4.17—0.247logP+0.96logY疋=0.371

()0()

上式中02二一0・247的价格弹性系数.0产°・96的收入弹性系数,均符合经济学的常识,即价格上升,住房需求下降,收入上升,住房需求也上升。

但白人家庭与黑人家庭对住房的需求量是不一样的,引进虎拟变董D:

小f0黑人家庭

D=<

1[1白人家庭或其他家庭

模型为:

logQ二0]+qZ)+02log卩+匕。

logP+03logY+ayDlogY

例3.1.2.2:

某省农业生产资料购买力和农民货币收入数据如下:

(单位:

十亿元)

年份

农资购买力

农民货币收入匕

1975

0

1976

0

1977

0

1978

0

1979

1

1980

1

1981

1

1982

1

1983

1

1984

1

1985

1

①根据上述数据建立一元线性回归方程:

$=1・0161+0.09357XR2=0.8821S、=0.2531F=67.3266

②带虚拟变量的回归模型,因1979年中国农村政疑发生重大变化,引入虚拟变量来反映农村政策的变化。

y=0.9855+0.0692.V+0.4945D

()()0

R2=0.9498Sv=0.1751F=75.6895

虽然上述两个模型都可通过显著性水平检脸,但可明显看出带虚拟变量的回归模型其方差解释系数更高,回归的估计误差(S、.)更小,说明模型的拟合程度更离,代表性更好。

3.5.4岭回归的举例说明

企业为用户提供的服务多种多样,那么在这些服务中哪些因素更为重要,各因素之间的重要性差异到底有多大,这些都是满意度研究需要首先解决的问题。

国际上比较流行并被实践所验证,比较科学的方法就是利用回归分析确定客户对不同服务因素的需求程度,具体方法如下:

假设菜电信运营商的服务界面包括了A1……Am共M个界面,那么各■界面对总体服务满意度A的影响可以通过以A为因变量,以A1……Am为自变量的回归分析,得出不同界面服务对总体A的影响系数,从而确定各服务界面对A的影响大小。

同样,A1服务界面可能会有A11……A1n共N个因素的影响,那么利用上述方法也可以计算出A11A1n对A1的不同影响系数,由此确定A1界面中的重要因素。

通过两个层次的分析,我们不仅得出冬大服务界面对客户总体满意度影响的大小以及不同服务界面上各■因素的影响程度,同吋也可综合得出某一界面某一因素对总体满意度的影响大小,由此再结合用户满意度评价、与竞争对手的比较等因素来确定每个界面细分因素在以后工作改进中的轻重缓急、重要性差异等,从而是到爭半功倍的作用。

例3.5.4:

对某地移动通信公司的服务满意度研究中,利用回归方法分析各服务界面对总体满意度的影响。

a.直接进入法

显然,这种方法计算的结果中,C界面不能通过显著性检验,直接利用分析结果是错误

的,见表3.5.4.1:

表3・5.4.1强制回归的Coefficients

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

(Constant)

A

B

C

D

E

F

aDependentVariable:

H

b.逐步回归法

这种方法剔除了一个不能通过统计检验的大的服务界面(C界面),虽然通过了显著性

检验,但却遗漏了C界面的信息。

表3.5.4.2逐步回归的Coefficients

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

(Constant)

A

B

D

E

F

aDependentVariable:

H

同样,使用强制刪除法,C服务界面不能通过显著性检验,向前法和向后法亦剔除了C界面进入分析。

可以看出,通过以上回归分析我们得到了不同的分析结果,显然这种分析方法存在着较大的偏差,随意选取一种是不负责任的,必须深入研究。

一般来说,满意度分析中涉及到许多因素,而诸多因素间存在看一定的关联,因而在进行回归分析时,各自变董之间的共线性问题导致了直接使用线性回归分析模型时一些因子不能参与分析的現象。

一些市场研究咨询公司常釆用舍弃一些变量,遗漏部分信息来求得统计检验通过的方法;有的不顾显箸性检验结果而强行使用不合理的分析结果来保证变量不被舍弃,从而虚假地保障了信息不被遗漏。

我们认为这是满意度分析错误的两个极端。

处理的正确方法是,利用SPSS软件中的岭回归分析来解决,既保障信息不被遗漏,同时保障分析具有统计意艾。

SPSS软件界面没有直接进行岭回归的命令,我们可以通过SPSS提供的程序编辑命令,自行编辑程序加以实现。

在SAS软件中可直接进行岭回归分析。

对例3.5.4.1进行岭回归,分析结果和表的结果对比如下。

可见两者之间有较大差异(下表数据将已将回归系数之和标准化为100%),F界面对总体满意度的作用被缩小了5%左右,而B界面、D界面的作用各被夸大近5亂

表3・5・4・3强制回归与冷回归结杲的比较

表的错误分析

岭回归结果

两者之间的差异

A

%

%

%

B

\

%

C

%

%

D

%

%

%

E

%

%

%

F

%

%

5回归分析方法应用的举例说明——怎样作回归分析How

本章以一个例子详细说明回归分析方法在实际研究中是如何应用的。

回归分析变量的数据转换

本章举例说明的例子选用39家企业样本数据(见表),带动作用是因变量,其余各变董均为自变量,其中所属产业和员工人数是对该样本企业而言,而接触程度则指该样本企业与本地的龙头企业之间在业务上的接触紧密程度。

接触程度.各自变董和因变董均以Likert五分董表进行度量。

例子的样本数据

样本

所属

员工

接触

企业

公共

营销

技术

资源

风险

带动

编号

产业

人数

程度

合作

事务

努力

改进

共享

分担

作用

1

皮革

230

1

2

皮革

159

3

3

皮革

208

2

4

皮革

112

1

5

皮革

100

1

6

皮革

495

1

7

皮革

33

3

8

皮革

80

1

9

皮革

100

3

10

皮革

150

3

11

皮革

136

1

12

皮革

61

3

13

皮革

17

3

14

皮革

230

3

15

家电

300

5

16

家电

250

3

17

家电

80

5

18

家电

134

3

19

家电

428

3

20

家电

80

3

21

家电

400

2

22

家电

20

3

23

家电

225

4

24

家电

180

3

25

家电

90

3

26

家电

160

1

27

家电

100

2

28

家电

350

3

29

家电

345

3

30

家电

305

1

31

家电

400

2

32

家电

100

3

33

家电

414

2

34

家电

324

2

35

家电

300

4

36

家电

200

3

37

家电

85

3

38

家电

180

1

39

家电

415

3

5.1.1

企业所晨

,产业虚拟变量的引入

从表中看到.自变量所属产业为名艾变量,在进行多元回归分析之祈需要将其转化为虚拟变董进行处理。

而员工人数在一定程度上能够反映企业的规模,因此也将其处理为虚拟变量。

将皮革产业变量定狡为变#D,,则

D=fO属于家电产业,=|1属于皮革产业

5.1.2企业规模虔拟变量的引入

首先按照企业员工人数将企业划分为微型、小型.一般型.中型和大型共5种类型企业,具体划分标准见表:

表企业规模的划分和变量说明

企业规模小型

中型

>100且W300

d3

大型工300

员工数W100

变量名D2

由此,有:

0不属于小型产业

0

不属于中型产业

1属于小型产业:

属于中型产业

当以上D2.Ds均为0时,则表示该企业属于大型企业。

5.1.3引入虚拟変量后的变量数据

将上述各变量进行转换处理之后,得到本例进行回归分析的各个变董数据,见表:

表回归分析的变量数据

皮革

接触程企业公共营销

技术资源风险也丄带动

改进共享分担

行业

度合作事务努力

D,

D2

d3

TachCoopPubIMark

TechRecoRiskEffe

1

1

0

1

1

2

1

0

1

3

3

1

0

1

2

4

1

0

1

1

5

1

1

0

1

6

1

0

0

1

7

1

1

0

3

8

1

1

0

1

9

1

1

0

3

10

1

0

1

3

11

1

0

1

1

12

1

1

0

3

13

1

1

0

3

14

1

0

1

3

15

0

0

1

5

16

0

0

1

3

17

0

1

0

5

18

0

0

1

3

19

0

0

0

3

20

0

1

0

3

首先看表中,各变董的均值及其标准差:

变量的描述性数据

变量

均值

标准差

样本数

effe

・79983

39

coop

・88252

39

publ

・87023

39

mark

・82885

39

tech

・62307

39

reco

・87637

39

risk

・80624

39

D・

.3590

・48597

39

6

.3333

・47757

39

Da

.4103

・49831

39

tach

39

由于举本例的目的是为了详细解释在SPSS中如何进行回归分析,所以在本文中不详细论述与本主体关系不大的各■项分析及其结论。

在表中,详细列出了所有变董之间的两两相关系数:

effe

coop

publ

变量的相关系数及其显著性

mark

tech

reco

risk

D・

D2D3tach

effe

1

coop

・377()

1

publ

・385(*)

・607()

1

mark

.410(**)

.387(*)

・382(*)

1

tech

.438(**)

.398(*)

.617(**)

.313

1

reco

・709(**)

.502(**)

.376(*)

・174

.324(*)

1

risk

・731(**)

.257

.322(*)

.210

・265

・659(♦*)

1

D・

(♦)

1

D2

.092

.204

.017

.000

・000

.017

・151

1

D3

.006

.070

.063

.042

・137

(**)1

tach

・397(*)

・162

.212

.064

.349(*)

.187

.304

(*)

・1261

强制(Enter)的多元线性回归分析

5.3.1强制(Enter)多元线性回归分析在Spss软件中的操作

激活Statistics菜单选Regression中的Linear...项,弹出LinearRegression对话框。

从对话框左侧的变董列表中选effe,点击钮使之进入Dependent框,选其余各个变量(包括coop、publ、mark、tech、reco、risk>Di、D2、D3和tach),点击钮使之进入Independent(s)框;在Method处下拉菜单,共有5个选项:

Enter(强制法)、Stepwise(逐步法)、Remove(剔除法)、Backward(向后法)、Forward(向前法)。

首先选用Enter法°

点击Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析,在本例中选择Regressionconfidence下的Estimate、Residuals下的Durbin-Watson,以及ModeIfit和ColIinearityDiagnostics这几个选项,分别进行回归系数的仕计.模型的拟合评价和回归三大问题的诊斷;点击Plots...钮选择是否作变量分布图,在本例中选择DEPENDENT即因变量作为X轴,ZRESID即标准化残差作为Y轴,观察Y随X变化的情况,以判斯是否存在异方差和自相关问題:

点击Save...钮选择对回归分析的有关结果是否作保存,在本例中不做选择:

点击Options...钮选择变量入选与剔除的a、0值和缺失值的处理方法,在本例中选择系统默认值。

点击0K钮即完成分析。

5.3.2强制(Enter)多元线性回归分析三大问题的诊斷

首先要判断本强制回归中是否存在回归的三大问题。

因此,对照第3幸的相关内容有:

1、多重共线性诊断

见表和表中,回归方程的F较商但十值显著的不多,表明自变董之间有存在严重多重共线性的可能。

但方差膨胀因子VIF值基本在2左右,而容忍/t(Tolerance)也在可接受范国内。

在麦中也看到,除去第11个层面(Dimension),其余各层面的条件指标(Conditionindex;Cl)在30以内,各个自变量在每个层面上的方差比例基本没有出现都较大的现象。

说明自变量之间没有严重的多重共线性问题。

表模型的拟合⑹

Model

R

RSquare

AdjustedRSquare

Std・Errorofthe

Estimate

Durbin-V/atson

1

.872(a)

.761

.675

・45576

aPredictors:

(Constant),tach,D3.mark,reco,D1,tech,coop・D2,risk,pubIbDependentVariable:

effe

1

Coefficients

Coefficierrts

Beta

Statistics

ToleranceVIF

B

Std・Error

(Constant)

.568

.490

coop

.128

.657

.425

pubI

.131

.779

.422

mark

.219

・105

.227

.046

.723

tech

・157

.162

.122

.973

.339

.540

reco

.327

・135

.358

.023

.388

risk

.403

・135

.406

.006

.461

D1

.191

.182

.633

D2

.218

.227

.130

.963

.344

.466

D3

.034

.208

.021

.165

.870

.508

tach

.071

.086

.096

.829

.414

.644

aDependent

Variable:

effe

表变量的多重共线性诊断⑹

Mod

e1

Dimen

sion

Eigenvalue

Conditio

nIndex

VarianeeProportions

常数

coop

pub

I

mark

tech

reco

ris

k

D1

D2

D3

tach

1

1

.00

・00

.00

.00

.00

.00

.00

・0

0

.0

0

.00

.00

2

.00

.00

.00

.00

.00

.00

.00

・0

0

・1

7

.14

.00

3

.694

.00

.00

.00

.00

.00

.00

.00

・5

0

・0

1

.01

.01

4

.211

.00

.00

.01

.00

.00

.01

.00

・0

9

.4

9

.59

.03

5

・105

.00

.07

.01

.01

.00

.00

.01

・1

4

・1

1

・11

.55

6

.069

.00

.01

.06

.02

.01

・14

・16

・0

1

.0

5

.04

.06

7

.058

.05

.26

.02

.12

.01

.01

.01

・0

4

・0

3

.00

.13

8

.030

.01

.25

.47

・18

.03

.01

.04

・0

3

•1

3

.09

・10

9

.025

・11

.00

.04

.26

・10

・18

.33

・0

0

・0

0

.00

.00

10

.013

・11

.40

・15

.32

.08

.64

.45

・1

0

・0

1

.01

・11

11

.009

.71

.00

.26

.08

.77

.00

.00

・0

9

.0

1

.02

.00

aDependentVariable:

effe

2、自相关诊斷

从表中看到,值为,而查DW统计量临界值表(张晓蒂,1991)有:

样本莹为39且变董个数为5时氏为而du为.则在本例中其范围较之更广.还不能完全判断是否存在自相关,本例中暫且认为不存在自相关问题。

3、异方差诊断

见图,该残差图中的点基本呈随机分布,初步判断该组数据不存在异方差问题。

Scatterplot

DependentVariable:

effe

J.002.003.00AM5.00

effe

«np一SVH(snd)pooouU.2SEZOH

图标雇化残差与因变量之间的散点图

因此,从上述的诊断结果来看,本例的回归分析过程中不存在回归问題的三大问題。

接着检验回归的残差是否服从正态分布,见图。

从图中看到,残差基本是如从正态分布

的。

NormalP-PPlotofUnstandardizedResidual

表方差分析⑹

aPredictors:

(Constant),tach,D3,mark,reco,D1,tech,coop・D2・risk,pubIbDependentVariable:

effe

此时,将回归分析的结果总结如下:

表回归分析结果(a)

ModeI

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std・Error

Beta

(Constant

1

.568

.490

coop

・128

.657

pubI

・131

.779

mark

.219

・105

.227

.046

tech

・157

・162

・122

.973

.339

reco

.327

・135

.358

.023

risk

.403

・135

.406

.006

D1

・191

・182

D2

.218

.227

・130

.963

・344

D3

.034

.208

.021

・165

.870

tach

.071

.086

.096

.829

.414

R:

.872:

AdjustedRSqu:

.675:

F:

:

Sig.:

.000

aDependentVariable:

effe

bWeightedLeastSquaresRegression-WeightedbyreciprocaIofesquared

其中需要说明的是,没有设定虚拟变量的类别变量(本例中的家电产业和大型企业)被称为参照类,各■个虚拟变量回归系数则表示该类别与参照类上均值的差异。

为了比较回归系数显箸的冬自变量对因变量的影响程皮的大小,本例选用标准化后的系

数,则从表中看到:

①本例数扌居分析得出.自变董mark、reco和risk对因变量effe有显著影响,且均为正向

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 金融投资

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1