SPSS二元Logistic回归结果分析报告.docx

上传人:b****6 文档编号:5545799 上传时间:2022-12-19 格式:DOCX 页数:20 大小:28.32KB
下载 相关 举报
SPSS二元Logistic回归结果分析报告.docx_第1页
第1页 / 共20页
SPSS二元Logistic回归结果分析报告.docx_第2页
第2页 / 共20页
SPSS二元Logistic回归结果分析报告.docx_第3页
第3页 / 共20页
SPSS二元Logistic回归结果分析报告.docx_第4页
第4页 / 共20页
SPSS二元Logistic回归结果分析报告.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

SPSS二元Logistic回归结果分析报告.docx

《SPSS二元Logistic回归结果分析报告.docx》由会员分享,可在线阅读,更多相关《SPSS二元Logistic回归结果分析报告.docx(20页珍藏版)》请在冰豆网上搜索。

SPSS二元Logistic回归结果分析报告.docx

SPSS二元Logistic回归结果分析报告

SPSS-二元Logistic回归结果分析

2011-12-0216:

48

身心疲惫,睡意连连,头不断往下掉,拿出耳机,听下歌曲,缓

解我这严重的睡意吧!

今天来分析二元Logistic回归的结果

分析结果如下:

案例处理汇总

未加^的案例*

N

百分比

选定案例包括在分析中

489

57.5

駛失案例

0

.0

总计

469

57.5

未选定的案例

361

42.5

总计

350

100.0

商部値

0

1

 

分奘娈量塩码

频军

参敎縞晞

(D

(2)

(4)

敦盲水平来完战高中

209

1000

.000

.000

.000

髙中

134

.000

toao

000

.000

68

.000

oao

1.000

.000

大学

000

.000

.000

1.000

硏究生

3

.000

.050

X0D

.000

1:

在“案例处理汇总”中可以看出:

选定的案例489个,未选定的案例361个,这个结果是根据设定的validate=1得到的,在“因变量编码”中可以看出“违约”的两种结果“是”或者“否”分别用值“1“和“0”代替,在“分

类变量编码”中教育水平分为5类,如果选中“为完成高中,高中,大专,大学等,其中的任何一个,那么就取值为1,未选中的为0,如果四个都未被选中,那么就是”研究生“频率分别代表了处在某个教育水平的个数,总和应该为

489个

己观测

选理案刮'

未谨压的案例山冲

是否曾经茬约

百分比桢正

是否冒经违约

百分比檢正

B

歩骤D是否曾经违妁否

3B0

0

100.0

157

0

WO.O

123

0

.0

54

0

0

73.B

74.4

a已选走的案MvalidaleEQI

b,未选定的案例validateNE1

c由于目娈量中有摭生値‘或分类麦鱼中的値国出连定黨例的范圉:

所収未时某些来谨建的累例遇行分类夕山撲型中包括常呈。

e切剖値知万E

 

方程中的娈量

B

S-E.

Wais

df

Sig.

拠(B)

齿骤B常量

■1.026

.103

100.029

1

000

.353

1:

在“分类表”中可以看出:

预测有360个是“否”(未违约)有129个是

“是”(违约)

2:

在“方程中的变量”表中可以看出:

最初是对“常数项”记性赋值,B为

-1.026,标准误差为:

0.103

那么wald=(B/S.E)2=(-1.026/0.103)2=99.2248,跟表中的“100.029几乎

接近,是因为我对数据进行的向下舍入的关系,所以数据会稍微偏小,

B和Exp(B)是对数关系,将B进行对数抓换后,可以得到:

Exp(B)=eA-1.026

=0.358,其中自由度为1,sig为0.000,非常显著

不在方程中的娈量

導分

i1J

歩叢0芟量年饋

7.46C

1

.006

教育

3,994

4

.061

敎育⑴

E.O0G

1

.014

敎育⑵

1.145

1

.2E5

教育⑶

2.224

1

.13S

敎育⑷

2.516

1

.113

工禎

36746

1

.000

地址

S.433

1

002

1.107

1

7B.41S

1

.000

信用卡母債

35.323

1

OOD

其他员儀

11531

1

.000

总计虽

U7.557

11

.000

1:

从“不在方程中的变量”可以看出,最初模型,只有“常数项”被纳入了模型,其它变量都不在最初模型表中分别给出了,得分,df,Sig三个值,而其中得分(Score)计算公式如下:

[\>心厂刃F

——.

J”

讯1—刃工(兀-补

(公式中(Xi-X")少了一个平方)

下面来举例说明这个计算过程:

(“年龄”自变量的得分为例)

则违约

从“分类表”中可以看出:

有129人违约,违约记为“T总和为129,选定案例总和为489

那么:

y-=129/489=0.16

x-=16951/489=34.2

所以:

刀(Xi-x")2=30074.9979

y"1-y")=0.16*(1-0.16)=0.216

则:

y—(1-y—)*刀(Xi-x-)2=0.216*30074.9979=5840.9044060372

则:

[刀Xi(yi-y")]A2=43570.8

所以:

«■

.--一.

J”

亍(1-刃工(兀-对

=43570.8/5840.9044060372=7.76

=7.46(四舍五入)

计算过程采用的是在EXCEL里面计算出来的,截图如下所示:

〒A

=(A486-AV2RAGE@$1;A$483)

2

ra

B

C

D

G

23

136.0633999

0

-6.06748

27

5出74^2545

0

-7.1227

34

0.4=41721973

0

-3.96S38

35

0,11247862

1

25.766S7

24

113.7341555

0

-6.33129

48

177.832315

0

-12.6626

26

75.0756688

0

-氐8589

30

2E75869539

1

22.03589

36

1.783235266

0

-9.49693

21

136.7218856

0

53^88

34

0.44L721973

0

-9.96933

35

0・11247862

1

25.76687

35

61124=7862

0

-9.23313

34

L441721973

1

25,03067

S3

2.770965327

0

-8.70552

30

21.75869539

0

-7.91411

113.7341555

0

-6.33129

47

152.1615584

0

-12.3988

53

336.1860993

1

39*0184

22

ISO.39Z6122

0

-5.80368

1.783235266

1

26.50307

29

32.03793874;

0

-7.65031

33

2.770965327

0

-8.70552

45

106.82004=51

0

-*11,8712

16951

3007k99?

%

0.263804

43570,3

从“不在方程的变量中”可以看出,年龄的“得分”为7.46,刚好跟计算结果

吻合!

答案得到验证~!

!

!

!

块化方法=向前步进(似然比)

模型系敷的综合检脸

卡方

df

Sig.

歩骡1步霊

74.052

1

.000

74C52

1

.000

74.C52

1

.DOO

曲糠2歩骤

44.543

1

.000

11B.595

2

.000

模璽

11&£95

2

.□00

曲黔3歩驟

40B19

1

.000

108.414

3

.000

模型

169.414

3

.000

步骤4歩骤

0677

1

.002

178.091

4

.DOO

T7B.091

4

.000

 

撲型汇总

步躱

-2蹲数似熱値

Gok&SrielIF?

Nacel^rkeR

1

.141

.205

2

145709**

215

.315

3

355.35^

4

3S6213e

305

.446

a因対帥估计的更改范圉小于001,所以估计在送代突散4处烫止=

b因母毎数估计的更改范圉小于001、所以估计在迭

代迟散£蟲終征0

c盘事hZ-韦丄册古at/rpmnhTnn

1:

从“块T中可以看出:

采用的是:

向前步进的方法,在“模型系数的综合检验”表中可以看出:

所有的SIG几乎都为“0”而且随着模型的逐渐

步进,卡方值越来越大,说明模型越来越显著,在第4步后,终止,

根据设定的显著性值和

=CHIINV(显著性值,自由度)

自由度,可以算出卡方临界值,公式为:

,放入excel就可以得到结果

2:

在“模型汇总“中可以看出:

Cox&SnellR方和NagelkerkeR方拟合效

果都不太理想,最终理想模型也才:

0.305和0.446,最大似然平方的对数值都比较大,明显是显著的

lnL=yrKlnP+f1K)ln(l£)1

似然数对数计算公式为:

计算过程太费时间了,我就不举例说明计算过程了

Cox&SnellR方的计算值是根据:

1:

先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL0(指只包含“常数项”的检验)

2:

再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InLB(包含自变量的检验)

R&三L-q"

再根据公式:

方的值!

即可算出:

Cox&SnellR

=Hosmer和Lemeshow捡验=

歩骡

卡方

df

Sig.

1

7.567

8

.477

2

5.311

S

.721

3

3.312

e

.S13

4

11.919

9

155

是否曾经违约二昙

总计

已观测

期望値

己观测

期望値

歩骤1

1

44

44.308

5

4.612

49

2

45

43.344

4

49

3

41

41.107

T

0.513

4B

4

37

4C.52G

11

7.4S0

48

5

45

4C.201

4

S.799

49

&

39

37.607

g

10.393

48

T

33

35.142

15

1Z653

43

g

32.590

16

16.410

43

9

27.217

25

21.783

49

10

19

17.506

33

34.494

52

步骡2

1

48

47.541

1

1.459

斗3

2

46

46.044

3

2帧

49

3

45

44.258

4

4J42

49

4

42

*2.494

7

6.506

49

5

39

40.385

11

Q.E15

49

35

37.955

U

11J46

49

T

38

34.330

11

14.170

49

35

3C.562

U

1B.43S

4S

9

3

23.564

28

25.436

48

10

12

12.165

36

35535

48

需俱*

1

1Rfi1d

n

3

提示:

将Hosmer和Lemeshow检验和“随机性表”结合一起来分析

1从Hosmer和Lemeshow检验表中,可以看出:

经过4次迭代后,最终的卡

方统计量为:

11.919,而临界值为:

CHINV(0.05,8)=15.507

卡方统计量<临界值,从SIG角度来看:

0.155>0.05,说明模型能够很好

的拟合整体,不存在显著的差异。

2:

从Hosmer和Lemeshow检验随即表中可以看出:

”观测值“和”期望值

“几乎是接近的,不存在很大差异,说明模型拟合效果比较理想,印证了“Hosmer和Lemeshow检验”中的结果

而“Hosmer和Lemeshow检验”表中的“卡方”统计量,是通过“Hosmer和Lemeshow检验随即表”中的数据得到的(即通过“观测值和”预测值“)得到的,计算公式如下所示:

x2(卡方统计量)

刀(观测值频率-预测值频率)A2/预测值的频率

举例说明一下计算过程:

以计算"步骤1的卡方统计量为例"

1:

将“Hosmer和Lemeshow检验随即表”中“步骤1”的数据,复制到

excel中,得到如下所示结果:

C21-1A=SUliKCL:

C

20)

AB

C|D

E

44

44.369

0.003335

1

45

45.344

0.063249

*

41

41.487

0.00S714

E

37

40.520

0.30&729

1

45

40.201

0.572B74

1

3S

37.607

0.051608

*

35.142

0.130517

¥

1

33

32.550

0,005166

1

24

27.217

0.38C177

L

15

17.506

0.127566

5

4.619

0.032576

2

4

5.656

0.484724

3

7

6.513

ij.036396

4

11

7.ISO

1.656082

5

4

8禅

2.C17364

5

5

10.393

0.186741

7

15

12.958

0.3567

3

16

16.410

0.010258

d

25

21.7E3

0.47S004

34.494

0.^64739

1

7.5^6569

从“Hosmer和Lemeshow检验”表中可以看出,步骤1的卡方统计量为:

7.567,在上图中,通过excel计算得到,结果为7.566569~~7.567(四

舍五入),结果是一致的,答案得到验证!

己观测

已预测

选定案例*

耒选定的案例Z

是香曾经违妁

百分讯校正

是否曾经违约

歩骤1墨否曾经违釣習

是总计百井比

340

95

20

3斗

54.4

26.4

76.5

150

42

7

12

95.5

222

76;8

歩骤2是否曾经曲否是总计百分比

335

74

25

55

S3.1

42.6

79.0

r14T

39

10

15

93.6

27S

?

e.c

歩骤3是否曾经违妁沓

总计百分上匕

333

S4

27

65

S2.5

50.4

61.4

142

=33

15

21

90.4

36.5

773

歩骤4是否曾墟违妁否

总计百分上匕

337

56

23

71

33.6

55.0

€3.4

141

34

16

89.S

37C

76.3

a-已选定的案例validateEO1

b未选定的案例validateNE1

c由于自娈量中有缺矢値・戴分类变量中師値超出谨定案例朗范国・所収未肘某些未违定的案例进行分类*d切割値对.500

1:

从“分类表”一“步骤T中可以看出:

选定的案例中,“是否曾今违约”总计:

489个,其中没有违约的360个,并且对360个“没有违约”的客户进行了预测,有340个预测成功,20个预测失败,预测成功率为:

340/360=94.4%

其中“违约”的有189个,也对189个“违约”的客户进行了预测,有95个预测失败,34个预测成功,预测成功率:

34/129=26.4%

总计预测成功率:

(340+34)/489=76.5%

步骤1的总体预测成功率为:

76.5%,在步骤4终止后,总体预测成功率为:

83.4,预测准确率逐渐提升76.5%—79.8%—81.4%—83.4。

83.4的预测准确率,不能够算太高,只能够说还行。

如果務去项则龍蟆

畫量

模酣数似然性

在-2对敵似然中的夏改

cff

夏改的显薯性

步膘1負债率

-282.152

74.052

1

.000

浚骤2工龄

-345.126

44543

1

.000

费债率

-260995

76292

1

.000

步转3工龄

-242996

90.102

1

.000

员债率

-205804

15877

1

ooa

信用卡员债

-222955

49819

1

.000

歩礫4工龄

-2347?

6

83.338

1

.000

地址

-197.945

9677

1

.00?

負债率

-200.672

15.130

1

.Q0&

信用卡负债

-221.194

56V4

1

000

 

岛程中的娈量

e

S.E.

Wais

df

Sig,

Exp

歩骤1a员债率

.129

cie

61777

1

.000

1.133

竜量

-2500

.228

111Q4S

1

DGO

082

歩寢2b工龄

-.131

022

34.S50

1

.000

877

罚備率

.140

.016

61.974

1

.000

1.15D

-1655

.25C

43.051

1

.DOO

.1S4

歩疆屮工聒

■252

033

57744

1

.DOD

777

罚债率

0€3

021

1572S

1

.000

1.0S6

信用卡彷债

.544

31r090

1

OGD

1723

寓量

-1.161

.275

13.505

1

.DOO

.307

垢骤4d工龄

-249

.034

54.S77

1

JOO

790

地址

-.069

.023

9,027

1

003

.933

E债率

081

.021

14.E93

1

.000

1.085

信用咔罚债

.594

.102

33650

1

JOD

1811

常量

-.766

.304

6375

1

.012

4B5

包在出骡1中输入的吏呈:

负债率.工在歩碟上中输入的麦量:

工騒

C.在歩骤2中输入的生呈.信用卡氏I伍.止在歩骡4中输入的妾量:

地址.

从“如果移去项则建模”表中可以看出:

“在-2对数似然中的更改”中的数值是不是很眼熟?

,跟在“模型系数总和检验”表中“卡方统计量"量的值是一样的!

将“如果移去项则建模”和“方程中的变量”两个表结合一起来看

1:

在“方程中的变量”表中可以看出:

在步骤1中输入的变量为“负债

率”,在”如果移去项则建模“表中可以看出,当移去“负债率”这个变量

时,引起了74.052的数值更改,此时模型中只剩下“常数项”-282.152为常数

项的对数似然值

在步骤2中,当移去“工龄”这个自变量时,引起了44.543的数值变化(简称:

似然比统计量),在步骤2中,移去“工龄”这个自变量后,还剩下“负债率”和“常量”,此时对数似然值变成了:

-245.126,此时我们可以通过公式算出“负债率”的似然比统计量:

计算过程如下:

答案得到验证!

似然比统计量=2(-245.126+282.152)=74.052

2:

在“如果移去项则建模”表中可以看出:

不管移去那一个自变量,“更改的显著性”都非常小,几乎都小于0.05,所以这些自变量系数跟模型显著相关,不能够剔去!

3:

根据"方程中的变量“这个表,我们可以得出logistic回归模型表达式:

1/1+eA-(a+Epl*Xi)

们假设Z=

+£窪1旳力那么可以得到简洁表达式:

P(Y)=1/1+eA(-z)

将”方程中的变量

步骤4中的参数代入

模型表达式中,可以得

到logistic回归模型如下所示:

P(Y)=1/1+ea-址-0.249*功龄)

(-0.766+0.594*信用卡负债率+0.081*负债率-0.069*地

收入

.430

1

.512

奏他们债

.012

1

.9U

12.707

S

122

步藥4娈蚤年豔

2.023

1

.155

1.233

4

373

載育⑴

.347

1

.556

.050

1

.913

772

1

380

報育(4)

J36

1

.712

收入

.005

1

.946

.131

1

718

总锁计量

3613

7

.323

从”不在方程中的变量“表中可以看出:

年龄,教育,收入,其它负债,都没有纳入模型中,其中:

sig值都大于0.05,所以说明这些自变量跟模型显著不相关。

Stepnumber:

4

ObservedGroupsandPredictedProtoatiltti^s

80++

F

R

&Q+

+

E

1

1

Q

1

1

U

1

1

E

40+0

N

10

1

c

10

1

Y

1000

1

20+0000

1000001

1

1000000100101100001

1011

ioooooooooooooaoooooooOOOOIO0011001100000011111111111111

rreaiCLeu~-十——

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1