SPSS操作方法逻辑回归.docx

上传人:b****5 文档编号:6605558 上传时间:2023-01-08 格式:DOCX 页数:11 大小:88.82KB
下载 相关 举报
SPSS操作方法逻辑回归.docx_第1页
第1页 / 共11页
SPSS操作方法逻辑回归.docx_第2页
第2页 / 共11页
SPSS操作方法逻辑回归.docx_第3页
第3页 / 共11页
SPSS操作方法逻辑回归.docx_第4页
第4页 / 共11页
SPSS操作方法逻辑回归.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

SPSS操作方法逻辑回归.docx

《SPSS操作方法逻辑回归.docx》由会员分享,可在线阅读,更多相关《SPSS操作方法逻辑回归.docx(11页珍藏版)》请在冰豆网上搜索。

SPSS操作方法逻辑回归.docx

SPSS操作方法逻辑回归

SPSS操作方法之五

SPSS操作方法:

逻辑回归

例证:

在一次关于公共交通的社会调查中,一个调查项目是“乘公交车上下班,还是骑自行车上下班”因变量Y=1表示乘车,Y=0表示骑车。

自变量X1表示年龄;X2表示表示月收入;X3表示性别,取1时为男性,取0时为女性。

调查对象为工薪族群体。

数据见下表:

试建立Y与自变量之间的Logistic回归。

表8-4

序号

性别

年龄

月收入

y

序号

性别

年龄

月收入

y

1

0

18

850

0

15

1

20

1000

0

2

0

21

1200

0

16

1

25

1200

0

3

0

23

850

1

17

1

27

1300

0

4

0

23

950

1

18

1

28

1500

0

5

0

28

1200

1

19

1

30

950

1

6

0

31

850

0

20

1

32

1000

0

7

0

36

1500

1

21

1

33

1800

0

8

0

42

1000

1

22

1

33

1000

0

9

0

46

950

1

23

1

38

1200

0

10

0

48

1200

0

24

1

41

1500

0

11

0

55

1800

1

25

1

45

1800

1

12

0

56

2100

1

26

1

48

1000

0

13

0

58

1800

1

27

1

52

1500

1

14

1

18

850

0

28

1

56

1800

1

逻辑回归SPSS操作方法的具体步骤:

1.选择Analyze→Regreessin→BinaryLogistic,打开对话框如图1所示:

图1主对话框Logistic回归。

2.选择因变量Y进入Dependent框内,将自变量选择进入Convariates框。

也可以将不同的自变量组放在不同的块(block)中,可以分析不同的自变量组对因变量的贡献。

3.在Mothed框内选择自变量的筛选策略:

Enter表示强行进入法;(本例选择)

Forword和Bacword都表示逐步筛选策略;Forword为自变量逐步进入,Bacword是自变量逐步剔出。

Conditional;LR;Wald分别表示不同的检验统计量,如ForwordWald表示自变量进入方程的依据是Wald统计量。

4.在Selection中选择一个变量作为条件变量,只有满足条件的变量数据才能参与回归分析。

5.单击Categorical打开Categorical对话框如图2所示:

对定性变量的自变量选择参照类。

常用的方法是Indicator,即以某个特定的类为参照类,Last表示以最大值对应的类为参照类(系统默认),First表示以最小值对应的类为参照类。

选择后点击Continue按钮返回主对话框。

(本例不作选择性)

图2Categorical对话框

6.单击Option按钮,打开Option对话框如图3所示

图3:

Option对话框

(1)从StatisticsandPlots框中选择输出图和分析结果。

ClassificationPlots:

表示绘制因变量实际值与预测分类值的关系图(本例选择)。

Hosmer-lemeshowgoodness-of-fit:

表示拟合优度指标(本例选择)。

CasewiseListingofresiduals:

表示输出各样本数据残差列表,有因变量的观察值,预测值,相应的预测概率,残差(非标准化残差,标准化残差)等。

Correlationsofestimations:

表示输出估计参数的相关矩阵(本例选择)。

Iterationhistory:

表示输出估计参数迭代过程中的参数与对数似然值(本例选择)。

CIforexp(B):

表示输出发生比N%的置信区间(默认95%)。

(2)从Display框中选择输出方式。

Ateachstep表示输出模型建立过程中的每一步结果(系统默认),Atlaststep表示只输出最终结果。

(3)从PropbabilityforStepwise框中指定自变量进入方程或剔除方程的显著性水平α。

Entry表示回归系数Score检验的概率p值小于时相应变量可进入方程;Removal表示回归系数Score检验的概率p值大于时相应变量应当剔除出回归方程.。

(4)ClassificationCutoff设置概率分界值,预测概率大于分界值(默认)时,分类预测值为1,否则为预测值为0。

(本例选择系统默认项)

(5)从MaximumIterations框内指定极大似然估计的最大迭代次数(默认值是20)

7.单击Save按钮,打开Save对话框如图4所示:

从中选择需要保存预测结果到数据窗口。

图4:

Save对话框

(1)从PredietedValues框中,Probalities表示保存因变量取1的预测概率值,Croupmembership

表示保存分类预测值。

(本例选择)

(2)Residuals和Influence表示保存残差及影响点,具体含义与线性回归相同。

选择结束,后可以从输出窗口观看输出结果如下:

 

表1案例处理摘要

未加权的案例a

N

百分比

已选定的案例

包括在分析中

28

缺失案例

0

.0

总计

28

未选定的案例

0

.0

总计

28

a.如果权重有效,请参见分类表以获得案例总数。

表2因变量编码

初始值

内部值

0

0

1

1

以上两个表是数据个数,分类,及因变量的概况。

表3迭代历史记录a,b,c

迭代

-2对数似然值

系数

Constant

步骤0

1

2

a.模型中包括常量。

b.初始-2对数似然值:

c.因为参数估计的更改范围小于.001,所以估计在迭代次数2处终止。

表4分类表a,b

观察值

预测值

出行方式

百分比校正

0

1

步骤0

出行方式

0

15

0

1

13

0

.0

总百分比

a.模型中包括常量。

b.切割值为.500

 

表5方程中的变量

B

.

Wald

df

显著性

Exp(B)

步骤0

常量

.379

.143

1

.706

.867

 

表6不在方程中的变量

得分

df

显著性

步骤0

变量

x3

1

.024

x1

1

.014

x2

1

.086

总统计量

3

.015

注意:

表3至表6表示只有常数项的模型,没有实际意义,可以不考虑。

表7迭代历史记录a,b,c,d

迭代

-2对数似然值

系数

Constant

x1

(1)

x2

x3

步骤1

1

.056

.001

2

.075

.001

3

.082

.001

4

.082

.002

5

.082

.002

a.方法:

输入

b.模型中包括常量。

c.初始-2对数似然值:

d.因为参数估计的更改范围小于.001,所以估计在迭代次数5处终止。

表7表示的是迭代历史,表示每一次迭代中-2LL值和系数值。

表8模型系数的综合检验

卡方

df

显著性

步骤1

步骤

3

.005

3

.005

模型

3

.005

表8模型综合检验是模型拟合优度检验的,用-2LL度量。

最好的模型有-2LL=0,步骤1中的“步骤”中的卡方值是当前-2LL与下一步-2LL的差值,“块”中的卡方值为当前值-2LL与后一组变量进入模型后的-2LL的差值,“模型”中的卡方统计量是当前模型中的-2LL与只含常数项模型的-2LL的差值,因所有自变量是强行进入,只有一个步骤,一个块和一个模型,所以三者的卡方值相等。

本例中假设检验的P值等于,小于,故模型中至少有一个回归系数不为0。

表9模型摘要

步骤

-2对数似然值

Cox&SnellR方

NagelkerkeR方

1

25.971a

.365

.487

a.因为参数估计的更改范围小于.001,所以估计在迭代次数5处终止。

从表9中看出-22LN值不算太大,模型拟合程度一般。

Cox&SnellR2和NagelkerkeR2类似于线性模型中的拟合优度检验。

其中:

Cox&SnellR2=

NagelkerkeR2=

从表中得出Cox&SnellR2和NagelkerkeR2类不是太高,似合优度一般。

表10Hosmer和Lemeshow检验

步骤

卡方

df

显著性

1

7

.118

表11Hosmer和Lemeshow检验的随机性表

出行方式=0

出行方式=1

总计

观察值

期望值

观察值

期望值

步骤1

1

3

0

.173

3

2

2

1

.336

3

3

3

0

.527

3

4

3

0

.953

3

5

1

2

3

6

2

1

3

7

0

3

3

8

0

.556

3

3

9

1

.172

3

4

 

表10和表11是逻辑方程的拟合程度的检验,由于观察值和理论频数的差异不大,检验通过。

但是理论频数都小于5,原因是数据个数太少造成的,所以检验结果有待进一步检验。

表12分类表a

观察值

预测值

出行方式

百分比校正

0

1

步骤1

出行方式

0

13

2

1

3

10

总百分比

a.切割值为.500

表12也称错判矩阵。

从表10中看出,如出行方式为坐公交车15人中,预测值为13人,正确率为%。

表13方程中的变量

B

.

Wald

df

显著性

Exp(B)

步骤1a

x3

1

.031

.082

x1

.082

.052

1

.115

x2

.002

.002

.661

1

.416

常量

1

.081

.026

a.在步骤1中输入的变量:

x3,x1,x2.

从表13中可以得到回归系数、回归系数的标准误、Wald检验统计量、P值、发生比等。

其中第二个与第三个变量的回归系数没有通过检验。

为回归系数

的标准误。

表示一个自变量的发生比,指当其它自变量不变时,该自变量每增加一个单位,将引起发生比扩大

表14相关矩阵

Constant

x3

x1

x2

步骤1

Constant

.311

x3

.311

x1

x2

表14中表示的是回归系数的相关矩阵。

             Step number:

 1

             Observed Groups and Predicted Probabilities

 

          Predicted Probability is of Membership for 1

          The Cut Value is .50

          Symbols:

 0 - 0

 

图5预测分类图

预测分类图中显示预测值的分布,横坐标表示预测概率值,大于的预测值将预测为1,小于的预测值为0。

图中0表示实际观察值为Y=0,1表示观察值Y=1,纵向四个同样的数字表示一个样本观察值。

实验题:

为研究某商品消费特点和趋势,收集以往的消费数据,数据包括:

因变量Y为是否购买,购买取值为1,否则Y取值为0。

自变量有性别,年龄和收入水平。

数据见表。

试采用逻辑回归的方法进行分析。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1