手把手教你SPSS二分类Logistic回归分析.docx

上传人:b****3 文档编号:2972556 上传时间:2022-11-16 格式:DOCX 页数:8 大小:166.54KB
下载 相关 举报
手把手教你SPSS二分类Logistic回归分析.docx_第1页
第1页 / 共8页
手把手教你SPSS二分类Logistic回归分析.docx_第2页
第2页 / 共8页
手把手教你SPSS二分类Logistic回归分析.docx_第3页
第3页 / 共8页
手把手教你SPSS二分类Logistic回归分析.docx_第4页
第4页 / 共8页
手把手教你SPSS二分类Logistic回归分析.docx_第5页
第5页 / 共8页
点击查看更多>>
下载资源
资源描述

手把手教你SPSS二分类Logistic回归分析.docx

《手把手教你SPSS二分类Logistic回归分析.docx》由会员分享,可在线阅读,更多相关《手把手教你SPSS二分类Logistic回归分析.docx(8页珍藏版)》请在冰豆网上搜索。

手把手教你SPSS二分类Logistic回归分析.docx

手把手教你SPSS二分类Logistic回归分析

手把手教你SPSS二分类Logistic回归分析

木教程手把手教您用SPSS做Logistic回归分析,目录如下:

一、数据格式

二、对数据的分析理解

三、SPSS做Logistic回归分析操作步骤

3.1线性关系检验假设

3.2多重共线检验假设

3.3离群值、杠杆点和强影响点的识别

3.4Logistic回归分析

四、SPSS计算结果的解释

五、结果结论的撰写

一、数据格式

某研究者想了解年龄、性别、BMI和总胆固醇(TC)预测患心脏病(CVD)的能力,招募了100例研究对象,记录了年龄(age)、性别(gender)、BMI,测量血中总胆固醇水平(TC),并评估研究对象目前是否患有心脏病(CVD)o部分数据如图1。

夕ID

&CVD

少age

gender

夕BMI

夕TC

T

3

1

46

1

29.22

5.37

4

1

36

0

29.93

5.64

5

0

34

1

31.01

5.07

6

0

39

0

26.79

4-13

7

0

34

1

27.49

5.44

8

0

37

0

26.31

3.80

9

1

55

1

32.37

5.02

10

0

32

0

26.14

4.50

11

1

40

1

29.34

5.53

12

1

55

0

24.82

4.85

13

0

35

1

25.33

4.14

14

0

46

0

19.66

5.60

15

1

33

0

27.27

3.99

1G

0

39

0

26.60

4.31

17

1

47

0

18.73

5.90

18

0

40

1

28.71

6.63

19

1

36

1

29.10

6.89

20

1

46

1

29.51

570

21

0

36

0

22.84

4.69

22

0

41

0

26.57

4.63

23

0

40

1

20.84

4.81

|24-

0

34

0

20.30

4.64

]25

1

66

1

17.81

5.53

|2G

0

33

0

22.84

5.04

27

1

55

1

24.12

6.90

28

1

48

0

27.39

6.23

j2»

1

40

1

30.31

4.76

]30

0

31

1

31.84

6.02

31

1

49

0

24.38

5.30

32

1

46

1

20.86

6.03

]33

1

38

1

30.46

5.37

]34

1

51

0

31.43

5.32

]36

0

40

1

19.36

5.11

|36

0

35

0

30.08

3.42

二、对问题分析

使用Logistic模型前,需判断是否满足以下7项假设。

假设1:

因变量(结局)是二分类变量。

假设2:

有至少1个自变量,自变量可以是连续变量,也可以是分类变量。

假设3:

每条观测间相互独立。

分类变量(包括因变量和自变量)的分类必须全而且每一个分类间互斥。

假设4:

最小样本量要求为自变量数目的15倍,但一些研究者认为样木量应达到自变量数目的50倍。

假设5:

连续的自变量与因变量的logit转换值之间存在线性关系。

假设6:

自变量之间无多重共线性。

假设7:

没有明显的离群点、杠杆点和强影响点。

假设1-4取决于研究设计和数据类型,本研究数据满足假设1-4o那么应该如何检验假设5-7,并进行Logistic回归呢?

三、SPSS操作

3.1检验假设5:

连续的自变量与因变量的logit转换值之间存在线性关系。

连续的自变量与因变量的logit转换值之间是否存在线性关系,可以通过多种方法检验。

这里主要介绍Box-Tidwell方法,即将连续自变量与其自然对数值的交互项纳入回归方程。

本研究中,连续的自变量包括age、BMI、TCo使用Box-Tidwell方法时,需要先计算age、BMI、TC的自然对数值,并

命名为ln_age>ln_BMI>ln_TCo

(1)计算连续自变量的自然对数值

以age为例,计算age的自然对数值ln_age的SPSS操作如下。

在主界面点击TransformComputeVariable,出现ComputeVariable对话框。

在TargetVariable框中输入即将生成自然对数值的变量名称(如输入ln_age表示age的自然对数值)。

选择Functiongroup菜单卜的Arithmetic,选择Functionsandspecialvariables菜单下的Ln,双击Ln将该公式选入NumericExpression框中,最后双击age将该变量选入“LN()”公式中。

点击0K生成新变量ln_age

(即age的自然对数值)。

如图2。

LN(age)

Type&Label...|

OK][^ste|Reset|Cancelj[Helpj

此时新变量会同时出现在VariableView和DataView窗口中。

在DataView窗口中,新生成的ln_age变暈如图3。

owe%AC夏亀事o汚-q<3]

重复以上过程,将木研究中的所有连续自变量的自然对数值全部

生成。

在DataView中,新生成的ln_age,ln_BMI,ln_TC变量如图

4o

伦^Logistic曲0[EtaSe门:

-IBMSPSSStatisticsDataEditor^

FileEdnviewDataTransformAnabzeDirectMarxetinoGraphsutilitiesAdO

ID

CVD

age

gender

BMI

TC

In.ag©

In.BMI

InJC

—~~11

0

37

1

20.16

3.97

3.61

3.00

1.3B

2

2

0

63

0

1678

438

414

282

148

3

3

1

46

1

2922

537

383

337

168

4

4

1

36

0

2993

5S4

3S8

340

171

5

5

0

34

1

31.01

5.07

3.53

3.43

1.62

i5

6

0

39

0

2579

413

366

325

142

7

0

34

1

2749

544

353

331

169

8

8

0

37

0

2631

380

361

323

133

9

9

1

55

1

32.37

5.02

4.01

3.48

1.61

10

10

0

32

0

2614

450

347

326

150

(2)Box-Tidwell法

Box-Tidwell法检验连续的自变量与因变量的logit转换值之间是否存在线性关系的SPSS操作如下。

在主界面中点击Analyze-Regression—^BinaryLogistico在LogisticRegression对话框中将变量CVD选入Dependent框中,将变量age、gendernBMI和TC选入Covariates框中。

Methods选项选择默认值,即Entero女口果目前未选择Enter,应修改为Entero如图5。

点击Categorical、在LogisticRegression:

DefineCategoricalVariables对话框中,将genderCategoricalCovariates框中。

在ChangeContrast区域,将ReferenceCategory从Last改为First后,点击ChangeContinueo如图6。

对于二分类变量(如本研究的gender),也可以不通过Categorical选项指定参照,SPSS将默认以赋值较低的变量为参照。

Categorical选项可将多分类变量(包扌舌有序多分类和无序多分类)变换成哑变量,指定某一分类为参照。

比如,某研究

中COPD是多分类变量(分为无C0PD病史、轻/中度、重度),如果指定“无COPD病史”的研究对象为参照组,可以分别比较“轻/中度”和“重度”组相对于参照组发生结局的风险。

Contrast右侧的下拉菜单中(该下拉菜单内的选项是几种与参照比较的方式),Indicator方式最常用,其比较方法为:

第一类或最后一类为参照类,每一类与参照类比较)。

在ReferenceCategory的右侧选择First,表示本研究以女性(赋值为0)为对照组。

回到LogisticRegression对话框后,可见gender己显示为gender(Cat)o分类变量后显示“(Cat)”说明己正确定义分类变量。

如图7。

设置好分类自变量后,开始生成交互项。

以age和ln_age为例,同时选中age和ln_age(使用Ctrl键+鼠标点击),点击“>a*b>”键,将age*ln_age交互项选入Covariates框中。

如图8。

重复以上过程,将所有交互项都选入Covariates框中,点击0心

如图90

 

(3)假设5的检验结果

查看VariablesintheEquation表格中,有交互作用的行及行内"Sig”值,本研究中为agebyln_age>BMIbyln_BMI和TCbyln_TC所在的行及行内“Sig”值。

如图10。

VariablesintheEquation

B

S.E.

Wald

df

Sig.

Exp(B)

Step1aago

1.893

1.019

3.452

1

.063

6.640

gender

(1)

.038

.601

.004

1

.949

1.039

BMI

.670

2.754

.059

1

.808

1.954

TC

-5.191

11.017

・222

1

・637

•006

agebyInnage

-.369

.210

3.087

1

.079

.692

BMIbyIn.BMI

-.112

.652

.029

1

.864

.894

TCbyln.TC

2.292

4.150

.305

1

.581

9.898

Constant

-22.342

30.528

.536

1

.464

.000

a.Variable(s)enteredonstep1:

age,gender,BMI.TC,age*ln_age,BMI*ln_BMI,TC*ln_TC.

如果交互作用有统计学意义(P〈0.05),则说明对应的连续自变量与因变量logit转换值间没有线性关系(即不符合假设5)o尽管

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 化学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1