SPSS操纵方法逻辑回归.docx-资源下载

SPSS操纵方法逻辑回归.docx

1、SPSS操纵方法逻辑回归SPSS操作方法之五 SPSS操作方法：逻辑回归例证8.3: 在一次关于公共交通的社会调查中,一个调查项目是“乘公交车上下班,还是骑自行车上下班”因变量Y=1表示乘车，Y=0表示骑车。自变量X1表示年龄；X2表示表示月收入；X3表示性别，取1时为男性，取0时为女性。调查对象为工薪族群体。数据见下表：试建立Y与自变量之间的Logistic回归。表8-4序号性别年龄月收入y序号性别年龄月收入y101885001512010000202112000161251200030238501171271300040239501181281500050281200119130950

2、160318500201321000070361500121133180008042100012213310000904695012313812000100481200024141150001105518001251451800112056210012614810000130581800127152150011411885002815618001逻辑回归SPSS操作方法的具体步骤：1选择AnalyzeRegreessinBinary Logistic,打开对话框如图1所示：图1 主对话框Logistic回归。2选择因变量Y进入Dependent框内，将自变量选择进入 Convariates框

3、。也可以将不同的自变量组放在不同的块（block）中，可以分析不同的自变量组对因变量的贡献。3在Mothed框内选择自变量的筛选策略：Enter表示强行进入法；（本例选择）Forword和Bacword都表示逐步筛选策略；Forword 为自变量逐步进入，Bacword是自变量逐步剔出。Conditional ;LR; Wald分别表示不同的检验统计量，如Forword Wald表示自变量进入方程的依据是Wald统计量。4在Selection中选择一个变量作为条件变量，只有满足条件的变量数据才能参与回归分析。5单击Categorical打开Categorical对话框如图2所示：对定性变量的自

4、变量选择参照类。常用的方法是Indicator，即以某个特定的类为参照类，Last表示以最大值对应的类为参照类（系统默认），First表示以最小值对应的类为参照类。选择后点击Continue按钮返回主对话框。（本例不作选择性）图2 Categorical对话框6单击Option按钮，打开Option对话框如图3所示图3：Option对话框（1）从Statistics and Plots框中选择输出图和分析结果。 Classification Plots：表示绘制因变量实际值与预测分类值的关系图（本例选择）。Hosmer-lemeshow goodness-of-fit：表示拟合优度指标（本例

5、选择）。Casewise Listing of residuals：表示输出各样本数据残差列表，有因变量的观察值，预测值，相应的预测概率，残差（非标准化残差，标准化残差）等。 Correlations of estimations：表示输出估计参数的相关矩阵（本例选择）。Iteration history：表示输出估计参数迭代过程中的参数与对数似然值（本例选择）。CI for exp(B)：表示输出发生比N%的置信区间（默认95%）。（2）从Display框中选择输出方式。 At each step 表示输出模型建立过程中的每一步结果（系统默认），At last step 表示只输出最终结果。

6、（3）从Propbability for Stepwise框中指定自变量进入方程或剔除方程的显著性水平。Entry表示回归系数Score检验的概率p值小于0.05时相应变量可进入方程； Removal 表示回归系数Score检验的概率p值大于0.1时相应变量应当剔除出回归方程.。（4）Classification Cutoff设置概率分界值，预测概率大于分界值（默认0.5）时,分类预测值为1, 否则为预测值为0。（本例选择系统默认项）（5）从Maximum Iterations框内指定极大似然估计的最大迭代次数（默认值是20）7单击Save按钮，打开Save对话框如图4所示：从中选择需要保存预

7、测结果到数据窗口。图4：Save对话框（1）从Predieted Values框中，Probalities 表示保存因变量取1 的预测概率值，Croup membership表示保存分类预测值。（本例选择）（2）Residuals和Influence表示保存残差及影响点，具体含义与线性回归相同。选择结束，后可以从输出窗口观看输出结果如下：表1 案例处理摘要未加权的案例aN百分比已选定的案例包括在分析中28100.0缺失案例0.0总计28100.0未选定的案例0.0总计28100.0a. 如果权重有效，请参见分类表以获得案例总数。表2 因变量编码初始值内部值0011以上两个表是数据个数，分类，及

8、因变量的概况。表3 迭代历史记录a,b,c迭代-2 对数似然值系数Constant步骤 0138.673-.143238.673-.143a. 模型中包括常量。b. 初始 -2 对数似然值: 38.673c. 因为参数估计的更改范围小于 .001，所以估计在迭代次数 2 处终止。表4 分类表a,b观察值预测值出行方式百分比校正01步骤 0出行方式0150100.01130.0总百分比53.6a. 模型中包括常量。b. 切割值为 .500表5 方程中的变量BS.E.Walddf显著性Exp(B)步骤 0常量-.143.379.1431.706.867表6 不在方程中的变量得分df显著性步骤 0变

9、量x35.0731.024x16.0381.014x22.9461.086总统计量10.4143.015注意：表3至表6表示只有常数项的模型，没有实际意义，可以不考虑。表7 迭代历史记录a,b,c,d迭代-2 对数似然值系数Constantx1(1)x2x3步骤 1127.128-3.7441.604.056.001226.051-5.4642.241.075.001325.971-6.0932.477.082.001425.971-6.1562.502.082.002525.971-6.1572.502.082.002a. 方法：输入b. 模型中包括常量。c. 初始 -2 对数似然值: 38

10、.673d. 因为参数估计的更改范围小于 .001，所以估计在迭代次数 5 处终止。表7表示的是迭代历史，表示每一次迭代中-2LL值和系数值。表8 模型系数的综合检验卡方df显著性步骤 1步骤12.7033.005块12.7033.005模型12.7033.005表8模型综合检验是模型拟合优度检验的，用-2LL度量。最好的模型有-2LL=0，步骤1中的“步骤”中的卡方值是当前-2LL与下一步-2LL的差值，“块”中的卡方值为当前值-2LL与后一组变量进入模型后的-2LL的差值，“模型”中的卡方统计量是当前模型中的-2LL与只含常数项模型的-2LL的差值，因所有自变量是强行进入，只有一个步骤，

11、一个块和一个模型，所以三者的卡方值相等。本例中假设检验的P值等于0.005，小于0.05，故模型中至少有一个回归系数不为0。表9 模型摘要步骤-2 对数似然值Cox & Snell R 方Nagelkerke R 方125.971a.365.487a. 因为参数估计的更改范围小于 .001，所以估计在迭代次数 5 处终止。从表9中看出-22LN值不算太大，模型拟合程度一般。Cox & Snell R2和 Nagelkerke R2类似于线性模型中的拟合优度检验。其中：Cox & Snell R2= Nagelkerke R2=从表中得出Cox & Snell R2和 Nagelkerke R

12、2类不是太高，似合优度一般。表10 Hosmer 和 Lemeshow 检验步骤卡方df显著性111.5137.118表11 Hosmer 和 Lemeshow 检验的随机性表出行方式 = 0出行方式 = 1总计观察值期望值观察值期望值步骤 1132.8270.1733222.6641.3363332.4730.5273432.0470.9533511.82221.1783621.41411.5863701.02531.975380.55632.444391.17233.8284表10 和表11是逻辑方程的拟合程度的检验，由于观察值和理论频数的差异不大，检验通过。但是理论频数都小于5，原因是数

13、据个数太少造成的，所以检验结果有待进一步检验。表12 分类表a观察值预测值出行方式百分比校正01步骤 1出行方式013286.7131076.9总百分比82.1a. 切割值为 .500表12也称错判矩阵。从表10中看出，如出行方式为坐公交车15人中，预测值为13人，正确率为86.7%。表13 方程中的变量BS.E.Walddf显著性Exp(B)步骤 1ax3-2.5021.1584.6691.031.082x1.082.0522.4861.1151.086x2.002.002.6611.4161.002常量-3.6552.0913.0551.081.026a. 在步骤 1 中输入的变量: x

14、3, x1, x2. 从表13中可以得到回归系数、回归系数的标准误、Wald检验统计量、P值、发生比等。其中第二个与第三个变量的回归系数没有通过检验。为回归系数的标准误。表示一个自变量的发生比，指当其它自变量不变时，该自变量每增加一个单位，将引起发生比扩大。表14 相关矩阵Constantx3 x1 x2 步骤 1Constant1.000.311-.372-.644x3 .3111.000-.197-.388x1 -.372-.1971.000-.400x2 -.644-.388-.4001.000 表14中表示的是回归系数的相关矩阵。Stepnumber:1ObservedGroupsan

15、dPredictedProbabilities4FR3EQUE21011N1011C1011Y10111000000000001100111111011000000000001100111111011000000000001100111111011000000000001100111111011PredictedProb:0.1.2.3.4.5.6.7.8.91Group:0000000000000000000000000000000000000000000000000011111111111111111111111111111111111111111111111111PredictedProbabilityisofMembershipfor1TheCutValueis.50Symbols:0-01-1EachSymbolRepresents.25Cases. 图5 预测分类图预测分类图中显示预测值的分布，横坐标表示预测概率值,大于0.5的预测值将预测为1，小于0.5的预测值为0。图中0表示实际观察值为Y=0，1表示观察值Y=1，纵向四个同样的数字表示一个样本观察值。实验题：为研究某商品消费特点和趋势，收集以往的消费数据，数据包括：因变量Y为是否购买，购买取值为1，否则Y取值为0。自变量有性别，年龄和收入水平。数据见表。试采用逻辑回归的方法进行分析。

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？