ImageVerifierCode 换一换
格式:DOCX , 页数:7 ,大小:68.53KB ,
资源ID:11610107      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/11610107.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(spssau 多分类logistic回归.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

spssau 多分类logistic回归.docx

1、spssau 多分类logistic回归Logistic回归之多分类logistic回归分析Logistic回归分析(logit回归)一般可分为3类:分别是二元Logistic回归分析、多分类Logistic回归分析和有序Logistic回归分析。logistic回归分析类型如下所示。Logistic回归选择自变量X因变量Y研 究 方 法研 究 场 景定量数据/分类数据分类数据(2组)二元Logistic回归分析数据间影响关系情况如何定量数据/分类数据分类数据(多组且有序)多分类Logistic回归分析数据间影响关系情况如何定量数据/分类数据分类数据(多组且有序)有序Logistic回归分析数

2、据间影响关系情况如何Logistic回归分析用于研究X对Y的影响,并且对X的数据类型没有要求,X可以为定类数据,也可以为定量数据,但要求Y必须为定类数据,并且根据Y的选项数,使用相应的数据分析方法。如果Y有两个选项,如愿意和不愿意、是和否,那么应该使用二元Logistic回归分析(SPSSAU进阶方法-二元logit);如果Y有多个选项,并且各个选项之间可以对比大小,例如,1代表“不愿意”,2代表“无所谓”,3代表“愿意”,这3个选项具有对比意义,数值越高,代表样本的愿意程度越高,那么应该使用多元有序Logistic回归分析(SPSSAU进阶方法-有序logit);如果Y有多个选项,并且各个选

3、项之间不具有对比意义,例如,1代表“淘宝”,2代表“天猫”,3代表“京东”,4代表“亚马逊中国”,数值仅代表不同类别,数值大小不具有对比意义,那么应该使用多元无序Logistic回归分析(SPSSAU进阶方法-多分类logit)。1多分类logistic回归分析基本说明只要是logistic回归,都是研究X对于Y的影响,区别在于因变量Y上,logistic回归时,因变量Y是看成定类数据的,如果为二元(即选项只有2个),那么就是二元logistic回归; 如果Y是多个类别且类别之间无法进行对比程度或者大小,则为多分类logistic回归;如果Y是多个类别且类别之间可以对比程度大小(也称为定量数据

4、,或者有序定类数据),此时则使用有序logistic回归。多分类logistic回归的难点在于:因变量为类别数据,研究X对Y的影响时,如果为类别数据,那么不能说越如何越如何,比如不能说越满意越愿意购买;而只能说相对小米手机来说,对于手机外观越满意越愿意购买苹果手机。这就是类别数据的特点,一定是相对某某而言。这就导致了多分类logistic回归分析时,文字分析的难度加大,最好是使用SPSSAU的智能文字分析对应查看。单独进行多分类logistic回归时,通常需要有以下步骤,分别是数据处理,模型似然比检验,参数估计分析和模型预测效果分析共4个步骤。1)数据处理如果说因变量Y的类别个数很多,比如为1

5、0个,此时建议时对类别进行组合下,尽量少的减少类别数量,便于后续进行分析。此步骤可通过SPSSAU数据处理模块的数据编码功能完成。如果说自变量X是定类数据,那么可对X进行虚拟哑变量处理,使用SPSSAU数据处理模块的生成变量功能。关于虚拟哑变量问题,可参阅SPSSAU的手册。其实定类数据在做影响关系研究时,通常都会做虚拟哑变量处理。而且做完之后,放入模型时一定要少放一项,比如专业分成理工科,文科类,体育艺术类。那么分析时一定要少放一项(少放的项是参考项),因为这涉及到分析时进行文字描述。至于少放那一项,由研究者自行决定即可。处理完成数据,确保数据没有问题后,直接进入SPSSAU的进阶方法找到“

6、多分类logit”进行分析即可。2)模型似然比检验模型似然比检验用于对整个模型的有效性进行分析,一般对应的P值小于0.05即可。同时SPSSAU还提供AIC和BIC这两个指标值,如果模型有多个,而且希望进行模型之间的优劣比较,可使用此两个指标,此两个指标是越小越好。具体可直接查看SPSSAU的智能分析和分析建议即可。3)参数估计分析参数估计分析其实就已经开始进入实质性的分析了。首先可分析R方,即模型的拟合水平情况,SPSSAU提供3个R方值指标,分别是McFaddenR方、Cox & SnellR方和NagelkerkeR方。此3个R方均为伪R方值,其值越大越好,但其无法非常有效的表达模型的拟

7、合程度,意义相对交小,而且多数情况此3个指标值均会特别小,研究人员不用过分关注于此3个指标值。一般报告其中任意一个R方值指标即可。接着分析回归系数,即X对于Y的影响。一定记住,分析时是先基于以*作为参照时,X对于*有正向影响。比如相对于小米手机作为参照项,用户对于手机外观的在乎程度会正向影响到用户选择苹果手机。简而言之即说明,相对小米手机,用户越在乎外观时,更加可能选择苹果手机。4)模型预测效果分析多分类logistic回归建模时,还可以对模型的预测效果进行分析,当然一般情况下我们关注于影响关系,因而对于预测效果等不那么看重。即模型预测质量的关注乎相对较低,多数时候直接忽略它。2 如何使用SP

8、SSAU进行多分类logistic回归操作关于多分类logistic回归的操作上,SPSSAU操作如下:此处的X为3个,分别是性别,学历和年龄,学历和年龄是定量数据直接纳入模型中即可。但是性别是定类数据,所以先做了虚拟哑变量(数据处理-生成变量功能),然后性别分为两项分别是男和女,以男作为参照项,因此把女放入了模型中。至于分析结果如下:多分类Logistic回归模型似然比检验似然比卡方值dfpAIC 值BIC 值-2LLNULL值-2LLF值91.57360.0003625.2563669.4273700.8293609.256此处模型检验的原定假设为:是否放入自变量(性别_女, 学历, 年龄

9、)两种情况时模型质量均一样;这里p值小于0.05,因而说明拒绝原定假设,即说明本次构建模型时,放入的自变量具有有效性,本次模型构建有意义。多分类Logistic回归分析结果汇总华为回归系数标准误z 值p 值OR值OR值95% CI性别_女-0.3090.145-2.1270.0330.7340.552 0.976学历-0.0650.062-1.0530.2920.9370.829 1.058年龄-0.4370.072-6.0760.0000.6460.561 0.744截距0.3900.2271.7220.0851.4770.948 2.303苹果回归系数标准误z 值p 值OR值OR值95%

10、CI性别_女0.4360.1044.1920.0001.5461.261 1.896学历-0.0020.043-0.0540.9570.9980.917 1.085年龄0.0760.0501.5160.1301.0790.978 1.191截距-0.1240.179-0.6940.4880.8830.623 1.254McFadden R 方:0.025模型的R方值仅为0.025,但一般报告下即可,伪R方值一般都比较低。特别需要注意分析:上表格加蓝色底纹的项为P值小于0.05即呈现出显著的项,接下来逐一说明下,性别_女的回归系数值为-0.309,并且呈现出0.05水平的显著性(z=-2.127

11、,p=0.0330.05),这说明相对于男性来讲,女性更加偏好于小米手机。为什么这样阐述呢,首先在多分类logistic回归,SPSSAU将因变量Y的第1项(此处为小米手机)作为参照项。那么性别_女呈现出负向影响,就说明越女性,越偏向于小米手机,因而结论就是,相对于华为手机来讲,女性明显更加偏好于小米手机。相对小米手机来讲,年龄的回归系数值为-0.437,并且呈现出0.01水平的显著性(z=-6.076,p=0.0000.01),负向影响,即说明年龄越大(此处年龄是定量数据所以可以说年龄越大越如何),用户越不偏好华为手机。那就是说年龄越大用户越偏好于小米手机。接着,相对于小米手机来讲,在苹果手

12、机进行对比时,性别_女的回归系数值为0.436,并且呈现出0.01水平的显著性(z=4.192,p=0.000数据编码】功能操作。第3点:OR值的意义OR值=exp(b)值,即回归系数的指数次方,该值在医学研究里面使用较多,实际意义是X增加1个单位时,Y的增加幅度。如果仅仅是研究影响关系,该值意义较小。第4点: wald值或z值z 值=回归系数/标准误,该值为中间过程值无意义,只需要看p 值即可。有的软件会提供wald值(但不提供z 值,该值也无实际意义),wald值= z 值的平方。第5点: McFaddenR方、Cox & SnellR方和NagelkerkeR方相关问题?Logit回归时会提供此3个R方值(分别是McFaddenR方、Cox & SnellR方和NagelkerkeR方),此3个R方均为伪R方值,其值越大越好,但其无法非常有效的表达模型的拟合程度,意义相对交小,而且多数情况此3个指标值均会特别小,研究人员不用过分关注于此3个指标值。一般报告其中任意一个R方值指标即可。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1