ImageVerifierCode 换一换
格式:PPT , 页数:57 ,大小:532.50KB ,
资源ID:15672030      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/15672030.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(讲座logistic20140331优质PPT.ppt)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

讲座logistic20140331优质PPT.ppt

1、散点图;残差图判断:残差图n独立(独立(independent)independent)任意两个观察值互相独立任意两个观察值互相独立判断:专业知识判断:专业知识n正态性(正态性(normalnormal)假定线性模型的误差项服从正态分布)假定线性模型的误差项服从正态分布判断:残差直方图判断:残差直方图n等方差性(等方差性(equal variance)equal variance):在:在X X的取值范围内,不论的取值范围内,不论X X取什么值,取什么值,Y Y都具有相同都具有相同的方差的方差判断:判断:X X 与与 Y Y,残差的散点图,残差的散点图Logistic Logistic 回归分

2、析回归分析n概率型非概率型非线性回性回归n研究研究二分二分类观察察结果与一些影响因素之果与一些影响因素之间关系的关系的一种多一种多变量分析方法。量分析方法。nlogistic回回归的主要用途:的主要用途:n一是一是寻找危找危险因素因素n二是二是预测,根据建立的,根据建立的logistic回回归模型,模型,预测在不同的自在不同的自变量情量情况下,况下,发生某病或某种情况的概率有多大。生某病或某种情况的概率有多大。n三是判三是判别,实际上跟上跟预测类似,根据似,根据logistic模型,判断某人属于模型,判断某人属于某病或属于某种情况的概率有多大,也就是看一下某病或属于某种情况的概率有多大,也就是

3、看一下这个人有多大个人有多大的可能性是属于某病患者。的可能性是属于某病患者。logisticlogistic回归与多重回归与多重线性回归线性回归nlogistic回归与多重线性回归实际上有很多相同之处,最大的区别就在于他们的因变量不同,n这两种回归可以归于同一个家族,即广义线性模型(generalized linear model)。这一家族中的模型形式基本上都差不多,不同的就是因变量不同,如果是连续的,就是多重线性回归,如果是二项分布,就是logistic回归,如果是poisson分布,就是poisson回归,如果是负二项分布,就是负二项回归nlogistic回归的因变量可以是二分类的,也可

4、以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。Logistic Logistic 回归分析在流行病学研究中的应用回归分析在流行病学研究中的应用n疾病病因和危险因素探讨疾病病因和危险因素探讨-病例对照研究病例对照研究n实验研究中药物或毒物的实验研究中药物或毒物的剂量反应关系剂量反应关系n临床试验评价临床试验评价n疾病预后因素分析疾病预后因素分析n膳食因素与膳食因素与2 2型糖尿病关系的型糖尿病关系的logisticlogistic回归分析回归分析n大学生高血压相关因素的大学生高血压相关因素的LogisticLogistic回归分析回归分

5、析n产后抑郁症影响因素的病例对照研产后抑郁症影响因素的病例对照研究究n产褥期抑郁及其影响因素的产褥期抑郁及其影响因素的LogisticLogistic回归分析回归分析n产褥期抑郁及其影响因素的产褥期抑郁及其影响因素的LogisticLogistic回归分析回归分析n天津市婴幼儿孤独症患病率与危险天津市婴幼儿孤独症患病率与危险因素因素n。孙振球主编.医学统计学人民卫生出版社.Logistic Logistic 回归模型回归模型 影响影响Y Y的取值的的取值的m m个自变量,个自变量,X X1 1,X X2 2XmXm。P P表示表示m m个自变个自变量的作用下阳性结果发生的概率,则量的作用下阳性

6、结果发生的概率,则Logistic Logistic 回归模型表示回归模型表示为为称为P的logit变换。Logistic Logistic 回归模型回归模型-参数的含义参数的含义 影响影响Y Y的取值的的取值的m m个自变量,个自变量,X X1 1,X X2 2XmXm。P P表表示示m m个自变量的作用下阳性结果发生的概率,则个自变量的作用下阳性结果发生的概率,则Logistic Logistic 回归模型表示为回归模型表示为0表示暴露剂量为0时个体发病与不发病概率之比的自然对数。流行病学中的一些基本概念:相相对危危险度度(relative risk):RR=P1/P2比数比数Odds=P

7、/(1-P)比数比比数比OR=P/(1-P)/P/(1-P)在患病率在患病率较小情况下,小情况下,ORRRnLogistic回归中的常数项(回归中的常数项(b0)表示,在不接触任何潜在危险保护表示,在不接触任何潜在危险保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。因素条件下,效应指标发生与不发生事件的概率之比的对数值。nLogistic回归中的回归系数回归中的回归系数(bi)表示,某一因素改变一个单位时,表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数的对数值。值。Logistic回归系数

8、的意义n分析因素分析因素xi为二分类变量时,存在(暴露)为二分类变量时,存在(暴露)xi,不存在(未暴不存在(未暴露)露)xi ,则,则Logistic回归中回归中xi的系数的系数bi就是暴露与非暴露优势比就是暴露与非暴露优势比的对数值即的对数值即OR=exp(bi)=e(bi)医学研究中疾病的复杂性医学研究中疾病的复杂性n一种疾病可能有多种致病因素或与多种危一种疾病可能有多种致病因素或与多种危险因素有关因素有关n疾病疾病转归的影响因素也可能多种多的影响因素也可能多种多样n临床治床治疗结局的局的综合性合性解决解决办法:法:n固定其他因素,研究有影响的一两个因素(配比);固定其他因素,研究有影响

9、的一两个因素(配比);n分分层分析:按分析:按12个因素个因素组成的成的层进行行层内分析和内分析和综合。合。n统计模型模型实例分析实例分析n为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例-对照研究,各因素的说明见表1,资料见数据库data1,试用logistic逐步回归分析方法筛选危险因素。Logistic回归分析的一般步骤n变量的量的编码n哑变量的量的设置和引入置和引入n各个自各个自变量的量的单因素分析因素分析n变量的量的筛选n交互作用的引入交互作用的引入n建立多个模型建立多个模型n选择较优的模型的模型n模型模型应用条件的用条件的评价价n输出出结果的解果的解释1.

10、1.变量的编码变量的编码n变量的量的编码要易于要易于识别n注意注意编码的等的等级关系关系n改改变分分类变量的量的编码,其分析的意,其分析的意义并不改并不改变。n牢牢记编码使用使用变量数量数值标识(value labels)记录编码内容内容变量的编码n变量名 变量标识 变量值 值标识 SEX 性别 1 男 2 女 EDU 教育程度 0 文盲 1 小学 2 初中及以上 2.2.哑变量的设置和引入哑变量的设置和引入n哑变量,又称量,又称指示指示变量量。n有利于有利于检验等等级变量各个等量各个等级间的的变化是否相同。化是否相同。n一个一个k分分类的分的分类变量,可以用量,可以用k-1个个哑变量来表示。

11、量来表示。n哑变量的设置教育程度X1X2X3文盲:0000小学:1100初中:2010高中:3001教育程度教育程度:文盲,小学,初中,高中以上:文盲,小学,初中,高中以上教育程度X1X2X3文盲:0100小学:1010初中:2001高中:3000以高中作为参照以高中作为参照SPSSSPSS提供的方法提供的方法nIndicator:默默认。以第。以第1 或最后或最后1类作作对照,其他每照,其他每类与与对照比照比较;nSample:以第以第1 或最后或最后1类作作对照,其他每照,其他每类与与对照比照比较,但反映平均效,但反映平均效应。nDifference:除第除第1类外各分外各分类与其前各与其

12、前各类平均效平均效应比比较;nHelmert:除最后除最后1类外各分外各分类与其前各与其前各类平均效平均效应比比较;nRepeated:除第除第1类外各分外各分类与其前一与其前一类比比较;nPolynomial:假假设类间距相等,用于数距相等,用于数值型型变量。量。nDeviation:以第以第1 或最后或最后1类作作对照,其余每照,其余每类与与总效效应比比较。3.自变量的单因素分析n了解自了解自变量与因量与因变量的分布量的分布n检验是否符合建立模型的是否符合建立模型的应用条件用条件偏离偏离应用条件用条件时,进行数据行数据变换n各个自各个自变量两量两组间的比的比较计数数资料料计量量资料料n双双

13、变量分析量分析4.变量的筛选n变量量筛选的原的原则专业上考上考虑测量上考量上考虑共共线性性问题:计算相关矩算相关矩阵,相关系数,相关系数0.8-0.9,则选其一。其一。缺失数据少、缺失数据少、测量量误差低的差低的优先先选择经验上考上考虑双双变量分析中有量分析中有显著性的自著性的自变量(量(P.15)选择那些改那些改变主效主效应的自的自变量量变量的筛选n变量量筛选的可用方法的可用方法逐步逐步logistic回回归:自:自动选择有有显著性的自著性的自变量,不量,不仅用于自用于自变量的剔量的剔选,也用于交互作用,也用于交互作用项是否是否显著的判断。著的判断。前前进法:逐个引入模型外的法:逐个引入模型

14、外的变量量后退法:放入所有后退法:放入所有变量,再逐个量,再逐个筛选 理理论上看,前上看,前进法法选择变量的量的经验公式缺乏公式缺乏总体概念,当用于因素分析体概念,当用于因素分析时,建,建议用后用后退法。当退法。当变量量间有完全相关性有完全相关性时,后退法无法使用,可用前,后退法无法使用,可用前进法。法。5.5.交互作用的引入交互作用的引入n交互作用的定交互作用的定义当自当自变量和因量和因变量的关系随第三个量的关系随第三个变量的量的变化而改化而改变时,则存存在交互作用在交互作用n交互作用交互作用项的引入的引入基于基于临床床实际认为对结果有重要影响果有重要影响基于模型基于模型应用条件的分析用条件

15、的分析引入两个自引入两个自变量的乘量的乘积项n交互作用的交互作用的检验n交互作用的解交互作用的解释6.建立多个模型n饱和模型和模型n自定自定义的模型的模型从从饱和模型中和模型中选择自自变量量再建立模型再建立模型饱和模型(saturated model)是指各观测变量之间均容许相关的最复杂模型,自由度为0.饱和模型其实是人为设定的约束条件最少的模型,纯粹按照数据的相互关系来构建最优的模型,所以,它是数学上最优的模型,一种理想的状态。7.选择较优的模型n模型模型拟合合优度度检验AIC(Akaike information criterion):):同一同一资料的多个模型的比料的多个模型的比较,此,此值越小,模型越合适。越小,模型越合适。SC(Schwartz

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1