1、广义线性模型论文广义线性模型的拟似然法论文题目: 用SAS实现因变量为两值变量的多重logistic回归分析班级:学号:姓名:用SAS实现因变量为两值变量的多重logistic回归分析摘要:Logistic回归分析属于概率型回归分析,适用于因变量为定性变量的数据分析和建模,但对自变量的数目和性质没有特殊要求。因变量为二值变量的多重logistic回归分析适用于因变量编码为0或1(代表阳性或者阴性)的多重logistic回归分析。从整体上理解Logistic回归分析,可根据操作过程依次总结为以下几个方面:自变量筛选、建立回归模型、进行假设检验(包括对回归系数的检验、整体模型检验以及模型拟合优度检
2、验)。近年来,logistic回归分析在众多临床医学研究,本文重点介绍如何正确实施多重logistic回归分析及其SAS实现及结果分析。关键词:logistic 两值变量一、数据:年龄复治与否治疗方案有效无效50是多西他赛联合奥沙利铂764多西他赛联合顺铂6820否多西他赛联合奥沙利铂2812多西他赛联合顺铂202050是多西他赛联合奥沙利铂6812多西他赛联合顺铂4832否多西他赛联合奥沙利铂820多西他赛联合顺铂1216二、变量解释:a表示年龄分层,a=0表示年龄50岁,a=1表示年龄50岁;b表示复治与否,b=0表示复治,b=1表示初治;c表示用药方案,c=0表示使用多西他赛联合奥沙利铂
3、,c=1表示使用多西他赛联合顺铂;Y=0表示有效,Y=1表示无效三、程序:Data ls;do a=0 to 1; do b=0 to 1; do c=0 to 1; do y=0 to 1; input f; output; end;end;end;end; cards; 76 4 68 20 28 12 20 20 68 12 48 32 8 20 12 16 ; proc logistic; freq f; model y=a b c/selection=stepwise; run; 四、程序说明:自变量a、b、c均为两值变量,因变量Y也是两值变量,程序中变量赋值均以0和1来代表每个变量
4、的两种状态。变量f表示频数,数据分析使用logistic过程,在model语句中一次列出年龄、复治情况和用药方案。Model语句后面的“selection=stepwise”表示使用逐步回归法法筛选变量。五、结果及结果分析:SAS 系统The LOGISTIC ProcedureModel InformationData SetWORK.LSResponse VariableyNumber of Response Levels2Frequency VariablefModelbinary logitOptimization TechniqueFishers scoringNumber of O
5、bservations Read16Number of Observations Used16Sum of Frequencies Read464Sum of Frequencies Used464Response ProfileOrderedValueyTotalFrequency1032821136Probability modeled is y=0.第一部分:logistic过程产生的第一部分结果主要是模型的信息和关于自变量的说明,因变量为Y,因变量有两个水平,使用的模型是两值的Logic模型,参数估计时的优化方法是Fishers scoring 法。读入观测数和使用观测数都是16。 在
6、logistic过程中,默认状态下是以因变量取值小的那个水平的发生概率为基础建模。在本文中Y=0表示治疗有效,所以是以治疗有效为基础建立概率模型。Stepwise Selection ProcedureStep 0. Intercept entered:Model Convergence StatusConvergence criterion (GCONV=1E-8) satisfied.-2 Log L=561.354Residual Chi-Square TestChi-SquareDFPrChiSq70.45813ChiSqLikelihood Ratio38.00831.0001Sco
7、re39.74781.0001Wald37.50221ChiSq33.55892ChiSqLikelihood Ratio55.00812.0001Score55.04542.0001Wald49.10262ChiSq17.48581ChiSqLikelihood Ratio72.71413.0001Score70.45813.0001Wald59.90273ChiSqEnteredRemoved1b1139.7478.00012c1216.7300.00013a1317.4858ChiSqIntercept12.40970.253990.0504.0001a1-0.93970.228216.
8、9513.0001b1-1.54970.236442.9609.0001c1-0.95110.228517.3229.0001Odds Ratio EstimatesEffectPoint Estimate95% WaldConfidence Limitsa0.3910.2500.611b0.2120.1340.337c0.3860.2470.605Association of Predicted Probabilities andObserved ResponsesPercent Concordant68.9Somers D0.493Percent Discordant19.6Gamma0.
9、557Percent Tied11.4Tau-a0.205Pairs44608c0.747 第三部分:在对拟合多重logistic回归分析方程过程中的变量进行筛选时,一般只保留对因变量。有统计学意义的变量。这部分结果是回归系数以及优势比的估计结果。逐步回归发筛选的结果显示a、b、c都是有统计学意义的变量(P55岁的患者接受治疗后有效的可能性是55岁者的0391倍(95CI为0250o611);复治的患者接受治疗后有效的可能性是初治患者的o212倍(95CI为o134o337);接受多西他赛联合奥沙利铂治疗有效的可能性是多西他赛联合顺铂者的o386倍(95CI为o247o605),即多西他赛联合顺铂的疗效优于多西他赛联合奥沙利铂。六、总 结:本文采用logistic回归分析对患者(分层因素,年龄,是否复发)接受多西他赛联合奥沙利铂治疗和多西他赛联合顺铂治疗的疗效进行了分析,结果显示年龄、复制情况和用药方案都是对疗效有统计学意义的影响因素,根据这三个因素建立的模型预测有效。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1