LOGISTIC回归模型中交互作用的分析及评价Word下载.docx
《LOGISTIC回归模型中交互作用的分析及评价Word下载.docx》由会员分享,可在线阅读,更多相关《LOGISTIC回归模型中交互作用的分析及评价Word下载.docx(5页珍藏版)》请在冰豆网上搜索。
相加交互作用指标;
女性肺癌StudyontheinteractionunderlogisticregressionmodelingOtuHong,Ignatius%奄一SUTIyU,WANGXiao-rong,FUZhen—ming,ShellyLapAhTSE.DepartmentofCommunityandFamilyMedicine,SchoolofPublicHealth。
ChineseUniversityofHongKong,H.K.S.A.RCorrespondingauthor:
Ignatius死^一SUnyU,Email:
iyu@cuhk.edu.hk【Introduction】whenstudyonepidemiologicalcausationiscarriedout,logisticregressionhasbeencommonlyusedtoestimatetheindependenteffectsofriskfactors.舾wellastoexaminepossibleinteractionsamongindividualriskfactorbyaddingoneormoreproducttermstotheregressionmodel.InlogisticorCox’Sregressionmodel.theregressioncoefficientoftheproducttermestimatestheinteractiononamultiplicativescalewhilestatisticalsignificanceindicatesthedeparturefrommultiplicativity.Rothmanarguesthatwhenbiologicinteractionisexamined,weneedtofocusoninteractionasdeparturefromadditivityratherthandeparturefrommultiplicativity.Hepresentsthreeindicestomeasureinteractiononanadditivescaleordeparturefromadditivity。
usinglogarithmicmodelssuchaSlogisticorCOx’sregressionmodel.Inthispaper.weusedatafromflcase—controlstudyoffemalelungcancerinHongKongtocalculatetheregressioncoefficientsandcovariancematrixoflogisticmodelinSPSS.WethenintroduceanExcelspreadsheetsetupbyTomasAnderssontocalculatetheindicesofinteractiononanadditivescaleandthecorrespondingconfidenceintervals.Theresultscanbeusedasreferencebyepidemiologiststoassessthebiologicinteractionbetweenfactors.TheproposedmethodisconvenientandtheExcelspreadsheetisavailableonlineforfree.【Keywords】Logisticregressionmodel;
Indicesofinteractiononanadditivescale;
FemalelungCaneel”多元统计分析中,交互作用是指某因素的作用随其他因素水平的不同而不同,两因素同时存在时的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。
目前多采用在回归方程中纳入因素乘积项的方法进行分析。
一般认为,线性回归模型为相加模型,乘积项反映因素间是否有相加交互作用,而logistic回归或Cox回归模型为相乘模型,乘积项反映因素间是否有相乘交互作用u1。
若logistic回归模型的乘积项系数不等于零且有统计学意义,表示两因素存在相乘交互作用,但若乘积作者单位:
香港中文大学公共卫生学院社区及家庭医学系通讯作者:
余德新,Email:
iyu@cuhk.edu.hk项无统计学意义,并不表示两因素无相加交互作用,也不表示两因素对某疾病的发生无生物学交互作用oRothman旧J1,Hosmer和Lemeshow¨
1指出logistic或Cox回归模型中乘积项分析的不足,从理论上系统探讨了交互作用分析指标的构造和算法。
向惠云等b1曾介绍反映相加交互作用的三个指标和可信区间的计算方法,因其计算过程复杂未得到推广使用。
本研究拟以logistic回归分析为例,介绍利用SPSS软件的分析结果进一步计算交互作用的评价指标,并引入Andersson等哺1编制的Excel计算表估计可信区间,以期为病因学研究中评价因素间的相加交互作用提供简便快捷的方法,亦为研究人员万方数据PDFWatermarkRemoverDEMO:
Purchasefromwww.PDFWatermarkRtoremovethewatermark分析生物学交互作用提供依据。
基本原理以最简单的两因素两水平为例。
假设两暴露因子分别为A、B,1表示因素存在,0表示因素不存在,因变量为疾病的发生与否,其他混杂因素暂不考虑。
logistic回归模型得到的OR值作为相对危险度(RR)的估计值。
OR。
。
表示A、B都不存在时发病的OR值,分析时以此为基准,因此OR00=1;
ORlo表示仅A存在、B不存在时发病的OR值;
表示A不存在、仅B存在时发病的OR值;
,表示A、B共同存在时发病的OR值。
Rothman和Hosmer用于评价相加交互作用的三个指标,即①相对超危险度比(therelativeexcP2Sriskduetointeraction,RERI)=RRll—RRlo—RR01+1;
②归因比(theattributableproportionduetointeraction,AP)=RERI/RRll;
③交互作用指数(thesynergyindex,S)=(RRll一1)/〔(RRol一1)+(RR。
一1)〕。
如果两因素无相加交互作用,则RERI和AP的可信区间应包含0,S的可信区间应包含1。
Rothman用于评价相乘交互作用的指标是:
RR。
/(RR。
×
RR。
),如果两因素无相乘交互作用,则该指标的可信区间应该包含1。
容易证明,此相乘交互作用指标即logistic回归模型中乘积项的OR值。
这也进一步说明logistic回归模型中乘积项反映的是相乘交互作用。
1.交互作用指标的点估计:
logistic回归模型估计OR,。
、OR。
和OR。
可通过以下两种方法得到,代入交互作用指标的计算公式即可得该指标的点估计值。
(1)用两因素A、B及乘积项A×
B构建模型1。
In(南)。
风+卢tA+屉B+P3A×
BIn(ORlo)=ln(糍)_ln(odds,o)_In(oaas∞)=岛+B一岛=岛净净0四Io=eplIn(OR01)_ln(糍)2In(odds01)一ha(odds∞)=岛+&一岛=岛净净0R01=P如In(ORll)=In(糍)2In(oddslI)一In(odds∞)=岛+风++岛一艮=区+慝+岛净净0Rll=P^+如+吩�9�9935�9�9评价相乘交互作用的指标是:
OR,。
/(OR。
OR01)=ePt+如+邑/(ep�9�9×
P屯)=P屯,说明模型1中乘积项的OR值即反映相乘交互作用。
(2)构造新变量C并以三个哑变量的形式纳入,构建模型2(表1)。
表l根据两分类变量A、B构造新变量C和三个哑变量Dural0Dum01Dural1OR值ORooORloORolORIlIn【丁当iJ2艮+BDumlo+Dumol+融Dumu‘,。
OR∞=1,ORlo=ePt,ORol=P屯,ORll=Pb可见,模型2中的p。
、&分别等同于模型1中的p。
、,而口,等于模型1中的p。
+&+岛。
2.交互作用指标的区间估计:
运用Hosmer和Lemeshow【41介绍的Delta方法估计可信区间,计算所需的因素间方差和协方差项可由SPSS的Multinomial过程选中“AsymptoticCovariance”得到的协方差矩阵代入计算。
本研究引用Andersson等№1编制的Excel计算表,输入模型1的p。
、f12、(融++融)或模型2的p,、&、p,以及因素A、B间的方差和协方差,可以方便快捷地得到RERI、AP和S的估计值及其95%a,进而评价因素间是否具有相加交互作用。
SPSS软件的Muhinomiallogistic过程用于无序多分类反应变量的logistic回归建模,当因变量为两分类时,Multinomial过程与Binarylogistic过程得到的参数估计值结果一致,但前者可以给出因素间的协方差矩阵。
实例分析以香港女性肺癌的病例对照研究资料为例,分析吸烟和癌症家族史在女性肺癌发生过程中有无交互作用(表2)。
为简化计算,暂不考虑其他因素的作用和混杂因素的影响。
构造乘积项fhisca×
smoke,利用SPSS软件的Binarylogistic过程得到模型1的参数估计值(表3)。
或构造新变量fhiscasm,以哑变量形式纳入得到模型2的参数估计值(表4)。
用SPss软件的Multinomial过程,因变量选择万方数据PDFWatermarkRemoverDEMO:
Purchasefromwww.PDFWatermarkRtoremovethewatermark�9�9936�9�9以control作为参照,对自变量fhisca—sm重新编码,定义fhisca和smoke都不存在的水平为最高水平(