ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:52.72KB ,
资源ID:10573614      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10573614.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(多因素分析.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

多因素分析.docx

1、多因素分析多因素分析研究多个因素间关系及具有这些因素的个体之间的一系列统计分析方法称为多元(因素)分析。主要包括:多元线性回归(multiple linear regression)判别分析(disoriminant analysis)聚类分析(cluster analysis)主成分分析(principal component analysis)因子分析(factor analysis)典型相关(canonical correlation)logistic 回归(logistic regression)Cox 回归(COX regression)1、多元回归分析(multiple linea

2、r regression)回归分析是定量研究因变量对自变量的依赖程度、分析变量之间的关联性并进行预测、预报的基本方法。研究一个因变量对几个自变量的线性依存关系时,其模型称为多元线性回归。函数方程建立有四种方法:全模型法、向前选择法、向后选择法、逐步选择法。全模型法其数学模型为:式中 y 为因变量, 为p个自变量,为常数项,为待定参数,称为偏回归系数(partial regression coefficient)。表示在其它自变量固定不变的情况下,自变量Xi 每改变一个单位时,单独引起因变量Y的平均改变量。 为随机误差,又称残差(residual), 它是在Y的变化中不能为自变量所解释的部分 例

3、如:1、现有20名糖尿病病人的血糖()、胰岛素()及生长素()的数据,讨论血糖浓度与胰岛素、生长素的依存关系,建立其多元回归方程。 逐步回归分析(stepwise regression analysis)在预先选定的几个自变量与一个因变量关系拟合的回归中,每个自变量对因变量变化所起的作用进行显著性检验的结果,可能有些有统计学意义,有些没有统计学意义。有些研究者对所要研究的指标仅具有初步知识,并不知道哪些指标会有显著性作用,只想从众多的变量中,挑选出对因变量有显著性意义的因素。一个较理想的回归方程,应包括所有对因变量作用有统计学意义的自变量,而不包括作用无统计学意义的自变量。建立这样一个回归方程

4、较理想的方法之一是逐步回归分析(stepwise regression analysis)基本原理:按这个自变量在方程中对因变量作用的大小,由大到小依次引入方程。每引入一个自变量都要对回归方程中每一个已引入的(包括刚被引入的)自变量的作用作统计意义检验,若发现一个或几个已被引入的自变量的作用无统计学意义时,即行剔除。每剔除一个自变量后,也要对留在回归方程中的自变量逐个作统计学意义检验。如果发现方程中还存在作用无统计学意义的自变量时,也予以剔除,直至没有自变量可引入,也没有自变量可从方程中剔除为止。最优方程应是:对y有显著性作用的自变量全部到回归方程中。凡是对y没有显著性作用的自变量都不被引入方

5、程。例如:1、讨论中学生的肺活量的影响因素,观察了10名女中学生的体重(X1, kg)、胸围(X2, cm)、胸围之呼吸差(X3, cm)及肺活量(Y, ml)。2、某研究协作组调查煤矿工人II期高血压患者40例,同时调查了工作面的污染程度(X1 )、井下工作时间(X2)、每人的体重(X3)、吸烟年限(X4)、饮酒年限(X5)和收缩压(y),欲分析影响煤矿工人II期高血压患者收缩压高低的主要因素。3、为探讨影响差等生学习成绩的因素,某儿科医生调查了某学校六年级各班倒数第五名以内学生的平均成绩(y),并测定了智商(X1 )、血清铁(X2)、血清酮(X3)、日均热卡(X4)、日均食入蛋白量(X5)

6、、头围(X6 )和月人均收入(X7) 2、判别分析(discriminant analysis)根据已掌握的一批分类明确的样品,制定出一个分类标准用以判断以后新样品的归类。在医学研究中经常遇到根据某病人的各种症状、体征、化验结果等来判定病人患的什么疾病,如:根据骨科的X光片的各种特征判断病人属于何种骨瘤?体育选材中根据运动员的体形、运动成绩、生理指标、心理素质指标、遗传因素判断是否选入运动队继续培养等。判别分析在医学领域的主要用途是:1、疾病诊断: 用判别分析的方法诊断疾病又称为计量诊断。包括临床诊断、X线诊断、心电图诊断、超声波诊断、脑电图诊断等。2、疾病预报: 流行病预报、某些疾病(心肌梗

7、死、中风)的早期预报。3、预后估计: 某些疗法的疗效估计,某些恶性肿瘤患者的生存期估计等。4、疾病的病因学估计: 研究引起疾病的原因,并分析其主要影响因素。判别分析:要求Y变量二分类或多分类的属性变量。分别用Fisher和Bayes准则进行计算。同时根据样本中个体的症状、体征选用多元逐步判别分析的方法,来判断病人患的什么疾病。其判别函数为:Z b1x1 + b2x2 + b3x3 .+ bkxk 对判别函数在实际应用中的判别能力要进行检验。 判别临界值: 且: 所以:若 YY0 判为A类;若 YY0 判为B类。 可以计算各指标的贡献率,进行回代检验其符合率。例如: 1、有健康人10名,心肌梗死

8、病人6名,分别进行心电图检查得到三个指标X1、X2、X3 。建立这两类人的判别式,以次判别新的就诊患者是否为心肌梗死病人。 2、对正常人和白血病人进行血清学方面的研究,用高分辨核磁共振谱仪分析峰形,以峰的高度(X1)和峰腰(X2)的宽度作为观察指标,采集了13名白血病人和11名献血员作为健康人的血清的峰形。 3、现有已知分类的健康人11人,硬化症患者7人,冠心病患者5人,这23人的心电图的5个指标测量数据,建立判别方程。3、logistic 回归分析多元线性回归要求y是呈正态分布的连续型随机变量。医学中常见这样的试验:动物服药后是生(假设其值为1)还是死(假设其值为0),或是发病(1)还是未发

9、病(0)等。当因变量取值为(0,1),自变量可能是分类变量,也可能是连续变量时,用线性回归分析的方法进行处理是不合适的,应选用Logistic 回归。Logistic 回归属于概率型回归,用来分析某类事件发生的概率与自变量之间的关系。适用于因变量为二值变量(或多分类)的情形。基本概念:因变量的预测值在01之间。如根据冠心病病人的饮食特点、吸烟史、生活的方式、得病的类型等数据资料,建立一个logistic 回归方程来预测病人的冠心病的可能性。数学模型:y = 式中:是在条件下,某事件发生的概率, 是该事件不发生的概率。其中, m 是自变量的个数。a是截距,bi 是待估计的参数。 Logistic

10、 回归方程的曲线为S型,预测值最大值趋近1,最小值趋近0。 logistic 回归方程的另一种表达形式: 通过变换可以得出P与多元变量Xi 间的数学表达式: 例如:1、某医生研究哪些指标可以判断糖尿病患者是否动脉硬化,将临床症状颈总动脉中层厚度imt 0.8mm或有斑块定义为动脉硬化,记为因变量type =1,非硬化imt 0.8mm且无斑块,记为因变量type =0。选择自变量为年龄(age)、尿白蛋白(ALB)、体重指数(BMI)、胰岛素敏感指数(ISI)、收缩压(SBP)、甘油三脂(TG)、胆固醇(CHO)、糖尿病病程(DURA)。 2、某医院为研究医院内尿路感染的主要危险因素,回顾调查

11、了某年三个月份在住院期间实施保留导尿的200名患者,分别记录了危险因素 变量名 定义性别 X1 女=0,男=1年龄(岁) X2 30=0, 30 =1, 50=2, 70=3插管前住院时间(天) X3 3=0, 3 =1, 10=2, 20=3导尿方式 X4 闭式=0,开放式=1导尿期间无抗生素持续冲洗 X5 否=0,是=1留置导尿时间 X6 3=0, 3 =1, 10=2, 20=3感染前有无输血史 X7 无=0,有=1感染前有无应用免疫抑制剂 X8 无=0,用=1插 插管前血浆肌酐水平 X9 80=0, 80 =1, 170=2有无糖尿病 X10 否=0,是=1尿路感染 Y 未感染=1,感

12、染=0 分析可能在医院内尿路感染的危险因素。4、比例风险模型COX回归 常用统计描述和统计推断的方法有:分位数、中数生存期、平均数、生存函数古迹、判断生存时间分布、非参数检验、寿命表法、log-rank检验(对数秩检验)等。这些方法已经系统地应用在医学的医疗评价和预后的因素分析中。医学临床生存资料有别于其他资料,特别是医学临床随访资料很难用一般统计方法来处理多种因素对生存时间序列的影响。资料的特点是:1、危险度的变化规律种类多且难以确定。2、资料中存在失访(截尾)数据。3、同是考虑多个变量(连续的或离散的)影响难以控制。非参数可以解决前两个问题,参数法可以解决后两个问题。所以实际应用中有很大的

13、局限性。Logistic模型中对任一个观察对象的失效处理都是相同的,无论失效发生在随访期的开始或结束,所以当分析变量与失效的关系时且需要考虑失效时间的作用时,logistic 回归模型就不完全适用了。而任一变量对失效的作用完全独立于随访期的长短,直接影响结论的可靠性和稳定性。1972年英国生物统计学家D.R.Cox提出半参数的比例风险模型Cox回归模型(Cox regression model),1975年由油料新的补充。Cox 模型是将生存时间和因素间的关系用回归方式来表示,主要解决多因素(如年龄、职业、吸烟、饮酒、病情、治疗方法等)对生存期(恢复期)的影响。对于每一个研究的病人除去要考察的

14、因素外,必须有生存时间变量(t)和结局变量(d)。风险函数为: 为风险函数,又称风险率或瞬间死亡率。为基准风险函数,是与时间有关的任意函数。例如:1、某省肿瘤医院调查1991-1994年间经手术治疗的66例大肠癌患者的资料,对可能影响大肠癌术后的临床病理因素进行分析,以探讨这些因素病理因素对大肠癌术后的综合影响。危险因素 变量名 定义性别 Z1 女=0,男=1年龄(岁) Z2 40=1, 4059 =2, 60=3组织学分类 Z3 乳头状腺癌=0, 管状腺癌=1肿瘤大小(cm) Z4 6=0,其它=1Dures 分期 Z5 A=1,B=2, C=3, D=4细胞增殖抗原(PCNA) Z6 55

15、% =0, 55%=1淋巴管侵润 Z7 无=0,有=1血管侵润 Z8 无=0,用=1手术到观察结束 Y 实际天数结束时是否死亡 D 生存=0,死亡=12、研究天花粉注射治疗绒癌疗效的试验,将16只体表接种成功的裸鼠分为4组,其中一组作为对照,其余三组分别注射天花粉、甲药和乙药,得到如下数据:试作Cox分析。危险因素 变量名 定义带瘤天数 X1 天数瘤体大小 X2 天花粉治疗 X3 无=0,有=1甲药治疗 X4 无=0,有=1 乙药治疗 X5 无=0,有=1维生素 X6 不用=0,用=1生存天数 day 实际天数结局 D 生存=0,死亡=1附例题:文件名 “sars建立永久数据集libname

16、ld:;data a;set l.sars3;run;读出数据集,选择确诊和发烧病人data a;set a1;if group= 2 the delete;run;逐步判别分析:proc stepdisc method=stepwise sle=0.05 sls=0.05;class group;var cpnb entb h1n12 h5n1b infab infbb infb2bmpnb piv1b piv3b rsvnab rsvnbb sars1b sars1mtb sars2b sars3b;quit;将逐步判别筛选出的变量作回代:proc discrim ;class group

17、;var h5n1b entb infb2b sars2b sars3b mpnb sars1b;*var infb2b cpnb h5n1b piv3b rsvnbb sars3b; quit;计算疑似与发烧病人的逐步logistic 回归:data b;set l.sars3;if group=1 the delete;run;data b1;set b;if group=2 then groupn=1;if group=3 then groupn=0;proc logistic descending;model groupn= cpnb entb h1n12 h5n1b infab in

18、fbb infb2bmpnb piv1b piv3b rsvnab rsvnbb sars1b sars1mtb sars2b sars3b/ selection=stepwise clodds=pl sle=0.15 sls=0.15;/*model groupn= cpnb entb h1n12 h5n1b infab infbb infb2bmpnb piv1b piv3b rsvnab rsvnbb sars1b sars1mtb sars2b sars3b;*model groupn= cpnb entb h1n12 h5n1b infab infbb infb2bmpnb piv1

19、b piv3b rsvnab rsvnbb / selection=stepwise clodds=pl sle=0.15 sls=0.15;*/quit;计算确诊和发烧病人的logistics回归分析:data c;set l.sars3;if group=3 then delete;run;data b1;set c;if group=1 then groupn=1;if group=2 then groupn=0;proc logistic descending;model groupn= cpnb entb h1n12 h5n1b infab infbb infb2bmpnb piv1

20、b piv3b rsvnab rsvnbb sars1b sars1mtb sars2b sars3b/ selection=stepwise clodds=pl sle=0.15 sls=0.15;*model groupn= cpnb entb h1n12 h5n1b infab infbb infb2bmpnb piv1b piv3b rsvnab rsvnbb sars1b sars1mtb sars2b sars3b;*model groupn= cpnb entb h1n12 h5n1b infab infbb infb2bmpnb piv1b piv3b rsvnab rsvnb

21、b / selection=stepwise clodds=pl sle=0.15 sls=0.15;quit;*/1BACKGROUND274.5140.514SAMPLE1疑似2961.0783241961.39501825SAMPLE2疑似2961.0783242091.48754436SAMPLE3疑似2060.7504551951.387947SAMPLE4疑似2300.837887223.51.59074758SAMPLE5疑似240.50.876138245.51.74733169SAMPLE6疑似2510.914391781.266904710SAMPLE7疑似224.50.8

22、17851369.52.629893811SAMPLE8确诊3901.4207652511.786477912SAMPLE9确诊219.50.7996363642.5907471013SAMPLE10确诊2280.8306012932.085409Logistics (B类与C 类病人拟和)Classification TablePredictedTYPE%Observed01Step 1TYPE0454052.912210682.8Overall Percentage70.9Step 2TYPE0493657.612310582.0Overall Percentage72.3Step 3TY

23、PE0523361.212210682.8Overall Percentage74.2Step 4TYPE0582768.211910985.2Overall Percentage78.4a The cut value is .500Variables in the EquationBS.E.WalddfSig.Exp(B)Step 1INFB2B-3.673.58239.8351.000.025Constant4.451.66544.8591.00085.732Step 2INFBB-.775.2589.0561.003.461INFB2B-3.733.60138.5551.000.024C

24、onstant5.804.84047.7841.000331.537Step 3INFBB-1.153.30813.9981.000.316INFB2B-4.084.63840.9961.000.017PIV1B2.589.69313.9381.00013.315Constant3.2391.0419.6861.00225.504Step 4INFBB-1.236.32114.8691.000.290INFB2B-4.524.69842.0311.000.011PIV1B2.961.73316.3301.00019.315RSVNAB2.355.71610.8121.00110.541Cons

25、tant.9741.245.6121.4342.648a Variable(s) entered on step 1: INFB2B.b Variable(s) entered on step 2: INFBB.c Variable(s) entered on step 3: PIV1B.d Variable(s) entered on step 4: RSVNAB.Logistics (疑似与发烧病人拟和)包括SARS病毒Classification TablePredictedTYPEPercentage CorrectObserved01Step 1TYPE0301173.2178892

26、.6Overall Percentage86.8Step 2TYPE036587.8139296.8Overall Percentage94.1Step 3TYPE038392.7129397.9Overall Percentage96.3Step 4TYPE037490.2149195.8Overall Percentage94.1Step 5TYPE038392.7139296.8Overall Percentage95.6Step 6TYPE040197.6119498.9Overall Percentage98.5a The cut value is .500Variables in

27、the EquationBS.E.WalddfSig.Exp(B)Step 1INFB2B-8.8101.52933.1791.000.000Constant10.4491.74635.8121.00034524.092Step 2H5N1B8.7922.24115.3871.0006582.400INFB2B-12.3192.36027.2541.000.000Constant6.1682.1048.5961.003477.220Step 3H5N1B8.1212.41511.3071.0013364.195INFB2B-13.1392.86321.0651.000.000PIV3B5.5582.0557.3121.007259.262Constant1.7742.559.4801.4885.893Step 4H5N1B9.6572.92310.9141.00115629.817INFAB-5.8542.6854.7531.029.003INFB2B-12.0862.82518.3021.000.000 PIV3B6.0632.2857.0441.008429.842 Constant5.1423.4222.2591.133171.122Step 5H5N1B9.7953.2129.29

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1