SAS统计分析教程方法总结Word格式文档下载.docx
《SAS统计分析教程方法总结Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《SAS统计分析教程方法总结Word格式文档下载.docx(34页珍藏版)》请在冰豆网上搜索。
配对,无法消除个体差异对观测结果的影响,因此,其试验效率低于配对设计。
T检验分析前提条件:
独立性、正态性和方差齐性。
1.4.成组设计一元定量资料Wilcoxon秩和检验
不符合参数检验的前提条件,故选用非参数检验法,即秩和检验。
1.5.单因素k(k>
=3)水平设计定量资料一元方差分析
方差分析是用来研究一个控制变量的不同水平是否对观测变量产生了显着影响。
这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。
方差分析的假定条件为:
各处理条件下的样本是随机的。
2)
各处理条件下的样本是相互独立的,否则可能出现无法解析的输出结果。
各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。
16单因素k(k>
=3)水平设计定量资料一元协方差分析
协方差分析(AnalysisofCovariance)是将回归分析与方差分析结合起来使用的一种分析方法。
在这种分析中,先将定量的影响因素(即难以控
制的因素)看作自变量,或称为协变量(Covariate),建立因变量随自变量变化的回归方程,这样就可以利用回归方程把因变量的变化中受不易控制的定量因素的影响扣除掉,从而,能够较合理地比较定性的影响因素处在不同水平下,经过回归分析手段修正以后的因变量的样本均数之间的差别是否有统计学意义,这就是协方差分析解决问题的基本计算原理。
在试验中,试验因素有时会受到某个重要的定量的非试验因素的影响,
为了消除这种定量非试验因素对定量观测结果的影响和干扰。
前提条件:
一、要求各组定量资料(主要指观测结果)来自方差相等的正态总体;
二、各组的总体回归斜率要相等且不等于零。
1.7.单因素k(k>
=3)水平设计一元定量资料Kruskal-Wallis秩和检验
定量资料不满足参数检验的前提条件时,则可选择秩和检验
2.单因素设计一元生存资料差异性分析
生存分析(SurvivalAnalysis)是将重点事件的出现与否和达到终点所经历的时间结合起来的一种统计分析方法,其主要特点就是考虑了每个观察对象达到终点所经理的时间长短。
终点事件不限于死亡,可以是疾病的发生、一种处理(治疗)的反映、疾病的复发等。
生存分析可用于生存曲线估计、生存曲线比较、影响因素分析和生存预测。
生存分析有一套完整的方法:
统计描述(包括求生存时间的分位数、中位生存期、平均数、生存函数的估计、判断生存时间分布的图示法)、非参数检验(检验分组变量各水平所对应的生存曲线是否一致)、COX模型(半参数)回归分析、参数模型回归分析。
研究者比较k条生存曲线之间是否有显着差别时,SAS软件提供了3种
常用的方法:
对数秩检验(log-rankTest)、威尔考克森(WilcoxonTest)
和似然比检验(LikelihoodRatioTest)
当生存时间的分布为Weibull分布或属于比例风险比模型时,Log-Rank
检验效率较高;
当生存时间的分布为对数正态分布时,Wilcoxon检验效率
较高;
因似然比检验是建立在指数分布模型上的,故当资料偏离此模型时,其结果不如前两种检验方法稳健。
非参数法估计生存率有乘积极限法(Product-LimitMethod,PL)和
寿险法(LifeTableMethod),其中乘积极限法又称为Kaplan-Meier法(简
称KM法)。
前者适用于小样本或大样本未分组资料,后者适用于观察倒数较多的分组资料。
3.多因素设计一元定量资料差异性分析
3.1.随机区组设计一元定量资料方差分析与Friedman秩和检验
随机区组设计(Randomizedblockdesign),亦称完全随机区组设计
randomcompleteblockdsign)。
这种设计的特点是根据“局部控制”
的原则,将试验地按肥力程度划分为等于重复次数的区组,一区组安排一重复,区组内各处理都独立的随机排列。
参数检验前提条件:
独立性、正态性和方差齐性
若不满足参数检验的前提条件,采用秩和检验。
3.2.双因素无重复实验设计一元定量资料方差分析
有两个试验因素,全部试验条件由两因素各水平全面组合而成,在每个条件下获得定量资料的均值数据。
3.3.平衡不完全随机区组设计一元定量资料方差分析
所谓平衡不完全随机区组试验(BalancedIncompleteBlockDesign
简称BIB试验)就是试验方案因受地块限制,不能把试验处理全部安置在试验区组内的情况下,所进行的试验设计。
其缺点是:
区组数必须严格按规定数目设立,缺一不可,否则各处理之间的比较将失去均衡性。
BIB试验设计需满足如下条件:
N=b*k=Y*v
YCk-1)
X=
V-1
其中N为试验小区总数;
入为任两处处理在同一区组中出现的次数;
Y是每个处理的重复数;
b是不完全随机区组数;
k是每区组内的小区数。
34拉丁方设计一元定量资料方差分析
拉丁方设计(Latinsquaredesign)使研究人员得以在统计上控制两个不相互作用的外部变量并且操纵自变量。
每个外部变量或分区变量被划分为一个相等数目的区组或级别,自变量也同样被分为相同数目的级别。
拉丁方以表格的形式被概念化,其中行和列代表两个外部变量中的区组,然后将自变量的级别分配到表中各单元中。
简单的说就是某一变量在其所处的任意行或任意列中,只出现一次。
假设我现在要做一个实验,被试一共要进行5个小测试,并且需要重
测多次,因此对这5个测试的排序就需要列入变量控制之内,不可能多次都一样的顺序,因此为了平衡这种顺序效应,采取拉丁方设计,先命名个小测试分别为1,2,3,4,5。
那么对其的排序就是这样的:
第一组测试顺序:
1,2,5,3,4
第二组测试顺序:
2,3,1,4,5
要排序的量的个数)竖排:
1,2,3,4,5再轮回。
3.5.二阶段交叉设计一元定量资料方差分析
在医学研究中,要将A、B两种处理先后施加于同一批试验对象,随机地使半数受试者先接受A后接受B,而另一半受试者正好相反,即先接受B
再接受A。
由于两种处理在全部试验过程中交叉进行,这种设计称为交叉设计(cross-overdesign)。
在交叉设计中,A、B两种处理先后以同等的机会出现在两个试验阶段中,故又称为两阶段交叉设计。
试验效应受到3个因素的影响,一个是处理因素,一个是处理顺利因素,还有一个是试验阶段因素,而且必须保证这3个因素之间没有交互作用。
虽然交叉试验的处理是单因素,但影响试验结果的因素还有非人为控制的受试者的个体差异和试验阶段这两个因素。
因此,该设计不仅平衡了处理顺序的影响,而且能把处理方法间的差别、时间先后之间的差别和受试者之间的差别分别进行分析。
3.6.析因设计一元定量资料方差分析
析因设计是一种多因素的交叉分组设计。
它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用。
两个或多个因素如存在交互作用,表示各因素不是各自独立的,而是一个因素的水平有改变时,另
一个或几个因素的效应也相应有所改变;
反之,如不存在交互作用,表示各因素具有独立性,一个因素的水平有所改变时不影响其他因素的效应。
3.7.含区组因素的析因设计一元定量资料方差分析
3.8.嵌套设计一元定量资料方差分析
试验中涉及两个或多个试验因素,且依据专业知识可以认为各试验因素对观测指标的影响有主次之分,主要因素各水平下嵌套着次要因素,次要因素各水平下又嵌套着更次要的因素,这样的试验设计称为嵌套设计。
此类设计有两种情形:
第一种情形是,受试对象本身具有分组再分组的各种分组因素,处理(即最终的试验条件)是各因素各水平的全面组合,且因素之间在专业上有主次之分(如年龄与性别对心室射血时间的影响,性别的影响大于年龄);
第二种情形是,受试对象本身并非具有分组再分组的各种分组因素,处理(即最终的试验条件)不是各因素各水平的全面组合,而是各因素按其隶属关系系统分组,且因素之间在专业上有主次之分(如研究不同
代次不同家庭成年男性的身高资料,不同家庭之间的差别大于同一个家庭内部不同代次之间的差别)。
3.9.裂区设计一元定量资料方差分析
试验因素分两阶段进入试验过程,通常由先进入试验的试验因素(设
为A)构成单因素多水平设计或由先进入试验的试验因素(设为A)与区组
因素(设为B)构造出含m次独立重复试验的随机区组设计;
再把接受因素
A各水平处理或接受因素A与因素B各组合水平处理的m个受试对象随机地
分配给在第二阶段进入试验的试验因素C的m个水平,这样安排试验因素
的方法称为裂区设计或分割设计。
结合实际问题,当试验研究过程自然形成2个或多阶段(有时称为工
序),各阶段涉及的试验因素彼此不同,但需要等整个试验过程结束后,才能观测定量指标的结果,就需要用到此设计。
3.10.正交设计一元定量资料方差分析
正交试验设计(Orthogonalexperimentaldesign)是研究多因素多水平的又一种设计方法,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备了“均匀分散,齐整可比”的特点,正交试验设计是分析因式设计的主要方法。
是一种高效率、快速、经济的实验设计方法。
正交表是一整套规则的设计表格,每个因素的每个水平与另一个因素各水平各碰一次,这就是正交性。
进行c因素t水平n次试验的正交表为
「仕。
),其中,L为正交表的代号,n为试验的次数,t为水平数,c为列数,也就是可能安排最多的因素个数。
3.11.重复测量设计一兀定量资料方差分析
重复测量设计指将一组或多组被试者先后重复地施加不同的实验处理或在不同场合和时间点被测量至少两次的情况。
重复测量设计大体有两类.一类是对每个人在同一时间不同因子组合间测量;
另外一类是对每个人在不同时间点上重复.前者常见于裂区设计,而后者常见于经典试验设计即包括前测,处理,一次或几次后测的情况.后
者比前者要多见。
3.12.常见多因素实验设计一元定量资料协方差分析
试验中存在极为重要的非试验因素,需进行协方差分析,判断其对主要因素的影响。
3.13.多个单因素两水平设计定量资料Meta分析
Meta分析是指用统计学方法对收集的多个研究资料进行分析和概括以提供量化的平均效果来回答研究的问题.其优点是通过增大样本含量来增加结论的可信度,解决研究结果的不一致性。
meta分析是对同一课题的多项独立研究的结果进行系统的、定量的综合性分析。
它是文献的量化综述,是以同一课题的多项独立研究的结果为研究对象,在严格设计的基础上,运用适当的统计学方法对多个研究结果进行系统、客观、定量的综合分析。
基本分析步骤:
a.异质性检验(齐性检验)。