统计学分析方法.docx
《统计学分析方法.docx》由会员分享,可在线阅读,更多相关《统计学分析方法.docx(7页珍藏版)》请在冰豆网上搜索。
统计学分析方法
1/9
统计分析方法总结
分享
胡斌00:
06分享,并说:
统计
1.连续性资料
1.1两组独立样本比较
1.
1.1资料符合正态分布,且两组方差齐性,直接采用t检验。
1.
1.2资料不符合正态分布,
(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;
(2)采用非参数检验,如Wilcoxon检验。
1.
1.3资料方差不齐,
(1)采用Satterthwate的t'检验;
(2)采用非参数检验,如Wilcoxon检验。
1.2两组配对样本的比较
1.
2.1两组差值服从正态分布,采用配对t检验。
1.
2/9
2.2两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。
1.3多组完全随机样本比较
1.
3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。
如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.
3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。
如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。
1.4多组随机区组样本比较
1.
4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。
如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.
4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。
如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。
****需要注意的问题:
(1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。
因为统计学上有中心极限定理,假定大样本是服从正态分布的。
(2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。
正确的做法应该是,先作总的各
3/9
组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**
(3)关于常用的设计方法:
多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。
常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。
2.分类资料
2.1四格表资料
2.
1.1例数大于40,且所有理论数大于5,则用普通的Pearson检验。
2.
1.2例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的检验或Fisher's确切概率法检验。
2.
1.3例数小于40,或有理论数小于2,则用Fisher's确切概率法检验。
2.22×C表或R×2表资料的统计分析
2.
2.1列变量&行变量均为无序分类变量,则
(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson检验。
(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher's确切概率法检验。
4/9
2.
2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。
2.
2.3列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.3R×C表资料的统计分析
2.
2.1列变量&行变量均为无序分类变量,则
(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson检验。
(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher's确切概率法检验。
(3)如果要作相关性分析,可采用Pearson相关系数。
2.
2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。
2.
2.3列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
5/9
2.
2.4列变量&行变量均为有序多分类变量,
(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。
如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
(2)如果要做两变量之间的相关性,可采用Spearson相关分析。
2.4配对分类资料的统计分析
2.
4.1四格表配对资料,
(1)b+c>40,则用McNemar配对检验。
(2)b+c<40,则用校正的配对检验。
2.
4.1C×C资料,
(1)配对比较:
用McNemar配对检验。
(2)一致性检验,用Kappa检验。
在SPSS软件相关分析中,pearson(皮尔逊),kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同
两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.
Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。
对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要
6/9
低一些。
Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
Kendall'stau-b等级相关系数:
用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。
对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;
计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据;计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。
计算相关系数:
当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用spearman或kendall相关
Pearson相关复选项积差相关计算连续变量或是等间距测度的变量间的相关分析
Kendall复选项等级相关计算分类变量间的秩相关,适用于合并等级资料
Spearman复选项等级相关计算斯皮尔曼相关,适用于连续等级资料注:
1若非等间距测度的连续变量因为分布不明-可用等级相关/也可用Pearson相关,对于完全等级离散变量必用等级相关
2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用Spearman或Kendall相关。
3若不恰当用了Kendall等级相关分析则可能得出相关系数偏小的结论。
则若不恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。
对一般情况默认数据服从正态分布的,故用Pearson分析方法。
在SPSS里进入Correlate-》Bivariate,在变量下面CorrelationCoefficients复选框组里有3个选项:
7/9
PearsonKendall'stau-bSpearman:
Spearman
spearman(斯伯曼/斯皮尔曼)相关系数
斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。
它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”
斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究
Kendall's相关系数
肯德尔(Kendall)W系数又称和谐系数,是表示多列等级变量相关程度的一种方法。
适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物。
等级评定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1,最大的为N,若并列等级时,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是
1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,
2.5,
2.5,5,5,5,这里
2.5是2,3的平均,5是4,5,6的平均。
肯德尔(Kendall)U系数又称一致性系数,是表示多列等级变量相关程度的一种方法。
该方法同样适用于让K个评委(被试)评定N件事物,或1个评委
8/9
(被试)先后K次评定N件事物所得的数据资料,只不过评定时采用对偶评定的方法,即每一次评定都要将N个事物两两比较,评定结果如下表所示,表格中空白位(阴影部分可以不管)填入的数据为:
若i比j好记1,若i比j差记0,两者相同则记
0.5。
一共将得到K张这样的表格,将这K张表格重叠起来,对应位置的数据累加起来作为最后进行计算的数据,这些数据记为γij。
正态分布的相关检验
对来自正态总体的两个样本进行均值比较常使用T检验的方法。
T检验要求两个被比较的样本来自正态总体。
两个样本方差相等与不等时用的计算T值的公式不同。
进行方差齐次性检验使用F检验。
对应的零假设是:
两组样本方差相等。
P值小于
0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。
U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。
在这种情况下总体方差通常是已知的。
虽然T检验法与U检验法所解决的问题大体相同,但在小样本(样本数n)=30作为大样本)且均方差未知的情况下就不能用U检验法了。
均值检验时不同的数据使用不同的统计量
使用MEANS过程求若干组的描述统计量,目的在于比较。
因此必须分组求均值。
这是与Descriptives过程不同之处。
检验单个变量的均值是否与给定的常数之间存在差异,用One-SampleTTest单样本T检验过程。
9/9
检验两个不相关的样本是否来自来具有相同均值的总体,用
Independent-SamplesTtest独立样本t检验过程。
如果分组样本不独立,用PairedSampleTtest配对t检验。
如果分组不止两个,应使用One-WayANOVO一元方差分析(用于检验几个独立的组,是否来自均值相等的总体)过程进行单变量方差分析。
如果试图比较的变量明显不服从正态分布,则应该考虑使用一种非参数检验过程Nonparametrictest.
如果用户相比较的变量是分类变量,应该使用Crosstabs功能。
当样本值不能为负值时用右侧单边检验。