第四讲两组计量资料平均水平的统计检验.docx-资源下载

第四讲两组计量资料平均水平的统计检验.docx

1、第四讲两组计量资料平均水平的统计检验Stata软件基本操作和数据分析入门第四讲两组计量资料平均水平的统计检验一、配对设计的平均水平检验统计方法选择原则：如果配对的差值服从近似正态分布(小样本)或大样本，则用配对t检验小样本的情况下，配对差值呈明显偏态分布，则用配对秩符号检验(matched-pairs signed-ranks test)。例1 10例男性矽肺患者经克矽平治疗，其血红蛋白（g/dL）如下：表 10例男性矽肺患者血红蛋白值（g/dL）病例号12345678910治疗前11.315.015.013.512.810.011.012.013.012.3治疗后14.013.814.0

2、13.513.512.014.711.413.812.0问：治疗前后的血红蛋白的平均水平有没有改变这是一个典型的前后配对设计的研究(但不提倡，因为对结果的解释可能会有问题)Stata数据输入结构X1X211.3141513.8151413.513.512.813.510121114.71211.41313.812.312操作如下：gen d=x1-x2 产生配对差值的变量dsktest d 正态性检验正态性检验结果如下：. sktest d Skewness/Kurtosis tests for Normality - joint - Variable | Pr(Skewness) Pr(Ku

3、rtosis) adj chi2(2) Probchi2-+- d | 0.279 0.774 1.43 0.4885正态性检验的无效假设为：资料正态分布相应的备选假设为：资料非正态分布=0.05，由于正态性检验的P值=0.4885，故可以认为资料近似服从正态分布。ttest d=0 配对t检验: H0:d=0 vs H1:d0，=0.05结果如下：One-sample t test-Variable | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- d | 10 -.6799999 .5204272 1.645735 -1.857288

4、 .4972881-Degrees of freedom: 9 Ho: mean(d) = 0 Ha: mean 0 t = -1.3066 t = -1.3066 t = -1.3066 P |t| = 0.2237 P t = 0.8881P值=0.2237，故认为治疗前后的血红蛋白的平均数差异没有统计学意义。即：没有足够的证据可以认为治疗前后的血红蛋白的总体平均数不同。如果已知差值的样本量，样本均数和样本标准差，可以用立即命令如下。设：已知样本量为10，差值的样本均数为-0.66，差值的标准差为1.65，则输入命令如下：ttesti 样本量样本均数样本标准差 0本例为： ttesti

5、 10 -0.66 1.65 0得到下列结果如下：. ttesti 10 .66 1.65 0One-sample t test- | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- x | 10 .66 .5217758 1.65 -.5203389 1.840339-Degrees of freedom: 9 Ho: mean(x) = 0 Ha: mean 0 t = 1.2649 t = 1.2649 t = 1.2649 P |t| = 0.2377 P t = 0.1188结果解释与结论同上述相同。如果对于小样本的情况下，差值不

6、满足正态分布，则用Match-Sign-rank test，操作如下：signrank 差值变量名=0假如本例不满足正态分布(为了借用上例资料，而假定的，实际上本例满足正态分布)则H0：差值的中位数0(其意义是治疗前的血红蛋白配大于治疗后的血红蛋白的概率治疗前的血红蛋白小于治疗后的血红蛋白的概率)H1：差值的中位数0=0.05本例为 signrank d=0Wilcoxon signed-rank test sign | obs sum ranks expected-+- positive | 4 18 27 negative | 5 36 27 zero | 1 1 1-+- all | 1

7、0 55 55unadjusted variance 96.25adjustment for ties 0.00adjustment for zeros -0.25 -adjusted variance 96.00Ho: d = 0 z = -0.919 Prob |z| = 0.3583P值=0.3583，故没有足够的证据说明两个总体不同。二、平行对照设计的两组资料平均水平统计检验统计方法选择原则：如果两组资料的方差齐性和相互独立的，并且每组资料服从正态分布(大样本资料可以忽略正态性问题)，则用成组t检验，否则可以用成组Wilcoxon秩和检验。例2 为研究噪声对纺织女工子代智能是否有影响，

8、一研究人员在某纺织厂随机抽取接触噪声95dB（A）、接触工龄5年以上的纺织女工及同一单位、条件与接触组相近但不接触噪声的女职工，其子女（学前幼儿）作为研究对象，按韦氏学前儿童智力量表（中国修订版）测定两组幼儿智商，结果如下。问噪声对纺织女工子代智能有无影响？(接触组group=0，不接触组group=1)资料及其结果如下：groupx079093091092094077093074091010108307308801020900100081091083010608407808709501011101110011141861106110711071941891104198111018911031

9、8911211941951921109198198112011041110方差齐性检验H0：12 vs H1:12=0.1两组方差齐性的检验命令(仅适合两组方差齐性检验)sdtest x,by(group)Variance ratio test- Group | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- 0 | 25 89.08 1.822928 9.11464 85.31766 92.84234 1 | 25 101.52 1.900982 9.504911 97.59657 105.4434-+-combined | 50 95.

10、3 1.577456 11.1543 92.12998 98.47002- Ho: sd(0) = sd(1) F(24,24) observed = F_obs = 0.920 F(24,24) lower tail = F_L = F_obs = 0.920 F(24,24) upper tail = F_U = 1/F_obs = 1.087 Ha: sd(0) sd(1) P F_obs = 0.4195 P F_U = 0.8389 P F_obs = 0.5805P值=0.8389，因此可以认为两组方差齐性的。正态性检验：H0：资料服从正态分布 vs H1：资料偏态分布=0.05每

11、一组资料正态性检验sktest x if group=0 Skewness/Kurtosis tests for Normality - joint - Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Probchi2-+- x | 0.927 0.326 1.05 0.5926. sktest x if group=1 Skewness/Kurtosis tests for Normality - joint - Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Probchi2-+- x |

12、0.474 0.675 0.73 0.6948P值均大于，因此可以认为两组资料都服从正态分布H0：12 vs H1：12=0.05ttest x,by(group)Two-sample t test with equal variances- Group | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- 0 | 25 89.08 1.822928 9.11464 85.31766 92.84234 1 | 25 101.52 1.900982 9.504911 97.59657 105.4434-+-combined | 50 95.3

13、1.577456 11.1543 92.12998 98.47002-+- diff | -12.44 2.633781 -17.73557 -7.144429-Degrees of freedom: 48 Ho: mean(0) - mean(1) = diff = 0 Ha: diff 0 t = -4.7232 t = -4.7232 t = -4.7232 P |t| = 0.0000 P t = 1.0000P值(0.0001),并且由01的95%可信区间为(-17.73557,-7.144429)可以知道，不接触组幼儿的平均智商高于接触组的幼儿平均智商，并且差别有统计学意义。如果已

14、知两组的样本量、样本均数和样本标准差，也可以用立即命令进行统计检验ttesti 样本量1 样本均数1 样本标准差1 样本量2 样本均数2 样本标准差2例如：本例第1组n1=25 均数1=89.08 标准差1=9.115第2组 n2=25 均数2=101.52 标准差2=9.505则ttesti 25 89.08 9.115 25 101.52 9.505Two-sample t test with equal variances- | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- x | 25 89.08 1.823 9.115 85.3

15、1751 92.84249 y | 25 101.52 1.901 9.505 97.59653 105.4435-+-combined | 50 95.3 1.577482 11.15448 92.12993 98.47007-+- diff | -12.44 2.633843 -17.7357 -7.144303-Degrees of freedom: 48 Ho: mean(x) - mean(y) = diff = 0 Ha: diff 0 t = -4.7231 t = -4.7231 t = -4.7231 P |t| = 0.0000 P t = 1.0000结果解释同上。对方差

16、不齐的情况，(小样本时，资料正态分布)还可以用t检验命令：ttest 观察变量名，by(分组变量名) unequal立即命令为 ttesti 样本量1 均数1 标准差1 样本量2 均数2 标准差2,unequal假定本例的资料方差不齐(实际为方差不齐的)，则要用t检验如下ttest x,by(group) unequalTwo-sample t test with unequal variances- Group | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- 0 | 25 89.08 1.822928 9.11464 85.31766

17、 92.84234 1 | 25 101.52 1.900982 9.504911 97.59657 105.4434-+-combined | 50 95.3 1.577456 11.1543 92.12998 98.47002-+- diff | -12.44 2.633781 -17.73581 -7.144189-Satterthwaites degrees of freedom: 47.9159 Ho: mean(0) - mean(1) = diff = 0 Ha: diff 0 t = -4.7232 t = -4.7232 t = -4.7232 P |t| = 0.0000

18、P t = 1.0000结果解释同上。t检验有许多方法，这里介绍的Satterthwaite方法，主要根据两个样本方差差异的程度校正相应的自由度，由于本例的两个样本方差比较接近，故自由度几乎没有减少(t检验的自由度为48,而本例t自由度为47.9159)。由于t检验要求的两组总体方差相同(称为方差齐性)，以及由于抽样误差的原因，样本方差一般不会相等，但是方差齐性的情况下，样本方差表现为两个样本方差之比1。(注意：两个样本方差之差很小，仍可能方差不齐。如：第一个样本标准差为0.1，样本量为100,第2个样本标准差为0.01，样本量为100，两个样本标准差仅差0.09，但是两个样本方差之比为100

19、。故用方差齐性检验的结果如下：方差齐性的立即命令为 sdtesti 样本量1 . 标准差1 样本量2 . 标准差2sdtesti 100 . 0.1 100 . 0.01Variance ratio test- | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- x | 100 . .01 .1 . . y | 100 . .001 .01 . .-+-combined | 200 . . . . .- Ho: sd(x) = sd(y) F(99,99) observed = F_obs = 100.000 F(99,99) lower

20、tail = F_L = 1/F_obs = 0.010 F(99,99) upper tail = F_U = F_obs = 100.000 Ha: sd(x) sd(y) P F_obs = 1.0000 P F_U = 0.0000 P F_obs = 0.0000P值0.0001，因此认为两组的方差不齐。故方差齐性是考察两个样本方差之比是否接近1。如果本例的资料不满足t检验要求(注：实际是满足的，只是想用本例介绍成组秩和检验)，则用秩和检验(Wilcoxon Ranksum test)。H0:两组资料所在总体相同H1：两组资料所在总体不同0.05命令：ranksum 观察变量名,by(分组变量)本例为 ranksum x,by(group). ranksum x,by(group)Two-sample Wilcoxon rank-sum (Mann-Whitney) test group | obs rank sum expected-+- 0 | 25 437 637.5 1 | 25 838 637.5-+- combined | 50 1275 1275

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

第四讲 两组计量资料平均水平的统计检验.docx