Stata软件基本操作和数据分析入门Word文档格式.docx
《Stata软件基本操作和数据分析入门Word文档格式.docx》由会员分享,可在线阅读,更多相关《Stata软件基本操作和数据分析入门Word文档格式.docx(21页珍藏版)》请在冰豆网上搜索。
1012
1114.7
1211.4
1313.8
12.312
操作如下:
gend=x1-x2产生配对差值的变量d
sktestd正态性检验
正态性检验结果如下:
.sktestd
Skewness/KurtosistestsforNormality
-------joint------
Variable|Pr(Skewness)Pr(Kurtosis)adjchi2
(2)Prob>
chi2
-------------+-------------------------------------------------------
d|0.2790.7741.430.4885
正态性检验的无效假设为:
资料正态分布
相应的备选假设为:
资料非正态分布
=0.05,由于正态性检验的P值=0.40189>
>
,故可以认为资料近
似服从正态分布。
ttestd=0配对t检验:
H:
=0vsH:
0,0d1d
=0.05
结果如下:
One-samplettest
------------------------------------------------------------------------------Variable|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]---------+--------------------------------------------------------------------
d|10-.6799999.52042721.645735-1.857288.4972881------------------------------------------------------------------------------Degreesoffreedom:
9
Ho:
mean(d)=0
Ha:
mean<
0Ha:
mean~=0Ha:
mean>
0
t=-1.3066t=-1.3066t=-1.3066
P<
t=0.1119P>
|t|=0.2237P>
t=0.8881
P值=0.2237>
,故认为治疗前后的血红蛋白的平均数差异没有统计
学意义。
即:
没有足够的证据可以认为治疗前后的血红蛋白的总体平
均数不同。
如果已知差值的样本量,样本均数和样本标准差,可以用立即命令如
下(如,已知样本量为10,差值的样本均数为-0.66,差值的标准差
为1.65,则输入命令如下:
ttesti样本量样本均数样本标准差0
本例为:
ttesti10-0.661.650
得到下列结果如下:
.ttesti10.661.650
------------------------------------------------------------------------------
|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]---------+--------------------------------------------------------------------
x|10.66.52177581.65-.52033891.840339------------------------------------------------------------------------------Degreesoffreedom:
mean(x)=0
t=1.2649t=1.2649t=1.2649
t=0.8812P>
|t|=0.2377P>
t=0.1188
结果解释与结论同上述相同。
如果对于小样本的情况下,差值不满足正态分布,则用
Match-Sign-ranktest,操作如下:
signrank差值变量名=0
假如本例不满足正态分布(为了借用上例资料,而假定的,实际上本
例满足正态分布)则
H:
差值的中位数,00
(其意义是治疗前的血红蛋白配大于治疗后的血红蛋白的概率,治疗
前的血红蛋白小于治疗后的血红蛋白的概率)
差值的中位数01
本例为signrankd=0
Wilcoxonsigned-ranktest
sign|obssumranksexpected-------------+---------------------------------
positive|41827
negative|53627
zero|111-------------+---------------------------------
all|105555unadjustedvariance96.25
adjustmentforties0.00
adjustmentforzeros-0.25
----------
adjustedvariance96.00
d=0
z=-0.919
Prob>
|z|=0.3583
P值=0.3583>
,故没有足够的证据说明两个总体不同。
二、平行对照设计的两组资料平均水平统计检验
如果两组资料的方差齐性和相互独立的,并且每组资料服从正态
分布(大样本资料可以忽略正态性问题),则用成组t检验,否则可
以用成组Wilcoxon秩和检验。
例2为研究噪声对纺织女工子代智能是否有影响,一研究人员在
某纺织厂随机抽取接触噪声95dB(A)、接触工龄5年以上的纺织
女工及同一单位、条件与接触组相近但不接触噪声的女职工,其
子女(学前幼儿)作为研究对象,按韦氏学前儿童智力量表(中
国修订版)测定两组幼儿智商,结果如下。
问噪声对纺织女工子
代智能有无影响,(接触组group=0,不接触组group=1)
资料及其结果如下:
groupx079093091092094077093074091010108307308801020900100081091083010608407808709501011101110011141861106110711071941891104
198
1110
189
1103
1121
194
195
192
1109
1120
1104
方差齐性检验
H,:
vsH:
012112
=0.1
两组方差齐性的检验命令(仅适合两组方差齐性检验)
sdtestx,by(group)
Varianceratiotest
Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]---------+--------------------------------------------------------------------
0|2589.081.8229289.1146485.3176692.84234
1|25101.521.9009829.50491197.59657105.4434---------+--------------------------------------------------------------------combined|5095.31.57745611.154392.1299898.47002------------------------------------------------------------------------------
sd(0)=sd
(1)
F(24,24)observed=F_obs=0.920
F(24,24)lowertail=F_L=F_obs=0.920
F(24,24)uppertail=F_U=1/F_obs=1.087
sd(0)<
sd
(1)Ha:
sd(0)~=sd
(1)Ha:
sd(0)>
sd
(1)
F_obs=0.4195P<
F_L+P>
F_U=0.8389P>
F_obs=0.5805
P值=0.8389>
,因此可以认为两组方差齐性的。
正态性检验:
资料服从正态分布vsH:
资料偏态分布01
每一组资料正态性检验
sktestxifgroup==0
x|0.9270.3261.050.5926
.sktestxifgroup==1
Variable|P