第三次作业.doc
《第三次作业.doc》由会员分享,可在线阅读,更多相关《第三次作业.doc(5页珍藏版)》请在冰豆网上搜索。
第三次作业
文航10统计2201030980223
1、以下是三个地区家庭人口数的抽样调查数据:
甲地
2
6
4
13
5
8
4
6
乙地
6
4
4
1
8
2
12
1
5
2
丙地
2
1
3
3
1
7
1
4
2
试分析三个地区的家庭平均人口数是否有显著差异(显著水平取0.10)。
(注:
要对原数据进行正态性检验和方差齐性检验)
(1)正态性检验(由于样本数都小于2000,故都用Shapiro-Wilk方法进行正态性检验):
甲地:
P值=0.2295>0.1,接受原假设,认为甲地的数据来自于正态总体
乙地:
P值=0.1800>0.1,接受原假设,认为乙地的数据来自于正态总体
丙地:
P值=0.0471<0.1,拒绝原假设,认为丙地的数据不来自于正态总体
(2)方差齐性检验:
P值>0.1,接受原假设,认为数据样本满足方差齐性。
(3)由于丙地的数据不满足正态性。
故选用非参数方差分析:
P值=0.0480<0.1,拒绝原假设,认为三个地区的家庭平均人口数有显著差异
(4)程序:
dataa;
inputpoition$number@@;
cards;
12 161 41 131 51 81 41 6
262 42 42 12 82 22 122 12 52 2
323 13 33 33 13 73 13 43 2
;
procunivariatenormal;/*正态性检验*/
procanova;
classpoition;
modelnumber=poition;
meanspoition/HOVTEST=LEVENE;/*方差齐性检验*/
procrankout=b;
varnumber;
ranksr;/*用r来存储秩次*/
procanovadata=b;
classpoition;
modelr=poition;
meanspoition/bon;
run;
2、在对比研究中观察正常人、萎缩性胃炎和胃癌三个不同群体(用A,B,C表示)。
记录的资料如下:
胃液癌胚抗原(CEA)含量X(mg/ml)
正常人(A)
N=32
20.4265.3170.528.557.064.630.2175.0360.0108.5189.6
87.3210.4169.878.4472.559.3365.0356.486.4158.6259.3
56.8254.0128.0238.7380.237.8262.324.1253.6210.5
萎缩性胃炎(B)
N=35
281.0766.266.8425.7584.1587.7377.1495.0521.3270.8648.8
86.8230.087.3327.8378.5485.6532.1537.9389.8421.4228.0110.8311.6248.7423.9149.7538.7398.7442.2571.4577.347.5245.6452.6
胃癌(C)
N=28
480.0725.6600.0608.4348.6488.9590.01380.0688.5550.0
350.7765.0438.5630.5640.0652.81200.0652.4750.0464.8
1400.0231.2432.8815.0850.0485.3296.1664.0
(1)用最佳的方法创建一个用于方差分析的SAS数据集;
(2)检验三个群体中CEA含量的分布是否为正态分布?
(考虑等方差)
(3)试比较这三个群体CEA的平均储量有无显著差异?
若有显著差异,请指出哪些群体间CEA的平均含量有显著差异。
答:
(1)见后面程序
(2)正态性检验(由于样本数都小于2000,故都用Shapiro-Wilk方法进行正态性检验):
A群体:
P值=0.0401<0.05,拒绝原假设,认为A群体中CEA含量的分布不是正态分布;
B群体:
P值=0.4302>0.05,接受原假设,认为B群体中CEA含量的分布是正态分布;
C群体:
P值=0.0027<0.05,拒绝原假设,认为C群体中CEA含量的分布不是正态分布;
(3)由于A、C群体的数据不满足正态性。
故选用非参数方差分析:
P值<0.05,拒绝原假设,认为这三个群体CEA的平均储量有无显著差异。
多重比较结果:
由上知,三个群体两两之间CEA的平均含量都有显著差异。
程序:
dataa;
dogroupnum=32,35,28;
docount=1togroupnum;
ifgroupnum=32thengroup='A';
ifgroupnum=35thengroup='B';
ifgroupnum=28thengroup='C';
inputX@@;output;
end;
end;
dropgroupnum;
cards;
20.4265.3170.528.557.064.630.2175.0360.0108.5189.6
87.3210.4169.878.4472.559.3365.0356.486.4158.6259.3
56.8254.0128.0238.7380.237.8262.324.1253.6210.5
281.0766.266.8425.7584.1587.7377.1495.0521.3270.8648.8
86.8230.087.3327.8378.5485.6532.1537.9389.8421.4228.0
110.8311.6248.7423.9149.7538.7398.7442.2571.4577.347.5245.6452.6
480.0725.6600.0608.4348.6488.9590.01380.0688.5550.0
350.7765.0438.5630.5640.0652.81200.0652.4750.0464.8
1400.0231.2432.8815.0850.0485.3296.1664.0
;
procprint;run;
procunivariatenormal;/*正态性检验*/
classgroup;
run;
procrankout=b;/*非参数方差分析*/
varX;
ranksr;
procanovadata=b;
classgroup;
modelr=group;
meansgroup/snk;
run;