R语言 实验七.docx
《R语言 实验七.docx》由会员分享,可在线阅读,更多相关《R语言 实验七.docx(19页珍藏版)》请在冰豆网上搜索。
R语言实验七
实验7假设检验
(一)
一、实验目的:
1.掌握重要的参数检验方法(单个总体的均值检验,两个总体的均值检验,成对样本的均值的检验,两个总体方差的检验,二项分布总体的检验);
2.掌握若干重要的非参数检验方法(Pearson拟合优度c2检验,Kolmogorov-Smirnov单样本和双样本检验)。
二、实验内容:
练习:
要求:
①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。
④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。
如文件名为“1305543109张立1”,表示学号为1305543109的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。
最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。
截图方法:
法1:
调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“PrScrn”等字符),即完成截图。
再粘贴到word文档的相应位置即可。
法2:
利用QQ输入法的截屏工具。
点击QQ输入法工具条最右边的“扳手”图标
,选择其中的“截屏”工具。
)
1.自行完成教材第五章的例题。
2.(习题5.1)正常男子血小板计数均值为225×109/L,今测得20名男性油漆作业工人的血小板计数值(单位:
109/L)
220188162230145160238188247113
126245164231256183190158224175
问油漆工人的血小板计数与正常成年男子有无差异?
解:
提出假设:
H0:
油漆工人的血小板计数与正常成年男子无差异
H1:
油漆工人的血小板计数与正常成年男子有差异
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(220,188,162,230,145,160,238,188,247,113,126,245,164,231,256,183,190,158,224,175)
>t.test(x,mu=225)
结论:
OneSamplet-test
data:
x
t=-3.4783,df=19,p-value=0.002516
alternativehypothesis:
truemeanisnotequalto225
95percentconfidenceinterval:
172.3827211.9173
sampleestimates:
meanofx
192.15
P=0.002516<0.05,拒绝原假设,认为油漆工人的血小板计数与正常成年男子有差异
3.(习题5.2)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10只,测得其寿命(单位:
小时)为
1067919119678511269369181156920948
求这个星期生产出的灯泡能使用1000小时以上的概率。
解:
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(1067,919,1196,785,1126,936,918,1156,920,948)
>p<-pnorm(1000,mean(x),sd(x))
>1-p
[1]0.4912059
结论:
这个星期生产出的灯泡能使用1000小时以上的概率为0.4912059
4.(习题5.3)为研究某铁剂治疗和饮食治疗營养性缺铁性贫血的效果,将16名患者按年龄、体重、病程和病情相近的原则配成8对,分别使用饮食疗法和补充铁剂治疗的方法,3个月后测得两种患者血红资白如下表所示,问两种方法治疗后的患者血红蛋白有无差异?
铁剂和饮食两种方法治疗后患者血红蛋白值(g/L)
铁剂治疗组
113
120
138
120
100
118
138
123
饮食治疗组
138
116
125
136
110
132
130
110
解:
提出假设:
H0:
两种方法治疗后的患者血红蛋白无差异
H1:
两种方法治疗后的患者血红蛋白有差异
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(113,120,138,120,100,118,138,123)
>y<-c(138,116,125,136,110,132,130,110)
>t.test(x,y,paired=T)
Pairedt-test
data:
xandy
t=-0.65127,df=7,p-value=0.5357
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-15.6288918.878891
sampleestimates:
meanofthedifferences
-3.375
结论:
p=0.5357>0.05,不拒绝原假设,两种方法治疗后的患者血红蛋白无差异
5.(习题5.4)为研究国产四类新药阿卡波糖股嚢效果,某医院用40名Ⅱ型糖尿病病人进行同期随机对照实验。
试验者将这些病人随机等分到试验组(阿卡波糖股嚢组)和对照组(拜唐苹股嚢组),分别测得试验开始前和8周后空腹血糖,算得空腹血糖下降值,如下所示。
能否认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同?
试验组与对照组空腹腔血糖下降值(mmol/L)
试验组
-0.70
-5.60
2.00
2.80
0.70
3.50
4.00
5.80
7.10
-0.50
(n1=20)
2.50
-1.60
1.70
3.00
0.40
4.50
4.60
2.50
6.00
-1.40
对照组
3.70
6.50
5.00
5.20
0.80
0.20
0.60
3.40
6.60
-1.10
(n2=20)
6.00
3.80
2.00
1.60
2.00
2.20
1.20
3.10
1.70
-2.00
(1)检验试验组和对照组的的数据是否来自正态分布,采用正态性W检验方法(见第3章)、Kolmogorov-Smirnov检验方法和Pearson拟合优度c2检验;
解:
提出假设:
H0:
认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同
H1:
认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果相同
①正态性W检验方法
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4)
>shapiro.test(x)
Shapiro-Wilknormalitytest
data:
x
W=0.9699,p-value=0.7527
>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00)
>shapiro.test(y)
Shapiro-Wilknormalitytest
data:
y
W=0.97098,p-value=0.7754
结论:
试验组p=0.7527>0.05,对照组p=0.7754>0.05,所以检验试验组和对照组的的数据是来自正态分布
②Kolmogorov-Smirnov检验方法
源代码及运行结果:
(复制到此处,不需要截图)
>ks.test(x,"pnorm",mean(x),sd(x))
One-sampleKolmogorov-Smirnovtest
data:
x
D=0.10652,p-value=0.9771
alternativehypothesis:
two-sided
Warningmessage:
Inks.test(x,"pnorm",mean(x),sd(x)):
Kolmogorov-Smirnov检验里不应该有连结
>ks.test(y,"pnorm",mean(y),sd(y))
One-sampleKolmogorov-Smirnovtest
data:
y
D=0.11969,p-value=0.9368
alternativehypothesis:
two-sided
Warningmessage:
Inks.test(y,"pnorm",mean(y),sd(y)):
Kolmogorov-Smirnov检验里不应该有连结
结论:
试验组p=0.9771>0.05,对照组p=0.9368>0.05,所以检验试验组和对照组的的数据是来自正态分布
③Pearson拟合优度c2检验
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4)
>A<-table(cut(x,br=c(-6,-3,0,3,6,9)))
>p<-pnorm(c(-3,0,3,6,9),mean(x),sd(x))
>p
[1]0.048947120.249900090.620022880.900758560.98828138
>p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4])
>p
[1]0.048947120.200952980.370122780.280735680.09924144
>chisq.test(A,p=p)
Chi-squaredtestforgivenprobabilities
data:
A
X-squared=0.56387,df=4,p-value=0.967
Warningmessage:
Inchisq.test(A,p=p):
Chi-squared近似算法有可能不准
>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00)
>B<-table(cut(y,br=c(-2,1,2,4,7)))
>p<-pnorm(c(-2,1,2,4,7),mean(y),sd(y))
>p
[1]0.028017520.250999070.398121950.715004470.96465615
>p<-c(p[1],p[2]-p[1],p[3]-p[2],1-p[3])
>p
[1]0.028017520.222981540.147122890.60187805
>chisq.test(B,p=p)
Chi-squaredtestforgivenprobabilities
data:
B
X-squared=28.087,df=3,p-value=3.483e-06
Warningmessage:
Inchisq.test(B,p=p):
Chi-squared近似算法有可能不准
结论:
试验组的p=0.967>0.05,对照组的p=3.483e-06>0.05,因此试验组和对照组都服从正态分布
(2)用t检验两组数据均值是否有差异,分别用方差相同模型、方差不同模型和成对t检验模型;
解:
提出假设:
H0:
两组数据均值没有差异
H1:
两组数据均值是有差异
①方差相同模型
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4)
>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00)
>t.test(x,y,var.equal=TRUE)
TwoSamplet-test
data:
xandy
t=-0.64187,df=38,p-value=0.5248
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-2.3261791.206179
sampleestimates:
meanofxmeanofy
2.0652.625
结论:
p=0.5248>0.05,不拒绝原假设,两组数据均值没有差异
②方差不同模型
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4)
>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00)
>t.test(x,y)
WelchTwoSamplet-test
data:
xandy
t=-0.64187,df=36.086,p-value=0.525
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-2.329261.20926
sampleestimates:
meanofxmeanofy
2.0652.625
结论:
p=0.525>0.05,不拒绝原假设,两组数据均值没有差异
③成对t检验模型
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4)
>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00)
>t.test(x,y,paired=T)
Pairedt-test
data:
xandy
t=-0.64644,df=19,p-value=0.5257
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-2.3731461.253146
sampleestimates:
meanofthedifferences
-0.56
结论:
p=0.5257>0.05,不拒绝原假设,两组数据均值没有差异
(3)检验试验组与对照组的方差是否相同。
解:
提出假设:
H0:
试验组与对照组的方差相同
H1:
试验组与对照组的方差不相同
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4)
>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00)
>var.test(x,y)
Ftesttocomparetwovariances
data:
xandy
F=1.5984,numdf=19,denomdf=19,p-value=0.3153
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
0.63265054.0381795
sampleestimates:
ratioofvariances
1.598361
结论:
p=0.3153>0.05,不拒绝原假设,试验组与对照组的方差相同
6.(习题5.5)为研究某种新药对抗凝血酶活力的影响,随机安排新药组病人12例,对照组病人10例,分别测定其抗凝血酶活力(单位:
mm3),其结果如下:
新药组:
126125136128123138142116110108115140
对照组:
162172177170175152157159160162
试分析新药组和对照组病人的抗凝血酶活力有无差别(=0.05)。
(1)检验两组数据是否服从正态分布;
(2)检验两组样本方差是否相同;
(3)选择最合适的检验方法检验新药组和对照组病人的抗凝血酶活力有无差别。
解:
(1)检验两组数据是否服从正态分布
①新药组数据
提出假设:
H0:
新药组数据服从正态分布
H1:
新药组数据不服从正态分布
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(126,125,136,128,123,138,142,116,110,108,115,140)
>ks.test(x,"pnorm",mean(x),sd(x))
One-sampleKolmogorov-Smirnovtest
data:
x
D=0.14644,p-value=0.9266
alternativehypothesis:
two-sided
②对照组数据
提出假设:
H0:
对照组数据服从正态分布
H1:
对照组数据不服从正态分布
源代码及运行结果:
(复制到此处,不需要截图)
>y<-c(162,172,177,170,175,152,157,159,160,162)
>ks.test(y,"pnorm",mean(y),sd(y))
One-sampleKolmogorov-Smirnovtest
data:
y
D=0.22216,p-value=0.707
alternativehypothesis:
two-sided
Warningmessage:
Inks.test(y,"pnorm",mean(y),sd(y)):
Kolmogorov-Smirnov检验里不应该有连结
(2)检验两组样本方差是否相同;
提出假设:
H0:
两组样本方差相同
H1:
两组样本方差不相同
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(126,125,136,128,123,138,142,116,110,108,115,140)
>y<-c(162,172,177,170,175,152,157,159,160,162)
>var.test(x,y)
Ftesttocomparetwovariances
data:
xandy
F=1.9646,numdf=11,denomdf=9,p-value=0.32
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
0.50219437.0488630
sampleestimates:
ratioofvariances
1.964622
(3)选择最合适的检验方法检验新药组和对照组病人的抗凝血酶活力有无差别。
提出假设:
H0:
新药组和对照组病人的抗凝血酶活力无差别
H1:
新药组和对照组病人的抗凝血酶活力有差别
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(126,125,136,128,123,138,142,116,110,108,115,140)
>y<-c(162,172,177,170,175,152,157,159,160,162)
>t.test(x,y,var.equal=TRUE)
TwoSamplet-test
data:
xandy
t=-8.8148,df=20,p-value=2.524e-08
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-48.24975-29.78358
sampleestimates:
meanofxmeanofy
125.5833164.6000
结论:
p=2.524e-08<0.05,拒绝原假设,新药组和对照组病人的抗凝血酶活力有差别
7.(习题5.6)—项调查显示某城市老年人口比重为14.7%。
该市老年研究协会为了检验该项调查是否可靠,随机抽选了400名居民,发现其中有57人是老年人。
问调查结果是否支持该市老年人口比重为14.7%的看法(=0.05)。
(提示,此题是二项分布总体的检验)
解:
提出假设:
H0:
p=p0=0.147
H1:
p≠p0
源代码及运行结果:
(复制到此处,不需要截图)
>bi