R语言实验8.docx
《R语言实验8.docx》由会员分享,可在线阅读,更多相关《R语言实验8.docx(14页珍藏版)》请在冰豆网上搜索。
![R语言实验8.docx](https://file1.bdocx.com/fileroot1/2022-12/31/6b91c573-7b54-47fc-a976-f98326cef058/6b91c573-7b54-47fc-a976-f98326cef0581.gif)
R语言实验8
实验8假设检验
(二)
一、实验目的:
1.掌握若干重要的非参数检验方法(χ2检验——列联表独立性检验,Mcnemar检验——对一个样本两种研究方法是否有差异的检验,符号检验,Wilcoxon符号秩检验,Wilcoxon秩和检验);
2.掌握另外两个相关检验:
Spearman秩相关检验,Kendall秩相关检验。
二、实验内容:
练习:
要求:
①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。
④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。
如文件名为“09张立1”,表示学号为09的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。
最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。
截图方法:
法1:
调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“PrScrn”等字符),即完成截图。
再粘贴到word文档的相应位置即可。
法2:
利用QQ输入法的截屏工具。
点击QQ输入法工具条最右边的“扳手”图标
,选择其中的“截屏”工具。
)
1.自行完成教材第五章的例题。
2.(习题5.11)为研究分娩过程中使用胎儿电子监测仪对剖腹产率有无影响,对5824例分娩的经产妇进行回顾性调查,结果如下表所示,试进行分析。
5824例经产妇回顾性调查结果
剖腹产
胎儿电子监测仪
合计
使用
未使用
是
358
229
587
否
2492
2745
5237
合计
2850
2974
5824
解:
提出假设:
H0:
分娩过程中使用胎儿电子监测仪对剖腹产率无影响
H1:
分娩过程中使用胎儿电子监测仪对剖腹产率有影响
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(358,2492,229,2745)
>dim(x)<-c(2,2)
>chisq.test(x)
Pearson'sChi-squaredtestwithYates'continuitycorrection
data:
x
X-squared=37.414,df=1,p-value=9.552e-10
结论:
P=9.552e-10<0.05,拒绝原假设,分娩过程中使用胎儿电子监测仪对剖腹产率有影响
3.(习题5.12)在高中一年级男生中抽取300名考察其两个属性:
B是1500米长跑,C是每天平均锻炼时间,得到4×3列联表,如下表所示。
试对α=0.05,检验B与C是否独立。
300名高中学生体育锻炼的考察结果
1500米
长跑记录
锻炼时间
合计
2小时以上
1〜2小时
1小时以下
5"01'〜5"30'
45
12
10
67
5"31'〜6"00'
46
20
28
94
6"01'〜6"30'
28
23
30
81
6"31'〜7"00'
11
12
35
58
合计
解:
提出假设:
H0:
B与C独立。
H1:
B与C不独立。
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(45,46,28,11,12,20,23,12,10,28,30,35)
>dim(x)<-c(4,3)
>chisq.test(x)
Pearson'sChi-squaredtest
data:
x
X-squared=40.401,df=6,p-value=3.799e-07
结论:
P=3.799e-07<0.05,拒绝原假设,B与C不独立,有关系。
4.(习题5.13)为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,其结果如下表所示。
试进行分析。
两种工艺下产品质量的抽查结果
合格
不合格
合计
工艺一
3
4
7
工艺二
6
4
10
合计
9
8
17
解:
提出假设:
H0:
两种工艺对产品的质量没影响
H1:
两种工艺对产品的质量有影响
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(3,6,4,4)
>dim(x)<-c(2,2)
>fisher.test(x)
Fisher'sExactTestforCountData
data:
x
p-value=0.6372
alternativehypothesis:
trueoddsratioisnotequalto1
95percentconfidenceinterval:
0.046243825.13272210
sampleestimates:
oddsratio
0.521271
结论:
P=0.6372>0.05,接受原假设,两种工艺对产品的质量没影响
5.(习题5.14)应用核素法和对比法检测147例冠心病患者心脏收缩运动的符合情况,其结果如下表所示。
试分析这两种方法测定结果是否相同。
两法检查室壁收缩运动的符合情况
对比法
核素法
合计
正常
减弱
异常
正常
58
2
3
63
减弱
1
42
7
50
异常
8
9
17
34
合计
67
53
27
147
解:
提出假设:
H0:
这两种方法测定结果不相同
H1:
这两种方法测定结果相同
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(58,1,8,2,42,9,3,7,17)
>dim(x)<-c(3,3)
>mcnemar.test(x)
McNemar'sChi-squaredtest
data:
x
McNemar'schi-squared=2.8561,df=3,p-value=0.4144
结论:
P=0.4144>0.05,因此,不能认为这两种方法测定结果不相同
6.(习题5.15)在某养鱼塘中,根据过去经验,鱼的长度的中位数为14.6cm,现对鱼塘中鱼的长度进行一次估测,随机地从鱼塘中取出10条鱼长度如下:
13.3213.0614.0211.8613.5813.7713.5114.4214.4415.43
将它们作为一个样本进行检验。
试分析,该鱼塘中鱼的长度是在中位数之上,还是在中位数之下。
(1)用符号检验分析;
(2)用Wilcoxon符号秩检验分析。
解:
(1)用符号检验分析
提出假设:
H0:
M>=14.6
H1:
M<14.6
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(13.32,13.06,14.02,11.86,13.58,13.77,13.51,14.42,14.44,15.43)
>binom.test(sum(x>14.6),length(x),al="l")
Exactbinomialtest
data:
sum(x>14.6)andlength(x)
numberofsuccesses=1,numberoftrials=10,p-value=0.01074
alternativehypothesis:
trueprobabilityofsuccessislessthan0.5
95percentconfidenceinterval:
0.00000000.3941633
sampleestimates:
probabilityofsuccess
0.1
(2)用Wilcoxon符号秩检验分析
提出假设:
H0:
M>=14.6
H1:
M<14.6
源代码及运行结果:
(复制到此处,不需要截图)
x<-c(13.32,13.06,14.02,11.86,13.58,13.77,13.51,14.42,14.44,15.43)
>wilcox.test(x,mu=14.6,al="l",exact=F)
Wilcoxonsignedranktestwithcontinuitycorrection
data:
x
V=4.5,p-value=0.01087
alternativehypothesis:
truelocationislessthan14.6
结论:
两种方法的P都是小于0.05,拒绝原假设,中位数小于14.6
7.(习题5.16)用两种不同的测定方法,测定同一种中草药的有效成分,共重复20次,得到实验结果如下表所示。
两种不同的测定方法得到的结果
方法
48.0
33.0
37.5
48.0
42.5
40.0
42.0
36.0
11.3
22.0
A
36.0
27.3
14.2
32.1
52.0
38.0
17.3
20.0
21.0
46.1
方法
37.0
41.0
23.4
17.0
31.5
40.0
31.0
36.0
5.7
11.5
B
21.0
6.1
26.5
21.3
44.5
28.0
22.6
20.0
11.0
22.3
(1)试用符号检验法来测定有无显著性差异;
(2)试用Wilcoxon符号秩检验法检验两测定有无显著差异;
(3)试用Wilcoxon秩和检验法检验两测定有无显著差异;
(4)对数据作正态性和方差齐性检验,该数据是否能作t检验,如果能,请作t检验;
(5)分析各种的检验方法,试说明哪种检验法效果最好。
解:
(1)符号检验法
提出假设:
H0:
两测定无显著差异
H1:
两测定有显著差异
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)
>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)
>binom.test(sum(x>y),length(x))
Exactbinomialtest
data:
sum(x>y)andlength(x)
numberofsuccesses=14,numberoftrials=20,p-value=0.1153
alternativehypothesis:
trueprobabilityofsuccessisnotequalto0.5
95percentconfidenceinterval:
0.45721080.8810684
sampleestimates:
probabilityofsuccess
0.7
结论:
P=0.1153>0.05,接受原假设,两测定无显著差异
(2)Wilcoxon符号秩检验法
提出假设:
H0:
两测定无显著差异
H1:
两测定有显著差异
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)
>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)
>wilcox.test(x,y,paired=T,exact=F)
Wilcoxonsignedranktestwithcontinuitycorrection
data:
xandy
V=136,p-value=0.005191
alternativehypothesis:
truelocationshiftisnotequalto0
结论:
P=0.005191<0.05,拒绝原假设,两测定有显著差异
(3)Wilcoxon秩和检验法
提出假设:
H0:
两测定无显著差异
H1:
两测定有显著差异
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)
>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)
>wilcox.test(x,y,exact=F)
Wilcoxonranksumtestwithcontinuitycorrection
data:
xandy
W=274.5,p-value=0.04524
alternativehypothesis:
truelocationshiftisnotequalto0
结论:
P=0.04524<0.05,拒绝原假设,两测定有显著差异
(4)两独立样本t检验,要求判断独立性、正态性和方差齐性
①正态性检验
提出假设:
H0:
两组数据服从正态分布
H1:
两组数据不服从正态分布
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)
>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)
>ks.test(x,pnorm,mean(x),sd(x))
One-sampleKolmogorov-Smirnovtest
data:
x
D=0.14067,p-value=0.8235
alternativehypothesis:
two-sided
Warningmessage:
Inks.test(x,pnorm,mean(x),sd(x)):
Kolmogorov-Smirnov检验里不应该有连结
>ks.test(y,pnorm,mean(y),sd(y))
One-sampleKolmogorov-Smirnovtest
data:
y
D=0.10142,p-value=0.973
alternativehypothesis:
two-sided
结论:
两组数据P值都大于0.05,接受原假设,两组数据服从正态分布
②方差齐性检验
提出假设:
H0:
两组数据方差相同
H1:
两组数据方差不相同
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)
>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)
>var.test(x,y)
Ftesttocomparetwovariances
data:
xandy
F=1.1406,numdf=19,denomdf=19,p-value=0.7772
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
0.45147882.8817689
sampleestimates:
ratioofvariances
1.140639
结论:
P=0.7772>0.05,接受原假设,两组数据方差相同
③能否作t检验?
如果能,请按照前面各题的格式、内容写出作t检验的过程
综上,能作t检验
提出假设:
H0:
两测定无显著差异
H1:
两测定有显著差异
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)
>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)
>t.test(x,y,var.equal=T)
TwoSamplet-test
data:
xandy
t=2.2428,df=38,p-value=0.03082
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
0.812552915.8774471
sampleestimates:
meanofxmeanofy
33.21524.870
结论:
P=0.03082<0.05,拒绝原假设,两测定有显著差异
(5)分析各种的检验方法,试说明哪种检验法效果最好。
结论:
综上所述,Wilcoxon秩和检验法的差异性检出能力最强,符号检验的差异性检出最弱。
8.(习题5.17)调查某大学学生每周学习时间与得分的平均等级之间的关系,现抽查10个学生的资料如下:
学习时间
24
17
20
4
29
学习等级
8
1
4
7
9
5
10
3
2
6
其中等级10表示最好,1表示最差。
试用秩相关检验(Spearman检验和Kendall检验)分别分析学习等级与学习成绩有无关系。
解:
(1)用Spearman秩检验方法
提出假设:
H0:
学习等级与学习成绩无关系
H1:
学习等级与学习成绩有关系
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(24,17,20,41,52,23,46,18,15,29)
>y<-c(8,1,4,7,9,5,10,3,2,6)
>cor.test(x,y,method="spearman",exact=F)
Spearman'srankcorrelationrho
data:
xandy
S=10,p-value=5.484e-05
alternativehypothesis:
truerhoisnotequalto0
sampleestimates:
rho
0.9393939
结论:
P=5.484e-05<0.05,拒绝原假设,学习等级与学习成绩有关系
(2)用Kendall秩检验方法
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(24,17,20,41,52,23,46,18,15,29)
>y<-c(8,1,4,7,9,5,10,3,2,6)
>cor.test(x,y,method="kendall",exact=F)
Kendall'srankcorrelationtau
data:
xandy
z=3.3094,p-value=0.000935
alternativehypothesis:
truetauisnotequalto0
sampleestimates:
tau
0.8222222
结论:
P=0.000935<0.05,拒绝原假设,学习等级与学习成绩有关系
9.(习题5.18)为比较一种新疗法对某种疾病的治疗效果,将40名患者随机地分为两组,每组20人,一组采用新疗法,另一组用原标准疗法。
经过一段时间的治疗后,对每个患者的疗效作仔细的评估,并划分为差、较差、一般、较好和好5个等级。
两组处于不同等级的患者人数下表所示。
试分析,由此结果能否认为新方法的疗效显著地优于原疗法。
(α=0.05)
不同方法治疗后的结果
等级
差
较差
一般
较好
好
新疗法组
0
1
9
7
3
原疗法组
2
2
11
4
1
解:
提出假设:
H0:
新方法的疗效不显著地优于原疗法
H1:
新方法的疗效显著地优于原疗法
源代码及运行结果:
(复制到此处,不需要截图)
>x<-rep(1:
5,c(0,1,9,7,3))
>y<-rep(1:
5,c(2,2,11,4,1))
>wilcox.test(x,y,exact=F)
Wilcoxonranksumtestwithcontinuitycorrection
data:
xandy
W=266,p-value=0.05509
alternativehypothesis:
truelocationshiftisnotequalto0
结论:
P=0.05509>0.05,接受原假设,即认为新方法的疗效不显著地优于原疗法
思考:
1.χ2检验针对的哪一类型的数据?
A.连续型变量;B.无序分类变量;C.有序分类变量
B.无序分类变量
2.符号检验、Wilcoxon符号秩检验和Wilcoxon秩和检验针对的哪一类型的数据?
A.连续型变量;B.无序分类变量;C.有序分类变量
C.有序分类变量
3.顺序统计量与秩统计量是一样的吗?
在R语言中分别利用什么函数可以求得?
秩统计计量是按顺序排列还是按降序排列?
不一样。
顺序统计量是将样本观测值从小到大排顺序。
在R中,可以由sort()函数求出一个顺序统计量。
而秩统计量是在非参数检验中广泛运用的统计量,它的一个重要的特性是分布无关性。
其样本不必取自同一总体。
在R中,可以由rank()函数求出一个秩统计量。
秩统计计量是按顺序排列的。
4.非参数检验中在检