R语言实验8.docx

资源描述

R语言实验8.docx

《R语言实验8.docx》由会员分享，可在线阅读，更多相关《R语言实验8.docx（14页珍藏版）》请在冰豆网上搜索。

R语言实验8.docx

R语言实验8

实验8假设检验

（二）

一、实验目的：

1.掌握若干重要的非参数检验方法（χ2检验——列联表独立性检验，Mcnemar检验——对一个样本两种研究方法是否有差异的检验，符号检验，Wilcoxon符号秩检验，Wilcoxon秩和检验）；

2.掌握另外两个相关检验：

Spearman秩相关检验，Kendall秩相关检验。

二、实验内容：

练习：

要求：

①完成练习并粘贴运行截图到文档相应位置（截图方法见下），并将所有自己输入文字的字体颜色设为红色（包括后面的思考及小结），②回答思考题，③简要书写实验小结。

④修改本文档名为“本人完整学号姓名1”，其中1表示第1次实验，以后更改为2,3,...。

如文件名为“09张立1”，表示学号为09的张立同学的第1次实验，注意文件名中没有空格及任何其它字符。

最后连同数据文件、源程序文件等（如果有的话，本次实验没有），一起压缩打包发给课代表，压缩包的文件名同上。

截图方法：

法1：

调整需要截图的窗口至合适的大小，并使该窗口为当前激活窗口（即该窗口在屏幕最前方），按住键盘Alt键（空格键两侧各有一个）不放，再按键盘右上角的截图键（通常印有“印屏幕”或“PrScrn”等字符），即完成截图。

再粘贴到word文档的相应位置即可。

法2：

利用QQ输入法的截屏工具。

点击QQ输入法工具条最右边的“扳手”图标

，选择其中的“截屏”工具。

）

1.自行完成教材第五章的例题。

2.（习题5.11）为研究分娩过程中使用胎儿电子监测仪对剖腹产率有无影响，对5824例分娩的经产妇进行回顾性调查，结果如下表所示，试进行分析。

5824例经产妇回顾性调查结果

剖腹产

胎儿电子监测仪

合计

使用

未使用

是

358

229

587

否

2492

2745

5237

合计

2850

2974

5824

解：

提出假设：

H0：

分娩过程中使用胎儿电子监测仪对剖腹产率无影响

H1：

分娩过程中使用胎儿电子监测仪对剖腹产率有影响

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（358,2492,229,2745）

>dim（x）<-c（2,2）

>chisq.test（x）

Pearson'sChi-squaredtestwithYates'continuitycorrection

data:

X-squared=37.414,df=1,p-value=9.552e-10

结论：

P=9.552e-10<0.05,拒绝原假设，分娩过程中使用胎儿电子监测仪对剖腹产率有影响

3.（习题5.12）在高中一年级男生中抽取300名考察其两个属性：

B是1500米长跑，C是每天平均锻炼时间，得到4×3列联表，如下表所示。

试对α=0.05，检验B与C是否独立。

300名高中学生体育锻炼的考察结果

1500米

长跑记录

锻炼时间

合计

2小时以上

1〜2小时

1小时以下

5"01'〜5"30'

5"31'〜6"00'

6"01'〜6"30'

6"31'〜7"00'

合计

解：

提出假设：

H0：

B与C独立。

H1：

B与C不独立。

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（45,46,28,11,12,20,23,12,10,28,30,35）

>dim（x）<-c（4,3）

>chisq.test（x）

Pearson'sChi-squaredtest

data:

X-squared=40.401,df=6,p-value=3.799e-07

结论：

P=3.799e-07<0.05,拒绝原假设，B与C不独立，有关系。

4.（习题5.13）为比较两种工艺对产品的质量是否有影响，对其产品进行抽样检查，其结果如下表所示。

试进行分析。

两种工艺下产品质量的抽查结果

合格

不合格

合计

工艺一

工艺二

合计

解：

提出假设：

H0：

两种工艺对产品的质量没影响

H1：

两种工艺对产品的质量有影响

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（3,6,4,4）

>dim（x）<-c（2,2）

>fisher.test（x）

Fisher'sExactTestforCountData

data:

p-value=0.6372

alternativehypothesis:

trueoddsratioisnotequalto1

95percentconfidenceinterval:

0.046243825.13272210

sampleestimates:

oddsratio

0.521271

结论：

P=0.6372>0.05，接受原假设，两种工艺对产品的质量没影响

5.（习题5.14）应用核素法和对比法检测147例冠心病患者心脏收缩运动的符合情况，其结果如下表所示。

试分析这两种方法测定结果是否相同。

两法检查室壁收缩运动的符合情况

对比法

核素法

合计

正常

减弱

异常

正常

减弱

异常

合计

147

解：

提出假设：

H0：

这两种方法测定结果不相同

H1：

这两种方法测定结果相同

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（58,1,8,2,42,9,3,7,17）

>dim（x）<-c（3,3）

>mcnemar.test（x）

McNemar'sChi-squaredtest

data:

McNemar'schi-squared=2.8561,df=3,p-value=0.4144

结论：

P=0.4144>0.05，因此，不能认为这两种方法测定结果不相同

6.（习题5.15）在某养鱼塘中，根据过去经验，鱼的长度的中位数为14.6cm，现对鱼塘中鱼的长度进行一次估测，随机地从鱼塘中取出10条鱼长度如下：

13.3213.0614.0211.8613.5813.7713.5114.4214.4415.43

将它们作为一个样本进行检验。

试分析，该鱼塘中鱼的长度是在中位数之上，还是在中位数之下。

（1）用符号检验分析；

（2）用Wilcoxon符号秩检验分析。

解：

（1）用符号检验分析

提出假设：

H0：

M>=14.6

H1：

M<14.6

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（13.32,13.06,14.02,11.86,13.58,13.77,13.51,14.42,14.44,15.43）

>binom.test（sum（x>14.6）,length（x）,al="l"）

Exactbinomialtest

data:

sum（x>14.6）andlength（x）

numberofsuccesses=1,numberoftrials=10,p-value=0.01074

alternativehypothesis:

trueprobabilityofsuccessislessthan0.5

95percentconfidenceinterval:

0.00000000.3941633

sampleestimates:

probabilityofsuccess

0.1

（2）用Wilcoxon符号秩检验分析

提出假设：

H0：

M>=14.6

H1：

M<14.6

源代码及运行结果：

（复制到此处，不需要截图）

x<-c（13.32,13.06,14.02,11.86,13.58,13.77,13.51,14.42,14.44,15.43）

>wilcox.test（x,mu=14.6,al="l",exact=F）

Wilcoxonsignedranktestwithcontinuitycorrection

data:

V=4.5,p-value=0.01087

alternativehypothesis:

truelocationislessthan14.6

结论：

两种方法的P都是小于0.05，拒绝原假设，中位数小于14.6

7.（习题5.16）用两种不同的测定方法，测定同一种中草药的有效成分，共重复20次，得到实验结果如下表所示。

两种不同的测定方法得到的结果

方法

48.0

33.0

37.5

48.0

42.5

40.0

42.0

36.0

11.3

22.0

36.0

27.3

14.2

32.1

52.0

38.0

17.3

20.0

21.0

46.1

方法

37.0

41.0

23.4

17.0

31.5

40.0

31.0

36.0

5.7

11.5

21.0

6.1

26.5

21.3

44.5

28.0

22.6

20.0

11.0

22.3

（1）试用符号检验法来测定有无显著性差异；

（2）试用Wilcoxon符号秩检验法检验两测定有无显著差异；

（3）试用Wilcoxon秩和检验法检验两测定有无显著差异；

（4）对数据作正态性和方差齐性检验，该数据是否能作t检验，如果能，请作t检验；

（5）分析各种的检验方法，试说明哪种检验法效果最好。

解：

（1）符号检验法

提出假设：

H0：

两测定无显著差异

H1：

两测定有显著差异

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1）

>y<-c（37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3）

>binom.test（sum（x>y）,length（x））

Exactbinomialtest

data:

sum（x>y）andlength（x）

numberofsuccesses=14,numberoftrials=20,p-value=0.1153

alternativehypothesis:

trueprobabilityofsuccessisnotequalto0.5

95percentconfidenceinterval:

0.45721080.8810684

sampleestimates:

probabilityofsuccess

0.7

结论：

P=0.1153>0.05,接受原假设，两测定无显著差异

（2）Wilcoxon符号秩检验法

提出假设：

H0：

两测定无显著差异

H1：

两测定有显著差异

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1）

>y<-c（37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3）

>wilcox.test（x,y,paired=T,exact=F）

Wilcoxonsignedranktestwithcontinuitycorrection

data:

xandy

V=136,p-value=0.005191

alternativehypothesis:

truelocationshiftisnotequalto0

结论：

P=0.005191<0.05,拒绝原假设，两测定有显著差异

（3）Wilcoxon秩和检验法

提出假设：

H0：

两测定无显著差异

H1：

两测定有显著差异

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1）

>y<-c（37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3）

>wilcox.test（x,y,exact=F）

Wilcoxonranksumtestwithcontinuitycorrection

data:

xandy

W=274.5,p-value=0.04524

alternativehypothesis:

truelocationshiftisnotequalto0

结论：

P=0.04524<0.05,拒绝原假设，两测定有显著差异

（4）两独立样本t检验，要求判断独立性、正态性和方差齐性

①正态性检验

提出假设：

H0：

两组数据服从正态分布

H1：

两组数据不服从正态分布

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1）

>y<-c（37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3）

>ks.test（x,pnorm,mean（x）,sd（x））

One-sampleKolmogorov-Smirnovtest

data:

D=0.14067,p-value=0.8235

alternativehypothesis:

two-sided

Warningmessage:

Inks.test（x,pnorm,mean（x）,sd（x））:

Kolmogorov-Smirnov检验里不应该有连结

>ks.test（y,pnorm,mean（y）,sd（y））

One-sampleKolmogorov-Smirnovtest

data:

D=0.10142,p-value=0.973

alternativehypothesis:

two-sided

结论：

两组数据P值都大于0.05，接受原假设，两组数据服从正态分布

②方差齐性检验

提出假设：

H0：

两组数据方差相同

H1：

两组数据方差不相同

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1）

>y<-c（37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3）

>var.test（x,y）

Ftesttocomparetwovariances

data:

xandy

F=1.1406,numdf=19,denomdf=19,p-value=0.7772

alternativehypothesis:

trueratioofvariancesisnotequalto1

95percentconfidenceinterval:

0.45147882.8817689

sampleestimates:

ratioofvariances

1.140639

结论：

P=0.7772>0.05,接受原假设，两组数据方差相同

③能否作t检验？

如果能，请按照前面各题的格式、内容写出作t检验的过程

综上，能作t检验

提出假设：

H0：

两测定无显著差异

H1：

两测定有显著差异

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1）

>y<-c（37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3）

>t.test（x,y,var.equal=T）

TwoSamplet-test

data:

xandy

t=2.2428,df=38,p-value=0.03082

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

0.812552915.8774471

sampleestimates:

meanofxmeanofy

33.21524.870

结论：

P=0.03082<0.05,拒绝原假设，两测定有显著差异

（5）分析各种的检验方法，试说明哪种检验法效果最好。

结论：

综上所述，Wilcoxon秩和检验法的差异性检出能力最强，符号检验的差异性检出最弱。

8.（习题5.17）调查某大学学生每周学习时间与得分的平均等级之间的关系，现抽查10个学生的资料如下：

学习时间

学习等级

其中等级10表示最好，1表示最差。

试用秩相关检验（Spearman检验和Kendall检验）分别分析学习等级与学习成绩有无关系。

解：

（1）用Spearman秩检验方法

提出假设：

H0：

学习等级与学习成绩无关系

H1：

学习等级与学习成绩有关系

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（24,17,20,41,52,23,46,18,15,29）

>y<-c（8,1,4,7,9,5,10,3,2,6）

>cor.test（x,y,method="spearman",exact=F）

Spearman'srankcorrelationrho

data:

xandy

S=10,p-value=5.484e-05

alternativehypothesis:

truerhoisnotequalto0

sampleestimates:

rho

0.9393939

结论：

P=5.484e-05<0.05，拒绝原假设，学习等级与学习成绩有关系

（2）用Kendall秩检验方法

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（24,17,20,41,52,23,46,18,15,29）

>y<-c（8,1,4,7,9,5,10,3,2,6）

>cor.test（x,y,method="kendall",exact=F）

Kendall'srankcorrelationtau

data:

xandy

z=3.3094,p-value=0.000935

alternativehypothesis:

truetauisnotequalto0

sampleestimates:

tau

0.8222222

结论：

P=0.000935<0.05，拒绝原假设，学习等级与学习成绩有关系

9.（习题5.18）为比较一种新疗法对某种疾病的治疗效果，将40名患者随机地分为两组，每组20人，一组采用新疗法，另一组用原标准疗法。

经过一段时间的治疗后，对每个患者的疗效作仔细的评估，并划分为差、较差、一般、较好和好5个等级。

两组处于不同等级的患者人数下表所示。

试分析，由此结果能否认为新方法的疗效显著地优于原疗法。

（α=0.05）

不同方法治疗后的结果

等级

差

较差

一般

较好

好

新疗法组

原疗法组

解：

提出假设：

H0：

新方法的疗效不显著地优于原疗法

H1：

新方法的疗效显著地优于原疗法

源代码及运行结果：

（复制到此处，不需要截图）

>x<-rep（1:

5,c（0,1,9,7,3））

>y<-rep（1:

5,c（2,2,11,4,1））

>wilcox.test（x,y,exact=F）

Wilcoxonranksumtestwithcontinuitycorrection

data:

xandy

W=266,p-value=0.05509

alternativehypothesis:

truelocationshiftisnotequalto0

结论：

P=0.05509>0.05,接受原假设，即认为新方法的疗效不显著地优于原疗法

思考：

1.χ2检验针对的哪一类型的数据？

A.连续型变量；B.无序分类变量；C.有序分类变量

B.无序分类变量

2.符号检验、Wilcoxon符号秩检验和Wilcoxon秩和检验针对的哪一类型的数据？

A.连续型变量；B.无序分类变量；C.有序分类变量

C.有序分类变量

3.顺序统计量与秩统计量是一样的吗？

在R语言中分别利用什么函数可以求得？

秩统计计量是按顺序排列还是按降序排列？

不一样。

顺序统计量是将样本观测值从小到大排顺序。

在R中，可以由sort（）函数求出一个顺序统计量。

而秩统计量是在非参数检验中广泛运用的统计量，它的一个重要的特性是分布无关性。

其样本不必取自同一总体。

在R中，可以由rank（）函数求出一个秩统计量。

秩统计计量是按顺序排列的。

4.非参数检验中在检

展开阅读全文