R语言实验8.docx

上传人:b****5 文档编号:5686949 上传时间:2022-12-31 格式:DOCX 页数:14 大小:22.51KB
下载 相关 举报
R语言实验8.docx_第1页
第1页 / 共14页
R语言实验8.docx_第2页
第2页 / 共14页
R语言实验8.docx_第3页
第3页 / 共14页
R语言实验8.docx_第4页
第4页 / 共14页
R语言实验8.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

R语言实验8.docx

《R语言实验8.docx》由会员分享,可在线阅读,更多相关《R语言实验8.docx(14页珍藏版)》请在冰豆网上搜索。

R语言实验8.docx

R语言实验8

实验8假设检验

(二)

一、实验目的:

1.掌握若干重要的非参数检验方法(χ2检验——列联表独立性检验,Mcnemar检验——对一个样本两种研究方法是否有差异的检验,符号检验,Wilcoxon符号秩检验,Wilcoxon秩和检验);

2.掌握另外两个相关检验:

Spearman秩相关检验,Kendall秩相关检验。

二、实验内容:

练习:

要求:

①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。

④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。

如文件名为“09张立1”,表示学号为09的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。

最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。

截图方法:

法1:

调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“PrScrn”等字符),即完成截图。

再粘贴到word文档的相应位置即可。

法2:

利用QQ输入法的截屏工具。

点击QQ输入法工具条最右边的“扳手”图标

,选择其中的“截屏”工具。

1.自行完成教材第五章的例题。

2.(习题5.11)为研究分娩过程中使用胎儿电子监测仪对剖腹产率有无影响,对5824例分娩的经产妇进行回顾性调查,结果如下表所示,试进行分析。

5824例经产妇回顾性调查结果

剖腹产

胎儿电子监测仪

合计

使用

未使用

358

229

587

2492

2745

5237

合计

2850

2974

5824

解:

提出假设:

H0:

分娩过程中使用胎儿电子监测仪对剖腹产率无影响

H1:

分娩过程中使用胎儿电子监测仪对剖腹产率有影响

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(358,2492,229,2745)

>dim(x)<-c(2,2)

>chisq.test(x)

Pearson'sChi-squaredtestwithYates'continuitycorrection

data:

x

X-squared=37.414,df=1,p-value=9.552e-10

结论:

P=9.552e-10<0.05,拒绝原假设,分娩过程中使用胎儿电子监测仪对剖腹产率有影响

3.(习题5.12)在高中一年级男生中抽取300名考察其两个属性:

B是1500米长跑,C是每天平均锻炼时间,得到4×3列联表,如下表所示。

试对α=0.05,检验B与C是否独立。

300名高中学生体育锻炼的考察结果

1500米

长跑记录

锻炼时间

合计

2小时以上

1〜2小时

1小时以下

5"01'〜5"30'

45

12

10

67

5"31'〜6"00'

46

20

28

94

6"01'〜6"30'

28

23

30

81

6"31'〜7"00'

11

12

35

58

合计

解:

提出假设:

H0:

B与C独立。

H1:

B与C不独立。

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(45,46,28,11,12,20,23,12,10,28,30,35)

>dim(x)<-c(4,3)

>chisq.test(x)

Pearson'sChi-squaredtest

data:

x

X-squared=40.401,df=6,p-value=3.799e-07

结论:

P=3.799e-07<0.05,拒绝原假设,B与C不独立,有关系。

4.(习题5.13)为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,其结果如下表所示。

试进行分析。

两种工艺下产品质量的抽查结果

合格

不合格

合计

工艺一

3

4

7

工艺二

6

4

10

合计

9

8

17

解:

提出假设:

H0:

两种工艺对产品的质量没影响

H1:

两种工艺对产品的质量有影响

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(3,6,4,4)

>dim(x)<-c(2,2)

>fisher.test(x)

Fisher'sExactTestforCountData

data:

x

p-value=0.6372

alternativehypothesis:

trueoddsratioisnotequalto1

95percentconfidenceinterval:

0.046243825.13272210

sampleestimates:

oddsratio

0.521271

结论:

P=0.6372>0.05,接受原假设,两种工艺对产品的质量没影响

5.(习题5.14)应用核素法和对比法检测147例冠心病患者心脏收缩运动的符合情况,其结果如下表所示。

试分析这两种方法测定结果是否相同。

两法检查室壁收缩运动的符合情况

对比法

核素法

合计

正常

减弱

异常

正常

58

2

3

63

减弱

1

42

7

50

异常

8

9

17

34

合计

67

53

27

147

解:

提出假设:

H0:

这两种方法测定结果不相同

H1:

这两种方法测定结果相同

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(58,1,8,2,42,9,3,7,17)

>dim(x)<-c(3,3)

>mcnemar.test(x)

McNemar'sChi-squaredtest

data:

x

McNemar'schi-squared=2.8561,df=3,p-value=0.4144

结论:

P=0.4144>0.05,因此,不能认为这两种方法测定结果不相同

6.(习题5.15)在某养鱼塘中,根据过去经验,鱼的长度的中位数为14.6cm,现对鱼塘中鱼的长度进行一次估测,随机地从鱼塘中取出10条鱼长度如下:

13.3213.0614.0211.8613.5813.7713.5114.4214.4415.43

将它们作为一个样本进行检验。

试分析,该鱼塘中鱼的长度是在中位数之上,还是在中位数之下。

(1)用符号检验分析;

(2)用Wilcoxon符号秩检验分析。

解:

(1)用符号检验分析

提出假设:

H0:

M>=14.6

H1:

M<14.6

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(13.32,13.06,14.02,11.86,13.58,13.77,13.51,14.42,14.44,15.43)

>binom.test(sum(x>14.6),length(x),al="l")

Exactbinomialtest

data:

sum(x>14.6)andlength(x)

numberofsuccesses=1,numberoftrials=10,p-value=0.01074

alternativehypothesis:

trueprobabilityofsuccessislessthan0.5

95percentconfidenceinterval:

0.00000000.3941633

sampleestimates:

probabilityofsuccess

0.1

(2)用Wilcoxon符号秩检验分析

提出假设:

H0:

M>=14.6

H1:

M<14.6

源代码及运行结果:

(复制到此处,不需要截图)

x<-c(13.32,13.06,14.02,11.86,13.58,13.77,13.51,14.42,14.44,15.43)

>wilcox.test(x,mu=14.6,al="l",exact=F)

Wilcoxonsignedranktestwithcontinuitycorrection

data:

x

V=4.5,p-value=0.01087

alternativehypothesis:

truelocationislessthan14.6

结论:

两种方法的P都是小于0.05,拒绝原假设,中位数小于14.6

7.(习题5.16)用两种不同的测定方法,测定同一种中草药的有效成分,共重复20次,得到实验结果如下表所示。

两种不同的测定方法得到的结果

方法

48.0

33.0

37.5

48.0

42.5

40.0

42.0

36.0

11.3

22.0

A

36.0

27.3

14.2

32.1

52.0

38.0

17.3

20.0

21.0

46.1

方法

37.0

41.0

23.4

17.0

31.5

40.0

31.0

36.0

5.7

11.5

B

21.0

6.1

26.5

21.3

44.5

28.0

22.6

20.0

11.0

22.3

(1)试用符号检验法来测定有无显著性差异;

(2)试用Wilcoxon符号秩检验法检验两测定有无显著差异;

(3)试用Wilcoxon秩和检验法检验两测定有无显著差异;

(4)对数据作正态性和方差齐性检验,该数据是否能作t检验,如果能,请作t检验;

(5)分析各种的检验方法,试说明哪种检验法效果最好。

解:

(1)符号检验法

提出假设:

H0:

两测定无显著差异

H1:

两测定有显著差异

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>binom.test(sum(x>y),length(x))

Exactbinomialtest

data:

sum(x>y)andlength(x)

numberofsuccesses=14,numberoftrials=20,p-value=0.1153

alternativehypothesis:

trueprobabilityofsuccessisnotequalto0.5

95percentconfidenceinterval:

0.45721080.8810684

sampleestimates:

probabilityofsuccess

0.7

结论:

P=0.1153>0.05,接受原假设,两测定无显著差异

(2)Wilcoxon符号秩检验法

提出假设:

H0:

两测定无显著差异

H1:

两测定有显著差异

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>wilcox.test(x,y,paired=T,exact=F)

Wilcoxonsignedranktestwithcontinuitycorrection

data:

xandy

V=136,p-value=0.005191

alternativehypothesis:

truelocationshiftisnotequalto0

结论:

P=0.005191<0.05,拒绝原假设,两测定有显著差异

(3)Wilcoxon秩和检验法

提出假设:

H0:

两测定无显著差异

H1:

两测定有显著差异

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>wilcox.test(x,y,exact=F)

Wilcoxonranksumtestwithcontinuitycorrection

data:

xandy

W=274.5,p-value=0.04524

alternativehypothesis:

truelocationshiftisnotequalto0

结论:

P=0.04524<0.05,拒绝原假设,两测定有显著差异

(4)两独立样本t检验,要求判断独立性、正态性和方差齐性

①正态性检验

提出假设:

H0:

两组数据服从正态分布

H1:

两组数据不服从正态分布

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>ks.test(x,pnorm,mean(x),sd(x))

One-sampleKolmogorov-Smirnovtest

data:

x

D=0.14067,p-value=0.8235

alternativehypothesis:

two-sided

Warningmessage:

Inks.test(x,pnorm,mean(x),sd(x)):

Kolmogorov-Smirnov检验里不应该有连结

>ks.test(y,pnorm,mean(y),sd(y))

One-sampleKolmogorov-Smirnovtest

data:

y

D=0.10142,p-value=0.973

alternativehypothesis:

two-sided

结论:

两组数据P值都大于0.05,接受原假设,两组数据服从正态分布

②方差齐性检验

提出假设:

H0:

两组数据方差相同

H1:

两组数据方差不相同

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>var.test(x,y)

Ftesttocomparetwovariances

data:

xandy

F=1.1406,numdf=19,denomdf=19,p-value=0.7772

alternativehypothesis:

trueratioofvariancesisnotequalto1

95percentconfidenceinterval:

0.45147882.8817689

sampleestimates:

ratioofvariances

1.140639

结论:

P=0.7772>0.05,接受原假设,两组数据方差相同

③能否作t检验?

如果能,请按照前面各题的格式、内容写出作t检验的过程

综上,能作t检验

提出假设:

H0:

两测定无显著差异

H1:

两测定有显著差异

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>t.test(x,y,var.equal=T)

TwoSamplet-test

data:

xandy

t=2.2428,df=38,p-value=0.03082

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

0.812552915.8774471

sampleestimates:

meanofxmeanofy

33.21524.870

结论:

P=0.03082<0.05,拒绝原假设,两测定有显著差异

(5)分析各种的检验方法,试说明哪种检验法效果最好。

结论:

综上所述,Wilcoxon秩和检验法的差异性检出能力最强,符号检验的差异性检出最弱。

8.(习题5.17)调查某大学学生每周学习时间与得分的平均等级之间的关系,现抽查10个学生的资料如下:

学习时间

24

17

20

4

29

学习等级

8

1

4

7

9

5

10

3

2

6

其中等级10表示最好,1表示最差。

试用秩相关检验(Spearman检验和Kendall检验)分别分析学习等级与学习成绩有无关系。

解:

(1)用Spearman秩检验方法

提出假设:

H0:

学习等级与学习成绩无关系

H1:

学习等级与学习成绩有关系

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(24,17,20,41,52,23,46,18,15,29)

>y<-c(8,1,4,7,9,5,10,3,2,6)

>cor.test(x,y,method="spearman",exact=F)

Spearman'srankcorrelationrho

data:

xandy

S=10,p-value=5.484e-05

alternativehypothesis:

truerhoisnotequalto0

sampleestimates:

rho

0.9393939

结论:

P=5.484e-05<0.05,拒绝原假设,学习等级与学习成绩有关系

(2)用Kendall秩检验方法

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(24,17,20,41,52,23,46,18,15,29)

>y<-c(8,1,4,7,9,5,10,3,2,6)

>cor.test(x,y,method="kendall",exact=F)

Kendall'srankcorrelationtau

data:

xandy

z=3.3094,p-value=0.000935

alternativehypothesis:

truetauisnotequalto0

sampleestimates:

tau

0.8222222

结论:

P=0.000935<0.05,拒绝原假设,学习等级与学习成绩有关系

9.(习题5.18)为比较一种新疗法对某种疾病的治疗效果,将40名患者随机地分为两组,每组20人,一组采用新疗法,另一组用原标准疗法。

经过一段时间的治疗后,对每个患者的疗效作仔细的评估,并划分为差、较差、一般、较好和好5个等级。

两组处于不同等级的患者人数下表所示。

试分析,由此结果能否认为新方法的疗效显著地优于原疗法。

(α=0.05)

不同方法治疗后的结果

等级

较差

一般

较好

新疗法组

0

1

9

7

3

原疗法组

2

2

11

4

1

解:

提出假设:

H0:

新方法的疗效不显著地优于原疗法

H1:

新方法的疗效显著地优于原疗法

源代码及运行结果:

(复制到此处,不需要截图)

>x<-rep(1:

5,c(0,1,9,7,3))

>y<-rep(1:

5,c(2,2,11,4,1))

>wilcox.test(x,y,exact=F)

Wilcoxonranksumtestwithcontinuitycorrection

data:

xandy

W=266,p-value=0.05509

alternativehypothesis:

truelocationshiftisnotequalto0

结论:

P=0.05509>0.05,接受原假设,即认为新方法的疗效不显著地优于原疗法

思考:

1.χ2检验针对的哪一类型的数据?

A.连续型变量;B.无序分类变量;C.有序分类变量

B.无序分类变量

2.符号检验、Wilcoxon符号秩检验和Wilcoxon秩和检验针对的哪一类型的数据?

A.连续型变量;B.无序分类变量;C.有序分类变量

C.有序分类变量

3.顺序统计量与秩统计量是一样的吗?

在R语言中分别利用什么函数可以求得?

秩统计计量是按顺序排列还是按降序排列?

不一样。

顺序统计量是将样本观测值从小到大排顺序。

在R中,可以由sort()函数求出一个顺序统计量。

而秩统计量是在非参数检验中广泛运用的统计量,它的一个重要的特性是分布无关性。

其样本不必取自同一总体。

在R中,可以由rank()函数求出一个秩统计量。

秩统计计量是按顺序排列的。

4.非参数检验中在检

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1