R语言实验8.docx

上传人:b****5 文档编号:27725536 上传时间:2023-07-04 格式:DOCX 页数:16 大小:21.97KB
下载 相关 举报
R语言实验8.docx_第1页
第1页 / 共16页
R语言实验8.docx_第2页
第2页 / 共16页
R语言实验8.docx_第3页
第3页 / 共16页
R语言实验8.docx_第4页
第4页 / 共16页
R语言实验8.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

R语言实验8.docx

《R语言实验8.docx》由会员分享,可在线阅读,更多相关《R语言实验8.docx(16页珍藏版)》请在冰豆网上搜索。

R语言实验8.docx

R语言实验8

实验8假设检验

(二)

一、实验目的:

1.掌握若干重要的非参数检验方法(?

2检验——列联表独立性检验,Mcnemar检验——对一个样本两种研究方法是否有差异的检验,符号检验,Wilcoxon符号秩检验,Wilcoxon秩和检验);

2.掌握另外两个相关检验:

Spearman秩相关检验,Kendall秩相关检验。

二、实验内容:

练习:

要求:

①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。

④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。

如文件名为“09张立1”,表示学号为09的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。

最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。

截图方法:

法1:

调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“PrScrn”等字符),即完成截图。

再粘贴到word文档的相应位置即可。

法2:

利用QQ输入法的截屏工具。

点击QQ输入法工具条最右边的“扳手”图标

,选择其中的“截屏”工具。

1.自行完成教材第五章的例题。

2.(习题5.11)为研究分娩过程中使用胎儿电子监测仪对剖腹产率有无影响,对5824例分娩的经产妇进行回顾性调查,结果如下表所示,试进行分析。

5824例经产妇回顾性调查结果

剖腹产

胎儿电子监测仪

合计

使用

未使用

358

229

587

2492

2745

5237

合计

2850

2974

5824

解:

提出假设:

H0:

分娩过程中使用胎儿电子监测仪对剖腹产率无影响

H1:

分娩过程中使用胎儿电子监测仪对剖腹产率有影响

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(358,2492,229,2745)

>dim(x)<-c(2,2)

>chisq.test(x)

Pearson'sChi-squaredtestwithYates'continuitycorrection

data:

x

X-squared=37.414,df=1,p-value=9.552e-10

结论:

P=9.552e-10<0.05,拒绝原假设,分娩过程中使用胎儿电子监测仪对剖腹产率有影响

3.(习题5.12)在高中一年级男生中抽取300名考察其两个属性:

B是1500米长跑,C是每天平均锻炼时间,得到4×3列联表,如下表所示。

试对?

?

=0.05,检验B与C是否独立。

300名高中学生体育锻炼的考察结果

1500米

长跑记录

锻炼时间

合计

2小时以上

1?

2小时

1小时以下

5"01'?

5"30'

45

12

10

67

5"31'?

6"00'

46

20

28

94

6"01'?

6"30'

28

23

30

81

6"31'?

7"00'

11

12

35

58

合计

130

67

103

300

解:

提出假设:

H0:

B与C独立。

H1:

B与C不独立。

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(45,46,28,11,12,20,23,12,10,28,30,35)

>dim(x)<-c(4,3)

>chisq.test(x)

Pearson'sChi-squaredtest

data:

x

X-squared=40.401,df=6,p-value=3.799e-07

结论:

P=3.799e-07<0.05,拒绝原假设,B与C不独立,有关系。

4.(习题5.13)为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,其结果如下表所示。

试进行分析。

两种工艺下产品质量的抽查结果

合格

不合格

合计

工艺一

3

4

7

工艺二

6

4

10

合计

9

8

17

解:

提出假设:

H0:

两种工艺对产品的质量没影响

H1:

两种工艺对产品的质量有影响

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(3,6,4,4)

>dim(x)<-c(2,2)

>fisher.test(x)

Fisher'sExactTestforCountData

data:

x

p-value=0.6372

alternativehypothesis:

trueoddsratioisnotequalto1

95percentconfidenceinterval:

sampleestimates:

oddsratio

0.521271

结论:

P=0.6372>0.05,接受原假设,两种工艺对产品的质量没影响

5.(习题5.14)应用核素法和对比法检测147例冠心病患者心脏收缩运动的符合情况,其结果如下表所示。

试分析这两种方法测定结果是否相同。

两法检查室壁收缩运动的符合情况

对比法

核素法

合计

正常

减弱

异常

正常

58

2

3

63

减弱

1

42

7

50

异常

8

9

17

34

合计

67

53

27

147

解:

提出假设:

H0:

这两种方法测定结果不相同

H1:

这两种方法测定结果相同

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(58,1,8,2,42,9,3,7,17)

>dim(x)<-c(3,3)

>mcnemar.test(x)

McNemar'sChi-squaredtest

data:

x

McNemar'schi-squared=2.8561,df=3,p-value=0.4144

结论:

P=0.4144>0.05,因此,不能认为这两种方法测定结果不相同

6.(习题5.15)在某养鱼塘中,根据过去经验,鱼的长度的中位数为14.6cm,现对鱼塘中鱼的长度进行一次估测,随机地从鱼塘中取出10条鱼长度如下:

13.3213.0614.0211.8613.5813.7713.5114.4214.4415.43

将它们作为一个样本进行检验。

试分析,该鱼塘中鱼的长度是在中位数之上,还是在中位数之下。

(1)用符号检验分析;

(2)用Wilcoxon符号秩检验分析。

解:

(1)用符号检验分析

提出假设:

H0:

M>=14.6

H1:

M<14.6

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(13.32,13.06,14.02,11.86,13.58,13.77,13.51,14.42,14.44,15.43)

>binom.test(sum(x>14.6),length(x),al="l")

Exactbinomialtest

data:

sum(x>14.6)andlength(x)

numberofsuccesses=1,numberoftrials=10,p-value=0.01074

alternativehypothesis:

trueprobabilityofsuccessislessthan0.5

95percentconfidenceinterval:

0.00000000.3941633

sampleestimates:

probabilityofsuccess

0.1

(2)用Wilcoxon符号秩检验分析

提出假设:

H0:

M>=14.6

H1:

M<14.6

源代码及运行结果:

(复制到此处,不需要截图)

x<-c(13.32,13.06,14.02,11.86,13.58,13.77,13.51,14.42,14.44,15.43)

>wilcox.test(x,mu=14.6,al="l",exact=F)

Wilcoxonsignedranktestwithcontinuitycorrection

data:

x

V=4.5,p-value=0.01087

alternativehypothesis:

truelocationislessthan14.6

结论:

两种方法的P都是小于0.05,拒绝原假设,中位数小于14.6

7.(习题5.16)用两种不同的测定方法,测定同一种中草药的有效成分,共重复20次,得到实验结果如下表所示。

两种不同的测定方法得到的结果

方法

48.0

33.0

37.5

48.0

42.5

40.0

42.0

36.0

11.3

22.0

A

36.0

27.3

14.2

32.1

52.0

38.0

17.3

20.0

21.0

46.1

方法

37.0

41.0

23.4

17.0

31.5

40.0

31.0

36.0

5.7

11.5

B

21.0

6.1

26.5

21.3

44.5

28.0

22.6

20.0

11.0

22.3

(1)试用符号检验法来测定有无显着性差异;

(2)试用Wilcoxon符号秩检验法检验两测定有无显着差异;

(3)试用Wilcoxon秩和检验法检验两测定有无显着差异;

(4)对数据作正态性和方差齐性检验,该数据是否能作t检验,如果能,请作t检验;

(5)分析各种的检验方法,试说明哪种检验法效果最好。

解:

(1)符号检验法

提出假设:

H0:

两测定无显着差异

H1:

两测定有显着差异

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>binom.test(sum(x>y),length(x))

Exactbinomialtest

data:

sum(x>y)andlength(x)

numberofsuccesses=14,numberoftrials=20,p-value=0.1153

alternativehypothesis:

trueprobabilityofsuccessisnotequalto0.5

95percentconfidenceinterval:

0.45721080.8810684

sampleestimates:

probabilityofsuccess

0.7

结论:

P=0.1153>0.05,接受原假设,两测定无显着差异

(2)Wilcoxon符号秩检验法

提出假设:

H0:

两测定无显着差异

H1:

两测定有显着差异

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>wilcox.test(x,y,paired=T,exact=F)

Wilcoxonsignedranktestwithcontinuitycorrection

data:

xandy

V=136,p-value=0.005191

alternativehypothesis:

truelocationshiftisnotequalto0

结论:

P=0.005191<0.05,拒绝原假设,两测定有显着差异

(3)Wilcoxon秩和检验法

提出假设:

H0:

两测定无显着差异

H1:

两测定有显着差异

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>wilcox.test(x,y,exact=F)

Wilcoxonranksumtestwithcontinuitycorrection

data:

xandy

W=274.5,p-value=0.04524

alternativehypothesis:

truelocationshiftisnotequalto0

结论:

P=0.04524<0.05,拒绝原假设,两测定有显着差异

(4)两独立样本t检验,要求判断独立性、正态性和方差齐性

①正态性检验

提出假设:

H0:

两组数据服从正态分布

H1:

两组数据不服从正态分布

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>ks.test(x,pnorm,mean(x),sd(x))

One-sampleKolmogorov-Smirnovtest

data:

x

D=0.14067,p-value=0.8235

alternativehypothesis:

two-sided

Warningmessage:

Inks.test(x,pnorm,mean(x),sd(x)):

Kolmogorov-Smirnov检验里不应该有连结

>ks.test(y,pnorm,mean(y),sd(y))

One-sampleKolmogorov-Smirnovtest

data:

y

D=0.10142,p-value=0.973

alternativehypothesis:

two-sided

结论:

两组数据P值都大于0.05,接受原假设,两组数据服从正态分布

②方差齐性检验

提出假设:

H0:

两组数据方差相同

H1:

两组数据方差不相同

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>var.test(x,y)

Ftesttocomparetwovariances

data:

xandy

F=1.1406,numdf=19,denomdf=19,p-value=0.7772

alternativehypothesis:

trueratioofvariancesisnotequalto1

95percentconfidenceinterval:

0.45147882.8817689

sampleestimates:

ratioofvariances

1.140639

结论:

P=0.7772>0.05,接受原假设,两组数据方差相同

③能否作t检验?

如果能,请按照前面各题的格式、内容写出作t检验的过程

综上,能作t检验

提出假设:

H0:

两测定无显着差异

H1:

两测定有显着差异

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)

>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0,11.0,22.3)

>t.test(x,y,var.equal=T)

TwoSamplet-test

data:

xandy

t=2.2428,df=38,p-value=0.03082

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

0.812552915.8774471

sampleestimates:

meanofxmeanofy

33.21524.870

结论:

P=0.03082<0.05,拒绝原假设,两测定有显着差异

(5)分析各种的检验方法,试说明哪种检验法效果最好。

结论:

综上所述,Wilcoxon秩和检验法的差异性检出能力最强,符号检验的差异性检出最弱。

8.(习题5.17)调查某大学学生每周学习时间与得分的平均等级之间的关系,现抽查10个学生的资料如下:

学习时间

24

17

20

41

52

23

46

18

15

29

学习等级

8

1

4

7

9

5

10

3

2

6

其中等级10表示最好,1表示最差。

试用秩相关检验(Spearman检验和Kendall检验)分别分析学习等级与学习成绩有无关系。

解:

(1)用Spearman秩检验方法

提出假设:

H0:

学习等级与学习成绩无关系

H1:

学习等级与学习成绩有关系

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(24,17,20,41,52,23,46,18,15,29)

>y<-c(8,1,4,7,9,5,10,3,2,6)

>cor.test(x,y,method="spearman",exact=F)

Spearman'srankcorrelationrho

data:

xandy

S=10,p-value=5.484e-05

alternativehypothesis:

truerhoisnotequalto0

sampleestimates:

rho

0.9393939

结论:

P=5.484e-05<0.05,拒绝原假设,学习等级与学习成绩有关系

(2)用Kendall秩检验方法

源代码及运行结果:

(复制到此处,不需要截图)

>x<-c(24,17,20,41,52,23,46,18,15,29)

>y<-c(8,1,4,7,9,5,10,3,2,6)

>cor.test(x,y,method="kendall",exact=F)

Kendall'srankcorrelationtau

data:

xandy

z=3.3094,p-value=0.000935

alternativehypothesis:

truetauisnotequalto0

sampleestimates:

tau

0.8222222

结论:

P=0.000935<0.05,拒绝原假设,学习等级与学习成绩有关系

9.(习题5.18)为比较一种新疗法对某种疾病的治疗效果,将40名患者随机地分为两组,每组20人,一组采用新疗法,另一组用原标准疗法。

经过一段时间的治疗后,对每个患者的疗效作仔细的评估,并划分为差、较差、一般、较好和好5个等级。

两组处于不同等级的患者人数下表所示。

试分析,由此结果能否认为新方法的疗效显着地优于原疗法。

(?

=0.05)

不同方法治疗后的结果

等级

较差

一般

较好

新疗法组

0

1

9

7

3

原疗法组

2

2

11

4

1

解:

提出假设:

H0:

新方法的疗效不显着地优于原疗法

H1:

新方法的疗效显着地优于原疗法

源代码及运行结果:

(复制到此处,不需要截图)

>x<-rep(1:

5,c(0,1,9,7,3))

>y<-rep(1:

5,c(2,2,11,4,1))

>wilcox.test(x,y,exact=F)

Wilcoxonranksumtestwithcontinuitycorrection

data:

xandy

W=266,p-value=0.05509

alternativehypothesis:

truelocationshiftisnotequalto0

结论:

P=0.05509>0.05,接受原假设,即认为新方法的疗效不显着地优于原疗法

思考:

1.?

2检验针对的哪一类型的数据?

A.连续型变量;B.无序分类变量;C.有序分类变量

B.无序分类变量

2.符号检验、Wilcoxon符号秩检验和Wilcoxon秩和检验针对的哪一类型的数据?

A.连续型变量;B.无序分类变量;C.有序分类变量

C.有序分类变量

3.顺序统计量与秩统计量是一样的吗?

在R语言中分别利用什么函数可以求得?

秩统计计量是按顺序排列还是按降序排列?

不一样。

顺序统计量是将样本观测值从小到大排顺序。

在R中,可以由sort()函数求出一个顺序统计量。

而秩统计量是在非参数检验中广泛运用的统计量,它的一个重要的特性是分布无关性。

其样本不必取自同一总体。

在R中,可以由rank()函数求出一个秩统计量。

秩统计计量是按顺序排列的。

4.非参数检验中在检验一个样本是否来自某个总体,或者检验两个总体是否有显着性差异时,为什么不能用均值这个统计量,而是用中位数这个统计量?

由于不再涉及到分布类型,因此不能使用均值这一与总体分布有关的参数加以检验。

所以,改用另一个同样描述集中趋势的统计量中位数M来代替均值U。

5.为什么符号秩检验的功效比符号检验好?

(P239)

因为符号检验利用了观测值跟原假设的中心位置之差的符号来进行检验,但是它只计算符号的个数,而不考虑每个符号差中所包含的绝对值的大小,而符号秩检验还利用了绝对值的大小,考虑了绝对值距中心位置的远近,自然比仅仅利用符号更有效。

6.符号检验和Wilcoxon符号秩检验都可以用于单个样本的检验,来判断一个样本是否来自某个总体;也可以用于两配对(成对)样本的检验,来判断两个相关总体是否存在显着性差异。

Wilcoxon秩和检验主要是用于哪类问题的检验?

两个配对样本的检验、两个独立样本的检验。

7.参数检验中的均值检验,两配对样本t检验可以转化为单样本t检验,即检验两个样本的差值序列的均值是否为0。

非参数检验中的中位数检验,两个

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1