R语言实验七.docx

资源描述

R语言实验七.docx

《R语言实验七.docx》由会员分享，可在线阅读，更多相关《R语言实验七.docx（19页珍藏版）》请在冰豆网上搜索。

R语言实验七.docx

R语言实验七

实验7假设检验

（一）

一、实验目的：

1.掌握重要的参数检验方法（单个总体的均值检验，两个总体的均值检验，成对样本的均值的检验，两个总体方差的检验，二项分布总体的检验）；

2.掌握若干重要的非参数检验方法（Pearson拟合优度c2检验，Kolmogorov-Smirnov单样本和双样本检验）。

二、实验内容：

练习：

要求：

①完成练习并粘贴运行截图到文档相应位置（截图方法见下），并将所有自己输入文字的字体颜色设为红色（包括后面的思考及小结），②回答思考题，③简要书写实验小结。

④修改本文档名为“本人完整学号姓名1”，其中1表示第1次实验，以后更改为2,3,...。

如文件名为“1305543109张立1”，表示学号为1305543109的张立同学的第1次实验，注意文件名中没有空格及任何其它字符。

最后连同数据文件、源程序文件等（如果有的话，本次实验没有），一起压缩打包发给课代表，压缩包的文件名同上。

截图方法：

法1：

调整需要截图的窗口至合适的大小，并使该窗口为当前激活窗口（即该窗口在屏幕最前方），按住键盘Alt键（空格键两侧各有一个）不放，再按键盘右上角的截图键（通常印有“印屏幕”或“PrScrn”等字符），即完成截图。

再粘贴到word文档的相应位置即可。

法2：

利用QQ输入法的截屏工具。

点击QQ输入法工具条最右边的“扳手”图标

，选择其中的“截屏”工具。

）

1.自行完成教材第五章的例题。

2.（习题5.1）正常男子血小板计数均值为225×109/L,今测得20名男性油漆作业工人的血小板计数值（单位：

109/L）

220188162230145160238188247113

126245164231256183190158224175

问油漆工人的血小板计数与正常成年男子有无差异？

解：

提出假设：

H0：

油漆工人的血小板计数与正常成年男子无差异

H1：

油漆工人的血小板计数与正常成年男子有差异

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（220,188,162,230,145,160,238,188,247,113,126,245,164,231,256,183,190,158,224,175）

>t.test（x,mu=225）

结论：

OneSamplet-test

data:

t=-3.4783,df=19,p-value=0.002516

alternativehypothesis:

truemeanisnotequalto225

95percentconfidenceinterval:

172.3827211.9173

sampleestimates:

meanofx

192.15

P=0.002516<0.05,拒绝原假设，认为油漆工人的血小板计数与正常成年男子有差异

3.（习题5.2）已知某种灯泡寿命服从正态分布，在某星期所生产的该灯泡中随机抽取10只，测得其寿命（单位：

小时）为

1067919119678511269369181156920948

求这个星期生产出的灯泡能使用1000小时以上的概率。

解：

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（1067,919,1196,785,1126,936,918,1156,920,948）

>p<-pnorm（1000,mean（x）,sd（x））

>1-p

[1]0.4912059

结论：

这个星期生产出的灯泡能使用1000小时以上的概率为0.4912059

4.（习题5.3）为研究某铁剂治疗和饮食治疗營养性缺铁性贫血的效果，将16名患者按年龄、体重、病程和病情相近的原则配成8对，分别使用饮食疗法和补充铁剂治疗的方法，3个月后测得两种患者血红资白如下表所示，问两种方法治疗后的患者血红蛋白有无差异？

铁剂和饮食两种方法治疗后患者血红蛋白值（g/L）

铁剂治疗组

113

120

138

120

100

118

138

123

饮食治疗组

138

116

125

136

110

132

130

110

解：

提出假设：

H0：

两种方法治疗后的患者血红蛋白无差异

H1：

两种方法治疗后的患者血红蛋白有差异

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（113,120,138,120,100,118,138,123）

>y<-c（138,116,125,136,110,132,130,110）

>t.test（x,y,paired=T）

Pairedt-test

data:

xandy

t=-0.65127,df=7,p-value=0.5357

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-15.6288918.878891

sampleestimates:

meanofthedifferences

-3.375

结论：

p=0.5357>0.05,不拒绝原假设，两种方法治疗后的患者血红蛋白无差异

5.（习题5.4）为研究国产四类新药阿卡波糖股嚢效果，某医院用40名Ⅱ型糖尿病病人进行同期随机对照实验。

试验者将这些病人随机等分到试验组（阿卡波糖股嚢组）和对照组（拜唐苹股嚢组），分别测得试验开始前和8周后空腹血糖，算得空腹血糖下降值，如下所示。

能否认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同？

试验组与对照组空腹腔血糖下降值（mmol/L）

试验组

-0.70

-5.60

2.00

2.80

0.70

3.50

4.00

5.80

7.10

-0.50

（n1=20）

2.50

-1.60

1.70

3.00

0.40

4.50

4.60

2.50

6.00

-1.40

对照组

3.70

6.50

5.00

5.20

0.80

0.20

0.60

3.40

6.60

-1.10

（n2=20）

6.00

3.80

2.00

1.60

2.00

2.20

1.20

3.10

1.70

-2.00

（1）检验试验组和对照组的的数据是否来自正态分布，采用正态性W检验方法（见第3章）、Kolmogorov-Smirnov检验方法和Pearson拟合优度c2检验；

解：

提出假设：

H0：

认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同

H1：

认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果相同

①正态性W检验方法

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4）

>shapiro.test（x）

Shapiro-Wilknormalitytest

data:

W=0.9699,p-value=0.7527

>y<-c（3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00）

>shapiro.test（y）

Shapiro-Wilknormalitytest

data:

W=0.97098,p-value=0.7754

结论：

试验组p=0.7527>0.05,对照组p=0.7754>0.05,所以检验试验组和对照组的的数据是来自正态分布

②Kolmogorov-Smirnov检验方法

源代码及运行结果：

（复制到此处，不需要截图）

>ks.test（x,"pnorm",mean（x）,sd（x））

One-sampleKolmogorov-Smirnovtest

data:

D=0.10652,p-value=0.9771

alternativehypothesis:

two-sided

Warningmessage:

Inks.test（x,"pnorm",mean（x）,sd（x））:

Kolmogorov-Smirnov检验里不应该有连结

>ks.test（y,"pnorm",mean（y）,sd（y））

One-sampleKolmogorov-Smirnovtest

data:

D=0.11969,p-value=0.9368

alternativehypothesis:

two-sided

Warningmessage:

Inks.test（y,"pnorm",mean（y）,sd（y））:

Kolmogorov-Smirnov检验里不应该有连结

结论：

试验组p=0.9771>0.05,对照组p=0.9368>0.05,所以检验试验组和对照组的的数据是来自正态分布

③Pearson拟合优度c2检验

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4）

>A<-table（cut（x,br=c（-6,-3,0,3,6,9）））

>p<-pnorm（c（-3,0,3,6,9）,mean（x）,sd（x））

[1]0.048947120.249900090.620022880.900758560.98828138

>p<-c（p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4]）

[1]0.048947120.200952980.370122780.280735680.09924144

>chisq.test（A,p=p）

Chi-squaredtestforgivenprobabilities

data:

X-squared=0.56387,df=4,p-value=0.967

Warningmessage:

Inchisq.test（A,p=p）:

Chi-squared近似算法有可能不准

>y<-c（3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00）

>B<-table（cut（y,br=c（-2,1,2,4,7）））

>p<-pnorm（c（-2,1,2,4,7）,mean（y）,sd（y））

[1]0.028017520.250999070.398121950.715004470.96465615

>p<-c（p[1],p[2]-p[1],p[3]-p[2],1-p[3]）

[1]0.028017520.222981540.147122890.60187805

>chisq.test（B,p=p）

Chi-squaredtestforgivenprobabilities

data:

X-squared=28.087,df=3,p-value=3.483e-06

Warningmessage:

Inchisq.test（B,p=p）:

Chi-squared近似算法有可能不准

结论：

试验组的p=0.967>0.05,对照组的p=3.483e-06>0.05,因此试验组和对照组都服从正态分布

（2）用t检验两组数据均值是否有差异，分别用方差相同模型、方差不同模型和成对t检验模型；

解：

提出假设：

H0：

两组数据均值没有差异

H1：

两组数据均值是有差异

①方差相同模型

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4）

>y<-c（3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00）

>t.test（x,y,var.equal=TRUE）

TwoSamplet-test

data:

xandy

t=-0.64187,df=38,p-value=0.5248

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-2.3261791.206179

sampleestimates:

meanofxmeanofy

2.0652.625

结论：

p=0.5248>0.05,不拒绝原假设，两组数据均值没有差异

②方差不同模型

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4）

>y<-c（3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00）

>t.test（x,y）

WelchTwoSamplet-test

data:

xandy

t=-0.64187,df=36.086,p-value=0.525

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-2.329261.20926

sampleestimates:

meanofxmeanofy

2.0652.625

结论：

p=0.525>0.05,不拒绝原假设，两组数据均值没有差异

③成对t检验模型

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4）

>y<-c（3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00）

>t.test（x,y,paired=T）

Pairedt-test

data:

xandy

t=-0.64644,df=19,p-value=0.5257

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-2.3731461.253146

sampleestimates:

meanofthedifferences

-0.56

结论：

p=0.5257>0.05,不拒绝原假设，两组数据均值没有差异

（3）检验试验组与对照组的方差是否相同。

解：

提出假设：

H0：

试验组与对照组的方差相同

H1：

试验组与对照组的方差不相同

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.4）

>y<-c（3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00）

>var.test（x,y）

Ftesttocomparetwovariances

data:

xandy

F=1.5984,numdf=19,denomdf=19,p-value=0.3153

alternativehypothesis:

trueratioofvariancesisnotequalto1

95percentconfidenceinterval:

0.63265054.0381795

sampleestimates:

ratioofvariances

1.598361

结论：

p=0.3153>0.05,不拒绝原假设，试验组与对照组的方差相同

6.（习题5.5）为研究某种新药对抗凝血酶活力的影响，随机安排新药组病人12例，对照组病人10例，分别测定其抗凝血酶活力（单位：

mm3），其结果如下：

新药组：

126125136128123138142116110108115140

对照组：

162172177170175152157159160162

试分析新药组和对照组病人的抗凝血酶活力有无差别（=0.05）。

（1）检验两组数据是否服从正态分布；

（2）检验两组样本方差是否相同；

（3）选择最合适的检验方法检验新药组和对照组病人的抗凝血酶活力有无差别。

解：

（1）检验两组数据是否服从正态分布

①新药组数据

提出假设：

H0：

新药组数据服从正态分布

H1：

新药组数据不服从正态分布

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（126,125,136,128,123,138,142,116,110,108,115,140）

>ks.test（x,"pnorm",mean（x）,sd（x））

One-sampleKolmogorov-Smirnovtest

data:

D=0.14644,p-value=0.9266

alternativehypothesis:

two-sided

②对照组数据

提出假设：

H0：

对照组数据服从正态分布

H1：

对照组数据不服从正态分布

源代码及运行结果：

（复制到此处，不需要截图）

>y<-c（162,172,177,170,175,152,157,159,160,162）

>ks.test（y,"pnorm",mean（y）,sd（y））

One-sampleKolmogorov-Smirnovtest

data:

D=0.22216,p-value=0.707

alternativehypothesis:

two-sided

Warningmessage:

Inks.test（y,"pnorm",mean（y）,sd（y））:

Kolmogorov-Smirnov检验里不应该有连结

（2）检验两组样本方差是否相同；

提出假设：

H0：

两组样本方差相同

H1：

两组样本方差不相同

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（126,125,136,128,123,138,142,116,110,108,115,140）

>y<-c（162,172,177,170,175,152,157,159,160,162）

>var.test（x,y）

Ftesttocomparetwovariances

data:

xandy

F=1.9646,numdf=11,denomdf=9,p-value=0.32

alternativehypothesis:

trueratioofvariancesisnotequalto1

95percentconfidenceinterval:

0.50219437.0488630

sampleestimates:

ratioofvariances

1.964622

（3）选择最合适的检验方法检验新药组和对照组病人的抗凝血酶活力有无差别。

提出假设：

H0：

新药组和对照组病人的抗凝血酶活力无差别

H1：

新药组和对照组病人的抗凝血酶活力有差别

源代码及运行结果：

（复制到此处，不需要截图）

>x<-c（126,125,136,128,123,138,142,116,110,108,115,140）

>y<-c（162,172,177,170,175,152,157,159,160,162）

>t.test（x,y,var.equal=TRUE）

TwoSamplet-test

data:

xandy

t=-8.8148,df=20,p-value=2.524e-08

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-48.24975-29.78358

sampleestimates:

meanofxmeanofy

125.5833164.6000

结论：

p=2.524e-08<0.05,拒绝原假设，新药组和对照组病人的抗凝血酶活力有差别

7.（习题5.6）—项调查显示某城市老年人口比重为14.7%。

该市老年研究协会为了检验该项调查是否可靠，随机抽选了400名居民，发现其中有57人是老年人。

问调查结果是否支持该市老年人口比重为14.7%的看法（=0.05）。

（提示，此题是二项分布总体的检验）

解：

提出假设：

H0：

p=p0=0.147

H1：

p≠p0

源代码及运行结果：

（复制到此处，不需要截图）

>bi

展开阅读全文

R语言 实验七.docx

R语言实验七.docx