R语言实验七.docx
《R语言实验七.docx》由会员分享,可在线阅读,更多相关《R语言实验七.docx(15页珍藏版)》请在冰豆网上搜索。
![R语言实验七.docx](https://file1.bdocx.com/fileroot1/2023-1/24/5db703a8-f0d6-4e55-a451-bd5571427703/5db703a8-f0d6-4e55-a451-bd55714277031.gif)
R语言实验七
集团标准化工作小组[Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]
R语言实验七
实验7假设检验
(一)
一、实验目的:
1.掌握重要的参数检验方法(单个总体的均值检验,两个总体的均值检验,成对样本的均值的检验,两个总体方差的检验,二项分布总体的检验);
2.掌握若干重要的非参数检验方法(Pearson拟合优度2检验,Kolmogorov-Smirnov单样本和双样本检验)。
二、实验内容:
练习:
要求:
①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。
④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。
如文件名为“09张立1”,表示学号为09的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。
最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。
截图方法:
法1:
调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“PrScrn”等字符),即完成截图。
再粘贴到word文档的相应位置即可。
法2:
利用QQ输入法的截屏工具。
点击QQ输入法工具条最右边的“扳手”图标
,选择其中的“截屏”工具。
)
1.自行完成教材第五章的例题。
2.(习题)正常男子血小板计数均值为225×109/L,今测得20名男性油漆作业工人的血小板计数值(单位:
109/L)
220188162230145160238188247113
126245164231256183190158224175
问油漆工人的血小板计数与正常成年男子有无差异
解:
提出假设:
H0:
油漆工人的血小板计数与正常成年男子无差异
H1:
油漆工人的血小板计数与正常成年男子有差异
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(220,188,162,230,145,160,238,188,247,113,126,245,164,231,256,183,190,158,224,175)
>(x,mu=225)
结论:
OneSamplet-test
data:
x
t=,df=19,p-value=
alternativehypothesis:
truemeanisnotequalto225
95percentconfidenceinterval:
sampleestimates:
meanofx
P=<,拒绝原假设,认为油漆工人的血小板计数与正常成年男子有差异
3.(习题)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10只,测得其寿命(单位:
小时)为
1067919119678511269369181156920948
求这个星期生产出的灯泡能使用1000小时以上的概率。
解:
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(1067,919,1196,785,1126,936,918,1156,920,948)
>p<-pnorm(1000,mean(x),sd(x))
>1-p
[1]
结论:
这个星期生产出的灯泡能使用1000小时以上的概率为
4.(习题)为研究某铁剂治疗和饮食治疗营养性缺铁性贫血的效果,将16名患者按年龄、体重、病程和病情相近的原则配成8对,分别使用饮食疗法和补充铁剂治疗的方法,3个月后测得两种患者血红资白如下表所示,问两种方法治疗后的患者血红蛋白有无差异
铁剂和饮食两种方法治疗后患者血红蛋白值(g/L)
铁剂治疗组
113
120
138
120
100
118
138
123
饮食治疗组
138
116
125
136
110
132
130
110
解:
提出假设:
H0:
两种方法治疗后的患者血红蛋白无差异
H1:
两种方法治疗后的患者血红蛋白有差异
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(113,120,138,120,100,118,138,123)
>y<-c(138,116,125,136,110,132,130,110)
>(x,y,paired=T)
Pairedt-test
data:
xandy
t=,df=7,p-value=
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
sampleestimates:
meanofthedifferences
结论:
p=>,不拒绝原假设,两种方法治疗后的患者血红蛋白无差异
5.(习题)为研究国产四类新药阿卡波糖股嚢效果,某医院用40名Ⅱ型糖尿病病人进行同期随机对照实验。
试验者将这些病人随机等分到试验组(阿卡波糖股嚢组)和对照组(拜唐苹股嚢组),分别测得试验开始前和8周后空腹血糖,算得空腹血糖下降值,如下所示。
能否认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同
试验组与对照组空腹腔血糖下降值(mmol/L)
试验组
(n1=20)
对照组
(n2=20)
(1)检验试验组和对照组的的数据是否来自正态分布,采用正态性W检验方法(见第3章)、Kolmogorov-Smirnov检验方法和Pearson拟合优度2检验;
解:
提出假设:
H0:
认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同
H1:
认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果相同
①正态性W检验方法
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c,,,,,,,,,,,,,,,,,,,
>(x)
Shapiro-Wilknormalitytest
data:
x
W=,p-value=
>y<-c,,,,,,,,,,,,,,,,,,,
>(y)
Shapiro-Wilknormalitytest
data:
y
W=,p-value=
结论:
试验组p=>,对照组p=>,所以检验试验组和对照组的的数据是来自正态分布
②Kolmogorov-Smirnov检验方法
源代码及运行结果:
(复制到此处,不需要截图)
>(x,"pnorm",mean(x),sd(x))
One-sampleKolmogorov-Smirnovtest
data:
x
D=,p-value=
alternativehypothesis:
two-sided
Warningmessage:
In(x,"pnorm",mean(x),sd(x)):
Kolmogorov-Smirnov检验里不应该有连结
>(y,"pnorm",mean(y),sd(y))
One-sampleKolmogorov-Smirnovtest
data:
y
D=,p-value=
alternativehypothesis:
two-sided
Warningmessage:
In(y,"pnorm",mean(y),sd(y)):
Kolmogorov-Smirnov检验里不应该有连结
结论:
试验组p=>,对照组p=>,所以检验试验组和对照组的的数据是来自正态分布
③Pearson拟合优度2检验
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c,,,,,,,,,,,,,,,,,,,
>A<-table(cut(x,br=c(-6,-3,0,3,6,9)))
>p<-pnorm(c(-3,0,3,6,9),mean(x),sd(x))
>p
[1]0.0.0.0.
>p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4])
>p
[1]0.0.0.
>(A,p=p)
Chi-squaredtestforgivenprobabilities
data:
A
X-squared=,df=4,p-value=
Warningmessage:
In(A,p=p):
Chi-squared近似算法有可能不准
>y<-c,,,,,,,,,,,,,,,,,,,
>B<-table(cut(y,br=c(-2,1,2,4,7)))
>p<-pnorm(c(-2,1,2,4,7),mean(y),sd(y))
>p
[1]0.0.0.0.
>p<-c(p[1],p[2]-p[1],p[3]-p[2],1-p[3])
>p
[1]0.0.0.
>(B,p=p)
Chi-squaredtestforgivenprobabilities
data:
B
X-squared=,df=3,p-value=
Warningmessage:
In(B,p=p):
Chi-squared近似算法有可能不准
结论:
试验组的p=>,对照组的p=>,因此试验组和对照组都服从正态分布
(2)用t检验两组数据均值是否有差异,分别用方差相同模型、方差不同模型和成对t检验模型;
解:
提出假设:
H0:
两组数据均值没有差异
H1:
两组数据均值是有差异
①方差相同模型
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c,,,,,,,,,,,,,,,,,,,
>y<-c,,,,,,,,,,,,,,,,,,,
>(x,y,=TRUE)
TwoSamplet-test
data:
xandy
t=,df=38,p-value=
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
sampleestimates:
meanofxmeanofy
结论:
p=>,不拒绝原假设,两组数据均值没有差异
②方差不同模型
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c,,,,,,,,,,,,,,,,,,,
>y<-c,,,,,,,,,,,,,,,,,,,
>(x,y)
WelchTwoSamplet-test
data:
xandy
t=,df=,p-value=
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
sampleestimates:
meanofxmeanofy
结论:
p=>,不拒绝原假设,两组数据均值没有差异
③成对t检验模型
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c,,,,,,,,,,,,,,,,,,,
>y<-c,,,,,,,,,,,,,,,,,,,
>(x,y,paired=T)
Pairedt-test
data:
xandy
t=,df=19,p-value=
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
sampleestimates:
meanofthedifferences
结论:
p=>,不拒绝原假设,两组数据均值没有差异
(3)检验试验组与对照组的方差是否相同。
解:
提出假设:
H0:
试验组与对照组的方差相同
H1:
试验组与对照组的方差不相同
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c,,,,,,,,,,,,,,,,,,,
>y<-c,,,,,,,,,,,,,,,,,,,
>(x,y)
Ftesttocomparetwovariances
data:
xandy
F=,numdf=19,denomdf=19,p-value=
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
sampleestimates:
ratioofvariances
结论:
p=>,不拒绝原假设,试验组与对照组的方差相同
6.(习题)为研究某种新药对抗凝血酶活力的影响,随机安排新药组病人12例,对照组病人10例,分别测定其抗凝血酶活力(单位:
mm3),其结果如下:
新药组:
126125136128123138142116110108115140
对照组:
162172177170175152157159160162
试分析新药组和对照组病人的抗凝血酶活力有无差别(=。
(1)检验两组数据是否服从正态分布;
(2)检验两组样本方差是否相同;
(3)选择最合适的检验方法检验新药组和对照组病人的抗凝血酶活力有无差别。
解:
(1)检验两组数据是否服从正态分布
①新药组数据
提出假设:
H0:
新药组数据服从正态分布
H1:
新药组数据不服从正态分布
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(126,125,136,128,123,138,142,116,110,108,115,140)
>(x,"pnorm",mean(x),sd(x))
One-sampleKolmogorov-Smirnovtest
data:
x
D=,p-value=
alternativehypothesis:
two-sided
②对照组数据
提出假设:
H0:
对照组数据服从正态分布
H1:
对照组数据不服从正态分布
源代码及运行结果:
(复制到此处,不需要截图)
>y<-c(162,172,177,170,175,152,157,159,160,162)
>(y,"pnorm",mean(y),sd(y))
One-sampleKolmogorov-Smirnovtest
data:
y
D=,p-value=
alternativehypothesis:
two-sided
Warningmessage:
In(y,"pnorm",mean(y),sd(y)):
Kolmogorov-Smirnov检验里不应该有连结
(2)检验两组样本方差是否相同;
提出假设:
H0:
两组样本方差相同
H1:
两组样本方差不相同
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(126,125,136,128,123,138,142,116,110,108,115,140)
>y<-c(162,172,177,170,175,152,157,159,160,162)
>(x,y)
Ftesttocomparetwovariances
data:
xandy
F=,numdf=11,denomdf=9,p-value=
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
sampleestimates:
ratioofvariances
(3)选择最合适的检验方法检验新药组和对照组病人的抗凝血酶活力有无差别。
提出假设:
H0:
新药组和对照组病人的抗凝血酶活力无差别
H1:
新药组和对照组病人的抗凝血酶活力有差别
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c(126,125,136,128,123,138,142,116,110,108,115,140)
>y<-c(162,172,177,170,175,152,157,159,160,162)
>(x,y,=TRUE)
TwoSamplet-test
data:
xandy
t=,df=20,p-value=
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
sampleestimates:
meanofxmeanofy
结论:
p=<,拒绝原假设,新药组和对照组病人的抗凝血酶活力有差别
7.(习题)—项调查显示某城市老年人口比重为%。
该市老年研究协会为了检验该项调查是否可靠,随机抽选了400名居民,发现其中有57人是老年人。
问调查结果是否支持该市老年人口比重为%的看法(=)。
(提示,此题是二项分布总体的检验)
解:
提出假设:
H0:
p=p0=
H1:
p≠p0
源代码及运行结果:
(复制到此处,不需要截图)
>(57,400,p=
Exactbinomialtest
data:
57and400
numberofsuccesses=57,numberoftrials=400,p-value=
alternativehypothesis:
trueprobabilityofsuccessisnotequalto
95percentconfidenceinterval:
sampleestimates:
probabilityofsuccess
结论:
P值=>,不拒绝原假设,调查结果支持该市老年人口比重为%的看法
8.(习题)作性别控制试验,经某种处理后,共有雏鸡328只,其中公雏150只,母雏178只,试问这种处理能否增加母雏的比例(性别比应为1:
1)。
解:
提出假设:
H0:
这种处理不能增加母雏的比例
H1:
这种处理能增加母雏的比例
源代码及运行结果:
(复制到此处,不需要截图)
>(178,328,p=,alternative="greater")
Exactbinomialtest
data:
178and328
numberofsuccesses=178,numberoftrials=328,p-value=
alternativehypothesis:
trueprobabilityofsuccessisgreaterthan
95percentconfidenceinterval:
sampleestimates:
probabilityofsuccess
结论:
P值=>,不拒绝原假设,这种处理不能增加母雏的比例
9.(习题)Mendel用豌豆的两对相对性状进行杂交实验,黄色圆滑种子与绿色皱缩种子的豌豆杂交后,第二代根据自由组合规律,理论分离比为
黄圆:
黄皱:
绿圆:
绿皱=(9/16):
(3/16):
(3/16):
(1/16)
实际实验值为:
黄圆315粒、黄皱101粒、绿圆108粒、绿皱32粒,共556粒。
问此结果是否符合自由组合规律的理论分离比
解:
提出假设:
H0:
符合自由组合规律的理论分离比
H1:
不符合自由组合规律的理论分离比
源代码及运行结果:
(复制到此处,不需要截图)
>(c(315,101,108,32),p=c(9,3,3,1)/16)
Chi-squaredtestforgivenprobabilities
data:
c(315,101,108,32)
X-squared=,df=3,p-value=
结论:
P值=>,接受原假设,符合自由组合规律的理论分离比
10.(习题)观察每分钟进入某商店的人数X,任取200分钟,所得数据如下:
顾客人数
0
1
2
3
4
5
频数
92
68
28
11
1
0
试分析,能否认为每分钟顾客数X服从Poisson分布(=)。
解:
提出假设:
H0:
能认为每分钟顾客数X服从Poisson分布
H1:
不能认为每分钟顾客数X服从Poisson分布
源代码及运行结果:
(复制到此处,不需要截图)
>X<-0:
5;Y<-c(92,68,28,11,1,0)
>q<-ppois(X,mean(rep(X,Y)));n<-length(Y)
>p<-numeric(n)
>p[1]<-q[1];p[n]=1-q[n-1]
>for(iin2:
(n-1))
+p[i]<-q[i]-q[i-1]
>(Y,p=p)
Chi-squaredtestforgivenprobabilities
data:
Y
X-squared=,df=5,p-value=
Warningmessage:
In(Y,p=p):
Chi-squared近似算法有可能不准
重新分组,合并频数小于5的组:
>Z<-c(92,68,28,12)
>n<-length(Z);p<-p[1:
n-1];p[n]=1-q[n-1]
>(Z,p=p)
Chi-squaredtestforgivenprobabilities
data:
Z
X-squared=,df=3,p-value=
结论:
p=>>,接受原假设,能认为每分钟顾客数X服从Poisson分布
11.(习题)观察得两样本值如下
顾客人数
频数
试分析,两样本是否来自同一总体(=)。
解:
提出假设:
H0:
两样本是来自同一总体
H1:
两样本不是来自同一总体
源代码及运行结果:
(复制到此处,不需要截图)
>x<-c,,,,,,,
>y<-c,,,,,
>(x,y)
Two-sampleKolmo