r语言与统计分析 第五章课后答案.docx
《r语言与统计分析 第五章课后答案.docx》由会员分享,可在线阅读,更多相关《r语言与统计分析 第五章课后答案.docx(9页珍藏版)》请在冰豆网上搜索。
r语言与统计分析第五章课后答案
第五章
5.1设总体x是用无线电测距仪测量距离的误差,它服从(α,β)上的均匀分布,在200次测量中,误差为xi的次数有ni次:
Xi:
3579111315171921
Ni:
21161526221421221825
求α,β的矩法估计值
α=u-
s
β=u+
s
程序代码:
x=seq(3,21,by=2)
y=c(21,16,15,26,22,14,21,22,18,25)
u=rep(x,y)
u1=mean(u)
s=var(u)
s1=sqrt(s)
a=u1-sqrt(3)*s1
b=u1+sqrt(3)*s1b=u1+sqrt(3)*s1
得出结果:
a=2.217379
b=22.40262
5.2为检验某自来水消毒设备的效果,现从消毒后的水中随机抽取50L,化验每升水中大肠杆菌的个数(假设1L水中大肠杆菌的个数服从泊松分布),其化验结果如下表所示:
试问平均每升水中大肠杆菌个数为多少时,才能使上述情况的概率达到最大
大肠杆菌数/L:
0123456
水的升数:
1720102100
γ=u是最大似然估计
程序代码:
a=seq(0,6,by=1)
b=c(17,20,10,2,1,0,0)
c=a*b
d=mean(c)
得出结果:
d=7.142857
5.3已知某种木材的横纹抗压力服从正态分布,现对十个试件做横纹抗压力试验,得数据如下:
482493457471510446435418394469
(1)求u的置信水平为0.95的置信区间
程序代码:
x=c(482493457471510446435418394469)
t.test(x)
得出结果:
data:
x
t=6.2668,df=9,p-value=0.0001467
alternativehypothesis:
truemeanisnotequalto0
95percentconfidenceinterval:
7.66829916.331701
sampleestimates:
meanofx
12
由答案可得:
u的置信水平为0.95的置信区间[7.66829916.331701]
(2)求σ的置信水平为0.90的置信区间
程序代码:
chisq.var.test<-function(x,var,alpha,alternative="two.sided"){
options(digits=4)
result<-list()
n<-length(x)
v<-var(x)
result$var<-v
chi2<-(n-1)*v/var
result$chi2<-chi2
p<-pchisq(chi2,n-1)
result$p.value<-p
if(alternative=="less")
result$p.value<-pchaisq(chi2,n-1,loer.tail=F)
elseif(alternative=="two.sider")
result$p.value<-2*min(pchaisq(chi2,n-1),
pchaisq(chi2,n-1,lower.tail=F))
result$conf.int<-c(
(n-1)*v/qchisq(alpha/2,df=n-1,lower.tail=F),
(n-1)*v/qchisq(alpha/2,df=n-1,lower.tail=T))
result
}
x<-c(482,493,457,471,510,446,435,418,394,469)
y=var(x)
chisq.var.test(x,0.048^2,0.10,alternative="two.side")
得出结果:
$conf.int:
659.83357.0
由答案可得:
σ的置信水平为0.90的置信区间[659.83357.0]
5.4某卷烟厂生产两种卷烟A和B现分别对两种香烟的尼古丁含量进行6次试验,结果如下:
A:
252823262922
B:
282330352127
若香烟的尼古丁含量服从正态分布
(1)问两种卷烟中尼古丁含量的方差是否相等(通过区间估计考察)
(2)试求两种香烟的尼古丁平均含量差的95%置信区间
(1)
程序代码:
X=c(25,28,23,26,29,22)
Y=c(28,23,30,35,21,27)
Var.test(x,y)
得出结果:
Ftesttocomparetwovariances
data:
xandy
F=0.2992,numdf=5,denomdf=5,p-value=0.2115
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
0.041872.13821
sampleestimates:
ratioofvariances
0.2992
由答案可得:
其方差不相等,方差区间为[0.041872.13821]
(2)
5.5比较两个小麦品种的产量,选择24块条件相似地实验条,采用相同的耕作方法做实验,结果播种甲品种的12块实验田的单位面积产量和播种乙品种的12块试验田的单位面积产量分别为:
A:
628583510554612523530615573603334564
B:
535433398470567480498560503426338547
假定每个品种的单位面积产量服从正态分布,甲品种产量的方差为2140,乙品种产量的方差为3250,试求这两个品种平均面积产量差的置信水平为0.95的置信上限和置信水平为0.90的置信下限。
程序代码:
two.sample.ci=function(x,y,conf.level=0.95,sigma1.sigma2)
{options(digits=4)
m=length(x);n=length(y)
xbar=mean(x)-mean(y)
alpha=1-conf.level
zstar=qnorm(1-alpha/2)*(sigma1/m+sigma2/n)^(1/2)
xbar+c(-zstar,+zstar)
}
x=c(628,583,510,554,612,523,530,615,573,603,334,564)
y=c(535,433,398,470,567,480,498,560,503,426,338,547)
sigma1=2140
sigma2=3250
two.sample.ci(x,y,conf.level=0.95,sigma1.sigma2)
得到结果:
31.29114.37
程序代码:
two.sample.ci=function(x,y,conf.level=0.95,sigma1.sigma2)
{options(digits=4)
m=length(x);n=length(y)
xbar=mean(x)-mean(y)
alpha=1-conf.level
zstar=qnorm(1-alpha/2)*(sigma1/m+sigma2/n)^(1/2)
xbar+c(-zstar,+zstar)
}
x=c(628,583,510,554,612,523,530,615,573,603,334,564)
y=c(535,433,398,470,567,480,498,560,503,426,338,547)
sigma1=2140
sigma2=3250
two.sample.ci(x,y,conf.level=0.90,sigma1.sigma2)
得到结果:
37.97107.69
5.6有两台机床生产同一型号的滚珠,根据以往经验知,这两台机床生产的滚珠直径都服从正态分布,现分别从这两台机床生产的滚珠中随机地抽取7个和9个,测得它们的直径如下:
机床甲:
15.214.515.514.815.115.614.7
机床乙:
15.215.014.815.21514.915.114.815.3
试问机床乙生产的滚珠的方差是否比机床甲生产的滚珠直径的方差小?
程序代码:
x=c(5.2,14.5,15.5,14.8,15.1,15.6,14.7)
y=c(15.2,15.0,14.8,15.2,15,14.9,15.1,14.8,15.3)
var.test(x,y)
得出结果:
Ftesttocomparetwovariances
data:
xandy
F=430.1,numdf=6,denomdf=8,p-value=2.723e-09
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
92.472408.54
sampleestimates:
ratioofvariances
430.1
由结果可得:
其甲机床的滚珠半径远超出乙机床的滚珠半径
5.7某公司对本公司生产的两种自行车型号A,B的销售情况进行了了解,随机选取了400人询问他们对AB的选择,其中有224人喜欢A,试求顾客中喜欢A的人数比例p的置信水平为0.99的区间估计。
方程代码:
Binom.test(224,400,conf.level=0.99)
得出结果:
Exactbinomialtest
data:
224and400
numberofsuccesses=224,numberoftrials=400,p-value=0.01866
alternativehypothesis:
trueprobabilityofsuccessisnotequalto0.5
99percentconfidenceinterval:
0.49440770.6241356
sampleestimates:
probabilityofsuccess
0.56
由结果可得:
顾客中喜欢a的人数比例p的置信水平为0.99的区间估计:
[0.49440770.6241356]
5.8某公司生产了一批新产品,产品总体服从正态分布,现估计这批产品的平均重量,最大允许误差为1,样本标准差s=10,试问在0.95的置信水平下至少要抽取多少个产品
程序代码:
Size,norm2=function(s,alpha,d,m)
{t0=qt(alpha/2,m,lower.tail=FALSE)
n0=(t0*s/d)^2
t1=qt(alpha/2,n0,lower.tail=FALSE)
n1=(t1*s/d)^2
while(abs(n1-n0)>0.5){
n0=(qt(alpha/2,n1,lower.tail=FALSE)*s/d)^2
n1=(qt(alpha/2,n0,lower.tail=FALSE)*s/d)^2
}
n1
}
Size.norm2(10,0.01,2,100)
得出结果:
98.44268
由结果可得,在0.95的置信水平下至少要抽取99个产品
5.9根据以往的经验,船运大量玻璃器皿,损坏率不超过5%,现要估计某船中玻璃器皿的损坏率,要求估计与真值间不超过1%,且置信水平为0.90,那么要抽取多少样本验收可满足上诉要求
程序代码:
size.bin=function(d,p,conf.level){
alpha=1-conf.level
((qnorm(1-alpha/2))/d)^2*p*(1-p)
}
size.bin(0.01,0.05,0.90)
得出结果:
1285.133
由结果可得:
要抽取1285个样本验收可满足上诉要求