统计学第四章第十章课后练习答案贾俊平第四版.docx
《统计学第四章第十章课后练习答案贾俊平第四版.docx》由会员分享,可在线阅读,更多相关《统计学第四章第十章课后练习答案贾俊平第四版.docx(18页珍藏版)》请在冰豆网上搜索。
统计学第四章第十章课后练习答案贾俊平第四版
《统计学》第四版统计学》第四章练习题答案
4.1
(1)众数:
M0=10;中位数:
中位数位置=n+1/2=5.5,Me=10;平均数:
x=
∑x
n
i
=
96=9.610
2
(2)QL位置=n/4=2.5,QL=4+7/2=5.5;QU位置=3n/4=7.5,QU=12(3)s=
∑(xi?
x)
n?
1
=
156.4=4.29
(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2
(1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M0=19和M0=23。
将原始数据排序后,计算中位数的位置为:
中位数位置=n+1/2=13,第13个位置上的数值为23,所以中位数为Me=23
(2)QL位置=n/4=6.25,QL==19;QU位置=3n/4=18.75,QU=26.5
∑x(3)平均数x=
n
i
=600/25=24,标准差s=
∑(xi?
x)
n?
1
2
=
1062=6.6525?
1
(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:
从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3
(1)茎叶图如下:
茎567叶567813488频数135
2
∑x
(2)x=
n
i
=63/9=7,s=
∑(xi?
x)
n?
1
=
4.08=0.7148
(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:
v1=1.97/7.2=0.274;v2=0.714/7=0.102.由于v1>v2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4
(1)x=
∑x
n
i
=8223/30=274.1
中位数位置=n+1/2=15.5,Me=272+273/2=272.5
(2)QL位置=n/4=7.5,QL==(258+261)/2=259.5;QU位置=3n/4=22.5,QU=(284+291)/2=287.5)
(3)s=
∑(xi?
x)
n?
1
2
=
13002.7=21.1730?
1
2100+3000+15006600==19.41210030001500340++152030
4.5
(1)甲企业的平均成本=总成本/总产量=
乙企业的平均成本=总成本/总产量=
3255+1500+15006255==18.29325515001500342++152030
原因:
尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
4.6
(1)(计算过程中的表略),x=
∑Mf
i
i
n
=51200/120=426.67
s=
∑(Mi?
x)
n?
1
2
fi
=
1614666.7=116.48120?
1
SK=0.203K=-0.6884.7
(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。
(2)两位调查人员所得到身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。
4.8
(1)要比较男女学生体重的离散程度应该采用离散系数。
女生体重的离散系数为v女=5/50=0.1,男生体重的离散系数为v男=5/60=0.08,所以女生的体重差异大。
(2)男生:
x=60×2.2=132(磅),s=5×2.2=11(磅)女生:
x=50×2.2=110(磅),s=5×2.2=11(磅)(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。
因此,男生中大约有68%的人体重在55kg-65kg之间。
(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。
因此,男生中大约有95%的人体重在40kg-60kg之间。
4.9通过计算标准分数来判断:
x?
x115?
100zA=AsAA=15=1;
z
B
=
xB?
xB425?
400==1;sB50
该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准分数高于B项测试,所以,A项测试比较理想。
4.9通过标准分数来判断,各天的标准分数如下表:
日期标准分数Z周一3周二-0.6周三-0.2周四0.4周五-1.8周六周日-2.20
周一和周六两天失去了控制。
4.11
(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。
(2)成年组身高的离散系数:
vs=
4.2=0.024172.12.5=0.035幼儿组身高的离散系数:
vs=71.3
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
4.12
(1)应该从平均数和标准差两个方面进行评价。
在对各种方法的离散程度进行比较时,应该采用离散系数。
(2)下表给出了各种方法的主要描述统计量。
方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准差2.13标准差1.75标准差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值128从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。
从离散程度来看,三种方法的离散系数分别为:
vA=
2.13=0.013,165.6
vB=
1.752.77=0.014,vC==0.022。
方法A的离散程度最小,因此,应选择方128.73125.53
法A。
4.13
(1)用方差或标准差来评价投资的风险。
(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。
(3)从投资风险角度看,应该选择风险较小的商业类股票。
当然,选择哪类股票还与投资者的主观判断有很大关系。
第五章练习题答案
5.1
(1)平均分数是范围在0-100之间的连续变量,Ω=[0,100]
(2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N(3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13…….]5.2设订日报的集合为A,订晚报的集合为B,至少订一种报的集合为A∪B,同时订两种报的集合为A∩B。
P(A∩B)=P(A)+P(B)-P(A∪B)=0.5+0.65-0.85=0.35.3P(A∪B)=1/3,P(A∩B)=1/9,P(B)=P(A∪B)-P(A∩B)=2/95.4P(AB)=P(B)P(A∣B)=1/3*1/6=1/18P(A∪B)=P(AB)=1-P(AB)=17/18
P(B)=1-P(B)=2/3P(AB)=P(A)+P(B)-P(A∪B)=7/18P(A∣B)=P(AB)/P(B)=7/125.5设甲发芽为事件A,乙发芽为事件B。
(1)由于是两批种子,所以两个事件相互独立,所以有:
P(AB)=P(B)P(B)=0.56
(2)P(A∪B)=P(A)+P(B)-P(A∩B)=0.94(3)P(AB)+P(BA)=P(A)P(B)+P(B)P(A)=0.385.6设合格为事件A,合格品中一级品为事件BP(AB)=P(A)P(B∣A)=0.96*0.75=0.725.7设前5000小时未坏为事件A,后5000小时未坏为事件B。
P(A)=1/3,P(AB)=1/2,P(B∣A)=P(AB)/P(A)=2/35.8设职工文化程度小学为事件A,职工文化程度初中为事件B,职工文化程度高中为事件C,职工年龄25岁以下为事件D。
P(A)=0.1P(B)=0.5,P(C)=0.4P(D∣A)=0.2,P(D∣B)=0.5,P(D∣C)=0.7P(A∣D)=
P(A)P(DA)P(A)P(DA)+P(B)P(DB)+P(C)P(DC)
=2/55
同理P(B∣D)=5/11,P(C∣D)=28/555.9设次品为D,由贝叶斯公式有:
P(A∣D)=
P(A)P(DA)P(A)P(DA)+P(B)P(DB)+P(C)P(DC)
=0.249
同理P(B∣D)=0.1125.10由二项式分布可得:
P(x=0)=0.25,P(x=1)=0.5,P(x=2)=0.255.11
(1)P(x=100)=0.001,P(x=10)=0.01,P(x=1)=0.2,P(x=0)=0.789
(2)E(X)=100*0.001+10*0.01+1*0.2=0.45.13答对至少四道题包含两种情况,对四道错一道,对五道。
3C541()C651+
(4)4
4
=1/64(4)
5
5.14由泊松分布的性质有:
P(X=1)=λe
λ
,P(X=2)=
λ2e?
λ
2!
,可得λ=2
P(X=4)=2/3e5.15
P(X=k+1)λk+1(k)!
λ=?
k==1P(X=k)(k+1)!
λk+1
所以,当k=λ-1和k=λ时P(x=k)最大。
5.16
(1)P(x>2)=P(x>2)+P(x<-2)=φ(0.5)+1-φ(2.5)=0.6977由于N(3,4)关于均值3对称,所以P(x>3)=0.55.17P(120<x<200)=P(
x-1604040?
)2φ()1≥0.08=?
σ
σ
σ
φ(
40
5.18
(1)P(x≤230)=P(
x?
20030≤)=φ(1.5)=0.93322020x?
20010≤)=2φ(0.5)?
1=0.383
(2)P(190≤x≤210)=P(2020
σ
)0.9,σ≤398.27≥
第七章练习题参考答案
7.1
(1)已知σ=5,n=40,x=25,α=0.05,
z
0.052
=1.96
样本均值的抽样标准差
σ
x
=
σ
n
=
540
=0.79
(2)估计误差(也称为边际误差)E=
zα
σ
2
=1.96*0.79=1.55
n
7.2
(1)已知σ=15,n=49,x=120,α=0.05,
z
0.052
=1.96
(2)样本均值的抽样标准差
σ
x
=
σ
n
=
1549
=2.14
估计误差E=
zα
σ
2
=1.96*
1549
n
=4.2
(3)由于总体标准差已知,所以总体均值μ的95%的置信区间为:
x±zα2
σ
n
=120±1.96*2.14=120±4.2,即(115.8,124.2)
7.3
(1)已知σ=85414,n=100,x=104560,α=0.05,
z
0.052
=1.96
由于总体标准差已知,所以总体均值μ的95%的置信区间为:
x±zα2
σ
n
=104560±1.96*
85414100
=104560±16741.144即(87818.856,121301.144)
7.4
(1)已知n=100,x=81,s=12,
α=0.1,z0.12=1.645
由于n=100为大样本,所以总体均值μ的90%的置信区间为:
x±zα2
sn
=81±1.645*
12100
=81±1.974,即(79.026,82.974)
(2)已知α=0.05,
z
0.052
=1.96
由于n=100为大样本,所以总体均值μ的95%的置信区间为:
x±zα2
sn
=81±1.96*
12100
=81±2.352,即(78.648,83.352)
(3)已知α=0.01,
z
0.012
=2.58
由于n=100为大样本,所以总体均值μ的99%的置信区间为:
x±zα2
sn
=81±2.58*
12100
=81±3.096,即(77.94,84.096)
7.5
(1)已知σ=3.5,n=60,x=25,α=0.05,
z
0.052
=1.96
由于总体标准差已知,所以总体均值μ的95%的置信区间为:
x±zα2
σ
n
=25±1.96*
3.560
=25±0.89,即(24.11,25.89)
(2)已知n=75,x=119.6,s=23.89,
α=0.02,z0.022=2.33
由于n=75为大样本,所以总体均值μ的98%的置信区间为:
x±zα2
sn
=119.6±2.33*
23.8975
=119.6±6.43,即(113.17,126.03)
(3)已知x=3.419,s=0.974,n=32,α=0.1,
z
0.12
=1.645
由于n=32为大样本,所以总体均值μ的90%的置信区间为:
x±zα2
sn
=3.419±1.645*
0.97432
=3.419±0.283,即(3.136,3.702)
7.6
(1)已知:
总体服从正态分布,σ=500,n=15,x=8900,α=0.05,由于总体服从正态分布,所以总体均值μ的95%的置信区间为:
z
0.052
=1.96
x±zα2
σ
n
=8900±1.96*
50015
=8900±253.03,即(8646.97,9153.03)
(2)已知:
总体不服从正态分布,σ=500,n=35,x=8900,α=0.05,
z
0.052
=1.96
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为:
x±zα2
σ
n
=8900±1.96*
50035
=8900±165.65,即(8734.35,9065.65)
(3)已知:
总体不服从正态分布,σ未知,n=35,x=8900,s=500,
α=0.1,z0.12=1.645
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为:
x±zα2
sn
=8900±1.645*
50035
=8900±139.03,即(8760.97,9039.03)
(4)已知:
总体不服从正态分布,σ未知,n=35,x=8900,s=500,
α=0.01,z0.012=2.58
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间为:
x±zα2
sn
=8900±2.58*
50035
=8900±218.05,即(8681.95,9118.05)
7.7已知:
n=36,当α=0.1,0.05,0.01时,相应的
z
0.12
=1.645,
z
0.052
=1.96,
z
0.012
=2.58
根据样本数据计算得:
x=3.32,s=1.61由于n=36为大样本,所以平均上网时间的90%置信区间为:
x±zα2
sn
=3.32±1.645*
1.6136
=3.32±0.44,即(2.88,3.76)
平均上网时间的95%置信区间为:
x±zα2
sn
=3.32±1.96*
1.6136
=3.32±0.53,即(2.79,3.85)
平均上网时间的99%置信区间为:
x±zα2
sn
=3.32±2.58*
1.6136
=3.32±0.69,即(2.63,4.01)
7.8已知:
总体服从正态分布,但σ未知,n=8为小样本,α=0.05,根据样本数据计算得:
x=10,s=3.46总体均值μ的95%的置信区间为:
t
0.052
(8?
1=2.365)
x±tα2
7.9
sn
=10±2.365*
3.468
=10±2.89,即(7.11,12.89)
已知:
总体服从正态分布,但σ未知,n=16为小样本,α=0.05,
t
0.052
(?
1)16=2.131
根据样本数据计算得:
x=9.375,s=4.113从家里到单位平均距离的95%的置信区间为:
x±tα2
sn
=9.375±2.131*
4.11314
=9.375±2.191,即(7.18,11.57)
7.10
(1)已知:
n=36,x=149.5,α=0.05,
z
0.052
=1.96
由于n=36为大样本,所以零件平均长度的95%的置信区间为:
x±zα2
sn
=149.5±1.96*
1.9336
=149.5±0.63,即(148.87,150.13)
(2)在上面的估计中,使用了统计中的中心极限定理。
该定理表明:
从均值为μ、方差为
σ
2
的总体中,抽取了容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值
2
的抽样分布近似服从均值为μ,方差为σ
n
的正态分布。
7.12
(1)已知:
总体服从正态分布,σ未知,但n=25为小样本,=0.01,0.012(25?
1)=2.797α
t
根据样本数据计算得:
x=16.128,s=0.871总体均值μ的99%的置信区间为:
x±tα2
sn
=16.128±2.797*
0.87125
=16.128±0.487,即(15.64,16.62)
7.13已知:
总体服从正态分布,但σ未知,n=18为小样本,α=0.1,根据样本数据计算得:
x=13.56,s=7.8网络公司员工平均每周加班时间的90%的置信区间为:
t
0.12
(18?
1)=1.74
x±tα2
sn
=13.56±1.74*
7.818
=13.56±3.2,即(10.36,16.76)
7.14
(1)已知:
n=44,p=0.51,α=0.01,总体比例π的99%的置信区间为:
z
0.012
=2.58
p±zα2
p(1?
p)0.51(1?
0.51)=0.51±2.58=0.51±0.19,即(0.32,0.7)n44
(2)已知:
n=300,p=0.82,α=0.05,总体比例π的95%的置信区间为:
z
0.052
=1.96
p±zα2
p(1?
p)0.82(1?
0.82)=0.82±1.96=0.82±0.04,即(0.78,0.86)n300
XX文库-让每个人平等地提升自我(3)已知:
n=1150,p=0.48,α=0.1,,总体比例π的90%的置信区间为:
z
0.12
=1.645
p±zα2
p(1?
p)0.48(1?
0.48)=0.48±1.645=0.48±0.02,即(0.46,0.5)n1150
7.15已知:
n=200,p=0.23,α为0.1和0.05时,相应的总体比例π的90%的置信区间为:
z
0.12
=1.645,
z
0.052
=1.96
p±zα2
p(1?
p)0.23(1?
0.23)=0.23±1.645=0.23±0.05,即(0.18,0.28)n200
总体比例π的95%的置信区间为:
p±zα2
p(1?
p)0.23(1?
0.23)=0.23±1.96=0.23±0.06,即(0.17,0.29)n200
7.16已知:
σ=1000,估计误差E=200,α=0.01,
z
0.012
=2.58
(zα2)σ应抽取的样本量为:
n=E
22
2
×=2.581000200
22
2
=167
7.17
(1)已知:
E=0.02,π=0.4,α=0.04,
2
z
0.042
=2.05
(zα2)π(1?
π)2.05×0.4×1?
0.4)(应抽取的样本量为:
n==