=F(ɛ+θ)-F(-ɛ+θ).
因为
FX(x)={0,x<0xθ,0≤x≤θ1,x>θ, 及F(x)=FMax{X1,X2,⋯,Xn}(x)=FX1(x)FX2(x)⋯FXn(x),
所以
F(ɛ+θ)=1, F(-ɛ+θ)=P(Max{X1,X2,⋯,Xn}<-ɛ+θ)=(1-xθ)n,
故
P(∣Max{X1,X2,⋯,Xn}-θ∣<ɛ)=1-(1-xθ)n→1(n→+∞).
习题2
设σ是总体X的标准差,X1,X2,⋯,Xn是它的样本,则样本标准差S是总体标准差σ的().
(A)矩估计量; (B)最大似然估计量; (C)无偏估计量; (D)相合估计量.
解答:
应选(D).
因为,总体标准差σ的矩估计量和最大似然估计量都是未修正的样本标准差;样本方差是总体方差的无偏估计,但是样本标准差不是总体标准差的无偏估计.可见,样本标准差S是总体标准差σ的相合估计量.
习题3
设总体X的数学期望为μ,X1,X2,⋯,Xn是来自X的样本,a1,a2,⋯,an是任意常数,验证(∑i=1naiXi)/∑i=1nai (∑i=1nai≠0)是μ的无偏估计量.
解答:
E(X)=μ,
E(∑i=1naiXi∑i=1nai)=1∑i=1nai⋅∑i=1naiE(Xi) (E(Xi)=E(X)=μ)
=μ∑i=1nai∑i=1n=μ,
综上所证,可知∑i=1naiXi∑i=1nai是μ的无偏估计量.
习题4
设θ̂是参数θ的无偏估计,且有D(θ̂)>0, 试证θ̂2=(θ̂)2不是θ2的无偏估计.
解答:
因为D(θ̂)=E(θ̂2)-[E(θ̂)]2, 所以
E(θ̂2)=D(θ̂)+[E(θ̂)]2=θ2+D(θ̂)>θ2,
故(θ̂)2不是θ2的无偏估计.
习题5
设X1,X2,⋯,Xn是来自参数为λ的泊松分布的简单随机样本,试求λ2的无偏估计量.
解答:
因X服从参数为λ的泊松分布,故
D(X)=λ, E(X2)=D(X)+[E(X)]2=λ+λ2=E(X)+λ2,
于是E(X2)-E(X)=λ2, 即E(X2-X)=λ2.
用样本矩A2=1n∑i=1nXi2,A1=X¯代替相应的总体矩E(X2),E(X), 便得λ2的无偏估计量
λ̂2=A2-A1=1n∑i=1nXi2-X¯.
习题6
设X1,X2,⋯,Xn为来自参数为n,p的二项分布总体,试求p2的无偏估计量.
解答:
因总体X∼b(n,p), 故
E(X)=np,
E(X2)=D(X)+[E(X)]2=np(1-p)+n2p2
=np+n(n-1)p2=E(X)+n(n-1)p2,
E(X2)-E(X)n(-1)=E[1n(n-1)(X2-X)]=p2,
于是,用样本矩A2,A1分别代替相应的总体矩E(X2),E(X),便得p2的无偏估计量
p̂2=A2-A1n(n-1)=1n2(n-1)∑i=1n(Xi2-Xi).
习题7
设总体X服从均值为θ的指数分布,其概率密度为
f(x;θ)={1θe-xθ,x>00,x≤0,
其中参数θ>0未知.又设X1,X2,⋯,Xn是来自该总体的样本,试证:
X¯和n(min(X1,X2,⋯,Xn))都是θ的无偏估计量,并比较哪个更有效.
解答:
因为E(X)=θ, 而E(X¯)=E(X), 所以E(X¯)=θ, X¯是θ的无偏估计量.设
Z=min(X1,X2,⋯,Xn),
因为
FX(x)={0,x≤01-e-xθ,x>0,
FZ(x)=1-[1-FX(x)]n={1-e-nxθ,x>00,x≤0,
所以fZ(x)={nθe-nxθ,x>00,x≤0, 这是参数为nθ的指数分布,故知E(Z)=θn, 而
E(nZ)=E[n(min(X1,X2,⋯,Xn)]=θ,
所以nZ也是θ的无偏估计.现比较它们的方差大小.
由于D(X)=θ2, 故D(X¯)=θ2n.
又由于D(Z)=(θn)2, 故有
D(nZ)=n2D(Z)=n2⋅θ2n2=θ2.
当n>1时,D(nZ)>D(X¯), 故X¯较nZ有效.
习题8
设总体X服从正态分布N(m,1),X1,X2是总体X的子样,试验证
m1̂=23X1+13X2, m2̂=14X1+34X2, m3̂=12X1+12X2,
都是m的无偏估计量;并问哪一个估计量的方差最小?
解答:
因为X服从N(m,1), 有
E(Xi)=m,D(Xi)=1(i=1,2),
得
E(m1̂)=E(23X1+13X2)=23E(X1)+13E(X2)=23m+13m=m,
D(m1̂)=D(23X1+13X2)=49D(X1)+19D(X2)=49+19=59,
同理可得:
E(m2̂)=m,D(m2̂)=58, E(m3̂)=m,D(m3̂)=12.
所以,m1̂,m2̂,m3̂都是m的无偏估计量,并且在m1̂,m2̂,m3̂中,以m3̂的方差为最小.
习题9
设有k台仪器.已知用第i台仪器测量时,测定值总体的标准差为σi(i=1,2,⋯,k), 用这些仪器独立地对某一物理量θ各观察一次,分别得到X1,X2,⋯,Xk. 设仪器都没有系统误差,即E(Xi)=θ(i=1,2,⋯,k), 问a1,a2,⋯,ak应取何值,方能使用θ̂=∑i=1kaiXi估计θ时,θ̂是无偏的,并且D(θ̂)最小?
解答:
因为E(Xi)=θ(i=1,2,⋯,k), 故
E(θ̂)=E(∑i=1kaiXi)=∑i=1kaiE(Xi)=θ∑i=1kai,
欲使E(θ̂)=θ, 则要∑i=1kai=1.
因此,当∑i=1kai=1时,θ̂=∑i=1kaiXi为θ的无偏估计, D(θ̂)=∑i=1kai2σi2, 要在∑i=1kai=1的条件下D(θ̂)最小,采用拉格朗日乘数法.
令
L(a1,a2,⋯,ak)=D(θ̂)+λ(1-∑i=1kai)=∑i=1kai2σi2+λ(1-∑i=1kai),
{∂L∂ai=0,i=1,2,⋯,k∑i=1kai=1,
即2aiσi2-λ=0,ai=λ2i2;
又因∑i=1kai=1, 所以λ∑i=1k12σi2=1, 记∑i=1k1σi2=1σ02, 所以λ=2σ02, 于是
ai=σ02σi2 (i=1,2,⋯,k),
故当ai=σ02σi2(i=1,2,⋯,k)时,θ̂=∑i=1kaiXi是θ的无偏估计,且方差最小.
习题6.2点估计的常用方法
习题1
设X1,X2,⋯,Xn为总体的一个样本,x1,x2,⋯,xn为一相应的样本值,求下述各总体的密度函数或分布律中的未知参数的矩估计量和估计值及最大似然估计量.
(1)f(x)={θcθx-(θ+1),x>c0,其它, 其中c>0为已知,θ>1,θ为未知参数.
(2)f(x)={θxθ-1,0≤x≤10,其它, 其中θ>0,θ为未知参数.
(3)P{X=x}=(mx)px(1-p)m-x, 其中x=0,1,2,⋯,m,0
解答:
(1)E(X)=∫c+∞x⋅θcθx-(θ+1)dx=θcθ∫c+∞x-θdx=θcθ-1,解出
θ=E(X)E(X)-c,
令X¯=E(X),于是θ̂=X¯X¯-c为矩估计量,θ的矩估计值为θ̂=x¯x¯-c,其中x¯=1n∑i=1nxi.
另外,似然函数为
L(θ)=∏i=1nf(xi;θ)=θncnθ(∏i=1nxi)-(θ+1),xi>c,
对数似然函数为
lnL(θ)=nlnθ+nθlnc-(θ+1)∑i=1nlnxi,
对lnL(θ)求导,并令其为零,得
dlnL(θ)dθ=nθ+nlnc-∑i=1nlnxi=0,
解方程得θ=n∑i=1nlnxi-nlnc,故参数的最大似然估计量为
θ̂=n∑i=1nlnXi-nlnc.
(2)E(X)=∫01x⋅θxθ-1dx=θθ+1,以X¯作为E(X)的矩估计, 则θ的矩估计由X¯=θθ+1解出,得
θ̂=(X¯1-X¯)2,
θ的矩估计值为θ̂=(x¯1-x¯)2,其中x¯=1n∑i=1nxi为样本均值的观测值.
另外,似然函数为
L(θ)=∏i=1nf(xi;θ)=θn/2(∏i=1nxi)θ-1,0≤xi≤1,
对数似然函数为
lnL(θ)=n2lnθ+(θ-1)∑i=1nlnxi,
对lnL(θ)求导,并令其为零,得
dlnL(θ)dθ=n2θ+12θ∑i=1nlnxi=0,
解方程得θ=(-n∑i=1nlnxi)2,故参数的最大似然估计量为
θ̂=(n∑i=1nlnXi)2.
(3)X∼b(m,p),E(X)=mp,以X¯作为E(X)的矩估计,即X¯=E(X),则参数p的矩估计为
p̂=1mX¯=1m⋅1n∑i=1nXi,
p的矩估计值为p̂=1mx¯=1m⋅1n∑i=1nxi.
另外,似然函数为
L(θ)=∏i=1nf(xi;θ)=(∏i=1nCmxi)p∑i=1nxi(1-p)∑i=1n(m-xi),xi=0,1,⋯,m,
对数似然函数为
lnL(θ)=∑i=1nlnCmxi+(∑i=1nxi)lnp+(∑i=1n(m-xi))ln(1-p),
对lnL(θ)求导,并令其为零,得
dlnL(θ)dθ=1p∑i=1nxi-11-p∑i=1n(m-xi)=0,
解方程得p=1mn∑i=1nxi,故参数的最大似然估计量为
p̂=1mn∑i=1nXi=1mX¯.
习题2
设总体X服从均匀分布U[0,θ],它的密度函数为
f(x;θ)={1θ,0≤x≤θ0,其它,
(1)求未知参数θ的矩估计量;
(2)当样本观察值为0.3,0.8,0.27,0.35,0.62,0.55时,求θ的矩估计值.
解答:
(1)因为
E(X)=∫-∞+∞xf(x;θ)dx=1θ∫0θxdx=θ2,
令E(X)=1n∑i=1nXi, 即θ2=X¯, 所以θ̂=2X¯.
(2)由所给样本的观察值算得
x¯=16∑i=16xi=16(0.3+0.8+0.27+0.35+0.62+0.55)=0.4817,
所以θ̂=2x¯=0.9634.
习题3
设总体X以等概率1θ取值1,2,⋯,θ, 求未知参数θ的矩估计量.
解答:
由
E(X)=1×1θ+2×1θ+⋯+θ×1θ=1+θ2=1n∑i=1nXi=X¯,
得θ的矩估计为θ̂=2X¯-1.
习题4
一批产品中含有废品,从中随机地抽取60件,发现废品4件,试用矩估计法估计这批产品的废品率.
解答:
设p为抽得废品的概率,1-p为抽得正品的概率(放回抽取). 为了估计p,引入随机变量
Xi={1,第i次抽取到的是废品0,第i次抽取到的是正品,
于是P{Xi=1}=p,P{Xi=0}=1-p=q, 其中i=1,2,⋯,60,且E(Xi)=p, 故对于样本X1,X2,⋯,X60的一个观测值x1,x2,⋯,x60, 由矩估计法得p的估计值为
p̂=160∑i=160xi=460=115,
即这批产品的废品率为115.
习题5
设总体X具有分布律
X
1 2 3
pi
θ2 2θ(1-θ) (1-θ)2
其中θ(0<θ<1)为未知参数.已知取得了样本值x1=1,x2=2,x3=1, 试求θ的矩估计值和最大似然估计值.
解答:
E(X)=1×θ2+2×2θ(1-θ)+3×(1-θ)2=3-2θ,
x¯=1/3×(1+2+1)=4/3.
因为E(X)=X¯, 所以θ̂=(3-x¯)/2=5/6为矩估计值,
L(θ)=∏i=13P{Xi=xi}=P{X1=1}P{X2=2}P{X3=1}
=θ4⋅2θ⋅(1-θ)=2θ5(1-θ),
lnL(θ)=ln2+5lnθ+ln(1-θ),
对θ求导,并令导数为零
dlnLdθ=5θ-11-θ=0,
得θL̂=56.
习题6
(1)设X1,X2,⋯,Xn来自总体X的一个样本,且X∼π(λ), 求P{X=0}的最大似然估计.
(2)某铁路局证实一个扳道员五年内所引起的严重事故的次数服从泊松分布,求一个扳道员在五年内未引起严重事故的概率 p的最大似然估计,使用下面122个观察值统计情况.下表中,r表示一扳道员某五年中引起严重事故的次数,s表示观察到的扳道员人数.
r
012345
sr
444221942
解答:
(1)已知,λ的最大似然估计为λ̂L=X¯. 因此
⌢P{X=0}=e-λL̂=e-X¯.
(2)设X为一个扳道员在五年内引起的严重事故的次数,X服从参数为λ的泊松分布,样本容量n=122.
算得样本均值为
x¯=1122×∑r=05r⋯r=1122×(0×44+1×42+2×21+3×9+4×4+5×2)
≈1.123,
因此
P̂{X=0}=e-x¯=e-1.123≈0.3253.
习题6.3置信区间
习题1
对参数的一种区间估计及一组观察值(x1,x2,⋯,xn)来说,下列结论中正确的是().
(A)置信度越大,对参数取值范围估计越准确;
(B)置信度越大,置信区间越长;
(C)置信度越大,置信区间越短;
(D)置信度大小与置信区间有长度无关.
解答:
应选(B).
置信度越大,置信区间包含真值的概率就越大,置信区间的长度就越大,对未知参数的估计精度越低.
反之,对参数的估计精度越高,置信区间的长度越小,它包含真值的概率就越低,置信度就越小.
习题2
设(θ1,θ2)是参数θ的置信度为1-α的区间估计,则以下结论正确的是().
(A)参数θ落在区间(θ1,θ2)之内的概率为1-α;
(B)参数θ落在区间(θ1,θ2)之外的概率为α;
(C)区间(θ1,θ2)包含参数θ的概率为1-α;
(D)对不同的样本观察值,区间(θ1,θ2)的长度相同.
解答:
应先(C).
由于θ1,θ2都是统计量,即(θ1,θ2)是随机区间,而θ是一个客观存在的未知常数,故(A),(B)不正确.
习题3
设总体的期望μ和方差σ2均存在,如何求μ的置信度为1-α的置信区间?
解答:
先从总体中抽取一容量为n的样本X1,X2,⋯,Xn.根据中心极限定理,知
U=X¯-μσ/n→N(0,1)(n→∞).
(1)当σ2已知时,则近似得到μ的置信度为1-α的置信区间为
(X¯-uα/2σn,X¯+uα/2σn).
(2)当σ2未知时,用σ2的无偏估计S2代替σ2, 这里仍有
X¯-μS/n→N(0,1)(n→∞),
于是得到μ的1-α的置信区间为
(X¯-uα/2Sn,X¯+uα/2Sn),
一般要求n≥30才能使用上述公式,称为大样本区间估计.
习题4
某总体的标准差σ=3cm, 从中抽取40个个体,其样本平均数x¯=642cm, 试给出总体期望值μ的95%的置信上、下限(即置信区间的上、下限).
解答:
因为n=40属于大样本情形,所以X¯近似服从
N(μ,σ2n)
的正态分布,于是μ的95%的置信区间近似为
(X¯±σnuα/2),
这里x¯=642,σ=3,n=40≈6.32,uα/2=1.96, 从而
(x¯±σnuα/2)=(642±340×1.96)≈(642±0.93),
故μ的95%的置信上限为642.93, 下限为641.07.
习题5
某商店为了了解居民对某种商品的需要,调查了100家住户,得出每户每月平均需求量为10kg, 方差为9,如果这个商店供应10000户,试就居民对该种商品的平均需求量进行区间估计(α=0.01), 并依此考虑最少要准备多少这种商品才能以0.99的概率满足需求?
解答:
因为n=100属于大样本问题,所以X¯近似服从N(μ,σ2/n),于是μ的99%的置信区间近似为(X¯±Snuα/2), 而
x¯=10,s=3,n=100, uα/2=2.58,
所以
(x¯±snuα/2)=(10±3100×2.58)=(10±0.774)=(9.226,10.774).
由此可知最少要准备10.774×10000=107740(kg)这种商品,才能以0.99的概率满足需求.
习题6
观测了100棵“豫农一号”玉米穗位,经整理后得下表(组限不包括上限):
分组编号
12345
组限
组中值
频数
70∼8080∼9090∼100100∼110110∼12075859510511539131626
分组编号
6789
组限
组中值
频数
120∼130130∼140140∼150150∼16012513514515520742
试以95%的置信度,求出该品种玉米平均穗位的置信区间.
解答:
因为n=100属于大样本情形,所以μ的置信度为95%的置信区间上、下限近似为X¯±snuα/2, 这里n=100,uα/2=1.96, 还需计算出x¯和s.
取a=115,c=10, 令zi=(xi-a)/c=(xi-115)/10, 用简单算公式,
(1)x¯=a+cz¯;
(2)sx2=c2sz2.
编号
123456789
组中值xi
zi=xi-11510
组频率mi
mizi
zi2
mizi2
758595105115125135145155
-4-3-2-101234
3913162620742
-12-27-26-1602014128
16941014916
123456789
z¯=1100∑i=19mizi=1100×(-27)=-0.27,
x¯=10×(-27)+115=112.3,
sz2=199∑i=19mizi2=199×313≈3.161616,
sx2=102×3.161616=316.1616, sx≈17.78.
于是
(x¯±snuα)≈(112.3±17.7810×1.96)≈(112.3±3.485)
=(108.815,115.785).
习题7
某城镇抽样调查的500名应就业的人中,有13名待业者,试求该城镇的待业率p的置信度为0.95置信区间.
解答:
这是(0-1)分布参数的区间估计问题.待业率p的0.95置信区间为
(p1̂,p2̂)=(-b-b2-4ac2a,-b+b2-4ac2a).
其中
a=n+uα/22,b=-2nX¯-(uα/2)2, c=nX¯2,
n=500,x¯=13500,uα/2=1.96.
则(p1̂,p2̂)=(0.015,0.044).
习题8
设X1,X2,⋯,Xn为来自正态总体N(μ,σ2)的一个样本,求μ的置信度为1-α的单侧置信限.
解答:
这是一个正态总体在方差未知的条件下,对μ的区间估计问题,应选取统计量:
T=X¯-μS/n∼t(n-1).
因为只需作单边估计,注意到t分布的对称性,故令
P{Ttα(n-1)}=1-α.
由给定的置信度1-α, 查自由度为n-1的t分布表可得单侧临界值tα(n-1). 将不等式Ttα(n-1), 即
X¯-μS/ntα(n-1)
分别变形,求出μ即得μ的1-α的置信下限为
X¯-tα(n-1)Sn.
μ的1-α的置信上限为
X¯+tα(n-1)Sn,
μ的1-α的双侧置信限
(X¯-tα/2(n-1)Sn,X¯+tα/2(n-1)Sn).
习题6.4正态总体的置信区间
习题1
已知灯泡寿命的标准差σ=50小时,抽出25个灯泡检验,得平均寿命x¯=500小时,试以95%的可靠性对灯泡的平均寿命进行区间估计(假设灯泡寿命服从正态分布).
解答:
由于X∼N(μ,502), 所以μ的置信度为95%的置信区间为
(X¯±uα/2σn),
这里x¯=500,n=25,σ=50,uα/2=1.96, 所以灯泡的平均寿命的置信区间为
(x¯±uα/2σn)=(500±5025×1.96)=(500±19.6)=(480.4,519.6).
习题2
一个随机样本来自正态总体X,总体标准差σ=1.5, 抽样前希望有95%的置信水平使得μ的估计的置信区间长度为L=1.7, 试问应抽取多大的一个样本?
解答:
因方差已知,μ的置信区间长度为
L=2uα/2⋅σn,
于是n=(2σLuα/2)2.
由题设知,1-α=0.95,α=0.05,α2=0.025. 查标准正态分布表得
u0.025=1.96,σ=1.5,L=1.7,
所以,样本容量
n=(2×1.5×1.961.7)2≈11.96.
向上取整数得n=12, 于是欲使估计的区间长度为1.7的置信水平为95%, 所以需样本容量为n=12.
习题3
设某种电子管的使用寿命服从正态分布.从中随机抽取15个进行检验,得平均使用寿命为1950小时,标准差s为300小时,以95%的可靠性估计整批电子管平均使用寿命的置信上、下限.
解答:
由X∼N(μ,σ2), 知μ的95%的置信区间为
(X¯±Sntα/2(n-1)),
这里x¯=1950,s=300,n=15,tα/2(14)=2.145, 于是
(x¯±sntα/2(n-1))=(1950±30015×2.145)
≈(1950±166.151)=(1783.85,2116.15).
即整批电子管平均使用寿命的置信上限为2116.15, 下限为1783.85.
习题4
人的身高服从正态分布,从初一女生中随机抽取6名,测其身高如下(单位:
cm):
149 158.5 152.5 165 157 142
求初一女生平均身高的置信区间(α=0.05).
解答:
X∼N(μ,σ2),μ的置信度为95%的置信区间为
(X¯±Sntα/2(n-1)),
这里x¯=154, s=8.0187, t0.025(5)=2.571, 于是
(x¯±sntα/2(n-1))=(154±8.01876×2.571)
≈(154±8.416)≈(145.58,162.42).
习题5
某大学数学测验,抽得20个学生的分数平均数x¯=72, 样本方差s2=16, 假设分数服从正态分布,求