自考概率论与数理统计Word文件下载.docx
《自考概率论与数理统计Word文件下载.docx》由会员分享,可在线阅读,更多相关《自考概率论与数理统计Word文件下载.docx(22页珍藏版)》请在冰豆网上搜索。
1
2X(0.1+0.7+0.2+1+1.9+1.3+1.8)=2
例7—4在一批产品取样n件,发现其中有m件次品,试用此样本求该批产品的次品率p的矩估计。
10070103针对该题提问】
因为■'
/?
=—
…二
例如抽样总数n=100,其中次品m=5.
=—=0.05
则.:
.J.
例7—5电话总机在一分钟间隔内接到呼唤次数X〜P(上)。
观察一分种接到呼唤次数
共观察40次,结果如下
接到呼唤次数
3
4
5
观察次数
10
12
8
求未知参数…的矩估计-.
10070104针对该题提问】
(1)vX〜P
(二)
•••EX=-
由矩法二二儿
•.T
(2)计算■-(0X5+1X10+2X12+3X8+4X3+5X2)=2
•••-.=2
7.1.2极大似然估计
为了叙述极大似然原理的直观想法,先看例7—6
例7—6设有外表完全相同的两个箱子,甲箱中有99个白球和1个黑球,乙箱中有99
个黑球和1个白球,现随机地抽取一箱,并从中随机抽取一球,结果取得白球,问这球是从哪一个箱子中取出的?
10070105针对该题提问】
不管是哪一个箱子,从箱子中任取一球都有两个可能的结果:
A表示取出白球,B
表示取出黑球,如果我们取出的是甲箱,则A发生的概率为0.99,而如果取出的是乙箱,
则A发生的概率为0.01,现在一次试验中结果A发生了,人们的第一印象就是:
此白球(A)最像从甲箱取出的”或者是说,应该认为试验条件对事件A出现有利,从而可以推断这球
是从甲箱中取出的,这个推断很符合人们的经验事实,这里最像”就是极大似然”之意。
本例中假设的数据很极端,一般地,我们可以这样设想,在两个箱子中各有100个球,
甲箱中白球的比例是Pi,乙箱中白球的比例是P2,已知Pi>
P2,现随机地抽取一个箱子并从中抽取一球,假定取到的是白球,如果我们要在两个箱子中进行选择,由于甲箱中白球的
比例高于乙箱,根据极大似然原理,我们应该推断该球来自甲箱。
下面分别给出离散型随机变量和连续型随机变量的极大似然估计求未知参数的估计
的步骤
(1)离散型随机变量
第一步,从总体X取出样本Xi,X2,…,x
第二步,构造似然函数
L(Xi,X2,…,x,幻)=P(X=Xi)P(X=X2)…P(X=xn)
第三步,计算lnL(Xi,X2,…,x,J)并化简
第四步,当」=卜时lnL(Xi,X2,…,Xi,»
)取最大值则取="
-1
常用方法是微积分求最值的方法。
(2)连续型随机变量
若X〜f(x卫)
第一步从总体X取出样本Xi,X2,…,X
第二步构造似然函数
L(Xi,X2,…,X,£
)=f(Xi,4)f(X2,旳…彳(Xn,9)
第三步计算InL(xi,x2,…,x,」)并化简
第四步当一时InL(Xi,X2,…,x.,0)取最大值则取
常用方法是微积分求最值的方法
例7—7设总体X〜B(i,P)即
ri*若a发生
I0若A不发生
设P(A)=「,从总体X中抽样Xi,X2,…,x,问最大似然法求
i0070i06针对该题提问】
当X〜B(i,P)时,应有-■■■-■'
'
p(x=i)=p,p(X=0)=i—P
第一步构造似然函数
L(Xi,X2,…,X,P)=P(X=Xi)P(X=X2)…P(X=Xn)
(1-左厂(1-戸厂]…卜气1弋厂
=左倨丹严%)(]-”严%)
第二步计算InL(Xi,X2,…,X,P)并化简=(Xi+…+Xn)Inp+(n-(Xi+…+Xn)In(i-p)
第三步
求〕二丄二…H
册+花+-八斗囘一(焉+…耳)
1-刀
Zj+--■+嚣一(血+・・+耳)
•••驻点为匚-■;
化简为(x什…+Xn)(1-p)=p[n-(Xi+…+Xn)]
(Xi+…+Xn)=np
•驻点
p=-(x^
因为只有一个驻点
•「丁是最大点
•取一-
例抽样n次A发生m次,则在Xi,X2…xn中有m个1,其余为0,
.P=_
••上
例7—8
(1)设总体X服从泊松分布pU),求兄的极大似然估计;
(2)设总体X服
从指数分布E(兄)求兄的极大似然估计
10070107针对该题提问】
•p(X=k)=£
!
从总体X中取样本X1,X2…Xn。
血)=口尸(丙丿)=口刀3=可)
[匕d:
———旷丄
用=1
dAA
A=——=x
•驻点:
■
InL(A)=迟再)血几-曲Tn(召!
兀」…孟口dlnL(A)*
解得…的极大似然估计
1"
—、=一2%7
易知上的矩估计亦为:
(2)vX〜E
(二)
第一步,从中取样本值X1,x2…xn,应有X1>
0,X2>
0…Xn>
0•似然函数L(X1,X2…Xn)=f(X1)f(X2)…f(Xn)=几巳跖)W■巳空)…(肮第二步计算:
:
「:
•:
丁」
第三步求討—、二'
一厂「
A=L
•••驻点叫亠…-■<
是最大点
S=i
••取.:
在例7-2中用矩法估计也是同样结果
八[J"
3X~f(x)=&
例7-9设即[①其它
从中取样Xi,X2…Xn,试用最大似然法求2
10070108针对该题提问】
因为样本Xi,X2…xn已经取出。
所以应有O^XW1,0三2^'
…0^rX'
所以。
的取值范围为m做X.xaT■--Xfl)<
<
+□□
iiii
=--■-w—'
=
999
•••」>
0,很明显,似然函数-•丁-二:
是J的单调减函数,因此当J最小时,似然函
数二一..最大,由条件二
知J的最小值为‘‘-mass(忑,X2
所以x—「•时-二二「J最大。
取一心:
—厂-二、:
这一结果与用矩法估计(例7-3)的结果不同。
例7—10若---丨i-[从中抽样x1,x2…Xn,试用最大似然估计法求:
「,,-
10070109针对该题提问】
解:
X的似然函数■-■■i'
-二'
■"
■:
…■
I(鬲-q'
H
i-1
=(加,戸exp{哙評T}
InZO-=-乔郭召-莎-守2—yln(2^r)
将丄」.一宀|分别关于两个分量求偏导并令其为0即得到似然方程组
(1)
]nL(^tdr2)1&
卫用门
■-—.--"
(2)
-菲吃W
解此方程组,由
(1)可得驻点「-•,••'
的极大似然估计为•:
一
将之代入
(2)给出匚「的极大似然估计
i1=
7.2
点估计的评价标准
我们已经看到,点估计有各种不同的求法,为了在不同的点估计间进行比较选择,就必
须对各种点估计的好坏给出评价标准。
数理统计中给出了众多的估计量评价标准,对同一估计量使用不同的评价标准可能会得
到完全不同的结论,因此,在评价某一个估计好坏时首先要说明是在哪一个标准下,否则所
论好坏毫无意义。
但在诸多标准中,有一个基本标准是所有的估计都应该满足的,它是衡量一个估计是否
可行的必要条件,这就是估计的相合性,我们就从相合性开始介绍。
7.2.1相合性
我们知道,点估计是一个统计量,因此它是一个随机变量,在样本量一定的条件下,我们不可能要求完全等同于参数的真实取值,但如果我们有足够的观测值,根据格里纹科定理,
随着样本量的不断增大,经验分布函数逼近真实分布函数,因此完全可以要求估计量随着样
本量的不断增大而逼近参数真值,这就是相合性,严格定义如下,
定义7-2设J-?
为未知参数•是J的一个估计量,n是样本容量,
右对任何一个>0,有I"
J(7.2.1)
则称一为参数J的相合估计
相合性被认为是对估计的一个最基本要求,如果一个估计量,在样本量不断增大时,它
都不能把被估参数估计到任意指定的精度,那么这个估计是很值得怀疑的,通常,不满足相
合性要求的估计一般不予考虑,证明古计的相合性一般可应用大数定律或直接由定义来证。
例11用大数定律证明「—丁是「「的相合估计
10070110针对该题提问】
是;
的相合估计
为了避免用定义判断相合性的困难,下面介绍一个判断相合性很有用的定理:
定量:
设"
-'
J'
■-•是」的估计量
若
(1)鳥—
(2)•―
则一是J的相合估计。
例12证明丁「是J的相合估计
10070111针对该题提问】证:
在前面我们已经证明
(1)-7'
n(s1)=z?
—y(x-x)—
(2)
D迟(召-z)->
0(«
->
co)
i
•••T二是J的相合估计
7.2.2无偏性
相合性是大样本下估计量的评价标准,对小样本而言,需要一些其他的评价标准,无偏
性便是一个常用的评价标准。
设是」的一个估计,」的参数空间为口,若对任意的—口,有门」了--则称丁■■是J的无偏估计,否则称为有偏估计。
例7-13对任一总体而言,样本均值是总体均值的无偏估计,当总体k阶矩存在时,
样本k阶原点矩s是总体k阶原点矩二的无偏估计,但对k阶中心矩则不一样,例如,二阶
样本中心矩〔就不是总体方差/的无偏估计,事实上,
10070112针对该题提问】
对此,有如下两点说明
(1)当样本量趋于无究时,有我们称为的渐近无偏估计,这表明
当样本量较大时,「可近似看作J的无偏估计
「它比訂更常用,这是
则「是总体方差的无偏估计,这种简章的修正方法在一些场合常被采用,
因为在n》2时,且二因此用上估计F有偏小的倾向,特别在小样本场合要使用0估计E3
无偏性不具有不变性。
即若&
是&
的无偏估计,一般而言,g(©
)不是g(4)的无
偏估计,除非g3)是J的线性函数,例如,「是J的无偏估计,但s不是h的无偏估计例14证明近住+…是口的无偏估计
二也■-'
-。
其中6是X的样本
10070113针对该题提问】
证:
匕
=碍码+务+…敢.
=.:
.」•:
-■■一-…行■"
=—:
.-■■■
='
--1
工M•-;
---+
特别情形*-丁是J的无偏估计例15证明丁「是匚「的无偏估计
10070114针对该题提问】
证•二】;
一二」厂
证•一:
童£
(兀-xf=£
乞彳-/)
£
必;
-恥<=左(士+/)-超(£
3+(遲力,)
za
(超-1好
〔敲十+用/『)-用(丄/+站
7.2.3有效性
参数的无偏估计可以有很多,那么如何在无偏估计中进行选择?
直观的想法是希望该估计围绕参数真值的波动越小越好,波动的大小可以用方差来衡量,因此人们常用无偏估计的
方差的大小作为度量无偏估计优劣的标准,这就是有效性。
定义7-4设二,宀是j的两个无偏估计,如果对任意的有则称囚比
r有效
例16设九…呦是取自某总体的样本,
记总体均值为.:
,总体方差为</,则---■■-.丁
都是二的无偏估计,但"
显然,只要n>1,c比"
效,这表明,用全
部数据的平均估计总体均值要比只使用部分数据更有效。
亠121212应再=&
〔包曲十&
再)=y目罚+—E愁-—-i-—p=p
•••»
与门都是'
的无偏估计
°
卫1=Q(亍兀+〒憨j=Q〔〒疋J+D(亏用)
1n121.2212
=I'
-丨一
717
。
卫a=询+亍花)=西)+。
(彳花)
<
J小门:
比.•有效
例18设,从总体中取样…
10070117针对该题提问】
/j=-&
4=丄0
212
二是。
-工一4-4
D佝=0(-或一少一-Dx
399n
土丄#2匸沪->
0(W^CO)
-2-
=-x
•二是。
7.3参数的区间估计
用点估计去估计总体的参数,即使是无偏且有效的,也会由于样本的随机性,使得从一
个样本X1,X2,X3,…,Xn算得的估计值不一定是被估计的参数的真实值,而且估计值的可靠性并不知道,这是一个重大的问题,因此,必须解决根据估计量的分布,在一定可靠性的
程度下指出被估计的总体参数的取值范围,这正是本节要介绍的参数的区间估计问题。
7.3.1置信区间概念
为了引入置信区间的概念,请看下面的引例。
引例设某种绝缘子抗扭强度X服从正态分布•"
「;
「,其中「未知,J已知(口=45公斤米),试对总体均值"
作区间估计。
10070201针对该题提问】
对于区间估计,要选择一个合适的统计量,若在该总体取一个容量为n的样本X1,X2,
X3,…,Xn,样本均值为…-的点估计即:
,然而我们要给出门的一个区间估计,以体现出估
丁叫》—)
计的误差,我们知道■。
在区间估计问题中,要选取一个合适的估计函数。
这时,
u_c
可取」J人,它是:
的标准化随机变量,且具备下面两个特点:
(1)u中包含所要估计的未知参数匸(其中匚已知);
(2)u的分布为N(0,1),它与未知参数启无关。
因为u〜N(0,1),因而有
P^\u\>
u^*=cj(0<
cs<
1)
■刃,
根据u〜N(0,1)的概率密度・•・I的对称性(见下图)
在引例中,若a=160,壬=40,n=16。
则有
-40
a-1.96-^=160-1.96x^=140.4<
16
〒+1.96-^=160+1.96x41=179.6血716
、^(140.4<
^<
179.6)=0.95
说明该绝缘子抗扭强度X的期望〔在(140.4,179.6)内的可靠度为0.95。
下面,引出置信区间的概念。
定义7-5设已为总体的未知参数:
■'
i■_■j|是由样
本\•二定出的两个统计量,若对于给定的概率1-a(0VaV1),有
44長
■-'
■\■■■_匚匚二I为置信下限,已称为置信上限。
者说,随机区间
」以100(1-a)%的概率包含旧。
粗略地说,当a=0.05时,在100次
的抽样中,大致有95次旧包含在LJ」中,而其余5次可能不在该区间中。
a常取的数值为0.05,0.01,此时置信度1-a分别为0.95,0.99。
置信区间的长度可视为区间估计的精度,下面分析置信度与精度的关系。
n固定时,置信区间长度增大,即区间估计精度减低置信区间长度减小,即区间估计精度提高。
n增大时,置信区间减小(如引例中,置信区间长度
%丁
为:
「•'
),区间估计精度提高。
7.3.2单个正态总体参数的置信区间
正态总体-1'
是最常见的分布,本小节中我们讨论它的两个参数的置信区间。
1>已知时「的置信区间
设总体X服从正态分布"
3小,其中/已知,而已未知,求"
的置信度1-a的置信区间。
这一问题实际上已在引例中的讨论中解决,得到
斗-盂“盂盂十肚。
莘}=1—迄
2U为~27就J
P
所以八的置信度1-a的置信区间为
例1某车间生产滚珠,从长期实践知道,滚珠直径X服从正态分布。
从某天产品里随机抽取6个,测得直径为(单位:
毫米):
14.6,15.1,14.9,14.8,15.2,15.1。
若总体方差C72=0.06,求总体均值P的置信区间(a=0.05a=0.01。
10070202针对该题提问】
解[-1「,
a=0.05时,置信度为95%的置信区间为
«
[1475J515]
a=0.01时,置信度为99%的置信区间为
从此例知,在样本容量n固定时,当置信度1-a较大时,置信区间长度较大;
当置信度
1-a较小时,置信区间较小。
_
例2用天平称量某物体的质量9次,得平均值为1=15.4(g),已知天平称量结果为正
态分布,其标准差为0.1g,试求该物体质量的0.95置信区间。
10070203针对该题提问】
解此处1-a=0.95a=0.05查表知U0.025=1.96,于是该物体质量"
的0.95的置信区间为
早=154±
196x^1=15.4±
00653
从而该物体质量的0.95置信区间为[15.3347,15.4653]。
例3设总体为正态分布上:
打亠为得到匸的置信水平为0.95的置信区间长度不超过1.2,
样本容量应为多大?
10070204针对该题提问】
解由题设条件知〔的0.95置信区间为
量至少为11时才能使得,的置信水平为0.95的置信区间长度不超过1.2。
2匸未知时匸的置信区间
解得
P—(«
-1)仝徑3-曲=1-os
72
戸(—一3—1)且上企=
一E—
Pa一J仗一1)莘兰“£
X+4(料-1)卓)=l-fl£
宀-4±
(再-分2
其中■1.-.是.一〜的无偏估计。
例4假设轮胎的寿命服从正态分布。
为估计某种轮胎的平均寿命,现随机地抽12只轮
胎试用,测得它们的寿命(单位:
万千米)如下:
4.684.854.324.854.615.025.204.604.584.724.384.70
试求平均寿命的0.95置信区间。
10070205针对该题提问】_
解此处正态总体标准差未知,可使用t分布求均值的置信区间。
本例中经计算有A
=4.7092,s2=0.0615。
取a=0.05查表知to.025(11)=2.2010,于是平均寿命的0.95置信区间为(单位:
万千米)
'
的置信区间
此时虽然也可以就「「是否已知分两种情况讨论J的置信区间,但在实际问题中未知时匸已知的情况是极为罕见的,所以我们只在门未知的条件下讨论J的置信区间。
-厂中包含未知参数又它的分布与-J无关,以上作为估计函数,可用于-J的区间估计。
由于一厂分布是偏态分布,寻找平均长度最短区间很难实现,一般都改为寻找等尾置信
a
区间:
把a平分为两部分,在一r分布两侧各截面积为1的部分,即采用一r的的两个分位数处帥—1)和迁口-1)
21_2
尸C?
、佥®
-1))=1))=1-^
它们满足:
:
-O(见下图)
F1))-1
1_72
3-1)兰F莖丘心一D)=1亠比F7
5孑守習十G
..Pt—s兰y<
―s)=1—a
3一1)3_1)/爲盘(闻_。
—1—■
23
尸((:
一忙勿让?
一用)“弋
力3-1)
—1.—=
将上式开方即可得标准差■-的置信区间。
例5某厂生产的零件质量X服从正态分布'
o现从该厂生产的零件中抽取9个,
测得其质量为(单位:
g)
45.345.445.145.345.545.745.445.345.6
试求总体标准差匸的0.95置信区间。
10070206针对该题提问】
解由数据可算得s2=0.0325,(n-1)s2=8>
0.0325=0.26,这里a=0.95查表知
Zafl(8)=21797,xt(8)=门5345
二.代入公式可得的0.95置信区间为
从而F的0.95置信区间为[0.1218,0.3454]。
以上关于正态总体参数的区间估计的讨论列表如表7-1所示。
表正态邑体掺魏的区间估计未
条件
佶计参数
置信区闾
戶
【1-財■卡・7丰斗■卡】
S
f0-皆1
3片
本章小结
本章考核要求为
(1)点估计
(1)知道点估计的概念
(2)会用矩法求总体参数的矩估计值,主要依据是
fl-X
(3)