第五章统计估计和假设检验.docx-资源下载

第五章统计估计和假设检验.docx

1、第五章统计估计和假设检验第五章统计估计和假设检验第五章统计估计和假设检验统计学的根本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大局部：一是统计估计，二是假设检验。统计估计问题就是根据样本的数字特征来估计总体参数的数字特征，因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式：点估计和区间估计。假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验，以判断其正确性。假设检验也分为两类：一类是对总体分布的一些数字特征进行检验，称为参数假设检验；另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验，此时只

2、检验分布，而不对参数作检验，这称作非参数的假设检验。非参数检验将在第六章进行讨论，本章着重讨论参数检验。第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。假设的总体参数为，这时是一个的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性，统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然，这样做必然会有误差产生。这种误差就称为抽样误差。极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。例5-1。设有一批产品，质量上分为正品与次品。产品的次品率有两种估计：0.1和0.4，今随机抽样15件产品，发现只

3、有一件是次品。现根据这一抽样情况，来决定用哪一种次品率来估计更为可靠呢？记 A =“抽取15件产品，只有一件是次品，设抽得正品用X=0，抽得次品用X=1来表示。抽样结果只有 X=0 与 X=1 两种情形，于是，可得 A发生的概率为： P(A)= 其中：是这批产品的次品率。假设次品率=0.1，那么P(A)=0.1=0.0229 假设次品率=0.4，那么P(A)=0.4=0.0003。现在 A 既然在一次观察中就发生了，直观地我们可以认为 A发生的概率P(A)不会小，故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。由于0.02290.0003，故应选择0.1作为产品的次品率

4、比选择0.4更可靠些。把上例到一般的情形，我们就可以得到极大似然法的一般原理。设是取自密度函数为f(x, )的总体的一组样本。其中：x和都为参数，待估计。的极大似然估计的根本思路是，假设记A =“一次观察中，所得一组样本的样本值为( )。现在在一次观察中A发生了，即P(A)应尽可能地大，即应在所有可能取值的中选出一个使P(A)到达最大值的作为的估计值。此时的又称为的极大似然估计值。由于相互，且都与X具有相同的分布，由此可以得到，P(A)就相当于：同时发生的概率，也就是P(A)=，记为L()=L(), 于是有： L()= L()称为的似然函数。求极大似然值的问题就是求似然函数L()

5、的最大值问题，根据微分学的结果，L()取到最大值的必要条件是它对的导数为零。因为ln L()与L()取得极大值的点相同，为计算方便，我们通常就用对数似然方程来求解最大似然估计值。在我们上述例子中，f(1, )=，f(0，)=1-，于是得到似然函数： L()= 令=0，舍去=1，得的最大似然估计值=0.067。实际上，正是在15次抽样中得到一次次品的频率，用频率估计概率，当n充分大时无疑是合理的。例5-2。从一个正态总体中抽取容量为n的样本，求总体参数的极大似然估计。解：构造似然函数为了求和，使ln的极大，令解上述方程得到：所以得到和的极大似然估计量为：二、估计量好坏的评选标准前

6、面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量，于是，在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么，什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。例5-3。假设某一建设单位购进了一批建筑用的线材，就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样，选择样本的某个函数统计量来推断总体指标值。由于随机原因，每次抽取样本的测量结果是不同的。如果样本容量为3，抽取4组样本，测得结果如表5-1所示。表5-1 一组抽样样本的观察值样本值样本顺序均值 1 900 999 1011 97

7、0 2 995 1050 1105 1065 3 1010 941 0 947 4 950 910 0 1000 为了说明的方便起见，我们假定，实际上=1000公斤，当然这在事先是不知道的。我们要求利用样本信息来推断总体指标，并使其误差最小。第一组样本的中位数最接近总体指标，第二组样本是最小值最接近总体指标，第三组样本是最大值最接近总体指标，第四组样本是均值刚好等于总体指标。于是就产生了一个问题，在大量的实验中，究竟采用哪一个指标来推断总体指标更合理呢？评价点估计的结果通常有无偏性、有效性和一致性等标准。 1. 无偏性无偏性的含义是个别样本由于随机原因可能偏大或偏小，然而一个好的估计量从平

8、均上看应该等于所估计的那个指标，其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。一般地，无偏性的定义为：设为被估计参数，假设有估计量( )，对一切n，有=，那么称为的无偏估计量。假设-b，那么称b为估计量的偏差。假设b0，那么称为的有偏估计量。如果，那么称为的渐近无偏估计量。不管是重复抽样或不重复抽样，也不管样本容量大小，样本均值及样本比例都是总体均值和总体比例的无偏估计，即，但样本方差并不是总体方差的无偏估计量。这是因为如果我们把定义为 =，那么：产生偏差的原因是总体方差的无偏估计应该是，但抽样时由于是的，因而用估计量来代替。根据最小平方原理，变量X距样本均值的离差平方和为最

9、小，因此就小于，从而用代替计算的方差就低估了，为了得到的无偏估计，令这时，由于，就是的无偏估计了。样本方差与之差称为偏差。但当n很大时，所以它是渐近无偏差估计。当样本容量很大时，也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就比较大了。图5-1 估计的无偏性和有效性 2. 有效性即使是符合无偏性要求的估计统计量，在抽取个别样本时也会产生误差。为了使误差尽量地小，要求估计量围绕其真值的变动愈小愈好，也就是说要求统计量的离散程度要小，或者说其方差要小。一般地，有效性的定义为：设、是参数的两个估计量，假设对任意的正常数c，有，那么称比有效。有效性反映了估计量分布的集中程度，

10、估计量的分布越是集中在参数真值附近，那么其估计效率越高，如图5-1所示。但是为了方便起见，在实际上有效性可定义为：、是参数的两个无偏估计量，假设用V()，V()分别表示各自的方差，假设V()/V()100。这表示备择假设是总体的均值大于100。或者是:100。反之，如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设，那么称作左侧检验。此时，原假设实际上变为:100，备择假设为:100。由此可见，原假设和备择假设总是排他性的。二检验的显著性水平假设检验需要确定一个是接受还是拒绝原假设的标准，这个标准就是显著性水平。所谓检验的显著性水平就表示，在假设正确的条件下落在某个界限以外的样本均

11、值所占的百分比。具体地说，“在5%的显著性水平下检验假设就是说，假定对总体参数所作的假设正确，那么样本均值同假设的总体均值差异过大的，在每100个样本中不应超过5个。如果样本均值与总体均值差异过大的超过这一数目就认为这个样本不可能抽自所假设的总体，所以拒绝零假设。我们可以用图5-4来直观地解释假设检验的原理。假设设检验的显著性水平=5%，我们在概率密度曲线下包括在假设的均值两侧直线间的是95%，两边每一个尾端的各为2.5%。于是假设样本的均值落在95%的区域内，我们就认为样本统计量与假设的总体参数的差异是不显著的。结果就接受原假设。假设样本统计量落在左右尾端的各为2.5%的区域内，那么差

12、异就是显著的。我们就拒绝原假设。接受备择假设。图5-4 假设检验的接受区域和拒绝区域不过应该强调指出，在假设检验中“接受原假设的意思仅仅是意味着没有充分的统计证据拒绝原假设。在假设检验中“接受原假设的特定含义就是不拒绝原假设。但实际上，即使样本统计量落在95%的内，也并不能证明原假设就是正确的。因为只有在知道了总体参数的真实值与假设值完全相同才能证明假设正确。但我们无法知道总体参数的真实值。在给定了检验的显著性水平后，我们可以根据假设来确定接受还是拒绝原假设的区域或范围。如果样本均值落在某一区域内我们就接受原假设，那么就称这一区域为接受区域。如果样本均值落在某一区域内就拒绝原假设，我们

13、就称这一区域为拒绝区域。对于显著性水平的选择没有一个唯一的或通用的标准。实际上在任何显著性水平下检验某个假设都是可能的，但是必须注意不管选择什么样的显著性水平，都存在假设为真而被拒绝的可能性。另一方面，在检验同一个假设时，使用的显著性水平愈高，原假设为真时而被拒绝的概率也就愈高。这就需要研究假设检验中的错误，我们在以后将对此进行讨论。二、假设检验的步骤 1. 提出原假设和备择假设。原假设和备择假设必须由题意来决定。在一般情况下总是把检验的目的作为备择假设，这样可以有充分的把握拒绝原假设。 2. 选择检验的显著性水平，从而确定检验的拒绝区域或临界点。表示在假设检验时当原假设为真而我们却拒绝了

14、原假设，接受备择假设的错误概率。假设检验中还可能犯另一种错误，这将在下面讨论。 3. 确定样本的统计量和分布。样本统计量又称检验统计量。不同的统计量具有不同的分布，用于检验不同的假设，要根据所检验的假设来正确地选择检验统计量。 4. 计算检验统计量并由此作出决策。根据样本数据计算出检验统计量的值，如果统计量的值落在拒绝区包括临界点内就说明原假设与样本所反映的情形有显著的差异，应该拒绝原假设。如果统计量的值落在接受区域内，就说明原假设与样本所反映的情形的差异并不显著，应该接受原假设。三、几种常用的假设检验一平均数的假设检验 1. 双侧检验让我们研究下面的例子。例5-4。某食品厂规定某种

15、罐头每罐的标准重量是500克。多年的经验说明这个厂每罐重量的标准差是15克。今随机抽取了49个罐头，发现这些罐头的平均重量是506克。问在=0.05的显著性水平下能否认为这批罐头的重量符合标准的要求？要检验这批罐头的重量是否符合标准的要求就是要检验这批样本的平均重量与标准重量之间是否具有明显的差异。因此可以列出要检验的假设为： :=500 :500。这是一个双侧检验问题。根据区间估计的结论可知原假设的接受区域为由于置信度水平=0.05，=1.96。由此得到接受区域为495.8，504.2。但现在样本的实际均值为506，落在拒绝区域内，因此拒绝原假设接受备择假设。我们无法认为这批罐头的重量符合标准的要求，即这批罐头的重量不符合标准的要求。当总体方差，样本数量又小于等于30时，检验统计量样本均值服从t分布。这就要用t分布确定原假设的接受区域和拒绝区域了。在得到接受区域后也就可以利用上面同样的方法，根据样本均值所处的位置作

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

第五章 统计估计和假设检验.docx