统计假设检验的基本思想和概念.docx
《统计假设检验的基本思想和概念.docx》由会员分享,可在线阅读,更多相关《统计假设检验的基本思想和概念.docx(18页珍藏版)》请在冰豆网上搜索。
![统计假设检验的基本思想和概念.docx](https://file1.bdocx.com/fileroot1/2023-2/2/270a8729-3f31-4d80-9b78-76036fa8fad4/270a8729-3f31-4d80-9b78-76036fa8fad41.gif)
统计假设检验的基本思想和概念
统计假设检验的基本思想和概念
本章主要介绍统计假设检验的基本思想和概念以及参数的假设检验方法。
8.1假设检验的基本思想和概念
(一)统计假设的概念
为了引入统计假设的概念,先请看例8-1。
例8-1味精厂用一台包装机自动包装味精,已知袋装味精的重量,机器正常时,其均值=0.5(0.5,0.015的单位都是公斤)。
某日开工后随机抽取9袋袋装味精,其净重(公斤)为:
0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512
问这台包装机是否正常?
【答疑编号:
10080101针对该题提问】
此例随机抽样取得的9袋味精的重量都不正好是0.5公斤,这种实际重量和标准重量不完全一致的现象,在实际中是经常出现的。
造成这种差异不外乎有两种原因:
一是偶然因素的影响,二
是条件因素的影响。
由于偶然因素而发生的(例如电网电压的波动、金属部件的不时伸缩、衡量仪器的误差而引起的)差异称为随机误差;由于条件因素(生产设备的缺陷、机械部件的过度损耗)而产生的差异称为条件误差。
若只存在随机误差,我们就没有理由怀疑标准重量不是0.5公斤;如果我们有十足的理由断定标准重量已不是0.5公斤,那么造成这种现象的主要原因是条件误差,即包装机工作不正常,那么,怎样判断包装机工作是否正常呢?
我们通过解例8-1来找出解假设检验问题的思想方法。
解已知袋装味精重,假设现在包装机工作正常,即提出如下假设:
,
这是两个对立的假设,我们的任务就是要依据样本对这样的假设之一作出是否拒绝的判断。
由于样本均值是的一个很好的估计,故当为真时,应很小。
当
过分大时,我们就应当怀疑不正确而拒绝。
怎样给出的具体界限值呢?
当为真时,由于,对于给定的很小的数0<α<1,例如取α=0.05,考
其中是标准正态分布上侧分位数,而事件
(8.1.1)是一个小概率事件,小概率事件在一次试验中几乎不可能发生。
我们查附表1得,又n=9,=0.015,由样本算得,又由(8.1.1)
得:
小概率事件居然发生了,这与实际推断原理相矛盾,于是拒绝,而认为这台包装机工作不正常。
从上面的例8-1中,我们看出为了对总体的某一参数进行检验,通常提出两个对立假设。
然后引入一个与被检参数有关的服从某种分布的统计量,根据事先给出的一概率标准α(叫显著水平)用反证法进行判断,由于小概率事件一般是不会发生的,如果引进的样本
是一个小概率事件,因为它的确出现了,则可认为假设不能接受,否则便接受
。
(二)假设检验的程序
根据以上的讨论与分析,可将假设检验的基本步骤概括如下:
(1)根据实际问题提出原假设及备择假设。
这里要求与有且仅有一个为真。
(2)选取合适的统计量,即要求所选的统计量与假设无关且服从某种分布,常见的有
标准正态分布t(n-1)分布,(n-1)分布及F(m,n)公布。
(3)规定小概率标准α的大小,也叫显著水平,通常可取
α=0.01,α=0.05或α=0.1。
(4)在显著水平α下,根据统计量的分布将样本空间划分为两部分,其一是接受的叫接受域,另一个是拒绝的叫拒绝域,记为W。
(5)根据样本值计算统计量的大小。
(6)作出判断:
若统计量的观测值落在拒绝域W内。
则知小概率事件发生了,拒绝,
接受。
若统计量的观测值落在接受域则认为小概率事件没有发生,可以接受拒绝。
8.2总体均值的假设检验
本节讨论的总体均值的假设检验,多数是在正态总体下进行的。
8.2.1u检验
1.方差已知时,单个正态总体均值检验
设x1,⋯,xn是从正态总体中抽取的一个样本,是已知常数,欲检验假设:
,
其中为已知数,它的程序:
1)提出假设2)引入统计量3)规定显著水平α,查标准正态分布表求的上侧分位数为临界值,写出相应的拒绝
其中常用的有α=0.1时,
α=0.05时,
α=0.01时,
4)根据样本值x1,x2,⋯,xn计算统计量u。
5)判断:
若u落入拒绝域W内时,则拒绝接受,
若u落入接受域内时,则接受,拒绝。
例8-2某产品的重量X~N(12,1)(单位:
克),更新设备后,从新生产的产品中抽样100件,测试样本均值(克),如果产品的方差没有改变,请问更新设备后,产品的平均重量是否有明显变化?
(α=0.01)
【答疑编号:
10080102针对该题提问】
解
(1)设
2)引入
(3)根据α=0.01,查标准正态分布函数表,得的上侧分位数
∴拒绝域为(-∞,-2.58),(2.58,+∞)
4)计算5)∵u落入拒绝域W中,故拒绝,即有明显差别。
2.方差已知时,两个正态总体值差的检验
设,其中为已知常数。
x1,⋯,xm和y1,⋯,yn分别是
取自X和Y的样本且相互独立。
欲检验假设:
检验假设,等价于检验假设。
而是的一个好估计量,且当为真时,有
于是对给定的水平α,查附表1,可得临界值,使
,(8.2.2)
从而得拒绝域
若u∈W,则拒绝;否则接受。
由上述讨论可知,由服从标准正态分布的检验统计量作检验的方法称为u检验法。
例8-3设从中各抽样25件
测得=90,=89。
设X,Y独立,请问是否可以认与基本相同?
(α=0.05)
【答疑编号:
10080103针对该题提问】解
(1)
(2)引进统计量
(3)根据α=0.05,查标准正态分布函数表将
∴拒绝域W为(-∞,-1.96),(1.96,+∞)
8.2.2t检验
1.方差未知时,单个正态总体均值检验
设x1,⋯,xm是从正态总体中抽取的一个样本,其中未知,欲检验
1),其中为已知数。
(3)给定显著水平α,查t(n-1)表求分位数
则拒绝域
(4)根据样本x1,x2,⋯,xn计算
(5)若t落在拒绝域W内,则拒绝,接受。
若t未落在拒绝域内,则接受,拒绝。
例8-4车辆厂生产的螺杆直径X服从正态分布,现从中抽取5枝,测得直径(单位:
毫米)为22.3,21.5,22.0,21.8,21.4。
如果未知,试问直径均值=21是否成立?
(α=0.05)
【答疑编号:
10080104针对该题提问】解检验假设
(1),
由样本观测值算得
(2),
(3)计算
(4)根据α=0.05,查t(n-1)分布表
临界值。
∴拒绝域为
(5)∵t=4.87在拒绝域内
∴否定,接受。
即认为直径均值不是21。
2.方差未知时,两个正态总体均值检验
设和分别是取自X和Y的样本且相互
独立。
1)(未知)。
欲检验假设
(2)构造统计量
。
t即为我们构造的检验统计量。
这时,对给定的水平α,查附表3可得临界值
,
使
,
即得拒绝域
。
例8-5在漂白工艺中考察温度对针织品断裂强度的影响,现在70℃与80℃下分别作8次和6次试验,测得各自的断裂度X和Y的观测值。
经计算得,
。
根据以往的经验,可认为X和Y均服从正态分布,且
方差相等,在给定α=0.10时,问70℃与80℃对断裂强度的无显著差异?
【答疑编号:
10080105针对该题提问】
解由题设,可假定,于是若作统计假设为两个温度下
α=0.10,查得t(m+n-2)=t(12)表,得临界值。
∴拒绝域W为(-∞,-1.782)∪(1.782,+∞)
4)计算
(5)因为t落在拒绝域W内,所以拒绝,接受。
即认为断裂强度有明显差别。
8.3正态总体方差的假设检验
在实际问题中,有关方差的检验问题也是常遇到的,如上节介绍的u检验和t检验中均与方差有密切的联系。
因此,讨论方差的检验问题尤为重要。
8.3.1检验
设总体未知,x1,⋯,nx为取自X的样本,欲检验假设
很小,则应否定H0,因此构造检验统计量
。
。
对于给定的显著水平α,可查(n-1)表可得分位数
∴拒绝域W为。
若统计量落在拒绝域W内,则拒绝,接受。
若统计量落在接受域内,则接受,拒绝。
例8-6设某厂生产铜线的折断力,现从一批产品中抽查10根测其折断力后经计算得样本均值=575.2,样本方差s2=68.16。
试问能否认为这批铜线折断力的方差仍为82(公斤)(取α=0.05)?
【答疑编号:
10080201针对该题提问】
解按题意,欲检验假设
(1),
(2)引进统计量
(3)根据α=0.05,查(n-1)=(9)表得临界值
于是得拒绝域
(4)。
(5)计算
由于不在拒绝域W内,故不拒绝,即可认为该批铜线折断力的方差与82(公斤)无显著差异。
8.3.2F检验
前面介绍的用t检验法检验两个独立正态总体的均值是否相等时,曾假定它们的方差是
相等的。
一般说来,两个正态总体方差是未知的,那么,如何来检验两独立正态总体方差是否相等呢?
为此介绍F检验法。
设有两正态总体和分别是取自X和Y的
样本且相互独立。
欲检验统计假设
。
由于是的无偏估计,是的无偏估计,当为真时,自然想到和应该差不多,
其比值不会太大或大小,现在关键在于统计量
服从什么分布。
由§6.3节定理6-4推论
我们知道,当为真时,
这样,取F为检验统计量,对给定的水平α,查附表5,确定临界值使
即得拒绝域
。
若由样本观测值算得F值,当F∈W时,拒绝,即认为两总体方差有显著差异。
否则认
为
与相容,即两总体方差无显著差异。
例8-7设甲、乙两台机床加工同一种轴,从这两台机床加工的轴中分别抽取若干根,测得直径数据如下
假定各台机床加工轴的直径X,Y分别服从正态分布,试比较甲、乙两台机床加工轴的精度有无显著差异(取α=0.05)。
【答疑编号:
10080202针对该题提问】
解按题意,本题是要检验两正态总体的方差是否相等,即要检验统计假设
1)
2)引入统计量
3)根据α=0.05查F(7,6)表得
4)计算
于是
∴拒绝域W为(0,0.195)∪(5.70,+∞)
(5)∵F不在拒约域W内,
∴接受,即方差无明显差别。
8.4单边检验
实际问题中,有时我们只关心总体的均值是否会增大,例如,试验新工艺以提高产品的质量,如材料的强度、元件的使用寿命等,当然,总体的均值越大越好,此时,需要检验假设。
。
其中是已知常数。
类似地,如果只关心总体的均值是否变小,就需要检验假设
,
下面以单个正态总体方差已知情况为例,来讨论均值的单边检验的拒绝域。
设总体为已知。
x1,⋯,xn,是取自X的一个样本,给定检验水平,α考虑单边假设问题。
,
由于是的无偏估计,故当为真时,不应太大,而当u偏大时应拒绝,
故拒绝域的形式为:
,c待定,
由于,故可找临界值α,
因此,
件。
由事件
如果根据所给的样本观测值,x1,⋯,xn算出
,则应该否定原假设,即
仍取
为检验统计量,但拒绝域为
即当由样本观测值算出
时,则应拒绝原假设
是一个小概率事件知,事件
更是一个小概率事
拒绝域为
W=(uα,+∞)。
时,我们不否认原假设
类似地,对于单边假设检验问题:
,
W=(-∞,-uα),
我们已注意到,上述
单边检验问题,与单个正态总体方差情况的均值的双边检验问题
因此,若遇上本章§8.2,§8.3中相应的单边检验问题,
一样,其所用的检验统计量和检验步骤完全相同,不同的只是拒绝域。
我们着重指出:
单边检验问题的拒绝域,其不等式的取向,与备择假设的不等式取向完全一致。
这一特有的性质使我们无需特别记忆单边检验的拒绝域。
则只要作类似的处理就行了,例如:
设总体,欲检验统计假设
,
其中为已知数。
这时,由双边检验问题中的检验知。
检验统计量可取。
若由样本观测
值算出,则当时拒绝,即拒绝域为,此不等式取向与备择假设取向一致。
若欲检验
则检验统计量仍取,拒绝域为:
,即W=(0,)
类似地,两个总体和分别是取自X
和Y的样本且相互独立。
欲检验统计假设
。
这时,类似于双边检验问题,检验统计量可取,拒绝域为,
即。
各种统计假设检验情况(检验水平为α)如表8-4所示。
表8-4
检验法
H0
H1
检验统计量
自由度
拒绝域
条件
u检
已知
验
已知
n-1
已知
检
未知
未知但
验
相等
m+n-2
n
检
F>Fα
已知
验
n-1
F已知
未知
对应重复上面
例8-8用某种农药施入农田中防治病虫害,经三个月后土壤中如有5ppm以上的浓度时,认为仍有残效,现在一大田施药区随机取10个土样进行分析,其浓度为:
4.8,3.2,2.0,
6.0,5.4,7.6,2.1,2.5,3.1,3.5(单位:
ppm)。
问该农药经三个月是否仍有残效(土壤残余农药浓度服从正态分布α=0.05)?
【答疑编号:
10080203针对该题提问】
解显然,我们关心的只是总体均值是否小于,这时若用双边检验是不恰当有,所以我们应该检验。
这时,检验统计量应取,对于给定的显著性水平α=0.05,查t分布表得
由样本算得T的观测值
t=-1.45>-1.83,
不能拒绝H0,即没有理由怀疑该农药已无残效。
例8-9某类钢板每块的重量X服从正态分布,其一项质量指标是钢板重量的方差不得超过0.016kg2。
现从某天生产的钢板中随机抽取25块,得其样本方差s2=0.025kg2,问该天
生产的钢板重量的方差是否满足要求?
【答疑编号:
10080204针对该题提问】
解这是一个关于正态总体方差的单侧检验问题,原假设,
备择假设为,此处n=25。
若取α=0.05,则查表知,现计算可得
。
由此,在显著水平
要求。
0.05下,我们拒绝原假设,认为该天生产的钢板重量的方差不符合
例8-10有一批枪弹,其初速度,其中=950m/s,=10m/s。
经过较长时
间储存后,现取出9发枪弹试射,测其初速度,得样本值如下(单位:
m/s):
914,920,910,934,953,945,912,924,940。
问这批枪弹在显著性水平α=0.05下,其初速度是否起了变化(假定没有变化)?
【答疑编号:
10080205针对该题提问】
解由题设,要检验的假设为,因为枪弹储存后初速度不可能
增加,所以是(左侧)单边检验问题,由n=9,易另算出
查表知
-uα=-u0.05=-1.65,
所以
u=-6.6<-1.65=-uα,
故应拒绝H0而接受,即认为这批枪弹经过较长时间储存后初速度已经变小
了。
8.5两类错误
通过上面分析可知,一个假设检验问题,是要先给定一个原假设H0与备择假设H1,选
出一个合适的检验统计量T,由此给出拒绝域W内。
再根据在总体抽样得到的样本值(x1,x2,⋯,xn),看它是否落入由检验统计量T定出的拒绝域W内。
当(x1,x2,⋯,xn)∈W时,就拒绝H0(即接受H1);而当(x1,x2,⋯,xn)∈W时,接受H0。
这样的假设检验有可能犯错误。
数理统计的任务本来是用样本去推断总体,即从局部去推断整体,当然有可能犯错误。
我们来分析会犯什么类型的错误。
一类错误是:
在H0成立的情况下,样本值落入了W,因而H0被拒绝,称这种错误为第一类错误,又称为拒真错误,一般记犯第一类的概率为α。
另一类错误是:
在H0不成立的情况下,样本值未落入拒绝域W,因而H0被接受,称
这种错误为第二类错误,又称为取伪错误,并记犯第二类错误的概率为。
第一类错误在例8-1中我们分析过。
因为
在H0成立条件下,根据样本值算得的u满足“”,即样本值落入拒绝域W,从而
拒绝了H0。
由此可见,犯第一类错误的概率即为α,而α即为显著性水平。
一般地,有
,
要寻找合适的检验统计量T,使得由它定出的拒绝域W满足犯第一类错误的概率不超
过α,犯第二类错误的概率为
现列表说明两类错误,见表8-1。
表8-1
人们当然希望在假设检验问题中犯两类错误的概率都尽可能小,然而在样本容量固定时是做不到的。
人们发现:
(1)两类错误的概率是相互关联的。
当样本容量n固定时,一类错误的概率的减少将
导致另一类错误的概率的增加。
(2)要同时降低两类错误的概率,需要增大样本容量n。
本章小结
(一)理解假设检验的基本思想,知道假设检验的步骤。
(二)知道两类错误
这是本章主要重点。
三)掌握单个正态总体的均值和方差的检验方法,并会简单应用,
四)两个正态总体会检验
1),
2),
本章作业
教材170页。
习题8.1
1,2
教材175页。
习题8.21,2,3,4,5,6,7,8教材179页。
习题8.31,2,4
教材183页。
习题8.4
教材183页。
自测题8一,二(1,2,3),三,四
本文资料均可编辑,只适合个人使用,不能用于商业。
资料一般需要结合本公司的实际情况,进行修改和调整。
主要目的在于给您的工作提供一定的参考和灵感,而非直接供您使用。
仅此提醒,最好的一定是根据公司的实际情况设计出来的。