比率p的假设检验Word格式.docx
《比率p的假设检验Word格式.docx》由会员分享,可在线阅读,更多相关《比率p的假设检验Word格式.docx(11页珍藏版)》请在冰豆网上搜索。
Keywords:
hypothesistesting;
theoverallrate;
teststatistics;
rejectionregion
1、假设检验的基本问题
(一)假设检验的概述
(二)假设检验的基本步骤
(三)检验的P值
二、总体比率的假设检验及其应用
(一)单个总体比率的假设检验
1.单个总体比率的精确检验及其应用
2.单个总体比率的大样本检验及其应用
(二)两个总体比率的假设检验
1.两个总体比率之差的精确检验及其应用
2.两个总体比率之差的大样本检验及其应用
一、假设检验的基本问题
假设检验是统计推断的一项重要组成部分,它在各种统计方法中都有极其重要的应用。
假设检验通过首先对总体参数提出的一个假设,然后利用样本信息推断这个假设是否成立这样一个过程,来判断承认还是拒绝该假设。
1.建立假设
在假设检验中,通常把被检验的假设叫做原假设,用表示,当原假设被拒绝时接受的假设叫做备择假设,用表示。
在任一假设检验中,原假设与备择假设都是相互对立的,且二者只能居其一。
2.选择检验统计量
建立假设后,对于是否接受原假设则需要根据某一统计量出现的数值,从概率意义上判断来完成,这个统计量称为检验统计量。
3.显著性水平
检验的结果不一定是真实的情况,所以说,检验是有可能犯错误的。
在假设检验中可能会犯的错误有两类:
一是原假设为真却拒绝原假设,称这种错误为第一类错误,其发生的概率叫做犯第一类错误的概率,或称为拒真概率,在假设检验中把犯第一类错误的概率称为显著性水平,通常用表示,即
另一种错误是原假设为假却接受原假设,称这种错误为第二类错误,其发生的概率叫做犯第二类错误的概率,或称为受伪概率,通常用表示,即
这两类错误之间也存在着这样的关系:
当减小时,会随之增大;
当减小时,会随之增大。
这个现象不是偶然的,而具有一般性,也就是说,在样本容量不变的前提下,找到一个使和都减小的检验是不可能的,唯一能使和同时减小的方法是增大样本容量。
在假设检验中,发生哪一类错误的后果更为严重,就应首先减小哪类错误发生的概率,通常情况下允许犯第一类错误的概率,尽量减小犯第二类错误的概率,一般取和,表示发生的概率很小。
4.给出拒绝域
拒绝域是指使原假设被拒绝的样本观测值所在的区域,用表示。
若统计量的值落在拒绝域内,则拒绝原假设;
反之,则接受原假设。
5.由样本值计算结果
(三)检验的值
假设检验的判断还有另外一种形式,即计算检验的值,检验的值就是在一个假设检验中,可以利用样本观测值做出拒绝原假设的最小显著性水平。
将检验的
值与心目中的显著性水平进行比较,就可以很容易的做出检验的结论。
判断如下:
如果,则在显著性水平下拒绝原假设;
如果,则在显著性水平下接受原假设。
二、总体比率的假设检验及其应用
下文所提到的比例可将其看作某事件发生的概率,即为两点分布中的参数。
做次独立试验,用标记事件发生的次数,则。
(1)设为两点分布的样本,考虑右侧假设检验:
,给出拒绝域,由于为整数,所以取非负整数值。
但是对于给定的,不一定找到恰好的,使
对此情况比较常见的办法是,找一个,使
若取,相当于提高检验的显著性水平,若取,则相当于降低检验的显著性水平,由于取可以保证的左侧不大于,所以取可得到水平为的检验。
由此可以类似推出,对于假设检验问题检验的拒绝域可以为为满足的最大正整数。
对于假设检验问题检验的拒绝域为其中为满足的最大整数,为满足的最小整数。
(2)应用
例1.1.1在一次模拟考试后,某班级的班主任对这次的成绩做了一次统计,统计结果发现有的同学达到了80分以上,现从该班级随机抽取20名同学,其中有5位同学成绩在80分以上。
在显著性水平下,能否认为这次的统计结果属实?
解:
由题意可知:
这是一个关于单个总体比率的双侧假设检验问题,由于,故可用精确检验的方法进行检验。
设该班级学生成绩达到80分以上的比率为p,x表示20名学生中成绩达到80分以上的人数,则。
现建立假设:
拒绝域为:
下求和
由前面可知:
为满足的最大整数,为满足的最小整数,又因
故,又有
故,所以拒绝域为,由于观测值5不在拒绝域内,也就是说未落入拒绝域,即接受原假设,可以认为这次的统计结果属实。
例1.1.2某工厂在一次对产品质量的调查中显示,该产生产的产品优质品率不低于,为了验证这一结论,该产随机从生产的产品中抽取了15件产品,其中发现有3件是优质品。
问:
在显著性水平下,能否认为这次的调查结果属实?
并给出检验的值。
这是一个关于总体比例的左侧的假设检验。
设表示该工厂产品的优质品率,表示抽取的15件产品中的优质品数,则可有。
先建立假设:
检验的拒绝域为:
,下计算的值。
由于,所以可取,检验的拒绝域为,因题中得到的优质品数为3,未落入拒绝域,故接受原假设,可以认为这次的调查结果属实。
本题也可通过计算检验的值得出结论,用表示服从二项分布的随机变量,则检验的
值为:
由于检验的P值,故接受原假设,所以可以认为这次的调查结果属实。
2.单个总体比率的大样本检验及其应用
(1)设样本取自两点分布总体其中表示样本比例,为对总体比率的某一假设值。
当很大,和都大于5时,样本比例近似服从均值为,方差为的正态分布,而标准化检验统计量,则近似服从标准正态分布。
在给定显著性水平的条件下,表1总结了大样本情况下总体比例检验的一般方法。
表1.大样本情况下单个总体比率的检验方法
双侧检验
左侧检验
右侧检验
假设形式
检验统计量
例1.2.1政府在对消费者的一项调查中表明,的居民的早餐饮料是牛奶。
某一城市的牛奶商却认为,该城市的居民早餐饮用牛奶的比例应该更高。
为了证明这一说法,该生产商随机抽取了一个500人的随机样本,其中有120人早餐饮用牛奶。
在的显著水平下,检验该生产商的说法是否属实?
由题意可知,这是一个右侧检验。
要证实生产商的说法是否属实,即要证明早餐引用牛奶的人数比例是否大于,由于,样本比例,大于30,和都大于5,故可用正态分布逼近。
检验统计量为:
由于,经查表有,因为,落入了拒绝域,故拒绝原假设,即该生产商的说法属实,也就是可以认为这个城市的拒绝早餐饮用牛奶的比例高于
。
例1.2.2某位关心空气保护的公共福利社团的代表人宣称:
“在工业发展日渐迅速的今天,空气污染成了人们关心的大问题。
在某一工业区域内,能够遵守政府制定的空气污染标准法则的工厂不足,但是环境保护局的负责人却认为至少有的工厂是遵守这个标准法则的。
因此这个环境保护局的负责人从这个工业区内随机选取了70家工厂,并且发现其中的42家是遵守这个法则的。
在显著性水平为下,验证真正的比率是否少于?
由题意可知,此题为一左侧检验。
样本比率,已知大于30,均大于5,故可以用正态分布逼近。
建立假设:
由于,,且,未落入拒绝域,因此不能否定原假设,即使观察的样本比率少于,但也不能否定遵守法则的工厂的真正比率不少于这个原假设,所以可以认为,真正的比率并未少于。
(二)两个总体比率的假设检验
(1)设两个独立样本和分别取自二项分布总体和,其中和分别为两个独立总体的比例,和分别为它们的样本比例,且的数学期望和标准差分别为:
在上式中,和分别表示两个总体的样本容量。
当,,和都大于或等于5时,由中心极限定理可知,近似地服从正态分布。
由于两个总体的比例和是未知的,则需要用两个样本的比例和估计,即两个样本比例之差抽样分布的标准差。
此时有:
对于两个总体比率之差的检验分为两种情况:
一种是检验两个总体比率之差是否为0,当原假设成立时,即的最佳估计量是将两个样本的结果联合起来,得到一个合并的比例,其中,表示样本1中具有某种特征单位的个数,表示样本2中具有某种特征单位的个数。
故两个总体比率之差的检验统计量就可以表示为:
第二种情况是:
两个总体比率之差为某一不为0的常数,即时,在这种情况下可以直接用两个样本的比例和相应估计两个总体的的比例和,继而得到两个总体比率之差的检验统计量为:
由上面的推导计算可以将两个总体比率之差的大样本检验方法概括在表2中。
表2.两个总体比率的大样本检验方法
右侧检验
检验
检验
例2.2.1政府对某一行业的两个公司进行了一项调查,调查内容为这两个公司的员工是希望得到特定增加的基本工资,还是希望得到特定增加的各种福利费用。
在A公司随机抽取的180名员工中,有80人愿意增加各种福利费用;
在B公司随机抽取的250名员工中,有120人希望增加各种福利费用。
在显著水平下,是否可以认为这两个公司中希望增加各种福利费用的员工比例有显著差异?
由题意可知,这是一个两个总体比例是否为0的假设检验。
已知,,。
由于