但如果在此例的假设检验中,取显著性水平a=0.02,则有P>a,这时就不能拒绝
这进一步说明,检验的结论是建立在概率的基础上的。
不能拒绝H并不一定保证H为真,只是在规定的显著性水平上不能拒绝原假设。
上面的例子说明能在0.95的置信水平上拒绝原假设,却不能在0.98的置信水平上拒绝原假设。
例8.6
其电子元件批量生产的质量标准为平均使用寿命1200小时,标准差为150小时。
某厂宣称它采用一种新工艺生产的元件质量大大超过规定标准。
为了进行验证,随机抽取20件作为样本,测得平均使用寿命为1245小时。
能否说该厂的元件质量显著高于规定标准?
★解:
首先需要规定检验的方向。
在本例中某厂称其产品质量大大超过规定标准1200小时,要检验这个宣称是否可信,因而是单侧检验。
从逻辑上看,如果样本均值低于1200小时,则元件厂的宣称会被拒绝,即使略高于1200小时,也会被拒绝。
只有当样本均值大大超过1200小时,以至于用抽样的随机性也难以解释时,才能认为该厂产品质量确实超过规定标准。
所以用右单侧检验更为适宜。
由题意可知,
并规定
,虽然n<30,但由于
已知,可以使用
z统计量。
进行检验的过程为:
因为这是右单侧检验,由图8-6可知拒绝域在右侧,查表得到临界值
由于Z=1.34在非拒绝域,所以不能拒绝
,即还不能说该厂产品质量显著高于规定标准。
若用P值检验,方法与前面相同,在Z值框内输入1.34,得到函数值为0.9099,由于是单侧检验,故P值为:
由于P>
故不能拒绝
新产品与老产品质量未表现出显著差别。
8.7
某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂作为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。
★解:
如果机器性能良好,生产出的肥皂厚度将在5cm上下波动,过薄或过厚都不符合产品质量标准,所以,根据题意这是双侧检验问题。
由于总体
未知,且样本量n较小,所以应采用t统计量。
已知条件为:
当
=0.05,自由度n-1=9时,查表得
因为t>
,样本统计量落入拒绝域,故拒绝
,接受
,说明该机器的性能不好。
8.8
一项统计结果声称,某市老年人口(年龄在65岁以上)所占的比例为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。
调查结果是否支持该市老年人口比例为14.7%的看法(a=0.05)?
★解:
这是一个双侧检验,当
有
=
由于|z|<|
|,不能拒绝
,可以认为调查结果支持了该市老年人口所占比例为14.7%的看法。
思考与联系
思考题
8.1假设检验和参数估计有什么相同点和不同点?
答:
参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。
而在参数假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
8.2什么是假设检验中的显著性水平?
统计显著是什么意思?
答:
显著性水平是一一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。
统计显著等价拒绝HO,指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。
8.3什么是假设检验中的两类错误?
答:
假设检验的结果可能是错误的,所犯的错误有两种类型,-.类错误是原假设HO为真却被我们拒绝了,犯这种错误的概率用a表示,所以也称a错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用β表示,所以也称β错误或取伪错误。
8.4两类错误之间存在什么样的数量关系?
答:
在假设检验中,a与β是此消彼长的关系。
如果减小a错误,就会增大犯β错误的机会,若减小β错误,也会增大犯a错误的机会。
8.5解释假设检验中的P值
答:
P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
(它的大小取决于三个因素,一个是样本数据与原假设之间的差异,一个是样本量,再一个是被假设参数的总体分布。
)
8.6显著性水平与P值有何区别
答:
显著性水平是原假设为真时,拒绝原假设的概率,是一个概率值,被称为抽样分布的拒绝域,大小由研究者事先确定,一般为0.05。
而P只是原假设为真时所得到的样本观察结果或更极端结果出现的概率,被称为观察到的(或实测的)显著性水平
8.7假设检验依据的基本原理是什么?
假设检验的理论依据是概率论中的小概率原理,该原理认为小概率事件在一次观察中是不可能出现的。
换言之,如果在一次调查(即观察)中发现了小概率事件,就应当作出这样的判断:
这种事件本身就不是一个小概率事件,而是一个大概率事件。
8.8在单侧检验中原假设和备择假设的方向应该如何确定?
解:
假设问题有两种情况,一种是所考察的数值越大越好(左单侧
检验或下限检验),临界值和拒绝域均在左侧;另-种是数值越小越
好(右单侧检验或上限检验),临界值和拒绝域均在右侧。
练习题
8.1已知某炼铁厂的铁水含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484。
如果估计方差没有变化,能否认为现在生产的铁水平均含碳量为4.55(a=0.05)?
8.2有一种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。
8.3某地区小麦的一般生产水平为亩产250千克,其标准差为30千克。
现用一种化肥进行试验,从25个地块抽样,平均产量为270千克。
这种化肥是否使小麦明显增产(a=0.05)?
8.4糖厂用自动打包机打包,每包的标准重量是100千克。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包重量(单位:
千克)如下:
99.398.7100.5101.298.399.799.5102.1100.5
已知每包的重量服从正态分布,试检验该日打包机工作是否正常(a=0.05)。
8.5某种大量生产的袋装食品按规定不得少于250克。
今从一批该食品中任意拍取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)?
8.6某厂家在广告中声称,该厂生产的汽车轮胎在正常条件下行驶距离超过目前的平均水平25000公里。
对一个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为27000公里和5000公里。
假定轮胎寿命服从正态分布,问该厂家的广告所声称的内容是否真实(a=0.05)?
8.7某种电子元件的寿命工服从正态分布。
现测得16只无件的寿命(单位:
小时)如下:
159280101212224379179264
222362168250149260485170
是否有理由认为元件的平均寿命显著地大于255小时(a=0.05)?
8.8随机抽取9个单位,测得结果分别为:
855966813557556366
以a=0.05的显著性水平对下述假设进行检验:
8.9A,B两厂生产同样的材料。
已知其抗压强度服从正态分布,且
从A厂生产的材料中随机抽取81个样品,测得
;从B厂生产的材料中随机抽取64个样品,测得
。
根据以上调查结果,能否认为A,B两厂生产的材料的平均抗压强度相同(
)?
8.10装配个部件可以采用不同的方法,所关心的问题是哪一个方法的效率更高劳动效率可以用平均装配时同来反映,现从不同的装配方法中各抽取12件产品,记承子自的装配时间(单位:
分钟)如下:
甲方法:
313429323538343029323126
乙方法:
262428293029322631293228
两总体为正态总体,且方差相同,间这两种方法的装配时间有无显著差别(o=0.05)?
8.11调查了339名50岁以上的人,在205名吸烟者中有43个患慢性气管炎,在134名不吸烟着中有13人患慢性气管炎。
调查数据能否支持“吸烟者容易患慢性气管类”这种观点(a=0.05)?
8.12为了控制贷款规模,某商业银行有个内部要求,平均每项贷款的效额不能超过60万元。
险着经济的发展,贷款规模有增大的趋势。
银行经理想了解在同样的项目条件下,贷款的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得5=68.1万元,s=45。
在a=0.01的显著性水平下采用P值进行检验。
8.13有一种理论认为服用河司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的22000人随机平均分成两组,一组人员每星期服用三次阿司匹林(样本1),另一组人员在相同的时间服用安慰剂(样本2)。
持续3年之后进行检测,祥本1中有104人患心脏病,样本2中有189人惠心脏病。
以a=0.05的显薯性水平检验服用阿司匹林是否可以降低心脏病发生率。
8.14某工厂制造螺栓,规定课栓口径为7.0cn.方差为0.03cm。
今从一批螺栓中拍取80个测量其口径,得平均值为6.97cm.方差为0.0375cm,假定螺检口径服从正态分布,问这批螺栓是否达到规定的要求(a=0.05)?
8.15有人说在大学中男生的学习成绩比女生的学习成绩好。
现从一所学校中随机挡取25名男生和16名女生,对他们进行相同题目的测试。
测试结果表明,男生的平均成绩为82分,方差为58分,女生的平均成绩为78分,方差为49分。
假设显著性水平a=0.02,从上述数据中能得到什么结论?
(注:
可编辑下载,若有不当之处,请指正,谢谢!
)