商务与经济统计――假设检验与总体比较(9).pptx
《商务与经济统计――假设检验与总体比较(9).pptx》由会员分享,可在线阅读,更多相关《商务与经济统计――假设检验与总体比较(9).pptx(21页珍藏版)》请在冰豆网上搜索。
第九章假设检验,生活中的统计检验的例子生活中可谓无处不在、无时不有:
买件日常用品要检验它的长度、重量;产品出厂要检验它的性能、质量;升学要检验学习成绩的优劣、功底的深厚等等。
与参数估计不同的是,对检验的对象我们并不是事先一无所知,而是已经得到过一些“宣称”,我们的工作是对此“宣称”进行核实,这便是“检验”的由来。
检验过程开始后,首先需要抽取一定大小的样本,算出对应统计量大小然后加以判断,但众所周知,样本并非总体的严格反映,不少情况下会发生总体“合格”而样本“不合格”或者总体“不合格”而样本“合格”的矛盾现象,如何从往往只能一次试验中进行判断,这便是“假设检验”的任务重点:
假设检验的基本思路、工作原理、方法特点;难点:
检验时所用的繁杂公式以及公式之间的细微差别,9.1零假设和择假设对研究性假设的检验对陈述正确性的检验对决策情况下的检验零假设和备择假设类型设表示在零假设和备择假设中考虑的某一特定数值。
一般来说,对总体均值的假设检验采取下面的三种形式之一:
9.2第一类和第二类错误第一类和第二类错误拒绝正确的原假设,简称“拒真”;第一类和第二类错误接受错误的原假设,简称“纳伪”如下所示:
总体H0正确H0错误接受H0正确结论第二类错误结论拒绝H0第一类错误正确结论我们把两类错误发生的概率表示如下:
第一错误发生的概率;第二错误发生的概率;,9.3大样本情况下总体均值的单侧检验单个总体均值的单侧检验p-值的运用假设检验的步骤总结:
单个总体均值的单尾检验大样本情形(n30)时单个总体均值的如下形式的单尾检验T-统计量:
已知T-统计量:
由s估计出拒绝法则:
使用T-统计量检验法:
拒绝H0如果z-z使用p值检验法:
拒绝H0如果p值,假设检验步骤1.建立零假设和备择假设.2.选定显著性水平.3.选定用于检验的检验统计量.使用统计量检验法4.使用显著性水平来决定拒绝原假设的临界值并叙述H0检验法则5.收集样本数据并计算统计量值.6.使用统计量的计算值并根据检验法则做出接受还是拒绝原假设H0的决定.使用p值检验法4.收集样本数据并计算统计量值.5.运用统计量的计算结果计算p值6.拒绝原假设H0如果p值.,例题:
联邦贸易委员会定期惊醒调查,目的是检验生产商们对自己产品的陈述。
例如,大听的Hilltop咖啡的标签标明:
听内至少装有3磅的咖啡,我们用假设检验来检验标签的陈述是否正确。
第一步,建立零假设和备择假设:
第二步,随机抽取36听咖啡作为样本假设36听咖啡样本的均值为磅,总体标准差为,用,检验统计量的值为:
第三步,确定拒绝域:
如果,则拒绝H0第四步,作出判断:
在0.01的显著性水平下,负责人员就有统计证据来采取行动,处理该公司的产品不足的问题,当然,如果在第二步计算出的均值发生改变,则结论应该随之也改变。
比如:
则此时统计量的值不再拒绝域内,我们不能拒绝原假设。
9.4大样本情形(n30)时单个总体均值的双侧检验双侧假设检验于单侧假设检验不同,因为前者的拒绝与分布在抽样分布的两侧。
用于双尾检验的p值总结:
单个总体均值的双尾检验大样本情形(n30)时单个总体均值的如下形式的双尾检验T-统计量:
已知T-统计量:
由s估计出拒绝法则:
使用T-统计量检验法:
拒绝H0如果zz使用p值检验法:
拒绝H0如果p值,区间估计和假设检验间的关系9.5小样本情形(n30)时单个总体均值的双尾检验样本容量较小时(n30),用样本标准差s来估计总体标准差。
入股总体具有整台概率分布也是合理的,那么就可以用t分布来推断总体的均值。
在这种情况下,检验统计量是:
p值和T统计量双尾检验9.6单个总体比例的检验有如下三种形式总体比例检验统计量为:
我们用PineCreek高尔夫球课程问题来说明总体比例的假设检验。
在过去的几个月里,在打高尔夫球的人中有20%是妇女,为了提高女性高尔夫球的比例,PineCreek采取了一项特殊的激励措施来吸引女性高尔夫球手。
一周以后,随机抽取了400名高尔夫球手作为样本,结果有300名男性和100名女性,课程经理想知道这些数据是否支持他们的结论:
PineCreek的女性高尔夫球手已有所增加?
第一步,建立零假设和备择假设:
建立相应的统计量先假设H0为真,即包括p=0.20,用样本比例来估计总体比例的标准差由下式给出:
有了假定值p=0.20,又已知样本容量n=400,则的标准差为:
由前面的理论我们知道,如果np和n(1-p)的值都大于或等于5,那么的抽样分布就可以近似看成为正态概率分布。
对于PineCreek的问题。
使用以下统计量我们假定检验的显著性水平为=0.05,查表可知,所以检验的拒绝域拒绝规则如下:
如果z1.645,则拒绝零假设H0由于PineCreek在激励措施期间,400个球手中有00个女球手,所以得,又知道,所以检验统计量的值为:
可见我们应当拒绝零假设。
一些重要的随机变量及其统计量的概率密度函数如果i.i.dx1,x2,xnN(0,1),则有:
22(n)如果i.i.dxN(0,1),y2(n),则有tt(n)如果i.i.dx2(m),y2(n),则有FF(m,n)随机变量特征值的一些重要规律
(1)E(x+y)=E(x)+E(y)
(2)E(ax)=aE(x)如果r.vx,y是i.i.d的,则有(3)E(xy)=E(x)*E(y)(4)D(x+y)=D(x)+D(y)(5)D(ax)=a2*D(x),第十章均值的比较,生活中的统计:
经常需要对两个班级同一学科考试平均成绩进行比较而不计较成绩的绝对高低;又如:
对男女两组人群进行肺活量大小的比较以鉴别二者是否存在显著差异但也不计较每组人群肺活量的绝对高低等等问题都属于均值的比较问题难点:
有关公式的理解,特别是两总体联合方差的表达形式重点:
均值比较的区间估计法10.1两个总体均值差异的估计:
独立样本的抽样分布1-2的点估计:
两总体均值之差的抽样分布的形式:
如果两个总体的样本大小都足够大,可以以正态分布来近似1-2的区间估计:
大样本情形且1,2的值已知的点估计1-2的区间估计:
大样本情形且1,2的值由s1,s2估计10.1.31-2的区间估计:
小样本情形2的合并估计,当时的点估计为则估计出的区间为:
式中,t的值基于自由度为的分布,为置信度1-2的区间估计:
小样本情形且1,2的值已知的点估计1-2的区间估计:
大样本情形且1,2的值由s1,s2估计,假设:
(1)两个总体都具有正态分布;
(2)两总体方差相等.2的合并估计当时的点估计为则估计出的区间为:
例题:
以克里夫兰国家银行所进行的一个样本研究问题为例,对该银行的两个支行顾客的独立随机样本的帐户余额进行核查,得如下结果:
支行样的帐户序号样本平均余额样本标准差CherryGroven1=12美元美元BeechMontn2=10美元美元用这些数据我们来建立两个支行帐户余额样本均值差异的置信度为90%的置信区间。
假定两个支行检查帐户余额服从正态分布,且两个支行检查帐户余额的方差相等。
用式(10.8)可以看到方差合并成:
s2=(n1-1)s12+(n2-1)s22/(n1+n2-2)=18855则有:
标准差的对应估计值为适合该区间估计过程的t分布的自由度为12+10-2=20,当=0.10时,查t分布表可得。
因此,根据前面的式子,我们看到区间估计变成:
第十一章比例的比较,生活中的统计生活中比例问题的比较例子也不少:
两个班一场考试之后的及格率需要比较;两批同样生产线不同操作流程或不同生产者生产出来的产品出厂前的合格率需要比较;饲养同样品种但方法有所不同的动物的死亡率或生存率也需要比较。
从某种意义上说,比例的比较问题就是均值的比较问题,后者是前者的特例,但侧重点又有所不同,值得单独加以研究。
11.1两个总体比例之差的推断11.1.1的抽样分布的抽样分布为期望值:
标准差来自总体的简单随机样本的样本容量来自总体的简单随机样本的样本容量,11.1.2的区间估计的点估计量为两个总体比例之差的区间估计:
大样本情况下,并且、及时式中,1-为置信系数11.1.3关于的假设检验,合适的零假设和备择假设是:
大样本情况下,抽样分布可近似为正态分布,两个总体比例之差的假设检验统计量为:
拒绝规则是:
如果或者,则拒绝实践中不知道、的值,所以需要估计,一般使用合并估计量法,又在零假设这种特殊情况下总体比例不存在差异,即所以我们可以不使用而先由下式给出的估计,再用代替、,式(11-4)就可以改写成如下形式11.2多项总体比例的假设检验拟合优度的检验统计量式中fi第i类的观察频数ei假设为真时,第i类的期望频数,多项分布拟合优度检验小结:
(1)建立零假设和备择假设。
H0总体服从类中每类都指定了概率的多项概率分布;H1总体服从类中每类都指定了概率的多项概率分布。
(2)抽取一个随机样本,记录各类的观察频数fi(3)假设零假设为真,将每类的概率乘以样本容量计算期望频数ei(4)计算检验统计量的值(5)拒绝规则如果,则拒绝H0式中,是检验的显著性水平,自由度为(k-1)11.3独立性检验:
列联表假设独立性为真时,列联表的期望频数eij=(第行的总数第列的总数)/(样本容量),独立性的检验统计量式中fij列联表中第行和第列这一类的观察频数;eij基于假设独立性为真时,列联表中第列这一类的观察频数。
独立性检验小结
(1)建立零假设和备择假设。
列变量和行变量相互独立列变量和行变量不相互独立
(2)抽取一个随机样本,记录列联表中各方格的观察频数(3)利用式(11-10)计算每个方格的期望频数。
(4)利用式(11-11)计算检验统计量的值(5)拒绝规则如果,则拒绝H0式中,是检验的显著性水平,对于n列m行的列联表,自由度为(n-1)(m-1),