置信度 置信区间.docx
《置信度 置信区间.docx》由会员分享,可在线阅读,更多相关《置信度 置信区间.docx(39页珍藏版)》请在冰豆网上搜索。
置信度置信区间
置信水平
出自MBA智库百科()
置信水平(Confidencelevel)
[显示]
∙1什么是置信水平
∙2置信水平的确定
∙3置信水平的置信度
∙4相关条目
[编辑]
什么是置信水平
置信水平来表示样本统计值的精确度,它是指样本统计值落在参数值某一正负区间内的概率。
[编辑]
置信水平的确定
但确定置信水平究竟是百分之几,则主要决定于以下两个要素:
第—要素是内部控制的健全状况和运用状况如何。
也就是说,在内部控制的完备状况和运用状况均属良好的情况下,选择80%的置信水平就可以了,但当内部控制的完备状况和运用状况并不充:
分时,就必须选择95%乃至99%的置信水平。
影响确定置信水平的另一要素是受审查公司的环境条件。
这种环境条件是指一般的经济条件、特殊的经济法律条件、受审查公司的经营组织和财务构成等。
在这些条件对受审查公司不利4如销售收入明显下降)的情况下,就应决定在依据性试验中选择较高的置信水平。
、
但是,因为环境条件的内容是多种多样的,所以,审计人员必领以高度的专业能力来进行判断,并根据这种判断来认真研究环境的条件,以决定置信水平的选择。
[编辑]
置信水平的置信度
置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。
因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。
置信水平是描述GIS中线元素与面元素的位置不确定性的重要指标之一。
置信水平表示区间估计的把握程度,置信区间的跨度是置信水平的正函数,即要求的把握程度越大,势必得到一个较宽的置信区间,这就相应降低了估计的准确程度。
置信区间
出自MBA智库百科()
置信区间(Confidenceinterval)
[显示]
∙1什么是置信区间
∙2置信区间的概述
∙3置信区间的计算步骤
∙4关于置信区间的宽窄
∙5置信区间与置信水平、样本量的关系
∙6相关条目
[编辑]
什么是置信区间
置信区间又称估计区间,是用来估计参数的取值范围的。
常见的52%-64%,或8-12,就是置信区间(估计区间)。
[编辑]
置信区间的概述
1、对于具有特定的发生概率的随机变量,其特定的价值区间:
一个确定的数值范围(“一个区间”)。
2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。
3、该区间包含了参数θ真值的可信程度。
4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。
[编辑]
置信区间的计算步骤
第一步:
求一个样本的均值
第二步:
计算出抽样误差。
人们经过实践,通常认为调查:
100个样本的抽样误差为±10%;
500个样本的抽样误差为±5%;
1,200个样本时的抽样误差为±3%;
第三步:
用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
[编辑]
关于置信区间的宽窄
窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。
假设全班考试的平均分数为65分,则
置信区间间隔宽窄度表达的意思
0-100分100宽等于什么也没告诉你
30-80分50较窄你能估出大概的平均分了(55分)
60-70分10窄你几乎能判定全班的平均分了(65分)
[编辑]
置信区间与置信水平、样本量的关系
1.样本量对置信区间的影响:
在置信水平固定的情况下,样本量越多,置信区间越窄。
实例分析:
经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):
样本量
置信区间
间隔
宽窄度
100
50%-70%
20
宽
800
56.2%-63.2%
7
较窄
1,600
57.5%-63%
5.5
较窄
3,200
58.5%-62%
3.5
更窄
由上表得出:
1、在置信水平相同的情况下,样本量越多,置信区间越窄。
2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。
通过置信区间的计算公式来验证置信区间与样本量的关系
置信区间=样本的推断值±(可靠程度系数×)
从上述公式中可以看出:
在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。
2.置信水平对置信区间的影响:
在样本量相同的情况下,置信水平越高,置信区间越宽。
实例分析:
美国做了一项对总统工作满意度的调查。
在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。
则两组数字的情况比较如下:
抽样误差
置信水平
置信区间
间隔
宽窄度
±3%
95%
60%±3%=57%-63%
6
宽
±2.3%
90%
60%±2.3%=57.7%-62.3%
4.6
窄
由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。
抽样误差(Samplingerror)
[编辑]
什么是抽样误差
在抽样检查中,由于用样本指标代替全及指标所产生的误差可分为两种:
一种是由于主观因素破坏了随机原则而产生的误差,称为系统性误差;另一种是由于抽样的随机性引起的偶然的代表性误差。
抽样误差仅仅是指后一种由于抽样的随机性而带来的偶然的代表性误差,而不是指前一种因不遵循随机性原则而造成的系统性误差。
总的说来,抽样误差是指样本指标与全及总体指标之间的绝对误差。
在进行抽样检查时不可避免会产生抽样误差,因为从总体中随机抽取的样本,其结构不可能和总体完全一致。
例如样本平均数与总体平均数之差
,样本成数与总体成数之差|p−P|。
虽然抽样误差不可避免,但可以运用大数定律的数学公式加以精确地计算,确定它具体的数量界限,并可通过抽样设计加以控制。
抽样误差也是衡量抽样检查准确程度的指标。
抽样误差越大,表明抽样总体对全及总体的代表性越小,抽样检查的结果越不可靠。
反之,抽样误差越小,说明抽样总体对全及总体的代表性越大,抽样检查的结果越准确可靠。
在统计学中把抽样误差分为抽样平均误差和抽样极限误差,下面就这两种误差分别进行阐释。
为使推理过程简化,这里不对属性总体进行分析,而仅对变量总体进行分析计算。
[编辑]
抽样误差的计算
1、表现形式:
平均数指标抽样误差;成数(比重)抽样误差。
2、平均数指标的抽样误差
1)重复抽样的条件下:
2)不重复抽样的条件下:
3、成数指标的抽样误差
1)重复抽样的条件下:
2)不重复抽样的条件下:
[编辑]
抽样误差的控制措施
抽样误差则是不可避免的,但可以减少,其措施有:
1、增加样本个案数。
2、适应选择抽样方式。
例如,在同样条件下,又重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其它方法的抽样误差小。
由于总体真正的参数值未知,真正的抽样误差也未知,所以抽样误差的计算一般都以抽样平均误差来代表真正的抽样误差。
显著性水平
出自MBA智库百科()
(重定向自显著水平)
显著性水平(SignificanceLevel)
[编辑]
什么是显著性水平
假设检验是围绕对原假设内容的审定而展开的。
如果原假设正确我们接受了(同时也就拒绝了备择假设),或原假设错误我们拒绝了(同时也就接受了备择假设),这表明我们作出了正确的决定。
但是,由于假设检验是根据样本提供的信息进行推断的,也就有犯错误的可能。
有这样一种情况,原假设正确,而我们却把它当成错误的加以拒绝。
犯这种错误的概率用α表示,统计上把α称为假设检验中的显著性水平,,也就是决策中所面临的风险。
显著性水平是假设检验中的一个概念,是指当原假设为正确时人们却把它拒绝了的概率或风险。
它是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取α=0.05或α=0.01。
这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95%或99%。
显著性水平代表的意义是在一次试验中小概率事物发生的可能性大小。
[编辑]
显著性水平的理解
显著性水平是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。
检验中,依据显著性水平大小把概率划分为二个区间,小于给定标准的概率区间称为拒绝区间,大于这个标准则为接受区间。
事件属于接受区间,原假设成立而无显著性差异;事件属于拒绝区间,拒绝原假设而认为有显著性差异。
对显著水平的理解必须把握以下二点:
1、显著性水平不是一个固定不变的数值,依据拒绝区间所可能承担的风险来决定。
2、统计上所讲的显著性与实际生活工作中的显著性是不一样的。
显著性差异
出自MBA智库百科()
显著性差异(SignificanceDifference)
[编辑]
什么是显著性差异
显著性差异是一个统计学名词。
它是统计学(Statistics)上对数据差异性的评价。
当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的。
如比西一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。
也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。
例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异,这一差异很可能来自于学××记忆法对被试记忆能力的改变。
[编辑]
显著性差异的评析
显著性差异是一种有量度的或然性评价。
比如,我们说A、B两数据在0.05水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为95%。
两个数据所代表的样本还有5%的可能性是没有差异的。
这5%的差异是由于随机误差造成的。
P-value是原假设H0真实的结论时,我们观察到样本的值有多大的概率,简称P值。
如果此值小,就下原假设为不真实的结论。
统计学上称为小概率事件,即样本不是从原假设的分布中抽出的。
一般P值大于α,则无法拒绝原假设,相反,P值小于α
如果我们是检验某实验(HypothesisTest)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(NullHypothesis)就可被推翻,对立假设(AlternativeHypothesis)得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。
假设检验
出自MBA智库百科()
假设检验(HypothesisTesting)
[显示]
∙1什么是假设检验
∙2假设检验的基本思想
∙3假设检验的原理
∙4假设检验的种类
∙5假设检验的基本思想
∙6假设检验规则与两类错误
∙7假设检验的一般步骤
∙8假设检验应注意的问题
∙9假设检验与置信区间的关系
∙10几种常见假设检验
∙11假设检验的应用分析
o11.1案例一:
假设检验设备判断中的应用[1]
o11.2案例二:
假设检验在卷烟质量判断中的应用[2]
∙12相关条目
∙13参考文献
[编辑]
什么是假设检验
假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:
一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?
再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?
这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:
μ=μ0,然后用统计的方法来计算验证你的假设是否正确。
[编辑]
假设检验的基本思想
1.小概率原理
如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
2.假设的形式
H0——原假设,H1——备择假设
双尾检验:
H0:
μ=μ0,
单尾检验:
,H1:
μ<μ0
,H1:
μ>μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。
[编辑]
假设检验的原理
一般地说,对总体某项或某几项作出假设,然后根据样本对假设作出接受或拒绝的判断,这种方法称为假设检验。
假设检验使用了一种类似于“反证法”的推理方法,它的特点是:
(1)先假设总体某项假设成立,计算其会导致什么结果产生。
若导致不合理现象产生,则拒绝原先的假设。
若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
(2)它又不同于一般的反证法。
所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:
概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。
至于怎样才算是“小概率”呢?
通常可将概率不超过0.05的事件称为“小概率事件”α,称为显著性水平。
而把原先设定的假设成为原假设,记作H0。
把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。
[编辑]
假设检验的种类
假设检验可分为正态分布检验、正态总体均值分布检验、非参数检验三类。
正态分布检验包括三类:
JB检验、KS检验、Lilliefors检验,用于检验样本是否来自于一个正态分布总体。
正态总体均值检验检验分析方法和分析结果的准确度,考察系统误差对测试结果的影响。
从统计意义上来说,各样本均值之差应在随机误差允许的范围之内。
反之,如果不同样本的均值之差超过了允许的范围,这就说明除了随机误差之外,各均值之间还存在系统误差,使得各均值之间出现了显著性差异。
正态总体均值检验分为两种情况,
t检验是用小样本检验总体参数,特点是在均方差不知道的情况下,可以检验样本平均数的显著性,分为单侧检验与双侧检验。
当为双样本检验时,在两样本t检验中要用到F检验。
从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。
若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。
Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。
上面所述的检验都是基于样本来自正态总体的假设,在实际工作中,有时并不明确知道样本是否来自正态总体,这就为假设检验带来难度。
非参数检验方法,对样本是否来自正态总体不做严格的限制,而且计算简单。
统计工具箱提供了符号检验和秩和检验两种非参数检验方法。
[编辑]
假设检验的基本思想
假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。
[编辑]
假设检验规则与两类错误
1.确定检验规则
检验过程是比较样本观察结果与总体假设的差异。
差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0。
差异
临界点
判断
c
拒绝H0
c
接受H0
怎样确定c?
2.两类错误
接受或拒绝H0,都可能犯错误
I类错误——弃真错误,发生的概率为α
II类错误——取伪错误,发生的概率为β
检验决策
H0为真
H0非真
拒绝H0
犯I类错误(α)
正确
接受H0
正确
犯II类错误(β)
α大β就小,α小β就大
基本原则:
力求在控制α前提下减少β
α——显著性水平,取值:
0.1,0.05,0.001,等。
如果犯I类错误损失更大,为减少损失,α值取小;如果犯II类错误损失更大,α值取大。
确定α,就确定了临界点c。
①设有总体:
X~N(μ,σ2),σ2已知。
②随机抽样:
样本均值\bar{X}~N(\mu,\sigma^2/n)。
③
标准化:
④确定α值,
⑤查概率表,知临界值
⑥计算Z值,作出判断。
[编辑]
假设检验的一般步骤
[编辑]
假设检验应注意的问题
1、做假设检验之前,应注意资料本身是否有可比性。
2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。
3、根据资料类型和特点选用正确的假设检验方法。
4、根据专业及经验确定是选用单侧检验还是双侧检验。
5、当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。
6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。
7、报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。
[编辑]
假设检验与置信区间的关系
假设检验与置信区间有密切的联系,我们往往可以由某参数的显著性水平为α的检验,得到该参数的置信度为1—α的置信区间,反之亦然。
例如,显著性水平α的均值μ的双侧检验问题:
H0:
μ=μ0,
与置信度为1-α的置信区间之间有着这样的关系;若检验在α水平下接受H0,则μ的1-α的置信区间必须包含μ0;反之,若检验在α水平下拒绝H0,则μ的1-α的置信区间必定不包含μ0。
因此,我们可以用构造μ的1-α置信区间的方法来检验上述假设,如果构造出来的置信区间包含μ0,就接受H0;如果不包含μ0就拒绝H0。
同样给定显著水平α,可以从构造检验规则的过程中,得到μ的1-α置信区间。
如上例,μ的置信度为95%的置信区间为:
即置信区间为(80.55,85.45),因为μ0=80,不在这个区间内,拒绝H0
[编辑]
几种常见假设检验
考虑下面三种类型的假设检验:
(4.12)
(1)
(双边检验)
(2)
(右侧单边检验)
(3)
(左侧单边检验)
[编辑]
假设检验的应用分析
[编辑]
案例一:
假设检验设备判断中的应用[1]
例如:
某公司想从国外引进一种自动加工装置。
这种装置的工作温度X服从正态分布(μ,52),厂方说它的平均工作温度是80度。
从该装置试运转中随机测试16次,得到的平均工作温度是83度。
该公司考虑,样本结果与厂方所说的是否有显著差异?
厂方的说法是否可以接受?
类似这种根据样本观测值来判断一个有关总体的假设是否成立的问题,就是假设检验的问题。
我们把任一关于单体分布的假设,统称为统计假设,简称假设。
上例中,可以提出两个假设:
一个称为原假设或零假设,记为H0:
μ=80(度);另一个称为备择假设或对立假设,记为H1:
μ≠80(度)这样,上述假设检验问题可以表示为:
H0:
μ=80 H1:
μ≠80
原假设与备择假设相互对立,两者有且只有一个正确,备择假设的含义是,一旦否定原假设H0,备择假设H1备你选择。
所谓假设检验问题就是要判断原假设H0是否正确,决定接受还是拒绝原假设,若拒绝原假设,就接受备择假设。
应该如何作出判断呢?
如果样本测定的结果是100度甚至更高(或很低),我们从直观上能感到原假设可疑而否定它,因为原假设是真实时,在一次试验中出现了与80度相距甚远的小概率事件几乎是不可能的,而现在竟然出现了,当然要拒绝原假设H0。
现在的问题是样本平均工作温度为83度,结果虽然与厂方说的80度有差异,但样本具有随机性,80度与83度之间的差异很可能是样本的随机性造成的。
在这种情况下,要对原假设作出接受还是拒绝的抉择,就必须根据研究的问题和决策条件,对样本值与原假设的差异进行分析。
若有充分理由认为这种差异并非是由偶然的随机因素造成的,也即认为差异是显著的,才能拒绝原假设,否则就不能拒绝原假设。
假设检验实质上是对原假设是否正确进行检验,因此,检验过程中要使原假设得到维护,使之不轻易被否定,否定原假设必须有充分的理由;同时,当原假设被接受时,也只能认为否定它的根据不充分,而不是认为它绝对正确。
[编辑]
案例二:
假设检验在卷烟质量判断中的应用[2]
在卷烟生产企业经常会遇到如下的问题:
卷烟检验标准中要求烟支的某项缺陷的不合格品率P不能超过3%,现从一批产品中随机抽取50支卷烟进行检验,发现有2支不合格品,问此批产品能否放行?
按照一般的习惯性思维:
50支中有2支不合格品,不合格品率就是4%,超过了原来设置的3%的不合格品率,因此不能放行。
但如果根据假设检验的理论,在α=0.05的显著性水平下,该批产品应该可以放行。
这是为什么呢?
最关键的是由于我们是在一批产品中进行抽样检验,用抽样样本的质量水平来判别整批的质量水平,这里就有一个抽样风险的问题。
举例来说,我们的这批产品共有10000支卷烟,里面有4支不合格品,不合格品率是0.04%,远低于3%的合格放行不合格品率。
但我们的检验要求是随机抽样50支,用这50支的质量水平来判别整批10000支的质量水平。
如果在50支中恰好抽到了2支甚至更多的不合格品,简单地用抽到的不合格品数除以50来作为不合格品率来判断,那我们就会对这批质量水平合格的产品进行误判。
如何科学地进行判断呢?
这就要用到假设