标准偏差与相对标准偏差.docx
《标准偏差与相对标准偏差.docx》由会员分享,可在线阅读,更多相关《标准偏差与相对标准偏差.docx(13页珍藏版)》请在冰豆网上搜索。
标准偏差与相对标准偏差
尺度偏差
宇文皓月
出自MBA智库百科(
尺度偏差(也称尺度离差或均方根差)是反映一组丈量数据离散程度的统计指标。
是指统计结果在某一个时段内误差上下动摇的幅度。
是正态分布的重要参数之一。
是丈量变动的统计测算法。
它通常不必作独立的指标而与其它指标配合使用。
尺度偏差在误差理论、质量管理、计量型抽样检验等领域中均得到了广泛的应用。
因此,尺度偏差的计算十分重要,它的准确与否对器具的不确定度、丈量的不确定度以及所接收产品的质量有重要影响。
然而在对尺度偏差的计算中,很多人不管丈量次数多少,均按贝塞尔公式计算。
样本尺度差的暗示公式
数学表达式:
∙S-尺度偏差(%)
∙n-试样总数或丈量次数,一般n值不该少于20-30个
∙i-物料中某成分的各次丈量值,1~n;
尺度偏差的使用方法
z
∙在价格变更剧烈时,该指标值通常很高。
∙如果价格坚持平稳,这个指标值不高。
∙在价格发生剧烈的上涨/下降之前,该指标值总是很低。
尺度偏差的计算步调
尺度偏差的计算步调是:
步调一、(每个样本数据-样本全部数据之平均值)2。
步调二、把步调一所得的各个数值相加。
步调三、把步调二的结果除以(n-1)(“n”指样本数目)。
步调四、从步调三所得的数值之平方根就是抽样的尺度偏差。
六个计算尺度偏差的公式[1]
尺度偏差的理论计算公式
设对真值为X的某量进行一组等精度丈量,其测得值为l1、l2、……ln。
令测得值l与该量真值X之差为真差占σ,则有 σ1=li−X
σ2=l2−X
……
σn=ln−X
我们定义尺度偏差(也称尺度差)σ为
(1)
由于真值X都是不成知的,因此真差σ占也就无法求得,故式只有理论意义而无实用价值。
尺度偏差σ的经常使用估计—贝塞尔公式
由于真值是不成知的,在实际应用中,我们经常使用n次丈量的算术平均值
来代表真值。
理论上也证明,随着丈量次数的增多,算术平均值最接近真值,当
时,算术平均值就是真值。
于是我们用测得值li与算术平均值
之差——剩余误差(也叫残差)Vi来代替真差σ,即
设一组等精度丈量值为l1、l2、……ln
则
……
通过数学推导可得真差σ与剩余误差V的关系为
将上式代入式
(1)有
(2)
式
(2)就是著名的贝塞尔公式(Bessel)。
它用于有限次丈量次数时尺度偏差的计算。
由于当
时,
可见贝塞尔公式与σ的定义式
(1)是完全一致的。
应该指出,在n有限时,用贝塞尔公式所得到的是尺度偏差σ的一个估计值。
它不是总体尺度偏差σ。
因此,我们称式
(2)为尺度偏差σ的经常使用估计。
为了强调这一点,我们将σ的估计值用“S”暗示。
于是,将式
(2)改写为
(2')
在求S时,为免去求算术平均值
的麻烦,经数学推导(过程从略)有
于是,式(2')可写为
(2")
按式(2")求S时,只需求出各测得值的平方和
和各测得值之和的平方艺
即可。
尺度偏差σ的无偏估计
数理统计中定义S2为样本方差
数学上已经证明S2是总体方差σ2的无偏估计。
即在大量重复试验中,S2围绕σ2散布,它们之间没有系统误差。
而式(2')在n有限时,S其实不是总体尺度偏差σ的无偏估计,也就是说S和σ之间存在系统误差。
概率统计告诉我们,对于服从正态分布的正态总体,总体尺度偏差σ的无偏估计值
为
(3)
令
则
即S1和S仅相差一个系数Kσ,Kσ是与样本个数丈量次数有关的一个系数,Kσ值见表。
计算Kσ时用到
Γ(n+1)=nΓ(n)
Γ
(1)=1
由表1知,当n>30时,
。
因此,当n>30时,式(3')和式(2')之间的差别可略而不计。
在n=30~50时,最宜用贝塞尔公式求尺度偏差。
当n<10时,由于Kσ值的影响已不成忽略,宜用式(3'),求尺度偏差。
这时再用贝塞尔公式显然是不当的。
尺度偏差的最大似然估计
将σ的定义式
(1)中的真值X用算术平均值
代替且当n有限时就得到
(4)
式(4)适用于n>50时的情况,当n>50时,n和(n-1)对计算结果的影响就很小了。
2.5尺度偏差σ的极差估计由于以上几个尺度偏差的计算公式计算量较大,不宜现场采取,而极差估计的方法则有运算简便,计算量小宜于现场采取的特点。
极差用"R"暗示。
所谓极差就是从正态总体中随机抽取的n个样本测得值中的最大值与最小值之差。
若对某量作次等精度丈量测得l1、
,且它们服从正态分布,则
R=lmax−lmin
概率统计告诉我们用极差来估计总体尺度偏差的计算公式为
(5)
S3称为尺度偏差σ的无偏极差估计,d2为与样本个数n(测得值个数)有关的无偏极差系数,其值见表2
由表2知,当n≤15时,
因此,尺度偏差σ更粗略的估计值为
(5')
还可以看出,当200≤n≤1000时,
因而又有
(5")
显然,不需查表利用式(5')和(5")了即可对尺度偏差值作出快速估计,用以对用贝塞尔公式及其他公式的计算结果进行校核。
应指出,式(5)的准确度比用其他公式的准确度要低,但当5≤n≤15时,式(5)不但大大提高了计算速度,而且还颇为准确。
当n>10时,由于舍去数据信息较多,因此误差较大,为了提高准确度,这时应将测得值分成四个或五个一组,先求出各组的极差R1、
再由各组极差求出极差平均值
。
极差平均值
和总体尺度偏差的关系为
需指出,此时d2大小要用每组的数据个数n而不是用数据总数N(=nK)去查表2。
再则,分组时一定要按测得值的先后顺序排列,不克不及打乱或颠倒。
尺度偏差σ的平均误差估计
平均误差的定义为
误差理论给出
(A)
可以证明
与
的关系为
(证明从略)
于是
(B)
由式(A)和式(B)得
从而有
式(6)就是佩特斯(C.A.F.Peters.1856)公式。
用该公式估计δ值,由于\right|V\right|不需平方,故计算较为简便。
但该式的准确度不如贝塞尔公式。
该式使用条件与贝塞尔公式相似。
尺度偏差的应用实例[1]
对标称值Ra=0.160
1.45,1.65,1.60,1.67,1.52,1.46,1.72,1.69,1.77,1.64,4.56,1.50,1.64,1.74和1.63μm,试求该样块Rn的平均值和尺度偏差并判断其合格否。
解:
1)先求平均值
2)再求尺度偏差S
若用无偏极差估计公式式(5)计算,首先将测得的,15个数据按原顺序分为三组,每组五个,见表3。
表3
组号
l_1
l_5
R
1
1.48
1.65
1.60
1.67
1.52
0.19
2
1.46
1.72
1.69
1.77
1.64
0.31
3
1.56
1.50
1.64
1.74
1.63
0.24
因每组为5个数据,按n=5由表2查得
故
若按经常使用估计即贝塞尔公式式(2'),则
若按无偏估计公式即式(3')计算,因n=15,由表1查得Kδ=1.018,则
若按最大似然估计公式即式(4')计算,则
=0.09296(μm)
若按平均误差估计公式即式(6),则
现在用式(5')对以上计算进行校核
可见以上算得的S、S1、S2、S3和S4没有粗大误差。
由以上计算结果可知0.09296<0.0962<0.0979<0.1017<0.1062
即 S2
可见,最大似然估计值最小,经常使用估计值S稍大,无偏估计值S1又大,平均误差估计值S4再大,极差估计值S3最大。
纵观这几个值,它们相当接近,最大差值仅为0.01324μm。
从理论上讲,用无偏估计值和经常使用估计比较合适,在本例中,它们仅相差0.0017μm。
可以相信,随着的增大,S、S1、S2、S3和S4之间的不同会越来越小。
就本例而言,无偏极差估计值S3和无偏估计值S1仅相差0.0083μm,这说明无偏极差估计是既可以包管一定准确度计算又简便的一种好方法。
JJG102-89《概况粗糙度比较样块》规定Ra的平均值对其标称值的偏离不该超出+12%~17%,尺度偏差应在标称值的4%~12%之间。
已得本样块二产,
产均在规定范围之内,故该样块合格。
尺度偏差与尺度差的区别
尺度差(StandardDeviation)各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。
用σ暗示。
因此,尺度差也是一种平均数。
尺度差是方差的算术平方根。
尺度差能反映一个数据集的离散程度。
平均数相同的,尺度差未必相同。
例如,A、B两组各有6位学生介入同一次语文检验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。
这两组的平均数都是70,但A组的尺度差为17.08分,B组的尺度差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。
尺度偏差(StdDev,StandardDeviation)-统计学名词。
一种量度数据分布的分散程度之尺度,用以衡量数据值偏离算术平均值的程度。
尺度偏差越小,这些值偏离平均值就越少,反之亦然。
尺度偏差的大小可通过尺度偏差与平均值的倍率关系来衡量。
有人经常混用均方根误差(RMSE)与尺度差(StandardDeviation),实际上二者其实不是一回事。
1.均方根误差
均方根误差为了说明样本的离散程度。
均方根误差(root-mean-squareerror)亦称尺度误差,其定义为
,i=1,2,3,…n。
在有限丈量次数中,均方根误差经常使用下式暗示:
,式中,n为丈量次数;di为一组丈量值与平均值的偏差。
如果误差统计分布是正态分布,那么随机误差落在土σ以内的概率为68%。
2.尺度差
尺度差是方差的算术平方根。
尺度差能反映一个数据集的离散程度。
平均数相同的,尺度差未必相同。
尺度差也被称为尺度偏差,或者实验尺度差。
均方根值也称作为效值,它的计算方法是先平方、再平均、然后开方。
比方幅度为100V而占空比为0.5的方波信号,如果按平均值计算,它的电压只有50V,而按均方根值计算则有70.71V。
这是为什么呢?
举一个例子,有一组100伏的电池组,每次供电10分钟之后停10分钟,也就是说占空比为一半。
如果这组电池带动的是10Ω电阻,供电的10分钟发生10A的电流和1000W的功率,停电时电流和功率为零。
那么在20分钟的一个周期内其平均功率为500W,这相当于70.71V的直流电向10Ω电阻供电所发生的功率。
而50V直流电压向10Ω电阻供电只能发生的250W的功率。
对于电机与变压器而言,只要均方根电流不超出额定电流,即使在一定时间内过载,也不会烧坏。
PMTS1.0抽油机电能图测试仪对电流、电压与功率的测试计算都是按有效值进行的,不会因为电流电压波形畸变而测禁绝。
这一点对于测试变频器拖动的电机特别有用。
均方根误差为了说明样本的离散程度。
对于N1,....Nm,设N=(N1+...+Nm)/m;则均方根误差记作:
t=sqrt(((N^2-N1^2)+...+(N^2-Nm^2))/(m(m-1)));
比方两组样本:
第一组有以下三个样本:
3,4,5
第二组有一下三个样本:
2,4,6
这两组的平均值都是4,但是第一组的三个数值相对更靠近平均值,也就是离散程度小,均方差就是暗示这个的。
同样,方差、尺度差(方差开根,因为单位不统一)都是暗示数据的离散程度的。
几种典型平均值的求法
(1)算术平均值这种平均值最经常使用。
设x1、x2、…、xn为各次的丈量值,n代表丈量次数,则算术平均值为
(2)均方根平均值
(3)几何平均值
(4)对数平均值
(5)加权平均值
相对尺度方差的计算公式
准确度:
测定值与真实值符合的程度
绝对误差:
丈量值(或多次测定的平均值)与真(实)值之差称为绝对误差,用δ暗示。
相对误差:
绝对误差与真值的比值称为相对误差。
经常使用百分数暗示。
绝对误差可正可负,可以标明丈量仪器的准确度,但不克不及反映误差在丈量值中所占比例,相对误差反映丈量误差在丈量结果中所占的比例,衡量相对误差更有意义。
例:
用刻度0.5cm的尺丈量长度,可以读准到0.1cm,该尺丈量的绝对误差为0.1cm;用刻度1mm的尺丈量长度,可以读准到0.1mm,该尺丈量的绝对误差为0.1mm。
例:
分析天平称量误差为0.1mg,减重法需称2次,可能的最大误差为0.2mg,为使称量相对误差小于0.1%,至少应称量多少样品?
答:
称量样品量应不小于0.2g。
真值(μ):
真值是客观存在的,但任何丈量都存在误差,故真值只能迫近而不成测知,实际工作中,往往用“尺度值”代替“真值”。
尺度值:
采取多种可靠的分析方法、由具有丰富经验的分析人员经过反复多次测定得出的结果平均值。
精密度:
几次平行测定结果相互接近的程度。
各次测定结果越接近,精密度越高,用偏差衡量精密度。
偏差:
单次丈量值与样本平均值之差:
平均偏差:
各次丈量偏差绝对值的平均值。
相对平均偏差:
平均偏差与平均值的比值。
尺度偏差:
各次丈量偏差的平方和平均值再开方,比平均偏差更灵敏的反映较大偏差的存在,在统计学上更有意义。
相对尺度偏差(变异系数)
例:
分析铁矿石中铁的质量分数,得到如下数据:
37.45,37.20,37.50,37.30,37.25(%),计算测结果的平均值、平均偏差、相对平均偏差、尺度偏差、变异系数。
准确度与精密度的关系:
1)精密度是包管准确度的先决条件:
精密度不符合要求,暗示所测结果不成靠,失去衡量准确度的前提。
2)精密度高不克不及包管准确度高。
换言之,准确的实验一定是精密的,精密的实验纷歧定是准确的。
重复性试验按拟定的含量测定方法,对同一批样品进行多次测定(平行试验至少5次以上,即n>5),计算相对尺度偏差(RSD),一般要求低于5%