物理实验误差分析与数据处理.docx
《物理实验误差分析与数据处理.docx》由会员分享,可在线阅读,更多相关《物理实验误差分析与数据处理.docx(29页珍藏版)》请在冰豆网上搜索。
物理实验误差分析与数据处理
实验误差分析与数据处理2
1测量与误差2
2误差的处理6
3不确定度与测量结果的表示10
4实验中的错误与错误数据的剔除13
5有效数字及其运算规则15
6实验数据的处理方法17
习题25
实验误差分析与数据处理
1测量与误差
1.1测量及测量的分类
物理实验是以测量为基础的。
在实验中,研究物理现象、物质特性、验证物理原理都需要进行测量。
所谓测量,就是将待测的物理量与一个选来作为标准的同类量进行比较,得出它们的倍数关系的过程。
选来作为标准的同类量称之为单位,倍数称为测量数值。
一个物理量的测量值等于测量数值与单位的乘积。
在人类的发展历史上,不同时期,不同的国家,乃至不同的地区,同一种物理量有着许多不同的计量单位。
如长度单位就分别有码、英尺、市尺和米等。
为了便于国际交流,国际计量大会于1990年确定了国际单位制(SI),它规定了以米、千克、秒、安培、开尔文、摩尔、坎德拉作为基本单位,其他物理量(如力、能量、电压、磁感应强度等)均作为这些基本单位的导出单位。
1.直接测量与间接测量
测量可分为两类。
一类是直接测量,是指直接将待测物理量与选定的同类物理量的标准单位相比较直接得到测量值的一种测量。
它无须进行任何函数关系的辅助运算。
如用尺测量长度、以秒表计时间、天平称质量、安培表测电流等。
另一类是间接测量,是指被测量与直接测量的量之间需要通过一定的函数关系的辅助运算,才能得到被测量物理量的量值的测量。
如单摆测量重力加速度时,需先直接测量单摆长l和单摆的周期T,再应用公式
,求得重力加速度g。
物理量的测量中,绝大部分是间接测量。
但直接测量是一切测量的基础。
不论是直接测量,还是间接测量,都需要满足一定的实验条件,按照严格的方法及正确地使用仪器,才能得出应有的结果。
因此实验过程中,一定要充分了解实验目的,正确使用仪器,细心地进行操作读数和记录,才能达到巩固理论知识和加强实验技能训练的目的。
2.等精度测量与不等精度测量
同一个人,用同样的方法,使用同样的仪器,在相同的条件下对同一物理量进行多次测量,尽管各次测量并不完全相同,但我们没有任何充足的理由来判断某一次测量更为精确,只能认为它们测量的精确程度是完全相同的。
我们把这种具有同样精确程度的测量称之为等精度测量。
在所有的测量条件中,只要有一个发生变化,这时所进行的测量即为不等精度测量。
在物理实验中,凡是要求多次测量均指等精度测量,应尽可能保持等精度测量的条件不变。
严格地说,在实验过程中保持测量条件不变是很困难的。
但当某一条件的变化对测量结果的影响不大时,乃可视为等精度测量。
在本书中,除了特别指明外,都作为等精度测量。
1.2误差及误差的表现形式
1.误差
物理量在客观上有着确定的数值,称为真值。
测量的最终目的都是要获得物理量的真值。
但由于测量仪器精度的局限性、测量方法或理论公式的不完善性和实验条件的不理想,测量人员不熟练等原因,使得测量结果与客观真值有一定的差异,这种差异称之为误差。
若某物理量测量的量值为x,真值为A,则产生的误差∆x为:
∆x=x–A
任何测量都不可避免地存在误差。
在误差必然存在的条件下,物理量的真值是不可知的。
所以在实际测量中计算误差时,通常所说的真值有如下几种类型:
(1)理论真值或定义真值。
如用平均值代替真值,三角形内角何等于180°等。
(2)计量约定真值。
如前面所介绍的基本物理量的单位标准,以及国际大会约定的基本物理量。
(3)标准器相对真值(或实际值)。
用比被标准过的仪器高一级的标准器的量值作为标准器相对真值。
例如:
用0.5级的电流表测得某电路的电流为1.200A,用0.2级电流表测得的电流为1.202A,则后者可示为前者的真值。
2.误差的表示形式
误差的表示形式有绝对误差和相对误差之分。
绝对误差是测量值和真值的数值之差:
δ=x–A(1-1)
根据绝对误差的大小还难以评价一个测量结果的可靠程度,还需要考虑被测量本身的大小,为此引入相对误差,相对误差E定义为绝对误差δ与被测量量的真值x的比值,即:
(1-2)
相对误差常用百分比表示。
它表示绝对误差在整个物理量中所占的比重,它是无单位的一个纯数,所以既可以评价量值不同的同类物理量的测量,也可以评价不同物理量的测量,从而判断它门之间优劣。
如果待测量有理论值或公认值,也可用百分差来表示测量的好坏。
即:
(1-3)
1.3误差的分类
既然测量不能得到真值,那么怎样才能最大限度的减小测量误差并估算出误差的范围呢?
要解决这个问题,首先要了解误差产生的原因及其性质。
测量误差按其产生的原因与性质可分为系统误差、随机误差和过失误差。
1.系统误差
在一定条件下(指仪器、方法和环境)对同一物理量进行多次测量时,其误差按一定的规律变化,测量结果都大于真值或都小于真值。
系统误差产生的原因可能是已知的,也可能是未知的。
产生系统误差的原因主要有:
(1)由于仪器本身存在一定的缺陷或使用不当造成的。
如仪器零点不准、仪器水平或铅直未调整、砝码未校准等。
(2)实验方法不完善或这种方法所依据的理论本身具有近似性。
例如用单摆测量重力加速度时,忽略空气对摆球的阻力的影响,用安培表测量电阻时,不考虑电表内阻的影响等所引入的误差。
(3)实验者生理或心理特点或缺乏经验所引入的误差。
例如有人读数时,头习惯性的偏向一方向,按动秒表时,习惯性的提前或滞后等。
2.随机误差
同一物理量在多次测量过程中,误差的大小和符号以不可预知的方式变化的测量误差称为随机误差,随机误差不可修正。
随机误差产生的原因很多,归纳起来大致可分为以下两个方面:
(1)由于观测者在对准目标、确定平衡(如天平)、估读数据时所引入的误差。
(2)实验中各种微小因素的变动。
例如,实验装置和测量机构在各次调整操作上的变动性,实验中电源电压的波动、环境的温度、湿度、照度的变化所引起的误差。
随机误差的出现,单就某一次观测来说是没有规律的,其大小和方向是不可预知的。
但对某一物理量进行足够多次测量,则会发现随机误差服从一定的统计规律,随机误差可用统计方法进行估算。
1.4测量的精密度、准确度、精确度
我们常用精度反映测量结果中误差大小的程度。
误差小的精度高,误差大的精度低,这里精度却是一个笼统的概念,它并不明确表示描写的是哪一类误差,为描述更具体,我们把精度分为精密度、准确度和精确度。
1.精密度
精密度表示测量结果中的随机误差大小的程度。
它是指在一定条件下进行重复测量时,所得结果的相互接近程度。
它用来描述测量得重复性。
精密度高,即测量数据得重复性好,随机误差较小。
(i)精密度(ii)准确度(iii)精确度
图1-1测量的精密度、准确度、精确度图示(以打靶为例)
2.准确度
准确度表示测量结果中系统误差大小得程度。
用它来描述测量值接近真值得程度。
准确度高,即测量结果接近真值得程度高,系统误差小。
3.精确度
精确度是对测量结果中系统误差和随机误差的综合描述。
它是指测量结果的重复性及接近真值的程度。
为了形象地说明这三个概念的区别和联系,我们以打靶为例说明(图1-1):
(i)精密度高而准确度较差;
(ii)准确度高而精密度较差;
(iii)精密度和准确度都很高,即精确度很高。
2误差的处理
误差的产生有其必然性和普遍性,误差自始至终存在于一切科学实验中,一切测量结果都存在误差。
本节主要介绍上述两类误差的处理方法。
2.1系统误差
一个实验结果的优劣,往往在于系统误差是否已经被发现或尽可能消除,所以预见一切可能产生的系统误差的因素,并设法减小它们是非常重要的。
一般而言,对于系统误差可以在实验前对仪器进行校准,对实验方法进行改进,在实验时采取一定的措施对系统误差进行补偿和消除,实验后对结果进行修正等。
系统误差的处理是一个比较复杂的问题,它没有一个简单的公式,主要取决于实验者的经验和技巧并根据具体情况来处理。
从实验者对系统误差掌握的程度来分,又可分为已定系统误差和未定系统误差两类。
1.已定系统误差
已定系统误差是指绝对值和符号都已确定的,可以估算出的系统误差分量。
例如:
对一个标准值为50毫克的三等砝码,就无法知道该砝码的误差值是多少。
只知道它对测量结果造成的未定系统误差限为±2mg,但如果在使用前用高一级的砝码进行校准,就可得到已定系统误差得值。
2.未定系统误差
未定系统误差是指符号或绝对值未经确定的系统误差分量。
例如,仪器出厂时的准确度指标是用符号∆仪表示的。
它只给出该类仪器误差的极限范围。
但实验者使用该仪器时并不知道该仪器的误差的确切大小和正负,只知道该仪器的准确程度不会超过∆仪的极限(例如上面所举砝码中的±2mg)。
所以这种系统误差通常只能定出它的极限范围,由于不能知道它的确切大小和正负,故无法对其进行修正。
对于未定系统误差在物理实验中我们一般只考虑仪器测量仪器的(最大)允许误差∆仪(简称仪器误差)。
2.2随机误差的估算
随机误差的特点是随机性。
也就是说在相同条件下,对同一物理量进行多次重复测量,每次测量的误差的大小和正负无法预知,纯属偶然。
但是实践和理论证明,如果测量次数足够多的话,大部分测量的随机误差都服从一定的统计规律。
本书只着重介绍随机误差的正态分布。
1.正态分布的特征与数学表达
遵从正态分布的随机误差有以下几点特征:
(1)单峰性。
绝对值大的误差出现的可能性(概率)比绝对值小的误差出现的概率小。
(2)对称性。
绝对值相等的正负误差出现的机会均等,对称分布于真值的两侧。
(3)有界性。
在一定的条件下,误差的绝对值不会超过一定的限度。
(4)抵偿性。
当测量次数很多时,随机误差的算术平均值趋于零,即
正态分布的特征可用正态分布曲线形象地表达。
如图2-1所示。
横坐标表示误差δ=x1-x0式中x0为被测量量的真值。
纵坐标为一个与误差出现的概率有关的概率密度函数f(δ)。
根据概率论的数学方法可以导出:
(2-1)
(a)(b)
图2-1概率密度函数曲线图
测量值的随机误差出现在δ到δ+dδ区间内可能性为
即图(a)中阴影所含的面积元。
上式中σ是一个与实验条件有关的常数,称为标准误差,其值为:
(2-2)
式中n为测量次数,各次测量的随机误差为
。
2.标准误差的物理意义
由式2-1可知,随机误差的正态分布曲线的形状与σ值有关,如图(b)所示,σ值越小,分布曲线越尖锐,峰值f(δ)越高,说明绝对值小的误差占多数,且测量值的离散性较小,重复性好,测量精密度较高;反之σ值越大,则曲线越平坦,该组测量值的离散性大,测量精密度低。
标准误差反映了测量值的离散程度。
由
是测量值随机误差出现在小区间
的可能性(概率),即n次测量值误差出现在
内的概率为:
(2-3)
这说明对任一次测量,其测量值误差出现在-σ到+σ区间内的概率为68.3%。
从概率密度分布函数的曲线图来看:
设曲线下面积为1即100%,则介于
间的曲线下的面积为68.3%。
用同样的方法计算可得介于
间的概率为95.5%,介于
间的概率为99.7%。
显然,测量误差的绝对值大于3σ的概率仅为0.3%。
在通常情况下的有限次测量测量误差超出±3σ范围的情况几乎不会出现,所以把3σ称为极限误差。
3.近真值——算术平均值
尽管一个物理量的真值是客观存在的,但由于误差的存在,企图得到真值的愿望仍然不能实现。
那么是否能够得到一个测量结果的最佳值,或者说得到一个最接近真值的数值呢?
根据随机误差具有抵偿性特点,我们可以求得真值的最佳估计值——近真值。
设在相同条件下对一个物理量进行多次没量,测量值分别为
,则该没量值的算术平均值:
(i=1,2,3,……)(2-4)
而各次测量的随机误差为:
式中x0为真值,
为第i次测量值,对n次测量的绝对误差求和有:
等式两边各除以n可得:
当测量次数
由随机误差具有抵偿性的特点,所以有:
故根据以上推导可得:
由此可知,测量次数愈多,算术平均值接近真值的可能性愈大。
当测量次数足够时,算术平均值是真值的最佳估计值。
2.3标准误差的估算——标准偏差
由于真值不知道,误差δ无法计算,因而按照式2-2标准误差σ也无从估算。
根据算术平均值是近真值的结论,在实际估算误算时采用算术平均值代替真值,用各次测量值与算术平均值的差值
来估算各次测量的误差,差值称为残差。
当测量次数n有限时,如用残差来表示误差时,其计算公式为:
(2-5)
称为任一次测量的标准偏差,它是测量次数有限多时,标准误差的一个估计值。
其代表的物理意义为:
如果多次测量的随机误差遵从正态分布,那么,任一次测量的测量值误差落在
到
区域之间的可能性(概率)为68.3%。
通过误差理论可以证明,平均值
的标准偏差为:
(2-6)
上式说明算术平均值的标准偏差是n次测量中的任意一次测量值标准偏差的
,
小于
,因为算术平均值是测量结果的最佳值,它比任意一次测量值xi更接近真值,所以误差要小。
的物理意义是在多次测量的随机误差遵从正态分布的条件下,真值处于
区间内的概率为68.3%。
3不确定度与测量结果的表示
3.1测量不确定度
由于测量误差的存在,难以确定被测量的真值。
测量不确定度是与测量结果相关联的参数,它表征测量真值在某一个量值范围内不能肯定程度的一个估计值。
也就是说不确定度是测量结果中无法修正的部分,反映了被测量的真值不能肯定的误差范围的一种评定,测量不确定度包含A类标准不确定度和B类标准不确定度。
1.A类标准不确定度
由于偶然因素,在同一条件下对同一物理量X进行多次重复测量值
,将是分散的,从分散的测量值出发用统计的方法评定标准不确定度,就是标准不确定度的A类评定。
设A类标准不确定度为
,用统计的方法算出平均值的标准偏差为
,不确定度的A类分量就取为平均值的标准偏差,即:
(3-1)
按误差理论的正态分布,如不存在其他影响,则测量值范围
中包含真值的概率为68.3%。
2.B类标准不确定度。
测量中凡是不符合统计规律的不确定度统称为B类不确定度。
在实际计算时,有的依据计量仪器的说明书或鉴定书,有的依据仪器的准确度,有的则粗略的依据仪器的分度值或经验,从中获得仪器的极限误差,∆仪(或允许误差或示值误差)此类误差一般可视为均匀分布,则B类评定不确定度为:
(3-2)
例:
使用量程为0—300mm,分度值为0.05mm的游标卡尺,测量长度时,其示值误差在±0.05mm以内,即极限误差为∆仪=0.05mm,则由此游标卡尺引入的标准不确定度
为:
3.合成标准不确定度
(1)直接测量结果不确定度的估算
物理实验的测量结果表示中,总不确定度u(x)的估算方法行为两类,即多次重重测量用统计方法算出的A类分量
和用其它方法估算出的B类分量
。
用方和根的方法合成为总不确定度u(x):
(3-3)
例:
已知游标卡尺(∆仪=0.005cm)的初始读为0.05cm,测量圆环内径数据如下表所示,试求其测量的不确定度。
测量次数
1
2
3
4
5
6
d(cm)
3.255
3.250
3.260
3.255
3.250
3.255
计算出:
则零点修正后:
所以有:
(2)间接测量不确定度的估算
物理实验的结果一般都通过间接测量获得的,间接测量是以直接测量为基础的,直接测量值不可避免地有误差存在,显然由直接测量值根据一定的函数关系,经过运算而获得的间接测量的结果,必然也有误差存在。
怎样来计算间接测量的误差呢?
这实质上是要解决一个误差的传递问题,即求得估算间接测量值误差的公式,称为误差的传递公式。
设间接测量量N是n个独立的直接测量量A、B、C,…,H的函数,即
N=f(A,B,C,…,H)
若各直接测量值A、B、C,…,H的不确定度分别为u(A),u(B),u(C),…,u(H),它们使N值也有相应的不确定度u(N),由于不确定度都是微小量,相当于数学中的“增量”,因此间接测量的不确定度公式与数学中的全微分公式基本相同,利用全微分公式,则间接测量的不确定度:
(3-4)
如果先对函数表达或取对数,再求全微分可得:
(3-5)
当间接测量量N是各直接测量量A、B、C,…,H的和或差的函数时,则用(3-4)式计算较为方便,当间接测量量N是各直接测量量A、B、C,…,H的积或商的函数时,则用(3-4)式先计算N的相对不确定度
,然后再计算u(N)比较方便。
在一些简单的测量问题中,有时要求不需太精确的测量问题中可以用绝对值合成方法,即
(3-6)
(3-7)
当然这种绝对值合成的方法所得结果一般偏大。
与实际的不确定度合成情况可能也有较大出入。
但因其计算比较简,在要求不高,作粗略做算时,往往采用绝对值合成法,但在科学实验中,一般都采用“方和根”合成来计算间接测量结果的不确定度,常用函数的方和根合成与绝对值合成公式见下表:
函数表达式
方和根合成公式
绝对值合成公式
(K为常数)
3.2测量结果的一般表示
一个完整的测量的结果不仅要给出该量值的大小(数值和单位)同时还应给出它的不确定度。
用不确定度来表征测量结果的可信赖程度,于是测量结果应写成下列标准形式:
式中
为测量值的最佳估计值,对等精度多次测量而言,
为多次测量值的算术平均值,u(x)为不确定度,Ur为相对不确定度。
4实验中的错误与错误数据的剔除
实验中有时会出现错误,尽早发现实验中的错误是实验得以顺利进行的前提保障,数据分析就是发现错误的重要方法。
例1:
三次单摆摆50个周期的时间,得出98.4s,96.7s,97.7s。
从数据可知摆的周期接近2s,但前面两个数据相差1.7s,而后两个相差1.0s,它们都在半个周期以上,显然这样大的差异不能用手按稍表稍或滞后的操作误差去解释,即测量有误差。
例2:
用静力称衡法测一块玻璃的密度ρ,所用公式为
,式中m1=5.78g为玻璃质量,m2=4.77g为玻璃悬挂在水中的质量。
这次测量显然有错误,因为在此m1与m2之差近似为1g;ρ值接近6g/cm3,没有这样大密度的玻璃。
4.1拉依达判据
在一组数据中,有一、二个稍许偏大或偏小的数值,如果简单的数据分析不能判定它是否为错误数据,就要借助于误差理论。
在前面标准误差的物理意义中已提到对于服从正态分布的随机误差,出现在±δ区间内概率为68.3%,与此相仿,同样可以计算,在相同条件下对某一物理量进行多次测量,其任意一次测量值的误差落在-3δ到+3δ区域之间的可能性(概率)为:
(4-1)
如果用测量列的算术平均替代真值,则测量列中约有99.7%的数据应落在
区间内,如果有数据出现在此区间之外,则我们可以认为它是错误数据,这时我们应把它舍去,这样以标准偏差Sx的3倍为界去决定数据的取舍就成为一个剔除坏数据的准则,称为拉依达准则。
但要注意的是数据少于10个时此准则无效。
4.2格罗布斯判据
对于服从正态分布的测量结果,其偏差出现在±3δ附近的概率已经很小,如果测量次数不多,偏差超过±3δ几乎不可能,因而,用拉依达判据剔除疏失误差时,往往有些疏失误差剔除不掉。
另外,仅仅根据少量的测量值来计算δ,这本身就存在不小的误差。
因此当测量次数不多时,不宜用拉依达判据,但可以用格罗布斯判据。
按此判据给出一个数据个数n相联系的系数Gn,当已知数据个数n,算术平均值
和测量列标准偏差Sx,则可以保留的测量值xi的范围为
(4-2)
Gn系数表
N
3
4
5
6
7
8
9
10
11
12
13
Gn
1.15
1.46
1.67
1.82
1.94
2.03
2.11
2.18
2.23
2.28
2.33
N
14
15
16
17
18
19
20
22
25
30
Gn
2.37
2.41
2.44
2.48
2.50
2.53
2.56
2.60
2.66
2.74
也可用拟合式计算Gn值
n<30时取
n>30时取
例:
测得一组长度值(单位:
cm)
98.28
98.26
98.24
98.29
98.21
98.30
98.97
98.25
98.23
98.25
计算出:
数据98.97在此范围之外应舍去。
舍去后再计算有
5有效数字及其运算规则
5.1有效数字
在物理量的测量中,测量结果都是存在一定的误差,这些值不能任意地取舍,它反映出测量量的准确程度。
如何科学地,合理地反映测量结果,这就涉及到有效数字的问题。
有效数字在物理实验中经常使用。
什么是有效数字,有效位数如何确定,有效数字的运算规则有什么不同,在用有效数字表示测量结果时,如何与误差联系起来。
可以说,误差决定有效数字。
例如:
实验测得某一物理量,其测量列的算术平均值为
,算得其不确定度u(x)=0.04cm。
从u(x)数值中可知,这一组测量量在小数点后面第二位就已经有误差,所以
等于1.674中“7”已经是有误差的可疑数,表示结果
时后面一位“4”已不必再写上,上述结果正确的表示应为x=1.67±0.04cm。
也就是说,我们表示测量结果的数字中,只保留一位可疑数,其余应全部是确切数。
有效数字的定义为:
有效数字是由若干位准确数和一位可疑数构成。
这些数字的总位数称为有效数字。
一个物理量的数值和数学上的数有着不同的意义。
例如在数学上0.2500m=25.00mm。
但在物理测量上0.2500m≠25.000cm。
因为0.2500的有效位数是四位,而25.000cm的有效位数是五位。
实际上,这两种不同的写法表示了两种不同精度的测量结果。
所以在实验中记录数据时,有效数字不能随意增减。
5.2有效数字运算规则
有效数字的正确运算关系到实验结果的精确表达,由于运算条件不一样,运算规则也不一样。
1.四则运算
四则运算,一般可以依据以下运算规则:
①参加运算的各数字可以认为仅最后一位数码是有误差的,其他位的数码是无误差的;②无误差的数码间的四则运算结果仍为无误差数码;③有误差的数码参加四则运算结果有误差的数码,进位和借位认为是无误差数码;④最后结果按四舍五入法仅保留一位有误差数码。
(1)加减法
[例1]5.345+30.2
(数字下面“_”是指误差所在位的数码)
取:
[例2]35.48-20.3
取:
(2)乘除法
[例1]4.178×10.1
取:
[例2]48216÷123
取:
用以上竖式才能得到计算结果的四则运算,对我们来讲,不现实,为了提高运算速度,又保证一定精度的误差估计,可把上面加减运算和乘除运算分别总结为如下运算规则:
1)加减法运算规则:
若干项加减运算时,仍然按正常运算进行;计算结果的最后一位,应取到与参加加减运算各项中某项最后一位靠前的位置对齐。
如
参加运算的各项最后一位最靠前的是103的个位,其计算结果的最后一位就保留在个位上。
2)乘除法运算规则:
计算结果的有效数字位数保留到与参加运算的各数中有效数字位数最少的位数相同。
如
,参加运算的2.7有效数字是两位,为最少,计算结果也就取两位