第三章误差和分析数据的处理汇总.docx

上传人:b****6 文档编号:3716235 上传时间:2022-11-24 格式:DOCX 页数:17 大小:28.92KB
下载 相关 举报
第三章误差和分析数据的处理汇总.docx_第1页
第1页 / 共17页
第三章误差和分析数据的处理汇总.docx_第2页
第2页 / 共17页
第三章误差和分析数据的处理汇总.docx_第3页
第3页 / 共17页
第三章误差和分析数据的处理汇总.docx_第4页
第4页 / 共17页
第三章误差和分析数据的处理汇总.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

第三章误差和分析数据的处理汇总.docx

《第三章误差和分析数据的处理汇总.docx》由会员分享,可在线阅读,更多相关《第三章误差和分析数据的处理汇总.docx(17页珍藏版)》请在冰豆网上搜索。

第三章误差和分析数据的处理汇总.docx

第三章误差和分析数据的处理汇总

本章目录

§3-1误差及其产生的原因

§3-2测定值的准确度与精密度

§3-3随机误差的正态分布

§3-4有限测量数据的统计处理

§3-5有效数字及其运算规则

§3-6提高分析结果可靠性的方法

§3-1误差及其产生的原因

分析结果与真实值之间的差值称为误差。

分析结果大于真实值,误差为正;分析结果小于真实值,误差为负。

根据误差的性质与产生的原因,可将误差分为系统误差和偶然误差两类。

一、系统误差

v系统误差也叫可测误差,它是定量分析误差的主要来源,对测定结果的准确度有较大影响。

v产生原因:

由于分析过程中某些确定的、经常的因素造成的,对分析结果的影响比较固定。

v特点:

是具有¡°重现性¡±、¡°单一性¡±和¡°可测性¡±。

即在同一条件下,重复测定时,它会重复出现;使测定结果系统偏高或系统偏低,其数值大小也有一定的规律;如果能找出产生误差的原因,并设法测出其大小,那么系统误差可以通过校正的方法予以减小或消除。

系统误差产生的主要原因

(一)方法误差这种误差是由于分析方法本身所造成的。

例如:

在重量分析中,沉淀的溶解损失或吸附某些杂质而产生的误差;在滴定分析中,反应进行不完全,干扰离子的影响,滴定终点和等当点的不符合,以及其他副反应的发生等,都会系统地影响测定结果。

(二)仪器误差主要是仪器本身不够准确或未经校准所引起的。

如天平、法码和量器刻度不够准确等,在使用过程中就会使测定结果产生误差。

(三)试剂误差由于试剂不纯或蒸馏水中含有微量杂质所引起。

(四)操作误差

主要是指在正常操作情况下,由于分析工作者掌握操作规程与正确控制条件稍有出入而引起的。

例如,使用了缺乏代表性的试样;试样分解不完全或反应的某些条件控制不当等。

与上述情况不同的是,有些误差是由于分析者的主观因素造成的,称之为¡°个人误差¡±例如,在读取滴定剂的体积时,有的人读数偏高,有的人读数偏低;在判断滴定终点颜色时,有的人对某种颜色的变化辨别不够敏锐,偏深或偏浅等所造成的误差。

二、偶然误差

v偶然误差也叫不可测误差,是由于某些偶然的因素(如测定时环境的温度、湿度和气压的微小波动,仪器性能的微小变化等)所引起的,其影响时大,时小,时正,时负。

偶然误差难以察觉,也难以控制。

v偶然误差的分布完全服从一般的统计规律:

(一)大小相等的正、负误差出现的几率相等;

(二)小误差出现的机会多,大误差出现的机会少,特别大的正、负误差出现的几率非常小、故偶然误差出现的几率与其大小有关。

§3-2测定值的准确度与精密度

一、准确度与误差

v误差的大小是衡量准确度高低的尺度。

v误差愈小,表示分析结果的准确度愈高,反之,误差愈大,准确度就越低。

v误差又分为绝对误差和相对误差。

误差的表示方法

v绝对误差=测定值-真实值(3-1)

v相对误差%=(绝对误差/真实值)×100%(3-2)

v相对误差表示误差在测定结果中所占的百分率。

分析结果的准确度常用相对误差表示。

v绝对误差和相对误差都有正值和负值。

正值表示分析结果偏高,负值表示分析结果偏低.

二、精密度与偏差

v定义:

精密度是指在相同条件下多次测定结果相互吻合的程度,表现了测定结果的重现性。

v表示形式:

精密度用¡°偏差¡±来表示。

偏差也分为绝对偏差和相对偏差。

v偏差越小说明分析结果的精密度越高。

所以偏差的大小是衡量精密度高低的尺度。

(一)绝对偏差、平均偏差和相对平均偏差

v绝对偏差=个别测定值一测定平均值

(3-4)

v如果对同一种试样进行了n次测定,若其测得的结果分别为:

x1,x2,x3,…,xn,则它们的算术平均值()算术平均偏差()和相对平均偏差分别可由以下各式计算:

(二)标准偏差和相对标准偏差

v在分析化学的教学中,愈来愈广泛地采用数理统计方法来处理各种测定数据。

v在数理统计中,我们常把所研究对象的全体称为总体(或母体);自总体中随机抽出的一部分样品称为样本(或子样);样本中所含测量值的数目称为样本大小(或容量)。

v例如,我们对某一批煤中硫的含量进行分析,首先是按照有关部门的规定进行取样、粉碎、缩分,最后制备成一定数量的分析试样,这就是供分析用的总体。

如果我们从中称取10份煤样进行平行测定,得到10个测定值,则这一组测定结果就是该试样总体的一个随机样本,样本容量为10。

v若样本容量为n,平行测定次数分别为x1,x2,x3,…,xn,则其样本平均值为:

(3-7)

v当测定次数无限增多,既n→∞时,样本平均值即为总体平均值μ:

v若没有系统误差,且测定次数无限多(或实用上n>30次)时,则总体平均值μ就是真实值T。

此时,用σ代表总体标准偏差,其数学表示式为:

v可见,在定量分析的实验中,测定次数一般较少(n<20次),故其平均偏差,须由式(3-9)求得。

但是,在分析化学中测定次数一般不多(n<20),而总体平均值又不知道,故只好用样本的标准偏差S来衡量该组数据的分散程度。

v样本标准偏差的数学表达式为:

v式中:

(n-1)称为自由度,以f表示。

它是指在n次测量中,只有n-1个可变的偏差。

自由度也可以理解为:

数据中可供对比的数目。

v例如,两次测定a值和b值,只有a与b之间的一种比较,三次测定可有两种比较(即其中任何两个数据之间及其平均值与第三个数据之间比较),n次测定n-1个可供对比的数目。

这里引入(n-1)的目的,主要是为了校正以代替μ所引起的误差。

很明显,当测定次数非常多时,测定次数n与自由度(n-1)的区别就变得很小,→μ。

(5-9)

此时,S→σ。

v相对标准偏差:

代表单次测定标准偏差(S)对测定平均值的相对值,用百分率表示:

v变异系数(%)=(3-10)

(三)平均值的标准偏差

v如果从同一总体中随机抽出容量相同的数个样本,由此可以得到一系列样本的平均值。

v实践证明,这些样本平均值也并非完全一致,它们的精密度可以用平均值的标准偏差来衡量。

显然,与上述任一样本的各单次测定值相比,这些平均值之间的波动性更小,即平均值的精密度较单次测定值的更高。

v因此,在实际工作中,常用样本的平均值对总体平均值μ进行估计。

v统计学证明,平均值的标准偏差σ与单次测定值的标准偏差σ之间有下述关系。

(n→∞)(3-11)

v样本平均值的标准偏差:

对于有限次的测定则有:

式中称样本平均值的标准偏差。

由以上两式可以看出,平均值的标准偏差与测定次数的平方根成反比。

v增加测定次数可以减小随机误差的影响,提高测定的精密度。

v极差R:

除了偏差之外,还可以用极差R来表示样本平行测定值的精密度。

极差又称全距,是测定数据中的最大值与最小值之差,其值愈大表明测定值愈分散。

v由于没有充分利用所有的数据,故其精确性较差。

v偏差和极差的数值都在一定程度上反映了测定中随机误差影响的大小。

常用的偏差表示形式:

三、准确度和精密度的关系

v系统误差是定量分析中误差的主要来源,它影响分析结果的准确度;

v偶然误差影响分析结果的精密度。

获得良好的精密度并不能说明准确度就高

v只有在消除了系统误差之后,精密度好,准确度才高。

Ø准确度和精密度的关系

v准确度高一定需要精密度好,但精密度好不一定准确度高。

若精密度很差,说明所测结果不可靠,虽然由于测定的次数多可能使正负偏差相互抵消,但已失去衡量准确度的前提。

v因此,我们在评价分析结果的时候,还必须将系统误差和偶然误差的影响结合起来考虑,以提高分析结果的准确度。

习题

1.指出在下列情况下,各会引起哪种误差?

如果是系统误差,应该采用什么方法减免?

(1)砝码被腐蚀;

(2)天平的两臂不等长;

(3)容量瓶和移液管不配套;

(4)试剂中含有微量的被测组分;

(5)天平的零点有微小变动;

(6)读取滴定体积时最后一位数字估计不准;

(7)滴定时不慎从锥形瓶中溅出一滴溶液;

(8)标定HCl溶液用的NaOH标准溶液中吸收了CO2。

答:

(1)

(2)(3)系统误差中的仪器误差。

减免的方法:

校准仪器或更换仪器。

(4)(8)系统误差中的试剂误差。

减免的方法:

做空白实验。

(5)随机误差。

(6)系统误差中的操作误差。

减免的方法:

多读几次取平均值。

(7)过失误差。

9.标定浓度约为0.1mol·L-1的NaOH,欲消耗NaOH溶液20mL左右,应称取基准物质H2C2O4·2H2O多少克?

其称量的相对误差能否达到0.1%?

若不能,可以用什么方法予以改善?

若改用邻苯二甲酸氢钾为基准物,结果又如何?

解:

根据方程2NaOH+H2C2O4·H2O==Na2C2O4+3H2O可知,

需H2C2O4·H2O的质量m1为:

相对误差为

则相对误差大于0.1%,不能用H2C2O4·H2O标定0.1mol·L-1的NaOH,可以选用相对分子质量大的作为基准物来标定。

若改用KHC8H4O4为基准物时,则有:

KHC8H4O4+NaOH==KNaC8H4O4+H2O

需KHC8H4O4的质量为m2,则

§3-3随机误差的正态分布

一、频率分布

二、正态分布

三、标准正态分布

四、随机误差的区间概率

一、频率分布

在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下:

1.601.671.671.641.581.641.671.621.571.60

1.591.641.741.651.641.611.651.691.641.63

1.651.701.631.621.701.651.681.661.691.70

1.701.631.671.701.701.631.571.591.621.60

1.531.561.581.601.581.591.611.621.551.52

1.491.561.571.611.611.611.501.531.531.59

1.661.631.541.661.641.641.641.621.621.65

1.601.631.621.611.651.611.641.631.541.61

1.601.641.651.591.581.591.601.671.681.69

v分组:

首先视样本容量的大小将所有数据分成若干组:

容量大时分为10-20组,容量小时(n<50)分为5-7组,本例分为9组。

v排序:

再将全部数据由小至大排列成序,找出其中最大值和最小值,算出极差R。

由极差除以组数算出组距。

本例中的R=1.74%-1.49%=0.25%,组距=R/9=0.25%/9=0.03%。

每组内两个数据相差0.03%即:

1.48-1.51,1.51-1.54等等。

为了使每一个数据只能进入某一组内,将组界值较测定值多取一位。

即:

1.485-1.515,1.515-1.545,1.545-1.575等等。

v计数:

统计测定值落在每组内的个数(称为频数),再计算出数据出现在各组内的频率(即相对频数)。

v由表中的数据和图3-3可以看出,测定数据的分布并非杂乱无章,而是呈现出某些规律性。

在全部数据中,平均值1.62%所在的组(第五组)具有最大的频率值,处于它两侧的数据组,其频率值仅次之。

v统计结果表明:

测定值出现在平均值附近的频率相当高,具有明显的集中趋势;而与平均值相差越大的数据出现的频率越小。

二、正态分布

v正态分布,又称高斯分布,它的数学表达式即正态分布函数式为:

▪式中y表明测定次数趋于无限时,测定值xi出现的概率密度。

v若以x值表示横坐标,y值表示纵坐标,就得到测定值的正态分布曲线。

曲线的最高点,它对应的横坐标值μ即为总体平均值,这就说明了在等精密度的许多测定值中,平均值是出现概率最大的值。

v标准偏差较小的曲线陡峭,表明测定值位于μ附近的概率较大,即测定的精密度高。

与此相反,具有较大标准偏差较大的曲线平坦,表明测定值位于μ附近的概率较小,即测定的精密度低。

v综上所述,一旦μ和σ确定后,正态分布曲线的位置和形状也就确定,因此μ和σ是正态分布的两个基本参数,这种正态分布用N(μ,σ2)表示。

v正态分布曲线关于直线x=μ呈钟形对称,具有以下特点:

1.对称性绝对值大小相等的正负误差出现的概率相等,因此它们常可能部分或完全相互低消。

2.单峰性峰形曲线最高点对应的横坐标x-μ值等于0,表明随机误差为0的测定值出现的概率密度最大。

3.有界性一般认为,误差大于的测定值并非是由随机误差所引起的。

也就是说,随机误差的分布具有有限的范围,其值大小是界的。

三、标准正态分布

v由于μ和σ不同时就有不同的正态分布,曲线的形状也随之而变化。

为了使用方便,将正态分布曲线的横坐标改用u来表示(以σ为单位表示随机误差),并定义

代入(3-13)中得:

由于

四、随机误差的区间概率

v正态分布曲线与横坐标之间所夹的总面积,就等于概率密度函数从-∞至+∞的积分值。

v它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100%,即为1。

v例如:

随机误差在±σ区间(u=±1),即测定值在μ±σ区间出现的概率是:

v例如:

随机误差出现的区间测定值出现的区间概率

u=±1x=μ±σ0.3413×2=0.6826

u=±2x=μ±2σ0.4773×2=0.9546

u=±3x=μ±3σ0.4987×2=0.9974

以上概率值表明

v对于测定值总体而言,随机误差在±2σ范围以外的测定值出现的概率小于0.045,即20次测定中只有1次机会。

随机误差超出±3σ的测定值出现的概率更小。

平均1000次测定中只有3次机会。

v通常测定仅有几次,不可能出现具有这样大误差的测定值。

如果一旦发现,从统计学的观点就有理由认为它不是由随机误差所引起,而应当将其舍去,以保证分析结果准确可靠。

v概率积分面积表的另一用途是由概率确定误差界限。

v例如:

要保证测定值出现的概率为0.95,那么随机误差界限应为±1.96σ。

例1.经过无数次测定并在消除了系统误差的情况下,测得某钢样中磷的质量分数为0.099%。

已知σ=0.002%,问测定值落在区间0.095%-0.103%的概率是多少?

解:

根据

|u|=2,由表3-1查得相应的概率为0.4773,则

P(0.095%≤x≤0.103%)=0.4773×2=0.955

§3-4有限测定数据的统计处理

一、置信度与μ的置信区间

随机误差的分布规律表明,测定值总是在以μ为中心的一定范围内波动,并有着向μ集中的趋势。

v 置信区间:

以单次测定值x或以平均值为中心的,以一定的置信度包含真值的取值范围称为总体平均值μ的置信区间。

v置信度:

在置信区间内包含μ的概率称为置信度,用P表示。

例1.用标准方法平行测定钢样中磷的质量分数4次,其平均值为0.087%。

设系统误差已经消除,且σ=0.002%。

(1)计算平均值的标准偏差;

(2)求该钢样中磷含量的置信区间。

置信度为P=0.95。

解:

(1)

(2)已知P=0.95时,u=±1.96。

根据

注意:

vμ是确定且客观存在的,它没有随机性。

v而区间x±uσ或是具有随机性的,即它们均与一定的置信度相联系。

v因此我们只能说置信区间包含真值的概率是0.95,而不能认为真值落在上述区间的概率是0.95

(二)已知样本标准偏差S时

v在实际工作中,通过有限次的测定是无法得知μ和σ的,只能求出和S。

而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。

此时若用S代替σ从而对μ作出估计必然会引起偏离,而且测定次数越少,偏离就越大。

v如果采用另一新统计量tP,f取代u(仅与P有关),上述偏离即可得到修正。

t分布法

vt值的定义:

vt分布是有限测定数据及其随机误差的分布规律。

t分布曲线见图3-6,其中纵坐标仍然表示概率密度值,横坐标则用统计量t值来表示。

v显然,在置信度相同时,t分布曲线的形状随f(f=n-1)而变化,反映了t分布与测定次数有关有实质。

由图3-6可知,随着测定次数增多,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。

当f→∞时,t分布曲线就与正态分布曲线合为一体,因此可以认为正态分布就是t的极限。

v与正态分布曲线一样,t分布曲线下面某区间的面积也表示随机误差在此区间的概率。

但t值与标准正态分布中的u值不同,它不仅与概率还与测定次数有关。

v不同置信度和自由度所对应的t值见表3-2中。

v由表3-2中的数据可知,随着自由度的增加,t值逐渐减小并与u值接近。

当f=20时,t与u已经比较接近。

当f→∞时,t→u,S→σ。

v在引用t值时,一般取0.95置信度。

例2.测定某试样中SiO2质量分数得S=0.05%。

若测定的精密度保持不变,当P=0.95时,欲使置信区间的置信限

,问至少应对试样平行测定多少次?

解:

根据式(3-19)和题设得:

已知s=0.05%,故:

查表3-2得知,当f=n-1=5时,t0.95,5=2.57,此时

即至少应平行测定6次,才能满足题中的要求。

置信区间的意义

v真值虽然不为所知(σ也未知),但可以期望由有限的测定值计算出一个范围,它将以一定的置信度将真值包含在内。

v该范围越小,测定的准确度越高。

例3.标定HCl溶液的浓度时,先标定3次,结果为0.2001mol/L、0.2005mol/L和0.2009mol/L;后来又标定2次,数据为0.2004mol/L和0.2006mol/L。

试分别计算3次和5次标定结果计算总体平均值μ的置信区间,P=0.95。

解:

标定3次时,

标定5次时,

二、可疑测定值的取舍

v可疑值或异常值:

平行测定的数据中,有时会出现一二个与其结果相关较大的测定值,称为可疑值或异常值。

对于为数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。

对可疑值的取舍实质:

区分可疑值与其它测定值之间的差异到底是由过失、还是随机误差引起的。

v如果已经确证测定中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计方法进行检验,然后再作出判断。

v根据随机误差分布规律,在为数不多的测定值中,出现大偏差的概率是极小的,因此通常就认为这样的可疑值是由过失所引起的,而应将其舍去,否则就予以保留。

(一)Q检验法

v将测定值由小至大按顺序排列,其中可疑值为x1或xn。

v求出可疑值与其最邻近值之差xn-xn-1或x2-x1,然后用它除以极差xn-x1,计算出统计量Q:

或(3-20)

vQ值越大,说明离群越远,远至一定程度时则应将其舍去。

故Q称为舍弃商。

v根据测定次数n和所要求的置信度P查QP,n值表3-3。

若Q>QP,n,则以一定的置信度弃去可疑值,反之则保留。

v分析化学中通常取0.90的置信度。

(二)格鲁布斯法

v将测定值由小至大按顺序排列,其中可疑值为x1或xn。

先计算该组数据的平均值和标准偏差,再计算统计量G。

若x1可疑,(3-21)

若xn可疑,(3-21a)

v根据事先确定的置信度和测定次数查表3-4。

若G>GP,n,说明可疑值对相对平均值的偏离较大,则以一定的置信度弃去可疑值,反之则保留。

v在运用格鲁布斯法判断可疑值的取舍时,由于引入了t分布中最基本的两个参数和s,故该方法的准确度较Q法高,因此得到普遍采用。

三、显著性检验

v用统计的方法检验测定值之间是否存在显著性差异,以此推断它们之间是否存在系统误差,从而判断测定结果或分析方法的可靠性,这一过程称为显著性检验。

v定量分析中常用的有t检验法和F检验法。

(一)样本平均值与真值的比较(t检验法)

v适用范围:

t检验法用来检验样本平均值或两组数据的平均值之间是否存在显著性差异,从而对分析方法的准确度作出评价。

v方法:

当检验一种分析方法的准确度时,采用该方法对某标准试样进行数次测定,再将样本平均值与标准值T进行比较。

v由置信区间的定义可知,经过n次测定后,如果以平均值为中心的某区间已经按指定的置信度将真值T包含在内,那么它们之间就不存在显著性差异,根据t分布,这种差异是仅由随机误差引起的。

t可由下式计算:

(3-22a)

v若t>tP,f,说明与T之差已超出随机误差的界限,就可以按照相应的置信度判断它们之间存在显著性差异。

v进行显著性检验时,如置信度定得过低,则容易将随机误差引起的差异判断为显著性差异,如置信度定得过高,又可能将系统误差引起的不一致认同为正常差异,从而得出不合理的结论。

v在定量分析中,常采用0.95或0.90的置信度。

(二)两组数据平均值之间的比较(F检验法和t检验法)

v显著性水平(α):

在显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率称为显著性水平,用α表示,即这些测定值位于一定置信度所对应的随机误差界限之外。

例如:

置信度P=0.95,则显著水平α=0.05,即α=1-P。

§5-4有效数字及其应用

v在科学实验中,为了得到准确的测量结果,不仅要准确地测定各种数据,而是还要正确地记录和计算。

v分析结果的数值不仅表示试样中被测成分含量的多少,而且还反映了测定的准确程度。

v所以,记录实验数据和计算结果应保留几位数字是一件很重要的事,不能随便增加或减少位数。

v例如:

用重量法测定硅酸盐中的SiO2时,若称取试样重为0.4538克,经过一系列处理后,灼烧得到SiO2沉淀重0.1374克,则其百分含量为:

SiO2%=(0.1374/0.4538)×100%=30.277655354%

上述分析结果共有11位数字,从运算来讲,并无错误,但实际上用这样多位数的数字来表示上述分析结果是错误的,它没有反映客观事实,因为所用的分析方法和测量仪器不可能准确到这种程度。

那么在分析实验中记录和计算时,究竟要准确到什么程度,才符合客观事实呢?

这就必须了解“有效数字”的意义。

一、有效数字的意义及位数

v有效数字是指在分析工作中实际上能测量到的数字。

v记录数据和计算结果时究竟应该保留几位数字,须根据测定方法和使用仪器的准确程度来决定。

在记录数据和计算结果时,所保留的有效数字中,只有最后一位是可疑的数字。

v例如:

坩埚重18.5734克六位有效数字

标准溶液体积24.41毫升四位有效数字

由于万分之一的分析天平能称准至±0.0001克,滴定管的读数能读准至±0.01毫升,故上述坩埚重应是18.5734±0.0001克,标准溶液的体积应是24.41±0.01毫升,因此这些数值的最后一位都是可疑的,这一位数字称为“不定数字”。

在分析工作中应当使测定的数值,只有最后一位是可疑的。

v有效数字的位数,直接与测定的相

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1