第三章误差和分析数据的处理精.docx
《第三章误差和分析数据的处理精.docx》由会员分享,可在线阅读,更多相关《第三章误差和分析数据的处理精.docx(26页珍藏版)》请在冰豆网上搜索。
第三章误差和分析数据的处理精
教案
(三)
开课单位:
化学及环境科学系
课程名称:
分析化学
专业年级:
2006级化学专业
任课教师:
江虹
教材名称:
分析化学
2007-2008学年第1学期
授课
内容
第三章误差和分析数据的处理
课时安排
8学时
教学
目的
要求
1.掌握有关误差的基本概念及表示方法;
2.掌握有效数字的表示和运算规则;
3.了解实验数据的分布特点和分析数据的处理;
4.正确应用F检验和t检验对分析方法和结果作出评价。
教学
重点
难点
重点:
误差的正态分布;有效数字及运算规则;F检验、t检验。
教学
方法
手段
讲授为主,启发式和互动式相结合;
多媒体教学与传统教学相结合。
教
学
内
容
提
纲
一、误差及其产生的原因
1.系统误差;2.偶然误差。
二、测定值的准确度与精密度
1.准确度与误差;2.精密度与偏差;3.精密度与准确度的关系。
三、随机误差的正态分布
1.数据处理中常用名词的含义;2.测定值的频数分布;
3.随机误差的正态分布。
四、有限测定数据的统计处理
1.置信度与μ的置信区间;2.可疑值的取舍;
3.分析方法准确度的检验。
4.分析结果的表示方法。
五、有效数字及其运算规则
1.有效数字的意义及位数;2.数字修约规则;
3.有效数字的运算规则;4.有效数字运算规则在分析化学中的应用。
六、提高分析结果准确度的方法
1.化学分析中对准确度的要求;2.分析准确度的检验;
3.提高分析结果准确度的方法。
课外
学习
要求
根据本章要求,查阅相关资料,并上课程网复习巩固,完成相应作业。
教学
后记
第三章误差和分析数据的处理
进程:
§3-1误差及其产生的原因
一、系统误差
指由于某些固定原因所导致的误差。
特点:
“重复性”、“单向性”、“可测性”。
1.仪器和试剂引起的误差
由于仪器本身的缺陷所造成的误差叫仪器误差。
由于试剂不纯或蒸馏水中含有微量杂质而引起的误差叫试剂误差。
2.个人操作上引起的误差
由于操作不当而引起的误差称为操作误差。
产生个人误差的原因:
一是由于个人观察判断能力的缺陷或不良习惯引起的;二是来源于个人的偏见或一种先入为主的成见。
操作误差与个人误差,其数值可能因人而异,但对同一个操作者来说基本上是恒定的,因此,也可以统称为个人误差。
3.方法误差
方法误差是由所采用的分析方法本身的固有特性所引起的,是由分析系统的化学或物理化学性质所决定的,无论分析者操作如何熟练和小心,这种误差总是难免的。
方法误差的来源有:
①反应不能定量地完成或者有副反应;
②干扰成分的存在;
③在重量分析中沉淀的溶解损失,共沉淀和后沉淀的现象,灼烧沉淀时部分挥发损失或称量形式具有吸湿性等等。
④在滴定分析中,滴定终点与化学计量点不相符。
系统误差的性质可以归纳为三点:
①系统误差会在多次测定中重复出现;
②系统误差具有单向性;
③系统误差的数值基本是恒定不变的。
二、偶然误差
指由于某些偶然的、微小的和不可知的因素所引起的误差。
举一个最简单的使用天平称重的例子:
取一个瓷坩埚,在同一天平上用同一砝码进行称重,得到下面的克数:
29.346529.346329.346429.3466
为什么四次称重数据会不同呢?
①读取天平指针读数时,总不免偏左或偏右一点,天平本身有一定的变动性,这是无法控制的;
②天平箱内温度的微小变化,坩埚和砝码上吸附着微量水份的变化;
③空气中尘埃降落速度的不恒定;
④其它未确定因素。
正态分布有三种性质:
①离散性;②集中趋势;③对称性。
(见书图)
课堂抽问:
P.721题
§3-2测定值的准确度与精密度
一、准确度与误差
准确度是测定值与真实值的符合程度,用误差表示。
⑴绝对误差:
指测得值与真实值之差。
即
绝对误差(Ea)=测得值(Xi)-真实值(T)
⑵相对误差:
指误差在分析结果中所占的百分率或千分率。
例如,用分析天平称量两个试样,称得1号为1.7542g,2号为0.1754g。
假定二者的真实重量各为1.7543g和0.1755g,则两者称量的绝对误差分别为:
1号:
E1=1.7542-1.7543=-0.0001(g)
2号:
E2=0.1754-0.1755=-0.0001(g)
两者称量的相对误差分别为:
1号:
2号:
二、精密度与偏差
在相同条件下多次测定结果相互吻合的程度就叫精密度,用偏差表示。
1.绝对偏差(di)
2.相对偏差
3.算术平均偏差()
4.相对平均偏差
5.标准偏差
6.相对标准偏差(变异系数)
7.平均值的标准偏差
三、准确度和精密度的关系
结论:
精密度高是保证准确度高的先决条件;但精密度高不一定准确度就高;若精密度很低,说明测定结果不可靠,在这种情况下,自然失去了衡量准确度的前提。
所以在评价分析结果时,必须将系统误差和偶然误差的影响结合起来考虑,以提高分析结果的准确度。
四、公差
“公差”是生产部门对分析结果允许误差的一种表示方法。
例如:
测定钢中含S量的公差范围为:
(武大P.13)
含S量%公差%
≤0.02±0.002
0.02~0.05±0.004
0.05~0.10±0.006
0.10~0.20±0.01
≥0.20±0.015
如果试样含S量为0.032%,而测得结果为0.035%,即符合公差的要求(因含S0.032%是属于含S0.02~0.05%这个范围,它的公差是±0.004)即测得值在0.032±0.004这个范围内的,都符合要求。
如果分析结果的误差超出公差的范围,就叫超差,就应重作。
公差范围的确定,一般是根据生产的需要和具体情况来确定。
•
讨论:
•P.722、3、9题
§3-3随机误差的正态分布
一、数据处理中常用名词的含义
1.总体、样本和个体
在统计学中,所研究对象的全体称为总体(又叫母体),其中的一个基本单元称为个体。
从总体中随机抽取出来的部分个体的集合体称为样本(又叫子样)。
2.样本容量
样本中所含数据(如测定值)的个数称为样本容量,用n表示。
3.算术平均值(前已讲)
4.中位数(M)
中位数(M)是指将一组测定值按一定大小顺序排列时的中间项的数值。
5.差方和
测定值对平均值偏差的平方的加和叫差方和。
即
6.方差(表征随机变量分布的离散程度)
个别测定值与平均值的偏差的平方和除以测定次数(n-1)得方差。
7.标准偏差(前已介绍)
8.相对标准偏差(前已介绍)
9.平均偏差和相对平均偏差
10.极差R(全距)
在一组数据中最大值与最小值之差称为极差(又叫全距或范围误差),用R表示。
即
R=X最大-X最小
11.频数
将平行测定次数足够多的数据划分为若干组,落入每一个组内的数据个数叫该组数据的频数。
12.相对频数
频数与所测数据总个数(样本容量)之比值,叫相对频数(即频率或概率)。
13.概率密度
各组数据的相对频数(概率)除以组距就是概率密度。
组距就是最大值与最小值之差除以组数。
二、测定值的频数分布
㈠算出极差R
例如,测定镍合金试样中镍的质量分数(%),即百分含量,在相同条件下共测定90次,其结果如四师P.49表所示。
㈠算出极差R(即全距)
R=X最大-X最小=1.74-1.49=0.25
㈡确定组数和组距
组数的确定视样本容量而定,容量大时分成10~20组,容量小时(n<50)分成5~7组。
在该测定中分成9组。
确定组数之后,就要求组距。
组距:
最大值减最小值用组数除即得组距(即极差除以组数)。
该例的组距为:
㈢统计频数和计算相对频数
如果90个测定数据分成9组,可以先统计每一个组内数据的个数(称为频数),再计算频数与样本总数(即样本容量总数)之比(称为相对频数;若以%表示,则称频率)。
然后将组值范围、频数和相对频数列入表中,即可得频数分布表(见四师P.49表)。
㈣绘直方图
若以组界值为横坐标,相对频数(频率)为纵坐标作图,可得相对频数分布直方图(四师P.49)。
相对频数直方图上长方形的总面积为1。
在全部测定数据中,位于中间数值1.57~1.69之间的数据多一些,在其它范围的数据少一些,小至1.49,大至1.74附近的数据就更少。
也就是说,测定值具有明显的集中趋势。
测定数据的这种既分散又集中的特性,就是其内在规律性的表现。
三、随机误差的正态分布
1.正态分布N(μ,σ2)
随机误差的正态分布性质,用高斯分布来描述,它的数学表达式为:
(1)
图2精密度相同,平均值不同
图1平均值相同,精密度不同
从
(1)式高斯分布的数学表达式和正态分布曲线可以看到平均值μ和总体标准偏差σ
是正态分布的两个基本参数。
给定了μ和σ,正态分布曲线就完全确定了。
不管总体标准差σ为何值,分布曲线和横坐标之间所夹的总面积代表各种大小偏差的样
本值出现概率的总和,这就是概率密度函数在-∞2.标准正态分布曲线N(0,1)
高斯正态分布的数学表达式(1式)中,x、μ、σ都是变量,计算不便。
为此常采用变量转换的办法,将平均值的偏差(x-μ)以σ为单位,即令
则x-μ以任何值出现时,就可由其相当于u个σ而得出。
例1:
有一系列Fe的分析数据,μ=53.78%Fe,σ=0.20%,计算x=53.58%Fe时的u。
解:
这就是说,当一次测定值x=53.58%时,偏离总体平均值为一个标准差,即一个u单位。
例2:
某化学课程最终考试,平均成绩μ=75分,总体标准偏差σ=10分,计算x=100分时的u值。
解:
即在此考试中,得满分的将以2.5个标准偏差出现。
将上式(所令u式)代入高斯数学表达式,得
经过变量转换后,平均值为μ,总体标准偏差为σ的正态分布曲线为:
平均值μ=0,总体标准偏差σ=1的正态分布曲线,这种特殊的正态分布曲线称为标准正态分布曲线,用N(0,1)表示。
(四师P.52图3-5)。
3.标准正态分布概率密度函数积分表(会用)
假定测定值出现在u=±∞这样的无限范围内,则其出现的几率就等于100%。
如果测定值出现在u=-∞到u=0或u由0到+∞之间,则在该范围内出现的几率分别为50%。
u和面积的关系列于四师P.54表3-1。
例3:
某数值x落在平均值(指总体平均值)的2个标准偏差(σ)以内的概率是多少?
落在平均值的3个标准偏差以内的概率是多少?
解:
查四师P.54表3-1,u=2时的面积为0.4773,于是出现的概率为:
当u=3时,面积为0.4987,于是出现的概率为:
四师P.54例3-3,3-4(略)
讨论:
•1.假如对Fe2O3进行了多次测定。
Fe2O3的平均含量μ为11.04%,σ为0.03%,
•试计算Fe2O3含量落在2个标准偏差以内的几率。
•解:
查表u=2时,面积为0.4773,于是出现的概率为:
•
•2.已知某试样中含Co的标准值为1.75%,标准偏差σ=0.10%,设测量时无系统误
•差,求分析结果落在1.75%±0.15%范围内的概率。
•
解:
•查正态分布概率积分表,u=1.5时,概率为0.4554。
•分析结果落在1.75%±0.15%范围内的概率应为2×0.4554=86.6%。
•3.已知某试样中含Co的标准值为1.75%,标准偏差σ=0.10%,设测量时无系统
•误差,求分析结果大于2.00%的概率。
•解:
此属单侧检验的问题。
•查积分表,u=2.5时,概率为0.4938,整个正态分布曲线右侧的概率为1/2,即0.5000,故落在大于2.00%的概率为:
•0.5000-0.4938=0.62%
•4.求平均值μ-0.6σ至μ+0.6σ区间内的概率。
•解:
由题意知:
u=±0.6
•查正态分布概率积分表,u=0.6时,积分面积为0.2258,此为双侧分布。
•故概率为:
0.2258×2=45.16%
•5.对某试样中铁含量量进行了130次分析,分析结果符合正态分布N(55.20%,
•0.20%),求分析结果大于55.60%可能出现的次数。
•
解:
•查概率积分表,u=2.0时,概率为0.4773,整个正态分布曲线右侧的概率为0.5000,结果大于55.60%之概率应为
•0.5000-0.4773=0.0227
•故130×2.27%≈3(次)
•
•作业:
P.7214、15、16、17、18题
§3-4有限测定数据的统计处理
一、置信度与μ的置信区间
真值落在某一指定范围内的概率就叫置信概率(或叫置信度,置信水平),这个范围就叫做置信区间。
㈠置信度
假设分析某钢样中的含磷量,四次平行测定的平均值为0.0087%。
已知σ=0.0022%,如果将分析结果报告为:
或写成:
单侧分布的概率为:
查积分表(四师P.54表3-1;三师P.134,表5-3;武大P.248表7-2),当单侧面积(或说单侧概率)等于0.3415时,u=1.0,于是可报告成:
置信度通常以P表示,显著性水平以α表示,
㈡置信区间
1.已知总体标准偏差σ时的置信区间
2.已知样本标准偏差S时的置信区间
二、可疑测定值的取舍
(一)Q检验法(该法由迪安和狄克逊在1951年提出)
步骤:
⑴将测定数据按从小到大顺序排列:
X1、X2、X3、…Xn-1、Xn,其中可疑数据可能是X1、Xn。
⑵依下列公式计算舍弃商Q值:
若Xn为可疑值时,
若X1为可疑值时,
⑶由Q值表得Q的临界值QP,n
⑷判断
Q计≥QP,n则该可疑数据为无效测量,应舍弃;
Q计(二)四倍法
步骤:
⑴除可疑数据外,将其余数据相加求出算术平均值及平均偏差。
⑵如果可疑数据与平均值之差大于4。
即
则弃去此可疑数据,否则应予以保留。
(三)格鲁布斯检验法
⑴在一组数据中,只有一个可疑值时:
将测得的数据,按从小到大顺序排列为X1、X2、…、Xn-1、Xn。
其中X1或Xn可能是可疑值。
若X1是可疑值,则
若Xn是可疑值,则
G≥GP,n时,则该可疑值舍去,否则应保留。
⑵一组数据中有两个(或两个以上)可疑值:
①可疑值在同一侧
②可疑值在两侧
例:
某一标准溶液的4次测定值为0.1014、0.1012、0.1025、0.1016mol/L。
用格鲁布斯法判断可疑值0.1025mol/L可否弃去?
(P=95%)
解:
选定P=95%,
查(四师P.60表3-4)临界值,G(0.95,4)=1.46
因G故0.1025mol/L这个数据属于偶然误差范畴内的不应舍去。
例3-9(四师P.60)(略)
(四)置信区间检验法
凡是落在置信区间之外的数据应舍去,在区间内的数据应保留。
例:
测定铁矿石中铁的含量(以Fe2O3%表示),经6次测定,其结果为:
40.02%,40.12%,40.16%,40.18%,40.20%,40.18%。
试以t检验法判断该组数据中是否有可以舍去的数据(置信度为95%)?
解:
已知P=95%,n=6,查t值表(四师P.57表3-2;三师P.139表5-4;武大P.250表7-3)得tP,f=2.57
求得
=40.14%,S=0.066
故测得值落在40.07~40.21%范围内,应保留;否则应舍去。
在所测数据中40.02%不在此范围内,故应舍去。
小结:
以上介绍的四种处理可疑数据的方法,它们都是从统计的概率来考虑的。
①四倍法简单,但不严密,目前用得很少。
②Q检验法比较直观,计算方法简便,在测量次数较少(n<10)时,Q检验法是一种较为合理的方法。
③格鲁布斯法和t-检验法在判断可疑值是否舍去的过程中引进了正态分布中两个最重要的样本参数σ和S,方法的准确性较好,是合理而普遍适用的一种方法。
但是因需要计算σ和S,所以比较麻烦。
三、分析方法准确度的检验(显著性检验)
1.先假设两组数据之间不存在显著性差异。
2.确定一个适当的置信度(或显著性水平)
3.根据所选择的置信度检验两个数据集的差异是否显著
⑴检验t值
①样本平均值与真值比较
或
若t若t>t0.95,新方法不可靠(有显著性差异)
例1:
为了鉴定一个分析方法,取基准物(含量为100.0%)作了10次平行测定。
结果为:
100.3,99.2,99.4,100.0,99.4,99.9,100.1,99.4,99.6(%)。
试对此分析方法作出评价(置信度95%)。
解:
已知μ=100.0%,n=10,P=95%
查t值表,t0.95,9=2.260,t>t0.95,9,所以,若置信度为95%,测定结果与基准物的纯度有显著性差异。
例2:
(略,见课件)
②两组样本平均值比较
例3:
(见课件)
例4:
(见课件)
⑵检验F值
F值大于F表值,则认为两组数据的标准差之间有显著性差异,否则无显著性差异。
例5:
(见课件)
例6:
(见课件)
例:
(四师P.63,例3-11)略
四、分析结果的表示方法
报告分析结果时,须报告准确度、精密度(注意有效数字的位数)、测定次数、一定置信度下的置信区间。
•讨论:
P.7211、12题
•作业:
P.7321~27、29题
§3~5有效数字及其运算规则
一、有效数字的意义及位数
有效数字——是指分析工作中实际能够测量到的数字。
或者说,所有确定数字后加上一位不确定性的数字,就叫做有效数字。
例如,用普通分析天平称量某物的克数时,由于分析天平性能的限制,小数点后第四位的数字是由估计得到的,因此数据只能取到小数点后第四位。
设称出的重量为12.1238g,此数前面5位数字都是确定的,最后一位数字不确定,因此,一共有6位有效数字。
如果改用普通台称,由于台称的性能比分析天平差,小数点后第二位数字开始已不确定,因此,只能取到小数点后第二位。
得到的重量应为12.12g,则为四位有效数字。
又如:
读取滴定管上的刻度
甲得到23.43mL,乙得到23.42mL,丙得到23.44mL,丁得到23.43mL
定量分析中,在表示分析数据时,最重要的一点,就是只用有效数字。
有效数字的位数直接与测定的相对误差有关。
例如,用一般的分析天平称得某物体的重量为0.5180g,这个数不仅表明该物体的具体重量,而且也表示最后一位数字“0”是可疑的,即实际重量是0.5180±0.0001g范围内的某一数值。
此时称量的绝对误差为±0.0001g。
若将上述结果写成0.518g,则该物体实际重量将为(0.518±0.001)g范围内的某一数值,即绝对误差为±0.001g。
可见,准确度降低了10倍。
注意:
“0”在数值中的作用,“0”可以是有效数字,也可以不是有效数字。
1.在数字中间的“0”都是有效的;
2.在数字前面的“0”,只起定位作用,不是有效数字;
3.在数字后面“0”究竟是不是有效数字,必须根据具体情况来定。
请说明下列有效数字的位数:
1.00795位有效数字
0.24004位有效数字
0.50624位有效数字
852位有效数字
0.0051位有效数字
423545位有效数字
30.48%4位有效数字
4.32×10-53位有效数字
0.00302位有效数字
2×10-71位有效数字
3900有效数字位数不确定
100有效数字位数不确定
二、数字修约规则
“四舍六入,五后有数就进一,五后无数就成双”。
例如:
将下列数字修约成三位有效数字。
①2.718282.72②3.141593.14
③59.85759.9④45.35445.4
⑤76.549976.5⑥28.2528.2
⑦42.7542.8⑧32.5032.5
⑨23.55023.6⑩27.45127.5
注:
①一个数据的修约只能进行一次,不能分次修约。
②使用计算器进行计算时,一般不对中间每一步骤的计算结果进行修约,仅对最后的结果进行修约,使其符合事先所确定的位数。
三、有效数字的运算规则
㈠加减法
进行加减运算时,应以小数点后位数最少(即绝对误差最大)的那个数为准确定有效数字位数。
例:
(见课件)
㈡乘除法
进行乘除运算时,应以有效数字位数最少(即相对误差最大)的那个数为准,确定有效数字的位数。
例:
(见课件)
㈢对数运算
所取对数的位数应与真数有效数字位数相同。
例:
(见课件)
注:
①记录测定数值时,只保留一位可疑数字。
②计算有效数字位数时,若数据的首位数等于8或大于8,其有效数字的位数可多算一位。
③所有常数(如π、e的数值以及分析化学中常遇到的倍数、分数关系),都是非测定所得,其有效数字位数,视为任意的(即无限多位),需要几位就写几位。
④表示准确度和精密度时,取一位有效数字即可,最多取两位有效数字。
四、有效数字运算规则在分析化学中的应用
①各种化学平衡中有关浓度的计算;
②计算测定结果。
•讨论:
P.727、8、10题
•作业:
P.724~6、28题
§3-6提高分析结果准确度的方法
一、化学分析中对准确度的要求
为了不同目的进行化学分析所要求的准确度是不同的。
二、分析准确度的检验
1.平行测定
2.求和法
3.离子平衡法
4、用两种不同类型的方法分析
三、提高分析结果准确度的方法
1.选择适当的分析方法
2.减小测量的相对误差
3.检验和消除系统误差
⑴作对照分析
⑵作空白试验
⑶校正仪器
⑷分析结果的校正
4.适当增加平行测定次数,减小随机误差