光谱分析质量控制方法讲义.docx

上传人:b****5 文档编号:29755842 上传时间:2023-07-26 格式:DOCX 页数:17 大小:193.19KB
下载 相关 举报
光谱分析质量控制方法讲义.docx_第1页
第1页 / 共17页
光谱分析质量控制方法讲义.docx_第2页
第2页 / 共17页
光谱分析质量控制方法讲义.docx_第3页
第3页 / 共17页
光谱分析质量控制方法讲义.docx_第4页
第4页 / 共17页
光谱分析质量控制方法讲义.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

光谱分析质量控制方法讲义.docx

《光谱分析质量控制方法讲义.docx》由会员分享,可在线阅读,更多相关《光谱分析质量控制方法讲义.docx(17页珍藏版)》请在冰豆网上搜索。

光谱分析质量控制方法讲义.docx

光谱分析质量控制方法讲义

光谱分析-质量控制方法讲义

一、质量控制方法定义

质量控制方法是保证产品质量并使产品质量不断提高的一种质量管理方法。

它通过研究、分析产品质量数据的分布,揭示质量差异的规律,找出影响质量差异的原因,采取技术组织措施,消除或控制产生次品或不合格品的因素,使产品在生产的全过程中每一个环节都能正常的、理想的进行,最终使产品能够达到人们需要所具备的自然属性和特性,即产品的适用性、可靠性及经济性。

二、历史沿革

本方法是由美国贝尔电话研究所休哈特在1924年首先提出,后于1931年由他与同一研究所的道奇和罗米格两人一起研究进一步发展,成为创始人。

它有3个特点:

一是运用数量统计方法;二是着重于对生产全过程中的质量控制;三是广泛运用各种质量数据图。

三、几种统计技术

1、线性回归

1.1基础介绍

线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。

分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

针对光谱分析,以前的讲义中讲过,分析试样的标准值和实测值是呈线性关系的。

这种线性关系明显,则表示光谱的分析数据正确度和精密度良好。

这里把这种线性关系解释一下,我们这里所说的线性关系是标准值和实测值的线性关系。

注意,只要分析数据准确标准值和实测值的线性关系是一定存在的。

而元素光强和元素的百分含量的关系是有本质区别的,元素光强和元素的百分含量有关系,可以是线性的也可以是非线性的,这根元素的特征有关系,不在赘述。

1.2软件线性回归示例

Excel回归分析结果的详细阐释

利用Excel的数据分析进行回归,可以得到一系列的统计参量。

下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。

图1连续10年的最大积雪深度与灌溉面积(1971-1980)

回归结果摘要(SummaryOutput)如下(图2):

图2利用数据分析工具得到的回归结果

第一部分:

回归统计表

这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下(表1):

 

表1回归统计表

逐行说明如下:

Multiple对应的数据是相关系数(correlationcoefficient),即R=0.989416。

RSquare对应的数值为测定系数(determinationcoefficient),或称拟合优度(goodnessoffit),它是相关系数的平方,即有R2=0.9894162=0.978944。

Adjusted对应的是校正测定系数(adjusteddeterminationcoefficient),计算公式为

式中n为样本数,m为变量数,R2为测定系数。

对于本例,n=10,m=1,R2=0.978944,代入上式得

标准误差(standarderror)对应的即所谓标准误差,计算公式为

这里SSe为剩余平方和,可以从下面的方差分析表中读出,即有SSe=16.10676,代入上式可得

最后一行的观测值对应的是样本数目,即有n=10。

第二部分,方差分析表

方差分析部分包括自由度、误差平方和、均方差、F值、P值等(表2)。

表2方差分析表(ANOVA)

逐列、分行说明如下:

第一列df对应的是自由度(degreeoffreedom),第一行是回归自由度dfr,等于变量数目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。

对于本例,m=1,n=10,因此,dfr=1,dfe=n-m-1=8,dft=n-1=9。

第二列SS对应的是误差平方和,或称变差。

第一行为回归平方和或称回归变差SSr,即有

它表征的是因变量的预测值对其平均值的总偏差。

第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有

它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。

上述的y的标准误差即由SSe给出。

第三行为总平方和或称总变差SSt,即有

它表示的是因变量对其平均值的总偏差。

容易验证748.8542+16.10676=764.961,即有

而测定系数就是回归平方和在总平方和中所占的比重,即有

显然这个数值越大,拟合的效果也就越好。

第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。

第一行为回归均方差MSr,即有

第二行为剩余均方差MSe,即有

显然这个数值越小,拟合的效果也就越好。

第四列对应的是F值,用于线性关系的判定。

对于一元线性回归,F值的计算公式为

式中R2=0.978944,dfe=10-1-1=8,因此

第五列SignificanceF对应的是在显著性水平下的Fα临界值,其实等于P值,即弃真概率。

所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。

可见,P值越小越好。

对于本例,P=0.0000000542<0.0001,故置信度达到99.99%以上。

第三部分,回归参数表

回归参数表包括回归模型的截距、斜率及其有关的检验参数(表3)。

表3回归参数表

 

第一列Coefficients对应的模型的回归系数,包括截距a=2.356437929和斜率b=1.812921065,由此可以建立回归模型

第二列为回归系数的标准误差(用

表示),误差值越小,表明参数的精确度越高。

这个参数较少使用,只是在一些特别的场合出现。

例如L.Benguigui等人在Whenandwhereisacityfractal?

一文中将斜率对应的标准误差值作为分形演化的标准,建议采用0.04作为分维判定的统计指标(参见EPB2000)。

不常使用标准误差的原因在于:

其统计信息已经包含在后述的t检验中。

第三列tStat对应的是统计量t值,用于对模型参数的检验,需要查表才能决定。

t值是回归系数与其标准误差的比值,即有

根据表3中的数据容易算出:

对于一元线性回归,t值可用相关系数或测定系数计算,公式如下

将R=0.989416、n=10、m=1代入上式得到

对于一元线性回归,F值与t值都与相关系数R等价,因此,相关系数检验就已包含了这部分信息。

但是,对于多元线性回归,t检验就不可缺省了。

第四列Pvalue对应的是参数的P值(双侧)。

当P<0.05时,可以认为模型在α=0.05的水平上显著,或者置信度达到95%;当P<0.01时,可以认为模型在α=0.01的水平上显著,或者置信度达到99%;当P<0.001时,可以认为模型在α=0.001的水平上显著,或者置信度达到99.9%。

对于本例,P=0.0000000542<0.0001,故可认为在α=0.0001的水平上显著,或者置信度达到99.99%。

P值检验与t值检验是等价的,但P值不用查表,显然要方便得多。

最后几列给出的回归系数以95%为置信区间的上限和下限。

可以看出,在α=0.05的显著水平上,截距的变化上限和下限为-1.85865和6.57153,即有

斜率的变化极限则为1.59615和2.02969,即有

第四部分,残差输出结果

这一部分为选择输出内容,如果在“回归”分析选项框中没有选中有关内容,则输出结果不会给出这部分结果。

残差输出中包括观测值序号(第一列,用i表示),因变量的预测值(第二列,用

表示),残差(residuals,第三列,用ei表示)以及标准残差(表4)。

表4残差输出结果

预测值是用回归模型

计算的结果,式中xi即原始数据的中的自变量。

从图1可见,x1=15.2,代入上式,得

其余依此类推。

残差ei的计算公式为

从图1可见,y1=28.6,代入上式,得到

其余依此类推。

标准残差即残差的数据标准化结果,借助均值命令average和标准差命令stdev容易验证,残差的算术平均值为0,标准差为1.337774。

利用求平均值命令standardize(残差的单元格范围,均值,标准差)立即算出表4中的结果。

当然,也可以利用数据标准化公式

逐一计算。

将残差平方再求和,便得到残差平方和即剩余平方和,即有

利用Excel的求平方和命令sumsq容易验证上述结果。

以最大积雪深度xi为自变量,以残差ei为因变量,作散点图,可得残差图(图3)。

残差点列的分布越是没有趋势(没有规则,即越是随机),回归的结果就越是可靠。

用最大积雪深度xi为自变量,用灌溉面积yi及其预测值

为因变量,作散点图,可得线性拟合图(图4)。

图3残差图

图4线性拟合图

第五部分,概率输出结果

在选项输出中,还有一个概率输出(ProbabilityOutput)表(表5)。

第一列是按等差数列设计的百分比排位,第二列则是原始数据因变量的自下而上排序(即从小到大)——选中图1中的第三列(C列)数据,用鼠标点击自下而上排序按钮

,立即得到表5中的第二列数值。

当然,也可以沿着主菜单的“数据(D)→

排序(S)”路径,打开数据排序选项框,进行数据排序。

用表5中的数据作散点图,可以得到Excel所谓的正态概率图(图5)。

表5概率输出表

图5正态概率图

【几点说明】

第一,多元线性回归与一元线性回归结果相似,只是变量数目m≠1,F值和t值等统计量与R值也不再等价,因而不能直接从相关系数计算出来。

第二,利用SPSS给出的结果与Excel也大同小异。

当然,SPSS可以给出更多的统计量,如DW值。

在表示方法上,SPSS也有一些不同,例如PValue(P值)用Sig.(显著性)表征,因为二者等价。

只要能够读懂Excel的回归摘要,就可以读懂SPSS回归输出结果的大部分内容。

1.3思考与应用

请考虑如何利用以上示例,线性回归试样的实测值和标准值之间的线性关系,要求写出以下统计量。

元素

C

Si

Mn

Cr

a

-0.0003

0.0004

0.0003

0

b

0.9999

0.9979

0.9981

0.999997

R

0.9999

0.9997

0.9997

0.99999

f

6

6

6

6

R0.01,6

0.8343

0.8343

0.8343

0.8343

R0.05,6

0.7067

0.7067

0.7067

0.7067

P(%)

95.43

94.24

96.25

99.83

S

0.00972

0.0091

0.01

0.0029

线性方程

y=0.9999x-0.0003

y=0.9979x+0.0004

y=0.9981x+0.0003

y=0.999997x

注:

a:

线性方程的截距;b:

直线斜率;R:

相关系数;f:

自由度(f=n-2);R0.01,6:

置信概率99%时的相关系数临界值;

R0.05,6:

置信概率95%时的相关系数临界值;P:

置信概率;S:

标准偏差。

2检出限(线性)

根据仪器对于空白的响应可用方程截距a表示,仪器响应的标准偏差可用校准曲线的标准偏差Sy/x来表示。

故可利用方程yLOD=a+3sy/x=a+bxLOD,则xLOD=3sy/x/b.

元素

C

Si

Mn

Cr

S

0.00972

0.0091

0.01

0.0029

检出限

0.02916

0.0273

0.03

0.0087

注:

xLOD为检出限。

3加标回收率

回收率:

R=(C1-C2)/C3*100

C1:

表示标样1测定的某元素的浓度;

C2:

表示标样2测定的某元素的浓度;

C3:

是指标样1和标样2某元素标定值的差值。

加标回收率标样设置时应充分考虑到其浓度梯度,如浓度梯度过于紧密,则受标准偏差的影响较大,一般至少选择梯度时尽量大于10倍标准差。

C元素

Si元素

Mn元素

测试值

指定指

R

测试值

指定指

R

测试值

指定指

R

0.0013

0.0013

/

0.0014

0.0014

/

0.1394

0.14

/

0.055

0.054

101.8975

0.1286

0.115

111.9718

0.1917

0.19

104.6

0.1084

0.104

106.8

0.3332

0.341

90.53097

0.324

0.32

101.7692

0.8913

0.9

98.3543

0.4175

0.426

99.17647

0.8141

0.82

98.02

1.0969

1.09

108.2105

0.4746

0.478

109.8077

1.0178

1.04

92.59091

1.2232

1.21

105.25

1.1231

1.12

101.0125

1.3099

1.3

112.3462

4.精密度控制

利用GB/T4336-2002附表4所示公式进行精密度的控制,例如某一含量的试样测试时精密度应满足下表重复性和再现性的范围,否则重新测试。

 元素

Wt(%) 

重复性限r≤

再现性限R≤

适用范围

C

0.196

0.0147096

0.0227332

0.03-0.7

Si

0.396

0.013504029

0.0273544

0.07-0.7

Mn

1.47

0.045259

0.061087408

0.1-2.0

P

0.0202

0.00179684

0.0030806

0.004-0.07

S

0.007

0.001939

0.0033883

0.002-0.06

Mo

0.25

0.011870373

0.0176

0.1~1.2

Ni

0.759

0.0243725

0.0366143

0.1~2.0

Cr

1.21

0.031763

0.058889

0.1~2.0

Cu

0.096

0.006683443

0.009007256

0.08~1.0

Al

0.061

0.004665436

0.007763585

0.009~1.5

Ti

0.093

0.005624891

0.010518635

0.01~0.9

V

0.105

0.00423

0.009163

0.04~0.7

5.统计分析在内控样、复验、重复检验、专业分析的应用

内控样、复验、重复检验、、专业分析进行等质量控制方法这里不再赘述,以前曾经详细的讲解过。

这里重点想说明的是控制图在以上方面的应用。

下面我以现有的8个均质试样的拉伸试验数据中的抗拉强度列了出来。

并应用控制图的方法,对拉伸数据的质量进行控制。

步骤1、列表并计算

序号

抗拉强度(MPa)

公式计算

备注

1

605

2

603

3

608

4

612

5

604

6

606

7

605

8

607

平均值

606.25

AVERAGE

 

标准偏差

2.815772

应用STDEV

 

控制图的下限

597.8027

平均值-3S

 

控制图的上限

614.6973

平均值+3S

 

步骤2、画图

EXCEL画图的控制限和均值线我重点说一下。

1)折线图画好之后,右键单击图中的任意部位,点击“选择数据”,然后点击“添加”。

在“系列名称”栏写上“控制上限”,在系列值里填写“614.6973”。

2)选中所添加的点,右键右键单击图中的任意部位,点击“更改表类型”、“X、Y散点图”。

3)选中所添加的点,右键右键单击图中的任意部位,点击“设置数据格式”,并在所有下拉菜单中能选择“无”的,均选择为“无”。

4)

5)选中所添加的点,依次点击“布局”、“误差线”、“误差线其它选项”“标准偏差”

6)选中所添加的点,选中点击“格式”、“设置所选内容格式”、“固定值”栏填写“8”,线型和颜色选自己喜欢的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 哲学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1