试验设计与数据处理-李云雁-全套323页.ppt

资源描述

试验设计与数据处理-李云雁-全套323页.ppt

《试验设计与数据处理-李云雁-全套323页.ppt》由会员分享，可在线阅读，更多相关《试验设计与数据处理-李云雁-全套323页.ppt（323页珍藏版）》请在冰豆网上搜索。

试验设计与数据处理-李云雁-全套323页.ppt

试验设计与数据处理（第二版）,ExperimentDesignandDataProcessing,引言,0.1试验设计与数据处理的发展概况,20世纪20年代，英国生物统计学家及数学家费歇（RAFisher）提出了方差分析20世纪50年代，日本统计学家田口玄一将试验设计中应用最广的正交设计表格化数学家华罗庚教授也在国内积极倡导和普及的“优选法”我国数学家王元和方开泰于1978年首先提出了均匀设计,0.2试验设计与数据处理的意义,0.2.1试验设计的目的:

合理地安排试验,力求用较少的试验次数获得较好结果例：

某试验研究了3个影响因素：

A：

A1，A2，A3B：

B1，B2，B3C：

C1，C2，C3全面试验：

27次正交试验：

9次,0.2.2数据处理的目的,通过误差分析，评判试验数据的可靠性；确定影响试验结果的因素主次，抓住主要矛盾，提高试验效率；确定试验因素与试验结果之间存在的近似函数关系，并能对试验结果进行预测和优化；试验因素对试验结果的影响规律，为控制试验提供思路；确定最优试验方案或配方。

第1章试验数据的误差分析,误差分析（erroranalysis）：

对原始数据的可靠性进行客观的评定误差（error）：

试验中获得的试验值与它的客观真实值在数值上的不一致试验结果都具有误差，误差自始至终存在于一切科学实验过程中客观真实值真值,1.1真值与平均值,1.1.1真值（truevalue）真值：

在某一时刻和某一状态下，某量的客观值或实际值真值一般是未知的相对的意义上来说，真值又是已知的平面三角形三内角之和恒为180国家标准样品的标称值国际上公认的计量值高精度仪器所测之值多次试验值的平均值,1.1.2平均值（mean）,

（1）算术平均值（arithmeticmean）,等精度试验值,适合：

试验值服从正态分布,

（2）加权平均值（weightedmean）,适合不同试验值的精度或可靠性不一致时,wi权重,加权和,（3）对数平均值（logarithmicmean）,说明：

若数据的分布具有对数特性，则宜使用对数平均值对数平均值算术平均值如果1/2x1/x22时，可用算术平均值代替,设两个数：

x10，x20，则,（4）几何平均值（geometricmean）,当一组试验值取对数后所得数据的分布曲线更加对称时，宜采用几何平均值。

几何平均值算术平均值,设有n个正试验值：

x1，x2，xn，则,（5）调和平均值（harmonicmean）,常用在涉及到与一些量的倒数有关的场合调和平均值几何平均值算术平均值,设有n个正试验值：

x1，x2，xn，则：

1.2误差的基本概念,1.2.1绝对误差（absoluteerror）

（1）定义绝对误差试验值真值或,

（2）说明,真值未知，绝对误差也未知,可以估计出绝对误差的范围：

绝对误差限或绝对误差上界,或,绝对误差估算方法：

最小刻度的一半为绝对误差；最小刻度为最大绝对误差；根据仪表精度等级计算：

绝对误差=量程精度等级%,1.2.2相对误差（relativeerror）,

（1）定义：

或,或,

（2）说明：

真值未知，常将x与试验值或平均值之比作为相对误差：

或,可以估计出相对误差的大小范围：

相对误差限或相对误差上界,相对误差常常表示为百分数（%）或千分数（）,1.2.3算术平均误差（averagediscrepancy）,定义式：

可以反映一组试验数据的误差大小,1.2.4标准误差（standarderror）,当试验次数n无穷大时，总体标准差：

试验次数为有限次时，样本标准差：

表示试验值的精密度，标准差，试验数据精密度,

（1）定义：

以不可预知的规律变化着的误差，绝对误差时正时负，时大时小

（2）产生的原因：

偶然因素（3）特点：

具有统计规律小误差比大误差出现机会多正、负误差出现的次数近似相等当试验次数足够多时，误差的平均值趋向于零可以通过增加试验次数减小随机误差随机误差不可完全避免的,1.3.1随机误差（randomerror）,1.3试验数据误差的来源及分类,1.3.2系统误差（systematicerror）,

（1）定义：

一定试验条件下，由某个或某些因素按照某一确定的规律起作用而形成的误差

（2）产生的原因：

多方面（3）特点：

系统误差大小及其符号在同一试验中是恒定的它不能通过多次试验被发现，也不能通过取多次试验值的平均值而减小只要对系统误差产生的原因有了充分的认识，才能对它进行校正，或设法消除。

1.3.3过失误差（mistake）,

（1）定义：

一种显然与事实不符的误差

（2）产生的原因：

实验人员粗心大意造成（3）特点：

可以完全避免没有一定的规律,1.4.1精密度（precision）,

（1）含义：

反映了随机误差大小的程度在一定的试验条件下，多次试验值的彼此符合程度例：

甲：

11.45，11.46，11.45，11.44乙：

11.39，11.45，11.48，11.50

（2）说明：

可以通过增加试验次数而达到提高数据精密度的目的试验数据的精密度是建立在数据用途基础之上的试验过程足够精密，则只需少量几次试验就能满足要求,1.4试验数据的精准度,（3）精密度判断,极差（range）,标准差（standarderror）,R，精密度,标准差，精密度,方差（variance）,标准差的平方：

样本方差（s2）总体方差

（2）方差，精密度,1.4.2正确度（correctness）,

（1）含义：

反映系统误差的大小

（2）正确度与精密度的关系：

精密度不好，但当试验次数相当多时，有时也会得到好的正确度,精密度高并不意味着正确度也高,（a）,（b）,（c）,1.4.3准确度（accuracy）,

（1）含义：

反映了系统误差和随机误差的综合表示了试验结果与真值的一致程度

（2）三者关系无系统误差的试验,精密度：

ABC正确度：

ABC准确度：

ABC,有系统误差的试验,精密度：

ABC准确度：

ABC，AB，C,1.5.1随机误差的检验,1.5试验数据误差的统计假设检验,

（1）目的：

对试验数据的随机误差或精密度进行检验。

（2）检验步骤：

计算统计量,查临界值,一般取0.01或0.05，表示有显著差异的概率,双侧（尾）检验（two-sided/tailedtest）：

检验,若,则判断两方差无显著差异，否则有显著差异,单侧（尾）检验（one-sided/tailedtest）：

左侧（尾）检验：

则判断该方差与原总体方差无显著减小，否则有显著减小,右侧（尾）检验,则判断该方差与原总体方差无显著增大，否则有显著增大,若,若,1.5.1.2F检验（F-test）,

（1）目的：

对两组具有正态分布的试验数据之间的精密度进行比较

（2）检验步骤计算统计量,设有两组试验数据：

都服从正态分布，样本方差分别为,和,和,，则,第一自由度为,第二自由度为,服从F分布，,查临界值给定的显著水平,查F分布表,临界值,双侧（尾）检验（two-sided/tailedtest）：

检验,若,则判断两方差无显著差异，否则有显著差异,单侧（尾）检验（one-sided/tailedtest）：

左侧（尾）检验：

则判断该判断方差1比方差2无显著减小，否则有显著减小,右侧（尾）检验,则判断该方差1比方差2无显著增大，否则有显著增大,若,若,（3）Excel在,F检验中的应用,1.5.2系统误差的检验,1.5.2.1t检验法

（1）平均值与给定值比较目的：

检验服从正态分布数据的算术平均值是否与给定值有显著差异检验步骤：

计算统计量：

给定值（可以是真值、期望值或标准值）,双侧检验：

若,则可判断该平均值与给定值无显著差异，否则就有显著差异,单侧检验,左侧检验,若,且,则判断该平均值与给定值无显著减小，否则有显著减小,右侧检验,若,且,则判断该平均值与给定值无显著增大，否则有显著增大,

（2）两个平均值的比较目的：

判断两组服从正态分布数据的算术平均值有无显著差异计算统计量：

两组数据的方差无显著差异时,s合并标准差：

两组数据的精密度或方差有显著差异时,服从t分布，其自由度为：

t检验,双侧检验：

若,则可判断两平均值无显著差异，否则就有显著差异,单侧检验,左侧检验,若,且,则判断该平均值1较平均值2无显著减小，否则有显著减小,右侧检验,若,且,则判断该平均值1较平均值2无显著增大，否则有显著增大,（3）成对数据的比较目的：

试验数据是成对出现，判断两种方法、两种仪器或两分析人员的测定结果之间是否存在系统误差计算统计量：

成对测定值之差的算术平均值：

零或其他指定值,n对试验值之差值的样本标准差：

t检验若,否则两组数据之间存在显著的系统误差,，则成对数据之间不存在显著的系统误差，,（4）Excel在,t检验中的应用,1.5.2.2秩和检验法（ranksumtest）,

（1）目的：

两组数据或两种试验方法之间是否存在系统误差、两种方法是否等效等，不要求数据具有正态分布

（2）内容：

设有两组试验数据，相互独立，n1，n2分别是两组数据的个数，总假定n1n2；将这个试验数据混在一起，按从小到大的次序排列每个试验值在序列中的次序叫作该值的秩（rank）将属于第1组数据的秩相加，其和记为R1R1第1组数据的秩和（ranksum）如果两组数据之间无显著差异，则R1就不应该太大或太小,查秩和临界值表：

根据显著性水平和n1，n2，可查得R1的上下限T2和T1检验：

如果R1T2或R1T1，则认为两组数据有显著差异，另一组数据有系统误差如果T1R1T2，则两组数据无显著差异，另一组数据也无系统误差,（3）例：

设甲、乙两组测定值为：

甲：

8.6，10.0，9.9，8.8，9.1，9.1乙：

8.7，8.4，9.2，8.9，7.4，8.0，7.3，8.1，6.8已知甲组数据无系统误差，试用秩和检验法检验乙组测定值是否有系统误差。

（0.05）,解:

（1）排序：

（2）求秩和R1R1=7911.511.5141568（3）查秩和临界值表对于0.05，n1=6，n2=9得T1=33，T263，R1T2故：

两组数据有显著差异，乙组测定值有系统误差,1.5.3异常值的检验,可疑数据、离群值、异常值一般处理原则为：

在试验过程中，若发现异常数据，应停止试验，分析原因，及时纠正错误试验结束后，在分析试验结果时，如发现异常数据，则应先找出产生差异的原因，再对其进行取舍在分析试验结果时，如不清楚产生异常值的确切原因，则应对数据进行统计处理；若数据较少，则可重做一组数据对于舍去的数据，在试验报告中应注明舍去的原因或所选用的统计方法,1.5.3.1拉依达（）检验法,内容：

可疑数据xp，若,则应将该试验值剔除。

说明：

计算平均值及标准偏差s时，应包括可疑值在内,3s相当于显著水平0.01，2s相当于显著水平0.05,可疑数据应逐一检验，不能同时检验多个数据首先检验偏差最大的数剔除一个数后，如果还要检验下一个数，应重新计算平均值及标准偏差方法简单，无须查表该检验法适用于试验次数较多或要求不高时3s为界时，要求n102s为界时，要求n5,有一组分析测试数据：

0.128，0.129，0.131，0.133，0.135，0.138，0.141，0.142，0.145，0.148，0.167，问其中偏差较大的0.167这一数据是否应被舍去?

（0.01）,解：

（1）计算,例：

（2）计算偏差,（3）比较,3s30.011160.03350.027,故按拉依达准则，当0.01时，0.167这一可疑值不应舍去,

（2）格拉布斯（Grubbs）检验法,内容：

可疑数据xp，若,则应将该值剔除。

Grubbs检验临界值,格拉布斯（Grubbs）检验临界值G（,n）表,说明：

计算平均值及标准偏差s时，应包括可疑值在内可疑数据应逐一检验，不能同时检验多个数据首先检验偏差最大的数剔除一个数后，如果还要检验下一个数，应重新计算平均值及标准偏差能适用于试验数据较少时格

展开阅读全文