ImageVerifierCode 换一换
格式:DOCX , 页数:22 ,大小:311.30KB ,
资源ID:11479452      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/11479452.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据处理论文.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据处理论文.docx

1、数据处理论文实验设计与数据处理课程总结与体会本文主要是总结了数据处理和实验设计两部分内容的一些概念、方法,详细地介绍其中方法的步骤和原理,并对数据处理方法和实验设计方法在实际实验应用中,各举了一个例子。最后,还总结了自己对这门课程的一些体会。一、数据处理1、数据处理的目的通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率;确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化;研究试验因素对试验结果的影响规律,为控制试验提供思路;确定最优试验方案或配方。2、数据处理的有关概念及其计算方法(1)真值 在某一时刻和某一状态下,某量的客观值

2、或实际值 ,在科学实验中,经常将多次试验值的平均值作为真值得近似值。(2)平均值 平均值的种类很多,常用的平均值及其算法和使用条件如下:算术平均值等精度试验值,试验值服从正态分布加权平均值适合不同试验值的精度或可靠性不一致时对数平均值若数据的分布具有对数特性,则宜使用对数平均值几何平均值当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。调和平均值常用在涉及到与一些量的倒数有关的场合如果1/2x1/x22 时,可用算术平均值代替(3) 各种误差的定义及其计算和使用条件绝对误差 绝对误差试验值真值相对误差算术平均误差 可以反映一组试验数据的误差大小 标准误差当试验次数n无穷大时,

3、总体标准差:试验次数为有限次时,样本标准差:表示试验值的精密度,标准差,试验数据精密度 小误差比大误差出现机会多;正、负误差出现的次数近似相等,当试验次数足够多时,误差的平均值趋向于零;可以通过增加试验次数减小随机误差,但随机误差不可完全避免的。 (4) 精密度,反映了随机误差大小的程度,可以通过增加试验次数而达到提高数据精密度的目的 精密度判断方法:极差:标准差和方差:方差,精密度(5) 试验数据误差的统计检验 随机误差的检验 随机误差的大少可用实验数据的精密度来反映,而精密度也可以用方差来检验,所以对测试结果进行方差检验,即可判断各试验或结果的随机误差之间的关系。检验检验,就是试验数据的总

4、体方差已知的情况下,对试验数据的随机误差或精密度进行检验。检验步骤: 如果数据服从正态分布,则统计量为:且服从自由度为的 分布,则通过查临界值 ,(为显著性水平,一般取0.05 或0.1)来进行检验。1 双侧检验:当,则判断两方差无显著差异,否则有显著差异2 左侧(尾)检验 :当,则判断该方差与原总体方差无显著减小,否则有显著减小3 右侧(尾)检验: 当,则判断该方差与原总体方差无显著增大,否则有显著增大系统误差的检验t检验法 目的:检验服从正态分布数据的算术平均值是否与给定值有显著差异检验步骤:若试验数据服从正态分布,先计算统计量: 服从自由度为 的 t分布 ,将t与临界值进行比较1 双侧检

5、验:当 ,则判断两方差无显著差异,否则有显著差异( 给定值可以是真值、期望值或标准值)2 左侧(尾)检验 :当 且断该方差与原总体方差无显著减小,否则有显著减小3 右侧(尾)检验: 当 且 ,则判断该方差与原总体方差无显著增大,否则有显著增大秩和检验法目的:两组数据或两种试验方法之间是否存在系统误差、两种方法是否等效等 ,不要求数据具有正态分布 步骤: 设有两组试验数据,相互独立 ,n1,n2分别是两组数据的个数 ,总假定 n1n2;将这个试验数据混在一起,按从小到大的次序排列 ;每个试验值在序列中的次序叫作该值的秩;将属于第1组数据的秩相加,其和记为R1( R1第1组数据的秩和)。 如果两组

6、数据之间无显著差异,则R1就不应该太大或太小检验:查秩和临界值表: 根据显著性水平 和n1,n2,可查得R1的上下限T2和T1 1 如果R1T2 或R1 T1,则认为两组数据有显著差异,另一组数据有系统误差2 如果T1R1T2,则两组数据无显著差异,另一组数据也无系统误差 异常值的检验 处理原则为: 在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠正错误;试验结束后,在分析试验结果时,如发现异常数据,则应先找出产生差异的原因,再对其进行取舍;在分析试验结果时,如不清楚产生异常值的确切原因,则应对数据进行统计处理;若数据较少,则可重做一组数据;对于舍去的数据,在试验报告中应注明舍去的原

7、因或所选用的统计方法。拉依达()检验法 方法: 对可疑数据xp ,若,则剔除这一数据,可疑数据应逐一检验。首先检验偏差最大的数。剔除一个数后,如果还要检验下一个数 ,应重新计算平均值及标准偏差。S取值方法:3s为界时,要求n10;2s为界时,要求n5 (6) 有效数字的运算加、减运算 与其中小数点后位数最少的相同;乘、除运算 各乘、除数中有效数字位数最少的为准;乘方、 方运算 其底数的相同: 例如:2.42=5.8;对数运算: 与其真数的相同 如ln6.841.92;lg0.000044;在4个以上数的平均值计算中,平均值的有效数字可增加一位;所有取自手册上的数据,其有效数字位数按实际需要取,

8、但原始数据如有限制,则应服从原始数据;一些常数的有效数字的位数可以认为是无限制的;一般在工程计算中,取23位有效数字;3、试验的方差分析 方差分析是一种用于检验试验中有关因素对试验结果影响的显著性的检验方法。试验指标衡量或考核试验效果的参数。 因素则是影响试验指标的条件。可控因素是水平因素的不同状态或内容。 (1)单因素试验的方差分析 目的:检验一个因素对试验结果的影响是否显著性单因素试验方差分析基本步骤 1 计算平均值:组内平均值 :2 计算离差平方和总离差平方和SST: 表示了各试验值与总平均值的偏差的平方和,反映了试验结果之间存在的总差异 组间离差平方和SSA: 反映了各组内平均值之间的

9、差异程度,由于因素A不同水平的不同作用造成的组内离差平方和 SSe: 反映了在各水平内,各试验值之间的差异程度,由于随机误差的作用产生 3 计算自由度 总自由度 :dfTn1 组间自由度 :dfA r1组内自由度 : dfe nr 三者关系: dfT dfA dfe4 计算平均平方均方离差平方和除以对应的自由度 MSA组间均方 MSA组间均方:5 F检验服从自由度为(dfA,dfe)的F分布,对于给定的显著性水平 ,从F分布表查得临界值F (dfA,dfe) 如果FA F (dfA,dfe) ,则认为因素A对试验结果有显著影响否则认为因素A对试验结果没有显著影响 6 方差分析表 差异源SSdf

10、MSF显著性组间(因素A)SSAr1MSASSA(r1)MSAMSe组内(误差)SSenrMSeSSe(nr)总和SSTn1若 FA F0.01(dfA,dfe) ,称因素A对试验结果有非常显著的影响,用 “* *”号表示; 若 F0.05(dfA,dfe) FA F0.01(dfA,dfe) ,则因素A对试验结果有显著的影响,用“*”号表示; 若 FA F0.05(dfA,dfe) ,则因素A对试验结果的影响不显著(2) 双因素试验的方差分析双因素试验的方差分析,是用来讨论两个因素对试验结果影响的显著性,又称为二元方差分析。双因素无重复试验方差分析的基本步骤 1 计算平均值 :总平均 : A

11、i平均: Bj平均: 2 计算离差平方和 总离差平方和:因素A引起离差的平方和:因素B引起离差的平方和:误差平方和:3 计算自由度 SSA的自由度:dfA r1 SSB的自由度:dfBs1 SSe的自由度:dfe(r1)(s1) SST的自由度:dfTn1rs1 dfT dfA dfB dfe4 计算均方 5 F检验 FA服从自由度为(dfA,dfe)的F分布;FB服从自由度为(dfB,dfe)的F分布;对于给定的显著性水平 ,查F分布表: F (dfA,dfe), F (dfB,dfe)若FAF (dfA,dfe),则因素A对试验结果有显著影响,否则无显著影响; 若FBF (dfB,dfe)

12、,则因素B对试验结果有显著影响,否则无显著影响;4、试验数据的回归分析 回归分析是处理变量之间相关关系的统计方法。目的是确定回归方程:变量之间近似的函数关系式,进而检验回归方程的显著性,对试验结果进行预测。(1)一元线性回归方程的建立 设有一组试验数据 (如表),若x,y符合线性关系 a,b回归系数残差平方和 :由最小二乘法原理得:1 一元线性回归效果的检验 1相关系数检验法 相关系数,用来描述变量x与y的线性相关程度,用r表示。定义式: 相关系数特点如下:1r1;当r1:x与y有精确的线性关系;r0:x与y负线性相关r0:x与y正线性相关;r0时 ,x与y没有线性关系 ,但可能存在其它类型关

13、系;相关系数r越接近1,x与y的线性相关程度越高; 试验次数越少 , r越接近1;(2)多元线性回归分析 由于在实际解决问题是,往往是由多个因素影响,所以设多元线性回归方程:,在根据一元线性回归分析的原理求出相关系数。(3)多元线性回归方程显著性检验 取用,上文中以介绍的F检验法或t检验法。二、试验设计 1、优选法优选法:根据生产和科研中的不同问题,利用数学原理,合理地安排试验点,减少试验次数,以求迅速地找到最佳点的一类科学方法。其适用于试验指标与因素间不能用数学形式表达或者表达式很复杂的情况。 其中,可分为单因素优选法和双因素优选法。(1) 单因素优选法 试验指标f(x)是定义区间(a,b)

14、的单峰函数,为了用尽量少的试验次数,来确定f(x)的最大值的近似位置(取值范围),这时应用单因素优选法。 其方法有很多,如来回调试方法、黄金分割法(0.618法)、分数法 、对分法、抛物线法、分批试验法(分为均分法、比例分割法)和逐步提高法(爬山法)。下面就重点来介绍一下,黄金分割法、分批试验法和抛物线法。黄金分割法将第一个试验点x1安排在试验范围内的0.618处,得试验结果y1=f(x1),再在x1的对称点x2。做一次试验,得到试验结果y2=f(x2);比较y1=f(x1)和y2=f(x2)哪个大,如果y1=f(x1)大,就去掉(a, x2),如下图。在留下的区间求x1的对称点,如此一直做到

15、达到要求为止。抛物线法 在三个试验点x1,x2,x3,且x1x2x3,分别得试验值y1,y2,y3,根据Lagrange插值法可以得到一个二次函数:设二次函数在x4取得最大值:在x x4处做试验,得试验结果y4 ,假定y1,y2,y3,y4中的最大值是由xi给出.除xi之外,在x1,x2,x3和x4中取较靠近xi的左右两点,将这三点记为 x1,x2,x3此处x1x2x3, ,若在处的函数值分别为 y1,y2,y3.如此重复,知道找出适合要求的范围。(2)双因素优选法双因素优选法问题,就是为了迅速地找到二元函数zf(x,y)的最大值,及其对应的(x,y)点的问题,往往假定一个因素为固定值,继而进

16、行是单峰问题出力。双因素优选法有以下几种常用的方法,对开法、旋升法、平行线法、按格上升法 翻筋斗法 。(3)优选法在因素主次判断中的应用:在因素的试验范围内做两个试验 (可选0.618和0.382两点);如果这两点的效果差别显著,则为主要因素;如果这两点效果差别不大, 在(0.3820.618)、(00.382)和(0.6181)三段的中点分别再做一次试验。 如果仍然差别不大,则此因素为非主要因素,可将该因素固定在0.3820.618间的任一点。 当对某因素做了五点以上试验后,如果各点效果差别不明显,则该因素为次要因素2、正交设计正交试验设计利用正交表科学地安排与分析多因素试验的方法,大大减少

17、试验次数。适合于多因素试验。(1)正交表表示 等水平正交表 混合水平正交表各因素水平数相等的正交表 记号 :Ln( r m ) L正交表代号n正交表横行数(试验次数)r因素水平数m正交表纵列数(最多能安排的因数个数) (2)正交表特点等水平正交表表中任一列,不同的数字出现的次数相同;表中任意两列,各种同行数字对(或称水平搭配)出现的次数相同。这两性质合称为“正交性” ,使试验点在试验范围内排列整齐、规律,也使试验点在试验范围内散布均匀。混合水平正交表 各因素的水平数不完全相同的正交表;表中任一列,不同数字出现次数相同;每两列,同行两个数字组成的各种不同的水平搭配出现的次数是相同的,但不同的两列

18、间所组成的水平搭配种类及出现次数是不完全相同。(3)正交试验设计的优点 能均匀地挑选出代表性强的少数试验方案,由少数试验结果,可以推出较优的方案,可以得到试验结果之外的更多信息。 (4)正交试验设计的基本步骤明确试验目的,确定评价指标挑选因素(包括交互作用),确定水平选正交表,进行表头设计明确试验方案,进行试验,得到结果对试验结果进行统计分析进行验证试验,作进一步分析(5)正交试验设计结果的直观分析法直观分析法简单直观、计算量小,其有四种情况,分别是单指标正交试验设计及其结果的直观分析、多指标正交试验设计及其结果的直观分析、有交互作用的正交试验设计及其结果的直观分析和混合水平试验设计及其结果的

19、直观分析。其方法大致相同,下面以单指标正交试验设计及其结果的直观分析,来说明方法的步骤单指标正交试验设计及其结果的直观分析步骤选正交表1 因素数正交表列数2 因素水平数与正交表对应的水平数一致3 选较小的表表头设计将试验因素安排到所选正交表相应的列中,一个因素占有一列(可以随机排列),最好留有至少一个空白列.。 明确试验方案按规定的方案做试验,得出试验结果按照规定的方案完成每一号试验,试验次序可随机决定试验条件要严格控制计算极差,确定因素的主次顺序三个符号: Ki:表示任一列上水平号为 i 时,所对应的试验结果之和。ki :ki= Ki/s,其中s为任一列上各水平出现的次数 R(极差):在任一

20、列上 R=maxK1 ,K2 ,K3minK1 ,K2 ,K3,或 R=maxk1 ,k2 ,k3mink1 ,k2 ,k3 R越大,因素越重要若空列R较大,可能原因:漏掉某重要因素;因素之间可能存在不可忽略的交互作用 优方案的确定优方案就是在所做的试验范围内,各因素较优的水平组合。若指标越大越好 ,应选取使指标大的水平;若指标越小越好,应选取使指标小的水平;最后还应考虑:降低消耗、提高效率等。 进行验证试验,作进一步的分析因为优方案往往不包含在正交实验方案中,需要验证;优方案是在给定的因素和水平的条件下得到的,若不限定给定的水平,有可能得到更好的试验方案 。对所选的因素和水平进行适当的调整,

21、以找到新的更优方案(6) 多指标正交试验设计及其结果的直观分析法 两种分析方法:综合平衡法和综合评分法 1综合平衡法 先对每个指标分别进行单指标的直观分析,再对对各指标的分析结果进行综合比较和分析,得出较优方案。1综合平衡原则:次服从主(首先满足主要指标或因素);少数服从多数 ;降低消耗、提高效率 2 综合平衡特点:计算量大;信息量大;有时综合平衡难2综合评分法 综合评分法,就是根据各个指标的重要程度,对得出的试验结果进行分析,给每一个试验评出一个分数,作为这个试验的总指标,进行单指标试验结果的直观分析法。1 评分方法: 直接给出每一号试验结果的综合分数;对每号试验的每个指标分别评分,再求综合

22、分;若各指标重要性相同:各指标的分数总和若各指标重要性不相同:各指标的分数加权和2 对每个指标评出分数 非数量性指标:依靠经验和专业知识给出分数。有时指标值本身就可以作为分数 ,如回收率、纯度等,或用“隶属度”来表示分数 3 综合评分法特点 将多指标的问题,转换成了单指标的问题,计算量小,准确评分难。(6)正交试验设计结果的方差分析法 相对于直观分析法,方差分析法能估计误差的大小,精确地估计各因素的试验结果影响的重要程度。其情况有单水水、二水平和三水平正交试验的方差分析。方差分析的基本步骤与格式在数据处理部分以介绍,所以在这里就不做说明。3、均匀设计 均匀设计,是一种只考虑试验点在试验范围内均

23、匀散布的试验设计方法,通过均匀表来安排试验,其应用于试验因素变化范围较大,需要取较多水平时。(1)均匀设计表 等水平均匀设计表 试验号列号1231(1)1(2)1(3)12(2)1(4)2(6)23(3)2(6)3(2)14(4)2(1)1(5)25(5)3(3)2(1)16(6)3(5)3(3)2 Un(rl)或 Un*(rl)U均匀表代号;n均匀表横行数(需要做的试验次数);r因素水平数,与n相等;l均匀表纵列数;*均匀性更好的表,优先选用Un*表 (2)等水平正交表特点等水平正交表等水平均匀表的试验次数与水平数一致;均匀设计:试验次数的增加具有“连续性” 3混合水平均匀设计表 混合均匀表

24、有较好的均衡性,即两列的水平组合要均衡;混合水平均匀表的任一列上,不同水平出现次数是相同的,但出现次数1。(3)均匀设计基本步骤 明确试验目的,确定试验指标 选因素 确定因素的水平 可以随机排列因素的水平序号4选择均匀设计表根据试验的因素数和水平数来选择,参考使用表 ,首选Un*表。 5进行表头设计根据因素数和使用表,均匀表中的空列,既不能安排交互作用,也不能用来估计试验误差。 明确试验方案,进行试验 试验结果统计分析 1 直观分析法: 直接对所得到的几个试验结果进行比较,从中挑出试验指标最好的试验点 。2 回归分析法:多元回归分析。 三、应用1、数据处理之单因素方差分析某饮料生产企业研制出一

25、种新型饮料。饮料的颜色共有四种,分别是橘黄色、粉色、绿色、和无色透明。随机从五家超级市场收集了前一期该种饮料的销售量(万元),如下表所示。试分析饮料颜色对销售量产生的影响。颜色销售量/万元橘黄色26.528.725.129.127.2粉色31.228.330.827.929.6绿色27.925.128.524.226.5无色30.829.632.431.732.8解: (1)由excel得有关数据如下:因为FAADC由此看出,特别要求在生产过程中控制好因素B,即反应时间.其次是要考虑因素A和D,即要控制好反应温度和真空度.至于原料配比就不那么重要了。而转化率越高越好,所以应在第1列选最大的T31=185;即取水平A3,同理可选B3C1D3.故较好的因素水平搭配是A3B3C1D3.。四、体会

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1