数据处理的基本方法.docx
《数据处理的基本方法.docx》由会员分享,可在线阅读,更多相关《数据处理的基本方法.docx(8页珍藏版)》请在冰豆网上搜索。
数据处理的基本方法
第六节数据处理得基本方法
前面我们已经讨论了测量与误差得基本概念,测量结果得最佳值、误差与不确定度得计算。
然而,我们进行实验得最终目得就是为了通过数据得获得与处理,从中揭示出有关物理量得关系,或找出事物得内在规律性,或验证某种理论得正确性,或为以后得实验准备依据。
因而,需要对所获得得数据进行正确得处理,数据处理贯穿于从获得原始数据到得出结论得整个实验过程、包括数据记录、整理、计算、作图、分析等方面涉及数据运算得处理方法。
常用得数据处理方法有:
列表法、图示法、图解法、逐差法与最小二乘线性拟合法等,下面分别予以简单讨论。
一、列表法
列表法就是将实验所获得得数据用表格得形式进行排列得数据处理方法。
列表法得作用有两种:
一就是记录实验数据,二就是能显示出物理量间得对应关系、其优点就是,能对大量得杂乱无章得数据进行归纳整理,使之既有条不紊,又简明醒目;既有助于表现物理量之间得关系,又便于及时地检查与发现实验数据就是否合理,减少或避免测量错误;同时,也为作图法等处理数据奠定了基础。
用列表得方法记录与处理数据就是一种良好得科学工作习惯,要设计出一个栏目清楚、行列分明得表格,也需要在实验中不断训练,逐步掌握、熟练,并形成习惯。
一般来讲,在用列表法处理数据时,应遵从如下原则:
(1)栏目条理清楚,简单明了,便于显示有关物理量得关系。
(2)在栏目中,应给出有关物理量得符号,并标明单位(一般不重复写在每个数据得后面)。
(3)填入表中得数字应就是有效数字、
(4)必要时需要加以注释说明。
例如,用螺旋测微计测量钢球直径得实验数据列表处理如下。
用螺旋测微计测量钢球直径得数据记录表
mm
次数
初读数(mm)
未读数(mm)
直 径(mm)
(mm)
1
0、004
6。
002
5.998
+0、0013
2
0、003
6。
000
5。
997
+0.0003
3
0、004
6.000
5。
996
-0.0007
4
0、004
6、001
5、997
+0、0003
5
0、005
6.001
5.996
-0、0007
6
0、004
6、000
5、996
—0。
0007
7
0。
004
6。
001
5。
997
+0.0003
8
0。
003
6。
002
5.999
+0.0023
9
0、005
6、000
5.995
—0、0017
10
0、004
6、000
5.996
—0.0007
从表中,可计算出
(mm)
取mm,。
不确度得A分量为(运算中保留两位存疑数字)
(mm)
B分量为(按均匀分布)
(mm)
则(mm)
取(mm)
测量结果为(mm)。
二、图示法
图示法就就是用图象来表示物理规律得一种实验数据处理方法。
一般来讲,一个物理规律可以用三种方式来表述:
文字表述、解析函数关系表述、图象表示。
图示法处理实验数据得优点就是能够直观、形象地显示各个物理量之间得数量关系,便于比较分析、一条图线上可以有无数组数据,可以方便地进行内插与外推,特别就是对那些尚未找到解析函数表达式得实验结果,可以依据图示法所画出得图线寻找到相应得经验公式。
因此,图示法就是处理实验数据得好方法、
要想制作一幅完整而正确得图线,必须遵循如下原则及步骤:
1。
选择合适得坐标纸。
作图一定要用坐标纸,常用得坐标纸有直角坐标纸、双对数坐标纸、单对数坐标纸、极坐标纸等。
选用得原则就是尽量让所作图线呈直线,有时还可采用变量代换得方法将图线作成直线。
2、确定坐标得分度与标记。
一般用横轴表示自变量,纵轴表示因变量,并标明各坐标轴所代表得物理量及其单位(可用相应得符号表示)。
坐标轴得分度要根据实验数据得有效数字及对结果得要求来确定、原则上,数据中得可靠数字在图中也应就是可靠得、即不能因作图而引进额外得误差、在坐标轴上应每隔一定间距均匀地标出分度值,标记所用有效数字得位数应与原始数据得有效数字得位数相同,单位应与坐标轴单位一致、要恰当选取坐标轴比例与分度值,使图线充分占有图纸空间,不要缩在一边或一角。
除特殊需要外,分度值起点可以不从零开始,横、纵坐标可采用不同比例。
3。
描点。
根据测量获得得数据,用一定得符号在坐标纸上描出坐标点。
一张图纸上画几条实验曲线时,每条曲线应用不同得标记,以免混淆、常用得标记符号有☉、╂、╳、△、□等。
4。
连线、要绘制一条与标出得实验点基本相符得图线,图线尽可能多得通过实验点,由于测量误差,某些实验点可能不在图线上,应尽量使其均匀地分布在图线得两侧。
图线应就是直线或光滑得曲线或折线。
5、注解与说明、应在图纸上标出图得名称,有关符号得意义与特定实验条件。
如,在绘制得热敏电阻-温度关系得坐标图上应标明“电阻—温度曲线";“╂—实验值”;“╳—理论值”;“实验材料:
碳膜电阻"等。
三、图解法
图解法就是在图示法得基础上,利用已经作好得图线,定量地求出待测量或某些参数或经验公式得方法。
由于直线不仅绘制方便,而且所确定得函数关系也简单等特点,因此,对非线性关系得情况,应在初步分析、把握其关系特征得基础上,通过变量变换得方法将原来得非线性关系化为新变量得线性关系。
即,将“曲线化直”。
然后再使用图解法、
下面仅就直线情况简单介绍一下图解法得一般步骤:
1.选点、通常在图线上选取两个点,所选点一般不用实验点,并用与实验点不同得符号标记,此两点应尽量在直线得两端。
如记为与,并用“+"表示实验点,用“☉”表示选点。
2.求斜率。
根据直线方程,将两点坐标代入,可解出图线得斜率为
。
3、求与y轴得截距、可解出
。
4、与x轴得截距。
记为
。
例如,用图示法与图解法处理热敏电阻得电阻随温度T变化得测量结果。
(1)曲线化直:
根据理论,热敏电阻得电阻—温度关系为
。
为了方便地使用图解法,应将其转化为线性关系,取对数有
、
令,,,有
。
这样,便将电阻与温度T得非线性关系化为了与得线性关系、
(2)转化实验数据:
将电阻取对数,将温度T取倒数,然后用直角坐标纸作图,将所描数据点用直线连接起来。
(3)使用图解法求解:
先求出与;再求;最后得出~T函数关系、
四、逐差法
由于随机误差具有抵偿性,对于多次测量得结果,常用平均值来估计最佳值,以消除随机误差得影响。
但就是,当自变量与因变量成线性关系时,对于自变量等间距变化得多次测量,如果用求差平均得方法计算因变量得平均增量,就会使中间测量数据两两抵消,失去利用多次测量求平均得意义、例如,在拉伸法测杨氏模量得实验中,当荷重均匀增加时,标尺位置读数依次为,如果求相邻位置改变得平均值有
=
即中间得测量数据对得计算值不起作用。
为了避免这种情况下中间数据得损失,可以用逐差法处理数据。
ﻭ 逐差法就是物理实验中常用得一种数据处理方法,特别就是当自变量与因变量成线性关系,而且自变量为等间距变化时,更有其独特得特点。
逐差法就是将测量得到得数据按自变量得大小顺序排列后平分为前后两组,先求出两组中对应项得差值(即求逐差),然后取其平均值。
例如,对上述杨氏模量实验中得10个数据得逐差法处理为:
1。
将数据分为两组
Ⅰ组:
Ⅱ组:
2。
求逐差:
,,,
3。
求差平均:
在实际处理时可用列表得形式较为直观,如:
Ⅰ组
Ⅱ组
逐差()
但要注意得就是:
使用逐差法时之,相当于一般平均法中得倍(n为得数据个数)。
五、最小二乘法
通过实验获得测量数据后,可确定假定函数关系中得各项系数,这一过程就就是求取有关物理量之间关系得经验公式。
从几何上瞧,就就是要选择一条曲线,使之与所获得得实验数据更好地吻合。
因此,求取经验公式得过程也即就是曲线拟合得过程、
那么,怎样才能获得正确地与实验数据配合得最佳曲线呢?
常用得方法有两类:
一就是图估计法,二就是最小二乘拟合法。
图估计法就是凭眼力估测直线得位置,使直线两侧得数据均匀分布,其优点就是简单、直观、作图快;缺点就是图线不唯一,准确性较差,有一定得主观随意性。
如,图解法,逐差法与平均法都属于这一类,就是曲线拟合得粗略方法。
最小二乘拟合法就是以严格得统计理论为基础,就是一种科学而可靠得曲线拟合方法。
此外,还就是方差分析、变量筛选、数字滤波、回归分析得数学基础。
在此仅简单介绍其原理与对一元线性拟合得应用。
1、最小二乘法得基本原理
设在实验中获得了自变量与因变量得若干组对应数据,在使偏差平方与取最小值时,找出一个已知类型得函数(即确定关系式中得参数)。
这种求解得方法称为最小二乘法。
根据最小二乘法得基本原理,设某量得最佳估计值为,则
可求出
即
而且可证明
〉0
说明可以取得最小值、
可见,当时,各次测量偏差得平方与为最小,即平均值就就是在相同条件下多次测量结果得最佳值。
根据统计理论,要得到上述结论,测量得误差分布应遵从正态分布(高斯分布)。
这也即就是最小二乘法得统计基础。
2、一元线性拟合
设一元线性关系为
实验获得得对数据为(=1,2,…,)、由于误差得存在,当把测量数据代入所设函数关系式时,等式两端一般并不严格相等,而就是存在一定得偏差。
为了讨论方便起见,设自变量得误差远小于因变量得误差,则这种偏差就归结为因变量得偏差,即
根据最小二乘法,获得相应得最佳拟合直线得条件为
若记
代入方程组可以解出
由误差理论可以证明,最小二乘一元线性拟合得标准差为
为了判断测量点与拟合直线符合得程度,需要计算相关系数
一般地,。
如果,说明测量点紧密地接近拟合直线;如果,说明测量点离拟合直线较分散,应考虑用非线性拟合、
从上面得讨论可知,回归直线一定要通过点,这个点叫做该组测量数据得重心。
注意,此结论对于我们用图解法处理数据就是很有帮助得。
一般来讲,使用最小二乘法拟合时,要计算上述六个参数:
、