数据处理的基本方法精选文档.docx
《数据处理的基本方法精选文档.docx》由会员分享,可在线阅读,更多相关《数据处理的基本方法精选文档.docx(8页珍藏版)》请在冰点文库上搜索。
数据处理的基本方法精选文档
第六节数据处理的基本方法
前面我们已经讨论了测量与误差的基本概念,测量结果的最佳值、误差和不确定度的计算。
然而,我们进行实验的最终目的是为了通过数据的获得和处理,从中揭示出有关物理量的关系,或找出事物的内在规律性,或验证某种理论的正确性,或为以后的实验准备依据.因而,需要对所获得的数据进行正确的处理,数据处理贯穿于从获得原始数据到得出结论的整个实验过程。
包括数据记录、整理、计算、作图、分析等方面涉及数据运算的处理方法。
常用的数据处理方法有:
列表法、图示法、图解法、逐差法和最小二乘线性拟合法等,下面分别予以简单讨论。
一、列表法
列表法是将实验所获得的数据用表格的形式进行排列的数据处理方法。
列表法的作用有两种:
一是记录实验数据,二是能显示出物理量间的对应关系.其优点是,能对大量的杂乱无章的数据进行归纳整理,使之既有条不紊,又简明醒目;既有助于表现物理量之间的关系,又便于及时地检查和发现实验数据是否合理,减少或避免测量错误;同时,也为作图法等处理数据奠定了基础。
用列表的方法记录和处理数据是一种良好的科学工作习惯,要设计出一个栏目清楚、行列分明的表格,也需要在实验中不断训练,逐步掌握、熟练,并形成习惯。
一般来讲,在用列表法处理数据时,应遵从如下原则:
(1)栏目条理清楚,简单明了,便于显示有关物理量的关系.
(2)在栏目中,应给出有关物理量的符号,并标明单位(一般不重复写在每个数据的后面)。
(3)填入表中的数字应是有效数字。
(4)必要时需要加以注释说明。
例如,用螺旋测微计测量钢球直径的实验数据列表处理如下。
用螺旋测微计测量钢球直径的数据记录表
mm
次数
初读数(mm)
未读数(mm)
直径(mm)
(mm)
1
0.004
6。
002
5。
998
+0。
0013
2
0.003
6.000
5.997
+0.0003
3
0。
004
6.000
5.996
-0。
0007
4
0.004
6.001
5。
997
+0。
0003
5
0。
005
6.001
5.996
-0.0007
6
0.004
6.000
5。
996
-0。
0007
7
0。
004
6。
001
5.997
+0.0003
8
0.003
6.002
5.999
+0.0023
9
0。
005
6.000
5。
995
—0.0017
10
0.004
6.000
5。
996
-0。
0007
从表中,可计算出
(mm)
取mm,。
不确度的A分量为(运算中保留两位存疑数字)
(mm)
B分量为(按均匀分布)
(mm)
则(mm)
取(mm)
测量结果为(mm)。
二、图示法
图示法就是用图象来表示物理规律的一种实验数据处理方法。
一般来讲,一个物理规律可以用三种方式来表述:
文字表述、解析函数关系表述、图象表示。
图示法处理实验数据的优点是能够直观、形象地显示各个物理量之间的数量关系,便于比较分析。
一条图线上可以有无数组数据,可以方便地进行内插和外推,特别是对那些尚未找到解析函数表达式的实验结果,可以依据图示法所画出的图线寻找到相应的经验公式.因此,图示法是处理实验数据的好方法.
要想制作一幅完整而正确的图线,必须遵循如下原则及步骤:
1。
选择合适的坐标纸。
作图一定要用坐标纸,常用的坐标纸有直角坐标纸、双对数坐标纸、单对数坐标纸、极坐标纸等。
选用的原则是尽量让所作图线呈直线,有时还可采用变量代换的方法将图线作成直线。
2.确定坐标的分度和标记。
一般用横轴表示自变量,纵轴表示因变量,并标明各坐标轴所代表的物理量及其单位(可用相应的符号表示).坐标轴的分度要根据实验数据的有效数字及对结果的要求来确定。
原则上,数据中的可靠数字在图中也应是可靠的。
即不能因作图而引进额外的误差.在坐标轴上应每隔一定间距均匀地标出分度值,标记所用有效数字的位数应与原始数据的有效数字的位数相同,单位应与坐标轴单位一致。
要恰当选取坐标轴比例和分度值,使图线充分占有图纸空间,不要缩在一边或一角。
除特殊需要外,分度值起点可以不从零开始,横、纵坐标可采用不同比例.
3。
描点.根据测量获得的数据,用一定的符号在坐标纸上描出坐标点。
一张图纸上画几条实验曲线时,每条曲线应用不同的标记,以免混淆。
常用的标记符号有☉、╂、╳、△、□等.
4。
连线。
要绘制一条与标出的实验点基本相符的图线,图线尽可能多的通过实验点,由于测量误差,某些实验点可能不在图线上,应尽量使其均匀地分布在图线的两侧.图线应是直线或光滑的曲线或折线。
5.注解和说明。
应在图纸上标出图的名称,有关符号的意义和特定实验条件.如,在绘制的热敏电阻-温度关系的坐标图上应标明“电阻—温度曲线”;“╂—实验值”;“╳-理论值";“实验材料:
碳膜电阻”等。
三、图解法
图解法是在图示法的基础上,利用已经作好的图线,定量地求出待测量或某些参数或经验公式的方法。
由于直线不仅绘制方便,而且所确定的函数关系也简单等特点,因此,对非线性关系的情况,应在初步分析、把握其关系特征的基础上,通过变量变换的方法将原来的非线性关系化为新变量的线性关系.即,将“曲线化直".然后再使用图解法。
下面仅就直线情况简单介绍一下图解法的一般步骤:
1.选点。
通常在图线上选取两个点,所选点一般不用实验点,并用与实验点不同的符号标记,此两点应尽量在直线的两端.如记为和,并用“+”表示实验点,用“☉”表示选点。
2。
求斜率。
根据直线方程,将两点坐标代入,可解出图线的斜率为
.
3。
求与y轴的截距。
可解出
.
4。
与x轴的截距.记为
。
例如,用图示法和图解法处理热敏电阻的电阻随温度T变化的测量结果。
(1)曲线化直:
根据理论,热敏电阻的电阻—温度关系为
。
为了方便地使用图解法,应将其转化为线性关系,取对数有
。
令,,,有
。
这样,便将电阻与温度T的非线性关系化为了与的线性关系。
(2)转化实验数据:
将电阻取对数,将温度T取倒数,然后用直角坐标纸作图,将所描数据点用直线连接起来。
(3)使用图解法求解:
先求出和;再求;最后得出~T函数关系.
四、逐差法
由于随机误差具有抵偿性,对于多次测量的结果,常用平均值来估计最佳值,以消除随机误差的影响。
但是,当自变量与因变量成线性关系时,对于自变量等间距变化的多次测量,如果用求差平均的方法计算因变量的平均增量,就会使中间测量数据两两抵消,失去利用多次测量求平均的意义.例如,在拉伸法测杨氏模量的实验中,当荷重均匀增加时,标尺位置读数依次为,如果求相邻位置改变的平均值有
=
即中间的测量数据对的计算值不起作用。
为了避免这种情况下中间数据的损失,可以用逐差法处理数据.逐差法是物理实验中常用的一种数据处理方法,特别是当自变量与因变量成线性关系,而且自变量为等间距变化时,更有其独特的特点。
逐差法是将测量得到的数据按自变量的大小顺序排列后平分为前后两组,先求出两组中对应项的差值(即求逐差),然后取其平均值。
例如,对上述杨氏模量实验中的10个数据的逐差法处理为:
1。
将数据分为两组
Ⅰ组:
Ⅱ组:
2。
求逐差:
,,,,
3。
求差平均:
在实际处理时可用列表的形式较为直观,如:
Ⅰ组
Ⅱ组
逐差()
但要注意的是:
使用逐差法时之,相当于一般平均法中的倍(n为的数据个数).
五、最小二乘法
通过实验获得测量数据后,可确定假定函数关系中的各项系数,这一过程就是求取有关物理量之间关系的经验公式。
从几何上看,就是要选择一条曲线,使之与所获得的实验数据更好地吻合.因此,求取经验公式的过程也即是曲线拟合的过程。
那么,怎样才能获得正确地与实验数据配合的最佳曲线呢?
常用的方法有两类:
一是图估计法,二是最小二乘拟合法.
图估计法是凭眼力估测直线的位置,使直线两侧的数据均匀分布,其优点是简单、直观、作图快;缺点是图线不唯一,准确性较差,有一定的主观随意性.如,图解法,逐差法和平均法都属于这一类,是曲线拟合的粗略方法。
最小二乘拟合法是以严格的统计理论为基础,是一种科学而可靠的曲线拟合方法。
此外,还是方差分析、变量筛选、数字滤波、回归分析的数学基础。
在此仅简单介绍其原理和对一元线性拟合的应用。
1。
最小二乘法的基本原理
设在实验中获得了自变量与因变量的若干组对应数据,在使偏差平方和取最小值时,找出一个已知类型的函数(即确定关系式中的参数).这种求解的方法称为最小二乘法.
根据最小二乘法的基本原理,设某量的最佳估计值为,则
可求出
即
而且可证明
〉0
说明可以取得最小值。
可见,当时,各次测量偏差的平方和为最小,即平均值就是在相同条件下多次测量结果的最佳值。
根据统计理论,要得到上述结论,测量的误差分布应遵从正态分布(高斯分布)。
这也即是最小二乘法的统计基础。
2.一元线性拟合
设一元线性关系为
,
实验获得的对数据为(=1,2,…,)。
由于误差的存在,当把测量数据代入所设函数关系式时,等式两端一般并不严格相等,而是存在一定的偏差。
为了讨论方便起见,设自变量的误差远小于因变量的误差,则这种偏差就归结为因变量的偏差,即
根据最小二乘法,获得相应的最佳拟合直线的条件为
若记
代入方程组可以解出
由误差理论可以证明,最小二乘一元线性拟合的标准差为
为了判断测量点与拟合直线符合的程度,需要计算相关系数
一般地,.如果,说明测量点紧密地接近拟合直线;如果,说明测量点离拟合直线较分散,应考虑用非线性拟合。
从上面的讨论可知,回归直线一定要通过点,这个点叫做该组测量数据的重心。
注意,此结论对于我们用图解法处理数据是很有帮助的。
一般来讲,使用最小二乘法拟合时,要计算上述六个参数:
。