误差及分析数据处理.docx
《误差及分析数据处理.docx》由会员分享,可在线阅读,更多相关《误差及分析数据处理.docx(12页珍藏版)》请在冰点文库上搜索。
误差及分析数据处理
误差及分析数据处理
4学时
基本要点:
1.了解误差产生的原因及其表示方法;
2.理解误差的分布及特点;
3.掌握分析数据的处理方法及分析结果的表示。
定量分析的任务:
准确测定试样中的组分的含量。
实际测定中,由于受分析方法、仪器、试剂、操作技术等限制,测定结果不可能与真实值完全一致。
同一分析人员用同一方法对同一试样在相同条件下进行多次测定,测定结果也总不能完全一致,分析结果在一定范围内波动。
由此说明:
客观上误差是经常存在的,在实验过程中,必须检查误差产生的原因,采取措施,提高分析结果的准确度。
同时,对分析结果准确度进行正确表达和评价。
误差及其表示方法
误差——分析结果与真实值之间的差值(>真实值为正,<真实值为负)
一.误差的分类
1.系统误差(systermaticerror)——可定误差(determinateerror)
(1)方法误差:
拟定的分析方法本身不十分完善所造成;
如:
反应不能定量完成;有副反应发生;滴定终点与化学计量点不一致;干扰组分存在等。
(2)仪器误差:
主要是仪器本身不够准确或未经校准引起的;
如:
量器(容量平、滴定管等)和仪表刻度不准。
(3)试剂误差:
由于世纪不纯和蒸馏水中含有微量杂质所引起;
(4)操作误差:
主要指在正常操作情况下,由于分析工作者掌握操作规程与控制条件不当所引起的。
如滴定管读数总是偏高或偏低。
特性:
重复出现、恒定不变(一定条件下)、单向性、大小可测出并校正,故有称为可定误差。
可以用对照试验、空白试验、校正仪器等办法加以校正。
2.随机误差(randomerror)——不可定误差(indeterminateerror)
产生原因与系统误差不同,它是由于某些偶然的因素所引起的。
如:
测定时环境的温度、湿度和气压的微小波动,以其性能的微小变化等。
特性:
有时正、有时负,有时大、有时小,难控制(方向大小不固定,似无规律)
但在消除系统误差后,在同样条件下进行多次测定,则可发现其分布也是服从一定规律(统计学正态分布),可用统计学方法来处理
系统误差——可检定和校正
偶然误差——可控制
只有校正了系统误差和控制了偶然误差,测定结果才可靠。
二.准确度与精密度
(一)准确度与误差(accuracyanderror)
准确度:
测量值(x)与公认真值(m)之间的符合程度。
它说明测定结果的可靠性,用误差值来量度:
绝对误差=个别测得值-真实值
(1)
但绝对误差不能完全地说明测定的准确度,即它没有与被测物质的质量联系起来。
如果被称量物质的质量分别为1g和0.1g,称量的绝对误差同样是0.0001g,则其含义就不同了,故分析结果的准确度常用相对误差(RE%)表示:
(2)
(RE%)反映了误差在真实值中所占的比例,用来比较在各种情况下测定结果的准确度比较合理。
(二)精密度与偏差(precisionanddeviation)
精密度:
是在受控条件下多次测定结果的相互符合程度,表达了测定结果的重复性和再现性。
用偏差表示:
1.偏差
绝对偏差:
(3)
相对偏差:
(4)
2.平均偏差
当测定为无限多次,实际上〉30次时:
总体平均偏差
(5)
总体——研究对象的全体(测定次数为无限次)
样本——从总体中随机抽出的一小部分
当测定次数仅为有限次,在定量分析的实际测定中,测定次数一般较小,<20次时:
平均偏差(样本)
(6)
相对平均偏差
(7)
用平均偏差表示精密度比较简单,但不足之处是在一系列测定中,小的偏差测定总次数总是占多数,而大的偏差的测定总是占少数。
因此,在数理统计中,常用标准偏差表示精密度。
3.标准偏差
(1)总体标准偏差
当测定次数大量时(>30次),测定的平均值接近真值此时标准偏差用s表示:
(8)
(2)样本标准偏差
在实际测定中,测定次数有限,一般n<30,此时,统计学中,用样本的标准偏差S来衡量分析数据的分散程度:
(9)
式中(n-1)为自由度,它说明在n次测定中,只有(n-1)个可变偏差,引入(n-1),主要是为了校正以样本平均值代替总体平均值所引起的误差
即
(10)
而S?
s
(3)样本的相对标准偏差——变异系数
(11)
(4)样本平均值的标准偏差
(12)
此式说明:
平均值的标准偏差按测定次数的平方根成正比例减少
4.准确度与精密度的关系
精密度高,不一定准确度高;
准确度高,一定要精密度好。
精密度是保证准确度的先决条件,精密度高的分析结果才有可能获得高准确度;
准确度是反映系统误差和随机误差两者的综合指标。
误差的统计概念
一.随机误差的正态分布
1.正态分布
随机误差的规律服从正态分布规律,可用正态分布曲线(高斯分布的正态概率密度函数)表示:
(13)
式中:
y—概率密度;m—总体平均值;s—总体标准偏差。
正态分布曲线依赖于m和s两个基本参数,曲线随m和s的不同而不同。
为简便起见,使用一个新变数(u)来表达误差分布函数式:
(14)
u的涵义是:
偏差值(x-m)以标准偏差为单位来表示。
变换后的函数式为:
(15)
由此绘制的曲线称为“标准正态分布曲线”。
因为标准正态分布曲线横坐标是以s为单位,所以对于不同的测定值m及s,都是适用的。
图1:
两组精密度不同的测定值图2:
标准正态分布曲线
的正态分布曲线
“标准正态分布曲线”清楚地反映了随机误差的分布性质:
(1)集中趋势当x=m时(u=0),
,y此时最大,说明测定值x集中在m附近,或者说,m是最可信赖值。
(2)对称趋势曲线以x=m这一直线为对称轴,表明:
正负误差出现的概率相等。
大误差出现的概率小,小误差出现的概率大;很大误差出现的概率极小。
在无限多次测定时,误差的算术平均值极限为0。
(3)总概率曲线与横坐标从-μ到+μ在之间所包围的面积代表具有各种大小误差的测定值出现的概率的总和,其值为1(100%)
(16)
用数理统计方法可以证明并求出测定值x出现在不同u区间的概率(不同u值时所占的面积)即x落在m±us区间的概率:
置信区间置信概率
u=±1.00x=m±1.00s68.3%
u=±1.96x=m±1.96s95.0%
u=±3.00x=m±3.00s99.7%
二.有限数据随机误差的t分布
在实际测定中,测定次数是有限的,只有
和S,此时则用能合理地处理少量实验数据的方法—t分布
1.t分布曲线(实际测定中,用
、S代替m、s)
t分布曲线与标准正态分布曲线相似,纵坐标仍为概率密度,纵坐标则是新的统计量t
(17)
无限次测定,u一定?
P就一定;
有限次测定:
t一定?
P随n(自由度)不同而不同。
不同的n值及概率所对应的t值,已有统计学家计算出来,可由有关表中查出。
2.平均值的置信区间
应用t分布估计真值范围,考虑的符号时,则可得到如下关系式:
m=x±tP,nS(18)
同样,对于样本平均值也存在类似的关系式:
(19)
此式表示的是在一定概率下,以样本平均值为中心的包括真值在内的取值范围,即平均值的置信区间。
称为置信区间界限。
此式表明:
平均值
与真值的关系,即说明平均值的可靠性。
平均值的置信区间取决于测定的精密度、测定次数和置信水平(概率)。
(分析工作中常规定为95%)
测定精密度越高(S小),测定次数越多(n大),置信区间则越小,即平均值
越准确。
分析数据的处理
一.有效数字及其运算规则
1.有效数字的意义和位数
(1)有效数字:
所有准确数字和一位可疑数字(实际能测到的数字)
(2)有效位数及数据中的“0”
1.0005,五位有效数字
0.5000,31.05%四位有效数字
0.0540,1.86三位有效数字
0.0054,0.40%两位有效数字
0.5,0.002%一位有效数字
2.有效数字的表达及运算规则
(1)记录一个测定值时,只保留一位可疑数据,
(2)整理数据和运算中弃取多余数字时,采用“数字修约规则”:
四舍六入五考虑
五后非零则进一
五后皆零视奇偶
五前为奇则进一
五前为偶则舍弃
不许连续修约
(3)加减法:
以小数点后位数最少的数据的位数为准,即取决于绝对误差最大的数据位数;
(4)乘除法:
由有效数字位数最少者为准,即取决于相对误差最大的数据位数;
(5)对数:
对数的有效数字只计小数点后的数字,即有效数字位数与真数位数一致;
(6)常数:
常数的有效数字可取无限多位;
(7)第一位有效数字等于或大于8时,其有效数字位数可多算一位;
(8)在计算过程中,可暂时多保留一位有效数字;
(9)误差或偏差取1~2位有效数字即可。
二.可疑数据的取舍
1.Q-检验法(3~10次测定适用,且只有一个可疑数据)
(1)将各数据从小到大排列:
x1,x2,x3……xn;
(2)计算(x大-x小),即(xn-x1);
(3)计算(x可-x邻),
(4)计算舍弃商Q计=?
x可-x邻?
/xn-x1
(5)根据n和P查Q值表得Q表
(6)比较Q表与Q计
若:
Q计3Q表可疑值应舍去
Q计2.G检验法(Grubbs法)
设有n各数据,从小到大为x1,x2,x3,……xn;
其中x1或xn为可疑数据:
(1)计算
(包括可疑值x1、xn在内)、∣x可疑-
∣及S;
(2)计算G:
(3)查G值表得Gn,P
(4)比较G计与Gn,P:
若G计3Gn,P则舍去可疑值;
G计三.分析数据的显著性检验
1.平均值(
)与标准值(m)之间的显著性检验——检查方法的准确度
(20)
若t计3t0.95,n则
与m有显著性差异(方法不可靠)
t计与m无显著性差异(方法可靠)
2.两组平均值的比较
(1)先用F检验法检验两组数据精密度S1(小)、S2(大)有无显著性差异(方法之间)
(21)
若此F计值小于表中的F(0.95)值,说明两组数据精密度S1、S2无显著性差异,反之亦反。
(2)再用t检验法检验两组平均值之间有无显著性差异
(22)
查t0.95(f=n1+n2)
若t计3t0.95,n则说明两平均值有显著性差异
t计