检测数据处理基础知识
时间:2017-03-15 阅读:1494
误差及相关概念 → 真实值与标准值 |
误差是测量值与真实结果之间的差异,要想知道误差的大小,必须知道真实的结果,这个真实的值,我们称之“真值”。 |
1. 真实值
从理论上说,样品中某一组分的含量必然有一个客观存在的真实数值,称之为“真实值”或“真值”。用“μ”表示。但实际上,对于客观存在的真值,人们不可能的知道,只能随着测量技术的不断进步而逐渐接近真值。实际工作中,往往用“标准值”代替“真值”。
2. 标准值
采用多种可靠的分析方法、由具有丰富经验的分析人员经过反复多次测定得出的结果平均值,是一个比较准确的结果。
实际工作中一般用标准值代替真值。例如原子量、物理化学常数:阿佛伽得罗常数为6.02×10 等。
与我们实验相关的是将纯物质中元素的理论含量作为真实值。
1. 准确度
准确度是测定值与真实值接近的程度。
为了获得可靠的结果,在实际工作中人们总是在相同条件下,多测定几次,然后求平均值,作为测定值。一般把这几次在相同条件下的测定叫平行测定。如果这几个数据相互比较接近,就说明分析的精密度高。
2. 精密度
精密度是几次平行测定结果相互接近的程度。
3. 精密度和准确度的关系
(1)精密度是保证准确度的先决条件。
(2)高精密度不一定保证高准确度。
1. 误差
(1) 定义:个别测定结果X 、X …X 与真实值μ之差称为个别测定的误差,简称误差。
(2) 表示:各次测定结果误差分别表示为X -μ、X -μ……X -μ。
(3)计算方法:
误差
相对误差
对于误差——测定值大于真值,误差为正值;测定值小于真值,误差为负值。
对于相对误差——反映误差在测定结果中所占百分率,更具实际意义。
2. 偏差
偏差是衡量精密度的大小。
误差的分类 → 系统误差
1. 定义
由某种固定的原因造成的误差,若能找出原因,设法加以测定,就可以消除,所以也叫可测误差。
2. 特点
具有单向性、可测性、重复性。即:正负、大小都有一定的规律性,重复测定时会重复出现。
3. 产生原因
(1)方法误差:分析方法本身所造成的误差。方法误差是由于某一分析方法本身不够完善造成的。如分析过程中,干扰离子的影响没有消除。
(2)操作误差:由于操作人员的主观原因造成的。如滴定分析时,每个人对滴定终点颜色变化的敏感程度不同,不同的人对终点的判断不同。
(3)仪器和试剂误差:仪器误差来源于仪器本身不够。例如天平两臂不等长,砝码长期使用后质量改变。试剂误差来源于试剂不纯。
注意:系统误差是重复地以固定形式出现的,增加平行测定次数不能消除。
误差的分类 → 随机误差
随机误差由某些难以控制、无法避免的偶然因素造成。也称偶然误差。
1. 特点
大小、正负都不固定,不能通过校正来减小或消除,可以通过增加测定次数予以减小。
2. 产生原因
操作中温度变化、湿度变化、甚至灰尘等都会引起测定结果波动。
系统误差和随机误差划分不是的,对滴定终点判断的不同有个人的主观原因,也有偶然性。随机误差比系统误差更具偶然性。分析工作中的“过失”不同于这两种误差。它是由于分析人员操作时粗心大意或违反操作规程所产生的错误。
随机误差的正态分布 |
1. 分布曲线 |
随机误差的区间概率 |
1. 定义 |
有限数据的统计处理 |
随机误差分布的规律给数据处理提供了理论基础,但它是对无限多次测量而言。实际工作中我们只做有限次测量,并把它看作是从无限总体中随机抽出的一部分,称之为样本。样本中包含的个数叫样本容量,用n表示。 |
数据的趋势 → 数据集中趋势的表示
1. 算术平均值
n次测定数据的平均值。
是总体平均值的*估计。对于有限次测定,测量值总朝算术平均值 集中,即数值出现在算术平均值周围;对于无限次测定,即n → ∞时, →μ。
2. 中位数M
将数据按大小顺序排列,位于正中间的数据称为中位数M。
n为奇数时,居中者即是;n为偶数时,正中间两个数据的平均值即是。
数据的趋势 → 数据分散程度的表示
1. 极差R(或称全距):指一组平行测定数据中zui大者(Xmax)和zui小者(Xmin)之差。
R = Xmax - Xmin
2. 平均偏差:各次测量值与平均值的偏差的值的平均。
偏差 di = Xi - (i =1,2,…,n )
平均偏差
相对平均偏差
3. 标准偏差S:计算方法
标准偏差S =
相对标准偏差,也叫变异系数,用CV表示,一般计算百分率。
相对标准偏差RSD = ×100 %
自由度f:f = n-1
平均值的置信度区间 → 定 义
1. 置信度
置信度表示对所做判断有把握的程度。 表示符号:P 。
有时我们对某一件事会说“我对这个事有八成的把握”。这里的“八成把握”就是置信度,实际是指某事件出现的概率。
常用置信度:P=0.90,P=0.95;或P=90%,P=95%。
2. 置信度区间
按照t分布计算,在某一置信度下以个别测量值为中心的包含有真值的范围,叫个别测量值的置信度区间。
1. t的定义
【t分布值表】 |
显著性检验 → 平均值与标准值比较 |
常用的方法有两种:t检验法和F检验法。 |
1. 比较方法
用标准试样做几次测定,然后用t检验法检验测定结果的平均值与标准试样的标准值之间是否存在差异。
2. 计算方法
① 求t 。
t =
② 根据置信度(通常取置信度95%)和自由度f,查t分布表中t 值。
③ 比较t 和t ,若t ﹥t ,说明测定的平均值出现在以真值为中心的95%概率区间之外,平均值与真实值有显著差异,我们认为有系统误差存在。
t =
例:某化验室测定标样中CaO含量得如下结果:CaO含量=30.51%,S=0.05,n=6, 标样中CaO含量标准值是30.43%,此操作是否有系统误差?(置信度为95%)
解:t = = 3.92
查表:置信度95%,f=5时,t =2.57。比较可知t >t 。
说明:此操作存在系统误差。
显著性检验 → 两组平均值的比较 |
常用的方法有两种:t检验法和F检验法。 |
1. 比较方法
用两种方法进行测定,结果分别为 ,S ,n ; ,S ,n 。然后分别用F检验法及t检验法计算后,比较两组数据是否存在显著差异。
2. 计算方法
(1)精密度的比较——F检验法:
①求F计算: F = >1
②由F表根据两种测定方法的自由度,查相应F值进行比较。
【表2-2 95%置信水平(a=0.05)时单侧检验F值(部分)】
③若F >F ,说明 S 和S 差异不显著,进而用t检验平均值间有无显著差异。若F >F ,S 和S 差异显著。
(2)平均值的比较:
①求t :t =
若S 与S 无显著差异,取S 作为S。
②查t值表,自由度f=n +n -2。
③若t >t ,说明两组平均值有显著差异。
例:Na CO 试样用两种方法测定结果如下:
方法1: =42.34,S =0.10,n =5。
方法2: =42.44,S =0.12,n =4。
比较两结果有无显著差异。
离群值的取舍 | ||
1. 定义 表2-3 90%置信水平的Q临界值表
例:测定某溶液物质的量浓度,得如下结果:0.1014 ,0.1012 ,0.1016 ,0.1025 ,问0.1025是否应该舍弃(置信度90%)? |
方法的选择 |
|
准确度的提高 |
1. 减少测量误差 |
有效数字 |
1. 定义 |
有效数字的修约规则 |
规定:当尾数≤4时则舍,尾数≥6时则入;尾数等于5而后面的数都为0时,5前面为偶数则舍,5前面为奇数则入;尾数等于5而后面还有不为0的任何数字,无论5前面是奇或是偶都入。 |
有效数字运算规则 |
由于与误差传递有关,计算时加减法和乘除法的运算规则不太相同。 |