您的当前位置:首页正文

分析化学中的误差及数据处理

2020-07-04 来源:爱站旅游
导读分析化学中的误差及数据处理
第三章 分析化学中的误差及数据处理

本章基本要求:

1 掌握误差和偏差的基本概念、准确度与精密度的概念和衡量其大小的方式;了解误差的分类、特点、产生的原因及其减免测定误差的措施。了解准确度与精密度之间的关系和它们在实际工作中的应用。

2 掌握有效数字的概念、有效数字在分析测定中的应用规则、可疑数据的取舍和有效数字的运算规则。

3 掌握平均值的置信区间的概念和计算;掌握t检验法、F检验法以及Q检验法的应用;了解随机误差的分布特征—正态分布。

4 掌握通过选择合适的分析方法、用标准样品对照、减小测量误差和随机误差、消除系统误差等提高分析结果准确度的方法。

分析人员用同一种方法对同一个试样进行多次分析,即使分析人员技术相当熟练,仪器设备很先进,也不可能做到每一次分析结果完全相同,所以在分析中往往要平行测定多次,然后取平均值代表分析结果,但是平均值同真实值之间还可能存在差异,因此分析中误差是不可避免的。

§3.1 分析化学中的误差

一 真值(xT)

某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的:

1 理论真值(如某化合物的理论组成,例:纯NaCl中Cl的含量)

2 计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位如米、千克等;标准参考物质证书上给出的数值;有经验的人用可靠方法多次测定的平均值,确认消除了系统误差。) 3 相对真值(如认定精确度高一个数量级的测定值作为低一级测量值的真值。(如标准试样(在仪器分析中常常用到)的含量) 二 平均值(x) xx1x2...xn

n 强调:n 次测量值的算术平均值虽不是真值,但比单次测量结果更接近真值,是对真值的最佳估计,它表示一组测定数据的集中趋势。

三 中位数 (xM)

一组测量数据按大小顺序排列,中间一个数据即为中位数XM,当测量值的个数位数时,中位数为中间相临两个测量值的平均值。

例1. 小 10.10,10.20,10.40,10.46,10.50 大 x=10.33 xM=10.40 例2. 10.10,10.20,10.40,10.46,10.50,10.54 x=10.37 xM=10.43

它的优点是能简单直观说明一组测量数据的结果,且不受两端具有过大误差数据的影响。例3:当有异常值时, 10.10,10.20,10.40,10.46,10.50,12.80 xM=10.43 x=10.74

很多情况下,用中位数表示“中心趋势”比用平均值更实际。其缺点是不能充分利用数据,因而不如平均值准确。 四 准确度和误差

1 准确度:指测量值与真值之间接近的程度,其好坏用误差来衡量,用相对误差较好。 2 误差(E):测定结果与真实值之间的差值

(1) 绝对误差:测量值与真值间的差值,Ea=x-xT

测量值大于真实值,误差为正误值;测量值小于真实值,误差为负误值。误差越小,测量值的准确度越好;误差越大,测量值的准确度越差。

(2) 相对误差:绝对误差占真值的百分比,Er= x - xT /xT×100%=Ea/xT 100% 相对误差有大小、正负之分,它能反映误差在真实结果中所占的比例,因此在绝对误差相同的条件下,代测组分含量越高,相对误差越小;反之,相对误差越大。

例: 某同学用分析天平直接称量两个物体,一为5.0000g,一为0.5000g, 试求两个物体的相对误差。

解:用分析天平称量,两物体称量的绝对误差均为0.0001g, 则两个称量的相对误差分别为

五 精密度和偏差

1 精密度: 平行测定结果相互靠近的程度,用偏差衡量 2 偏差(d): 测量值与平均值的差值,用 d表示

(1) 绝对偏差:个别测得值x-测得平均值x,即: d=x-x di0

偏差的大小反映了精密度的好坏,即多次测定结果相互吻合的程度。偏差有正负号,如果将各单次测定的偏差相加,其和应为0或接近为0。

(2) 相对偏差(dr):绝对偏差与平均值的比值,即:dr = d / x  100%

(3)平均偏差(d): 各单个偏差绝对值的平均值 ,即:dd1d2...dnn

(4)相对平均偏差(dr):平均偏差与测量平均值的比值,即:dr=d/x 100%

(5)标准偏差:S(xi1nix)2n1

强调:1 S是表示偏差的最好方法,数学严格性高,可靠性大,能显示出较大的偏差。 测定次数在3-20次时,可用S来表示一组数据的精密度,

2 式中n-1称为自由度,表明n次测量中只有n-1个独立变化的偏差。因为n个偏差之和等于零,所以只要知道n-1个偏差就可以确定第n个偏差了,

3 S与相对平均偏差的区别在于:第一,偏差平方后再相加,消除了负号,再除自由度和再开根,标准偏差是数据统计上的需要,在表示测量数据不多的精密度时,更加准确和合理。

4 S对单次测量偏差平方和不仅避免单次测量偏差相加时正负抵消,更重要的是大偏差能更显著地反映出来,能更好地说明数据的分散程度。 例:有二组数据,各次测量的偏差为:

+0.3,-0.2,-0.4,+0.2,+0.1,+0.4, 0.0,-0.3,+0.2,-0.3; 0.0, +0.1,-0.7,+0.2,-0.1,-0.2,+0.5,-0.2,+0.3,+0.1; 解:两组数据的平均偏差均为0.24,但明显看出第二组数据分散大。因为S1=0.28; S2=0.33 (注意计算S时,若偏差d=0时,也应算进去,不能舍去),可见第一组数据较好。

s(6) 相对标准偏差(Sr、RSD、CV):Sr100%

x六 准确度与精密度的关系

A B C D

A. 准确且精密 B. 不准确但精密 C.准确但不精密 D.不准确且不精密 结论:准确度高精密度一定高;精密度是保证准确度的前提;精密度好,准确度不一定好,可能有系统误差存在;精密度不好,衡量准确度无意义;在确定消除了系统误差的前提下,精密度可表达准确度;准确度及精密度都高说明结果可靠。 七 极差(R):又称全距或范围误差 ,即:R=xmax-xmin 相对极差 = R/x 100%

八 公差(阅读P45):生产部门对于分析结果允许误差表示法,超出此误差范围为超差,分析组分越复杂,公差的范围也大些。 九 系统误差和随机误差

1.系统误差:由某种固定原因造成,使测定结果系统地偏高或偏低。可用校正地方法加以消除。 特点:(1)单向性:要么偏高,要么偏低,即正负、大小有一定地规律性

(2)重复性:同一条件下,重复测定中,重复地出现; (3)可测性:误差大小基本不变。 来源:(1)方法误差—选择的方法不够完善:重量分析中沉淀的溶解损失、滴定分析中终点误差-用其他方法校正

(2)仪器误差—仪器本身的缺陷: 天平两臂不等,滴定管,容量瓶刻度不准、砝码磨损-校准(绝对、相对)

(3)操作误差: 颜色观察(多实践)

(4)试剂误差—所用试剂有杂质: 去离子水不合格;试剂纯度不够(含待测组份或干扰离子)-空白实验 (5)主观误差—个人误差,操作人员主观因素造成: 对指示剂颜色辨别偏深或偏浅;滴定管读数不准。

2. 随机误差:由某些不固定偶然原因造成,使测定结果在一定范围内波动,大小、正负不定,难以找到原因,无法测量。不存在系统误差的情况下,测定次数越多其平均值越接近真值。一般平行测定4-6次 特点:(1)不确定性;(2)不可避免性。只能减小,不能消除。每次测定结果无规律性,多次测量符合统计规律。

3.过失:其实质是一种错误,由粗心大意引起,可以避免的,必须重 做 !如:加错指示剂、记录错误等

图1 系统误差与随机误差的比较

项目 产生原因 系统误差 固定因素,有时不存在 随机误差 不固定因素,总是存在 分类 方法误差、仪器与试剂误差、 环境的变化因素、主观的变 主观误差 化因素等 性质 重现性、单向性(或周期性)、 服从概率统计规律、不可测性 可测性 准确度 精密度 影响 消除或减小的方法 校正 增加测定的次数 十 误差的传递(自阅) 1 系统误差的传递 (1) 加减法

R =mA+nB-pC ER =mEA+nEB-pEC (2)乘除法

R =mA×nB/pC ER/R =EA/A+EB/B-EC/C (3) 指数运算

n R =mA ER/R =nEA/A (4) 对数运算

R =mlgA ER =0.434mEA/A 2 随机误差的传递 (1)加减法

2 222222

R =mA+nB-pC sR=msA+nsB+psC (2)乘除法

22 222222

R =mA×nB/pC sR/R= sA/A+ sB/B+ sC/C (3) 指数运算

R =mA sR/R =nsA/A (4) 对数运算

R=mlgA sR =0.434msA/A 3 极值误差:最大可能误差

R=A+B-C ER=|EA|+|EB|+|EC|

R=AB/C ER/R=|EA/A|+|EB/B|+|EC/C|

n§3.2 有效数字及运算规则

一 有效数字:实际能测到的数字。在有效数字中, 只有最后一位数是不确定的,可疑的。有效数字位数由仪器准确度决定,它直接影响测定的相对误差。 1 零的作用:

(1)数字前“0”定位作用不计有效数字,数字中、后的计入有效数字 : 0.03040(四位) 1.0008(五位)0.0382(三位)0.0040(两位)

(2) 数字后的0含义不清楚时, 有效位数不确定、含糊: 3600(有效位数不确定、含糊,因为可看成是4位有效数字,但它也可能是2位或3位有效数字,分别写成指数形式表示为

333

3.600×10,3.6×10,3.60×10);1000 (有效位数不确定、含糊,原因同上,分别写成

333

指数形式表示为1.0×10, 1.00×10, 1.000 ×10)

3

2 倍数、分数、常数可看成具有无限多位有效数字:10、1/3、、e

3 pH,pM,lgc,lgK等对数值,有效数字的位数取决于小数部分(尾数)位数,因整数部

-5

分代表该数的方次。例: pM=5.00 (二位) [M]=1.0×10 (二位);PH=10.34(二位);pH=0.03(二位)

4

4 数据的第一位数大于等于8的,可多计一位有效数字,如 9.45×10, 95.2%, 8.65(四位)

-3

5 不能因为变换单位而改变有效数字的位数,如: 24.01mL 24.0110 L 6 误差只需保留1~2位

二 有效数字的修约规则:“四舍六入五成双”

1 当测量值中修约的那个数字等于或小于4时,该数字舍去。如:3.1483.1 2 等于或大于6时,进位。如:0.7360.74 3 等于5时(5后面无数据或是0时),如进位后末位数为偶数则进位,舍去后末位数位 偶数则舍去,如:75.576。 当5后面还有不是0的任何数时,进位,如:2.4512.5、1.25131.3 4 修约数字时,只允许对原测量值一次修约到所需要的位数,不能分次修约(一次修约) 如:13.474813.47(对)、如:13.4565  13.456  13.46  13.5  14(错) 三 运算规则

1 加减法:当几个数据相加减时,它们和或差的有效数字位数,应以小数点后位数最

少的数据为依据,因小数点后位数最少的数据的绝对误差最大。例: 0.0121 + 25.64 + 1.05782 = ? 绝对误差 ±0.0001 ±0.01 ±0.00001 由于在加合的结果中总的绝对误差值取决于25.64,所以

0.0121+25.64+1.05782=0.01+25.64+1.06=26.71。又如:50.1+1.45+0.5812=52.1 2 乘除法:当几个数据相乘除时,它们积或商的有效数字位数,应以有效数字位数最少

的数据为依据,因有效数字位数最少的数据的相对误差最大。 例: 0.0121 × 25.64 × 1.05782 = ? 相对误差 ±0.8% ±0.4% ±0.009%

由于结果的相对误差取决于 0.0121,因它的相对误差最大,所以

0.0121 × 25.64 × 1.05782 = 0.0121×25.6×1.06 = 0.328 四 有效数字运算规则在分析化学中的应用

1 根据分析仪器和分析方法的准确度正确读出和记录测定值,且只保留一位不确定数字。 2 在计算测定结果之前,先根据运算方法(加减或乘除)确定欲保留的位数,然后按照数字修约规则对各测定值进行修约,先修约,后计算。 3 分析化学中的计算主要有两大类

(1)一类是各种化学平衡中有关浓度的计算,一般为四位,化学平衡计算中,结果一般为 两位有效数字(由于K值一般为两位有效数字)。

(2)一类是计算测定结果,确定其有效数字位数与待测组分在试样中的相对含量有关。 对于高含量组分(一般大于10%)的测定,四位有效数字;对中含量组分(1%--10%), 三位有效数字;微量组分(<1%=,两位有效数字。 (3)常量分析法一般为4位有效数字(Er≈0.1%),微量分析为2位。 (4) 各种常数取值一般为两至三位。

§3.3 分析化学中的数据处理

数理统计是一门研究随机现象统计规律的数学分支学科,它是建立在概率论基础上的。 1.事件:在一定条件下的试验结果中,所发生的现象。 (1) 必然事件:在每次试验结果中,一定会发生的事件。 (2) 不可能事件:在每次试验结果中,一定不发生的事件。

(3) 随机事件:在每次试验结果中,可能发生也可能不发生的事件。(偶然事件、概率事件) 2.概率:随机事件发生的可能性大小。

频率 = k/n,n→大,频率→接近概率,当n相当大时,频率近似于概率。 3.总体(母体):研究对象的全体。

4.个体(子体): 组成总体的每个单元。

5.样本(子样): 自总体中随机抽取的一组测量值(自总体中随机抽取的一部分个体)。 6.样本容量(n):样品中所包含个体的数目,用n表示。

例:分析宁德霍童溪水总硬度,依照取样规则,从霍童溪取来供分析用2000ml样品水,这2000ml样品水是供分析用的总体,如果从样品水中取出20个试样进行平行分析,得到20个分析结果,则这组分析结果就是霍童溪样品水的一个随机样本,样本容量为20。 7.随机变量 来自同一总体的无限多个测量值都是随机出现的,叫随机变量。 一 概念

1 样本平均值 :x1xi (n为有限次测量) n1xi(n为无限次测量) nn2总体平均值μ:lim 强调:(1)当测定次数无限增多时,所得样本平均值即为总体平均值μ

(2)若没有系统误差,则总体平均值μ就是真值

x

3 总体平均偏差δ:n4 总体标准偏差(n为无限次测量)

xi1ni2n 5 样本标准偏差S(n为有限次测量、已讲)

S(xi1nix)2n1 (n-1)-自由度

6 相对标准偏差(已讲)

s相对标准偏差(变异系数)CV100%

x相对平均偏差d100% x7 总体标准偏差与总体平均偏差的关系

当测定次数非常多(n大于20)时,0.7970.8,但是样本中d00.8S 8 平均值的标准偏差:(p58-59)

统计学可证明 平均值的标准偏差与单次测量结果的标准偏差存在下列关系:

,x(无限次测量) 增加测定次数,可使平均值的标准偏差减少,但xnn测定次数增加到一定程度时,这种减少作用不明

sxsn,dxdn显,因此在实际工作中,一般平行测定3-4次即可;

(有限次测量) 当要求较高时,可适当增加平行测量次数

总结:用标准偏差比用平均偏差更科学更准确.

例: 两组数据

1 x : 0.11, -0.73, 0.24, 0.51, -0.14, 0.00, 0.30, -0.21 n=8 d1=0.28 S1=0.38

2 x :0.18,0.26,-0.25,-0.37, 0.32 ,-0.28,0.31, -0.27 n=8 d2=0.28 S2=0.29 d1=d2, S1>S2(第二组数据更准确!) 二 随机误差的正态分布 1 频率分布

表1 某样品中镍的质量分数(%),n = 90

1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59 1.61 1.62 1.55 1.52 1.49 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.69

(1) 将n个数据从小到大依次排列。 (2) 算出极差(R):R = x最大 - x最小 R = 1.74% -1.49 % = 0.25 % (3) 确定组数和组距 :组数视测定次数n而定,组数必须是整数。 n = 90 9组

组距=

极差25.0%==0. 03%组数9

组数第一组 1.485 % + 0.03 % = 1.515 %

表2 分组、频数和概率密度统计 组序 1 2 3 4 5 6 7 8 9 分组(% ) 1.485~1.515 1.515~1.545 1.545~1.575 1.575~1.605 1.605~1.635 1.635~1.665 1.665~1.695 1.695~1.725 1.725~1.755 Σ 频数 2 6 6 17 22 20 10 6 1 90 概率密度(相对频数) 0.022 0.067 0.067 0.189 0.244 0.222 0.111 0.067 0.011 1.00 (4) 统计频数

频数:落在某组内的数据个数。 ∑ 频数 = n

(5)计算概率密度(频率)

概率密度= 频数/n , ∑概率密度= 1

所以,以各组分区间为横坐标,概率密度为纵坐标作图就可得频率分布直方图(p54)。

图中长方条面积:面积= 频率×组距,它表示了测定值出现在该区间的概率。因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多。

(6) 频率分布直方图的特点

A 离散特性:各数据是分散的,波动的,即;测定值在平均值周围波动。波动的程度用总体标准偏差表示。

B 集中趋势:有向平均值集中的趋势。用总体平均值表示。在确认消除了系统误差的前提下,总体平均值就是真值。

2 随机误差的正态分布 (无限次测量)

(1) 正态分布曲线:如果以x-(随机误差)为横坐标,曲线最 高点横坐标为0,这时表示的是随机误差的正态分布曲线。 yf(x)1ex2222, 记为:N(,2),

式中 y:概率密度; x:测量值; x-μ:随机误差

μ:总体平均值,反映测量值分布的集中趋势,决定 曲线在X轴的位置。

σ:标准偏差,反映测量值分布的分散程度;决定 曲线的形状,小曲线高、陡峭,精密度好;  大曲线低、平坦,精密度差。

随机误差符合正态分布: A x=μ 时,y值最大,体现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。μ反映测量值分布集中趋势。 B 曲线以x=μ这一直线为其对称轴,说明正误差和负误差出现的概率相等。

C 当x趋于-∞或+∞时,曲线以x轴为渐近线。即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。

D σ越大,测量值落在μ附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,σ越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。σ反映测量值分布分散程度。

1E x=时的概率密度为 yx 2(2) 标准正态分布曲线 令ux,

1eu22 则:yf(x)22 记为:N(0,1)

此时,横坐标改为u,纵坐标为概率密度,此时

曲线的形状与σ大小无关,不同σ的曲线合为一条。

3. 随机误差的区间概率

正态分布曲线与横坐标-∞到+∞之间所夹的面积,代表所有数据出现概率的总和,其值应为1,即P(,)P(a,b)1212yu1eu22

eu222dx1。若要求变量在某区间出现的概率,则

baeu222dx。由此,可得到概率积分图(如下图)

图2 正态分布概率积分图 |μ| 面积 |μ| 面积 |μ| 面积 0.0 0.0000 1.0 0.3413 2.0 0.4773 0.1 0.0398 1.1 0.3643 2.1 0.4821 0.2 0.0793 1.2 0.3849 2.2 0.4861 0.3 0.1179 1.3 0.4032 2.3 0.4893 0.4 0.1554 1.4 0.4192 2.4 0.4918 0.5 0.1915 1.5 0.4332 2.5 0.4938 0.6 0.2258 1.6 0.4452 2.6 0.4953 0.7 0.2580 1.7 0.4554 2.7 0.4965 0.8 0.2881 1.8 0.4641 2.8 0.4974 0.9 0.3519 1.9 0.4713 2.9 0.4987 注意:表中列出的是单侧概率,求  u间的概率,需乘以2。 随机误差出现的区间 测量值出现的区间 概率

u=1 x=1 0.3413×2=68.26% u=±1.96 x=μ±1.96σ 95.0% u=2 x=2 0.4773×2=95.46% u=±2.58 x=μ±2.58σ 99.0%

u=3 x=3 0.4987×2=99.74%

结论:随机误差超过3的测量值出现的概率仅占0.3%。当实际工作中,如果重复测量中,个别数据误差的绝对值大于3,则这些测量值可舍去。

例:已知某试样中Fe的标准值为3.78%,=0.10,又已知测量时没有系统误差,求 (1)分析结果落在(3.78±0.20)%范围内的概率;(2)分析结果大于4.0%的概率。

xu0.20解:(1)u2.0 查表,求得概率为2*0.4773=0.9546 =95.46%

0.10xu4.003.78 (2)分析结果大于4.0%的概率,u2.2,查表求得分析结果落在

0.103.78-4.00%以内的概率为0.4861,那么分析结果大于4.00%的概率为0.5000-0.4861=1.39%

§3.4 少量数据的统计处理

一 t分布曲线(有限次测量中随机误差服从t分布)

正态分布是无限次测量数据的分布规律,而对有限次测量数据则用t 分布曲线处理。用t代替u,用S代替,t定义为:t标则为统计量t。如下图:

xxn 。 纵坐标仍为概率密度,但横坐 sxs

1 正态分布与 t 分布区别

(1) 正态分布 — 描述无限次测量数据; t 分布 — 描述有限次测量数据 (2 )正态分布——横坐标为 u ,t 分布——横坐标为 t (3) 两者所包含面积均是一定范围内测量值出现的概率P 正态分布:P 随u 变化;u 一定,P一定

t 分布: P 随 t 和f 变化;t 一定,概率P与f 有关

t分布曲线与正态分布曲线相似,只是t分布曲线随自由度f而改变。当f趋近∞时, t分布就趋近正态分布,即:f → ∞时,t分布→正态分布。 2 置信度(P):表示在某一t值时,测定值落在(μ+ts)范围内的概率,说明估计的把握程度。当f,t即为u 3 显著性水平():表示在某一t值时,测定值落在(μ+ts)范围之外的概率,即:=1-P。

t值与置信度及自由度有关,一般表示为t,f,见p60,表3-3(双边)

表3-6 tα,f值表(双边) 置信度,显著性水准 f P=0.90 P=0.95 α=0.10 α=0.05

P=0.99 α=0.01 63.66 9·92 5·84 4·60 4·03 3·71 3·50 3.36 3.25 3.17 2.84 2.58

例: t0·05,10 = 2.23表示置信度为95%,自由度为10时的t值为2.23。

1 2 3 4 5 6 7 8 9 10 20 ∞ 6.31 2.92 2.35 2.13 2.02 1.94 1.90 1.86 1.83 12.81 1.72 1.64 12.71 4.30 3.18 2.78 2.57 2.45 2.36 2.31 2.26 2.23 2.09 1.96 t0·01,5 = 4.03表示置信度为99%,自由度为5时的t值为4.03。

S二 平均值的置信区间(xt):一定置信度(概率)下,以平均值为中心,能够包

n含真值的区间(范围),反映估计的精密度。置信度越高,置信区间越大。

xu(1)由单次测量结果估计μ的置信区间:

(2)由多次测量的样本平均值估计μ的置信区间:

xuxu

xn

(3)由少量测定结果均值估计μ的置信区间

x

它表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间。

xtstsxn从公式可知只要选定置信度P,根据P(或)与f即可从表中查出t,f值,从测定的x,s,n值就可以求出相应的置信区间,置信度越高,置信区间就越大,所估计的区间包括真值的可能性也就越大,置信度定在95%或90%。

例1:分析某固体废物中铁含量得如下结果:x=15.78%,s=0.03%,n=4,求: (1) 置信度为95%时平均值的置信区间; (2) 置信度为99%时平均值的置信区间

S0.03解:置信度为95%,查表得t0.05,那么xt15.783.1815.780.05% 3=3.18,

n4S0.03置信度为99%,查表得t0.05,=5.84,那么xt15.785.8415.780.09% 3

n4从该例可以看出,置信度越高,置信区间越大。

对上例结果的理解:

1.正确的理解:在15.78±0.05%的区间内,包括总体平均值的的概率为95%。 2.错误的理解:a.未来测定的实验平均值有95%落入15.78±0.05%区间内

b.真值落在15.78±0.05%区间内的概率为95%

例2:下列有关置信区间的定义中,正确的是:

a.以真值为中心的某一区间包括测定结果的平均值的几率;

b.在一定置信度时,以测量值的平均值为中心的包括总体平均值的范围

c.真值落在某一可靠区间的几率;d.在一定置信度时,以真值为中心的可靠范围。 例3:某试样含Cl-的质量分数的平均值的置信区间为36.45%±0.10%(置信区间90%),对此结果应理解为:

a.有90%的测量结果落在36.45%±0.10%范围内;b.总体平均值落在此区间的概率为90%; c.若再作一次测定,落在此区间的概率为90%;d.在此区间内,包括总体平均值的把握为90%

§3.5 显著性检验

显著性检验是利用统计学的方法,检验被处理的问题是否存在统计上的显著性差异,即:确定某种方法是否可用,判断实验室测定结果准确性。方法有t 检验法和F 检验法

一 t检验法—系统误差的检测

1 平均值与标准值的比较: 为了检查分析数据是否存在较大的系统误差,可对标准试样进行若干次分析,再利用t检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。进行t检验时,首先按下式计算出t值:txSn 。若t

计算

>tα,f,存

在显著性差异,存在系统误差,被检验方法需要改进,否则不存在显著性差异,被检验方法可以采用。。通常以95%的置信度为检验标准,即显著性水准为5%。表示有显著性差异.

例: 采用某种新方法测定基准明矾中铝的质量分数,得到下列9个分析结果:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。已知明矾中铝含量的标准值(以理论值代)为10.77%。试问采用该新方法后,是否引起系统误差(置信度95%)? 解 n = 9, f = 9-1=8

x10.79%10.77%

tn91.43 s0.042% 查表,P = 0.95,f = 8时,t0.05,8 = 2.31。t < t0.05,8,故x与μ之间不存在显著性差异,即采用新方法后,没有引起明显的系统误差。

x10.79%,s0.042%2 两组平均值的比较((同一试样,比较x1与x2): 新方法--经典方法(标准方法) 两个分析人员测定的两组数据 两个实验室测定的两组数据 设两组分析数据为:

n1 s1 x1 n2 s2 x2 统计量 t=x1x2S2(n11)S12(n21)S22n1n2 Sn1n2n1n22在一定置信度时,查出表值 (总自由度f=n1+n2-2),若t > t表,则两组平均值存在显

著性差异。t例 用两种方法测定合金中铝的质量分数,所得结果如下: 第一法 1.26% 1.25% 1.22% 第二法 1.35% 1.31% 1.33% 试问两种方法之间是否有显著性差异(置信度90%)? 解 n1=3, x1=1.24% s1=0.021% n2=4, x2=1.33% s2=0.017%

f大=2 f小=3 F表=9·55 F < F表 → 说明两组数据的标准偏差没有显著性差异. 22(xx)(xx)1i12i2

s0.019 (n11)(n21)

tx1x2s1.241.33n1n2n1n20.019346.2134

当P = 0.90,f = n1+n2-2 = 5时,t0·10,5 = 2.02。t > t0·10,5,故两种分析方法之间存在显著性差异.

二 F检验法 — 方差检验法(两组数据间偶然误差的检测):比较两组数据的方差s2,以确定它们的精密度是否有显著性差异的方法。统计量F定义为两组数据的方差的比值,即:统计量 Fs大2s小2 。两组数据的精密度相差不大,则F值趋近于1;若两者之间存在显著

性差异,F值就较大。在一定的P(置信度95%)及f时,F计算>F表,存在显著性差异,否则,不存在显著性差异。

表 置信度95%时F值(单边) 2 3 4 5 6 7 8 9 10 f大 ∞ f小 2 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.39 19.50 3 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78 8.53 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.63 4 5 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74 4.36 6 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 3.67 7 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63 3.23 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34 2.93 8 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.13 2.71 9 10 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97 2.54 ∞ 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.00 f大:大方差数据的自由度;f小:小方差数据的自由度。 判断两组数据的精密度是否有显著性差异时,一组数据的精密度可能大于,等于,或小于另一组数据的精密度,显著性水平为单侧检验时的两倍,即0.10,此时的置信P=1-0.10=0.90(90%)。 例:一碱灰试样,用两种方法测得其中Na2CO3,结果如下方法1:x142.34,s10.10,n15 方法2:x242.44,s20.12,n24

解:先用F检验s1与s2有无显著差异:F计算s大2s小20.1220.1021.44

查表得F表=6.59,因F计算< F表,因此 s1与s2无显著差异,用t检验法检验x1与x2

x1x2s42.3442.44n1n2(ss小)n1n20.10541.49 54t计算查t表,f=5+4-2=7,P=95%,得:t表=2.36 ,则 t计算< t表,因此,无显著差异。

§3.6 异常值的取舍

在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。

若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。处理方法有4d法、格鲁布斯(Grubbs)法和Q检验法。 一 4d法(简单,但误差大)

1 依据:根据正态分布规律,偏差超过3σ的个别测定值的概率小于0.3%,故这一测量值通常可以舍去。而δ=0.80σ,3σ≈4δ,即偏差超过4δ的个别测定值可以舍去。当4d法与其他检验法矛盾时,以其他法则为准。

2 步骤:(1)求出除异常值(Qu)以外数据的平均值x和平均偏差d。

(2)将异常值与平均值进行比较,如绝对差值大于4d,则将可疑值舍去,否则保留。 二 格鲁布斯(Grubbs)法: 步骤:(1) 数据由小到大排列:x1,x2……xn,其中x1或xn可能是异常值。 (2) 求出x与s。

(3) 求统计量T :Txxxx1(x1为可疑值) Tn(xn为可疑值) ss (4) 将T与表值Ta,n比较,T>Ta,n,舍去,否则保留。 n 3 4 5 6 7 8 9 10 11 12 13 14 15 20

三 Q检验法

表 Tα,n值表 0.05 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23 2.29 2.33 2.37 2.41 2.56 显著性水准α 0.025 1.15 1.48 1.71 1.89 2.02 2.13 2.21 2.29 2.36 2.41 2.46 2.51 2.55 2.71 0.01 1.15 1.49 1.75 1.94 2.10 2.22 2.32 2.41 2.48 32.55 2.61 2.63 2.71 2.88 步骤:(1)数据由小到大排列:x1,x2……xn,其中x1或xn可能是异常值。

x可疑x邻近xmaxxmin (2)计算统计量(Q计算 Q):

xnxn1xx(xn为可疑值)Q21(x1为可疑值)

xnx1xnx1,若Q计算>Q表,舍去,过失误差造成。 (3)比较Q计算和Q表(QP,n)

若Q计算 < Q表,保留该数据, 偶然误差所致。

测定次数,n 置 90%(Q0.90) 信 96%(Q0.96) 度 99%(Q0.99) 表 Q值表 3 0.94 0.98 0.99 4 0.76 0.85 0.93 5 0.64 0.73 0.82 6 0.56 0.64 0.74 7 0.51 0.59 0.68 8 0.47 0.54 0.63 9 0.44 0.51 0.60 10 0.41 0.48 0.57 总结:

1 比较:

t 检验 — 检验方法的系统误差 F 检验 — 检验方法的偶然误差 G 检验 — 可疑值的取舍 2 检验顺序:

G检验 → F 检验 → t检验

§3.7 回归分析法

一 一元线性回归方程

式中x,y分别为x和y的平均值,a为直线的截矩,b为直线的斜率,它们的值确定之后,

yiabxieiQ(yiabxi)2i1nayi1nibxii1nnnybxnQ2xi(yiabxi)0bi1b(xx)(yy)iii1Q2(yiabxi)0ai1n(xx)ii1n2一元线性回归方程及回归直线就定了。

例 用吸光光度法测定合金钢中Mn的含量,吸光度与Mn的含量间有下列关系: Mn的质量μg 0 0.02 0.04 0.06 0.08 0.10 10.12 未知样 吸光度A 0.032 0.135 0.187 0.268 0.359 0.435 0.511 0.242 试列出标准曲线的回归方程并计算未知试样中Mn的含量。

解 此组数据中,组分浓度为零时,吸光度不为零,这可能是在试剂中含有少量Mn,或者含有其它在该测量波长下有吸光的物质。

设Mn含量值为x,吸光度值为y,计算回归系数a,b值。 a=0.038 b=3.95

标准曲线的回归方程为 y = 0.38+3.95x r=0.9993 < r99%,f 标准曲线具有很好的线性关系未知试样中含Mn 0.052μg。 二 相关系数

1 相关系数的定义式如下:

rb(x(yi1i1nnix)y)n(xi1nix)(yiy)2i(xi1ix)(yi1niy)2

2相关系数的物理意义如下:

a.当所有的认值都在回归线上时,r= 1。

b.当y与x之间完全不存在线性关系时,r=0。

c.当r值在0至1之间时,表示例与x之间存在相关关系。r值愈接近1,线性关系就

愈好。

§3.7 提高分析结果准确度的方法

一 选择合适的分析方法

1 根据试样的中待测组分的含量选择分析方法。高含量组分用滴定分析或重量分析法;低

含量用仪器分析法。

2 充分考虑试样中共存组分对测定的干扰, 采用适当的掩蔽或分离方法。

3 对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后再进行测定。 例:测全Fe含量

K2Cr2O7法: 40.20% ±0.2%×40.20% 比色法: 40.20% ±2.0%×40.20% 二 减小测量误差

1 称量:分析天平的称量误差为±0.0002g,为了使测量时的相对误差在0.1%以下,试样质量必须在0.2 g以上。

例:天平一次的称量误差为 0.0001g,两次的称量误差为0.0002g,RE% < 0.1%,计算最少称样量?

20.0001

RE%100%0.1% w

2 滴定管读数常有±0.0l mL的误差,在一次滴定中,读数两次,可能造成±0.02 mL的误差。为使测量时的相对误差小于0.1%,消耗滴定剂的体积必须在20 mL以上,最好使体积在25 mL左右,一般在20至30mL之间。

例:滴定管一次的读数误差为0.01mL,两次的读数误差为0.02mL,RE% 0.1%,计算最少移液体积?

20.01

RE%100%0.1% V V20mL

3 微量组分的光度测定中,可将称量的准确度提高约一个数量级。 三 减小随机误差

在消除系统误差的前提下,平行测定次数愈多,平均值愈接近真值。因此,增加测定次数,可以提高平均值精密度。在化学分析中,对于同一试样,通常要求平行测定2--4次。 四 消除系统误差

由于系统误差是由某种固定的原因造成的,因而找出这一原因,就可以消除系统误差的来源。有下列几种方法:(1) 对照试验 (2) 空白试验 (3) 校准仪器 (4) 分析结果的校正 1 对照试验

(1) 与标准试样的标准结果进行对照;标准试样、管理样、合成样、加入回收法。 (2) 与其它成熟的分析方法进行对照;国家标准分析方法或公认的经典分析方法。 (3) 由不同分析人员,不同实验室来进行对照试验。 内检、外检。 2 空白试验:在不加待测组分的情况下,按照试样分析同样的操作手续和条件进行实验,所测定的结果为空白值,从试样测定结果中扣除空白值,来校正分析结果。可以消除由试剂、蒸馏水、实验器皿和环境带入的杂质引起的系统误差,但空白值不可太大。

3 校准仪器:仪器不准确引起的系统误差,通过校准仪器来减小其影响。例如砝码、移

w0.2000g液管和滴定管等,在精确的分析中,必须进行校准,并在计算结果时采用校正值。

4 分析结果的校正:校正分析过程的方法误差,例;用重量法测定试样中高含量的SiO2,因硅酸盐沉淀不完全而使测定结果偏低,可用光度法测定滤液中少量的硅,而后将分析结果相加。

作业:习题( P74 – 77)1、3、5、7、9、11、13、15、17、21题

因篇幅问题不能全部显示,请点此查看更多更全内容