第一节 用选定的标准来评定一组检测数据平均值的准确度
在检验检测机构中,往往选用标准样品、标准的检测方法或经典的检测方法、熟练的检测人员、质量可靠的检测仪器等工作标准,对以下一些情况进行考核:
(1)一种新制定的检测方法;
(2)一个检测人员的检测结果;
(3)新购置的或使用时间较久或修理后的仪器;
(4)检验检测机构的检测测试条件是否改变;
(5)产品的质量波动等。
此时我们可以认为用作标准数据,其总体平均值为已知,设欲检验的平均值为,其计算方法见式(2-1)。这里有两种情况需要检验:一是与之间是否有显著差异;二是比要大,或比要小。
这两种情况的检验方法如下。
一、一组测定次数为n的检测数据的平均值与用作标准的平均值之间是否有显著的差异
1.总体标准偏差σ未知时
(1)选定显著性水平a值;
(2)查表3-1双侧检验一栏,自由度为n-1时的ta值;
(3)按式(2-4)计算S值;
(4)据下式计算u0值:
(4-1)
(5)结论:如果和之间的差的绝对值大于计算值u0,即,则认为在100(1-a)%的可信水平下,和之间有显著差异。
这一检验方法通称t检验法。
应当指出,我们下这一结论是根据统计学的检验方法,认为在可信水平为100(1-a)%时,值的范围为。如果,则得出与之间有显著差异。这里,如何选择a值很重要。对两组检测结果的评定,一般选用的a值为0.05,如果要求放宽一些,也可选用0.01。实际上,a值反映了犯第Ⅰ类错误的概率,即与之间实际上不存在显著差异,而我们得出两者之间存在显著差异的错误结论,a值所反映的便是这种错误发生的概率。显然,a值愈小,则计算得的的范围愈大,因而犯这类错误的概率也愈小。关于显著性水平a的大小和结论之间的关系,见表3-4。
例4-1 用现行的国家标准检测法测得某试样中粗蛋白质含量的平均值为70.91%,现用新制定的快速检测方法测定同一试样,平行测定8次,测得粗蛋白质含量的平均值为70.96%。新方法的标准偏差为0.053%,问:用新制定的快速方法测得的平均值与标准方法测得的平均值之间是否存在显著差异?
解:将标准方法测得的粗蛋白质含量的平均值视为。
(1)选定a=0.05。
(2)查表3-1双侧检验栏:自由度为n-1=7,a=0.05,查得ta=2.365。
(3)已知S=0.053%,计算u0值:
(4)
(5)结论:由于,故在可信水平为95%的情况下,新制定的快速方法测得的平均值与标准方法测得的平均值有显著差异。
2.总体标准偏差σ已知时
(1)选定显著性水平a值。
(2)查表4-1相应的uP值,表中的P值即为1-a值,由于它是单侧检验表,而此时为双侧检验,故P=1-a/2。
表4-1 正态分布uP数值表
(3)据下式计算u0值:
(4-2)
(4)结论:如果计算得,即认为在100(1-a)%的可信水平下,和之间有显著差异。
同样,我们下这一结论的根据是,在可信水平为100(1-a)%下,的范围为,如果,则得出与之间有显著差异。
表4-1为单侧检验表,用作单侧检验时,P=1-a;若作双侧检验,则P=1-a/2。
例4-2 用一电感耦合等离子体发射光谱(ICP-AES)仪器测铬的含量,它的精度σ为0.24%,一个有经验的检测人员用该检测方法,使用正常的仪器做多次测试,测得某试样中铬含量为1.88%,现有一台刚安装好的电感耦合等离子体发射光谱(ICP-AES)仪器,该名检测人员用相同的方法,在这台新仪器上,对以上试样做同样的检测,平行测定10次,得到试样中的铬含量为1.80%,问用这台刚安装好的电感耦合等离子体发射光谱(ICP-AES)仪器测得的检测结果(),与使用正常的电感耦合等离子体发射光谱(ICP-AES)仪器所测得的结果()之间是否有显著差异?
解:
(1)选定a=0.05。
(2)查表4-1:由于此时为双侧检验,故P=1-a/2=0.975,查得uP=1.960。
(3)按式(4-2)计算u0值:
(4)
由于,故认为在95%的可信水平下,和之间无显著差异,即在新安装好的电感耦合等离子体发射光谱(ICP-AES)仪器上测得的平均值与在正常电感耦合等离子体发射光谱(ICP-AES)仪器上测得的平均值之间无显著差异。
二、一组测定次数为n的检测数据的平均值和用作标准的平均值比较,比要大,或比要小
1.总体标准偏差σ未知时
(1)选定显著性水平a值。
(2)查表3-1中单侧检验栏,自由度为n-1时的ta值。
(3)按式(3-1)计算S值。
(4)据下式计算u0值:
(4-3)
(5)结论:
①如果确定要检验是否大于,则当计算得的u0值小于-时,即->u0时,可认为在100(1-a)%的可信水平下,大于,此时,值在100(1-a)%的可信水平下,存在于-u0~+∞的范围内;如果-≤u0,则没有理由相信大于。
②如果确定要检验是否小于,则当计算得的u0值小于-值时,即->u0时,可认为在100(1-a)%的可信水平下小于,此时值在100(1-a)%的可信水平下存在于-∞~-u0的范围内;如果-≤u0,则没有理由相信小于。
例4-3 测定一试样中某元素的含量,熟练的检测人员测得其中被测物的含量为3.46%。现有一名新从事检测工作的人员用相同的检测方法,对该试样平行测定6次,得到被测物的含量为3.57%,测定的标准偏差为0.16%,问:新从事检测工作的人员检测的结果(平均值),是否比熟练的检测人员测得的检测结果(平均值)要高?
解:
(1)选定a=0.05。
(2)查表3-1中单侧检验一栏:自由度为n-1=5,查得ta=2.015。
(3)已知S=0.16%,计算u0值:
(4)-=3.57%-3.46%=0.11%
(5)结论:-<u0,说明在95%的可信水平下,没有理由相信比高,即在95%的可信水平下,没有理由相信,刚从事检测工作的人员测得的平均值比熟练人员测得的要高。
例4-4 另一个新的操作人员对例4-3中同一试样进行检测,他平行测定7次,测得被测物的含量为3.33%,标准偏差为0.15%,问:他测得的平均值是否比熟练的检测人员测得的平均值要低?
解:
(1)选定a=0.05。
(2)查表3-1中单侧检验栏:自由度为n-1=6,查得ta=1.943。
(3)已知S=0.15%,计算u0值:
(4) (-)=3.46%-3.33%=0.13%。
(5)结论:由于->u0,故认为在95%的可信水平下,比低,即该新的操作人员测得的平均值比熟练的检测人员测得的平均值要低。
2.总体标准偏差σ已知时
(1)选定显著性水平a值。
(2)查表4-1中P=1-a栏中相应的uP值。
(3)据下式计算u0值:
(4-4)
(4)结论:
①如果确定要检验是否大于,则当计算得的u0值小于-值时,即->u0时,可认为在100(1-a)%的可信水平下小于,此时,值在100(1-a)%的可信水平下存在于-u0~+∞的范围内,如果-≤u0,则没有理由相信大于;
②如果确定要检验是否小于,则当计算得的u0值小于-值时,即->u0,可认为在100(1-a)%的可信水平下小于,此时,值在100(1-a)%的可信水平下,存在于-∞~-u0的范围内,如果-≤u0,则没有理由相信小于。
例4-5 某检验检测机构用一含碳标准样品考核一组检测操作人员。此标样含碳量为8.12%,用标准方法测定,其标准偏差σ为0.034%。现要求用同样的检测方法,平行测定10次,这组操作人员中有两人测得的平均值分别为8.14%和8.09%,问:
(1)前者得到的平均值是否比标值8.12%要大?
(2)后者得到的平均值是否比标值要小?
解:
(1)选定显著性水平a=0.05。
(2)按表4-1:P=1-a=0.95,查得uP=1.645。
(3)按式(4-4)计算u0值:
(4)结论:
①-=8.14%-8.12%=0.02%
由于->u0,故认为在可信水平为95%下,平均值(8.14%)比标值(8.12%)要大。
②-=8.12%-8.09%=0.03%
由于->u0,故认为在可信水平为95%下,平均值(8.09%)比标值(8.12%)要小。
在本节的几种检验中,前面已指出犯第Ⅰ类错误的概率为a。第Ⅰ类错误是指与之间实际上不存在显著差异,而得到的结论是两者之间存在显著差异。与此同时,我们也有犯第Ⅱ类错的可能,第Ⅰ类错误是指与之间实际存在显著差异,但未被发现。犯这类错误的概率为β。β的大小和平均值之间的差δ有关。如果愈接近,即δ值愈小,则β值愈大。此外,影响β的因素还有以下一些:
(1)当其他条件不变时,a小,则β大;反之,a大,则β小。也可以说,在其他条件不变时,要使a和β同时都很小是不可能的。
(2)其他条件不变时,如增加测定次数n,则β值将有效地减小。
(3)在选定的a下,用单侧检验时的β比用双侧检验时的β要小。
由上可知,用统计学的方法检验平均值之间差异,它决定于三个量——a、β(δ)以及n。在检验测试中,我们可以充分利用上述减小β的各项有利因素,使统计检验能在适当的a值与β值的条件下进行。如前所述,a值通常选用0.01或0.05,β值则大多数控制在0.10~0.30之间,在要求更严格的场合,a和β值还可以取得更小。