第一节 检测结果的可信范围
一组平行测定数据,取平均值表示检测结果,由于存在系统误差和随机误差,这一检测结果往往和总体平均值,或真值,或标准物质的标准值有差异。因此,人们很想通过这一检测结果,准确知道真值是多少。实际上,这一问题目前无法回答,现在只能通过统计学的方法来计算真值的存在范围。也称其为检测结果的可信范围。此时,有个重要的假定,就是在检测测试过程中不存在系统误差。
检测结果的可信范围的计算方法如下。
一、双侧可信范围
双侧可信范围是指同时存在大于和小于总体平均值的可信范围。
(1)由一组平行测量数据,按式(2-1)计算平均值。
(2)用式(2-4)或下式计算标准偏差S:
(3-1)
(3)选定可信水平1-a。
(4)由表3-1中双侧检验栏,查相应的t值,此时自由度为n-1,显著性水平为a。
表3-1 t检验临界值
(5)由下式计算结果的上限值(xU)及结果的下限值(xL):
(3-2a)
(3-2b)
(6)结论:总体平均值(真值)m在xL~xU的范围内的概率为100(1-a)%,也就是说在100(1-a)%的可信水平下,总体平均值m存在于xL~xU范围内,即
例3-1 全自动定氮仪测定某饲料样品中的粗蛋白质含量,平行测定五次,结果如下(%):13.54,13.45,13.36,13.44,13.48。求:可信水平为95%及99%时,总体平均值的可信范围。
解:
(1)计算平均值和标准偏差S:
(2)选定可信水平1-a:
①1-a=95%
②1-a=99%
(3)查表3-1:双侧检验栏,自由度=n-1=4,
①1-a=95%即a=5%,查得t0=2.776
②1-a=99%即a=1%,查得t0=4.604
(4)计算上限值xU和下限值xL:
①a=5%:
②a=1%:
(5)结论:
①可信水平为95%时,总体平均值的可信范围为:
②可信水平为99%时,总体平均值的可信范围为:
说明:
(1)式(3-1)与式(2-4)是数学恒等式,用式(3-1)代替式(2-4)计算标准偏差是为了简化计算。式(3-1)特别适用于用科学计算器进行计算。标准偏差S(及t值)所取的有效数字的位数应和平均值的有效位数一致,也可先多取一位,但最后表示结果时,仍应与平均值的有效位数一致。
(2)100(1-a)%可信水平,可以理解为:进行100次平行测定时,其中100(1-a)%的平均值是落在xL~xU的范围内,100(1-a)%值愈大,即要求的可信水平愈高,则计算得的范围也愈大。在检测工作中往往选用a=0.05。
(3)测定次数n愈大,则计算得的范围愈小。应用本方法时,n值至少应等于或大于4。
(4)如果总体标准偏差σ为已知,或通过大量实验,多次求得的标准偏差基本为恒值,则可将该标准偏差看成为σ。此时,平均值的可信范围按下式计算:
(3-3a)
(3-3b)
在选定的可信水平1-a时,u值可由表2-10查得。此时a值可理解为出现大于+u和小于-u的概率(100a%),由于此表为单侧检验表,故查表时应将选定的a值除以2,查得相应的u值。比较表3-1和表2-10可知,当n为∞时,在相同的可信水平1-a下,t值和u值相同。
例3-2 有一快速检测方法适用于测定花生样品中的蛋白质含量,某检验检测机构用此方法对试样进行了64次平行测定,测得蛋白质含量的平均值为25.10%,总体标准偏差为0.44%,求此平均值的可信范围(a=0.05)。
解:
①查表2-10:此时为双侧检验,故查a/2=0.025相应的u值,查得u=1.960
②根据题意已知:σ=0.44%,n=64
故:
③
④平均值的可信范围为24.99%~25.21%(a=0.05)。
(5)当测定次数n较小时,亦可用以下简便方法近似计算平均值的可信范围:
(3-4a)
(3-4b)
或用下式计算:
(3-5a)
(3-5b)
式中,R为一组平行测得的数据中的最大值与最小值之差;a、b为计算平均值可信范围时的系数。
式(3-4)中的a和式(3-5)中的b可由表3-2查得。
表3-2 计算平均值可信范围时的系数
例3-3 用例3-1的数据,计算a=0.05和a=0.01时平均值的可信范围。
解:
(1)。
(2)查表3-2:a=0.05,n=5时,系数a=1.24,系数b=0.51;
a=0.01,n=5时,系数a=2.06,系数b=0.84。
(3)计算上限值xU和下限值xL:
①用式(3-4a)、式(3-4b)计算:
②用式(3-5a)、式(3-5b)计算:
结论:按式(3-4)算,a=0.05时,平均值的可信范围是:13.37%~13.54%;
a=0.01时,平均值的可信范围是:13.32%~13.59%;
按式(3-5)算,当a=0.05时,平均值的可信范围是:13.36%~13.55%;
当a=0.01时,平均值的可信范围是:13.30%~13.61%。
用与以上相似的方法,也可以计算在可信水平100r%下,测定次数n中有百分之几(p%)的次数,它的测定值落在xL~xU的范围内。计算方法如下:
(1)选定100r%及p%值;
(2)计算及S值;
(3)根据n、r、p值查表3-3中相应的K值;
(4)计算范围:
(3-6a)
(3-6b)
例3-4 在64次平行测定中,测得花生蛋白质含量的平均值为25.10%,测定的标准偏差为0.44%。问:欲使0.44%的测定值落在xL~xU范围内,在可信水平为95%下,xU及xL各为多少?
解:
(1)已知:=25.10%,S=0.44%;
(2)根据题意,已选定γ=0.95,n=64,p=0.90;
(3)查表3-3:n=64≈65,γ=0.95,p=0.90,K=1.943;
(4)按式(3-6a)及式(3-6b)分别计算xU和xL:
结论:在95%的可信水平下,有90%的测定值是落在24.25%~25.95%范围内。
二、单侧可信范围
单侧可信范围是指总体平均值小于最大值xU或者大于最小值xL的可信范围。即总体平均值在xU→0或者xL→∞的范围内的可信水平。计算方法如下:
(1)由一组测定次数为n的平行测定数据,按式(2-1)计算平均值。
(2)用式(2-4)或式(3-1)计算标准偏差S。
(3)选定可信水平1-a。
(4)查表3-1中单侧检验一栏中自由度为n-1,显著性水平为a的相应t值(此时应注意,如查表3-1中双侧检验栏,则应查显著性水平为2a一行,自由度为n-1的相应的t值)。
(5)由下式计算总体平均值大于xL的范围:
(3-7a)
或由下式计算总体平均值小于xU的范围:
(3-7b)
(6)结论,总体平均值大于xL的概率为100(1-a)%,或者总体平均值小于xU的概率为100(1-a)%,也可以认为在可信水平为100(1-a)%下,总体平均值大于xL,或小于xU。
例3-5 某一检验检测机构检测一个饮料样品中甜蜜素的含量,平行测定8次,得到以下结果(%):0.923、0.928、0.924、0.929、0.921、0.926、0.920、0.925,求:总体平均值大于何值(或小于何值)的概率为95%?
解:
(1)按式(2-1)和式(3-1)计算和S,得
(2)根据题意:1-a=95%,即a=0.05。
(3)查表3-1:单侧检验一栏,自由度n-1=7一行,查得ta=1.895。
(4)计算xL及xU:
(5)结论:总体平均值大于0.922%(或小于0.927%)的概率为95%。
说明:
(1)和“双侧可信范围”中说明(4)一样,如果总体标准偏差σ为已知,则可用下式计算xL和xU。
(3-8a)
(3-8b)
此时如选定的可信水平为1-a,则查表2-10中p=1-a相应的up值,up值即为式(3-8)中的u值。
例3-6 在研制某元素的标准物质过程中,为确定该元素的含量,由8个参加测定试验的检验检测机构共同对组织者提供的同一样品进行了测定,各机构分别测定10次,总数据为测定80次结果,得到的标准物质样品中的某元素的平均含量为12.37%,测定的总体标准偏差为0.056%,问:由此而得的总体平均值小于何值的概率为99.9%?
解:
①已知:。
②根据题意要求:1-a=99.9%,即a=0.001。
③查表2-10:100a=0.100,up=3.089。
④计算总体平均值小于xU的范围:
结论:总体平均值小于12.39%的概率为99.9%。
(2)以上检验的方法,都是先选定一个显著性水平a值,再进行计算,并求得结论。实际上也可以先根据出现差异的大小,再计算出该差异值的概率来作结论。这种用计算概率进行统计检验的方法,也适用于其他一些情况。
例3-7 用例3-5的数据,计算总体平均值大于0.923%的概率。
解:
①由例3-5解得=0.9245,S=0.003162,n=8
②根据题意要求:xL=0.923%
则 ,即
解上式得:t=1.342
③查表3-1:在自由度为n-1=7的单侧检验栏中寻找最接近计算得的t值的ta值:
查得:ta=1.415,此值与计算得的t=1.342最为接近,ta=1.415相应的a为0.10,故1-a=0.90。
④结论:由于计算得的t值小于表中查得的t值,说明要求的a值应更大些(从表3-1中可以看出,在一定的自由度下,a值愈大,ta值愈小),即1-a应更小一些,故总体平均值落在0.923%→∞(0范围的概率约小于90%(接近90%)。