張亮亮*
(中航金屬材料理化檢測科技有限公司,陜西西安,713801)
實驗室間比對結果的數據處理及測量不確定度評定
張亮亮*
(中航金屬材料理化檢測科技有限公司,陜西西安,713801)
某研究總院要求對四組GH4169質控樣品中的鎳含量進行定值分析,共組織了11家經認證的實驗室進行實驗室間比對(ILC)。采用了曼德爾 h/k統(tǒng)計分析、科克倫、格拉布斯和狄克遜檢驗法對數據的一致性和離群值進行了檢驗。在一致性檢驗中,對超出臨界值hCrit或kCrit數據的取舍情況進行說明,以盡可能地保留超臨界數據,使統(tǒng)計結果更為真實、可靠。再利用賦值合理的3個水平的實驗數據和期間精密度條件下的質控數據,分別計算偏倚ub和不精密度uR’兩者帶來的累積效應,以作為不確定度的估計量進行評定。
實驗室間比對(ILC);一致性檢驗;離群值檢驗;測量不確定度評定
高溫合金GH4169(INCONEL 718)是以體心四方的γ''相和面心立方的 γ'相沉淀強化的鎳-鉻-鐵基高溫合金,由于該合金具有較高的強度、良好的抗蠕變和抗疲勞性能,以及優(yōu)越的綜合力學性能,因而在航空上主要用于發(fā)動機部件,如渦輪盤、葉片、機匣、軸、定子、封嚴、支撐件、管路、緊固件等。要準確測定GH4169合金中化學成分是判定材料是否合格的重要環(huán)節(jié)。某研究總院在召開關于GH4169材料化學成分分析報告中指出,各檢測機構給出鎳的測定結果相差較大,而鎳作為主要基體成分對材料的性能有著極為重要的影響。為分析原因,將四組GH4169質控樣品分發(fā)給11家有資質的實驗室,要求各實驗室按標準進行檢測。
一些研究表明[1-4],采用曼德爾h/k一致性統(tǒng)計分析檢查ILC數據的可靠程度,相比其它統(tǒng)計方法[5-9],h/k檢驗方案更顯得簡捷直觀。本文對各實驗室的ILC數據也采用h/k一致性統(tǒng)計分析。并采用 top-down技術[10-12]評定丁二酮肟-EDTA容量法測定GH4169標樣中鎳含量的不確定度,top-down技術是在期間精密度測量條件下,利用質控和方法確認數據,分別將偏倚 ub和不精密度 uR’兩者帶來的累積效應,作為不確定度的估計量進行評定。該評定方法操縱性強、易于推廣。
文中數據摘自某研究總院組織 ILC實驗結果,組織分發(fā)給11家檢測機構各四組GH4169質控樣品。對于標準分析方法的選用,有2家實驗室(1#和2#)選用丁二酮肟重量法[13],其余9家實驗室選用丁二酮肟沉淀-EDTA容量法[14]。
評定uR’的數據源自本實驗室期間精密度條件下,GH4169質控樣品(52.27%±0.07%,編號:YSBC 41503-2012,研制單位:上海材料研究所)兩個月的累積數據,分析方法為丁二酮肟沉淀-EDTA容量法[14]。
k是實驗室內數據一致性的統(tǒng)計量,對各試驗結果進行離散型統(tǒng)計分析,即單個實驗室內各試驗結果與試驗結果均值在相比其它實驗室下的偏差。設有p家實驗室(j)參加比對,n是單個實驗室內試驗結果數量(x1,j,x2,j,…xi,j…xn-1,j,xn,j),試驗室(j)的k統(tǒng)計量見公式(1-4)。
kcrit是衡量測定結果離散程度的檢驗臨界值,見公式(5),當k值超過臨界值kcrit,表明試驗結果離散程度非常嚴重,精密度很差,試驗結果難予接受。
F(ν1,ν2)為 F-F 分布,自由度 ν1=n-1,ν2=(p-1)(n-1),該值即可通過F分布表獲得,也可由Excel函數“=FINV(0.05,ν1,ν2)”獲得。
h是實驗室間數據一致性的統(tǒng)計量,確定是否有實驗室的數據是離群的,即單個實驗室結果均值與所有實驗室結果均值的偏差。h值越大,說明試驗結果偏差越大,結果準確度越低。設有p家實驗室(j)參加比對,各實驗室內試驗結果數量(),試驗室(j)的h統(tǒng)計量見公式(6-9)。
hcrit是衡量單個實驗室測定結果準確度的檢驗臨界值,見公式(10),當h值超出臨界值hcrit,表明試驗結果準確度很差,試驗結果不予接受。
t為學生氏概率分布值,其自由度ν=p-2,該值即可通過t分布表獲得,也可由Excel函數“=TINV(0.05,ν)”獲得。
表1給出了檢出水平α=0.05時,Mandel’s h/k統(tǒng)計量臨界值。
表1 曼德爾h/k統(tǒng)計量臨界值(α=0.05)Table 1 The critical value of Mandel’s h/k statistic (α=0.05)
為了盡可能合理的保留各實驗室上報的ILC試驗數據,首先通過h/k統(tǒng)計公式計算出各實驗室的h(j)值和k(j)值,先判定h(j)值是否超出臨界值hCrit,若超出hCrit,則應先剔除該組實驗室數據,重新計算新一輪的h(j)值和k(j)值,直至h(j)值是在hCrit之內。然而,在運算時存在不斷會有新一輪的h(j)值超出 hCrit,但對于略高于hCrit的h(j)應予以保留,否則,若ILC數據犧牲太大,統(tǒng)計結果不能客觀反映各實驗室間的檢測情況。當h(j)判定完成后,再判定預留數據 k(j)值,允許稍高于臨界值的 k(j)值,但若 k(j)高出kCrit太多,就應考慮舍去。
表2為各實驗室上報的GH4169質控樣品中鎳含量的統(tǒng)計結果。表中再現性精密度標準差 sR和偏倚 bi的計算見公式(11)和(12),式中,ARV為樣品接受參考值或標準認可值。
表2 GH4169貨控樣品中鎳含量的ILC研究(%)Table 2 ILC study of nickel content in GH4169 quality control sample (%)
備注:表中的灰色背景表示該h值或k值統(tǒng)計量超出其臨界值,繼而在下一次統(tǒng)計運算時將該實驗室的試驗結果予以剔除;被標上標的數據為按執(zhí)行h/k統(tǒng)計檢驗次序得出的h值或k值,若未標記,即為最后一次統(tǒng)計檢驗結果。如標記為ⅰ時,即第一次對所有實驗室的數據值進行統(tǒng)計運算;標記為ⅱ時,即第二次對剩余實驗室的數據值進行統(tǒng)計運算,依次類推。
為了便于分析統(tǒng)計情況,通常采用直方圖對統(tǒng)計結果進行表述,如圖1所示,為①號樣品中鎳含量的h/k統(tǒng)計分布直方圖。
圖1 試驗結果的h值和k值統(tǒng)計量分布直方圖Fig.1 Statistic distribution histogram of h value and k value for test results
表3至表5是各實驗室給出的②~④號GH4169質控樣品中鎳含量統(tǒng)計結果。
表3 GH4169貨控樣品中鎳含量的ILC研究(%)Table 3 ILC study of nickel content in GH4169 quality control sample (%)
表4 GH4169貨控樣品中鎳含量的ILC研究(%)Table 4 ILC study of nickel content in GH4169 quality control sample (%)
表5 GH4169貨控樣品中鎳含量的ILC研究(%)Table 5 ILC study of nickel content in GH4169 quality control sample (%)
由表2~表5的統(tǒng)計結果可以看出,在最后保留的數據中,雖有個別實驗室的 h值或 k值超出其臨界值,如表3中h(j=3)=1.81>+1.798,k(j=10)=1.73>1.573,但 h(j)值與臨界值極為接近,k(j)只是略高于其臨界值,分析認為是隨機誤差所致,在統(tǒng)計時應予以保留。
另外,通過以上分析可以看出:1)與其它實驗室相比,4#實驗室的準確度和精密度均較差;2)1#實驗室的準確度稍差;3)7#實驗室和 10#實驗室的精密度稍差。這就要求相關實驗室需對其實驗過程進行質量自查和原因分析,在確保檢測數據真實和可靠的同時,進一步提高實驗室檢測水準。
總得來說,由該研究總院組織的ILC研究基本成功,除了②號樣品賦值與各實驗室的平均值差異較大外,其它3組的賦值都比較合理。
該統(tǒng)計方法是對標準差的最大值進行評定,屬于單側檢驗。統(tǒng)計過程是先將實驗室結果標準差由小到大排列,然后根據標準差的最大值計算科克倫檢驗的統(tǒng)計量,見公式(13)。查閱Cochran臨界值表,通過與同一顯著水平下的臨界值進行比較,判定最大標準差是否為離群值。如果標準差的最大值是離群值,則將該值舍去后對剩余的標準差重新計算科克倫檢驗的統(tǒng)計量。
式中,Ci是i水平下科克倫檢驗的統(tǒng)計量值,sj是實驗室內標準偏差,sjmax是sj中最大值。
離群值的判定:
a)當統(tǒng)計量小于等于5%的臨界值時,認為該值是正常值;
b)當統(tǒng)計量大于5%的臨界值且小于等于1%的臨界值時,該值為可疑值;
c)當統(tǒng)計量大于1%的臨界值時,認為該值是離群值。
應用科克倫檢驗,對4個水平保留實驗室的方差進行統(tǒng)計運算,統(tǒng)計量C值見表6。
表6 各水平方差的科克倫檢驗Table 6 Cochran test of variance with different levels
檢驗結果表明,各水平的實驗數據無離群值和可疑值。
格拉布斯檢驗法是用于判定一組數據中最大值或最小值是否為離群值,屬于雙側檢驗。統(tǒng)計過程是先將實驗室結果由小到大排列,并得出該組數據的平均值和標準偏差然后再計算統(tǒng)計量G,見公式(14-16)。查閱Grubbs檢驗臨界表,通過與同一顯著水平下的臨界值進行比較,判定該試驗值是否離群。若數據為離群值,再對剩余數據繼續(xù)檢驗,直至數據中無離群值為止。
其中,xp是數據xi(i=1,2,…p)中的最大值,是i水平下數據平均值的標準偏差。
式中,x1為數據xi(i=1,2,…p)中的最小值,是i水平下數據平均值的標準偏差。
離群值的判定:
a)當統(tǒng)計量小于等于5%的臨界值時,認為該值是正常值;
b)當統(tǒng)計量大于5%的臨界值且小于等于1%的臨界值時,該值為可疑值;
c)當統(tǒng)計量大于1%的臨界值時,認為該值是離群值。
應用格拉布斯檢驗,對4個水平保留實驗室的x進行統(tǒng)計運算,統(tǒng)計量G值見表7。
表7 各水平平均值的格拉布斯檢驗Table 7 Grubbs test of mean with different levels
檢驗結果表明,各水平的實驗數據無離群值和可疑值。
在異常值檢驗過程中,重復使用狄克遜檢驗法的效果比格拉布斯檢驗法要優(yōu)越得多,方法有單側檢驗和雙測檢驗。本文采用雙側檢驗法,統(tǒng)計過程是先將實驗室結果由小到大排列,即x1≤x2≤...≤xmax-1≤xmax,然后再計算統(tǒng)計量 D,見公式(17-19)。查閱Dixon檢驗臨界表,通過與同一顯著水平下的臨界值進行比較,判定該試驗值是否離群。若數據為離群值,再對剩余數據繼續(xù)檢驗,直至數據中無離群值為止。
離群值的判定:
a)當統(tǒng)計量小于等于5%的臨界值時,認為該值是正常值;
b)當統(tǒng)計量大于5%的臨界值且小于等于1%的臨界值時,該值為可疑值;
c)當統(tǒng)計量大于1%的臨界值時,認為該值是離群值。
表8 各水平平均值的狄克遜檢驗Table 8 Dixon test of mean with different levels
檢驗結果表明,各水平的實驗數據無離群值和可疑值。
由此可以看出,通過以上三種離群值檢驗法,4個水平的實驗數據均無離群值和可疑值。這也說明經h/k一致性檢驗保留的實驗數據更為合理,統(tǒng)計結果可靠。
依據之前的統(tǒng)計結果,選用其中3組賦值合理的質控樣品進行偏倚不確定度評定,ub的統(tǒng)計量參見公式(20)。
其中,ub是偏倚的不確定度分量;n是樣品數;是uCref的平均值,當 ARV用中位值或穩(wěn)健平均值表示時,有用表示時,有L為參加實驗室數。通過賦值計算,得出ub=0.202%。
本實驗室選用在期間精密度條件下,GH4169質控樣品(52.27%±0.07%)在兩個月內的累積數據,按時間順序記錄,結果見表9。通過 Anderson Darling(AD)統(tǒng)計量檢驗表明(A2(s)=0.204,A2*(s)=0.211,A2(MR)=0.424,A2*(MR)=0.438),實驗室數據處于統(tǒng)計受控狀態(tài),即有uR’=sR’=0.059%。
表9 貨控樣品中鎳含量測定結果(%)Table 9 Determination results of nickel content in quality control sample (%)
已知 ub=0.202%,uR’=0.059%,進而采用公式(21)計算合成不確定度uc=0.21%。
因此在 95%概率下,GH4169質控樣品的測定結果為52.27%±0.42%,k=2。
本文首先采用曼德爾h/k統(tǒng)計分析對參與ILC的11家實驗室試驗數據的一致性進行了檢驗,對超出臨界值hCrit或kCrit的實驗數據判定其取舍。然后采用科克倫、格拉布斯和狄克遜檢驗法對各水平保留的實驗數據進行了離群值檢驗,檢驗結果表明經h/k一致性檢驗所保留的實驗數據更為合理,統(tǒng)計結果可靠。最后利用賦值合理的 3個水平的實驗數據和本實驗室期間精密度條件下的質控數據,分別計算偏倚ub和不精密度uR’兩者帶來的累積效應,以作為不確定度的估計量進行評定。此外,為了使ub的評定結果更加準確,在以后的分析中應盡可能加大各水平間的梯度值,且在兼顧風險和成本的前提下,應盡可能增大樣本容量,以給出更為合理的不確定度估計量。
[1]徐本平.精密度試驗中的數據處理[J].冶金分析,2013,33(11): 74-80.
[2]裴文,田洪祥,劉瑜,等.發(fā)射光譜儀檢測油料的精密度[J].光譜實驗室,2011,28(4): 597-1602.
[3]黃文通,吳卓成.瀝青混合料比對實驗一致性分析[J].石油瀝青,2008,22(5): 56-58.
[4]馮俊杰,齊小勇.車載式路面激光平整度儀實驗室間比對結果分析[J].公路交通科技:應用技術版,2013,07: 20-23.
[5]符穎操,羅茜.實驗室間比對結果分析統(tǒng)計方法的探討[J].理化檢驗:物理分冊,2006,42(6): 295-299.
[6]陸娟.一次實驗室間比對試驗結果分析[J].現代預防醫(yī)學,2013,40(14): 2700-2702.
[7]陳東,蔡健.海洋環(huán)境監(jiān)測實驗室間比對試驗結果分析評價[J].化學分析計量,2012,21(5): 79-81.
[8]王承忠.實驗室間比對的能力驗證及應用實例[J].理化檢驗:物理分冊,2009,45(7): 423-430.
[9]Hayes K,Kinsella A,Coffey N. A note on the use of outlier criteria in Ontario laboratory quality control schemes [J]. Clinical Biochemistry,2007,40(3-4): 147-152.
[10]International organization for standardization. ISO 11352: 2012(E)Water quality-Estimation of measurement uncertainty based on validation and quality control data [S]. Published in Switzerland,2012.
[11]中國合格評定國家認可委員會.CNAS-GL34: 2013基于質控數據環(huán)境檢測測量不確定度評定指南[S].北京:國家認證認可監(jiān)督管理委員會,2013.
[12]Magnusson B,Naykki T,Hovind H,et al. Handbook for calculation of measurement uncertainty in environmental laboratories [S]. Nordtest,NT Technical Report 537,NT Progect No. 1589-02,Espoo,Edition2,2004-02.
[13]冶金工業(yè)部鋼鐵研究總院,上海鋼鐵研究所. GB/T 223.25-1994 鋼鐵及合金化學分析方法 丁二酮肟重量法測定鎳量[S].北京:中國標準出版社,1994.
[14]中國航空工業(yè)第一集團公司北京航空材料研究院,哈爾濱東安發(fā)動機(集團)有限公司,西安航空發(fā)動機公司,沈陽黎明發(fā)動機制造公司. HB 5220.23-2008 高溫合金化學分析方法 第 23部分: 丁二酮肟沉淀-EDTA容量法測定鎳含量[S].北京:中國航空綜合技術研究所,2008.
[15]鄧勃.分析測試數據的統(tǒng)計處理方法[M].北京:清華大學出版社,1995.
Data Processing of Inter-laboratory Comparison Results and Evaluation of Measurement Uncertainty
ZHANG Liangliang*
(AVIC Metal Test Technology Company Limited,Shanxi Xi'an,713801,China)
A study was conducted to determine the nickel content in four groups GH4169 quality control samples,and eleven accredited laboratories were organized to conduct inter-laboratory comparison (ILC) study. The data consistency and outliers were investigated with Mandel’s h/k statistic analysis,Cochran,Grubbs and Dixon test methods. In order to make the statistical results more realistic and reliable,the supercritical data that is beyond the critical value hCritor kCritshould be retained as soon as possible in the consistency test. Reservation or deletion of the supercritical data was explained. Using three levels of reasonable experimental data and quality control data under the condition of period precision calculated respectively bias uband imprecision uR’,the cumulative effect of the both was evaluated as measurement uncertainty.
Inter-laboratory comparison study (ILC); consistency test; outliers test; measurement uncertainty evaluation
O212.1
A
1672-9129(2017)06-0094-05
10.19551/j.cnki.issn1672-9129.2017.06.033
張亮亮. 實驗室間比對結果的數據處理及測量不確定度評定[J]. 數碼設計,2017,6(6): 94-98.
Cite:ZHANG Liangliang. Data Processing of Inter-laboratory Comparison Results and Evaluation of Measurement Uncertainty[J]. Peak Data Science,2017,6(6): 94-98.
2017-01-23;
2017-02-26。
張亮亮(1986-),男,陜西西安,助理工程師,碩士研究生,研究方向:化學分析。
E-mail:aconsery@sina.com