陳凌峰
(北京理工大學(xué) 光電學(xué)院,北京 100081)
分析實驗室通常不可能對全部材料做檢測,所以測量過程幾乎總是涉及到抽樣。由于測量值一般定義為抽樣目標(biāo)(sampling target)中的分析物濃度,并不僅僅是實驗室樣本,所以與抽樣相關(guān)的不確定性必然會導(dǎo)致最終測量結(jié)果的不確定度。
傳統(tǒng)上,分析人員主要關(guān)心在實驗室內(nèi)進(jìn)行的測量,而抽樣經(jīng)常是由不同人員實施的,分析人員對抽樣過程的了解非常有限。這就帶來一個嚴(yán)重問題:當(dāng)測量結(jié)果的最終用戶見到以“x±U”給出的測量結(jié)果時,會非常自然地將該區(qū)間解釋為抽樣目標(biāo)的濃度范圍。其中隱含的觀點(diǎn)是,被測量是“一批材料中的分析物濃度”,其中必然包括了批次中的非均勻性。但是分析人員則可能解釋為“實驗室樣本中的分析物濃度”,隱含排除了實驗室樣本之間的差異。顯然,前一個觀點(diǎn)包含抽樣的影響,而后一個觀點(diǎn)則不是,2種觀點(diǎn)對不確定度的影響當(dāng)然是非常可觀的。
已經(jīng)越來越明顯的是,抽樣是不確定度的重要來源,和分析測試一樣需要謹(jǐn)慎的對待和控制[1]。因此新版ISO 17025-2017《檢測和校準(zhǔn)實驗室能力認(rèn)可準(zhǔn)則》的7.6.1條明確要求:“實驗室應(yīng)識別測量不確定度的貢獻(xiàn)。評定測量不確定度時,應(yīng)采用適當(dāng)?shù)姆治龇椒紤]所有顯著貢獻(xiàn),包括來自抽樣的貢獻(xiàn)”[2]。
對抽樣檢驗來說,測量不確定度導(dǎo)致對整批產(chǎn)品的誤判風(fēng)險[3]。如果沒有考慮抽樣影響而低估了測量不確定度,就可能做出錯誤的決定,從而引起巨大的財務(wù)負(fù)擔(dān)。而分析過程貢獻(xiàn)的不確定度是否可以接受,也取決于對分析之外其他因素所導(dǎo)致的不確定度是否了解。因此必須使用有效的方法來評估測量過程所有環(huán)節(jié)的不確定度。更明確地說,如果知道抽樣方差或分析方差占總方差的百分比,就能做成本效益分析,從而優(yōu)化抽樣過程和分析過程中的相關(guān)工作。
由EURACHEM(歐洲化學(xué)分析協(xié)會)與CITAC(分析化學(xué)國際可追溯性合作組織)聯(lián)合發(fā)布的指南文件《分析測量中不確定度的量化》[4]詳細(xì)介紹了化學(xué)分析中不確定度的評估方法,該指南文件在國內(nèi)的引入和應(yīng)用較早[5]。但從公開發(fā)表的文獻(xiàn)來看,EURACHEM和CITAC聯(lián)合發(fā)布的另一份指南文件《抽樣導(dǎo)致的測量不確定度:方法和處理指南》[6](以下簡稱《指南》)在國內(nèi)則幾乎沒有相關(guān)研究。本文將在介紹《指南》基本原理和基本方法的基礎(chǔ)上,用實例說明如何評估抽樣和樣品制備過程所引入的不確定度。
顯然,抽樣目標(biāo)內(nèi)的不均勻性會引起測量不確定度。如果測試樣品只有幾微克,那么幾乎所有的材料都是不均勻的,不均勻性通過抽樣給測量結(jié)果帶入了不確定性。IUPAC(國際理論與應(yīng)用化學(xué)聯(lián)合會)認(rèn)為:“異質(zhì)性(不均勻)程度是抽樣誤差的決定性因素”[7]。不均勻性可以通過單獨(dú)的實驗進(jìn)行量化或評估[8,9],但是如果估計較大抽樣目標(biāo)中的分析物濃度,那么不均勻性只是抽樣不確定度的一個來源。
抽樣一般遵從事先制定好的抽樣方案,但抽樣方案從來都不是完備的,因為無法窮盡抽樣人員面對真實世界每一種情況所采取的行動。例如,沒有精確指定抽樣位置或時間(精確到毫米或秒),抽樣人員自行做出的選擇會影響最后估計的濃度。
圖1顯示了一個典型的測量過程[6],從開始抽樣到分析完成,每一步都會對測量不確定度產(chǎn)生影響(虛線框所示的制樣步驟雖然發(fā)生在實驗室內(nèi),但通常被認(rèn)為是分析過程的一部分)。
圖1 典型的測量過程Fig.1 Schematic diagram of the typical measurement process
抽樣和樣品制備過程中,每個環(huán)節(jié)都可能引入一些誤差,例如分析物損失、微粒損失、設(shè)備污染或以前樣品污染等。認(rèn)識這些不確定度來源對設(shè)計和評估抽樣不確定度非常重要??赡艿牟淮_定度來源列舉如下。
1) 抽樣中的一些不確定度來源:
異質(zhì)性(或不均勻性);
具體抽樣方案的影響(例如,隨機(jī)抽樣,分層隨機(jī)抽樣,比例抽樣等);
樣品批的介質(zhì)運(yùn)動影響(特別是密度選擇);
樣品批的物理狀態(tài)(固體,液體,氣體);
溫度和壓力影響;
抽樣過程對組分的影響(例如抽樣系統(tǒng)的吸附不同);
樣品的運(yùn)輸和保存。
2) 樣品制備中的一些不確定度來源:
均化和/或二次抽樣影響;
干燥;
研磨;
溶解;
萃取;
污染;
衍生化學(xué)(化學(xué)效應(yīng));
稀釋誤差;
(預(yù))濃縮;
形態(tài)影響控制。
《指南》介紹了2種方法來評估抽樣引起的測量不確定度。經(jīng)驗方法使用不同條件下的重復(fù)抽樣和分析,來量化由于樣本均勻性或抽樣實施中的變動性帶來的影響。建模方法使用預(yù)定義模型來識別和評估每個不確定度分量,然后合成得到總體估計[10]。這兩種方法并不互斥,建模方法中觀察到的重復(fù)性或精度估計通常被視為對不確定度的單獨(dú)貢獻(xiàn)。經(jīng)驗方法可以估計一個或多個效應(yīng)對不確定度的貢獻(xiàn),而不必了解單獨(dú)的不確定度來源。在評估重復(fù)性之前,通常至少檢查個體效應(yīng)的顯著性或進(jìn)行量化。經(jīng)驗方法具有對抽樣對象的最廣泛適用性(不論氣體,液體和固體),建模方法則適用于特定抽樣對象(例如顆粒固體材料),必要時,可以同時用于同一個測量系統(tǒng)。
《指南》重點(diǎn)介紹的是經(jīng)驗方法。該方法將不確定度來源分為隨機(jī)影響(精密度)和系統(tǒng)影響(偏倚),將測量分為抽樣過程和分析過程。于是就有了如表1所示的4種效應(yīng)分類:抽樣精度(抽樣中的隨機(jī)效應(yīng))、分析精度(分析中的隨機(jī)效應(yīng))、分析偏倚(分析中的系統(tǒng)效應(yīng))、抽樣偏倚(抽樣中的系統(tǒng)效應(yīng))。抽樣精度和分析精度可以通過一定數(shù)量的重復(fù)抽樣和重復(fù)分析來分別估計。分析偏倚可以通過測量良好匹配的有證標(biāo)準(zhǔn)物質(zhì)的偏差來估計,或者從分析方法的驗證過程得到。抽樣偏倚的評估方法包括使用參考抽樣目標(biāo)[11],或者使用多個抽樣者、多種抽樣方案、組織間抽樣試驗數(shù)據(jù)等。抽樣偏倚可能難以估計,但如果有充分的證據(jù)表明抽樣的系統(tǒng)效應(yīng)很小并且控制良好,則實際處理中可以忽略。這種證據(jù)可以是定性的,例如對抽樣目標(biāo)的物理或化學(xué)性質(zhì)的認(rèn)識,也可以是定量的,例如來自先前完整批次的測量信息。EURACHEM認(rèn)為,隨機(jī)抽樣通常導(dǎo)致零偏倚,但有必要檢查抽樣確實是隨機(jī)的。
表1 經(jīng)驗方法中的不確定度貢獻(xiàn)Tab.1 Uncertainty contributions in the empirical approach
經(jīng)驗方法通過重復(fù)實驗來進(jìn)行,由單個抽樣者按特定抽樣方案采集重復(fù)樣本。為使估計的抽樣不確定度有足夠的準(zhǔn)確度,《指南》推薦采集抽樣總體的10%,且不少于8個抽樣目標(biāo)[12]。如果只有一個抽樣目標(biāo),則可以從中獲取所有8個副本,但估計的不確定度只適用于該抽樣目標(biāo)。重復(fù)樣本之間的變化反映了抽樣方案的模糊性以及分析物的小規(guī)模異質(zhì)性對實施該抽樣方案的影響。兩個樣本都經(jīng)過物理制備,各產(chǎn)生兩個單獨(dú)的測試樣品,并做重復(fù)分析,如圖2所示。這種重復(fù)抽樣和重復(fù)分析系統(tǒng)被稱為“平衡型實驗設(shè)計”。
圖2 平衡型實驗設(shè)計示意圖Fig.2 Diagram of the balanced design
《指南》將測量過程視為包含抽樣和分析過程的整體,并假定樣本是有代表性的和無偏的,而方差成分是由模型預(yù)測的。單次分析物濃度測量結(jié)果x的隨機(jī)效應(yīng)模型為:
x=Xtrue+εtarget+εsamp+εanal
(1)
本實例來自于《指南》的附錄A1:溫室種植生菜中的硝酸鹽含量測定。硝酸鹽對植物健康至關(guān)重要,但攝入過多會危害人體健康,因此歐盟要求定期監(jiān)測生菜中的硝酸鹽含量是否超出規(guī)定的閾值 4 500 mg/kg。
抽樣目標(biāo)是以“灣”(Bay)為單位的生菜(超2萬株),需要估計測量不確定度以及來自抽樣和分析的貢獻(xiàn)。使用的抽樣方案如下:不論數(shù)量大小,對每灣生菜皆按“W”型設(shè)計來選擇、收割10株構(gòu)成一個復(fù)合樣本。
使用上述抽樣方案,由單個抽樣人員對每灣生菜(單個抽樣目標(biāo))沿“W”線條采集10株得到復(fù)合樣本S1,然后重復(fù)采集10株得到復(fù)合樣本S2?!癢”線條可能從左邊或右邊開始,其朝向也完全取決于抽樣人員的個人決定,如圖3所示,所以重復(fù)樣本中包含了由于抽樣方案不明確而帶來的分散性。為有效評估抽樣不確定度,最少需要采集8個抽樣目標(biāo)的樣本。樣本在早上采集,24 h內(nèi)用冰盒運(yùn)輸?shù)椒治鰧嶒炇摇?/p>
圖3 重復(fù)抽樣示例Fig.3 Example of the duplicate sampling
實驗室收到原始樣本后做冷藏,每個復(fù)合樣本(10株生菜)中的每一株被切成相等的4份,保留2份。將20份生菜放入粉碎器處理得到復(fù)合樣品。取兩個測試份樣(10克),用熱水萃取后,用高效液相色譜儀測定硝酸鹽濃度。對質(zhì)控樣品(驗證回收率)和實際樣品同時進(jìn)行分析,沒有檢測到明顯的分析偏倚,因此不必對分析結(jié)果做校正。
表2列出了所有8個抽樣目標(biāo)的硝酸鹽濃度最佳估計值,其中重復(fù)樣品標(biāo)記為S1和S2,重復(fù)分析標(biāo)記為A1和A2。
表2 硝酸鹽濃度測量結(jié)果Tab.2 Measurements of the concentration of nitrate in eight duplicated samples mg/kg
為方便說明方差分析過程,對表2中的數(shù)據(jù)重新標(biāo)注,如表3所示。
表3 平衡型實驗設(shè)計的數(shù)據(jù)處理Tab.3 The data process in the balanced design
表3中,xi11代表對第i個抽樣目標(biāo)的第1個樣本的第1次測量結(jié)果(S1A1),xi22代表對第i個抽樣目標(biāo)的第2個樣本的第2次測量結(jié)果(S2A2),依此類推。
第i個抽樣目標(biāo)的第1個樣本的測量平均值:
第i個抽樣目標(biāo)的第2個樣本的測量平均值:
第i個抽樣目標(biāo)的2個樣本的平均值:
全部抽樣目標(biāo)的總平均值:
分析方差可計算為:
Vanal=SSanal/dfanal=21 957.50,
于是化學(xué)分析所引入的標(biāo)準(zhǔn)不確定度取為:
抽樣方差可計算為
Vsamp=SSsamp/dfsamp-Vanal/2=268 490.69,
于是抽樣所引入的標(biāo)準(zhǔn)不確定度取為:
抽樣目標(biāo)間的方差可計算為:
于是抽樣目標(biāo)之間變動性所引入的標(biāo)準(zhǔn)不確定度取為:
由式(1),測量結(jié)果的標(biāo)準(zhǔn)不確定度可估計為:
相對擴(kuò)展不確定度可計算為:
Urel_meas=538.93/4 345.6×200%=24.8%, (k=2)
抽樣帶入的相對擴(kuò)展不確定度(隨機(jī)部分)為:
Urel_samp=518.16/4 345.6×200%=23.8%, (k=2)
分析帶入的相對擴(kuò)展不確定度(隨機(jī)部分)為:
Urel_anal=148.18/4 345.6×200%=6.8%, (k=2)
可見,本例中分析導(dǎo)致的相對擴(kuò)展不確定度小于實驗室內(nèi)部的常規(guī)控制限(10%),但抽樣不確定度已經(jīng)遠(yuǎn)遠(yuǎn)超過分析不確定度,占測量不確定度的96%。因回收率分析相對100%并無顯著性差異,即未發(fā)現(xiàn)分析偏倚,對本例來說,不用對測量不確定度關(guān)聯(lián)分析偏倚。同樣,該不確定度估計沒有包含可能的抽樣偏倚。
每個測量結(jié)果應(yīng)當(dāng)按硝酸鹽濃度的24.8%計算和報告測量不確定度。表4列出了樣品S1A1的硝酸鹽濃度以及相關(guān)的測量不確定度,其中抽樣目標(biāo)6的樣品S1A1的硝酸鹽含量大約以95%的置信概率位于3 897 mg/kg和6 467 mg/kg之間。如需基于測量結(jié)果和相關(guān)不確定度來判斷是否超出規(guī)定的閾值,則取決于相關(guān)規(guī)范的要求。
表4 樣品S1A1的硝酸鹽濃度及測量不確定度Tab.4 The nitrate concentrations and associated measurement uncertainties of the sample S1A1 mg/kg
需強(qiáng)調(diào)的是,《指南》評估的是單次測量結(jié)果的不確定度。本例中的復(fù)合樣本皆來自于單個抽樣目標(biāo)中若干增量樣本的組合,單次測量結(jié)果用作分析物平均濃度的估計值。需要區(qū)別的是:如果從抽樣目標(biāo)中抽取若干獨(dú)立樣本,逐個分析后計算平均值,該平均值也是分析物平均濃度的估計值,但與其相關(guān)聯(lián)的不確定度則是平均值的不確定度,隨抽取樣本數(shù)量的增加而減少。
無論采用任何特定的抽樣方案來降低異質(zhì)性的影響,抽樣目標(biāo)內(nèi)的異質(zhì)性只是最終測量不確定度的一個來源。《指南》介紹的方法可以幫助我們量化測量不確定度中的抽樣來源和分析來源,以及各自所占比例,但《指南》本身并不推薦優(yōu)化的抽樣方案。
抽樣可以產(chǎn)生很大的不確定度,在本文的實例中,抽樣帶入的相對擴(kuò)展不確定度達(dá)23.8%,而在《指南》的部分實例中則高達(dá)測量濃度的80%。這說明如果需要減少測量不確定度以達(dá)到測量目的,需要增加抽樣而不是分析的支出。簡單將公認(rèn)的測量方案應(yīng)用于高異質(zhì)性的材料,即使在程序上是正確的,也無法得到理想的結(jié)果。抽樣帶來的高不確定性將導(dǎo)致基于測量結(jié)果的決策變得不可靠,是否能夠接受則取決于對適用性的嚴(yán)格評估。
需要注意的是,通常假設(shè)對化學(xué)分析的不確定度評估自然適用于后續(xù)批次。但對一批材料的某種抽樣方案的不確定度評估不能假定自然適用于后續(xù)批次。因為隨抽樣目標(biāo)的不同,異質(zhì)程度可能已經(jīng)大幅改變,需要對抽樣質(zhì)量的關(guān)鍵參數(shù)進(jìn)行監(jiān)測,以便檢查和更新對后續(xù)批次的抽樣不確定度評估。
雖然《指南》中的實例都是化學(xué)分析,但是抽樣不確定度評定的基本原理是通用的,其評定方法為所有涉及抽樣的測量領(lǐng)域提供了參考。