馬文麗,林立民,孫艷勤,宋曉東
(內(nèi)蒙古蒙牛乳業(yè)(集團(tuán))股份有限公司,內(nèi)蒙古 呼和浩特 011500)
數(shù)據(jù)是指對客觀事件進(jìn)行記錄并可以鑒別的符號(hào),是對客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號(hào)或這些物理符號(hào)的組合。它是可識(shí)別的、抽象的符號(hào)。利用穩(wěn)健(Robust)統(tǒng)計(jì)法、格拉布斯檢驗(yàn)法(Grubbs)、科克倫(Cochran)檢驗(yàn)法三種統(tǒng)計(jì)方法對實(shí)驗(yàn)室間比對的檢測數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)在計(jì)算過程特別是離群值判斷方面存在較大差異,現(xiàn)將三種統(tǒng)計(jì)方法進(jìn)行詳細(xì)介紹與分析,對結(jié)果進(jìn)行客觀的評價(jià)。
采用穩(wěn)健統(tǒng)計(jì)法進(jìn)行統(tǒng)計(jì)分析的前提是假設(shè)分析的結(jié)果服從正態(tài)分布。在開始進(jìn)行統(tǒng)計(jì)分析之前,應(yīng)確保所采集的數(shù)據(jù)是正確、合理的,并對數(shù)據(jù)中的粗大誤差和潛在問題進(jìn)行識(shí)別。通常在數(shù)據(jù)統(tǒng)計(jì)過程中需要統(tǒng)計(jì)結(jié)果數(shù)、中位值、標(biāo)準(zhǔn)四分位間距(標(biāo)準(zhǔn)化IQR)、穩(wěn)健CV、最小值、最大值和極差七種統(tǒng)計(jì)量。這些統(tǒng)計(jì)量的計(jì)算是進(jìn)行實(shí)驗(yàn)室結(jié)果統(tǒng)計(jì)評價(jià)的基礎(chǔ)。其中最重要的統(tǒng)計(jì)量是中位值和標(biāo)準(zhǔn)化IQR,它們是數(shù)據(jù)集中和分散的量度,屬于穩(wěn)健統(tǒng)計(jì)量,不受數(shù)據(jù)中離群值的影響。
對實(shí)驗(yàn)室檢測結(jié)果應(yīng)使用基于穩(wěn)健總計(jì)統(tǒng)計(jì)量的Z比分?jǐn)?shù)(中位值和標(biāo)準(zhǔn)化IQR)進(jìn)行評價(jià)。對于分割水平對樣品a和樣品b應(yīng)統(tǒng)計(jì)計(jì)算兩個(gè)Z比分?jǐn)?shù)——實(shí)驗(yàn)室間Z比分?jǐn)?shù)(ZB)和實(shí)驗(yàn)室內(nèi)Z比分?jǐn)?shù)(ZW)。它們分別基于結(jié)果對的標(biāo)準(zhǔn)化和(S)和標(biāo)準(zhǔn)化差(D)來進(jìn)行計(jì)算,標(biāo)準(zhǔn)化和(S)和標(biāo)準(zhǔn)化差(D)的計(jì)算公式如下:
(1)
(2)
通過計(jì)算各實(shí)驗(yàn)室的標(biāo)準(zhǔn)化和(S)和標(biāo)準(zhǔn)化差(D),可統(tǒng)計(jì)出所有參加實(shí)驗(yàn)室的S和D的中位值和標(biāo)準(zhǔn)化IQR,再根據(jù)公式(3)和公式(4)計(jì)算實(shí)驗(yàn)室間Z比分?jǐn)?shù)(ZB)和實(shí)驗(yàn)室內(nèi)Z比分?jǐn)?shù)(ZW)。
(3)
(4)
實(shí)驗(yàn)室結(jié)果依據(jù)Z比分?jǐn)?shù)(包括ZB和ZW)進(jìn)行評定。|Z|≥3的結(jié)果為離群值,2<|Z|<3時(shí)為可疑值。正的實(shí)驗(yàn)室間離群(即ZB≥3)表明該樣品對的兩個(gè)結(jié)果太高,負(fù)的實(shí)驗(yàn)室間離群值(即ZB≤-3)表明其結(jié)果太低,而實(shí)驗(yàn)室內(nèi)離群值則表明其兩個(gè)結(jié)果間的差值太大。
科克倫檢驗(yàn)法應(yīng)用于所有標(biāo)準(zhǔn)差都是在重復(fù)性條件下,且由相同數(shù)目(n)的測試結(jié)果計(jì)算得出的情形。實(shí)際中由于數(shù)據(jù)的缺失或剔除,測試結(jié)果數(shù)可能不同。所以假定在正常組織的試驗(yàn)中,每個(gè)實(shí)驗(yàn)室的測試結(jié)果數(shù)目不同所造成的影響是有限且可以忽略的,科克倫檢驗(yàn)中所用的n可取多數(shù)實(shí)驗(yàn)室的測試結(jié)果數(shù)。
該統(tǒng)計(jì)方法是對標(biāo)準(zhǔn)差的最大值進(jìn)行評定,屬于單側(cè)檢驗(yàn)。統(tǒng)計(jì)過程為先將全組實(shí)驗(yàn)室檢測結(jié)果標(biāo)準(zhǔn)差從小到大排列,然后根據(jù)標(biāo)準(zhǔn)差的最大值計(jì)算科克倫檢驗(yàn)的統(tǒng)計(jì)量,見公式(5)。查閱科克倫檢驗(yàn)臨界值表,通過比較相同顯著水平下的臨界值來判定該最大標(biāo)準(zhǔn)差是否為離群值。如果標(biāo)準(zhǔn)差的最大值是離群值,則將該值舍去后對剩余的標(biāo)準(zhǔn)差重新計(jì)算科克倫檢驗(yàn)的統(tǒng)計(jì)量。
(5)
式中,si為實(shí)驗(yàn)室的標(biāo)準(zhǔn)差,smax是si中最大值。
離群值的判斷:
(a)當(dāng)統(tǒng)計(jì)量小于等于5%的臨界值時(shí),認(rèn)為該值是正常值。(b)當(dāng)統(tǒng)計(jì)量大于5%的臨界值且小于等于1%的臨界值時(shí),該值為可疑值。(c)當(dāng)統(tǒng)計(jì)量大于1%臨界值時(shí),認(rèn)為該值是統(tǒng)計(jì)離群值。
格拉布斯檢驗(yàn)法適用于判定一組檢測結(jié)果中最大值或最小值是否為離群值,此方法通過計(jì)算平均值和標(biāo)準(zhǔn)偏差(s)然后再計(jì)算統(tǒng)計(jì)量(G),見公式(6)、公式(7)。通過查閱Grubbs檢驗(yàn)臨界值表獲得一定顯著性水平(α)下的臨界值,比較統(tǒng)計(jì)量(G)與查到的臨界值。當(dāng)統(tǒng)計(jì)量(G)大于臨界值時(shí),此數(shù)據(jù)即為離群值,并對剩余數(shù)據(jù)繼續(xù)檢驗(yàn),直到數(shù)據(jù)中無異常值為止。
Grubbs檢驗(yàn)的統(tǒng)計(jì)量計(jì)算公式為:
(6)
最小值x1的統(tǒng)計(jì)量計(jì)算公式為:
(7)
式中,x1為一系列數(shù)據(jù)xi(i=1,2,…,p)中的最小值。
離群值的判斷:
(a)當(dāng)統(tǒng)計(jì)量小于等于5%的臨界值時(shí),認(rèn)為該值是正常值。(b)當(dāng)統(tǒng)計(jì)量大于5%的臨界值且小于等于1%的臨界值時(shí),該值為可疑值。(c)當(dāng)統(tǒng)計(jì)量大于1%臨界值時(shí),認(rèn)為該值是統(tǒng)計(jì)離群值。
樣品檢測結(jié)果見表1。
表1 實(shí)驗(yàn)室間比對結(jié)果
本次牛奶中營養(yǎng)元素指標(biāo)實(shí)驗(yàn)室間比對采用“分割水平”的樣品設(shè)計(jì),脂肪的樣品分為A、B兩組,蛋白質(zhì)的樣品分為C、D兩組。在對實(shí)驗(yàn)室檢測能力進(jìn)行評定時(shí),不出具“合格”與否的結(jié)論,而是使用“滿意”、“可疑”或“離群”的概念。如果一個(gè)結(jié)果被評定為離群值,這意味著從統(tǒng)計(jì)上看它明顯地不同于同組的其他結(jié)果。
用穩(wěn)健統(tǒng)計(jì)法計(jì)算各參加實(shí)驗(yàn)室的實(shí)驗(yàn)室間Z值(ZB)和實(shí)驗(yàn)室內(nèi)Z值(ZW)。通過對檢測結(jié)果進(jìn)行統(tǒng)計(jì)分析,本次脂肪檢測項(xiàng)目發(fā)現(xiàn)實(shí)驗(yàn)室間離群4家,實(shí)驗(yàn)室間可疑0家,實(shí)驗(yàn)室內(nèi)離群4家,實(shí)驗(yàn)室內(nèi)可疑0家;對于蛋白質(zhì)檢測項(xiàng)目,此次有實(shí)驗(yàn)室間離群4家,實(shí)驗(yàn)室間可疑1家,實(shí)驗(yàn)室內(nèi)離群0家,實(shí)驗(yàn)室內(nèi)可疑4家。將實(shí)驗(yàn)室Z值(ZB和ZW)合并統(tǒng)計(jì),本次脂肪項(xiàng)目共有91.11%的實(shí)驗(yàn)室結(jié)果滿意,8.99%的實(shí)驗(yàn)室離群;蛋白質(zhì)項(xiàng)目共有90%的實(shí)驗(yàn)室結(jié)果滿意,5.56%的實(shí)驗(yàn)室可疑,4.44%的實(shí)驗(yàn)室離群。具體穩(wěn)健統(tǒng)計(jì)如表2。
表2 實(shí)驗(yàn)室間比對穩(wěn)健統(tǒng)計(jì)結(jié)果
由統(tǒng)計(jì)數(shù)據(jù)可見,實(shí)驗(yàn)室內(nèi)的離群與可疑明顯多于實(shí)驗(yàn)室間離群與可疑,說明實(shí)驗(yàn)室內(nèi)部檢測過程中的隨機(jī)誤差比較多,而實(shí)驗(yàn)室間的系統(tǒng)誤差要少一些。
用科克倫檢驗(yàn)法進(jìn)行數(shù)據(jù)統(tǒng)計(jì)時(shí),需要計(jì)算統(tǒng)計(jì)量C,再與臨界值進(jìn)行比較判定離群值。科克倫檢驗(yàn)法是對檢測結(jié)果的標(biāo)準(zhǔn)偏差進(jìn)行統(tǒng)計(jì)以剔除離群值。經(jīng)過統(tǒng)計(jì)計(jì)算,本次實(shí)驗(yàn)室比對活動(dòng)中,樣品A、樣品B、樣品C、樣品D均無可疑值和離群值。
表3 實(shí)驗(yàn)室間比對柯克倫檢驗(yàn)統(tǒng)計(jì)結(jié)果
根據(jù)科克倫統(tǒng)計(jì)原理,采用此方法時(shí),參與實(shí)驗(yàn)室數(shù)量越多,其對應(yīng)的臨界值越小,即要求標(biāo)準(zhǔn)偏差的離散程度要小。參與實(shí)驗(yàn)室數(shù)量少時(shí),對應(yīng)的臨界值大,那么對于數(shù)據(jù)標(biāo)準(zhǔn)偏差離散程度的要求就不是那么嚴(yán)格。因此,在此次實(shí)驗(yàn)室間比對活動(dòng)參與實(shí)驗(yàn)室較多,而數(shù)據(jù)的離散程度偏大的情況下,科克倫檢驗(yàn)法評定剔除的離群值相對較多。
在此次實(shí)驗(yàn)室間比對中,對同一種樣品的檢測結(jié)果呈兩端離散的形式,所以在采用格拉布斯檢驗(yàn)法進(jìn)行數(shù)據(jù)統(tǒng)計(jì)時(shí),需要同時(shí)對最大值和最小值計(jì)算統(tǒng)計(jì)量Gp和G1,再與臨界值G(α)比較。如果Gp>G1且Gp>G(α),則評定最大值為離群值;如果G1>Gp且G1>G(α),則評定最小值為離群值。對于樣品A,計(jì)算發(fā)現(xiàn)離群值1個(gè);對于樣品B,計(jì)算發(fā)現(xiàn)可疑值1個(gè),離群值2個(gè);對于樣品C,計(jì)算發(fā)現(xiàn)離群值2個(gè);對于樣品D,計(jì)算發(fā)現(xiàn)離群值1個(gè)。
格拉布斯檢驗(yàn)法是對實(shí)驗(yàn)室檢測結(jié)果的平均值進(jìn)行統(tǒng)計(jì),從而剔除離群值。在數(shù)據(jù)量較少時(shí),其對應(yīng)的臨界值越小,那么剔除離群值的概率就較大。在數(shù)據(jù)量較大時(shí),其對應(yīng)的臨界值越大,那么剔除離群值的概率就較低。
對于本次實(shí)驗(yàn)室間比對樣品的參考值,不同的統(tǒng)計(jì)方法依據(jù)不同的統(tǒng)計(jì)量來反映。穩(wěn)健統(tǒng)計(jì)法采用中位值反映樣品的參考值,而科克倫檢驗(yàn)與格拉布斯檢驗(yàn)則采用總平均值。總平均值并不是對一組數(shù)據(jù)計(jì)算其平均值得到的,而是首先通過科克倫檢驗(yàn)法對標(biāo)準(zhǔn)偏差進(jìn)行評價(jià)剔除離群值,然后通過格拉布斯檢驗(yàn)法剔除平均值的離群值,之后再對剩余的數(shù)據(jù)計(jì)算平均值即為總平均值。
表4 實(shí)驗(yàn)室間比對格拉布斯統(tǒng)計(jì)結(jié)果
通過對本次實(shí)驗(yàn)室間比對數(shù)據(jù)的計(jì)算,得到的參考值與離群情況見表5、表6。
表5 實(shí)驗(yàn)室間比對參考值比較
表6 實(shí)驗(yàn)室間比對結(jié)果統(tǒng)計(jì)
由表5、表6可以看出,雖然通過穩(wěn)健統(tǒng)計(jì)法判定出的可疑值與離群值數(shù)量與通過科克倫檢驗(yàn)法和格拉布斯檢驗(yàn)法剔除的可疑值與離群值數(shù)量有較大的差別,但是兩種統(tǒng)計(jì)方法計(jì)算的樣品參考值是很接近的。由此可以看出,穩(wěn)健統(tǒng)計(jì)法和由科克倫檢驗(yàn)法與格拉布斯檢驗(yàn)法組合檢驗(yàn)這兩種檢驗(yàn)方法的統(tǒng)計(jì)參數(shù)受極端值的影響都不大。
通過對此次實(shí)驗(yàn)室間比對數(shù)據(jù)的分析統(tǒng)計(jì),可以看出,穩(wěn)健統(tǒng)計(jì)法不受數(shù)據(jù)量多少的影響,而且受極端值的影響也不大。由科克倫檢驗(yàn)法與格拉布斯檢驗(yàn)法組合檢驗(yàn)的統(tǒng)計(jì)方法,受數(shù)據(jù)量多少的影響較大,而受極端值的影響較小。不過兩種統(tǒng)計(jì)方法相比較,穩(wěn)健統(tǒng)計(jì)法在數(shù)據(jù)處理和計(jì)算程序上更加科學(xué)、直觀和簡潔方便。