周月蘭,蘇武錦(廣西壯族自治區(qū)南寧市中心血站 530003)
?
漢佩爾辨識(shí)法在酶聯(lián)免疫吸附試驗(yàn)室內(nèi)質(zhì)控中的應(yīng)用
周月蘭,蘇武錦(廣西壯族自治區(qū)南寧市中心血站 530003)
目的 探討漢佩爾辨識(shí)法(Hampel identifier)在室內(nèi)質(zhì)控圖中的應(yīng)用,評(píng)估其對(duì)質(zhì)控離群值的檢出能力。方法 使用弱陽(yáng)性HIV質(zhì)控品和常規(guī)標(biāo)本一起檢測(cè),連續(xù)測(cè)定20次,收集原始數(shù)據(jù),并在其基礎(chǔ)上衍生模擬數(shù)據(jù);然后對(duì)原始數(shù)據(jù)和模擬數(shù)據(jù)進(jìn)行分析并繪制Z-分?jǐn)?shù)圖、Hampel identifier (Zi-分?jǐn)?shù)圖)與箱式圖,比較3種質(zhì)控圖對(duì)離群值的檢出能力。結(jié)果 對(duì)于非正態(tài)數(shù)據(jù),Hampel identifier與箱式圖的離群值檢出能力一致,均高于Zi-分?jǐn)?shù)圖。結(jié)論 使用多種離群值檢測(cè)方法的功能、應(yīng)用條件及其限制,防止離群值的漏判。
Zi-分?jǐn)?shù); 漢佩爾辨識(shí)法; 箱式圖; 質(zhì)量控制圖; 離群值
目前,基于數(shù)據(jù)正態(tài)性分布特性的Zi-分?jǐn)?shù)圖已廣泛應(yīng)用于我國(guó)醫(yī)學(xué)實(shí)驗(yàn)室質(zhì)量控制[1-2],但實(shí)際應(yīng)用時(shí),由于受某些外源性及內(nèi)源性因素的影響,酶聯(lián)免疫吸附試驗(yàn)(ELISA)檢測(cè)的質(zhì)控?cái)?shù)據(jù)不一定完全符合正態(tài)分布,當(dāng)數(shù)據(jù)中出現(xiàn)離群值時(shí)常被忽略[3-4]。有學(xué)者認(rèn)為箱式圖對(duì)非正態(tài)分布數(shù)據(jù)離群值的檢出能力更強(qiáng)[5-6]。Wilcox[7]推薦使用漢佩爾辨識(shí)法(Hampel identifier)的質(zhì)控方法在國(guó)內(nèi)卻鮮有報(bào)道。現(xiàn)通過實(shí)例及模擬數(shù)據(jù),探討該法的應(yīng)用條件及優(yōu)缺點(diǎn),報(bào)道如下。
1.1 一般資料 弱陽(yáng)性(4 NCU/mL)HIV質(zhì)控品(北京康徹斯坦生物技術(shù)有限公司,生產(chǎn)批號(hào):201403001)及常規(guī)標(biāo)本。
1.2 儀器與試劑 全自動(dòng)酶免分析系統(tǒng)(STAR全自動(dòng)加樣器及FAME全自動(dòng)酶免分析儀);伯樂公司HIV診斷試劑盒(ELISA),是國(guó)家批準(zhǔn)檢驗(yàn)合格產(chǎn)品,于有效期內(nèi)使用。
1.3 方法
1.3.1 數(shù)據(jù)收集 每批樣品均平行檢測(cè)常規(guī)標(biāo)本、試劑盒內(nèi)陰陽(yáng)性對(duì)照品和弱陽(yáng)性質(zhì)控品(1次),并連續(xù)測(cè)定20次,收集質(zhì)控?cái)?shù)據(jù)20例(A組),同時(shí)從原始數(shù)據(jù)中衍生模擬出其他4組數(shù)據(jù):B組,懷疑存在1個(gè)高值為離群值;C組,懷疑存在1個(gè)以上的高值離群值;D組,懷疑存在1個(gè)以上的高值離群值(個(gè)別離群值很高);E組,懷疑存在1個(gè)高值和1個(gè)低值離群值。
1.3.3 數(shù)據(jù)分析 使用Z-分?jǐn)?shù)圖、Zi-分?jǐn)?shù)圖及箱式圖分別對(duì)各組數(shù)據(jù)進(jìn)行分析,比較3種質(zhì)控圖對(duì)質(zhì)控離群值的檢出能力。
1.4 統(tǒng)計(jì)學(xué)處理 采用SPSS17.0軟件計(jì)算統(tǒng)計(jì)量;夏皮洛-威爾克(Shapiro-Wilk)檢驗(yàn)進(jìn)行正態(tài)性檢驗(yàn);MedCalc11.4.2.0英文版繪制箱式圖;MicrosoftOfficeExcel2003繪制Z-分?jǐn)?shù)圖和Zi-分?jǐn)?shù)圖。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 數(shù)據(jù)統(tǒng)計(jì) 原始數(shù)據(jù)(A組)和衍生模擬數(shù)據(jù)(B、C、D、E組)經(jīng)Shapiro-Wilk正態(tài)性檢驗(yàn),均P<0.05。
2.2Z-分?jǐn)?shù)圖與Zi-分?jǐn)?shù)圖的比較A組中,例17 的Z分?jǐn)?shù)為3.03,>3,Zi分?jǐn)?shù)為3.44,>3,Z-分?jǐn)?shù)圖和Zi-分?jǐn)?shù)圖均檢出例17為離群值。B組中,計(jì)算獲得的20個(gè)Z分?jǐn)?shù)繪制成的Z-分?jǐn)?shù)圖,檢出例20(Z=3.26)為離群值,Zi-分?jǐn)?shù)圖也檢出例20(Zi=4.06)為離群值。C組中,Z-分?jǐn)?shù)圖未檢出離群值,Zi-分?jǐn)?shù)圖則檢出例17(Zi=3.53)、例20(Zi=3.98) 為離群值。D組中,Z-分?jǐn)?shù)圖僅檢出例20(Z=4.05)為離群值,Zi-分?jǐn)?shù)圖則檢出例17(Zi=3.53)、例20(Zi=15.71)為離群值。E組中,Z-分?jǐn)?shù)圖未檢出離群值,Zi-分?jǐn)?shù)圖則檢出例17(Zi=3.44)、例20(Zi=-3.23)為離群值,見圖1~5。
2.3 箱式圖分析A組中,例17為離群值。B組中,例20為離群值。C組中,例17、例20為離群值。D組中,例17為離群值、例20為極值。E組中,例17、例20為離群值。見圖6。
注:Z-分?jǐn)?shù)圖與Zi-分?jǐn)?shù)圖比較。
注:Z-分?jǐn)?shù)圖與Zi-分?jǐn)?shù)圖比較。
注:Z-分?jǐn)?shù)圖與Zi-分?jǐn)?shù)圖比較。
注:Z-分?jǐn)?shù)圖與Zi-分?jǐn)?shù)圖比較。
注:Z-分?jǐn)?shù)圖與Zi-分?jǐn)?shù)圖比較。
2.4Zi-分?jǐn)?shù)圖與箱式圖的比較 2種質(zhì)控圖檢出離群值的總數(shù)、例數(shù)相一致。
圖6 箱式圖
離群值是指樣本中的1個(gè)或幾個(gè)觀測(cè)值,離開其他觀測(cè)值較遠(yuǎn),提示其可能來(lái)自不同的總體[10]。本研究利用Z-分?jǐn)?shù)圖、Zi-分?jǐn)?shù)圖及箱式圖,分別對(duì)實(shí)例及模擬數(shù)據(jù)的離群值進(jìn)行分析,本組結(jié)果顯示:(1)當(dāng)數(shù)據(jù)中僅存在1個(gè)離群值時(shí)(A組、B組),3種方法均能檢出,但Z-分?jǐn)?shù)圖法不如Zi-分?jǐn)?shù)圖法敏感(見圖1、圖2),A組中第17個(gè)檢測(cè)值的Z分?jǐn)?shù)為3.03時(shí),Zi分?jǐn)?shù)為3.44;B組中第20個(gè)檢測(cè)值的Z分?jǐn)?shù)為3.26時(shí),Zi分?jǐn)?shù)為4.06。(2)當(dāng)數(shù)據(jù)中存在2個(gè)同一方向離群值時(shí)(C組),Zi-分?jǐn)?shù)圖、箱式圖均能檢出,而Z-分?jǐn)?shù)圖則不能(見圖3),除非存在很大的離群值時(shí)(D組),最大的數(shù)值方能被檢出(見圖4),但此時(shí)該組的CV值已高達(dá)46.48%,遠(yuǎn)大于ELISA實(shí)驗(yàn)批間差異的20%最高限。(3)當(dāng)數(shù)據(jù)中存在2個(gè)不同一方向(即一高一低)離群值時(shí)(E組),Zi-分?jǐn)?shù)圖、箱式圖均能檢出,而Z-分?jǐn)?shù)圖則不能(見圖5),但第20個(gè)檢測(cè)值(S/CO=1.07)已經(jīng)非常接近臨界值(CutOff值=1),若再小于1時(shí),表明該實(shí)驗(yàn)處于失控狀態(tài)了,而Z-分?jǐn)?shù)圖再檢出離群值也無(wú)實(shí)際意義。
Z分?jǐn)?shù),即單個(gè)觀察值減去總體均值,得到的差值除以總體標(biāo)準(zhǔn)獲得的無(wú)因次度量。其用于判斷離群值操作簡(jiǎn)便,但較適于符合正態(tài)分布的變量。ELISA受試劑、設(shè)備、溫度、操作各個(gè)環(huán)節(jié)等多種因素影響,檢測(cè)數(shù)據(jù)不一定完全符合正態(tài)分布,若出現(xiàn)離群值,其標(biāo)準(zhǔn)差變大,Z分?jǐn)?shù)相應(yīng)變小其絕對(duì)值可能會(huì)小于3,離群值出現(xiàn)漏檢。當(dāng)存在多個(gè)離群值時(shí),還會(huì)出現(xiàn)某個(gè)離群值會(huì)屏蔽另一個(gè)離群值被檢出的情況,甚至導(dǎo)致無(wú)任何離群值被檢出(見圖3~5)。
國(guó)外學(xué)者漢佩爾(Hampel)建議以中位數(shù)和中位數(shù)絕對(duì)偏差(MAD)作為位置和寬度的穩(wěn)健估計(jì),已有相關(guān)報(bào)道證明該方法的有效性[7-9]。箱式圖的箱子兩端分別是上四分位數(shù)和下四分位數(shù),中間橫線是中位數(shù),兩端連線分別是除離群值外的最小值和最大值,另外標(biāo)記的可能是離群值,其更適于非正態(tài)分布資料[9-11]。本研究結(jié)果表明,Zi-分?jǐn)?shù)圖與箱式圖對(duì)非正態(tài)資料的離群值檢出能力是一致的,兩者均高于Z-分?jǐn)?shù)圖。
本組認(rèn)為,判斷數(shù)據(jù)是否存在離群值,須考慮數(shù)據(jù)中是否存在單個(gè)或多個(gè)離群值,有些檢出離群值的方法只可用來(lái)檢出1個(gè)離群值,如Z-分?jǐn)?shù)圖。這是否可以稱之為“屏蔽效應(yīng)”,還需做進(jìn)一步研究,但目前至少可以確定某些離群值的存在會(huì)掩蓋另一個(gè)離群值的檢出,甚至導(dǎo)致所有離群值都無(wú)法被檢出的可能。因此,醫(yī)學(xué)實(shí)驗(yàn)室的管理人員,應(yīng)該掌握多種離群值檢測(cè)方法的功能、應(yīng)用條件及其限制,防止離群值的漏判。
[1]陳雪,李書平,趙欣,等.血液核酸篩查利用室內(nèi)質(zhì)控品Ct值建立質(zhì)控圖方法初探[J].中國(guó)輸血雜志,2014,27(11):1154-1155.
[2]羅偉,羅智敏,劉建兵,等.用Excel繪制兩種實(shí)驗(yàn)室常用室內(nèi)質(zhì)量控制圖方法[J].檢驗(yàn)醫(yī)學(xué)與臨床,2013,10(5):620-622.
[3]繆希莉.臨床免疫檢驗(yàn)質(zhì)量影響因素分析[J].檢驗(yàn)醫(yī)學(xué)與臨床,2014,11(3):395-397.
[4]蘇武錦,鐘周琳,邱昌文,等.四分位極差在血站ELISA質(zhì)控中的應(yīng)用研究[J].國(guó)際檢驗(yàn)醫(yī)學(xué)雜志,2014,35(6):735-737.
[5]David C,Hoaglin-Frederick M,John WT,等.探索性數(shù)據(jù)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,1998:62-101.
[6]官生平.SPC 統(tǒng)計(jì)過程管制[M].廈門:廈門大學(xué)出版社,2004:104-106.
[7]Wilcox R.Applying contemporary statistical techniques[M].Amsterdam:Academic Press,2003:55-79.
[8]Perarson RK.Outliers in process modeling and identification[J].IEEE Transactions on Control Systems Technology,2002,37(10):55-63.
[9]Liu H,Shah S,Jiang W.On-line outlier detection and data cleaning[J].Computers and Chemical Engineering,2004,67(28):1635-1647.
[10]國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局.GB/T4883-2008數(shù)據(jù)的統(tǒng)計(jì)處理和解釋正態(tài)樣本離群值的判斷和處理[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2008.
[11]孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].3版.北京:人民衛(wèi)生出版社,2010:18-19.
The application of Hampel identifier in internal quality control about ELISA
ZHOUYue-lan,SUWu-jin
(Nan-ningBloodCenter,Nanning,Guangxi530003,China)
Objective To study the value of Hampel identifier in internal quality control and to assess the detection ability of quality control outliers.Methods The weak positive quality product of HIV together with routine specimens were detected for 20 times, raw data and simulation data derived on the basis of the raw data were collected and analyzed, Z-scores figure,Hampel identifier (Zi-scores figure),box plot correspondingly were drawed,and the ability of outlier detection about the three kinds of quality control charts were compared.Results Hampel identifier was consistent with the box plot on outlier detection ability for abnormal distribution data,both were superior to Z-score chart.Conclusion Medical laboratory managers should master functions,application conditions and limitations of outlier detection methods to prevent the missing outliers.
Z-scores; Hampel identifier; box plot; quality control charts; outliers
周月蘭,女,碩士,主管技師,主要從事臨床檢驗(yàn)研究。
10.3969/j.issn.1672-9455.2015.11.024
A
1672-9455(2015)11-1555-02
2014-12-25
2015-02-10)