□ 喬新愚
工業(yè)和信息化部電子第五研究所 廣州 510610
目前,計(jì)數(shù)型測(cè)量系統(tǒng)廣泛應(yīng)用于包括汽車在內(nèi)的制造行業(yè)全數(shù)檢查場(chǎng)合,以及外觀質(zhì)量特性的檢驗(yàn)(如產(chǎn)品外殼是否劃傷、電鍍后色澤的均勻度是否滿足要求、裝配螺紋孔是否合格等)。測(cè)量系統(tǒng)分析(MSA)參考手冊(cè)(以下簡(jiǎn)稱手冊(cè))提供了一種用科恩(Cohen)的“假設(shè)檢驗(yàn)分析——交叉表法”來對(duì)這類測(cè)量系統(tǒng)進(jìn)行分析。但由于手冊(cè)有些地方表述不清甚至錯(cuò)誤(有些是翻譯錯(cuò)誤),導(dǎo)致很多從事MSA的人員非常迷惑,不知如何操作。筆者結(jié)合長(zhǎng)期從事MSA研究和實(shí)踐,對(duì)其中的主要錯(cuò)誤進(jìn)行更正和說明,為從事MSA的工作人員解疑答惑。
表1 A與B交叉表
以手冊(cè)中的例子來說明。隨機(jī)地從過程中抽取50個(gè)零件樣本,兩個(gè)評(píng)價(jià)人A和B分別對(duì)這50個(gè)零件進(jìn)行測(cè)量,判斷是否合格(1代表合格,0代表不合格),每個(gè)零件重復(fù)3次。測(cè)量結(jié)果見表1(有下劃線的數(shù)據(jù)是直接測(cè)量的)。
由于所有版本的手冊(cè)中都沒有解釋期望計(jì)數(shù)如何計(jì)算,很多人對(duì)15.7、34.3、31.3、68.7這幾個(gè)數(shù)字怎么算出來不明白。
15.7 是指A和B均判定不合格的期望計(jì)數(shù),其值等于A判定不合格的次數(shù)乘以B判定不合格的次數(shù)除以總判定次數(shù)。從表1可見,A判定不合格次數(shù)為50次,B判定不合格次數(shù)為47次,所以,A和B均判定不合格的期望計(jì)數(shù)為:
47×50/150=15.7
同理,A判定不合格B判定合格的期望計(jì)數(shù)為:
50×103/150=34.3
A判定合格B判定不合格的期望計(jì)數(shù)為:
100×47/150=31.3
A判定合格B判定合格的期望計(jì)數(shù)為:
100×103/150=68.7
科恩(Cohen)給出了Kappa值計(jì)算公式為:
手冊(cè)(第四版)定義P0為對(duì)角欄框中觀測(cè)比例的總和,Pe為對(duì)角欄框中期望比例的總和。不少人對(duì)這個(gè)定義不太理解,這里P0含義是指A、B兩個(gè)評(píng)價(jià)人判定一致的次數(shù)總和與總判定次數(shù)之比,Pe含義是指A、B兩個(gè)評(píng)價(jià)人判定一致的期望計(jì)數(shù)總和與總判定次數(shù)之比(第三版手冊(cè)定義P0為對(duì)角線單元中觀測(cè)值的總和,Pe為對(duì)角線單元中期望值的總和,應(yīng)該屬于翻譯錯(cuò)誤)。即:
需要注意的是,Kappa值只評(píng)價(jià)不同評(píng)價(jià)人判定一致的程度,不評(píng)價(jià)他們不一致的程度。
通用的經(jīng)驗(yàn)法則是:Kappa>0.75表示一致性可以接受,<0.4一般認(rèn)為一致性不可接受。此例中,A與B之間的Kappa值為0.86,說明A和B判定一致性好,可以接受。
手冊(cè)(第四版)第129頁(yè)定義:有效性=正確判定數(shù)/判定機(jī)會(huì)總數(shù)(這和第三版基本一致)。但第130頁(yè)計(jì)算有效性時(shí)卻沒有按照這個(gè)定義進(jìn)行計(jì)算,而是按照下面的公式計(jì)算有效性:
仍以手冊(cè)(第四版)第124頁(yè)表12作為例子。從表12可以發(fā)現(xiàn),參考值顯示合格的零件有34個(gè),不合格的有16個(gè)。其中,39個(gè)零件是A、B、C三個(gè)評(píng)價(jià)人每次判定都和參考值一致;評(píng)價(jià)人A有8個(gè)零件的判定結(jié)果與參考值不一致,其中5次將合格零件判定為不合格,3次將不合格零件判定為合格;評(píng)價(jià)人B有5個(gè)零件的判定結(jié)果與參考值不一致,其中2次將合格零件判定為不合格,3次將不合格判定為合格;評(píng)價(jià)人C有10個(gè)零件判定結(jié)果與參考值不一致,其中9次將合格零件判定為不合格,6次將不合格零件判定為合格。這里需要特別注意,評(píng)價(jià)人C判定結(jié)果與參考值不一致的零件數(shù)不等于判定不一致的次數(shù),因?yàn)樵u(píng)價(jià)人C對(duì)其中的5個(gè)零件的判定共有10次與參考值不一致(每個(gè)零件有2次判定和參考值不一致)。
手冊(cè)(第四版)最后給出的A、B、C的有效性分別為:84%、90%、80%,即:
評(píng)價(jià)人A的有效性:
評(píng)價(jià)人B的有效性:
評(píng)價(jià)人C的有效性:
它們和手冊(cè)(第四版)第129頁(yè):有效性=正確判定數(shù)/判定機(jī)會(huì)總數(shù)的定義不一致。若按照此定義,評(píng)價(jià)人A、B、C的有效性為:
評(píng)價(jià)人A的有效性:
評(píng)價(jià)人B的有效性:
評(píng)價(jià)人C的有效性:
顯然,按此方法計(jì)算的3個(gè)評(píng)價(jià)人的有效性均不低于90%,都滿足有效性評(píng)價(jià)準(zhǔn)則;而按照前一種算法只有評(píng)價(jià)人B滿足有效性評(píng)價(jià)準(zhǔn)則。
測(cè)量系統(tǒng)分析參考手冊(cè)是從事MSA的工作指南,雖然經(jīng)過三次修訂,但由于作者、校對(duì)和翻譯的能力水平和實(shí)踐經(jīng)驗(yàn)所限,難免出現(xiàn)一些紕漏。所以,使用者發(fā)現(xiàn)其中不對(duì)的地方或不明白的地方,要大膽地提出來,以便大家共同商討,解決問題。由于篇幅所限,本文只是就其中的部分問題提出自己的見解,僅供大家參考。
[1] 袁學(xué)成,胡湘洪.統(tǒng)計(jì)過程控制SPC體系實(shí)施指南[M].北京:中國(guó)標(biāo)準(zhǔn)出版社,2009.
[2] 尚國(guó)慧.測(cè)量系統(tǒng)分析 (MSA)在制造行業(yè)中的應(yīng)用[D].上海:上海交通大學(xué),2009.
[3] 陳宏.測(cè)量系統(tǒng)分析在實(shí)驗(yàn)設(shè)備質(zhì)量評(píng)價(jià)中的應(yīng)用[J].實(shí)驗(yàn)室研究與探索,2011(11).
[4] 葉衛(wèi)民,劉沃野,趙德勇,等.測(cè)量系統(tǒng)分析方法評(píng)述及應(yīng)用[J].統(tǒng)計(jì)與決策,2013(1).
[5] 李耀江,杜世昌.測(cè)量系統(tǒng)分析在品質(zhì)控制中的應(yīng)用[J].機(jī)械制造與自動(dòng)化,2010(6).
[6] 戴姆勒克萊斯勒,福特和通用汽車公司.測(cè)量系統(tǒng)分析參考手冊(cè)(第三版)[Z].2002.
[7] 戴姆勒克萊斯勒,福特和通用汽車公司.測(cè)量系統(tǒng)分析參考手冊(cè)(第四版)[Z].2010.