高帥
(對外經(jīng)濟貿(mào)易大學(xué)統(tǒng)計學(xué)院,北京 100029)
測試是產(chǎn)品研制流程中的一個重要環(huán)節(jié)。當(dāng)產(chǎn)品中的各模塊調(diào)試完成后,將進行產(chǎn)品的裝配與集成,并最終通過各項測試驗證后交付到用戶手中。產(chǎn)品的測試過程旨在交付前期全面驗證產(chǎn)品質(zhì)量特性是否滿足用戶要求。產(chǎn)品質(zhì)量特性的各項測試結(jié)果是其是否具備產(chǎn)品交付條件的重要評判依據(jù)。
以往產(chǎn)品測試結(jié)果僅給出各功能性能指標的測試報告或是測試表單,以此逐一驗證產(chǎn)品各項功能性能指標是否滿足要求和規(guī)范,但并沒有將產(chǎn)品各功能及指標的測試數(shù)據(jù)進行綜合的定量評估。本文提出的評估模型,針對產(chǎn)品研制的特點與獲得測試數(shù)據(jù)的實際情況,集成灰色白化權(quán)函數(shù)聚類法、層次分析法與德爾菲調(diào)查法中的要素與方法,形成了利用已有測試數(shù)據(jù)進行打分評估的流程方法。
本文所述模型結(jié)合了灰色白化權(quán)函數(shù)聚類法、層次分析法與德爾菲調(diào)查法中的要素與方法。主要過程可歸納為建立指標體系、構(gòu)建指標打分方法、分析指標權(quán)重與計算評估得分幾個步驟。
應(yīng)當(dāng)建立與產(chǎn)品相關(guān)的覆蓋面盡可能全的指標體系。本文中產(chǎn)品的指標體系建立分為兩級,第一級為產(chǎn)品級的指標,這一級指標主要是結(jié)合質(zhì)量驗收協(xié)議對各類指標進行綜合分類,從而形成不同類別的一級指標。第二級主要為各一級指標下具體包含的功能性能指標,該層級指標數(shù)據(jù)是測試過程中可直接獲取的客觀的數(shù)據(jù)與狀態(tài)。
指標的打分方法是評估體系建立的一個核心問題,將每個指標的測試結(jié)果進行合理的打分,是得到合理的產(chǎn)品得分的前提。評估指標的計量單位不同,若直接進行數(shù)據(jù)分析,則會造成較大偏差,影響判讀結(jié)果,因此,指標打分需要進行無量綱化?;疑谆瘷?quán)函數(shù)聚類法是一種將未知類別的對象進行聚類的方法。該方法中所使用的白化權(quán)函數(shù),能夠解決產(chǎn)品各類指標打分的無量綱化問題。
為某指標得分設(shè)計得分函數(shù)f(·)如圖1 所示,函數(shù)縱軸代表指標的評價值,最大值為1,橫軸代表技術(shù)指標測量結(jié)果,X(1),X(2),X(3),X(4)是函數(shù)的轉(zhuǎn)折點,得分函數(shù)的轉(zhuǎn)折點可根據(jù)指標分布特點自由制定,若將測試指標每次測量所得結(jié)果看作一個連續(xù)型隨機變量,則該測試指標測試結(jié)果概率密度函數(shù)可用正態(tài)分布函數(shù)進行描述,則有,這表明當(dāng)某質(zhì)量特性X ~N()時,其特性值落在區(qū)間()內(nèi)的概率為99.73%,因此,可將X(2)~X(3)轉(zhuǎn)折點區(qū)間對應(yīng)區(qū)間,而X(1)~X(2),X(3)~X(4)轉(zhuǎn)折點區(qū)間對應(yīng)以外的區(qū)間??梢?,得分函數(shù)f(·)可將不同的測量結(jié)果與最終評判分數(shù)之間建立起分段線性函數(shù)的關(guān)系。
圖1 得分函數(shù)
圖2 系統(tǒng)級指標得分函數(shù)
指標權(quán)重的建立,基于對測試指標不同重要性的考慮。不同模塊的指標有著不同的重要性,越重要的指標對評估分數(shù)的貢獻越大,反之亦然。層次分析法是20 世紀70 年代提出的一種定性與定量分析相結(jié)合的分析方法,可根據(jù)用戶對各個指標相對重要度比較的打分結(jié)果獲得指標的權(quán)重。具體方法是對同一層次指標構(gòu)造兩兩比較的判斷矩陣,比較結(jié)果利用標度法表示:若標度值為1,表示兩個指標相比同樣重要;若標度值為3,表示兩個指標前者比后者稍微重要;若標度值為5,表示兩個指標前者比后者明顯重要;若標度值為7,表示兩個指標前者比后者強烈重要;若標度值為9,表示兩個指標前者比后者極端重要;若標度值為(2、4、6、8)表示上述兩相鄰判斷的中值。若元素i 與元素j 的重要性之比記為,那么元素j 與元素i 的重要性之比為。
公式(2)中RI 為相應(yīng)的平均隨機一致性指標。當(dāng)CR<0.1 時,認為判斷矩陣一致性可以接受,否則,須重新構(gòu)造判斷矩陣。本文提出,判斷矩陣A 的構(gòu)造使用德爾菲調(diào)查法。德爾菲調(diào)查法可以比較精確地反映專家們個人的主觀評價意見。對于一個具有嚴謹科學(xué)態(tài)度并具有廣泛代表性的專家組,他們相對集中的意見具有較大的可信度。德爾菲調(diào)查法既能充分地利用專家個人的知識和經(jīng)驗,又能最大限度發(fā)揮專家集體的智慧,是一種比較科學(xué)的調(diào)查方法。
綜合考慮同一級別的指標得分及指標權(quán)重,通過指標的得分進行加權(quán)求和,得到結(jié)果η 是該級別指標的評估得分,可表示為:
若對二級指標進行計算,得到的便是對應(yīng)的一級指標得分,如對一級指標進行計算,所得為最終產(chǎn)品評估得分結(jié)果。
本文以某產(chǎn)品為例,利用已掌握的指標測試結(jié)果對其質(zhì)量特性進行評估。為清晰表達應(yīng)用流程,本實例對指標體系進行簡化,所納入的指標僅為部分關(guān)鍵指標。建立兩個層級的指標體系,一級指標包括:一般指標、接口指標、功能性能指標、系統(tǒng)級指標。對應(yīng)一級指標又可具體細分為不同二級指標,其中一般指標包含3 項,接口指標包含6 項,功能性能指標包含8 項,系統(tǒng)級指標包含6 項。
第二步,將指標進行分類,賦予不同的得分函數(shù)。系統(tǒng)級指標屬于下限測度白化權(quán)函數(shù),根據(jù)在產(chǎn)品級測試中發(fā)現(xiàn)并解決的問題數(shù)量來對其性能進行評價。若至產(chǎn)品交付,仍存在未解決超標項,f 為0。若均解決,f 取值視首次測試超標項目數(shù)量而定,滿足圖2 得分函數(shù)關(guān)系。
功能類指標與性能類指標分別定義得分函數(shù)。對于功能類指標,若針對該功能測試從未發(fā)生過問題則f 為1;若該功能在測試及試驗階段發(fā)生過問題,但問題得以解決,則f為0.8,若該功能未實現(xiàn),則f 為0(如圖3);對于性能類指標,將規(guī)范要求的指標范圍上下限設(shè)計為指標得分臨界點即技術(shù)指標與技術(shù)要求一致,則f 函數(shù)值為0.8;將規(guī)范要求的指標范圍上下限設(shè)計在中心50%范圍內(nèi),即產(chǎn)品性能優(yōu)于規(guī)范要求指標范圍區(qū)間為規(guī)范要求的子集,則f 函數(shù)值為1;在臨界點外超出規(guī)范要求,函數(shù)為0。若至交付前仍超標,f 為0,(如圖4)。
圖3 功能指標得分函數(shù)
圖4 性能指標得分函數(shù)
評估實施采取先二級指標后一級指標自下而上的方式,最終獲得產(chǎn)品得分。以功能性能指標的8 個二級指標為例,根據(jù)各指標的得分函數(shù)獲得得分向量F 為:
依托德爾菲調(diào)查法,獲得的功能性能指標的8 個二級指標的兩兩比較判斷矩陣A 見圖5。
圖5 功能性能指標判斷矩陣
對W 歸一化后得到:
利用以上方法,可以獲得其他一級指標得分及對應(yīng)權(quán)重,如表1,通過公式(3)可得產(chǎn)品得分η=0.9251,換算為百分制為92.51 分。
基于測試指標的集成決策產(chǎn)品評估模型,綜合了產(chǎn)品各個模塊指標的測試結(jié)果,用打分的方式對產(chǎn)品進行評價,與傳統(tǒng)的測試報告相比,具有標準、直觀、定量的特點,是測試及試驗數(shù)據(jù)分析的發(fā)展產(chǎn)物,為產(chǎn)品研發(fā)部門與用戶決策提供了一種新的支持方式。本文所描述的模型僅是其中一種具有較好操作性的實現(xiàn)方法,可作為一次有益的嘗試,具有一定參考借鑒價值。
表1 某項目產(chǎn)品一級指示權(quán)重與得分