祖月芳,呂永順
(1.陸軍工程大學野戰(zhàn)工程學院,江蘇 南京 210004 ;2.96761 部隊,河南 靈寶 472500)
在故障案例檢索后,選擇出最佳的相似度故障案例有效解決新問題是裝備故障診斷的目標。在檢索出的故障案例中,需要對案例從實際應用和理論兩個方面進行評判;實際應用方面主要通過案例的引用成功次數確定,理論方面依據不同等級的專家對案例打分進行評判。最后將案例的成功引用次數和專家打分兩方面結合起來對檢索出來的案例順序進行優(yōu)化,以更有效地實現故障的輔助診斷。
故障案例的實用性可以通過在實際使用過程中被成功引用的次數c 來體現。故障案例在使用過程中被成功引用的次數越多,說明案例的質量越高,實用性越強。由于案例被成功引用的次數是客觀存在的,在實際解決故障中可以通過統(tǒng)計得到,通過案例被成功引用次數對故障案例的實用性進行量化分析。假設通過語義相似度匹配方法檢索出了一組案例X,每個案例被成功引用的案例次數可以表示為C={c_1,c_2,…,c_i,…c_n},則每個故障案例的在實際應用中得分為:
其中,表示第個案例已被成功引用的次數;min{ci}表示在案例X 中被成功引用次數最小的c 值;min{ci}表示案例被成功引用次數最大的c 值;a 是一個超參,它保證了任何情況下分子分母的值均不為零。
專家打分法是對定性的指標進行評價的一種常用方法,它是依據專家經驗對某一指標進行量化評價的過程。在裝備故障案例庫中,通過專家評判可以優(yōu)化案例權重,提升案例庫中的案例質量。但是,專家打分法存在不同等級的專家對故障案例的了解程度、把握程度不一的情況,導致一些專家可能由于人為因素出現打分過高或過低的情況,影響故障案例的真實評價和案例庫的有效維護。鑒于這種情況,對故障案例的專家打分權重以不同級別的專家對案例的了解程度、把握程度以及專家個人打分與專家組平均分差為依據,綜合考量建立一種使專家個人打分盡可能趨近于專家組平均分的迭代算法,降低個別異常分值對案例實際評分的影響,確保專家評價故障案例的有效性。
(1)專家權威性指標量化分析在裝備故障案例的評價過程中,主要依據專家的權威性確定專家打分的權重。專家的權威性主要包括硬指標和軟指標兩個方面;硬指標主要包括專家等級、學術成果等實際存在的指標,軟指標指不同級別的專家對故障案例的了解和把握程度。在評價過程中,本文將軟指標和硬指標作為兩個關鍵因素,專家的硬指標越高,對故障案例的了解和把握程度越高,打出的分數越科學合理。設W 為專家打分的合理性權重,則W 與專家的硬指標F 和軟指標G 呈線性關系,如式(2)所示。
其中,專家的硬指標F 和軟指標G 的取值范圍均為[0,1],若專家對故障案例屬于跨領域完全不了解,則G 值為0;若同領域非常了解則為1。同理,硬指標F 值的設定方式也如此。另外,為防止兩個指標互相影響,設定F 和G 為線性無關變量,如式(3)所示。
由于專家的硬指標F 和軟指標G 具有一定的主觀性,基于這兩個指標進行權威性評價無法客觀體現公正性。因此,將專家的權威性評價設定為的指標函數處理。
(2)分值差異分析
專家在打分過程中,主要是進行案例理論層面的打分,評分應綜合考慮故障案例的完整性以及故障原因和解決方案的有效性等方面。由于打分存在一定的人為因素影響,容易出現某個專家個人打分與同組專家打分差異性較大的情況,這里采用方差計算方法對分值差異進行量化。假定為n 個裝備領域專家對案例的打分數據,方差D 的計算方法如式(4)所示。
其中,E(S)代表同組裝備領域專家打分的平均值,是S的數學期望,E(S)的計算方法如式(5)所示。
由式(4)可以看出,D 值的大小與分值差異成正比,分值差異越大,D 值越大,對權重W 的干擾越大。為了降低干擾,將W 和D 進行線性耦合得到式(6)。
(3)綜合評分權重
通過式(2)和式(6)可以看出,專家打分的合理性權重W 與專家的硬指標F 和軟指標G 以及專家打分的分值差異D 三個指標呈線性關系,共同決定權重W 的取值。因此,可以得到式(7)。
其中k1,k2,k3,為歸一化線性相關系數;專家的硬指標F 和軟指標G 為固定值用指標函數代替;表示專家對故障案例評價的分值差異。
(1)專家綜合評分
在計算綜合評分過程中,常用的方法是專家打分與權重乘積的累加,如式(8)。
其中,wi代表專家打分的綜合權重,在式(7)中已經可以得出第個專家的評分權重可以表示為:
式(9)中,ci為固定值,是評判專家權威性的線性量化函數;ki表示對幾個指標歸一化的線性系數;di表示第個專家打分的量化偏差。將式(9)代入式(8),可得式(10)。
通過式(9)可以看出,最終專家的綜合評分包括兩部分內容,左半部分是所有專家對故障案例評價的認同度基準分值,右半部分是專家對故障案例評價的干擾值。
(2)加權迭代算法
為降低干擾值對故障案例評價的影響,需要對每個專家打分的權重進行調整。從式(9)中可以發(fā)現,di值越小,專家對案例評價的一致性認同度越高,當時di=0,可以得到式(11)。
其中,表示沒有加權的專家打分平均值;此時,加權平均值與的差值即為所有專家對故障案例評價的一致性認同分值。由此可以得出,專家對故障案例的客觀打分可以通過加權均值迭代相減得到,具體算法如圖1。當同組專家打分的量化偏差值均為0 時,可以得到最公平有說服力的專家評分值。
圖1 加權迭代算法流程圖
在故障案例的評判過程中,從實際應用和理論兩方面考慮,通過故障案例引用成功的次數和專家評判兩個方面分別對故障案例進行了評價。接下來通過對實際應用和理論賦予不同的比例對案例進行綜合評判,以進一步優(yōu)化故障案例的推理順序。
式(12)中,r1,r2為兩個相關系數,且r1+r2=1,表示對實際應用和理論兩方面分配的權重,和均采用百分制。
假定通過相似度檢索出5 個故障案例,下面以5 個案例的實際應用評分和理論得分情況對故障案例的綜合評判方法進行說明。
(1)實際應用得分
如表1 所示,根據故障案例的成功引用次數,依據式(1)計算得到案例的實際應用的得分情況(此時式(1)的超參值)。
表1 故障案例的實際應用情況
抽取一組專家,根據專家實際的軟硬指標設定專家的權2 所示。通過迭代算法調節(jié)個別專家由于權威性不高對故障案例的理解把握不夠導致打分異常的權重,獲得大部分專家對項目認同度的分值。
從表2 中可以看出,專家5 的權威性系數只有0.6,在案例1 和案例4 中打分情況明顯高于其他專家,因此判定專家5 給出的這兩個案例的分數不合理。以故障案例1 的打分為例,通過迭代算法調節(jié)權重得到專家5 的權重為0.79,此時,而其他四位專家的平均分為71,相差不大,調節(jié)權重后的得到的分值更合理。同理,通過迭代算法計算所有其他專家對每個案例的打分權重如圖2 所示。
表2 專家對故障案例的理論打分情況
圖2 專家打分權重
最終,通過調整權重后得到專家對5 個案例合理性評分,如表3 所示。
表3 理論得分
(3)綜合得分
根據式(12)可知,綜合得分由實際應用和理論得分兩部分構成,已知兩部分的系數,每一部分應該分多大的比重使得綜合得分比重更合理,通過實際計算得到給實際應用得分分配比例由0.4 到0.9的綜合得分情況,如表4 所示。
表4 綜合得分
通過實驗可以看出,結合案例被成功引用的次數和不同權威性的專家評判進一步優(yōu)化案例的推薦順序,有利于實現故障的輔助診斷。