尚保玉 郭順生 郭 鈞
(武漢理工大學(xué)機(jī)電工程學(xué)院 武漢 430070)
基于粗糙集和RBF神經(jīng)網(wǎng)絡(luò)的高速公路路面使用性能評價方法,就是把粗糙集理論和RBF神經(jīng)網(wǎng)絡(luò)相結(jié)合,并在高速公路路面使用性能評價中的綜合應(yīng)用,旨在提高對路面使用性能評價的精度和效率.該方法繼承了粗糙集理論和RBF神經(jīng)網(wǎng)絡(luò)各自的特點(diǎn),形成優(yōu)缺點(diǎn)互補(bǔ),使兩者的優(yōu)勢得到充分發(fā)揮.不僅具有粗糙集理論的約簡特性,而且兼?zhèn)淞薘BF神經(jīng)網(wǎng)絡(luò)逼近能力強(qiáng)、學(xué)習(xí)速度快等優(yōu)點(diǎn).通過實(shí)證分析,結(jié)果表明該方法具有很高的評價精度,較大程度的提高了運(yùn)算能力和收斂速度,使決策者能夠快速的、準(zhǔn)確的給出實(shí)時的養(yǎng)護(hù)決策,具有很高的使用價值[1].
筆者提出的引入粗糙集理論的路面使用性能評價模型見圖1.在保留人工神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、自組織特性的基礎(chǔ)上,利用粗糙集理論對數(shù)據(jù)進(jìn)行優(yōu)化處理[2],提取其中關(guān)鍵要素作為網(wǎng)絡(luò)的輸入,從而簡化了神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),提高了分類精度.
圖1 基于粗糙集神經(jīng)網(wǎng)絡(luò)的路面使用性能評價模型流程圖
在保證具有良好的分類質(zhì)量和精度的前提下,對神經(jīng)網(wǎng)絡(luò)模型的輸入數(shù)據(jù)進(jìn)行屬性約簡.基于粗糙集和RBF神經(jīng)網(wǎng)絡(luò)的使用性能評價模型的流程圖見圖2.具體步驟如下.
步驟1樣本采集 從高速公路路面管理處數(shù)據(jù)庫中抽調(diào)樣本數(shù)據(jù),按照指標(biāo)屬性構(gòu)建初始的寬泛屬性集,并按照一定的比例選擇訓(xùn)練樣本和測試樣本.
圖2 路面使用性能評價的粗糙集和RBF神經(jīng)網(wǎng)絡(luò)系統(tǒng)框架
步驟2構(gòu)建決策表 對數(shù)據(jù)首先進(jìn)行預(yù)處理,填補(bǔ)空缺值等以保證樣本數(shù)據(jù)適合挖掘;對指標(biāo)值進(jìn)行語義界定,確定每個指標(biāo)值的界定屬性值,建立決策表[3].
步驟3屬性約簡 利用決策表建立可辨識矩陣,并通過邏輯表達(dá)式計算出決策表的屬性約簡集和屬性核.
步驟4創(chuàng)建RBF神經(jīng)網(wǎng)絡(luò) 由屬性約簡集和屬性核確定RBF神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元個數(shù),進(jìn)而確定整個RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)構(gòu)成.
步驟5網(wǎng)絡(luò)訓(xùn)練 用訓(xùn)練樣本對RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練[4].
步驟6網(wǎng)絡(luò)仿真 用測試樣本對訓(xùn)練后的RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真驗(yàn)證網(wǎng)絡(luò)的可靠性及使用性等.
根據(jù)高速公路的路面數(shù)據(jù)的特點(diǎn)以及上文所述,確定粗糙集理論的屬性約簡建模步驟.具體約簡步驟如下.
步驟1確定屬性集 通過對高速公路路面使用性能評價研究,對所有能夠影響到路面性能評價的指標(biāo)進(jìn)行分析,確定寬泛的屬性集,即評價指標(biāo)集,又稱為條件屬性,并明確決策屬性,即最終能夠?qū)β访媸褂眯阅苓M(jìn)行評價的綜合指標(biāo).
步驟2數(shù)據(jù)收集 主要是收集路面歷史數(shù)據(jù)樣本或獲取路面的實(shí)時數(shù)據(jù),為路面使用性能評價做前提準(zhǔn)備.
步驟3數(shù)據(jù)預(yù)處理 如某些指標(biāo)值因?yàn)楝F(xiàn)有設(shè)備故障沒辦法測得或數(shù)值丟失等原因所致的數(shù)據(jù)同其他數(shù)據(jù)不一致,達(dá)不到?jīng)Q策表的完整性.需要用一些方法對這些數(shù)值進(jìn)行預(yù)處理,使之達(dá)到使用要求,如用某些特殊方法(Mean completer算法、Combinational completer算法等)來對丟失的數(shù)據(jù)進(jìn)行預(yù)先處理.
步驟4數(shù)據(jù)歸一化處理 對指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理,定性數(shù)據(jù)轉(zhuǎn)化為數(shù)值型,如路面裂縫的有輕、重兩個級別,分別用0和1來表示.
步驟5構(gòu)建決策表系統(tǒng) 屬性約簡的決策表和關(guān)系型數(shù)據(jù)庫中的二維表一樣,其中每一個樣本數(shù)據(jù)就是論域中的一個元素,每一列為一個指標(biāo),最后一列是決策指標(biāo).
步驟6構(gòu)建可辨識矩陣 按照公式(1)確定可辨識矩陣的每一個元素值.
步驟7約簡指標(biāo) 通過可辨識函數(shù)f(A)=∧(∨mij)對指標(biāo)進(jìn)行約簡,最終篩選出對路面使用性能評價最具有價值、最約簡的指標(biāo)集.
約簡主要包括2部分:屬性約簡和值約簡[5].考慮到高速公路數(shù)據(jù)指標(biāo)量大等實(shí)際情況,這里采用條件屬性約簡.隨著研究的深入,基于可辨識矩陣的算法已經(jīng)相當(dāng)?shù)某墒?,而且可辨識矩陣在處理具有大量指標(biāo)時有其獨(dú)特的優(yōu)勢,并且已經(jīng)在一些實(shí)際的約簡問題中得到普遍的使用,因此這里應(yīng)用可辨識矩陣來對數(shù)據(jù)進(jìn)行屬性約簡.
可辨識矩陣主要根據(jù)決策屬性或條件屬性的值是否相同來確定矩陣的元素值的.具體方法按照公式(1)可得出.
根據(jù)可辨識矩陣,利用可辨識函數(shù)f(A)=∧(∨mij)即可求出最簡屬性集.該函數(shù)是布爾函數(shù).如果出現(xiàn)屬性集合mij為空,那么就定函數(shù)值為1,從可辨識矩陣的定義和公式可以看出,矩陣M中屬性組合為1的元素項(xiàng)的全部集合構(gòu)成粗糙集決策表的核[6].
在RBF神經(jīng)網(wǎng)絡(luò)中,設(shè)輸入層、隱含層和輸出層的神經(jīng)元數(shù)分別為L,M和N.其中L是經(jīng)過指標(biāo)約簡而定的,由上文可知為6;N為系統(tǒng)要求的路面綜合評價指標(biāo)PQI,因此N為1.利用newrbe創(chuàng)建一個精確的RBF神經(jīng)網(wǎng)絡(luò),能夠自動選擇隱含層數(shù)目,使得誤差達(dá)到最小.因此,選擇RBF神經(jīng)網(wǎng)絡(luò)為6×Y×1的結(jié)構(gòu).其結(jié)構(gòu)圖限于篇幅這里不予給出.
4.1.1 屬性集確定與收集 由于本研究是基于河南省某高速公路(瀝青路面)管理處而實(shí)施的,所以僅對瀝青路面型的高速公路路面數(shù)據(jù)進(jìn)行采集和約簡,以驗(yàn)證粗糙集理論在路面使用性能評價指標(biāo)約簡中的良好應(yīng)用.為了能夠可靠的、真實(shí)的反映路面使用性能評價模型的評價能力,這里選取路面數(shù)據(jù)中對路面狀況影響較大的15種指標(biāo)作為路面使用性能評價的寬泛指標(biāo).下面是在該管理處高速公路的不同地段、不同時間隨機(jī)抽樣的3組共70項(xiàng)樣本數(shù)據(jù).其中前50項(xiàng)作為訓(xùn)練樣本,后20項(xiàng)作為測試樣本之用.這15種指標(biāo)分別為:日交通量Nm,輛/d;瀝青面層厚度h,mm;路面損壞狀況指數(shù)PCI;路面行駛質(zhì)量指數(shù)RQI;路面整體承載能力SSI;路面抗滑能力指數(shù)SRI(路面抗滑性能指數(shù)采用抗滑系數(shù)作為評價指標(biāo),抗滑系數(shù)以橫向力系數(shù)SFC或擺式儀的擺值BPN表示,這里選取橫向力抗滑系數(shù)作為路面抗滑性能指標(biāo));縱向裂縫LC;橫向裂縫TC;坑槽S;龜裂C;麻面松散R;沉陷M;日均氣溫t,℃;抗壓強(qiáng)度p,MPa和路面綜合評價指標(biāo)PQI.PQI是決策屬性指標(biāo),其余全部為條件屬性指標(biāo).數(shù)據(jù)屬性信息見表1.
表1 瀝青路面抽樣數(shù)據(jù)
4.1.2 數(shù)據(jù)預(yù)處理和歸一化處理 利用基于粗糙集理論下的可辨識矩陣對表1進(jìn)行指標(biāo)約簡,找出影響路面使用性能評價指標(biāo)的約簡核,并建立決策表.對表1數(shù)據(jù)進(jìn)行歸一化處理,把定性指標(biāo)轉(zhuǎn)化為數(shù)值型[7],如縱向裂縫有輕、重2種破損程度之分,分別用數(shù)字1和0來表示.把PCI,RQI,SSI,SFC等按照各自的評價標(biāo)準(zhǔn)分類轉(zhuǎn)化為數(shù)值型.各指標(biāo)等級劃分標(biāo)準(zhǔn)見表2.
表2 瀝青路面評價標(biāo)準(zhǔn)[8]
通過歸一化處理,使各種指標(biāo)都轉(zhuǎn)化為數(shù)值型,并構(gòu)建決策表,限于篇幅,不再給出決策表.
4.1.3 構(gòu)建可辨識矩陣并篩選指標(biāo) 通過以上對數(shù)據(jù)的處理,然后由可辨識函數(shù)推算出可辨識矩陣,見表3.
表3 可辨識矩陣M
式(2)表明,屬性b,c,d,e,f和m是必須的,而其余的屬性則是冗余的.由此可以知道,采用可辨識矩陣的屬性約簡的結(jié)果集為{瀝青面層厚度h,路面損壞狀況指數(shù)PCI,路面行駛質(zhì)量指數(shù)RQI,路面整體承載能力SSI,路面抗滑能力指數(shù)SRI,抗壓強(qiáng)度p}.即使用這6個指標(biāo)作為RBF神經(jīng)網(wǎng)絡(luò)的輸入.
在表1中,前50組數(shù)據(jù)作為訓(xùn)練樣本,后20組作為測試樣本.利用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱直接調(diào)用RBF函數(shù),在網(wǎng)絡(luò)的學(xué)習(xí)過程中,為了減少學(xué)習(xí)時間,防止數(shù)據(jù)過大而溢出,需要對網(wǎng)絡(luò)進(jìn)行歸一化處理,即直接調(diào)用premnmx函數(shù),把數(shù)據(jù)都整理在區(qū)間[-1,1]之間.
選取約簡后的6個指標(biāo)作為網(wǎng)絡(luò)的輸入,以路面綜合評價指標(biāo)PQI為輸出.根據(jù)表2,把70組樣本數(shù)據(jù)的PQI按照{優(yōu)、良、中、次、差}5個等依次用5個向量表示,即,優(yōu)=[1 0 0 0 0]′、良=[0 1 0 0 0]′、中=[0 0 1 0 0]′、次=[0 0 0 1 0]′、差=[0 0 0 0 1]′,具體見表5.這里以是否加入粗糙集的2個網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行仿真分類評價.經(jīng)過一定的試算發(fā)現(xiàn),當(dāng)SPREAD=0.85時,網(wǎng)絡(luò)的訓(xùn)練誤差較小,因此,SPREAD定為0.85.見表4.
表4 路面使用性能評價模型的加入粗糙集前后分類仿真誤差對比
從表4中可見,加入粗糙集并對屬性約簡后,網(wǎng)絡(luò)的仿真效果較理想,整體誤差比未進(jìn)行屬性約簡的網(wǎng)絡(luò)仿真的結(jié)果小,未進(jìn)行屬性約簡的結(jié)果在第69組數(shù)據(jù)仿真時出現(xiàn)失真,誤差較大.由于本次數(shù)據(jù)采集有限,約簡后的評價精度仍然較大,如果訓(xùn)練數(shù)據(jù)足夠充足,則預(yù)測與仿真效果將會越好.
提出了基于粗糙集和RBF神經(jīng)網(wǎng)絡(luò)在路面性能評價上的應(yīng)用,并研究了其評價的精度等問題,通過算例分析表明,在路面使用性能評價的數(shù)據(jù)分類仿真方面,輸出結(jié)果都與采集的樣本結(jié)果基本保持一致.基于粗糙集和RBF神經(jīng)網(wǎng)絡(luò)的使用性能評價的提出,加快了對高速公路養(yǎng)護(hù)決策的響應(yīng)速度和面向大規(guī)模的路面養(yǎng)護(hù)管理提供了一個有效而又便捷的解決途徑,具有較大的使用價值和重要的實(shí)際意義.
[1]Mak B,Munakata T.Rule extraction from expert heuristics:A comparative study of rough set with neural networks and ID3[J].European Journal of Operational Research,2002,136:212-229.
[2]Hung Y H.A neural network classifier with rough set-based feature selection to classify multiclass IC package products[J].Advanced Engineering Informatics,2009,23:348-357.
[3]Hou Zhijian,Lian Zhiwei,Yao Ye,et al.Cooling-load prediction by the combination of rough set theory and an artificial neural-network based on data-fusion technique[J].Applied Energy,2006,83:1033-1046.
[4]Li Renpu,Wang Zhengou.Mining classification rules using rough sets and neural networks[J].European Journal of Operational Research,2004,157:439-448.
[5]王忠浩,邵新宇,張國軍,等.基于粗糙集神經(jīng)網(wǎng)絡(luò)的產(chǎn)品族配置性能預(yù)測方法[J].機(jī)械工程學(xué)報,2007,43(5):85-90.
[6]劉曉兵,潘瑞林,崔發(fā)婧,等.基于隨即分布的費(fèi)用分配系數(shù)確定方法[J].計算機(jī)集成制造系統(tǒng),2010,16(1):215-223.
[7]劉冠權(quán).基于粗糙集理論的區(qū)域虛擬企業(yè)資源優(yōu)化決策[J].計算機(jī)集成制造系統(tǒng),2007,13(11):2 178-2 182.
[8]《高速公路養(yǎng)護(hù)管理手冊》編委會.高速公路養(yǎng)護(hù)管理手冊[M].北京:人民交通出版社,2002.