宮龍飛,劉 澤
(山東黃河河務局 黃河河口管理局,山東 東營 257091)
防汛物資作為黃河防汛搶險要素之一,是國家防汛搶險的重要物質(zhì)基礎。在黃河防汛中,黃河水利委員會早已經(jīng)形成比較完善的黃河防汛物資定額管理體系,在防汛物資儲備定額管理上積累了一定經(jīng)驗[1]。物資儲備定量的條件下,出現(xiàn)險情如何合理的調(diào)度物資成為近年來的熱門話題。應用CTAN算法[2],結合以往防汛物資經(jīng)驗,對物資調(diào)用實現(xiàn)智能分析,得出結果作為指揮調(diào)度的決策支持。
在防汛物資方面,陳鴻起等[3]采用多供給點思路對物資儲備進行優(yōu)化,構造出3個數(shù)學模型,合理分配各倉庫的物資儲備定額,在滿足防汛要求的基礎上節(jié)約了成本。崔萌等[4]通過對提防、河道、涵閘工程等物資儲備測算分析,計算出管理段倉庫所需物資儲備數(shù)量。李曉曦[5]構建了一種ISM模型,為防汛物資優(yōu)化配備及管理提供決策依據(jù)。
在物資調(diào)度方面,談文靜[6]針對不確定條件考慮需求緊急度的應急物資調(diào)度問題進行研究,綜合解決了物資調(diào)配和優(yōu)化問題。宋曉宇等[7]通過改進多目標粒子群算法,應用基于Pareto最優(yōu)解的多目標應急物資調(diào)度,構建了多受災點、多出救點的應急物資調(diào)度模型。同樣對于多供應點、多需求點問題,李桂香等[8]利用遺傳算法最優(yōu)解,利用符號編碼、特殊交叉算子和變異算子,最終完成了民航應急救災物資的調(diào)度優(yōu)化。
黃河防汛的物資調(diào)度問題不只是簡單的兩點間最短路徑問題,還應該考慮到倉庫物資數(shù)量、行政劃區(qū)、車輛調(diào)度、多地出險等因素。研究將分類算法應用于物資調(diào)度決策推理當中,訓練和測試樣本為歷來防汛物資調(diào)度數(shù)據(jù)。結合實際情況對CTAN算法參數(shù)等進行研究,建立應用于防汛的CTAN模型。
CTAN分類器全稱為基于樹選擇的分類器,是對樸素貝葉斯分類器(NBC)與樹狀貝葉斯分類器(TAN)的結合改進[2]。研究通過樣本試驗來確定相關參數(shù),建立CTAN模型,并應用于黃河防汛項目物資調(diào)度決策當中。
CTAN分類器主要通過操作TAN保留對數(shù)來構造模型。假設分類模型數(shù)據(jù)集有n個屬性,則其中包括一個分類屬性,n-1個非類屬性,具體構造過程如下:
(1)取樣。對以往數(shù)據(jù)樣本取樣S1、S2。S1、S2均包含完整的非類屬性和類屬性。
(2)生成TAN模型。根據(jù)樣本S1求每對屬性之間的條件互信息CMI(Conditional Mutual Information),由公式(1)決定:
1(X,YC)=
(1)
式中X,Y為非類屬性,C為類屬性,Xi,Yj,c為三個屬性的任意取值組合,i≠j。根據(jù)條件互信息生成n-1個節(jié)點的最大生成樹,確定一個根節(jié)點指定生成樹方向。將類屬性節(jié)點作為各節(jié)點的父節(jié)點加入,生成TAN模型。此時每個節(jié)點有最對兩個父節(jié)點。
(3)確定保留對數(shù)。上一步求得互信息生成樹后,會得到一個權重序列,依邊的權值大小排列,保留對數(shù)H∈正整數(shù),且H (4)分類。對于待分類的實例X(x1,x2,…,xn-1),分類結果為公式(2)(3): (2) (3) 集合∏xk表示Xk屬性的父節(jié)點集合。 研究的CTAN分類器主要應用在險情分級與物資調(diào)度兩大模塊中。 將上述CTAN分類器應用于智慧黃河(河口)平臺開發(fā)項目中,根據(jù)現(xiàn)有歷史數(shù)據(jù)進行樣本分析,得出最終CTAN分類器模型數(shù)據(jù)。研究的算法模型主要用于險情分級與物資調(diào)度中。 當黃河堤壩巡查人員發(fā)現(xiàn)黃河險情時,利用終端儀器輸入險情探摸尺寸,形成立體模型,通過后臺計算出建議工程量,人工修改調(diào)整后,向系統(tǒng)提出險情告警與調(diào)用物資請求。 2.2.1 險情分級 在黃河防洪工程中,險情有3個級別,CTAN模型中對應類屬性值分別為一般險情(1),較大險情(2),重大險情(3),無險情(0)。根據(jù)歷史險情處理記錄分析,將數(shù)據(jù)處理后,樣本集S1數(shù)據(jù)量為400,測試集S2數(shù)據(jù)量為200。CTAN模型中數(shù)據(jù)屬性如表1所示,屬性值全為0則表示無險情。 表1 險情分級模型數(shù)據(jù)屬性 樣本集共有7個非類屬性,對S1樣本操作求互信息,生成非類屬性節(jié)點的最大權值生成樹結果如圖1,邊權為對應屬性的互信息值。 根據(jù)CTAN保留對數(shù)的不同,我們對樣本S2進行測試,通過CTAN模型將S2樣本非類屬性組合進行分類,分類結果與S2樣本類屬性比較,不同保留對數(shù)下準確率結果如表2,由表2可得保留對數(shù)為2時準確率最高,兩對屬性分別為(裂縫,坍塌)和(管涌,漏洞),此保留對數(shù)值將具體運用到智慧黃河電子預案險情分級模型中。 2.2.2 物資調(diào)度 巡查人員發(fā)現(xiàn)險情后,會向后臺請求物資調(diào)用來處理險情。各個倉庫具有行政劃分歸屬,為了便于調(diào)配,一般情況下倉庫選擇遵循行政劃區(qū)優(yōu)先,出現(xiàn)較大險情或以上時,則應遵循最短距離優(yōu)先。倉庫的選擇與后臺分析的險情分級密切相關。 黃河沿岸大堤每隔一公里都會有樁號標記,智慧黃河平臺里,數(shù)據(jù)以樁號為單位來計算。如圖2所示,圖中顯示的為D市部分流域倉庫分布圖,其中三角符號表示樁號,粗細線為交通路線,橢圓形表示倉庫所在位置。倉庫由所在行政單位負責,因此物資調(diào)度并非完全按照最近倉庫原則來執(zhí)行。 圖1 險情分級最大權值生成樹 CTAN保留數(shù)CTAN(0)CTAN(1)CTAN(2)CTAN(3)CTAN(4)CTAN(5)CYAN(6) 準確率0.7950.8200.8750.8500.8400.8150.815 圖2 D市部分流域倉庫分布 構建CTAN模型前,需要先計算出險情分級以及出險點到各倉庫距離排序,所得結果作為CTAN屬性用于預測分類。其中險情分級由上一小節(jié)2.2.1得出,各倉庫距離則基于樁號來計算。D市所屬流域內(nèi)總共有樁號約190個,每個樁號間隔1 km,兩岸間樁號不同,樁號之間的位置則用a+b形式表示,例如206+300表示樁號206往下游方向300 m位置。 研究模塊CTAN模型類屬性為14個倉庫,非類屬性包括險情分級、行政區(qū)域、左右岸以及14個倉庫距離屬性。險情分級結果由上一個模型求得,取值0~3。行政區(qū)域包括黃河途徑D市的四個行政區(qū)域,L縣、D區(qū)、K區(qū)、H區(qū)。左右岸有兩個取值。倉庫距離屬性取值為1~4,取值為出險點至各倉庫距離排名,為減少運算量,第四名往后賦值均為5。計算距離時,考慮到車輛阻塞情況,需后臺管理人員輸入阻塞點。 原始樣本數(shù)據(jù)中險情記錄包含樁號位置、現(xiàn)場情況以及出庫記錄等,通過后臺計算樁號到各倉庫距離后,生成新的樣本集以滿足CTAN模塊屬性分類。為了保證決策準確性,根據(jù)實際情況,人工添加了部分數(shù)據(jù),樣本集總量為700,S1數(shù)據(jù)量為500,S2數(shù)據(jù)量為200。對S1求互信息,按取值大小前五對結果為表3。 表3 物資調(diào)度互信息值排序前5 根據(jù)CTAN保留對數(shù)的不同,在保留對數(shù)取值0~5時,通過CTAN模型將S2樣本非類屬性組合進行分類,分類結果與S2樣本類屬性比較,得出準確率。由表4可知,對比結果表明保留對數(shù)為1時,效果最好,行政區(qū)域大多以黃河為界,因此結果具有合理性。在之后分類預測中,將沿用CTAN(1)模型。最終預測結果將保留前三個概率最大的倉庫,發(fā)生多處險情時,系統(tǒng)將不會選擇正在處理前一險情的倉庫,而是順位選擇下一倉庫。 表4 物資調(diào)度不同保留對數(shù)CTAN模型準確率 兩種CTAN模型分別用來處理險情分級和物資調(diào)度,通過構建模型分類屬性建立數(shù)據(jù)集,并得出不同保留對數(shù)下CTAN模型的最優(yōu)解。試驗表明,險情分級模型最優(yōu)保留對數(shù)為2;物資調(diào)度模型最優(yōu)保留數(shù)為1。最優(yōu)解模型已應用于智慧黃河(河口)平臺模塊中,為防汛物資調(diào)度提供決策支持。研究主要是針對險情現(xiàn)狀,今后的研究方向會細化倉庫出庫物資種類等,所構建模型將主要是基于物資請求種類的分析。2.2 CTAN分類器的應用
3 結 語