王學(xué)淵 陳志剛 鐘新榮 盧寧
摘 要: 供水管道泄漏會造成水資源浪費和經(jīng)濟損失,傳統(tǒng)支持向量機泄漏診斷模型中存在參數(shù)選擇不確定的問題,導(dǎo)致其分類結(jié)果不穩(wěn)定。提出將粒子群進化算法應(yīng)用于泄漏診斷支持向量機模型中的參數(shù)優(yōu)化選擇,利用粒子群群體智能優(yōu)化搜索從全局迅速地迭代出合理的支持向量機的懲罰參數(shù)以及核參數(shù),使建立的PSO?SVM管道泄漏診斷模型達到最優(yōu)。實驗測試表明,通過結(jié)合粒子群算法全局搜索收斂速度快的優(yōu)點,有效地解決了支持向量機模型中兩個重要參數(shù)優(yōu)化選擇的問題,提升了支持向量機分類的準確率和效率。
關(guān)鍵詞: 供水管道; 泄漏診斷; 支持向量機; 粒子群算法; 參數(shù)優(yōu)化; PSO?SVM
中圖分類號: TN911.1?34; TP274.2 文獻標識碼: A 文章編號: 1004?373X(2018)07?0156?04
PSO?SVM based leakage diagnosis method of water supply pipeline
WANG Xueyuan1, 2, CHEN Zhigang1, 2, ZHONG Xinrong3, LU Ning1, 2
(1. School of Mechanical?electronic and Vehicle Engineering, Beijing University of Civil Engineering and Architecture, Beijing 100044, China;
2. Beijing Engineering Research Center of Monitoring for Construction Safety, Beijing 100044, China;
3. Changqing Downhole Technology Company, Xian 710000, China)
Abstract: The leakage of water supply pipeline will cause the water resource waste and economic losses. The traditional leakage diagnosis model based on support vector machine (SVM) has the problem of uncertain parameter selection, which may cause the unstable classification result. The particle swarm optimization (PSO) algorithm is proposed for parameter optimization selection in leakage diagnosis model based on SVM. The particle swarm intelligent optimization search is used to quickly iterate the reasonable penalty parameter and kernel parameter of SVM in the overall situation, so as to make the pipeline leakage diagnosis model based on PSO?SVM optimal. The experimental results show that, in combination with the fast convergence speed of PSO global search, the method can solve the two important parameters optimization selection problem in SVM model, and improve the accuracy and efficiency of SVM classification.
Keywords: water supply pipeline; leakage diagnosis; SVM; PSO; parameter optimization; PSO?SVM
0 引 言
隨著我國城市化水平不斷提高,供水管道長度呈現(xiàn)加速增長趨勢,但供水管網(wǎng)道的漏損現(xiàn)象卻十分普遍。對于城市供水管道的漏失診斷,如何從復(fù)雜干擾中識別泄漏是整個技術(shù)的關(guān)鍵難點[1]。針對這一關(guān)鍵點,文獻[2]提出基于神經(jīng)網(wǎng)絡(luò)的管道泄漏檢測識別方法,很大程度上提升了泄漏檢測的準確率。但是,神經(jīng)網(wǎng)絡(luò)存在訓(xùn)練樣本需求多、收斂速度慢等問題,文獻[3]提出基于結(jié)構(gòu)風(fēng)險最小化的SVM理論應(yīng)用于管道泄漏診斷領(lǐng)域,它在小樣本及非線性的情形下有獨特優(yōu)勢,可以實現(xiàn)對管道泄漏進行比較精確的診斷。但有研究表明,在成熟的條件下核函數(shù)對SVM識別性能的影響不大,其中對SVM性能起到關(guān)鍵作用的因素[4]是核參數(shù)和懲罰因子[C。]常規(guī)支持向量機核參數(shù)和懲罰因子的選擇一般采用試湊法、經(jīng)驗法或單目標優(yōu)化法,上述方法不能達到全局優(yōu)化的效果,而且耗費時間。
本文提出將粒子群進化算法應(yīng)用于支持向量機的核參數(shù)和懲罰因子的選擇中。粒子群優(yōu)化算法在每次迭代中都考慮了全局搜索和局部搜索,與支持向量機結(jié)合后可獲得診斷效果更佳的PSO?SVM模型,提高了供水管道工況識別的準確率。
1 支持向量機
1.1 支持向量機的基本原理
支持向量機是一種實現(xiàn)結(jié)構(gòu)風(fēng)險最小化原則的分類學(xué)習(xí)算法,它利用核函數(shù)把樣本映射到高維特征空間,然后在此空間中構(gòu)造分類間隔最大的線性分類超平面,因而向量機比較適合于小樣本數(shù)據(jù)的分類[5]。
支持向量機方法的最優(yōu)分類面是在線性可分的情況下提出的。圖1為最優(yōu)分類界限,圖中的[H]為兩種樣本的分類線,[H1,H2]分別為各類中離分類線最近且平行的直線,[H1,H2]之間的距離稱為分類間隔。最優(yōu)分類線即為分類間隔最大的分類線,使兩類樣本正確分離。
在線性不可分的情況下,圖1所示的最優(yōu)分類面在實際應(yīng)用中可能存在某些樣本不能被超平面正確分類的情況,超平面約束條件為:
式中:[b]為閾值;[ω]為分類面的法向量。對于非線性最優(yōu)分類面的求解需要引入拉格朗日乘子,廣義最優(yōu)分類面問題可以轉(zhuǎn)化為在約束條件下的最小化[iaii,jaiajxixjyiyj,]其中約束為[0≤ai≤C;][iaiyi=0;]懲罰參數(shù)[C]為非負常數(shù)。
對于支持向量機的非線性劃分,可通過非線性變換將其轉(zhuǎn)換為高維空間中的線性劃分。這里只需要將原來空間的函數(shù)在高維特征空間通過內(nèi)積運算的方式引入核函數(shù),并且采用適當?shù)膬?nèi)積核函數(shù)[Kxi,yi]使核函數(shù)滿足Mercer條件,就可實現(xiàn)此非線性變換,并且算法的復(fù)雜程度也不會有所增加,此時分類函數(shù)為:
其中,影響識別準確率的兩個重要因素為:
1) 核參數(shù)
核參數(shù)的改變本質(zhì)上是映射函數(shù)的改變,從而改變了空間樣本集分布的復(fù)雜程度。所以,只有使用適合的核函數(shù)以及核參數(shù)才能夠?qū)颖緮?shù)據(jù)映射到適合的特征空間。即選擇機器學(xué)習(xí)實際風(fēng)險最小的特征空間,才可以獲得泛化能力優(yōu)秀的支持向量機分類器。
常用的核函數(shù)有徑向基函數(shù)(其中函數(shù)寬度為核參數(shù))、多項式核函數(shù)(其中多項式系數(shù)為核參數(shù))以及Sigmoid核函數(shù)(其中尺度和衰減系數(shù)為核參數(shù))。
2) 懲罰因子
懲罰因子[C]的數(shù)值表示對經(jīng)驗誤差的敏感程度,懲罰因子與SVM的復(fù)雜度成正比,而與經(jīng)驗風(fēng)險成反比。在確定的數(shù)據(jù)子空間內(nèi)至少存在一個適合的懲罰因子使得SVM的泛化能力達到最好。
1.2 多元支持向量機
支持向量機是兩類分類器,而現(xiàn)實中管道泄漏診斷結(jié)果的分類通常是多個種類,如正常輸送、調(diào)閥、停泵和泄漏。常用構(gòu)建多元支持向量機的方法有一對一、一對多以及采用決策樹的支持向量機。
在少量的工況分類情況下,三種方法效果相當,但考慮到擴增工況識別的可能,本文采用文獻[6]中的決策樹方法構(gòu)建多元支持向量機用以判別管道泄漏和各種工況操作。其訓(xùn)練效果與一對一多元支持向量機相當,但學(xué)習(xí)訓(xùn)練和測試用時方面比常規(guī)支持向量機更短,隨著分類數(shù)量的增加,效果更加明顯,效率更高。多元支持向量機分類器的構(gòu)建如圖2所示。
2 粒子群算法優(yōu)化支持向量機
2.1 粒子群優(yōu)化算法
粒子群優(yōu)化算法的基本思想為:需要被優(yōu)化問題的潛在解就是在空間中搜索最優(yōu)粒子,將PSO算法隨機初始化為隨機粒子群,每個單獨粒子都有一個函數(shù)決定它所對應(yīng)的適應(yīng)度,并且還有一個決定它們運行軌跡的速度向量,然后粒子群會依據(jù)當前的最優(yōu)粒子在空間中進行搜索,直到通過迭代尋優(yōu)找到最優(yōu)解[7]。
粒子群優(yōu)化算法核心迭代公式如下:
式中:[vk+1i]表示第[i]個粒子在第[k+1]代時的飛行速度;[xk+1i]表示第[i]個粒子在第[k+1]代時的位置;[pki]表示第[i]個粒子到第[k]代為止所找到的最優(yōu)位置;[pkg]表示當前種群到目前為止所找到的最優(yōu)位置;[pki-xki]表示個體認知;[pkg-xki]表示社會認知;[ω]為慣性系數(shù),表示相信自己的程度;學(xué)習(xí)因子[c1,c2]為非負常數(shù),前者表示對經(jīng)驗的信服程度,后者表示對周圍個體的信服程度;[r1,r2]表示[(0,1)]的隨機數(shù)。
在整個粒子群的迭代中體現(xiàn)了粒子群優(yōu)化在尋找最優(yōu)解的過程中既保持了粒子自身的慣性,又利用個性以及社會性不斷修改和移動自身方向,最終使群體朝著最優(yōu)解靠近,并且避免了復(fù)雜的遺傳操作。
2.2 基于粒子群優(yōu)化的支持向量機
根據(jù)粒子群優(yōu)化算法的全局搜索優(yōu)勢進行支持向量機的改進,其步驟如下:
步驟1:初始化。對樣本數(shù)據(jù)進行歸一化處理并讀取樣本數(shù)據(jù)。設(shè)定參數(shù)運動范圍,設(shè)定學(xué)習(xí)因子[c1,c2、]進化代數(shù)[(E)、]懲罰因子[C]和核參數(shù)[g](本文采用徑向基核函數(shù),其核參數(shù)為函數(shù)寬度[σ])。
步驟2:適應(yīng)度評價。計算個體的適應(yīng)度值,初始化個體和全局最優(yōu)位置。
步驟3:比較尋優(yōu)。根據(jù)式(3)更新粒子的速度和位置產(chǎn)生新種群,計算新種群的個體適應(yīng)度值。分別比較當前參數(shù)[C]和[σ]的適應(yīng)值和自身歷史最優(yōu)值及種群最優(yōu)值,更新種群參數(shù)[C]和[σ]的全局最優(yōu)值。
步驟4:檢查結(jié)束條件。尋優(yōu)達到最大進化代數(shù),結(jié)束尋優(yōu),否則返回步驟2,輸出最佳參數(shù)[C]和[σ]。
隨后將優(yōu)化的參數(shù)[C]和[σ]代入SVM模型并檢測SVM的建模精度。PSO?SVM工作流程如圖3所示。
3 應(yīng) 用
3.1 實驗預(yù)處理
在實際生產(chǎn)中,除了泄漏可能引起壓力波動外,其他的一些工況操作,如啟停泵、調(diào)泵、閥門切換、調(diào)閥等同樣也會引起壓力波動信號,而且某些工況下的波動信號與泄漏引發(fā)的波動信號非常相似。
從圖4中可以看出,信號中的背景十分嘈雜,波動的特征被淹沒在噪聲中,不便于后期的機器學(xué)習(xí)分類。管道泄漏分析中必須對泄漏、停泵、調(diào)泵、調(diào)閥等引起的壓力波動信號加以準確區(qū)別。首先要對采集的信號進行濾波,本文采用小波降噪方法進行降噪處理,得到比較純凈的波形,以便于管道的泄漏診斷。
其次,泄漏波形特征參數(shù)的選擇對泄漏診斷的準確率和可靠性有一定的影響。文獻[8]中數(shù)據(jù)挖掘方法從描述供水管道壓力波動的特征參數(shù)中選擇平均幅值、均方根、方根幅值、裕度因子和峭度作為支持向量機的輸入特征。輸入特征值如表1所示。
3.2 參數(shù)的確定
本文采用Matlab進行模型的建造,其中核函數(shù)選擇在泄漏檢測領(lǐng)域支持向量機常用的RBF徑向基[9?10]核函數(shù):[K(x,y)=exp-x-y2σ2]。
按照本文2.2節(jié)步驟建立PSO?SVM模型,核參數(shù)及懲罰參數(shù)的迭代如圖5所示。得出最優(yōu)參數(shù)為:函數(shù)寬度[σ=30,]懲罰參數(shù)[C=1.5。]
由圖5可以看出,隨著粒子群算法迭代的進行,模型的準確率在87%~98%的區(qū)間內(nèi)震蕩,粒子群記錄下最優(yōu)的參數(shù)組合。相比以往的交叉驗證和網(wǎng)格搜索,粒子群算法在搜索范圍及速度方面都有比較明顯的優(yōu)勢。
3.3 測試結(jié)果
為了驗證本文PSO?SVM分類模型的泛化能力,用經(jīng)過訓(xùn)練的PSO?SVM分類器對4種運行工況下不同的樣本波形進行識別分類的檢測實驗。將待測試樣本的特征值列表按照規(guī)定的輸入格式輸入經(jīng)過PSO?SVM訓(xùn)練的模型進行工況識別。為了體現(xiàn)基于粒子群算法的支持向量機的優(yōu)缺點,建立BP神經(jīng)網(wǎng)絡(luò)以及傳統(tǒng)的SVM模型,并將他們與PSO?SVM進行性能比較。測試結(jié)果如表2所示。
由表2可以看出,PSO?SVM相對于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)和SVM不僅識別的準確率有所提升,而且訓(xùn)練用時相對較少,并且管道工況識別準確率分別提高了12%和3.5%。
為了降低常規(guī)操作導(dǎo)致的供水管道泄漏檢測的錯誤識別,采用SVM分類器從不同的工作環(huán)境中識別出泄漏的存在;采用PSO算法對模型參數(shù)進行優(yōu)化,提高了SVM分類器的泄漏識別準確率。試驗結(jié)果表明,PSO比較適用于優(yōu)化SVM,PSO?SVM算法對供水管道工況識別具有很高的辨識精度,可以很好地應(yīng)用于相關(guān)的管道泄漏診斷中。
4 結(jié) 論
本文使用粒子群優(yōu)化算法的全局優(yōu)化特性優(yōu)化支持向量機的核參數(shù)和懲罰參數(shù),建立供水管道泄漏診斷模型。通過粒子群優(yōu)化算法的全局搜索優(yōu)勢對支持向量機進行改進,使得支持向量機的參數(shù)選擇更加合理。實驗表明,基于改進的支持向量機的管道泄漏診斷模型在測試中準確率相對于以往的支持向量機以及神經(jīng)網(wǎng)絡(luò)模型有較明顯提升,有效地解決了傳統(tǒng)支持向量機中參數(shù)選擇對檢測準確率的影響,提升了對管道工況的辨識程度,同時也避免了復(fù)雜的遺傳操作,在訓(xùn)練時間上有可觀的改進。
注:本文通訊作者為陳志剛。
參考文獻
[1] 文玉梅,張雪園,文靜,等.依據(jù)聲信號頻率分布和復(fù)雜度的供水管道泄漏辨識[J].儀器儀表學(xué)報,2014,35(6):1223?1229.
WEN Y M, ZHANG X Y, WEN J, et al. Identification of water pipeline leakage based on acoustic signal frequency distribution and complexity [J]. Chinese journal of scientific instrument, 2014, 35(6): 1223?1229.
[2] 唐秀家.管道系統(tǒng)泄漏檢測神經(jīng)網(wǎng)絡(luò)與模式識別方法[J].核科學(xué)與工程,1998(3):33?40.
TANG X J. Fluid pipeline system leak detection based on neural network and pattern recognition [J]. Chinese journal of nuclearence & engineering, 1998(3): 33?40.
[3] 陳志剛,張來斌,梁偉,等.復(fù)雜工況下熱油管道泄漏識別與定位方法研究[J].西南石油大學(xué)學(xué)報,2008,30(6):157?160.
CHEN Z G, ZHANG L B, LIANG W, et al. Leak detection and positioning for hot oil pipeline under complicated conditions [J]. Journal of Southwest Petroleum University, 2008, 30(6): 157?160.
[4] VAPNIK V N. The nature of statistical learning theory [M]. 2nd ed. New York: Springer, 2000.
[5] CHEN Peng, YUAN Lifen, HE Yigang, et al. An improved SVM classifier based on double chains quantum genetic algorithm and its application in analogue circuit diagnosis [J]. Neurocomputing, 2015, 211: 202?211.
[6] 張亮,陳志剛,楊建偉,等.基于決策樹與多元支持向量機的齒輪箱早期故障診斷方法[J].計算機測量與控制,2016(1):12?15.
ZHANG L, CHEN Z G, YANG J W, et al. Early fault diagnosis of gearbox based on multiclass support vector machine and decision tree [J]. Computer measurement & control, 2016(1): 12?15.
[7] TUNGADIO D H, JORDAAN J A, SITI M W. Power system state estimation solution using modified models of PSO algorithm: comparative study [J]. Measurement, 2016, 92: 508?523.
[8] 梁偉,張來斌,王朝暉.基于數(shù)據(jù)挖掘的負壓波特征參數(shù)優(yōu)化方法[J].石油機械,2008,36(12):38?42.
LIANG W, ZHANG L B, WANG Z H. Study of optimization method of characteristic parameters of negative pressure wave based on data mining [J]. China petroleum machinery, 2008, 36(12): 38?42.
[9] YIN Shen, YIN Jiapeng. Tuning kernel parameters for SVM based on expected square distance ratio [J]. Information sciences, 2016(2): 370?371.
[10] LIU Chao, YIN Shiqun, ZHANG Miao, et al. An improved grid search algorithm for parameters optimization on SVM [J]. Applied mechanics and materials, 2014, 644: 2216?2219.