孫兆光
(莒縣青峰嶺水庫管理服務(wù)中心,山東 莒縣 276500)
農(nóng)田水利灌溉分流機(jī)械是提升農(nóng)田灌溉的關(guān)鍵設(shè)備。該設(shè)備可提高灌區(qū)排灌的整體水平,以滿足農(nóng)業(yè)的發(fā)展需求,通過合理布置和調(diào)整灌溉系統(tǒng)可以提高節(jié)水率[1]??紤]到灌區(qū)的灌排需求和飲水需求,優(yōu)化灌溉設(shè)施能夠降低設(shè)施養(yǎng)護(hù)費(fèi)用、縮短灌溉周期,提高灌溉效率[2]。在上述方式中,需要借助灌溉分流機(jī)械完成。當(dāng)灌溉分流機(jī)械出現(xiàn)異常時(shí),將影響整個(gè)灌區(qū)的灌溉效果,因此,研究農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測方法具有重要意義。
張聰?shù)萚3]針對機(jī)械變量之間存在的耦合關(guān)系,通過趨勢互相關(guān)分析方法,構(gòu)建變量耦合關(guān)系網(wǎng)絡(luò)。采用無監(jiān)督學(xué)習(xí)方法,根據(jù)變量耦合關(guān)系網(wǎng)絡(luò)構(gòu)建變分圖自編碼模型,獲取機(jī)械運(yùn)行特征,將提取的特征輸入圖卷積網(wǎng)絡(luò)中,完成機(jī)械運(yùn)行異常檢測,該方法ROC曲線檢測結(jié)果不理想,存在檢測性能差的問題。王昱棟等[4]通過感知哈希算法獲取機(jī)械圖像,利用直方圖均衡化方法增強(qiáng)機(jī)械圖像,結(jié)合Canny邊緣檢測算法和雙邊濾波算法獲取機(jī)械運(yùn)行特征,實(shí)現(xiàn)異常檢測。該方法在異常檢測過程中容易出現(xiàn)漏檢現(xiàn)象,存在檢測率低問題。張西寧等[5]將邊界軟化率引入格雷厄姆掃描法中,通過射線法構(gòu)成數(shù)據(jù)集,將其輸入隨機(jī)森林模型中,完成異常檢測,該方法檢測異常所用的時(shí)間較長,存在檢測效率低的問題。
為了解決上述方法中存在的問題,提出基于支持向量機(jī)的農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測方法。
為實(shí)現(xiàn)農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測,采用自組織映射算法聚類灌溉分流機(jī)械運(yùn)行數(shù)據(jù),作為研究的基礎(chǔ)數(shù)據(jù),為后續(xù)的檢測實(shí)現(xiàn)奠定基礎(chǔ)。
自組織映射算法由輸入層和競爭層構(gòu)成,屬于層次性神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[6-7]。其中,輸入層主要作用是將接收的輸入信息傳遞到下一層中,競爭層主要目的是比較神經(jīng)網(wǎng)絡(luò)細(xì)胞元和輸入信息,根據(jù)比較結(jié)果分類信息。采用自組織映射算法處理水利灌溉分流機(jī)械運(yùn)行數(shù)據(jù)的具體過程如下所述。
a.用C表示灌溉分流機(jī)械運(yùn)行數(shù)據(jù),用ξj表示神經(jīng)元在自組織映射網(wǎng)絡(luò)競爭層中的加權(quán)向量,歸一化處理C、ξj的表達(dá)式為
(1)
(2)
c.根據(jù)競爭學(xué)習(xí)法可知,在自組織映射網(wǎng)絡(luò)中獲勝神經(jīng)元的輸出為
(3)
ui為輸出的神經(jīng)元結(jié)果;t為輸出的當(dāng)前時(shí)刻;j為神經(jīng)元的加權(quán)向量;j*為神經(jīng)元的一般向量。
獲勝的神經(jīng)元在自組織映射網(wǎng)絡(luò)中可以根據(jù)下述規(guī)則對加權(quán)向量ξj調(diào)整:
(4)
β為在區(qū)間[0,1]內(nèi)取值的學(xué)習(xí)效率,在不斷的迭代過程中學(xué)習(xí)效率不斷減小。
采用自組織映射算法聚類處理水利灌溉分流機(jī)械運(yùn)行數(shù)據(jù)的具體流程如圖1所示。
圖1 農(nóng)田水利灌溉分流機(jī)械數(shù)據(jù)聚類流程
在上述灌溉分流機(jī)械運(yùn)行數(shù)據(jù)聚類基礎(chǔ)上,采用尺度不變特征變換SIFT方法[8-9]提取水利灌溉分流機(jī)械數(shù)據(jù)的運(yùn)行特征。該方法可獲取水利灌溉分流機(jī)械的局部信息,提取的運(yùn)行特征點(diǎn)可反映農(nóng)田水利灌溉分流機(jī)械的運(yùn)行狀態(tài)。
在固定尺寸中水利灌溉分流機(jī)械運(yùn)行的局部特征信息具有不變特點(diǎn),用Q(x,y,ζ)表示分流機(jī)械運(yùn)行圖像O(x,y)中存在的空間信息,其計(jì)算式為
Q(x,y,ζ)=O(x,y)*H(x,y,ζ)
(5)
ζ為幅度可變因子;*為卷積;(x,y)為特征點(diǎn)位置;H(x,y,ζ)為高斯函數(shù),其表達(dá)式為
(6)
構(gòu)建高斯平方差函數(shù)F(x,y,ζ),在不同幅度狀態(tài)下提取農(nóng)田水利灌溉分流機(jī)械運(yùn)行的特征點(diǎn),即
F(x,y,ζ)=[G(x,y,μζ)2-G(x,y,ζ)2]*g(x,y)
(7)
μ為檢測閾值參數(shù)。
在提取灌溉分流機(jī)械運(yùn)行特征的基礎(chǔ)上,本文借助支持向量機(jī)完成農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測。在支持向量機(jī)中引入免疫算法[10-11]實(shí)現(xiàn)農(nóng)田水利灌溉分流機(jī)械運(yùn)行的異常檢測。
設(shè)g(u)為支持向量機(jī)的誤差上限值,通過免疫算法優(yōu)化g(u),使其最小,具體步驟如下所述。
a.抗體二進(jìn)制編碼通常情況下由3個(gè)部分構(gòu)成,分別為支持向量機(jī)的樣本特征、誤差懲罰因子V和核函數(shù)參數(shù)η[12-13]。A=[a1,a2,…,al],A為參數(shù)集合,其中,l為參數(shù)編碼對應(yīng)長度,編碼通常情況下由0或1構(gòu)成。
農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測方法將核函數(shù)參數(shù)η設(shè)定在[0.000 1,20 000]內(nèi),將誤差懲罰因子V設(shè)定在[1,200]內(nèi)。用G=[g1,g2,…,gd]表示水利灌溉分流機(jī)械運(yùn)行數(shù)據(jù)的特征集,d表示該集合的大小,通過二進(jìn)制編碼表示機(jī)械運(yùn)行數(shù)據(jù)的特征選擇,D=[d1,d2,…,dd],D為機(jī)械運(yùn)行數(shù)據(jù)特征選擇的總集合。通過上述分析可知,可通過參數(shù)和特征的組合表示抗體的二進(jìn)制編碼S=[A,D]。
b.通過匹配灌溉分流機(jī)械運(yùn)行異常檢測問題的特征和記憶細(xì)胞庫中存在的結(jié)構(gòu)信息構(gòu)成初始抗體群。
c.將支持向量機(jī)的誤差上限值g(u)作為標(biāo)準(zhǔn),獲得抗體與抗原之間的親和力Sv,即
(8)
k為抗體v選擇的特征總數(shù);f為特征數(shù)量。
d.更新群體后,在抗體記憶細(xì)胞庫中引入與抗原存在最大親和力的抗體,下次在遇到相同問題時(shí),直接在記憶細(xì)胞庫中獲得答案,縮短尋找答案所用的時(shí)間。
e.抗體之間的相似度可通過抗體濃度描述,抗體產(chǎn)生的抑制與刺激可通過相似度度量得以控制,進(jìn)而實(shí)現(xiàn)抗體多樣性的控制,設(shè)Nvw為抗體之間存在的相似度,其計(jì)算式為
(9)
R(2)為抗體v、w之間存在的平均信息熵。
根據(jù)相似度計(jì)算結(jié)果獲得抗體v的濃度cv,其表達(dá)式為
(10)
f.抗體進(jìn)入下一代的過程具有隨機(jī)性,親和力會(huì)影響克隆的概率,即當(dāng)抗體與其他抗體親和力低、與抗原親和力高時(shí),克隆的幾率較大。用av表示抗體選擇的概率,即
(11)
β、χ均為加權(quán)系數(shù);M為抗原數(shù)量;vv為濃度抑制概率。
g.新抗體是原始抗體做變異和交叉操作生成,抗體交換信息可描述新抗體生成過程。農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測方法通過高斯變異[14-15]和單點(diǎn)交叉生成新個(gè)體。
h.為避免算法出現(xiàn)局部最優(yōu)解問題,需要對抗體集合做更新處理,記憶細(xì)胞集中存在的記憶細(xì)胞通過不斷迭代構(gòu)成抗體群。
i.將提取的特征輸入支持向量機(jī)中,設(shè)置終止條件,滿足條件的個(gè)體即為最佳個(gè)體,獲得農(nóng)田水利灌溉分流機(jī)械運(yùn)行的異常檢測結(jié)果。
結(jié)合支持向量機(jī)和免疫算法實(shí)現(xiàn)農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測的具體流程如圖2所示。
圖2 異常檢測流程
為驗(yàn)證本文方法的整體有效性,將文獻(xiàn)[3]方法和文獻(xiàn)[4]方法作為對比方法,進(jìn)行實(shí)驗(yàn)測試。
在農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測時(shí),實(shí)驗(yàn)中以某地大型農(nóng)田水利灌溉分流機(jī)械為研究對象進(jìn)行實(shí)驗(yàn)分析。本次實(shí)驗(yàn)中評價(jià)指標(biāo)選取接收者操作特征曲線ROC下面積,即AUC概率,對本文方法、文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的有效性進(jìn)行檢測。真陽率和假陽率分別為ROC曲線的縱坐標(biāo)和橫坐標(biāo),真陽率越高、假陽率越低,曲線下面積越大,即方法的性能越好,設(shè)TP為真陽率,其計(jì)算式為
(12)
nT為判定正常狀態(tài)為正常狀態(tài)的次數(shù);nF為判定正常狀態(tài)為異常狀態(tài)的次數(shù)。
設(shè)FP為假陽率,其計(jì)算式為
(13)
nR為判定異常狀態(tài)為正常狀態(tài)的次數(shù);nN為判定異常狀態(tài)為異常狀態(tài)的次數(shù)。
本文方法、文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的ROC曲線如圖3所示。
圖3 不同方法的ROC曲線
由圖3可知,與其他2種方法相比,本文方法構(gòu)成的ROC曲線面積較大,表明本文方法的真陽率高于假陽率,在農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測過程中具有較好的性能。
在2種典型實(shí)驗(yàn)環(huán)境下采用本文方法、文獻(xiàn)[3]方法和文獻(xiàn)[4]方法檢測農(nóng)田水利灌溉分流機(jī)械運(yùn)行狀態(tài),對比不同方法的檢測率,測試結(jié)果如圖4所示。
由圖4可知,隨著時(shí)間和樣本數(shù)量的增加,本文方法、文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的檢測率均有所下降, 表明樣本數(shù)量和機(jī)械運(yùn)行時(shí)間會(huì)影響上述方法的檢測率。上述方法在實(shí)驗(yàn)環(huán)境2中的檢測率明顯高于實(shí)驗(yàn)環(huán)境1中的檢測率,對比測試結(jié)果發(fā)現(xiàn),在相同時(shí)間和相同樣本數(shù)量下,本文方法的檢測率在不同實(shí)驗(yàn)環(huán)境中均高于文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的檢測率,這是由于本文方法對機(jī)械運(yùn)行狀態(tài)檢測之前通過自組織映射算法對機(jī)械的運(yùn)行狀態(tài)數(shù)據(jù)進(jìn)行聚類,提高了方法的檢測率。
圖4 不同方法的檢測率
將檢測時(shí)間作為指標(biāo),采用上述方法檢測農(nóng)田水利灌溉分流機(jī)械運(yùn)行的狀態(tài),對比不同方法的檢測效率,結(jié)果如表1所示。
表1 不同方法的檢測效率
表1(續(xù))
由表1中的數(shù)據(jù)可知,在多次異常檢測測試中本文方法的檢測時(shí)間均控制在0.1 s左右,遠(yuǎn)低于文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的檢測時(shí)間,表明本文方法具有較高的檢測效率。
檢測農(nóng)田水利灌溉分流機(jī)械的運(yùn)行狀態(tài),可以提高灌溉工程的用水效率、有利于管道的施工和管理。針對異常檢測方法存在檢測性能差、檢測率低和檢測效率低等問題,提出基于支持向量機(jī)的農(nóng)田水利灌溉分流機(jī)械運(yùn)行異常檢測方法。該方法借助支持向量機(jī)完成農(nóng)田水利灌溉分流機(jī)械運(yùn)行的異常檢測,提升了農(nóng)田水利灌溉分流機(jī)械的運(yùn)行效率,具有一定可行性。