陳永政
(重慶財經(jīng)職業(yè)學院 應用技術學院,重慶 402160)
城市需水預測是城市水資源規(guī)劃、管理、決策的重要依據(jù)。隨著人口與經(jīng)濟活動的增加、生活水平的提高、城市化以及氣候變化帶來的不確定性,世界各地的水資源短缺問題日益突出[1]。水資源和供水系統(tǒng)的優(yōu)化規(guī)劃變得越來越重要,需水量預測是供水優(yōu)化調(diào)度的依據(jù),同時為確定新水資源開發(fā)時間提供參考。需水量的科學預測有利于水資源優(yōu)化配置,預測的準確性對供水系統(tǒng)安全經(jīng)濟運行起著重要作用[2]。城市需水量預測是供水系統(tǒng)有效運行的關鍵環(huán)節(jié)?;貧w模型法、時間序列法等傳統(tǒng)方法在供水量預測方面要求建立預測量與影響因素之間準確的機理模型、大量線性化處理降低模型精度,具有較大的不確定性和模糊性,普適性較差,而基于經(jīng)驗風險最小化的神經(jīng)網(wǎng)絡為需水預測提供了新思路[3]。郭強等[4]采用貝葉斯BP神經(jīng)網(wǎng)絡對校園日用水量波動范圍進行了有效預測。Zubaidi等[5]提出了結(jié)合粒子群與人工神經(jīng)網(wǎng)絡的新方法,通過評估氣候因素進行需水量預測。然而,城市需水量預測模型中影響因子多且普遍存在多重共線問題,BP神經(jīng)網(wǎng)絡在求解模型時易陷入局部極值[6]。
為提升需水預測的準確性,筆者把基于結(jié)構(gòu)風險最小化的最小二乘支持向量機(LSSVM)[7]作為需水量預測的擬合模型?;依莾?yōu)化算法(GWO)具有易理解、控制參數(shù)少、不要求目標函數(shù)和優(yōu)化條件可微等特點而得到廣泛應用[8-9]。針對GWO尋優(yōu)過程易陷入局部最優(yōu)的問題,采用一般性反向?qū)W習與非線性控制參數(shù)對其進行改進,以提升其全局優(yōu)化性能,改進后的算法記為IGWO。IGWO算法更適合非線性模型參數(shù)的擬合,而LSSVM模型的超參數(shù)確認過程也是復雜的非線性擬合問題,因此將其引入LSSVM需水預測模型,用來擬合模型的超參數(shù),構(gòu)建IGWO-LSSVM城市需水預測模型。以上海市為例,采用近35 a城市供水數(shù)據(jù)建立IGWO-LSSVM需水預測模型,驗證灰狼優(yōu)化算法在城市需水預測模型中的有效性,以期為城市水資源綜合管理規(guī)劃提供參考。
最小二乘支持向量機(LSSVM)是支持向量機(SVM)的一種改進,它將復雜、高維的非線性問題映射到特征線性空間,并將優(yōu)化問題轉(zhuǎn)化為對偶凸二次規(guī)劃,用于解決高維、非線性、小樣本的問題,因具有良好的泛化能力而得到廣泛應用[10]。設訓練數(shù)據(jù)集為{xi,yi},其中:i=1,2,…,l;xi∈Rn;yi∈R(R為實數(shù)集,n為維數(shù))。利用非線性映射φ(·)將樣本從原空間Rn映射到特征空間。在高維空間構(gòu)造回歸函數(shù)[11]:
式中:ω為可調(diào)權(quán)向量;φ(x)為非線性映射函數(shù);b為偏置參數(shù)。
根據(jù)結(jié)構(gòu)風險最小化準則,可得最優(yōu)ω與b:
式中:‖ω‖2為控制模型的復雜度;為誤差控制函數(shù);C為正則化參數(shù),用于平衡訓練誤差與模型適應度;ξi為擬合隨機誤差。
引入Lagrange乘子α,構(gòu)造拉格朗日函數(shù),得到無約束優(yōu)化問題:
根據(jù)Karush-Kuhn-Tucker條件,分別求解L對ω、b、ξ和αi的偏微分,并消除ω和ξ,以矩陣形式表示為
式 中:e=[1,1…,1]T;y=[y1,…,yl];α=[α1,…,αl]Τ;Ω為對稱矩陣,矩陣中的元素Ωij=φ(xi)φ(xj)=K(xi,xj),其中j=1,2,…,l;K(xi,xj)為核函數(shù),為解決原空間中樣本非線性擬合問題,采用徑向基函數(shù)。
求解優(yōu)化問題后,得到回歸模型的線性表達式:
GWO算法是Mirjalili等[11]受灰狼群體中的捕食行為和社會等級啟發(fā)而提出的群智能優(yōu)化算法?;依欠N群社會等級如圖1所示,其中:θ狼的位置代表最優(yōu)位置,對應求解問題的最優(yōu)解;β、δ狼的任務是協(xié)助θ狼對狼群進行管理及參與捕獵過程中的決策,其位置代表第2優(yōu)、第3優(yōu)位置,對應求解問題的2個次優(yōu)解;ε狼代表其他普通灰狼,其位置對應解空間中的剩余候選解。GWO算法通過模擬灰狼包圍、追捕、攻擊等捕食行為逐步更新自身位置,從而實現(xiàn)全局優(yōu)化。
圖1 灰狼種群等級制度
假設種群規(guī)模為N的灰狼群為{xi|i=1,2,…,N},解空間為D維,GWO算法數(shù)學模型[12]表達式為
式中:B為灰狼與獵物間的距離;xi(t)、xi(t+1)分別為t和t+1時刻第i灰狼的位置;xp(t)為獵物的位置(當前最優(yōu)解);C為系數(shù),表示圍捕獵物過程中所受自然界的阻礙作用,C>1或C<1表示加大或減小獵物距離;A為收斂因子,控制灰狼個體趨向或者遠離當前獵物。
A、C計算公式為
式中:r1、r2為[0,1]內(nèi)的隨機數(shù);a為控制參數(shù),從2線性遞減至0;T為迭代周期。
GWO算法中,灰狼種群中其他灰狼xo(t)在t+1時刻的位置通過θ、β、δ狼t時刻的位置進行更新:
式中:xθ、xβ、xδ分別為θ、β、δ狼的當前位置;x1(t+ 1)、x2(t+ 1)、x3(t+ 1)分別為θ、β、δ狼在t+1時刻的位置。
GWO算法的尋優(yōu)過程是由3個較優(yōu)解θ、β、δ狼主導,易造成算法早熟收斂并陷入局部最優(yōu)。采用反向?qū)W習策略對候選解與其反向解所構(gòu)造的解空間同時搜索,可提升算法的搜索能力,而非線性自適應控制參數(shù)可平衡灰狼優(yōu)化算法的開發(fā)和探索能力、提高全局優(yōu)化能力。改進的灰狼優(yōu)化算法(IGWO)即將GWO算法引入一般性反向?qū)W習和非線性控制參數(shù)策略。
2.2.1 一般性反向?qū)W習策略
反向?qū)W習(OBL)[13]通過評估當前可行解與其反向解,保留較優(yōu)秀解以便更好地逼近當前候選解,OBL的思想已經(jīng)被許多研究者用來提高各種優(yōu)化方法的收斂速度。在一維空間中,假設是粒子xj的反向解,則定義為
式中:xj∈[aj,bj],aj、bj分別為變量的下限、上限。
Wang等[14]將通過當前搜索空間中的候選對象轉(zhuǎn)換為新的搜索空間的對象,提出了一般性反向?qū)W習(GOBL)模型。設xi=(xi,1,xi,2,…,xi,D)是D維空間中的一個個體,反向解為),則第j維方向點表達式為
其中
式中:k為U(0, 1)范圍內(nèi)的隨機數(shù);daj、dbj分別為第j維搜索空間的最小值、最大值。
若越界,將采用下式進行重置:
倘若我們手持的是一卷“粼粼的微波下潛伏著洶涌暗浪”的憂患之作,則恐怕難得“瀟灑”而要為之擊節(jié)共鳴、扼腕長嘆了。而此刻筆者案頭所置的便是這樣一冊由著名劇作家、散文家柯靈先生所著的《墨磨人》!
假設f(xi)是一個適應度函數(shù),用于表示候選解的適應度。當且僅當f()優(yōu)于f(xi)時,用取代xi。對候選解與其反向解所構(gòu)造的解空間同時搜索,將大大提高最優(yōu)解質(zhì)量。
2.2.2 非線性控制參數(shù)策略
實現(xiàn)GWO算法全局探索和局部開發(fā)之間的平衡是保證算法全局搜索性能的關鍵。全局探索能力指探測更廣泛搜索區(qū)域的能力,局部開發(fā)則強調(diào)利用已有信息對群體的某些區(qū)域進行精細搜索。在GWO算法中,收斂因子A調(diào)節(jié)全局探索和局部開發(fā)之間的平衡,而A的值隨控制參數(shù)a的變化而改變,因此控制參數(shù)a在很大程度上決定著全局探索和局部開發(fā)之間的平衡度。式(10)中控制參數(shù)a由2線性遞減至0,而求解復雜優(yōu)化問題時,線性遞減策略往往不利于實際搜索。因此,設計一種非線性控制參數(shù)策略,對之前的線性遞減的控制參數(shù)進行動態(tài)調(diào)整:
式中:fi為個體i的適應度;fmin、favg分別為當前種群中最小適應度和平均適應度。
當fi>favg時,取得較大權(quán)值,從而增大個體的活躍度;反之,取得較小權(quán)值,使狼群個體更多地被θ、β、δ狼吸引,從而向優(yōu)勢搜索空間靠攏。此外,當個體趨于收斂或一致時,即|favg-fmin|較小時,a隨之增大;當較分散時,即|favg-fmin|較大,a隨之減小。因此,式(18)控制參數(shù)更新策略更有利于全局搜索與局部探測能力的平衡。
2.2.3 IGWO算法步驟
(1)初始化參數(shù)、群體規(guī)模和最大迭代次數(shù)。
(3)采用式(18)計算控制參數(shù)。
(4)采用式(8)~式(10)計算A、C。
(5)按式(11)、式(12)更新種群中個體位置。
(6)計算適應度值,更新θ、β、δ狼的位置。
(7)判斷終止條件是否滿足。若滿足,則輸出最優(yōu)解;否則轉(zhuǎn)至步驟(3)繼續(xù)迭代。
采用RBF的LSSVM模型有正則化參數(shù)和核寬度兩個超參數(shù),需要在回歸過程中進行優(yōu)化,其中:正則化參數(shù)決定經(jīng)驗風險和置信范圍的比例,核寬度決定樣本數(shù)據(jù)映射到特征空間分布的復雜性且影響模型在特征空間中獲得最優(yōu)分類超平面的泛化性能。因此,本文采用IGWO算法優(yōu)化模型超參數(shù),以進一步提升LSSVM模型的需水預測泛化能力。主要步驟:①選取需水量試驗數(shù)據(jù)并進行歸一化處理,初始化IGWO和LSSVM模型參數(shù);②將RMSE作為優(yōu)化過程的目標函數(shù),以目標函數(shù)值最小為原則,采用IGWO模型優(yōu)化LSSVM模型的兩個參數(shù);③采用最優(yōu)的超參數(shù)構(gòu)建LSSVM模型,并對測試集數(shù)據(jù)進行預測驗證。IGWOLSSVM模型計算流程見圖2。
圖2 IGWO-LSSVM模型計算流程
采用IGWO-LSSVM模型進行需水量預測。城市供水系統(tǒng)復雜,需水量具有非線性和隨機波動性,其變化受氣候、降水量、工業(yè)用水量、居民用水量等多種因素影響。本文提出一種基于最小二乘支持向量機的時間序列需水量預測方法,用于預測城市用水量變化的總體趨勢。崔東文等[15]采用SPSS軟件對用水序列進行自相關分析時,指出當滯后數(shù)為4時,預測模型具有較好的預測效果,因此本文選用前4 a的供水量作為輸入變量,以當前年份的供水量作為輸出變量。表1給出1985—2019年上海市自來水供水量數(shù)據(jù),共35組。隨機選擇30組數(shù)據(jù)用作訓練集,采用訓練集數(shù)據(jù)對IGWO-LSSVM模型進行訓練并建立需水預測模型,剩余5組數(shù)據(jù)用于測試模型的性能。
表1 上海市自來水逐年供水量 億m3
為了驗證IGWO-LSSVM模型的性能,采用剩余5組數(shù)據(jù)對訓練后的模型進行測試,并與PSO-LSSVM模型、GWO-LSSVM模型的測試結(jié)果進行對比,見表2??傮w而言,PSO-LSSVM、GWO-LSSVM、IGWOLSSVM三種模型均能對5組測試樣本做出合理預測,前2種模型的平均相對誤差(1.82%、1.86%)均較為接近,而IGWO-LSSVM模型平均相對誤差為0.78%,比前2種模型平均相對誤差更小、精度更高,表明改進后的IGWO具有更好的全局優(yōu)化能力、能尋找出更優(yōu)的模型超參數(shù),可有效解決城市需水預測問題。
表2 模型預測效果
針對城市需水預測模型中需水量影響因子眾多且非線性的問題,提出一種基于最小二乘支持向量機的非線性預測模型,以提升城市需水預測的準確性。模型的超參數(shù)決定著LSSVM模型的泛化性能,提出采用IGWO對其進行優(yōu)化。通過引入一般性反向?qū)W習與非線性控制參數(shù)策略,以改善其全局優(yōu)化性能,進而提高超參數(shù)優(yōu)化選擇能力。采用構(gòu)建的IGWO-LSSVM模型對上海市需水量進行預測,結(jié)果顯示該模型平均相對誤差為0.78%,比PSO-LSSVM模型、GWO-LSSVM模型的預測精度更高,表明改進的灰狼優(yōu)化算法在城市需水預測模型中具有較強的優(yōu)勢。