鄭浩然 潘雨青 李世偉 徐愛平
1 (江蘇大學計算機科學與通信工程學院 江蘇 鎮(zhèn)江 212000) 2(常州安控電器成套設(shè)備有限公司 江蘇 常州 213300)
隨著城市建設(shè)加快,高層建筑日益增多,二次供水設(shè)施已成為城市供水管網(wǎng)建設(shè)中不可缺少的一部分。然而,在當前的二次供水方案中,仍然存在一定的安全隱患,例如因設(shè)定不合理的壓力導致供水主管網(wǎng)在部分地區(qū)產(chǎn)生負壓,影響供水管網(wǎng)的安全[1]。研究對二次供水設(shè)施進行遠程監(jiān)控、狀態(tài)預測及智能遠程控制具有以下的意義:
(1) 實時傳輸管網(wǎng)數(shù)據(jù)使得管理員能夠及時掌控現(xiàn)場信息;
(2) 狀態(tài)預測及故障判定能夠為巡檢與維修人員提供參考;
(3) 通過了解小區(qū)內(nèi)的用水情況,能夠制定更合適的管網(wǎng)控制策略,從而降低整體的能耗并提高設(shè)備的壽命。
當前,已有較多人從不同的方面對管網(wǎng)供水進行了研究。
在對供水設(shè)施的遠程監(jiān)控方面,通常是采用SCADA系統(tǒng)(Supervisory control and data acquisition system),即數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)。在SCADA系統(tǒng)構(gòu)建方面,廖曙江等[2]構(gòu)建了基于GPRS、無線射頻傳輸及CAN總線等遠程建筑消防水壓實時監(jiān)控系統(tǒng)。付剛等[3]利用GPRS遠傳模塊和水壓監(jiān)測裝置等建立了二次供水管理系統(tǒng),并將其用于聊城市二次供水。在上述系統(tǒng)中,雖然都對數(shù)據(jù)進行了采集,但是數(shù)據(jù)未能被充分挖掘,也并未涉及到如何通過分析數(shù)據(jù)來影響下一步對管網(wǎng)的控制過程。
在對供水設(shè)施的狀態(tài)預測方面,練庭宏等[4]使用ARIMA模型對月度水需求進行預報。在文獻[5]中,Mahmut Firat等通過人工神經(jīng)網(wǎng)絡(luò)技術(shù)對月度需水量進行了預測。
在上述的方案中,文獻[4-5]均是以月為周期進行分析,屬于中長期的預測,中長期的預測結(jié)果往往難以直接體現(xiàn)在遠程控制的過程中。而在本文的方案中采用24小時作為分析的周期,預測的速度能夠達到小時,即能夠預測下一個小時的用水狀態(tài)。本文方案提高了預測的實時性,使得預測結(jié)果更適用于實時的遠程控制。
為了進一步挖掘所預測結(jié)果的價值,本文提出,將預測的結(jié)果用于協(xié)助判定管網(wǎng)所存在的狀態(tài)異常。這是由于通常爆管等異常都伴隨著水壓等明顯變化[6],此時,水壓通常會大幅度偏離正常值。
在對供水管網(wǎng)的異常檢測方面,有較多人已經(jīng)進行了研究。程偉平等[7]將加權(quán)最小誤差法用于供水管網(wǎng)的爆管水力模型的建立,Wu等[8]運用數(shù)據(jù)驅(qū)動的聚簇算法來進行爆管檢測。Christopher Hutton等[9]提出了基于貝葉斯需求預測方法的供水系統(tǒng)的實時爆管檢測方案;文玉梅等[10]對聲信號頻率分布和復雜度進行了分析,并將譜寬參數(shù)和近似熵用于供水管道泄漏辨識。
上述方案為異常檢測與定位提供了實現(xiàn)手段。但對于上述方案,通常對歷史數(shù)據(jù)的規(guī)模及傳感器的精度與數(shù)量有較高的要求。本方案適合用于小區(qū)的供水預測、異常檢測及遠程控制的原因如下: ARIMA模型所需要的歷史數(shù)據(jù)量較少;使用PLC采集常規(guī)的數(shù)據(jù)如進水壓力、頻率、功率即可,無需采集聲音等信息,成本較低,便于實施;本模型的預測速度快,能夠及時發(fā)現(xiàn)小區(qū)供水管網(wǎng)中存在的異常。并能夠及時通知管理員去現(xiàn)場排查問題,或直接通過服務(wù)器進行遠程控制,并通知相關(guān)人員及時到現(xiàn)場進行查看。
通過將物聯(lián)網(wǎng)技術(shù)、時間序列分析技術(shù)及遠程控制技術(shù)運用到無負壓供水的監(jiān)控與反饋控制中,能夠?qū)π^(qū)供水進行實時預測,并能及時發(fā)現(xiàn)供水管網(wǎng)的異常及進行遠程反饋控制,在保障了系統(tǒng)安全的同時,降低了運維成本,具有顯著的經(jīng)濟效益及社會效益。
時間序列是指將同一統(tǒng)計指標的數(shù)值按其發(fā)生的時間先后順序排列而成的數(shù)列。時間序列分析的主要目的是根據(jù)已有的歷史數(shù)據(jù)對未來進行預測,其被廣泛應(yīng)用于經(jīng)濟預測、用電量預測、天氣預報及地震預報等。
ARIMA模型全稱為自回歸求和滑動平均模型(Autoregressive Integrated Moving Average Model),是一種著名的時間序列預測模型。該模型首先對原始時間序列進行平穩(wěn)化處理,再對平穩(wěn)化后的時間序列建立自回歸滑動平均模型,通過有效性檢驗的模型將能被用于時間序列預測。對于ARIMA模型,通常分為非季節(jié)性ARIMA模型與季節(jié)性ARIMA模型。其中,季節(jié)性ARIMA模型適合用于具有明顯的周期性特征的時間序列。
季節(jié)性ARIMA模型是引入了季節(jié)項的ARIMA模型。也就是說,季節(jié)性ARIMA包含了非季節(jié)項和季節(jié)項。該模型可以寫作ARIMA(p,d,q)×(P,D,Q)S。其中,p為非季節(jié)性自回歸階數(shù),d為非季節(jié)性差分階數(shù),q為非季節(jié)性移動平均階數(shù),P為季節(jié)性自回歸階數(shù),D為季節(jié)性差分階數(shù),Q為非季節(jié)性移動平均階數(shù),S為有重復模式的周期。
當考慮差分運算時,上述季節(jié)性ARIMA模型可以寫作:
(1)
式中:wt為獨立擾動或隨機誤差;B為后移算子,有Bxt=xt-1;▽為差分算子,其中▽xt=xt-xt-1=(1-B)xt,因此有▽=1-B,進一步有▽d=(1-B)d。
(1)φp(B)為p階非季節(jié)性自回歸運算符,其定義為φp(B)=1-φ1B-…-φpBp。
(2)θq(B)為q階非季節(jié)性移動平均運算符,其定義為θq(B)=1+θ1B+…+θqBq。
(3) ▽d為d階非季節(jié)性差分運算符,其定義為▽d=(1-B)d。
(4)ΦP(BS)為以S為周期的時間序列的P階季節(jié)性自回歸運算符,其定義為ΦP(BS)=1-Φ1BS-…-ΦPBPS。
(5)ΘQ(BS)為以S為周期的時間序列的Q階季節(jié)性移動平均運算符,其定義為ΘQ(BS)=1+Θ1BS+…+ΘQBQS。
在上述的季節(jié)性時間序列中:
(3)ΘQ(BS)θq(B)wt為移動平均項。
在對季節(jié)性ARIMA模型的模型識別過程中,關(guān)鍵是對p、d、q和P、D、Q進行定階,并對各φ、θ、Φ、Θ所對應(yīng)的參數(shù)進行估計。經(jīng)過上述步驟,最終得到的模型將能被用于時間序列預測。
當對于ARIMA(0,1,1)×(0,1,1)12,根據(jù)季節(jié)性ARIMA模型公式可得:
整理可得:
xt=xt-1+xt-12-xt-13+wt+θ1wt-1+
Θ1wt-12+θ1Θ1wt-13
式中:θ1和Θ1為需要進一步估計的參數(shù),常用的估計方法有矩估計[11]、最小二乘估計[12]及最大似然估計[13]等。
步驟如下:
(1) 對數(shù)據(jù)進行預處理,并畫出時間序列圖。
(2) 對時間序列平穩(wěn)性進行識別,包含對非平穩(wěn)時間序列的平穩(wěn)化處理。
(3) 對第(2)步中的非白噪聲時間序列進行模型識別與模型定階。
(4) 對第(3)步所得到的模型進行參數(shù)估計。
(5) 對第(4)步所產(chǎn)生的模型進行檢驗,如果檢驗通過,則轉(zhuǎn)至步驟(6),否則轉(zhuǎn)至步驟(3)。
(6) 根據(jù)第(5)步中的模型,建立預測模型,并將其用于實際預測。
ARIMA 模型的建模流程如圖1所示。
圖1 ARIMA模型建模流程圖
通過物聯(lián)網(wǎng)技術(shù),使用數(shù)據(jù)透傳模塊來實現(xiàn)對供水設(shè)備的實時運行數(shù)據(jù)采集及遠程控制。其中,數(shù)據(jù)透傳模塊具有串口通信及網(wǎng)絡(luò)通信的功能,其通過串口接收PLC所采集的數(shù)據(jù)或向PLC發(fā)送遠程控制命令,并使用以太網(wǎng)或GPRS與服務(wù)器進行數(shù)據(jù)及命令交互。服務(wù)器負責對歷史數(shù)據(jù)及實時數(shù)據(jù)的統(tǒng)計分析,并根據(jù)分析結(jié)果發(fā)送控制命令給數(shù)據(jù)透傳模塊,以實現(xiàn)對工控現(xiàn)場的智能控制。
在數(shù)據(jù)分析階段,首先對數(shù)據(jù)進行預處理并繪制所需的圖形。樣本數(shù)據(jù)如表1所示。
表1 用于分析的樣本數(shù)據(jù)
在對所采集的數(shù)據(jù)經(jīng)過預處理等操作之后,建立如圖2所示的時間序列圖。從圖上可以看出,各類數(shù)據(jù)具有明顯的周期性,下面將進一步分析。
圖2 運行數(shù)據(jù)的時間序列圖
通過對所采集的數(shù)據(jù)以24小時為周期建立如圖3所示的月份圖,可以觀察到每個參數(shù)本身及各個參數(shù)之間存在如下的相關(guān)性:
(1) 通過進水壓力曲線(圖3(a))可以看出,水壓在0點至5點之間時處于較高水平(0.4 MPa),在5點到8點之間水壓存在明顯的下降,而在下午3點到晚上8點之間的水壓也存在下降的趨勢。該趨勢符合文中小區(qū)的用水規(guī)律,即:早上5點之后漸漸進入用水高峰期,在15點之后又有一輪用水小高峰。
(2) 通過頻率曲線(圖3(c))可以看出,其與進水壓力呈現(xiàn)明顯的負相關(guān)。原因是:當進水壓力低時,需要升高變頻器的頻率;當進水壓力高時,需要降低頻率,這兩個因素相互影響。頻率調(diào)節(jié)的目的是為了保證出水壓力的穩(wěn)定。
(3) 通過出水壓力曲線(圖3(b))可以看出,出水壓力在進水壓力和頻率的共同影響下,處于穩(wěn)定(水壓位于0.449 5 MPa與0.449 9 MPa之間)。
(4) 通過功率曲線(圖3(d))可以看出,其與變頻器的頻率存在明顯的正相關(guān)。原因是運行頻率的升高將導致功率的上升。
圖3 各數(shù)據(jù)的月份圖(monthplot)
通過上述分析,可知各個參數(shù)之間存在一些相關(guān)性,為了降低建模的復雜度,提升預測的效率,故在下文中對各個參數(shù)之間的相關(guān)度進行計算。由于所采集的頻率和功率與進水壓力呈現(xiàn)明顯的負相關(guān),因此已提前對它們的符號進行了處理 (頻率和功率取負值后再進行計算),以便于在相關(guān)圖進行排序。表2給出了各變量的相關(guān)系數(shù)矩陣。
表2 各變量的相關(guān)系數(shù)矩陣
相關(guān)系數(shù)矩陣通常不易觀察,故繪制如圖4所示的相關(guān)圖,以便直觀地查看不同變量之間的相關(guān)性。在本方案中,采用相關(guān)度較高的運行頻率(或進水壓力) 進行分析。
圖4 各變量的相關(guān)圖
圖5是根據(jù)本時間序列數(shù)據(jù)繪制的小提琴圖。小提琴圖結(jié)合了箱線圖和核密度圖的優(yōu)點,即:箱線圖僅僅顯示了平均值、中位數(shù)、四分位數(shù)范圍等統(tǒng)計數(shù)據(jù),而小提琴圖則顯示了數(shù)據(jù)的完整分布情況。從圖5可以看出,對于每天某個固定的時間點,其進水壓力呈現(xiàn)正態(tài)分布。該特點為下文中根據(jù)標準分數(shù)z來判斷管網(wǎng)異常的發(fā)生提供了依據(jù)。
圖5 樣本序列的小提琴圖
當前,在供水量預測方面,所采用的典型方法與模型有回歸分析法、ARIMA模型、人工神經(jīng)網(wǎng)絡(luò)、灰色預測模型、機器學習模型及組合預測模型等[14]。
ARIMA模型常被用于供水預測,其適合用于具有明顯周期性、趨勢性等特性的數(shù)據(jù)。對于非頻繁變化的系統(tǒng),采集的歷史數(shù)據(jù)越多,預測的精度越高。使用ARIMA模型時,對供水的實時數(shù)據(jù)采集有較大的要求。本方案中已經(jīng)實現(xiàn)了對工控現(xiàn)場的實時供水數(shù)據(jù)的采集,為ARIMA模型的數(shù)據(jù)源提供了保證。
通過分析本方案中所采集數(shù)據(jù),由于其具有明顯的周期性,且季節(jié)性ARIMA模型能夠滿足遠程控制的預測需求,故采用季節(jié)性ARIMA模型進行后續(xù)分析。
2.3.1 ARIMA模型的階數(shù)識別
在對季節(jié)性ARIMA模型的階數(shù)識別及參數(shù)估計上,通常采用Box-Jenkins方法。該方法主要考察數(shù)據(jù)的自相關(guān)函數(shù)(ACF)、偏相關(guān)函數(shù)(PACF)及周期S,其中,周期S通常與實際息息相關(guān),如以月、天、小時為周期。
在確定本模型的季節(jié)項上,對其繪制如圖6所示的ACF圖。從圖中可以看出,該序列在 24、48、72 等處有明顯的峰值。上述特征與供水的實際情況相符,故下文中使用 24 作為模型的季節(jié)項。
圖6 樣本序列的小提琴圖進水壓力的ACF圖
關(guān)于季節(jié)性ARIMA模型中的差分階數(shù)d和季節(jié)差分階數(shù)D的選取,通??梢圆捎迷囂降淖龇ǎ部梢岳眯畔蕜t。在采取試探的方案時,通常對差分階數(shù)d,D選擇較低的數(shù)值(如1、2、3)。
當采用信息準則時,典型的方案是選擇AIC準則(Akaike Information Criterion)、AICc準則(corrected AIC)或BIC準則(Bayesian Information Criterion)來進行判斷。
在上述的信息準則中,本方案采用AIC信息準則來確定模型的階數(shù)。AIC 準則函數(shù)如公式:
AIC=-2log(L)+2(p+q+k+1)
(2)
式中:L為數(shù)據(jù)的極大似然度,k為獨立參數(shù)個數(shù)。
通過使AIC最小化,能夠得到合適的模型階數(shù)。在確定了模型的階數(shù)之后,通常采用最大似然估計和無約束最小二乘估計等方式來對各模型參數(shù)進行估計。
2.3.2 對樣本數(shù)據(jù)建立季節(jié)性ARIMA模型
表3是本實驗中對樣本數(shù)據(jù)進行ARIMA模型識別的部分數(shù)據(jù)。
表3 ARIMA模型識別
在本方案中,選擇AIC數(shù)值最小的模型作為預測模型。根據(jù)上述的選區(qū)方案,文中所選擇的季節(jié)性ARIMA模型為ARIMA(3,0,1)×(1,1,1)24,該模型所對應(yīng)的σ2為0.404 9,AIC為284.850。
由上述模型所計算的預測結(jié)果樣例如表4所示。該預測結(jié)果將被用于異常判定。異常判定即:根據(jù)所建立的預測模型,將預測的實時數(shù)值與實際的實時數(shù)值進行對比。若超過了相應(yīng)的閾值,則可認為發(fā)生了異常。其中的閾值可以根據(jù)標準分數(shù)z來進行設(shè)定。
表4 ARIMA(3,0,1)×(1,1,1)24的擬合結(jié)果
根據(jù)公式z=(v-vapprox)/σ,可以得到z的數(shù)值。式中:v為該時間點的實際值,vapprox為該時間點的預測值,σ為該時間序列的歷史數(shù)據(jù)的標準差。
服務(wù)器可以根據(jù)歷史數(shù)據(jù)的統(tǒng)計情況及遠程控制策略來設(shè)定z的閾值范圍。
表4中同時給出了預測結(jié)果的百分比誤差δ。
(3)
圖7是對供水管網(wǎng)的運行頻率的預測擬合圖。通過該圖及上述的表4可以看出,文中的季節(jié)性ARIMA
模型ARIMA(3,0,1)×(1,1,1)24能很好地擬合測試數(shù)據(jù)。
圖7 運行頻率預測擬合圖
通過對所采集的數(shù)據(jù)進行數(shù)據(jù)預處理,對供水管網(wǎng)的實時數(shù)據(jù)及歷史數(shù)據(jù)的分析,建立季節(jié)性ARIMA模型并進行預測。實驗結(jié)果表明,得到的季節(jié)性ARIMA模型能夠有效地對小區(qū)的供水狀況進行預測。該方法具有較好實際應(yīng)用價值,可以為降低小區(qū)供水的運維成本提供參考。在后續(xù)工作中,可以根據(jù)預測供水情況,通過遠程智能控制等手段,實現(xiàn)更高效的遠程控制,以進一步提升系統(tǒng)的整體效率,達到節(jié)能的目的。
[1] 韓曉峰,丁莉芬.淺析遠程監(jiān)控系統(tǒng)在城市二次供水管理中的應(yīng)用[J].給水排水,2014(4):120-123.
[2] 廖曙江,刑佳佳,陳睿迪,等.基于物聯(lián)網(wǎng)技術(shù)的遠程建筑消防水壓實時監(jiān)控系統(tǒng)[J].自動化與儀器儀表,2012(5):16-17,20.
[3] 付剛,朱晨光,劉彥華.基于遠程控制技術(shù)的二次供水管理系統(tǒng)的探索與實踐[J].中國給水排水,2013,29(12):14-17.
[4] 練庭宏,劉秋娟,王景成.基于ARIMA時序辨識的需水量預測[J].控制工程,2008(S1):166-168.
[5] Firat M,Turan M E,Yurdusev M A.Comparative analysis of neural network techniques for predicting water consumption time series[J].Journal of Hydrology,2010,384(1):46-51.
[6] 高金良,姚芳,葉健.結(jié)合圖論的供水管網(wǎng)PMA分區(qū)方法[J].哈爾濱工業(yè)大學學報,2016,48(8):67-72.
[7] 程偉平,趙丹丹,許剛,等.供水管網(wǎng)爆管水力學模型與爆管定位[J].浙江大學學報(工學版),2013,47(6):1057-1062.
[8] Wu Yipeng,Liu Shuming,Wu Xue,et al.Burst detection in district metering areas using a data driven clustering algorithm[J].Water Research,2016,100:28-37.
[9] Hutton C,Kapelan Z.Real-time Burst Detection in Water Distribution Systems Using a Bayesian Demand Forecasting Methodology[J].Procedia Engineering,2015,119(1):13-18.
[10] 文玉梅,張雪園,文靜,等.依據(jù)聲信號頻率分布和復雜度的供水管道泄漏辨識[J].儀器儀表學報,2014,35(6):1223-1229.
[11] 鄒柏賢,劉強.基于ARMA模型的網(wǎng)絡(luò)流量預測[J].計算機研究與發(fā)展,2002,39(12):1645-1652.
[12] 韓超,宋蘇,王成紅.基于ARIMA模型的短時交通流實時自適應(yīng)預測[J].系統(tǒng)仿真學報,2004,16(7):1530-1532,1535.
[13] 彭志行,鮑昌俊,趙楊,等.ARIMA乘積季節(jié)模型及其在傳染病發(fā)病預測中的應(yīng)用[J].數(shù)理統(tǒng)計與管理,2008,27(2):362-368.
[14] 白云.時間序列特性驅(qū)動的供水量預測方法研究及應(yīng)用[D].重慶大學,2014.