陳斌,方海英,周繼來,許仁杰,周鵬,楊文靜,趙維晞,潘楠
(1.紅云紅河煙草(集團)有限責任公司物流中心,云南 昆明 650202;2.昆明理工大學民航與航空學院,云南 昆明 650500)
目前,在原煙倉儲管理中,片煙已成為原煙的主要貯存形式,存儲片煙的堆垛內部溫濕度環(huán)境直接影響其醇化效果,管理員根據(jù)溫濕度數(shù)據(jù)可對片煙儲存進行有效管理,一旦出現(xiàn)溫度過高等問題管理員可以及時采取措施,以避免煙葉產生霉變等問題,減少損失。如果能有效預測出未來某短時間內的倉儲溫度,即可極大提高片煙精準監(jiān)測水平,因此對片煙堆垛內部未來一段時間內的溫度數(shù)據(jù)進行預測非常有必要。
關于倉儲溫度預測的方法,主要包括機器學習以及深度學習神經網絡等技術。近些年來,人工神經網絡取得了快速發(fā)展,包括深度神經網絡(DNN)、長短期記憶網絡(Long Short-Term Memory,LSTM)、卷積神經網絡(Convolutional Neural Network,CNN)等。Shi X,等將降水臨近預報描述為一個時空序列預測問題,通過利用LSTM方法有效預測了降水臨近的數(shù)據(jù)。Gundu,等提出了一個基于LSTM的預測模型,通過對各種網絡模型進行統(tǒng)計分析,得到了適合準確預測太陽能和溫度的網絡結構。也有不少學者將上述人工神經網絡相結合,其中,倪錚,等提出了一種針對氣象數(shù)據(jù)的CNN-LSTM神經網絡,并利用其對雷暴的6h臨近預報進行了實驗,取得令人滿意的預報效果。Tabrizi S E,等采用將CNN與LSTM相結合的DNN模型應用于路面表面溫度預測,相較于其他單一的神經網絡取得了較好的預測效果。此外也有學者將其他方法與神經網絡相結合,其中,張亞偉,等提出了結合長短期記憶神經網絡LSTM與梯度提升算法LightGBM的組合模型,該方法可以保留LSTM模型對單變量預測的周期性特點,結果表明,基于LSTMLightGBM的組合模型方法比單純使用LSTM的方法更接近原始波形,具有更低的RMSE。黃偉建,等提出一種基于混合神經網絡和注意力機制的預測模型(Att-CNN-LSTM),王晨陽,等提出一種基于遺傳算法(GA)優(yōu)化的卷積長短記憶神經網絡混合模型(GACNN-LSTM),通過GA優(yōu)化LSTM訓練網絡的超參數(shù)權重與偏置值,經過仿真結果表明該方法對光伏發(fā)電功率具有更好的預測性能。
基于上述分析可知,單一神經網絡在預測上精度都不夠高,預測結果不夠準確,應該將多種神經網絡結合在一起,用其他方法的優(yōu)勢取代其劣勢,從而達到對數(shù)據(jù)的精確預測。因此,本文首先利用自組織映射(Self-Organizing Maps,SOM)將輸入的溫度數(shù)據(jù)進行聚類,隨后將數(shù)據(jù)集分成訓練集和測試集,對這些數(shù)據(jù)進行歸一化處理,以提高訓練速度和計算精度,由于LSTM可以解決循環(huán)神經網絡(Recurrent Neural Network,RNN)中梯度消失和梯度爆炸、長期記憶能力不足的缺點,因此,本文提出了基于粒子群算法的混合長短記憶模型(PSO-SOM-LSTM),對數(shù)據(jù)進行預處理,基于粒子群算法優(yōu)化SOM-LSTM的網絡權重,隨后帶入神經網絡進行數(shù)據(jù)預測,實現(xiàn)對未來倉儲堆垛內的溫濕度進行精準預測的目的。具體步驟為:首先對數(shù)據(jù)進行預處理,將數(shù)據(jù)歸一化再采用SOM聚類分別構建各類數(shù)據(jù)集;其次構建LSTM神經網絡結構,輸入訓練數(shù)據(jù)進行訓練;隨后,基于PSO算法優(yōu)化SOMLSTM的網絡權重,帶入神經網絡進行數(shù)據(jù)預測并與四種不同的預測方法進行對比,證明了PSO-SOMLSTM算法的優(yōu)越性;最后通過均方根誤差(RMSE)等指標來衡量實驗結果。
本文實驗數(shù)據(jù)由某大型卷煙生產企業(yè)原料倉儲科露天堆垛在2021年4月25日-5月1日一周內的某一煙垛每間隔30min的溫度監(jiān)測數(shù)據(jù)擬合而成。傳感器的最大布設上限為80個,傳感器在室內中的擺放信息記錄共分8段,由于篇幅問題,本文只選了第一段第一層的無線傳感器擺放示意圖,如圖1所示。
圖1 無線傳感器擺放圖(節(jié)選)
為了提高后面神經網絡的訓練速度和預測精度,將所有的溫度數(shù)據(jù)進行歸一化處理,公式如下:
其中:X是所用數(shù)據(jù)的平均值,是所用數(shù)據(jù)的最大值,是所用數(shù)據(jù)的最小值。歸一化后的溫度數(shù)據(jù)如圖2所示。
圖2 數(shù)據(jù)歸一化
對大量數(shù)據(jù)進行分析是一項繁重又復雜的工作,為簡化該工作并且為神經網絡提供不同類別的數(shù)據(jù)集,以提高預測精度,本文采用一種無監(jiān)督學習SOM聚類方法。自組織映射神經網絡(Self Organizing Maps,SOM)由芬蘭神經網絡專家Kohonen教授提出,一個神經網絡接受外界輸入模式時,將會分為不同的對應區(qū)域,各區(qū)域對輸入模式具有不同的響應特征,而且這個過程是自動完成的。SOM能把繁雜的高維數(shù)據(jù)轉換為簡潔的幾何關系,因此具有精簡數(shù)據(jù)并達到高質量聚類分析結果的目的。
實現(xiàn)SOM聚類的步驟為;提取各條數(shù)據(jù)之間的差異性,將歸一化后的數(shù)據(jù)劃分為訓練集和測試集,輸入SOM神經網絡,把相同聚類結果的數(shù)據(jù)歸為一類,為下一步的LSTM神經網絡提供不同類別的數(shù)據(jù)集,以提高預測精度。
本文采用粒子群算法(PSO)優(yōu)化SOM-LSTM混合神經網絡算法模型,主要過程為:首先對數(shù)據(jù)進行預處理,將數(shù)據(jù)歸一化再采用SOM聚類分別構建各類數(shù)據(jù)集;其次構建LSTM神經網絡結構,輸入訓練數(shù)據(jù)進行訓練;隨后,基于PSO算法優(yōu)化SOM-LSTM的網絡權重,帶入神經網絡進行數(shù)據(jù)預測;最后輸入溫度訓練數(shù)據(jù)進行訓練,對未來附近時間段內的溫度進行預測,通過均方根誤差(RMSE)等指標來衡量實驗結果。
競爭學習規(guī)則的學習步驟如下:
(3)網絡輸出與權調整。按WTA學習法則,獲勝神經元輸出為“1”,其余的神經元均為0,如下:
式(5)中,為學習效率,區(qū)間為[0,1]。
(4)重新歸一化處理。權向量經過調整后得到新的向量,與之前的并不相同,因此要對該新向量重新歸一化,直到學習率衰減到0。
LSTM算法本質上是循環(huán)神經網絡(RNN)的一種特殊模型,用來處理RNN訓練過程中梯度消失和梯度爆炸的問題。其關鍵為細胞狀態(tài)cell。如圖3所示,LSTM擁有三個門來保護和控制細胞狀態(tài)。三個門分別為輸入門、遺忘門和輸出門。
圖3 標準LSTM細胞結構圖
2.2.1 遺忘門。遺忘門會讀取h和x,輸出一個區(qū)間在[0,1]的數(shù)值,分配在每個細胞狀態(tài)C中。1為保留,0為舍棄。
其中,h表示上一個細胞輸出,x為當前細胞的輸入。為一個向量,表示讓對應信息通過的權重。
2.2.2 輸入門。LSTM中第二步是決定讓多少新的信息加入到cell狀態(tài)中來。此過程包括兩個步驟:
(1)層為“輸入門層”,決定哪些信息將要更新;
更新舊cell狀態(tài),C更新為C,新的候選值為:
2.2.3 輸出門。LSTM中的最后一步是確定輸出什么值。此值基于cell狀態(tài),也是一個過濾后的值。運行式(11)確定細胞狀態(tài)的哪個部分將會輸出。通過tanh對cell狀態(tài)進行處理。
構建SOM-LSTM神經網絡結構,輸入溫度訓練數(shù)據(jù)進行訓練,同時對未來附近時間段的室內溫度進行預測。總體算法流程如圖4所示。
圖4 SOM-LSTM總體算法流程圖
粒子群算法是一種仿生群體智能算法,該算法將每個解都看作鳥群中的一個獨立個體——“粒子”,每個粒子都有對應優(yōu)化目標的適應值,因此,該算法的評價指標為適應值。由于PSO算法不用設置眾多參數(shù)且簡單易實現(xiàn),因此,本文采用PSO算法優(yōu)化LSTM,PSO算法的編碼過程見表1。
表1 PSO算法偽代碼
用PSO算法優(yōu)化SOM-LSTM神經網絡的具體流程如圖5所示。
圖5 粒子群算法優(yōu)化流程圖
本文采用均方誤差(MSE)、均方根誤差(RMSE)、相對誤差和判定系數(shù)()等評價指標來衡量實驗結果,以上評價指標為預測領域常用的評價指標。
式中,y()為預測溫度,y()為真實溫度,y為真實溫度的均值。通常,值越大,值越小,則預測的結果就越準確。
為了驗證PSO-SOM-LSTM方法的可行性,本文將該方法與LSTM、BP和SOM-LSTM神經網絡算法預測效果進行了比較。采用MATLAB編程環(huán)境搭建并訓練算法模型,本次實驗選取136個真實數(shù)據(jù)為采樣點,對不同的算法進行對比。其中,SOM-LSTM的梯度閾值設置為1,指定初始學習率0.002,在100輪訓練后乘以因子0.2。圖6為三種不同方法的溫度預測效果。
圖6 不同算法下的溫度預測值
由圖6可以看出:BP神經網絡在拐點處溫度預測誤差較大,預測結果具有不穩(wěn)定性。LSTM和SOMLSTM都具有良好的穩(wěn)定預測效果,但是預測值有偏差,相比于LSTM和SOM-LSTM,PSO-SOM-LSTM算法的預測值更貼近真實值,預測結果更為準確,因此采取PSO-SOM-LSTM算法對未來一段時間內的溫度進行預測是最優(yōu)的。
由于采取PSO-SOM-LSTM算法對未來一段時間內的溫度進行預測是最優(yōu)的,為保障算法的適用性,隨機選取倉庫內某處的傳感器,對同一個傳感器未來時間段內的溫度數(shù)據(jù)進行預測,選取285個數(shù)據(jù)作為訓練數(shù)據(jù),預測附近未來30個數(shù)據(jù)點,結果如圖7所示。其中實線為訓練值,虛線為真實值,星號線為預測出的溫度數(shù)據(jù):
圖7 基于PSO-SOM-LSTM的預測溫度結果
通過具體的相對誤差指標分析預測的溫度數(shù)據(jù),圖8為相對誤差折線圖,可以看出預測的相對誤差主要集中在[-0.005,0.005]區(qū)間內,誤差區(qū)間范圍較小,在0.5%以內。
圖8 基于PSO-SOM-LSTM預測溫度的相對誤差圖
本文提出的算法與其他預測方法的預測誤差對比見表2,由表2可以看出,BP預測效果最差,誤差最大,PSO-SOM-LSTM的誤差最小,預測結果最好。在RMS指標下,PSO-SOM-LSTM比SOM-LSTM減少了2.46%,比單一神經網絡減少了8.94%,具有較優(yōu)的預測效果。
表2 不同算法的預測對比
片煙倉儲堆垛內部溫濕度環(huán)境對片煙的醇化效果有很大的關聯(lián)性,如果能有效預測出未來某短時間內的倉儲溫度,即可對片煙儲存進行有效管理,能極大地提高片煙精準監(jiān)測水平,如何對倉儲空間內部的溫濕度進行精準監(jiān)控和預測,是片煙養(yǎng)護的一項重要工作。本文提出了基于粒子群算法的混合長短記憶模型(PSO-SOM-LSTM),首先對數(shù)據(jù)進行預處理,將數(shù)據(jù)歸一化再采用SOM聚類分別構建各類數(shù)據(jù)集;其次構建LSTM神經網絡結構,輸入訓練數(shù)據(jù)進行訓練;隨后,基于PSO算法優(yōu)化SOM-LSTM的網絡權重,帶入神經網絡進行數(shù)據(jù)預測,并與四種不同的預測方法進行對比,證明了PSO-SOM-LSTM算法的優(yōu)越性;最后通過均方根誤差(RMSE)等指標來衡量實驗結果,計算出均方根誤差為0.043 5左右。實驗結果證明,通過PSO-SOM-LSTM模型算法優(yōu)于本文所提到的其他算法,在實際倉儲中能有效實現(xiàn)對未來某時間段內的溫濕度進行精準預測的目的。