王天宇 趙 珺 王 偉 王天鑫
鋼鐵生產是高耗能和高排放的生產過程,能源介質的發(fā)生與消耗在其中起到了至關重要的作用.隨著煤炭、石油等一次能源的緊缺,充分利用鋼鐵生產過程中產生的副產煤氣不但可以提高企業(yè)節(jié)能降耗水平,還可減少煤氣放散對環(huán)境的污染[1].而在生產工藝和設備狀態(tài)相對固定的情況下,對于能源系統(tǒng)的優(yōu)化調度逐漸成為實現(xiàn)節(jié)能降耗的重要手段.
一些現(xiàn)有的能源優(yōu)化調度研究已經在文獻中有所報道,包括強化學習[2]、基于數(shù)學規(guī)劃方法[3-4]、案例推理[5]以及因果關系建模[6]等.其中,文獻[2]提出了一種結合專家經驗和生產計劃的能源動態(tài)調度策略.文獻[3]采用預測-調度兩階段方法,首先利用高斯過程回歸對不確定條件下的能源需求進行預測,從而建立關于容量約束的優(yōu)化調度模型.文獻[4]提出了一種新穎的數(shù)學規(guī)劃模型,研究了燃氣系統(tǒng)緩沖用戶中富余煤氣的優(yōu)化配置.針對連續(xù)生產過程建模,文獻[5]設計了一種稀疏模糊推理方法,用于推測具有動態(tài)特征的調度知識.此外,一種基于粒度因果關系的方法被用來挖掘間歇性生產特征下能源產消過程的因果關系,進而建立基于因果推理調度模型[6].在智能學習與優(yōu)化調控方面,文獻[7]針對離散時間最優(yōu)控制設計,介紹了集成學習逼近器和強化公式的評價智能方法.文獻[8]設計了一種基于折扣廣義值迭代的智能算法,有效解決了一類復雜非線性系統(tǒng)的最優(yōu)跟蹤控制問題.文獻[9]結合神經標識符學習和啟發(fā)式動態(tài)規(guī)劃算法,解決了非仿射離散時間系統(tǒng)的最優(yōu)跟蹤控制問題.上述方法在智能優(yōu)化控制領域提出了創(chuàng)新性的思路.然而,由于生產工況的多樣性,能源系統(tǒng)的運行條件可能會實時變化,需對能源發(fā)生、消耗和存儲過程中所包含的多工況知識進行有效表示,并衡量它們對調度模型的影響,進而實現(xiàn)對于調整方向和調度量的有效判斷.
針對包含多工況特性的建模方法,文獻[10]結合條件指示變量(專家知識) 和條件驅動聚類建立工況劃分模型,可將時間尺度的非平穩(wěn)和瞬態(tài)過程巧妙地還原到不同的條件切片中,在同一條件切片內揭示相似的過程特征.文獻[11]針對操作條件切換和生產產品變化,提出一種條件判別自編碼器來表征穩(wěn)態(tài)模式,并設計了基于注意力的評估器對暫態(tài)特征進行描述.此外,文獻[12]提出了一種具有魯棒性的指數(shù)平穩(wěn)子空間分析算法,探索用于非平穩(wěn)過程監(jiān)控的自適應策略.上述研究可以有效結合專家經驗和實際數(shù)據(jù),提出了面向多工況特性的精確建模方法.然而其主要針對工業(yè)暫態(tài)特性和過程監(jiān)控問題進行分析,而本文方法側重于研究工業(yè)能源產消變化的穩(wěn)態(tài)過程.
近年來,基于深度網(wǎng)絡的表征學習技術受到廣泛關注.通過以低維向量的形式表達研究對象的語義信息,可以提高知識獲取、表示和推理的性能.其中,對比學習側重于從大規(guī)模數(shù)據(jù)中挖掘潛在信息,提高下游任務的數(shù)據(jù)表示能力.例如,文獻[13]通過預先訓練的教師模型學習知識表示,并采用聚類方法將其簡化為偽標簽,然后使用偽標簽訓練下游學生網(wǎng)絡,以提升圖像分類精度.文獻[14]采用動量對比學習實現(xiàn)新冠病毒的CT 圖像快速診斷.目前,對比學習方法還被廣泛應用于語義分析[15]、推薦系統(tǒng)[16]和視覺表示[17]等研究領域,但在能源系統(tǒng)知識型工作中應用較少.而由于能源系統(tǒng)優(yōu)化調度過程需結合機理知識、專家領域知識和運行數(shù)據(jù)中的隱含知識,包含復雜工況條件,因此采用深度對比網(wǎng)絡獲取顯性/隱性知識將是有益的嘗試.
粒度計算理論是通過粒度化的方式對不同尺度和層級的數(shù)據(jù)進行統(tǒng)一描述,促進了可用數(shù)據(jù)和存在性關系的知識組織方式[18].針對副產能源系統(tǒng)調度問題,通過時間跨度、幅值和線型等三維特征構建能源數(shù)據(jù)的粒度知識表示,提出了基于協(xié)同條件聚類的長期預測模型[19].針對工業(yè)實際對于建模可靠性的需求,分層粒度計算方法[20]被用來建立區(qū)間形式的預測模型.以設備變量信息粒為基本處理單元,粒度計算還結合了模糊邏輯和強化學習來獲得動態(tài)調度策略[21-22].考慮到目前對比學習主要應用于具有顯式語義描述的領域,因此對于工業(yè)能源系統(tǒng)的知識型工作,可采用粒度計算方法從能源數(shù)據(jù)中提取語義特征,為深度網(wǎng)絡提供更為豐富的數(shù)據(jù)信息.
本文面向鋼鐵燃氣產消過程的多工況特征,提出了一種基于分層粒度對比網(wǎng)絡的調度知識獲取與建模方法.首先通過粒度化的方式劃分和描述能源數(shù)據(jù),形成多維度特征語義表示.為了提取多工況調度知識,利用專家經驗數(shù)據(jù)劃分樣本,構建基于粒度對比學習的知識表征網(wǎng)絡,并采用多層次的學習策略來學習經驗數(shù)據(jù)具有的多工況類別特性.為進一步挖掘出深層次的隱藏信息,提出了一種基于閉環(huán)反饋機制的分層對比網(wǎng)絡模型.據(jù)我們所知,本文工作是對比學習首次應用于鋼鐵工業(yè)能源系統(tǒng)的知識提取與優(yōu)化調度領域.實驗部分結果表明了本文方法獲得的知識表示可擬合出專家水平的調度策略,并能夠有效提高燃氣系統(tǒng)的建模精度.
本文結構如下: 第1 節(jié)就典型燃氣系統(tǒng)結構和優(yōu)化調度過程中涉及的知識型工作作出簡單介紹及分析;第2 節(jié)描述基于分層粒度對比網(wǎng)絡的知識獲取及建模方法;第3 節(jié)給出大量的仿真實驗,充分驗證所提方法的有效性;第4 節(jié)對全文進行了總結和展望.
鋼鐵燃氣系統(tǒng)是工業(yè)生產與能源消耗相互耦合的主體.圖1 所示為一個典型能源系統(tǒng)(高爐煤氣系統(tǒng)) 結構圖,主要由煤氣發(fā)生用戶(高爐)、傳輸管網(wǎng)、煤氣柜以及一系列煤氣消耗用戶4 部分組成.其中,4 座高爐作為發(fā)生單元,每小時可以向傳輸管網(wǎng)輸送約180 萬立方米煤氣.傳輸系統(tǒng)包括管網(wǎng)、混合站和壓力站.消耗用戶主要包括煉焦爐、熱軋廠、冷軋廠、化工產品回收(Chemical product recycling,CPR)、低壓鍋爐(Low pressure boiler,LPB)、合成單元(Synthesis unit,SU) 和發(fā)電機.由于4 座高爐在產生高爐煤氣的同時,其自身配備的熱風爐在切換過程中會消耗大量高爐煤氣,導致流入管網(wǎng)的煤氣流量頻繁波動.此外,在生產過程中還會出現(xiàn)諸多異常狀態(tài),如高爐減風、設備參數(shù)變化等.為維持能源系統(tǒng)的平衡穩(wěn)定,現(xiàn)場操作人員需要監(jiān)控各能源用戶的運行狀態(tài),進而作出能源產消的工況判斷,在必要的情況下對一些可調整用戶(如電廠、低壓鍋爐等) 的煤氣消耗量做出調整(如圖2 所示),以保證煤氣柜的安全運行,達到節(jié)能減排的目的.
圖1 典型鋼鐵工業(yè)燃氣系統(tǒng)結構圖Fig.1 A typical structure of the gas system in steel industry
圖2 燃氣產消多工況特征及調度過程Fig.2 The multi-condition characteristics and their scheduling process of gas generation and consumption
考慮到燃氣系統(tǒng)的復雜結構,導致很難對整個系統(tǒng)的能源產消過程建立機理模型.另一方面,單純基于數(shù)據(jù)的方法無法區(qū)分出不同調度工況下的系統(tǒng)運行狀態(tài)及差異.而知識型工作自動化能夠將經驗和數(shù)據(jù)緊密聯(lián)系,有針對性地提取不同工況條件下的深層次調度知識,并通過知識的表示及處理方法實現(xiàn)精準的判斷和創(chuàng)新性的決策任務[23].因此,如何從數(shù)據(jù)中提取出與調度工況和系統(tǒng)狀態(tài)相關的知識,構建關于鋼鐵副產能源系統(tǒng)的知識獲取及表示方法,對于其優(yōu)化調度工作具有重要意義.
考慮到燃氣產消過程的復雜工況及其對于調度決策的影響,本文提出一種基于分層粒度對比網(wǎng)絡的調度知識獲取與表示方法.整體架構如圖3 所示,可分為三個階段,即數(shù)據(jù)預處理與粒度化、分層粒度對比網(wǎng)絡構建及調度實施階段.
圖3 所提方法整體框架圖Fig.3 The overall framework of the proposed method
第一階段將主要用戶數(shù)據(jù)進行濾波處理,根據(jù)能源數(shù)據(jù)的波動語義構建特征信息粒.第二階段利用專家經驗知識建立粒度對比網(wǎng)絡,形成定性的工況知識表示.而后通過定義輸出層得到現(xiàn)有知識表示的評價函數(shù),依據(jù)定量的評價反饋結果添加表示層,并利用分層對比學習模型細化工況特征表示.
第三階段,首先根據(jù)能源用戶的實時狀態(tài),根據(jù)建立的分層對比網(wǎng)絡獲得多工況特征的組合向量,而后根據(jù)不同的下游任務建立相關預測及調度模型,獲得完整的調度方案.
目前深度對比學習主要用于處理文本、圖像等具有顯式語義描述的領域,通過對圖片數(shù)據(jù)的增強(如隨機剪切、隨機顏色失真等) 來構建適用于處理圖像信息的表示形式.針對包含時變信息和多因素影響的工業(yè)能源系統(tǒng)數(shù)據(jù),采用粒度計算的方式提取語義信息,形成適合于下游深度網(wǎng)絡的數(shù)據(jù)表示形式.考慮到能源數(shù)據(jù)的波動趨勢包含豐富的生產實際意義,不同的趨勢特征往往對應不同的設備運行或能源產消工況,本文首先根據(jù)數(shù)據(jù)的趨勢特征劃分數(shù)據(jù)粒,并建立相對應的特征描述方式.
在一般情況下,工業(yè)時間序列可以劃分為時間維度上的一系列連續(xù)趨勢片段(信息粒),這些片段可由一組原型基底通過橫向和縱向的伸縮變換進行近似[19].本文構建了1/4 周期的正弦曲線作為基底(如式(1)所示),每組基底可以代表一類典型的波動趨勢(單調性和凹凸性).此外,采用直線來描述曲線為單調線性的特殊情況.
其中,φ代表不同的正弦周期.這樣一來,可通過基底的橫向和縱向的伸縮變換來近似任意的趨勢片段,如y=Asin((2/π)Dx+φ)表示對基底進行了橫向伸縮尺度D(時間跨度) 和縱向伸縮尺度A(波動幅值) 之后的近似曲線.
為了匹配原始時間序列并獲得基于趨勢的粒度,本文根據(jù)單調和凹凸特性對數(shù)據(jù)序列進行劃分.借鑒文獻[19]中的方式,給定序列X={x1,x2,···,xn},首先需要判斷X中每個數(shù)據(jù)點xi領域內小段曲線的趨勢特征(單調性、凹凸性),記為數(shù)據(jù)點xi的標識Fi.考慮時間序列的一階和二階動態(tài)特性,命名為{Δ2,Δ3,···,ΔN}和{E3,E4,···,EN},其中Δi=xi-xi-1,Ei=Δi-Δi-1.根據(jù)單調性、凹凸性定義,Δi及 ΔiΔi-1分別表示數(shù)據(jù)點xi與xi-1之間小段曲線的單調性及時間序列在點xi-1處的單調性變化,同時Ei表示該段曲線的凹凸性.具體的數(shù)據(jù)點標識判斷標準如下所示,其中i=3,4,···,N.為了實現(xiàn)信息粒的語義劃分,依次檢索X中每個數(shù)據(jù)點的標識Fi,在數(shù)據(jù)點標識發(fā)生改變處劃分數(shù)據(jù).
在實際應用中,可根據(jù)運行過程中不斷產生的能源數(shù)據(jù)判斷當前序列的趨勢特性是否發(fā)生變化,以此來劃分數(shù)據(jù)序列,并構建在線樣本的粒度化輸入.需要注意的是在信息粒劃分之前,本文采用經驗模態(tài)分解(Empirical mode decomposition,EMD)對原始的訓練數(shù)據(jù)進行濾波.由于EMD 過程需要計算由各個極值點形成的包絡線,因此需等待數(shù)據(jù)到達極值之后再進行濾波.若需要立即給出調度策略,亦可將當前時刻作為極值點,并結合歷史數(shù)據(jù)來進行濾波計算.
為反映能源用戶運行狀態(tài)的語義特征,劃分后的數(shù)據(jù)粒G被進一步描述為三維特征向量的形式,包括其對應的橫向和縱向伸縮尺度D和A,以及代表基底類型的線型特征L[19],記為G={D,A,L}.
本文基于第2.1 節(jié)中的信息粒的語義描述,利用調度過程中的專家經驗知識(如調整方向、調整量大小等) 劃分潛在空間的對比學習樣本,提出粒度對比網(wǎng)絡模型實現(xiàn)副產能源系統(tǒng)的調度知識粗提取.
對比學習通過潛在空間中的對比損失來最大化相似工況樣本不同隱性特征之間的一致性,從而學習知識的表示形式[17].傳統(tǒng)對比學習方法通過吸引或排斥來構建類似于二分類的處理方式.考慮到由專家經驗知識帶來多分類情況,因此不同于傳統(tǒng)方法,本文對所建立的模型執(zhí)行多個訓練步驟.在訓練過程中首先根據(jù)調整方向進行二分類的對比學習,之后通過構建具有不同調整量大小的輸入樣本再進行多次學習,使得輸出的表示向量能夠區(qū)分多類別的專家知識.
對比網(wǎng)絡模型的輸入為能源發(fā)生、消耗以及存儲等流量數(shù)據(jù),即其中e表示不同調度事件,n為輸入因素個數(shù).該網(wǎng)絡結構如圖4 所示,可分為以下5 個部分:
圖4 粒度對比網(wǎng)絡結構圖Fig.4 The structure of the granular contrastive network
1) 首先根據(jù)歷史時刻的專家經驗κ(調整方向、調整量大小等) 將數(shù)據(jù)樣本定性地劃分為不同的子集 {si1,si2,···},{sj1,sj2,···},···.
2)采用第2.1節(jié)中的粒度化方式對樣本子集中的各輸入因素數(shù)據(jù)進行語義增強,即
3) 基于神經網(wǎng)絡的編碼器f(·)從數(shù)據(jù)的粒度化特征描述中提取表示向量.為了學習各輸入因素粒度變量的時變特性,本文采用長短時記憶(Longshort-term memory,LSTM)網(wǎng)絡[24]來獲得he,τ=,其中τ為數(shù)據(jù)劃分后信息粒序列的時間步.為網(wǎng)絡的隱藏表示,計算為
其中,T為LSTM 時間步長.在LSTM 中,采用門控機制調節(jié)內部記憶單元的輸出以學習輸入序列數(shù)據(jù)的復雜表示[25].其中存儲單元可記憶任意時間間隔的信息,并且由3 種門管理出入單元的信息流.輸出(簡化為hτ) 可被看作為輸入、隱層狀態(tài)hτ-1以及存儲單元狀態(tài)cτ-1的加權組合.其中,遺忘門fτ,輸入門iτ,存儲單元cτ,輸出門oτ和隱層狀態(tài)hτ可被計算為
其中,fti表示信息粒G中的特征描述,即{D,A,L}.可以看出式(4)~ 式(6)依賴于hτ-1和當前的輸入,并且式(6)中的cτ和式(8)中的hτ與它們前一時間步的值相關.將式(6)代入式(8)得到關于歷史值的加權形式,即
從式(9)可以看出,hτ不僅包含了先前時間步的信息,還與各粒度特征的加權信息相關.而傳統(tǒng)神經網(wǎng)絡的非線性預測器,其輸出是輸入的簡單加權組合,使得權值未能隨著序列而改變,無法考慮到燃氣系統(tǒng)產、消、儲數(shù)據(jù)所包含的時序關聯(lián)和粒度語義特征之間的協(xié)同關系.因此,本文采用LSTM可更為靈活地計算非線性權值,將能源產消用戶的時間依賴關系及特征語義關聯(lián)反映到hτ和cτ中.
圖5 樣本數(shù)據(jù)知識表征的計算過程描述Fig.5 The calculation process of the knowledge representation of sample data
5) 為對比學習任務定義損失函數(shù).給定輸入樣本集{se},假設樣本集中包含屬于不同潛在空間的樣本si和sk,粒度對比學習的任務旨在通過知識表示向量zi,zk對樣本進行區(qū)分.
損失函數(shù)使得同一潛在空間樣本(i,j)的表示向量相近,而區(qū)分不同空間樣本(i,k)的表示.本文定義損失函數(shù)如下
其中,p表示與zi屬于同一潛在空間的樣本個數(shù);q為不同空間樣本個數(shù);d(u,v)表示向量間的距離,這里采用余弦相似度來衡量.從式(10)中可以看出,假設樣本數(shù)量為N,若在訓練模型時使用了所有可能的數(shù)據(jù)對,則用于訓練的數(shù)據(jù)信息量可達到N(N-1)/2.也就是說相比于經典的有監(jiān)督學習方法,對比學習模型的訓練過程要多出近似于(N-1)/2個樣本,因此能夠更為高效地利用相對稀疏的專家調度數(shù)據(jù).
上述過程獲得的工況表示雖然可以涵蓋大部分系統(tǒng)運行情況,但是無法獲取經驗數(shù)據(jù)中更深層次的隱性知識,本節(jié)進一步提出一種分層粒度對比學習模型實現(xiàn)知識的細化表示.
定義驗證集{s1,s2,···,sl},根據(jù)第2.2 節(jié)學習到的模型得到相應的工況表示{z1,z2,···,zl}.在此基礎上,添加輸出層來學習下游任務,對獲取的知識表示進行評價.本文通過在工況表示的基礎上增加MLP 層來擬合能源系統(tǒng)調度時刻的調整量,進而判斷當前的工況表示是否能夠滿足實際應用條件.若樣本數(shù)據(jù)集的誤差高于某一設定的閾值,即
其中,ye為真實調整量.說明當前的空間表示無法覆蓋該樣本集中所隱含的工況知識.這種情況下需進一步采用對比學習的方式擴展空間表示,以區(qū)分與驗證集中的其他樣本,直到所有的樣本均滿足評價函數(shù)條件為止,因此,較小的閾值θ會增加對比網(wǎng)絡的層數(shù).本文在知識粗提取的基礎上,通過選擇合適的閾值,使得模型能夠有效覆蓋隱含的調度工況和特征.分層粒度對比學習網(wǎng)絡的結構如圖6 所示.
圖6 分層粒度對比網(wǎng)絡結構Fig.6 The structure of hierarchical granular contrastive network
圖6 中最底層所示的網(wǎng)絡為傳統(tǒng)的LSTM 網(wǎng)絡,在知識細化過程中LSTM 的層數(shù)不斷增多,以提取更深層次的隱藏信息.中間層為采用MLP 的特征映射層,用于獲得工況知識的表示向量,并在此基礎上構建對比學習損失函數(shù).在實際應用過程中,共增加了2 層對比網(wǎng)絡,以權衡知識獲取表現(xiàn)和網(wǎng)絡模型復雜度.需要注意的是,由于多層網(wǎng)絡中當前層級需要學習與上一層級不同的隱性特征,因此損失函數(shù)中各個層級的特征表示均為相互排斥.本文定義第i層粒度對比網(wǎng)絡的損失函數(shù)如下
其中,r為未滿足條件的樣本數(shù),l為驗證集樣本總數(shù).
在訓練過程中,采用一種批次訓練方式,從低層次到高層次依次訓練LSTMi及MLPi,即在完成低層級的網(wǎng)絡訓練后,若根據(jù)判斷條件需進一步增添對比學習層,則在保持現(xiàn)有層級權值參數(shù)不變的情況下訓練下一層級的網(wǎng)絡模型.因此,本文提出的分層粒度對比網(wǎng)絡在訓練過程可有效避免由深層網(wǎng)絡結構帶來的梯度消失影響.
分層粒度對比網(wǎng)絡的實施過程如圖7 所示,輸入樣本se到模型中得到多層級的工況知識表示{z1,z2,···,zn},將n個知識表示拼接為行向量[z1,z2,···,zn]以整合不同層級的特征,并定義輸出層來實現(xiàn)知識表示的加權和選擇.
圖7 分層粒度對比網(wǎng)絡實施過程Fig.7 The implement process of the hierarchical granular contrastive network
為了驗證本文方法的有效性,采用國內某鋼鐵企業(yè)高爐煤氣系統(tǒng)2019 年4 月的實際運行數(shù)據(jù),從中選取了200 組調度時刻(來自現(xiàn)場人工記錄).數(shù)據(jù)采樣間隔為1 分鐘.按照5 : 4 : 1 的比例將樣本隨機劃分為訓練集、驗證集和測試集.訓練集和驗證集分別用于知識粗提取和知識精煉過程,測試集用于測試模型效果.每個數(shù)據(jù)集均包含煤氣過剩和短缺情況(通過人工調度量進行區(qū)分),代表不同的能源系統(tǒng)運行狀態(tài).考慮由數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(Supervisory control and data acquisition,SCADA)采集的工業(yè)數(shù)據(jù)本身包含異常點、噪聲及缺失數(shù)據(jù),因此在建模之前需要進行數(shù)據(jù)預處理過程,包括對原始數(shù)據(jù)進行異常點刪除、缺失數(shù)據(jù)填補和濾波去噪.此外,在數(shù)據(jù)輸入到分層對比網(wǎng)絡之前,需對粒度化的特征輸入進行歸一化處理,以提升網(wǎng)絡模型的收斂速度.
采用Tensorflow 深度學習平臺和NVIDIA TITAN Xp 圖形處理單元執(zhí)行實驗,模型中LSTM 單元和MLP 均為單隱層結構(每層包含128 個節(jié)點),通過隨機正態(tài)分布初始化網(wǎng)絡權重,并選取均方誤差作為最小化的損失函數(shù).訓練過程中采用Adam 算法優(yōu)化求解,其他主要參數(shù)設置如下: 用于每次訓練過程的數(shù)據(jù)批尺寸batch_size=10;訓練回合數(shù)training_epoch=40;優(yōu)化算法學習率learning_rate=5 × 10-4.
鋼鐵燃氣系統(tǒng)的調度過程需通過對能源存儲量的實時估計來確定調整時刻,并根據(jù)調度模型計算出系統(tǒng)調整量.本文基于多層粒度對比學習訓練得到的特征表示,通過定義不同的輸出層來實現(xiàn)對于系統(tǒng)調整量的估計任務.
圖8(a)比較了不同學習階段的調度量計算結果.其中以人工調度數(shù)據(jù)作為基準參照,對比了專家知識的二分類、多分類對比學習以及提出的分層網(wǎng)絡模型結果.調度量為正數(shù)表示煤氣剩余,此時操作員制定合理的調度方案,通過增加一些可調用戶的消耗量以降低柜位高度;否則視為煤氣短缺情況.從圖8(a)中可以看出,基于專家知識的學習過程無法判斷出第5 個測試樣本的系統(tǒng)運行狀態(tài)(如圖8(a)圓圈中所示),給出了錯誤的調度方向.而經過多層對比學習后,這些狀態(tài)可被所提出的模型準確辨識,說明了本文方法對于深層次調度工況知識獲取的有效性.
圖8 調度量結果對比Fig.8 Comparative results of scheduling amount
此外,圖9 給出了各階段對比模型的計算結果對于專家調整量的絕對誤差.以平均絕對誤差(Mean absolute error,MAE),平均絕對百分誤差(Mean absolute percentage error,MAPE) 和均方根誤差(Root mean square error,RMSE) 作為評價指標,這些指標通過下式計算
圖9 各階段對比學習模型的誤差比較Fig.9 Absolute error of the scheduling amount during different contrastive learning phases
其中,n為測試樣本數(shù)量,yi為真實值,y?i為估計值.此外,表1 列出了詳細的誤差統(tǒng)計結果.從圖9和表1 中可以看出,基于專家知識的多分類模型相比于二分類模型在擬合效果方面無明顯提高,這說明僅利用定性或顯性知識構建的對比學習模型不足以覆蓋隱含的調度工況或特征.而進一步建立的分層次粒度對比網(wǎng)絡可通過多層次的定量學習幫助模型達到與調度專家類似的水平,表明所提分層次結構對于隱性調度知識具有學習能力.
表1 各對比學習階段的誤差統(tǒng)計Table 1 Error statistical results of different contrastive learning phases
為了說明本文所建立的多工況知識模型的有效性,選取一些常見的數(shù)值擬合和調度方法,即深度學習方法(LSTM)[26]、強化學習調度方法(Actorcritic)[22]和核函數(shù)方法(最小二乘支持向量機,Leastsquares support-vector machine,LSSVM)[27]作為對比,所用方法的參數(shù)均通過試錯的方式進行優(yōu)化調整.類似地,圖8(b)、圖10 以及表2 給出了各方法對于調整量的計算結果及誤差和耗時比較.如圖8(b)中圓圈部分所示,LSSVM 和LSTM 方法對于調度方向的判斷存在偏差,這可能是因為這兩種方法僅通過輸入與輸出數(shù)據(jù)的非線性關系進行建模和擬合,無法考慮到能源系統(tǒng)多工況運行場景.由于采用關于調度評價指標的優(yōu)化模型,Actor-critic 方法能夠準確判斷出測試樣本的調度方向,但從圖10和表2 中的結果可以看出,其對于人工經驗的擬合結果不及本文方法.表2 中還給出了提出方法與各對比方法的計算耗時(Time consumption,TC) 統(tǒng)計.由于采用核學習的方式,LSSVM 的計算耗時最短;與傳統(tǒng)有監(jiān)督學習方式不同,Actor-critic 需要從環(huán)境中學習相關特征,因此其學習過程需要更長的時間;而所提方法的訓練過程包含了知識粗提取和知識精煉兩部分且網(wǎng)絡結構更為復雜,因此相比于經典的LSTM 方法更為耗時.考慮到由于副產能源調度具有事件驅動特征,相鄰調度過程往往間隔數(shù)小時以上,因此所提方法不足1 分鐘的訓練代價能夠滿足工業(yè)現(xiàn)場的調度需求.
圖10 不同方法獲得的調度量絕對誤差對比Fig.10 Absolute error of the scheduling amount obtained by the comparative algorithms
進一步地,比較表1 中二分類和多分類知識學習與表2 中對比方法的擬合精度可以發(fā)現(xiàn),無論是否進行分層次學習,采用專家經驗知識構建表征學習模型相比于傳統(tǒng)方法對于調度量估計方面具有優(yōu)勢,這也說明了知識-數(shù)據(jù)協(xié)同建模相比于單純的數(shù)據(jù)驅動方法在能源調度方面的優(yōu)勢.
表2 各對比方法的誤差及耗時統(tǒng)計Table 2 Statistical results of error and time consumption of the comparative algorithms
鑒于鋼鐵燃氣調度屬于一類事件驅動的決策過程,因此對于調度時刻的準確判斷亦十分重要.現(xiàn)有的調度方法大多采用預測建模的方式來估計能源存儲量的變化趨勢,進而作出調度判斷和決策.本文選取LSSVM 作為柜位預測模型,分別采用單工況建模和多工況模型(基于知識表示劃分訓練樣本后,建立組合預測模型) 來驗證所獲得調度知識的有效性.根據(jù)生產現(xiàn)場的長期調研可知,由于生產作業(yè)部門在日間需要進行方案制定、計劃調整、檢測分析等會議,導致其生產頻率比夜間的頻率低,因此柜位多接近于存儲上限,而夜間場景的柜位相對較低,本文分別考慮了這兩種場景下的預測建模精度.
圖11 所示為不同場景下的對比結果.表3 中進一步給出了結果的誤差統(tǒng)計.很顯然根據(jù)所提出的調度知識網(wǎng)絡對輸入數(shù)據(jù)進行工況劃分后,所建立的組合模型相比于單工況模型具有更高的預測精度.上述結果表明,本文所提出的分層粒度對比網(wǎng)絡能夠對調度過程中包含的多工況知識進行認知和表示,而對于知識的有效運用則有助于提高燃氣系統(tǒng)的建模精度.
表3 不同場景下的煤氣柜位預測誤差統(tǒng)計Table 3 The error statistics of the gas tank level prediction under different situations
圖11 通過知識表示構建多工況組合模型與單一預測建模的結果對比Fig.11 Prediction modeling results with and without using the granular contrastive learning model for extracting multiple working-condition knowledge
對于鋼鐵燃氣系統(tǒng)的實時有效調度是實現(xiàn)企業(yè)節(jié)能降耗和智能制造的關鍵.考慮到燃氣產消過程包含多工況特征,本文通過粒度計算的方式提取能源數(shù)據(jù)語義特征,提出了一種基于多層粒度對比網(wǎng)絡的知識獲取與建模方法.其優(yōu)勢在于能夠有效獲取多工況及深層次的調度知識,從而有助于能源系統(tǒng)的建模過程和調度判斷.實驗部分計算和對比了不同工況下的預測精度及調度策略,結果表明提出方法獲得的知識表示可進一步提高建模精度,并達到與人類專家一致的決策水平.
另一方面,由于所提方法尚無法實現(xiàn)基于調度評價的知識和策略優(yōu)化過程,因此一些相關的改進工作值得進一步關注.首先,可建立相關評估體系來指導對比學習中潛在空間的劃分,進一步實現(xiàn)知識發(fā)現(xiàn)、更新知識表示.其次,所提出的知識表示架構還可結合強化學習實現(xiàn)對于調度策略的優(yōu)化過程,將對比學習獲得的知識表示作為強化學習狀態(tài)來約束學習環(huán)境,可簡化狀態(tài)空間,以提升學習表現(xiàn)和收斂能力,獲得更優(yōu)的調度策略.