湯 健喬俊飛徐 喆郭子豪
(1.北京工業(yè)大學信息學部,北京 100124;2.計算智能與智能系統(tǒng)北京市重點實驗室,北京 100124)
城市固廢焚燒(municipal solid waste incineration,MSWI)在生活垃圾的無害化、減量化和資源化處理等方面優(yōu)勢顯著.MSWI過程排放被稱為“世紀之毒”的痕量特性污染物二噁英(dioxin,DXN)[1],其在生物體內(nèi)具有顯著地積累和放大效應,對生態(tài)環(huán)境與人類健康具有巨大危害[2].目前,DXN排放濃度還無法在線實時檢測,其產(chǎn)生機理至今仍不清晰,難以建立數(shù)學模型[3].通過利用高濃度的單氯苯等關聯(lián)指示物進行DXN排放濃度的在線間接檢測是目前研究熱點之一[4-8];但該方法所具有的時間滯后性難以滿足MSWI過程運行優(yōu)化與反饋控制的要求,并且關聯(lián)模型低精度、檢測設備的高復雜性和低性價比等原因?qū)е略摲绞诫y以實際應用.目前工業(yè)界多采用具有周期長、滯后大、成本高等缺點的在線采樣-離線化驗相結合的方法[3],即:以月/季周期或不確定周期由具有資質(zhì)的檢測機構在現(xiàn)場人工采樣若干小時、在實驗室離線化驗至少一周、單次采樣化驗費用為0.5~1萬元.顯然,上述方式不能支撐以降低DXN排放濃度為直接設定目標的MSWI運行優(yōu)化與反饋控制.數(shù)據(jù)驅(qū)動軟測量技術常用于在線獲得依靠離線化驗或?qū)<彝茢嗟确绞讲拍塬@取的難以檢測過程參數(shù)測量值[9-10].MSWI過程的爐內(nèi)溫度、爐排速度、一/二次風量、煙氣壓力/溫度、活性炭量等過程變量以及SO2,HCl等污染氣體的濃度,以秒為周期基于分布式控制系統(tǒng)和在線煙氣檢測系統(tǒng)進行采集;但排放煙氣中的DXN濃度卻以月/季周期或不確定周期基于實驗室離線化驗獲得.顯然,通過過程變量和DXN排放濃度的時序匹配僅能獲得少量有標記建模樣本.此外,MSWI全流程過程變量間存在較強共線性.因此,DXN排放濃度的軟測量需要面對特征約簡和小樣本數(shù)據(jù)非線性建模等問題.
基于國外機構采集的關鍵過程變量進行DXN排放濃度預測的研究包括:文獻[11]針對不同類型的焚燒爐構建線性回歸模型;文獻[12]構建基于遺傳編程的非線性模型,結果表明預測性能強于多元線性回歸和誤差逆向傳播神經(jīng)網(wǎng)絡(back propagation neural network,BPNN)模型;為進一步提高模型泛化性能,文獻[13]構建基于最小二乘-支持向量機(least squaressupport vector machine,LS-SVM)的預測模型.采用國內(nèi)MSWI過程數(shù)據(jù),文獻[14]提出采用遺傳算法優(yōu)化BPNN模型的軟測量策略,但該方法所固有的隨機特性導致難以針對小樣本數(shù)據(jù)獲得穩(wěn)定的預測性能;針對上述問題,文獻[15]提出對小樣本數(shù)據(jù)進行重新抽樣和噪聲注入以增加樣本數(shù)量,再構建基于最大熵神經(jīng)網(wǎng)絡的DXN排放濃度預測模型的策略.上述方法存在難以處理高維特征、面對小樣本數(shù)據(jù)時預測性能穩(wěn)定性差等問題.
研究表明,潛結構映射算法(projection to latent structure,PLS)及其核版本能夠提取線性/非線性潛在變量構建模型,具有能夠消除高維輸入特征間的共線性、降低對建模樣本數(shù)量要求等優(yōu)點[16];但存在過多的輸入特征會降低模型的泛化性能和可解釋性、適合建模樣本特性的核參數(shù)難以有效選擇等問題[17].針對高維近紅外譜數(shù)據(jù),文獻[18]提出組合特征選擇與核潛結構映射算法的建模策略,有效提高了模型的預測性能;但其僅構建了泛化性能有待提升的單一模型,并不適用于小樣本數(shù)據(jù).研究表明,基于選擇性集成(selective ensemble,SEN)算法的軟測量模型具有較佳的泛化性和魯棒性[19].基于“訓練樣本重采樣”集成構造策略的SEN算法驗證了集成部分可用候選子模型可獲得比集成全部候選子模型更好的泛化性能[20],但所采用的BPNN算法并不適合于小樣本數(shù)據(jù)建模.面向小樣本高維頻譜數(shù)據(jù),文獻[21]提出了綜合考慮多源多尺度特征和多工況樣本的雙層SEN潛結構映射建模策略,但該方法所構建軟測量模型存在復雜度高、普適性弱等缺點,同時也未進行維數(shù)約簡.因此,將維數(shù)約簡、核參數(shù)自適應選擇、模型復雜度可裁剪等功能為一體的SEN策略,應用于DXN排放濃度軟測量的研究未見報道.
綜上,針對DXN 排放濃度建模數(shù)據(jù)所固有的高維、小樣本、共線性和非線性等特性,本文提出了基于特征約簡與SEN算法的軟測量方法.對預處理后的建模數(shù)據(jù)采用變量投影重要性(variable projection importance,VIP)和輸入特征約簡比率進行維數(shù)約簡,基于預先給定訓練子集數(shù)量、候選子模型的結構參數(shù)及候選核參數(shù),構建候選子模型并對其進行評價,并基于集成子模型選擇閾值和加權算法進行集成子模型的選擇與合并,對基于全部候選核參數(shù)的SEN核潛結構映射模型采用性能最佳準則獲得最終DXN模型.采用文獻和國內(nèi)某MSWI廠多年的DXN排放濃度數(shù)據(jù)驗證了所提方法的有效性.
MWSI包括固廢儲運、爐內(nèi)焚燒、蒸汽發(fā)電、煙氣處理等階段,其中:焚燒爐將固廢轉(zhuǎn)變?yōu)榛覡a、煙氣和熱量,底部爐排促使固廢在燃燒室內(nèi)移動以使燃燒更為有效和充分,余熱鍋爐產(chǎn)生用于發(fā)電的蒸汽,煙氣處理設備清除焚燒煙氣中的部分污染物.
從產(chǎn)生機理的視角,DXN排放濃度與爐內(nèi)焚燒和煙氣處理階段的過程變量和排放至大氣中的易檢測氣體濃度等相關,如圖1所示.
圖1表明,MSWI包括DXN的產(chǎn)生、吸收和排放共3個階段.在焚燒爐和余熱鍋爐的“加熱-燃燒-冷卻”階段,為保證有機物的有效分解,通常要求焚燒爐內(nèi)的煙氣達到至少850?C并保持2 s;機理研究表明,預熱區(qū)域(20?C~500?C)、高溫轉(zhuǎn)換區(qū)域(800?C~500?C)和低溫轉(zhuǎn)換區(qū)域(500?C~250?C)等均與DXN產(chǎn)生密切相關[22],不同溫度區(qū)域的產(chǎn)生機理也具有差異性;特別是在煙氣冷卻階段,某些被分解的DXN也可能會重新生成.顯然,作為DXN產(chǎn)生階段產(chǎn)物的煙氣G1具有外部可測的最大DXN濃度,但目前MSWI企業(yè)均未對其進行監(jiān)測.在煙氣處理階段,石灰和活性炭被噴射進入反應器以去除酸性氣體和吸附DXN及某些重金屬,進而使得G1煙氣中的DXN被分為兩部分:一部分被吸附后進入飛灰儲倉;另一部分經(jīng)袋式過濾器過濾后留存于煙氣G2中,通過引風機排入煙囪進而作為煙氣G3排放至大氣中.因此,理論上DXN是與焚燒過程和煙氣處理過程的眾多變量,以及CO,HCl,SO2,NOx和HF等氣體濃度相關.圖1表明,MSWI的過程變量和其排放的易檢測氣體濃度以秒為周期在線實時采集,但DXN排放濃度需通過至少1周的時間才能獲得離線化驗值.可見,DXN排放濃度軟測量面對的是特性難以描述的小樣本高維數(shù)據(jù).此外,DXN生成和吸收階段的機理復雜不清,不同階段過程變量的特性也存在差異性,這些因素導致難以進行基于機理知識的特征選擇.因此,基于約簡特征構建基于“訓練樣本重采樣”集成構造策略的SEN模型可有效用于DXN排放濃度的預測.進一步,待構建的預測模型可表示為
圖1 面向DXN排放的城市固廢焚燒(MSWI)過程描述Fig.1 DXN emissions-based municipal solid waste incineration(MSWI)process description
本文提出的DXN排放濃度軟測量策略包括數(shù)據(jù)采集與預處理、基于VIP的特征約簡和基于訓練樣本集成構造策略SEN軟測量模型共3個模塊,見圖2.
將DXN產(chǎn)生階段、吸收階段和排放階段在線采集的與DXN排放濃度相關的過程變量或易檢測氣體排放濃度確定為輸入特征,結合DXN排放濃度的離線化驗值構建建模數(shù)據(jù)的輸入輸出樣本對,并進行離群點和缺失值的處理.全部建模樣本可表示為
其中X ∈RN×M和y ∈RN×1表示用于構建DXN 排放濃度模型的輸入和輸出數(shù)據(jù).
首先構建基于全部輸入特征的線性潛結構映射模型,再計算這些輸入特征的VIP值并對其進行排序,最后基于依據(jù)經(jīng)驗設定的特征約簡比率值選擇輸入特征.PLS算法通過最大化輸入輸出數(shù)據(jù)間的協(xié)方差在新的潛在變量空間構建具有線性結構的多層回歸模型,其層數(shù)即為潛在變量(latent variable,LV)的數(shù)量.算法描述如下所示.
圖2 軟測量策略Fig.2 Soft sensor strategy
算法1線性PLS算法.
輸入:輸出矩陣X.
輸出:輸出矩陣Y.
由以上算法描述可知,線性PLS算法的外部模型用于提取和輸入/輸出空間均相關的潛在變量,內(nèi)部模型通過這些LV構建回歸模型,其可表示為
表示與算法1中的向量所相應的矩陣;H為LV的數(shù)量.
VIP指標能夠表征每個輸入特征對模型性能的影響,以第mth特征為例,其計算式如下:
首先采用操縱訓練樣本的集成構造策略產(chǎn)生訓練樣本子集并基于候選核參數(shù)和結構參數(shù)值構建候選子模型,接著對候選子模型進行評價并基于選擇閾值獲得集成子模型,然后對基于相同核參數(shù)的集成子模型進行加權以獲得模型輸出,最后基于預測性能獲得最終的DXN軟測量模型.主要步驟描述如下.
1) 訓練子集構造.
基于“訓練樣本采樣”方式從訓練樣本{(xSel,y)n}中產(chǎn)生數(shù)量為J的訓練樣本子集,即集成構造,可表示為
上述DXN預測模型的構建如圖3所示.
圖3 基于訓練樣本集成構造的SEN軟測量模型構建流程Fig.3 SEN soft sensor model construction process based on training samples ensemble construction
1) 數(shù)據(jù)描述.
利用水冷壁焚化爐數(shù)據(jù)[12-13]構建DXN排放濃度模型,其輸入特征按編號從1-8依次為:蒸汽負荷(tone/h)、煙氣中H2O含量(%)、煙道溫度(?C)、煙氣流量(Nm3/min)、CO濃度(ppmv)、HCl濃度(ppml)、顆類物(PM)濃度(mg/Nm3)和燃燒室上方溫度(?C)(注:文獻中對該數(shù)據(jù)集無更為詳細的描述).此處將28個樣本的70%和30%分別作為建模數(shù)據(jù)和測試數(shù)據(jù).
2) 實驗結果.
首先,構建PLS模型,其全部8個LV的方差貢獻率如表1所示.
如表1所示,全部LV提取的輸入和輸出數(shù)據(jù)累積方差貢獻率為100%和77.08%,表明該文獻選擇的輸入特征是合理的.
接著,計算輸入特征的VIP值,如圖4所示.
圖4表明,全部8個特征的VIP值均大于1,其中第5個特征(CO濃度)具有最大值,其他特征按VIP值依次排序為第3個(煙道溫度)、第1個(蒸汽負荷)、第7個(PM濃度)、第2個(煙氣中H2O含量)、第4個(煙氣流量)、第8個(燃燒室上方溫度)、第6個(燃燒室上方溫度).
表1 文獻DXN 數(shù)據(jù)基于PLS 模型的方差貢獻率統(tǒng)計表Table 1 Statistical table of variance contribution rate based on PLS model for ref DXN data
圖4 文獻DXN數(shù)據(jù)輸入特征的VIP值Fig.4 VIP value of input feature for ref DXN data
采用遺傳算法工具箱確定不同候選子模型的理想權重.同時,考慮到遺傳算法存在的隨機性,基于每個候選參數(shù)的候選子模型均運行20次進行均值統(tǒng)計.
最后,考慮ρFeSel和ρKLV是影響模型輸入特征和集成子模型結構的關鍵參數(shù),采用網(wǎng)格搜索法進行選擇.結合圖4可知,在取值為1,0.8,0.6,0.4和0.2時所選擇的輸入特征編號的子集分別為(5,3,1,7,2,4,8,6),(5,3,1,7,2,4),(5,3,1),(5,3)和5.設定ρKLV的范圍為1~10,其最大值高于原始輸入特征數(shù)量原因在于核技術擴展了變量維數(shù).上述兩個參數(shù)與模型預測性能間的關系如圖5所示.
圖5 文獻DXN數(shù)據(jù)建模時ρFeSel和ρKLV與預測性能間的關系Fig.5 Relationship between ρFeSel and ρKLV and predicted performance for ref DXN data modeling
由圖5可知:針對訓練數(shù)據(jù),ρFeSel=1時的平均預測誤差稍弱于ρFeSel=0.8;但是針對測試數(shù)據(jù),ρFeSel=1 且KLV=7 具有最佳平均和最小預測誤差;針對訓練和測試數(shù)據(jù),選擇較少輸入特征建模時預測性能均具有較大跳躍性,這表明該算法針對小樣本低維數(shù)據(jù)存在隨機性.可見,適當選擇ρFeSel和ρKLV的值是非常必要的.
3) 方法比較.
本文方法與文獻,以及線性PLS基準方法等進行比較,結果如表2所示.
表2 文獻DXN數(shù)據(jù)不同方法的預測誤差比較結果Table 2 Comparison of prediction errors of different methods for ref DXN data
由表2可知:本文方法在ρFeSel=1和KLV=7時,具有最佳預測性能,其訓練和測試數(shù)據(jù)的平均RMSE分別為23.79和78.30,較文獻[12]的GP模型在精度上至少提高1倍多,較文獻[13]的LS-SVM模型和PLS基準方法也有較大提高;此外,測試數(shù)據(jù)的預測范圍波動比較大,但其最小平均預測誤差值僅為70.98.上述結果表明,選擇適當?shù)妮斎胩卣骱湍P蛥?shù)是非常關鍵的.
上述研究表明,本文方法是有效的.基于我國MSWI過程的DXN排放濃度數(shù)據(jù)構建軟測量模型將更具有實際意義.
1) 數(shù)據(jù)描述.
本文數(shù)據(jù)源于北京某MSWI焚燒企業(yè),涵蓋了2012-2018年測試的DXN排放濃度檢測樣本34組,其中:DXN取值為3次采樣化驗的均值,過程變量取值為采樣當天24小時的均值(包含有效過程變量的數(shù)量為287);訓練和測試樣本等分,各為17組.
2) 實驗結果.
首先,構建PLS模型,其前10個LV的方差貢獻率如表3所示.
表3 國內(nèi)DXN數(shù)據(jù)基于PLS模型的方差貢獻率統(tǒng)計表Table 3 Statistical table of variance contribution rate based on PLS model for China DXN data
如表3所示,前10個LV所提取的輸入和輸出數(shù)據(jù)的方差累積貢獻率為分別為90.25%和100%,表明較少LV能夠蘊含建模數(shù)據(jù)中的多數(shù)變化.
接著,計算全部輸入特征的VIP值,如圖6所示.
圖6 國內(nèi)DXN數(shù)據(jù)輸入特征的VIP值Fig.6 VIP value of input feature for China DXN data
圖6表明輸入特征VIP值的最小值為0.9230e?4、均值為0.1999、最大值為0.7051,可見輸入特征間具有較大差異性,其中排在前10的過程變量是:燃燼爐排左側速度、燃燼爐排右側速度、汽包爐水電導率、燃燒爐排右空氣流量、爐墻左側外溫度、發(fā)電機前軸承振動、給水泵出口流量、煙囪排放CO濃度、給水泵出口給水壓力、二次燃燒室左側溫度,取值范圍為0.7051~0.5034;其中,除“汽包爐水電導率”和“汽包爐水電導率”外,均與DXN的生成、吸收和排放階段直接相關,這表明了國內(nèi)DXN數(shù)據(jù)的可用性,以及采用VIP選擇輸入特征的合理性.
圖7 國內(nèi)DXN數(shù)據(jù)建模時ρFeSel和ρKLV與預測性能間的關系Fig.7 Relationship between ρFeSel and ρKLV and predicted performance for China DXN data modeling
接著,采用與文獻DXN數(shù)據(jù)相同的J和參數(shù)運行20次進行統(tǒng)計;取ρKLV=112;結合圖6,設定ρFeSel的取值為0.01,0.03,0.05,0.08,0.1,其所對應的輸入特征數(shù)量分別為2,8,14,22,28,采用網(wǎng)格尋優(yōu)法獲取ρFeSel和ρKLV值并分析其與模型預測性能間的關系.上述參數(shù)與模型預測性能間的關系如圖7所示.
圖8 國內(nèi)DXN數(shù)據(jù)建模時核參數(shù)與預測性能間的關系Fig.8 VIP value of input feature for China DXN data
由圖7可知:針對訓練數(shù)據(jù),在ρFeSel=0.1和KLV=9時具有最佳的平均預測性能;針對測試數(shù)據(jù),ρFeSel=0.1和KLV=1時具有最佳預測性能,其中RMSE的均值為0.01792.核參數(shù)與模型預測性能間的關系如圖8所示.
由圖8可知,核參數(shù)的取值為300.因此,選擇適當?shù)妮斎胩卣骱蛯W習參數(shù)很必要.
3) 方法比較.
此處與基準線性PLS/核PLS方法進行比較,結果如表4所示.
由表4 可知:1)在選擇28 個輸入特征(ρFeSel=0.1)和KLV=1時,本文所提方法具有最佳預測性能,其最小RMSE為0.01643,其維數(shù)與原輸入特征相比降低了近10倍,表明特征約簡和SEN建模策略的有效性;2)采用線性PLS和核PLS建模時,在LV和KLV數(shù)量為1時具有最佳預測性能,其第1個KLV所提取的輸入數(shù)據(jù)和輸出數(shù)據(jù)的方差貢獻率分別為56.76%和71.76%,比PLS 方法提高了20%~30%;但針對預測性能,卻只是提升訓練樣本而未提升測試樣本,這與特征約簡的VIP值為線性和建模樣本的數(shù)量稀少相關;3)所提方法的最小預測誤差較核PLS方法在預測性能上具有較大提升,表明SEN策略是有效的.
表4 國內(nèi)DXN數(shù)據(jù)不同方法的預測誤差比較結果Table 4 Comparison of prediction errors of different methods for China DXN data
綜上可知,本文所提方法在如何進行非線性特征選擇、如何同時優(yōu)化特征約簡與模型參數(shù)選擇機制、如何降低模型的隨機性等方面的研究還有待于深入進行.
本文提出了一種新的基于特征約簡和選擇性集成算法的二噁英排放濃度軟測量方法,其主要創(chuàng)新點是:基于線性潛結構映射模型獲取的變量投影重要性以及依經(jīng)驗設定的特征約簡比率因子確定輸入特征;基于“訓練樣本重采樣”的集成構造策略構建核參數(shù)自適應選擇和模型復雜度依需求設定的選擇性集成核潛結構映射模型.采用文獻和國內(nèi)的DXN排放濃度數(shù)據(jù)驗證了所提方法的有效性.
進一步的研究包括:非線性特征選擇、特征約簡與模型參數(shù)優(yōu)化機制、以及如何進行全階段多相態(tài)二噁英濃度預測,以更好地為城市固廢焚燒過程的運行控制提供支撐.