孫欽乾,劉萌萌,鄭煥祺,周玉成
(1.山東建筑大學(xué),山東 濟(jì)南 250101;2.山東省產(chǎn)品質(zhì)量檢驗(yàn)研究院)
氣候艙法是應(yīng)用廣泛的建材及家具的甲醛釋放量檢測(cè)方法之一,因其具有檢測(cè)環(huán)境與待檢樣品實(shí)際使用環(huán)境類似的優(yōu)點(diǎn),已經(jīng)逐漸主導(dǎo)未來檢測(cè)甲醛的發(fā)展方向[1-2]。但氣候艙法存在檢測(cè)時(shí)間長(zhǎng)的問題,如,JIS A1911-2015《Determination of the emission of formaldehyde by building materials and building related products-Large chamber method》標(biāo)準(zhǔn)規(guī)定的測(cè)試時(shí)間最長(zhǎng)可達(dá)28 天。而建立預(yù)測(cè)模型來預(yù)測(cè)艙內(nèi)甲醛濃度成為了節(jié)約時(shí)間成本、減少電力消耗的有效途徑。例如已有一階衰減模型[3]、灰色模型[4]及傳質(zhì)模型[5]等預(yù)測(cè)模型的應(yīng)用。但上述模型多應(yīng)用于建材的VOC釋放量預(yù)測(cè),專用于人造板家具甲醛釋放量的預(yù)測(cè)模型較少。近年來,支持向量機(jī)因其性能的優(yōu)越性,已獲得諸多應(yīng)用。如使用SVM 解決液壓泵壽命預(yù)測(cè)問題[6]、衛(wèi)星熱平衡溫度預(yù)測(cè)問題[7]及巖體高邊坡位移預(yù)測(cè)問題[8]。上述文獻(xiàn)中所用數(shù)據(jù)與氣候艙內(nèi)甲醛濃度變化規(guī)律類似,都是具有單調(diào)趨勢(shì)的時(shí)間序列?;谏鲜鲆蛩兀疚膶VM 應(yīng)用到甲醛濃度預(yù)測(cè)中來。
研究表明,采用降噪算法對(duì)數(shù)據(jù)進(jìn)行處理后再采用SVM 建模會(huì)取得更優(yōu)的預(yù)測(cè)結(jié)果[9]?;パa(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解[10]可以對(duì)非線性、非平穩(wěn)數(shù)據(jù)進(jìn)行自適應(yīng)分解,將噪聲與有效信息進(jìn)行分離,適用于甲醛濃度數(shù)據(jù)的降噪。采用智能優(yōu)化算法優(yōu)化SVM 參數(shù)也是提升模型預(yù)測(cè)精度的有效手段。遺傳算法、退火算法等智能優(yōu)化算法已被大量學(xué)者所采用。多種群遺傳算法在遺傳算法的基礎(chǔ)上進(jìn)行了優(yōu)化,降低了陷入局部最優(yōu)的可能性[11],適合對(duì)SVM進(jìn)行參數(shù)尋優(yōu)。
本文采用CEEMD 算法對(duì)甲醛濃度數(shù)據(jù)進(jìn)行降噪處理,利用MPGA 優(yōu)化SVM 參數(shù),建立CEEMDMPGA-SVM 預(yù)測(cè)模型,對(duì)氣候艙內(nèi)家具的甲醛濃度進(jìn)行預(yù)測(cè)。
理想條件下氣候艙內(nèi)甲醛濃度變化趨勢(shì)是一條會(huì)在短時(shí)間快速達(dá)到峰值,隨后開始逐漸衰減的曲線。但受艙內(nèi)溫濕度波動(dòng)及檢測(cè)誤差等因素的影響,使得檢測(cè)數(shù)據(jù)會(huì)存在失真,呈現(xiàn)出一定的波動(dòng)性。選用合適的濾波方法濾除干擾成分,有助于提高SVM模型的預(yù)測(cè)性能。CEEMD 算法對(duì)經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)進(jìn)行了優(yōu)化,在EMD 基礎(chǔ)上采用多次增添白噪聲的方法較好的解決了模態(tài)混疊問題,避免了噪聲和有效信息無法被正確的分離的問題。
本文采用CEEMD 算法對(duì)甲醛濃度數(shù)據(jù)進(jìn)行降噪,步驟如下。
⑴設(shè)某家具的甲醛濃度數(shù)據(jù)序列為C,將C中加入k次幅值相同但正負(fù)相反的隨機(jī)白噪聲+ni(t)及-ni(t),可得
⑶通過公式⑵對(duì)分解后的第j個(gè)IMF分量IMFj進(jìn)行求解。
其中,IMFij與IMF-ij分別表示第i次加入正白噪分解后獲得第j個(gè)IMF分量與第i次加入負(fù)白噪聲后分解獲得的第j個(gè)IMF分量。分解后的趨勢(shì)項(xiàng)R可通過公式⑶進(jìn)行求解
其中,Ri與R-i分別代表第i次加正白噪聲、負(fù)白噪后分解后獲得相應(yīng)的趨勢(shì)項(xiàng)。經(jīng)公式⑵與公式⑶的集總平均后,添加的正負(fù)白噪聲被相互抵消。
⑷C經(jīng)過CEEMD 分解后,波動(dòng)項(xiàng)與趨勢(shì)項(xiàng)實(shí)現(xiàn)了大致分離。得到若干個(gè)IMF分量及趨勢(shì)項(xiàng)R。通過極值點(diǎn)數(shù)量的多少可判斷該分量波動(dòng)性的強(qiáng)弱,將極值點(diǎn)數(shù)量與數(shù)據(jù)總量之比大于0.2 的IMF分量進(jìn)行剔除。而對(duì)于波動(dòng)較小的IMF分量不做處理,以免因造成有效信息的損失。將剩余IMF分量與趨勢(shì)項(xiàng)R進(jìn)行重組即可得到降噪后的甲醛濃度數(shù)據(jù)序列。
支持向量機(jī)的回歸預(yù)測(cè)算法被稱為支持向量回歸,SVM 的基本原理是將訓(xùn)練數(shù)據(jù)轉(zhuǎn)化到一個(gè)高維度的空間中。建立一個(gè)超平面ωTx+b=0,使樣本xi滿足公式⑷的約束條件
其中,ωT代表該超平面的法向量,b是常數(shù)項(xiàng),ε是容忍偏差,ξ與是松弛變量。
超平面兩側(cè)間距ε之間的范圍被稱為間隔帶,SVM 的目地是使樣本數(shù)據(jù)全部落入間隔帶內(nèi),但這往往難以實(shí)現(xiàn),因此引入松弛變量ξ與,容許少量樣本數(shù)據(jù)不在間隔帶內(nèi)。SVM 要求使間樣本點(diǎn)盡可能在間隔帶內(nèi)的同時(shí),還要求總體損失最小,這就變成了一個(gè)如公式⑸所示的最優(yōu)化問題。
其中,c為懲罰系數(shù),決定了SVM對(duì)不在間隔帶內(nèi)的樣本數(shù)據(jù)的敏感程度,由人工設(shè)定。
對(duì)式⑸中相關(guān)參數(shù)可采用拉格朗日乘子法求解。參數(shù)確定后,即可獲得SVM模型函數(shù):
其中,?表示將數(shù)據(jù)轉(zhuǎn)化到到高維度空間的操作。
將數(shù)據(jù)轉(zhuǎn)換到高維度空間可能會(huì)極大的增加計(jì)算量。為解決這一問題,SVM 引入核函數(shù)的概念,避免在高維空間中進(jìn)行計(jì)算。高斯核函數(shù)是泛化性最好應(yīng)用最廣泛地核函數(shù),其表達(dá)式如公式⑺所示。
其中,g值由人工設(shè)定。
本文使用MPGA 算法對(duì)c,g進(jìn)行尋優(yōu),計(jì)算SVM對(duì)訓(xùn)練集的均方誤差(Mean Square Error,MSE)。將MSE作為MPGA算法的尋優(yōu)標(biāo)準(zhǔn),MSE定義如下:
其中,m為訓(xùn)練集數(shù)據(jù)總量,yi為第i個(gè)數(shù)據(jù)的實(shí)際值,f(xi)為SVM 擬合值。通過MPGA 算法選擇使MSE最小的c,g值,并以此訓(xùn)練SVM,提高SVM 模型的預(yù)測(cè)性能。使用SVM預(yù)測(cè)甲醛濃度的過程如下。
⑴ 設(shè)濾波后的甲醛濃度序列為Cw,Cw=[c(1),c(2),…,c(t),…,c(T)]。c(t)為t時(shí)刻測(cè)得的甲醛濃度。對(duì)Cw進(jìn)行重構(gòu),如公式⑼所示
其中,n是嵌入維數(shù),其值可根據(jù)公式(8)進(jìn)行確定,選擇使MSE最小的n。
⑵將X的每一行做為SVM的一個(gè)輸入,Y與之相對(duì)應(yīng)的每一行做為其標(biāo)簽。訓(xùn)練SVM,建立甲醛歷史濃度值與將來濃度值間的映射關(guān)系。
⑶通過T和之前時(shí)刻的歷史濃度數(shù)據(jù)預(yù)測(cè)T +1時(shí)刻的甲醛濃度值。即,=f(c(T),c(T-1),...,c(T-n+1))。作為輸入數(shù)據(jù)可實(shí)現(xiàn)對(duì)c(T+2)的預(yù)測(cè)。即,c(T),...,c(T-n+2)),以此類推,最終可獲得T+l時(shí)刻的甲醛濃度預(yù)測(cè)值,實(shí)現(xiàn)l步預(yù)測(cè)。
主要實(shí)驗(yàn)設(shè)備:30m3氣候艙。紫外分光光度計(jì)。雙路大氣采樣器。
實(shí)驗(yàn)樣品 家具1:人造板衣柜;家具2:人造板儲(chǔ)物柜。
實(shí)驗(yàn)步驟①預(yù)處理:將待測(cè)樣品在接近實(shí)際檢測(cè)要求的溫濕度環(huán)境中環(huán)境下放置120小時(shí)。②啟動(dòng)氣候艙,設(shè)置艙內(nèi)溫度為(23.0±2)℃,濕度為45%±10%,換氣率為1h-1。③將預(yù)處理完成試樣轉(zhuǎn)移至氣候艙內(nèi)中心位置,以實(shí)驗(yàn)樣品放入氣候艙時(shí)為0時(shí)刻,第一天在1、3、5、6、7、8、10、13、15、19 小時(shí)抽取試樣,此后每日取樣三次,本文實(shí)驗(yàn)持續(xù)時(shí)間為七天。④使用酚試劑分光光度法對(duì)試樣的甲醛濃度進(jìn)行測(cè)定。⑤重復(fù)上述步驟,繼續(xù)新樣品檢測(cè)。
使用家具1 的甲醛濃度數(shù)據(jù)進(jìn)行建模,前四天甲醛濃度數(shù)據(jù)為訓(xùn)練集,后三天數(shù)據(jù)為測(cè)試集。實(shí)驗(yàn)初期,艙內(nèi)甲醛濃度存在較短暫的上升期,該部分?jǐn)?shù)據(jù)并未參與建模。采用CEEMD 對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行分解,對(duì)缺失的夜間檢測(cè)數(shù)據(jù),采用三次Hermite 插值進(jìn)行補(bǔ)齊。將極值點(diǎn)數(shù)量與數(shù)據(jù)總量之比大于0.2 的分量IMF1及IMF2剔除后重組剩余IMF分量及趨勢(shì)項(xiàng)R。圖1展示了濾波后的甲醛濃度數(shù)據(jù)序列與原始數(shù)據(jù)序列的對(duì)比,其中,“o”為原始數(shù)據(jù),“*”為濾波后數(shù)據(jù)。
圖1 濾波數(shù)據(jù)與原始數(shù)據(jù)對(duì)比圖
再次對(duì)濾波后數(shù)據(jù)進(jìn)行三次Hermite 插值,將其變?yōu)榈乳g距序列,并進(jìn)行歸一化。利用MPGA 優(yōu)化SVM參數(shù)。參數(shù)值如表1所示。
表1 參數(shù)取值表
用上述參數(shù)訓(xùn)練CEEEMD-MPGA-SVM,模型的預(yù)測(cè)效果如圖2所示。
圖2 CEEMD-MPGA-SVM模型預(yù)測(cè)結(jié)果圖(家具1)
圖2中“*”為原始數(shù)據(jù),“◇”為本文模型為對(duì)訓(xùn)練集的擬合結(jié)果,“o”表示對(duì)測(cè)試集的預(yù)測(cè)結(jié)果。從圖2可以觀察到預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)基本吻合。為了進(jìn)一步證明CEEMD-MPGA-SVM 的泛化能力及預(yù)測(cè)效果,分別采用該模型與MPGA-SVM、SVM 及應(yīng)用較廣的一階衰減模型對(duì)家具1 及家具2 甲醛釋放濃度進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果如表2所示。
表2 CEEMD-MPGA-SVM、MPGA-SVM、SVM及一階衰減模型預(yù)測(cè)結(jié)果對(duì)比
從表2 可以看出CEEMD-MPGA-SVM 對(duì)預(yù)測(cè)效果最佳,證明了本模型的優(yōu)越性。MPGA-SVM 模型預(yù)測(cè)結(jié)果遜于本文模型,這是因?yàn)橛?xùn)練集中包含噪聲,使得SVM 在訓(xùn)練時(shí)對(duì)噪聲進(jìn)行了擬合,影響了預(yù)測(cè)效果。單一SVM 模型預(yù)測(cè)同樣不佳,不加選擇的采用默認(rèn)參數(shù)進(jìn)行建模具有一定盲目性。一階衰減模型的預(yù)測(cè)效果最差,該模型嚴(yán)重了低估甲醛濃度值。
針對(duì)氣候艙法存在檢測(cè)周期長(zhǎng),耗能大的問題,本文提出了CEEMD-MPGA-SVM 甲醛濃度預(yù)測(cè)模型。采用CEEMD 算法對(duì)采集的甲醛濃度數(shù)據(jù)中的噪聲和有效信息進(jìn)行了充分的分離,降低了噪聲對(duì)SVM的干擾,提高了模型的抗干擾性能。為驗(yàn)證CEEMDSVM 模型的泛化能力及預(yù)測(cè)性能,使用本模型及現(xiàn)有模型分別對(duì)兩種不同家具的甲醛濃度進(jìn)行預(yù)測(cè),本文提出的預(yù)測(cè)模型預(yù)測(cè)效果最佳,預(yù)測(cè)誤差在6%以內(nèi),這對(duì)縮短氣候艙法檢測(cè)周期及節(jié)能減排具有一定積極意義。本研究?jī)H對(duì)氣候艙內(nèi)甲醛濃度進(jìn)行了預(yù)測(cè),在未來可進(jìn)一步研究,將其推廣到室內(nèi)環(huán)境的甲醛預(yù)測(cè)中來。