張 汛,李 鵬
(1. 天津大學(xué)環(huán)境科學(xué)與工程學(xué)院,天津 300072;2. 桂林電子科技大學(xué)海洋工程學(xué)院,廣西 北海 536000)
在水資源供需平衡、水污染防治規(guī)劃研究過程中,工業(yè)廢水排放量預(yù)測屬于重要工作,將預(yù)測結(jié)果作為依據(jù)可以有效實(shí)現(xiàn)環(huán)境的科學(xué)管理[1]。治理能力、工業(yè)結(jié)構(gòu)、管理水平、科技水平以及產(chǎn)品種類等因素都會對工業(yè)廢水排放產(chǎn)生影響[2]。工業(yè)廢水排放在空間和時間的變化下存在較強(qiáng)的隨機(jī)性,因此工業(yè)廢水排放預(yù)測的難度較高,需要對工業(yè)廢水排放量預(yù)測方法進(jìn)行分析和研究。
張金勇[3]等人結(jié)合ARIMA模型和馬爾薩斯模型對GDP和人口進(jìn)行預(yù)測,通過排污系數(shù)法獲得工業(yè)廢水排放量與人口、GDP之間的關(guān)系,根據(jù)分析結(jié)果完成工業(yè)廢水排放量的預(yù)測,該方法獲取的排放數(shù)據(jù)中存在大量的缺失數(shù)據(jù),導(dǎo)致方法存在數(shù)據(jù)完整性差的問題。劉鴻斌[4]等人通過偏最小二乘法獲取投影的重要性信息,根據(jù)獲取的信息選擇最優(yōu)變量子集,并將其作為輸入,輸入至軟測量模型中,構(gòu)建工業(yè)廢水排放預(yù)測模型,完成工業(yè)廢水排放量的預(yù)測,該方法用完整度低的數(shù)據(jù)進(jìn)行工業(yè)廢水排放量預(yù)測,導(dǎo)致預(yù)測結(jié)果的精度較低。
為了解決上述方法中存在的問題,提出基于灰色GM(1,1)模型的工業(yè)廢水排放總量預(yù)測模型。
獲取的工業(yè)廢水排放數(shù)據(jù)中存在一些缺失數(shù)據(jù),對工業(yè)廢水排放總量預(yù)測結(jié)果產(chǎn)生影響[5]。為了提高預(yù)測精度,需要對缺失數(shù)據(jù)進(jìn)行填補(bǔ)處理?;诨疑獹M(1,1)模型的工業(yè)廢水排放總量預(yù)測模型通過矢量神經(jīng)網(wǎng)絡(luò)根據(jù)設(shè)定的可信度λp∈[0,1]對缺失數(shù)據(jù)進(jìn)行填補(bǔ)。
基于灰色GM(1,1)模型的工業(yè)廢水排放總量預(yù)測模型在矢量神經(jīng)網(wǎng)絡(luò)中引入可信度λp對矢量神經(jīng)網(wǎng)絡(luò)進(jìn)行修正,利用修正后的網(wǎng)絡(luò)完成缺失數(shù)據(jù)的填補(bǔ)。
用(n-k-m)描述矢量神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),設(shè)f代表的是神經(jīng)元在網(wǎng)絡(luò)中對應(yīng)的激活函數(shù),基于灰色GM(1,1)模型的工業(yè)廢水排放總量預(yù)測模型用sigmoid函數(shù)代替激活函數(shù),獲得實(shí)際的網(wǎng)絡(luò)輸出youtput,其表達(dá)式如下
(1)
1)前向傳播
區(qū)間類型矢量即為所有神經(jīng)元在前向傳播算法中的輸入,也可以用區(qū)間類型的矢量描述網(wǎng)絡(luò)輸出,用sigmoid函數(shù)代替神經(jīng)元對應(yīng)的激活函數(shù),此時輸出節(jié)點(diǎn)可通過下式進(jìn)行描述
(2)
(3)
設(shè)Epq代表輸出誤差,其計(jì)算公式如下
(4)
對上述公式計(jì)算的輸出誤差Epq進(jìn)行修正,獲得矢量神經(jīng)網(wǎng)絡(luò)對應(yīng)的輸出總誤差Ep
(5)
2)后向傳播
(6)
用{(xp,dp,λp),p=1,2,…,N}描述訓(xùn)練樣本集STr;N′代表完備訓(xùn)練樣本在訓(xùn)練樣本集STr中存在的數(shù)量;STe描述測試樣本集,Sf=STr-Ste代表的是殘缺數(shù)據(jù)構(gòu)成的樣本集,用Nf=N-N′描述殘缺數(shù)據(jù)的數(shù)量,填補(bǔ)缺失數(shù)據(jù)的過程如下:
1)網(wǎng)絡(luò)訓(xùn)練
①初始化處理訓(xùn)練參數(shù),設(shè)置訓(xùn)練樣本在訓(xùn)練樣本集Str中的可信度為λp,并將訓(xùn)練次數(shù)的上限設(shè)置為Nt,輸出誤差上限設(shè)置為Emax,同時設(shè)定慣性項(xiàng)系數(shù)α和訓(xùn)練步長η,計(jì)數(shù)器在訓(xùn)練過程中的次數(shù)設(shè)置為1,賦予權(quán)值矩陣w(1)、w(2)相應(yīng)的數(shù)值,并將訓(xùn)練樣本對應(yīng)的標(biāo)志p設(shè)定為1。
②在訓(xùn)練過程中將輸出誤差變量E設(shè)定為0,并在矢量神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)中輸入訓(xùn)練樣本集Str中存在的訓(xùn)練樣本。
③通過上述過程獲得修正后的權(quán)值矩陣w(1)、w(2),并計(jì)算輸出誤差E。
④在訓(xùn)練樣本集Str中檢查訓(xùn)練樣本是否完成訓(xùn)練,如果p 2)填補(bǔ)殘缺數(shù)據(jù) ①初始化處理參數(shù)以及殘缺樣本標(biāo)志l=1,設(shè)置樣本l對應(yīng)的填充矩陣Al。 在工業(yè)廢水排放總量預(yù)測過程中GM(1,1)模型的應(yīng)用較多[8,9],其主要過程如下: 用{x(0)(t)}描述原始時間序列,其中t=1,2,…,n,用{x(1)(t)}描述新數(shù)據(jù)序列,可通過累加原始時間序列獲得 (7) 通過下式描述上式的微分方程 (8) 根據(jù)式(8)獲得 其中,-a代表的是發(fā)展系數(shù),用來描述預(yù)測數(shù)據(jù)序列與原始數(shù)據(jù)序列之間的發(fā)展趨勢;u描述了數(shù)據(jù)在變化過程中的關(guān)系,代表的是灰色作用向量。在此基礎(chǔ)上獲得還原模型 (9) 實(shí)際值與上述GM(1,1)模型獲得的預(yù)測值之間存在誤差,根據(jù)誤差的實(shí)際情況對誤差進(jìn)行劃分,獲得n個狀態(tài)?i=[?1i,?2i],設(shè)置馬爾可夫過程對應(yīng)的狀態(tài)轉(zhuǎn)移概率pij(n),當(dāng){Xn,n∈T}為齊次馬爾可夫鏈時,n不對轉(zhuǎn)移概率pij(n)產(chǎn)生影響,此時下一步系統(tǒng)狀態(tài)對應(yīng)的轉(zhuǎn)移概率矩陣P可通過下式描述 (10) (11) 通過以下兩種方式,在馬爾可夫模型的基礎(chǔ)上改進(jìn)GM(1,1)模型,構(gòu)建灰色GM(1,1)模型: (12) 2)根據(jù)狀態(tài)轉(zhuǎn)移矩陣和預(yù)測狀態(tài)對灰色預(yù)測相對誤差在下一時刻所處的狀態(tài)進(jìn)行計(jì)算,根據(jù)計(jì)算結(jié)果獲得系統(tǒng)灰色預(yù)測相對誤差在未來不同時刻對應(yīng)的狀態(tài),預(yù)測區(qū)間可通過修正灰色預(yù)測結(jié)果獲得,預(yù)測值即為預(yù)測區(qū)間對應(yīng)的中值[10]。 (13) 式中,pijmax對應(yīng)的jmax即為最大數(shù)據(jù)在狀態(tài)轉(zhuǎn)移矩陣中對應(yīng)的列。 通過上述方法預(yù)測未來時刻對應(yīng)的數(shù)值,預(yù)測結(jié)果即為預(yù)測數(shù)值對應(yīng)的平均值,構(gòu)建工業(yè)廢水總排放量預(yù)測模型 (14) 為了驗(yàn)證基于灰色GM(1,1)模型的工業(yè)廢水排放總量預(yù)測模型的整體有效性,需要對基于灰色GM(1,1)模型的工業(yè)廢水排放總量預(yù)測模型進(jìn)行測試。分別采用基于灰色GM(1,1)模型的工業(yè)廢水排放總量預(yù)測模型、基于人口和GDP的主要水污染物排放量預(yù)測方法和基于變量選擇的廢水排放總量預(yù)測方法進(jìn)行如下對比實(shí)驗(yàn)。 通過相關(guān)系數(shù)ρ驗(yàn)證上述方法獲取數(shù)據(jù)的完整性,相關(guān)系數(shù)ρ在區(qū)間[0,1]內(nèi)取值,相關(guān)系數(shù)ρ越高,表明數(shù)據(jù)的完整性越高。相關(guān)系數(shù)ρ的計(jì)算公式如下 (15) 不同方法的測試結(jié)果如下: 分析圖1可知,在多次工業(yè)廢水排放總量預(yù)測測試過程中,基于灰色GM(1,1)模型的工業(yè)廢水排放總量預(yù)測模型獲得的相關(guān)系數(shù)ρ均在0.8以上,基于人口和GDP的預(yù)測方法和基于變量選擇的預(yù)測方法獲得的相關(guān)系數(shù)ρ均低于所提方法獲得的相關(guān)系數(shù)ρ。因?yàn)樗岱椒ㄔ跇?gòu)建工業(yè)廢水排放總量預(yù)測模型之前,對獲取的數(shù)據(jù)進(jìn)行填補(bǔ)處理,獲取的數(shù)據(jù)中存在缺失數(shù)據(jù),通過矢量神經(jīng)網(wǎng)絡(luò)對缺失數(shù)據(jù)進(jìn)行填補(bǔ)處理,提高了數(shù)據(jù)的完整性。 圖1 不同方法的相關(guān)系數(shù) 通過判定系數(shù)R2和相對誤差測試不同方法的整體有效性。判定系數(shù)R2描述的是因變量對回歸自變量擬合程度產(chǎn)生的影響,R2的值越接近1表明預(yù)測結(jié)果的精度越高,判定系數(shù)R2的計(jì)算公式如下: (16) 上述方法的測試結(jié)果如表1所示。 表1 不同方法的判定系數(shù) 根據(jù)表1中的數(shù)據(jù)可知,所提方法的判定系數(shù)均在0.9以上,判定系數(shù)更接近1,表明預(yù)測結(jié)果的精度較高,通過上述分析可知,所提方法可精準(zhǔn)地實(shí)現(xiàn)工業(yè)廢水排放總量的預(yù)測。 采用不同方法對不同年份的工業(yè)廢水排放總量進(jìn)行預(yù)測,獲得預(yù)測相對誤差如圖2所示。 圖2 預(yù)測結(jié)果的相對誤差 分析圖2可知,采用不同方法對不同年份的工業(yè)廢水排放總量進(jìn)行預(yù)測時,基于人口和GDP的主要水污染物排放量預(yù)測方法和基于變量選擇的廢水排放總量預(yù)測方法預(yù)測結(jié)果的相對誤差均高于所提方法,所提方法預(yù)測結(jié)果的相對誤差均保持在0.1以內(nèi),因?yàn)樗岱椒ɡ锰钛a(bǔ)后的數(shù)據(jù)構(gòu)建了工業(yè)廢水排放總量預(yù)測模型,提高了模型的預(yù)測精度,進(jìn)而降低了預(yù)測結(jié)果的相對誤差。 水體污染情況隨著我國工業(yè)的發(fā)展不斷加重,在這種背景下我國政府開始重點(diǎn)控制工業(yè)廢水排放總量。通過預(yù)測未來工業(yè)廢水排放總量相關(guān)部門可以制定合理、科學(xué)的污染減排方案。目前工業(yè)廢水排放總量預(yù)測方法存在數(shù)據(jù)完整性差、預(yù)測精度低的問題,提出基于灰色GM(1,1)模型的工業(yè)廢水排放總量預(yù)測模型,對缺失數(shù)據(jù)進(jìn)行填補(bǔ)處理,利用灰色GM(1,1)模型完成工業(yè)廢水排放總量的預(yù)測,為治理我國工業(yè)廢水排放提供了相關(guān)依據(jù)。3 工業(yè)廢水排放總量預(yù)測模型
4 實(shí)驗(yàn)與分析
5 結(jié)束語