*程順健
(福州城建設(shè)計(jì)研究院有限公司 福建 350001)
水資源短缺與能源危機(jī)是人類社會發(fā)展面臨的重大挑戰(zhàn)。針對高濃度城市有機(jī)污水的處理,厭氧膜生物反應(yīng)器(Anaerobic Membrane Bioreactor,AnMBR)將厭氧消化與膜過濾技術(shù)有機(jī)結(jié)合,在實(shí)現(xiàn)高質(zhì)量出水的同時(shí)產(chǎn)出甲烷,極大降低運(yùn)行成本[1]。
在將AnMBR 應(yīng)用于市政污水處理的大規(guī)模工程中,膜污染問題是首要挑戰(zhàn)[2]。市政污水在低溫下黏度較高,因此,更易引發(fā)膜污染[3],增加系統(tǒng)的運(yùn)行成本,而胞外聚合物是造成膜污染的主要原因[4]。傳統(tǒng)的膜污染控制方法包括增加膜面水力剪切作用、優(yōu)化系統(tǒng)運(yùn)行模式及化學(xué)清洗等[5],而發(fā)展膜污染原位控制技術(shù)則是重要的研究方向之一。其中,基于電化學(xué)調(diào)控方法,可實(shí)現(xiàn)原位控制膜污染問題[6-7],有助于改善膜污染情況,提高系統(tǒng)的可持續(xù)性和效率。目前,關(guān)于AnMBR 膜污染的機(jī)理和控制方法研究已經(jīng)有較多報(bào)道[8-12],但在膜污染模擬預(yù)測,尤其是電化學(xué)強(qiáng)化AnMBR 膜污染方面的研究報(bào)道相對較少,且已報(bào)道的傳統(tǒng)方法與數(shù)學(xué)模型[13-14]往往難以處理龐大的數(shù)據(jù)量,也無法從中挖掘出膜污染變化的潛在特征,因此預(yù)測精度始終有限。
反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)是一種用于挖掘數(shù)據(jù)內(nèi)在關(guān)聯(lián)的算法模型。BPNN 在多層前饋人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,增加了誤差反向傳播算法,允許其根據(jù)目標(biāo)問題的復(fù)雜需求進(jìn)行建模[15]。BPNN 已被部分研究應(yīng)用于常見膜污染的預(yù)測[16-18],但是尚未將BPNN 模型應(yīng)用于針對城市污水處理AnMBR 膜污染電化學(xué)原位控制的研究報(bào)道。
數(shù)據(jù)集的預(yù)處理是訓(xùn)練BPNN 模型的關(guān)鍵步驟。由于數(shù)據(jù)在收集過程中不可避免地存在缺失、重復(fù)等情況,若不進(jìn)行預(yù)處理,將直接影響到模型的訓(xùn)練[19]。膜污染的形成涉及許多變量,但并非所有變量都對預(yù)測結(jié)果具有顯著影響,因此,需要在預(yù)處理階段對數(shù)據(jù)進(jìn)行分析和重構(gòu)[20]。
本文構(gòu)建了電化學(xué)強(qiáng)化AnMBR 反應(yīng)體系,施加1 V 電壓構(gòu)建外電場,進(jìn)行原位電場驅(qū)動AnMBR 抗膜污染性能研究。反應(yīng)器內(nèi)消化液的pH 值、氧化還原電位(Oxidation-Reduction Potential,ORP),以及膜組件的跨膜壓差(Transmembrane Pressure,TMP)等數(shù)據(jù),基于BPNN 構(gòu)建單層多節(jié)點(diǎn)隱含層的膜污染預(yù)測模型。同時(shí),通過不同數(shù)據(jù)集分割方式進(jìn)行實(shí)驗(yàn)測試和模型評估,討論如何通過優(yōu)化數(shù)據(jù)集提高模型的預(yù)測準(zhǔn)確性和實(shí)用性,為膜污染的預(yù)測和控制提供新的思路和方法。
本文實(shí)驗(yàn)的主要目的是利用BPNN 算法對AnMBR中的膜污染情況進(jìn)行預(yù)測。此外,還包含通過對數(shù)據(jù)的可視化,進(jìn)行pH 值和ORP 對TMP 變化的影響分析。
如圖1 所示,采用浸沒式AnMBR 處理市政污水,實(shí)驗(yàn)裝置主要包括直流電源、極板、厭氧顆粒污泥、Ni/Fe LDH@C 顆粒填料。同時(shí)啟用兩套電化學(xué)強(qiáng)化AnMBR 裝置,分別標(biāo)記為R1#和R2#,對模擬城市污水進(jìn)行連續(xù)實(shí)驗(yàn)和數(shù)據(jù)采集,溫度維持在20~25 ℃。
圖1 電化學(xué)強(qiáng)化AnMBR 裝置
反應(yīng)器的pH、ORP 和TMP 等數(shù)據(jù)通過將其連接到可編程邏輯控制器(PLC)設(shè)備的傳感器進(jìn)行收集。其中,數(shù)據(jù)的采集過程以30 min 為一個(gè)周期,最終共收集7416 條數(shù)據(jù)。
本文采用單層多節(jié)點(diǎn)的BPNN 作為模型主體,通過數(shù)據(jù)預(yù)處理進(jìn)行優(yōu)化。
對TMP 列和ORP 列進(jìn)行取反,以保證整體數(shù)據(jù)為正數(shù),便于比對分析。
如表1 所示,原始數(shù)據(jù)中存在部分的缺失值(指表中數(shù)值表示為“0.00”的數(shù)據(jù)記錄)及離群值(指表中ORP 數(shù)值顯著高于“-400.0”的數(shù)據(jù)記錄,如“-227.3”),需對其進(jìn)行數(shù)據(jù)清洗。
表1 部分原始數(shù)據(jù)
①缺失值處理
觀察數(shù)據(jù)整體的變化趨勢,可以發(fā)現(xiàn)pH 和ORP的變化具有隨機(jī)性。因此,采用隨機(jī)填充法對目標(biāo)缺失值進(jìn)行處理,在指定范圍內(nèi)隨機(jī)生產(chǎn)浮點(diǎn)數(shù)。
②離群值處理
如圖2 所示,兩個(gè)反應(yīng)器的TMP 數(shù)據(jù)都存在大量連續(xù)的離群值。針對這些離群值,采用刪除對應(yīng)數(shù)據(jù)行向量的方式進(jìn)行處理。
圖2 TMP 數(shù)據(jù)趨勢圖
對于表1 中R1#反應(yīng)器的ORP 離群值,采取人工填寫方式,將數(shù)值統(tǒng)一修改為理論邊界值-400 mV。
各參數(shù)與TMP 的波動變化對比如圖3 所示,采用歸一化方法進(jìn)行數(shù)據(jù)變換。其中,采用式(1)對TMP 和ORP 進(jìn)行常規(guī)離差標(biāo)準(zhǔn)化;而pH 值則采用式(2)進(jìn)行特殊歸一化處理。
圖3(A)pH 與TMP 波動變化對比;(B)ORP 與TMP 波動變化對比
經(jīng)過數(shù)據(jù)清洗和數(shù)據(jù)變換處理后的數(shù)據(jù),如圖4所示。為進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,本文將整體數(shù)據(jù)以兩種不同方式分割為數(shù)據(jù)集1 和數(shù)據(jù)集2,供模型進(jìn)行學(xué)習(xí),并評估學(xué)習(xí)效果。第一種分割方式:單獨(dú)在R1#反應(yīng)器產(chǎn)生的數(shù)據(jù)上進(jìn)行,將數(shù)據(jù)的70%作為訓(xùn)練集,30%作為測試集。第二種分割方式:同時(shí)在兩個(gè)反應(yīng)器的數(shù)據(jù)上進(jìn)行,將R1#反應(yīng)器的數(shù)據(jù)作為訓(xùn)練集,R2#反應(yīng)器的數(shù)據(jù)作為測試集。
圖4 經(jīng)過清洗和變換后的數(shù)據(jù)
通過圖4 可見,TMP 與pH 和ORP 兩個(gè)參數(shù)并未表現(xiàn)出顯性關(guān)聯(lián),但卻表現(xiàn)出典型的時(shí)間序列數(shù)據(jù)特性,與時(shí)間節(jié)點(diǎn)的變化呈強(qiáng)關(guān)聯(lián)性。因此,本文BPNN 模型的建立主要以單一條件TMP 時(shí)間序列數(shù)據(jù)作為輸入。
(1)模型結(jié)構(gòu)。BPNN 的網(wǎng)絡(luò)結(jié)構(gòu),如圖5 所示,主要由輸入層、隱含層和輸出層組成,其中有若干個(gè)神經(jīng)元結(jié)構(gòu)相互形成全連接。
圖5 BPNN 的拓?fù)浣Y(jié)構(gòu)
①激活函數(shù)。本文使用的激活函數(shù)是MATLAB 中的purelin 函數(shù)和tansig 函數(shù),它們都是神經(jīng)傳遞函數(shù),負(fù)責(zé)單層神經(jīng)元中由凈輸入值計(jì)算轉(zhuǎn)換出輸出值的過程。
②損失函數(shù)。本文使用MATLAB 的神經(jīng)網(wǎng)絡(luò)構(gòu)建函數(shù)net 中默認(rèn)使用的均方誤差(MSE)作為目標(biāo)模型的損失函數(shù),見式(3)。
③梯度下降函數(shù)。本文使用的梯度下降函數(shù)是MATLAB 中的trainlm 函數(shù),該函數(shù)是由Levenberg-Marquardt(L-M)算法實(shí)現(xiàn)的一個(gè)反向傳播神經(jīng)網(wǎng)絡(luò)的訓(xùn)練函數(shù)。
(2)參數(shù)設(shè)定。經(jīng)過多次實(shí)驗(yàn)并調(diào)整參數(shù),本文在兩個(gè)數(shù)據(jù)集上的模型訓(xùn)練分別設(shè)定目標(biāo)誤差為1e-6和1e-10,同時(shí)設(shè)定學(xué)習(xí)率為0.01,分別設(shè)定Epoch個(gè)數(shù)為500 和1000。
訓(xùn)練結(jié)果顯示(圖6)最終模型的預(yù)測誤差均能夠達(dá)到1e-4 以下,表現(xiàn)出良好的預(yù)測性能。
圖6 模型在不同結(jié)構(gòu)的數(shù)據(jù)集上的訓(xùn)練過程
對比圖6 中的訓(xùn)練過程數(shù)據(jù)可以發(fā)現(xiàn),不同數(shù)據(jù)集訓(xùn)練的模型性能存在明顯差異。其中,數(shù)據(jù)集1 由于所使用的數(shù)據(jù)較為單一,模型并沒有充分地學(xué)習(xí)到TMP 數(shù)據(jù)的潛在特征,經(jīng)過完整的6 次測試集迭代后,誤差仍只能降低至6.59e-5,遠(yuǎn)達(dá)不到目標(biāo)誤差的1e-6。數(shù)據(jù)集2 上的訓(xùn)練則顯示出明顯的優(yōu)越性,在經(jīng)過732 個(gè)傳播周期、進(jìn)行不到1 次完整測試集迭代的情況下,達(dá)到9.97e-11 的誤差,滿足了目標(biāo)誤差1e-10 的要求??梢?,通過兩個(gè)不同獨(dú)立反應(yīng)器數(shù)據(jù)的相互驗(yàn)證,能夠在擴(kuò)充數(shù)據(jù)量的同時(shí)引入更多的潛在特征,訓(xùn)練得到性能更好的模型。
研究通過實(shí)驗(yàn)收集并建立AnMBR 反應(yīng)過程數(shù)據(jù)集,在數(shù)據(jù)分析過程中剔除pH 和ORP 等非強(qiáng)關(guān)聯(lián)數(shù)據(jù),并以不同的方式劃分為兩個(gè)不同的數(shù)據(jù)集,將TIME_ID 和TMP 作為輸入,建立了基于數(shù)據(jù)驅(qū)動的BPNN 時(shí)間序列預(yù)測模型,實(shí)現(xiàn)對AnMBR 裝置的膜污染程度進(jìn)行預(yù)測。
通過多次實(shí)驗(yàn)及調(diào)整參數(shù)至最佳訓(xùn)練條件,最終模型的預(yù)測誤差能夠達(dá)到1e-10 以下,精準(zhǔn)度接近100%,可應(yīng)用于膜污染程度預(yù)測。