亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多示例遺傳神經(jīng)網(wǎng)絡的室內(nèi)PM2.5預測

        2019-05-16 08:32:48吳宏杰柳維生傅啟明
        計算機應用與軟件 2019年5期
        關(guān)鍵詞:示例遺傳神經(jīng)網(wǎng)絡

        陳 成 吳宏杰,2* 柳維生 傅啟明 湯 燁

        1(蘇州科技大學電子與信息工程學院 江蘇 蘇州 215009)2(蘇州大學江蘇省計算機信息處理技術(shù)重點實驗室 江蘇 蘇州 215006)3(蘇州市立醫(yī)院(北區(qū)) 江蘇 蘇州 215000)

        0 引 言

        近年來,隨著我國工業(yè)化和城市化進程加快,空氣質(zhì)量逐漸成為一個百姓關(guān)注的熱點問題。在眾多的空氣污染物中,PM2.5由于粒徑小、活性強且易附帶有害物質(zhì),成為我國環(huán)境空氣污染的重要污染物之一?,F(xiàn)有的空氣污染監(jiān)測與預測主要關(guān)注室外空氣質(zhì)量。但是,人們每天在室內(nèi)環(huán)境中停留時間占一天的80%以上,年老、幼小及患有慢性病的人群在室內(nèi)停留更久的時間[1],室內(nèi)空氣污染往往比室外空氣污染對人體造成更持久的危害[2]。PM2.5對人體健康的影響包括損害呼吸系統(tǒng)、致癌、破壞人體免疫系統(tǒng)等[3-4],這提示著人們室內(nèi)環(huán)境與人群健康密切相關(guān)。因此,研究室內(nèi)外空氣中PM2.5的監(jiān)測和預測有重大的科學意義和現(xiàn)實意義。

        經(jīng)驗模型和統(tǒng)計模型是早年對空氣質(zhì)量進行預測的主要方法,隨著大氣物理、化學機制研究的發(fā)展,機理模型逐漸取代之前的預測方法。在基于機理模型的空氣質(zhì)量預測方法研究中,主要的思路是對污染物在空氣中的傳播、擴散、化學反應等過程實施抽象模擬,通過研究大氣污染物的物理化學特性及其在特定條件下的轉(zhuǎn)化規(guī)律,對未來的空氣質(zhì)量狀況做出預測[5-6]。目前國內(nèi)外使用的空氣質(zhì)量預測模型一般是機理模型[7],但是對于我國室內(nèi)空氣的重要污染物之一PM2.5來說,其來源具有多樣性且其形成機理較為復雜,研究其在室內(nèi)空氣中的擴散及復雜的轉(zhuǎn)化機理并進行有效的建模難度較大[8]。同時,在實際條件下,多種因素都可能影響空氣中污染物的含量,如溫度、濕度、光照等,所以空氣中污染物的含量具有很高的復雜性和不確定性。而隨著人工智能的發(fā)展,很多研究者開始嘗試使用機器學習方法來進行空氣質(zhì)量預測的研究。如Feng等[9]提出了一種將PM2.5軌跡分析與小波變換相結(jié)合的混合模型,以提高人工神經(jīng)網(wǎng)絡預測PM2.5的平均預測精度;Yegaeh[10]將局部最小二乘方法與支持向量機方法結(jié)合對CO的日均值進行了預測,Garcia[11]利用支持向量回歸方法對臭氧濃度進行了小時級預測。為了提高預測模型的精度,Kamali[12]提出一種通過譜分解構(gòu)建的模型預測空氣污染物濃度,通過Kolmogorov Zurbenko濾波器得到的人工神經(jīng)網(wǎng)絡(ANN),用于分離和單獨預測空氣污染物短期、季節(jié)和長期時間序列的三個光譜成分。盡管上述單示例方法在空氣質(zhì)量預測上取得了一定的效果,但是仍然存在兩個問題:第一,樣本采集粒度與預測粒度不一致,導致單示例方法難以準確描述本問題的實質(zhì);第二,對室內(nèi)PM2.5預測的重要特征研究不足。因此上述方法預測精度難以進一步提高。且以上研究方法大多使用小時級測量的數(shù)據(jù)作為訓練樣本,忽略了小時內(nèi)連續(xù)時刻的污染物數(shù)據(jù)隱藏的序列關(guān)系,導致最終預測的小時級污染物濃度不夠準確。

        基于此,本文提出一種基于多示例遺傳神經(jīng)網(wǎng)絡的室內(nèi)外PM2.5實時預測方法,將遺傳神經(jīng)網(wǎng)絡與多示例方法結(jié)合,用遺傳神經(jīng)網(wǎng)絡構(gòu)建深層次預測模型,利用多示例機制將小時內(nèi)的多個連續(xù)數(shù)據(jù)進行融合來挖掘其時序特征,最終提高了室內(nèi)PM2.5小時級預測的精度。室外預測模型中以時間戳、溫度和相對濕度作為輸入特征,室內(nèi)預測模型中選取與室內(nèi)PM2.5密切相關(guān)的氣溫、相對濕度等屬性作為輸入特征。同時,研究表明[13],當室內(nèi)無內(nèi)擾動及污染源時,由室內(nèi)外環(huán)境條件和外窗等特性決定的通風率成為影響室內(nèi)PM2.5的重要因素,因此將通風率也作為一項模型輸入特征。最后通過對醫(yī)院辦公室內(nèi)外歷史空氣質(zhì)量數(shù)據(jù)進行分析和深度挖掘,構(gòu)建預測模型并進行了驗證。

        1 基于多示例遺傳神經(jīng)網(wǎng)絡的PM2.5預測方法

        1.1 數(shù)據(jù)采集與特征選取

        分別于測試房間室內(nèi)外設置監(jiān)測點,室外監(jiān)測點布于醫(yī)院大樓3層,室內(nèi)監(jiān)測點布于1.5米呼吸帶區(qū)域。我們分別于2017年7月、10月和2018年1月,即夏季、秋季、冬季3個季節(jié)采集連續(xù)的7天數(shù)據(jù),形成3個數(shù)據(jù)集。采樣間隔為全天24小時每隔1分鐘進行一次采樣,所采集數(shù)據(jù)分別為室內(nèi)外氣溫(單位:℃)、室內(nèi)外相對濕度(單位:%)以及室內(nèi)外PM2.5(單位:μg/m3),每個樣本集包含9 600條數(shù)據(jù),同時把時間戳也作為模型輸入特征之一。分別定義如下室外和室內(nèi)預測模型。

        moutdoor=F(t,wout,sout)

        (1)

        mindoor=F(t,pout,win,wout,sin,sout,v)

        (2)

        對于室內(nèi)模型,當前室內(nèi)的PM2.5與當前室內(nèi)外溫度、相對濕度、室外PM2.5以及通風率共7個參數(shù)有關(guān)[14],對應于示例子網(wǎng)的7個輸入,而當前室內(nèi)PM2.5對應于每個包的輸出。每個數(shù)據(jù)集中以9 000條樣本數(shù)據(jù)作為網(wǎng)絡的訓練集,600條數(shù)據(jù)作為測試集,室外和室內(nèi)模型示例子網(wǎng)的特征輸入如表1所示。

        表1 室內(nèi)外模型輸入特征數(shù)據(jù)表

        v表示當前房間室內(nèi)通風率,計算公式如下:

        v=s×|wout-win|

        (3)

        式中:s是為窗口打開的面積,wout為室外溫度,win為室內(nèi)溫度。在實驗前先對樣本進行歸一化處理,歸一化公式如下所示,使之分布在[-1,1]之間。

        (4)

        1.2 基于多示例遺傳神經(jīng)網(wǎng)絡的PM2.5預測模型

        多示例框架下的遺傳神經(jīng)網(wǎng)絡可由圖1來描述。我們把N個樣本作為N個包數(shù)據(jù),把1小時內(nèi)每隔1分鐘所測的數(shù)據(jù)作為1個示例,則每個包中有60個示例。每個示例均為一個7維的特征向量,分別對應示例子網(wǎng)神經(jīng)網(wǎng)絡的室內(nèi)外溫濕度等7個輸入特征,記包Bi中的第j個示例為[Bij1,Bij2, … ,Bij7]T。圖中F1至F7表示表1室內(nèi)特征所示的7個特征。

        圖1 多示例遺傳神經(jīng)網(wǎng)絡模型框圖

        在多示例神經(jīng)網(wǎng)絡的回歸學習問題中,包的實值標記是已知的[15-16]。因此,本文利用訓練包的實際輸出,在包的基礎(chǔ)上定義全局誤差函數(shù)為:

        (5)

        式中:Ei為包Bi對應的輸出誤差。

        已有的相關(guān)研究指出[17],在多示例學習問題中,包的實際輸出主要由包中示例的最大實際輸出所決定。將包Bi的誤差定義為:

        (6)

        式中:Ei為示例Bij經(jīng)過模型得到的預測值。

        神經(jīng)網(wǎng)絡隱藏層節(jié)點數(shù)的設置至今還沒有確定的指導方法[18],試湊法是比較常見的方式。通常是使用不同的隱藏層節(jié)點數(shù)構(gòu)建多個網(wǎng)絡,分別對同一組訓練數(shù)據(jù)進行訓練,取最優(yōu)模型的隱藏層節(jié)點數(shù)作為最佳網(wǎng)絡參數(shù)。

        也有研究者總結(jié)出一些經(jīng)驗公式[19],用來計算可能的隱藏層節(jié)點數(shù)目,把它設成試湊法的起始數(shù)值。常用的經(jīng)驗公式為:

        (7)

        式中:j、l、k分別對應輸入、輸出、隱藏層神經(jīng)元數(shù)目,ξ為1到10 范圍內(nèi)的整數(shù)。綜合前文分析,本實驗中的示例子網(wǎng)輸入層節(jié)點數(shù)為7,即j為7,輸出層節(jié)點數(shù)為1,即l=1,根據(jù)式(7)可算出該神經(jīng)網(wǎng)絡隱藏層的節(jié)點數(shù)范圍是3到12。經(jīng)過多次實驗對比論證,當隱藏層節(jié)點數(shù)k為11的時候,該多示例遺傳傳神經(jīng)網(wǎng)絡模型能得到最佳的預測結(jié)果。

        1.3 多示例遺傳神經(jīng)網(wǎng)絡預測流程

        多示例遺傳神經(jīng)網(wǎng)絡預測算法流程如圖2所示。

        圖2 多示例遺傳神經(jīng)網(wǎng)絡訓練算法流程圖

        在圖2所示的訓練流程中,初始化網(wǎng)絡結(jié)構(gòu)包括每個包的多個示例子網(wǎng)中的前向神經(jīng)網(wǎng)絡結(jié)構(gòu),每個包的輸出變量為預測的PM2.5數(shù)據(jù)。同時,根據(jù)本文前述分析針對本項目的實際情況,多示例子網(wǎng)中的隱藏層節(jié)點數(shù)設置為11。

        初始化種群中,對包中示例子網(wǎng)的權(quán)重和偏置進行實數(shù)編碼,然后求出種群中每個個體的適應度并進行評價,評價函數(shù)為誤差平方和的倒數(shù),即Fitness=1/SSE。

        (8)

        若滿足進化結(jié)束條件則將當前權(quán)重和偏置作為示例子網(wǎng)的最優(yōu)初始值來計算當前網(wǎng)絡的預測結(jié)果與實際值的誤差,并進行權(quán)重和偏置更新,否則產(chǎn)生新的種群繼續(xù)迭代尋優(yōu)。迭代停止后,將全局較好解作為初始權(quán)值和偏置進行接下來的多示例神經(jīng)網(wǎng)絡訓練。

        多示例遺傳神經(jīng)網(wǎng)絡的優(yōu)化停止條件為如下兩個條件之一成立:

        1) 運行到某一代時,全局誤差Ei小于預先給定的閾值;

        2) 訓練次數(shù)達到預先設置好的最大訓練次數(shù)。

        1.4 多示例遺傳神經(jīng)網(wǎng)絡初始權(quán)值訓練算法

        三層單元的神經(jīng)網(wǎng)絡可以滿意地再現(xiàn)任何連續(xù)函數(shù)[20],神經(jīng)網(wǎng)絡具有自適應、自組織和實時學習的特點。常見的網(wǎng)絡一般都使用誤差導數(shù)來更新網(wǎng)絡參數(shù),從原理上來看并不是全局尋優(yōu)算法,在隨機初始化網(wǎng)絡權(quán)重和偏置的情況下很可能導致輸出結(jié)果陷入局部極小值點。

        遺傳算法起源于自然界“優(yōu)勝劣汰”法則,是一種全局尋優(yōu)算法。區(qū)別于傳統(tǒng)優(yōu)化算法的是,遺傳算法能同時處理種群中的不同個體并根據(jù)不確定性原則來引導算法搜索方向,極大地擴展了問題解的覆蓋面和搜索方向的多樣性,降低陷入局部極小值點的可能性。由此,可以使用遺傳算法來對示例子網(wǎng)的初始權(quán)值和偏置進行選取,以此來降低得到局部最小值的可能性,從而提高多示例框架下的神經(jīng)網(wǎng)絡的預測性能,算法實現(xiàn)如下所示:

        G:停止進化代數(shù); Iter:繁殖代數(shù) w:網(wǎng)絡的權(quán)重CalFitness:計算適應度;Copy:選擇個體進行復制;Crossover:交叉;Mutation:變異;M:個體個數(shù);TN,Q:由N個包構(gòu)成的數(shù)據(jù)集,每個包包含Q個示例1. Input: TN,Q2. Initialize(Sk, k=1,2,…,M)3. whileTrue4. w=Encoding(Sk)5. for(i=0; i

        CalFitness(w,N,Q)用于按式(8)計算包的適應度函數(shù)。該算法的時間復雜度為O(M×G),遺傳算法搜索最優(yōu)權(quán)值的停止條件定義為如下兩個條件之一成立。

        1) 運行到一定代數(shù)時,適應度函數(shù)中最高的適應度函數(shù)小于預先設定的閾值;

        2) 進化次數(shù)增長到初始給定的最大進化次數(shù)。

        2 結(jié)果分析

        2.1 評價指標

        多種指標可用于對預測模型的性能進行評價,其原理都是對標簽和預測值之間的差距進行分析。對于回歸問題來說,可以從2個方面來評價這種差異,分別是預測值與標簽之間在數(shù)值上的偏差,以及二者的一致性程度。因此,本文采用2種指標對預測結(jié)果進行評價,分別是相對誤差RE(Relative Error)、和擬合指數(shù)IA(Index of Agreement)[22],RE反映了預測值與標簽之間在數(shù)值上的偏差,IA反映了預測值與標簽之間的一致性,可以用來表示模型預測的效果,計算公式如下:

        (9)

        (10)

        2.2 結(jié)果與分析

        根據(jù)式(9)和式(10)可知,RE是越小越好,IA是越大越好。表2是多示例遺傳神經(jīng)網(wǎng)絡算法MI-GA(Multi-Instance Genetic Neural Network Algorithm)、遺傳神經(jīng)網(wǎng)絡算法GA(Genetic Neural Network Algorithm)、支持向量回歸(Support Vector Regression)、隨機森林(Random Forest)、線性回歸(Linear Regression)、決策樹(Decision Tree)、LASSO(Least Absolute Shrinkage and Selection Operator),在室外和室內(nèi)的3個測試集(每個測試集為600條數(shù)據(jù))上預測所得結(jié)果的平均相對誤差RE的比較,表3為這七種方法在是否加“通風率”特征的實驗比較。

        表2 室內(nèi)和室外預測結(jié)果相對誤差(RE)比較

        表3 MI-GA 與其他六種方法在室內(nèi)數(shù)據(jù)上預測結(jié)果比較

        續(xù)表3

        (1) 室內(nèi)與室外預測比較:

        從表2中可看出,在對室內(nèi)和室外PM2.5的預測中,對同一種方法,室外預測結(jié)果的相對誤差RE都要小于室內(nèi)預測結(jié)果,這是因為室內(nèi)PM2.5來源復雜,相較于室外PM2.5而言更加難預測。在對室外PM2.5的預測中,本文提出的MI-GA方法獲得了僅次于RF的預測結(jié)果,這是因為本文實驗中,室外特征較少,而在特征較少和小數(shù)據(jù)集的情況下,相對于其他算法, RF能發(fā)揮更大的優(yōu)勢。而相對于GA、SVR、LR、DT、LASSO,MI-GA方法取得了更好的預測效果,平均RE降低了0.33%、8.31%、2.03%、9.12%和2.74%。對于難度較大的室內(nèi)PM2.5的預測,因為特征由3個增加到7個,MI-GA方法取得了最好的預測效果,相較于GA、SVR、RF、LR、DT和LASSO,平均RE分別降低了7.54%、5.97%、12.88%、8.84%、11.65%和7.32%。

        (2) 特征是否含通風率實驗比較:

        窗戶是連接室內(nèi)和室外的重要通道,通風情況是影響室內(nèi)PM2.5的一個關(guān)鍵因素,因此,通風率成為預測室內(nèi)PM2.5的一個重要特征。本文對室內(nèi)的3個數(shù)據(jù)集進行了是否含“通風率”特征的實驗比較,實驗結(jié)果見表3。從表3中可看出,在加入“通風率”特征的情況下,七種方法預測結(jié)果的相對誤差RE分別降低了1.93%、0.04%、12.02%、3.93%、3.89%、3.77%和8.09%,擬合指數(shù)IA提高了0.07、0.10、0.01、0.04、0.06、0.10和0.06。實驗結(jié)果證明了“通風率”特征對于預測室內(nèi)PM2.5的重要性,為今后的模型改善提供了一個新思路,同時也可以為其他相關(guān)專業(yè)研究人員提供新的參考特征。

        2.3 MI-GA方法與其他六種方法預測結(jié)果比較

        從表3中可見,在加入“通風率”特征的結(jié)果中,本文提出的MI-GA方法預測結(jié)果RE為5.60%,比GA降低7.55%,比SVR降低5.98%,比RF低8.36%,比LR低7.66%,比DT低14.69%,比LASSO低8.21%??梢?,使用多示例機制將預測時間與采樣間隔時間有效融合后的遺傳神經(jīng)網(wǎng)絡預測模型,預測結(jié)果的相對誤差得到了很好的降低。

        圖3為MI-GA與GA方法在3個室內(nèi)數(shù)據(jù)集(包含“通風率”特征)上所得結(jié)果相對誤差分布的散點圖。從圖中可以看到,分布于對角線上方的數(shù)據(jù)點都要多于直線下方的數(shù)據(jù)點,即相較于GA方法所得結(jié)果中,MI-GA方法所得結(jié)果中相對誤差RE較大的點要更少,即MI-GA方法預測結(jié)果中有更多的數(shù)據(jù)比較接近標簽。

        (a) Summer數(shù)據(jù)集預測結(jié)果

        (b) Autumn數(shù)據(jù)集預測結(jié)果

        (c) Winter數(shù)據(jù)集預測結(jié)果圖3 MI-GA與GA方法在三個數(shù)據(jù)集上的RE比較散點圖

        圖4為測試樣本在六種方法上預測結(jié)果在不同誤差區(qū)間內(nèi)的分布直方圖。從圖中可以看出,本文提出的MI-GA方法在室內(nèi)數(shù)據(jù)集預測結(jié)果中,RE低于5%的樣本個數(shù)有517個,比GA方法多339個,比SVR方法多252個,比RF方法多226個,比LR方法多92個,比DT多194個,比LASSO多138個。而在RE大于30%樣本中,MI-GA方法的樣本點最少,由此可見MI-GA方法不僅具有較高的預測準確度,還具有很好的穩(wěn)定性。MI-GA能取得更好的預測結(jié)果,原因可能是多示例神經(jīng)網(wǎng)絡方法將某個時間范圍內(nèi)的多條數(shù)據(jù)集中于一個包中,充分考慮了包中各個示例之間隱藏的關(guān)系,進而更深層地挖掘出PM2.5的序列特征,從而提高預測的精確度。

        圖4 不同RE區(qū)間內(nèi)樣本分布直方圖

        3 結(jié) 語

        綜合以上對多示例遺傳神經(jīng)網(wǎng)絡模型的分析和實驗的實現(xiàn),表明以時間戳、溫濕度、通風率以及室外PM2.5等因子作為網(wǎng)絡的特征輸入,可以較為準確地預測出室內(nèi)的PM2.5。最后從醫(yī)院房間采集了28 800條數(shù)據(jù)進行實驗驗證,結(jié)果顯示相對誤差為5.60%,比傳統(tǒng)遺傳神經(jīng)網(wǎng)絡降低7.55%,比支持向量回歸方法降低5.98%,比隨機森林低8.36%,比線性回歸低7.66%,比決策樹低14.69%, 比LASSO回歸低8.21%。這樣的結(jié)果對于醫(yī)院房間內(nèi)預警污染的發(fā)生是可行的。

        本文中所采用的遺傳算法是最基本的遺傳算法,遺傳算法的設定在一定程度上會影響神經(jīng)網(wǎng)絡參數(shù)的優(yōu)化,所以如何對遺傳算法做進一步的改良或者選取更優(yōu)的進化算法,進而優(yōu)化多示例神經(jīng)網(wǎng)絡的模型結(jié)構(gòu),從而降低預測模型的誤差率將是我們下一步的研究方向。同時,醫(yī)院室內(nèi)空氣質(zhì)量的預測是一種小范圍問題,接下來的工作將考慮到將算法用于住宅、教室等更為復雜的環(huán)境,進一步驗證算法的性能。

        猜你喜歡
        示例遺傳神經(jīng)網(wǎng)絡
        大還是小
        非遺傳承
        2019年高考上海卷作文示例
        神經(jīng)網(wǎng)絡抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        常見單位符號大小寫混淆示例
        山東冶金(2019年5期)2019-11-16 09:09:22
        還有什么會遺傳?
        還有什么會遺傳
        還有什么會遺傳?
        “全等三角形”錯解示例
        基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
        重型機械(2016年1期)2016-03-01 03:42:04
        色猫咪免费人成网站在线观看| 国产成年无码v片在线| 亚洲精品98中文字幕| 挑战亚洲美女视频网站| 亚洲国产精品久久久久久久| 成人亚洲精品777777| 男女搞事在线观看视频| 国产区高清在线一区二区三区| 乱码一二区在线亚洲| 精品少妇人妻av无码专区 | 国产美女一级做a爱视频| 天堂8中文在线最新版在线| 国产成人午夜高潮毛片| 日本女优久久精品久久| 国产裸体AV久无码无遮挡| 免费人成毛片乱码| 真人新婚之夜破苞第一次视频| 久久精品成人一区二区三区| 久久综合激情的五月天| 在线一区二区三区视频观看| 热久久亚洲| 久久精品亚洲中文字幕无码网站 | 亚洲精品在线观看自拍| 九九99久久精品午夜剧场免费| 少妇人妻在线视频| 大陆极品少妇内射aaaaaa| 国产激情一区二区三区| 91视色国内揄拍国内精品人妻 | 精品国产一区二区三区毛片| 久热香蕉av在线爽青青| 精品国产a∨无码一区二区三区 | 操出白浆在线观看| 长腿校花无力呻吟娇喘的视频| 国产精品久久777777| 久久精品成人一区二区三区| 日本最新一区二区三区在线| 午夜亚洲精品一区二区| 国产黄片一区视频在线观看| 99久久超碰中文字幕伊人| 亚洲一区二区三区偷拍女厕| 久久久午夜精品福利内容|