亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多示例遺傳神經(jīng)網(wǎng)絡(luò)的室內(nèi)PM2.5預(yù)測(cè)

        2019-05-16 08:32:48吳宏杰柳維生傅啟明
        關(guān)鍵詞:特征方法模型

        陳 成 吳宏杰,2* 柳維生 傅啟明 湯 燁

        1(蘇州科技大學(xué)電子與信息工程學(xué)院 江蘇 蘇州 215009)2(蘇州大學(xué)江蘇省計(jì)算機(jī)信息處理技術(shù)重點(diǎn)實(shí)驗(yàn)室 江蘇 蘇州 215006)3(蘇州市立醫(yī)院(北區(qū)) 江蘇 蘇州 215000)

        0 引 言

        近年來(lái),隨著我國(guó)工業(yè)化和城市化進(jìn)程加快,空氣質(zhì)量逐漸成為一個(gè)百姓關(guān)注的熱點(diǎn)問(wèn)題。在眾多的空氣污染物中,PM2.5由于粒徑小、活性強(qiáng)且易附帶有害物質(zhì),成為我國(guó)環(huán)境空氣污染的重要污染物之一。現(xiàn)有的空氣污染監(jiān)測(cè)與預(yù)測(cè)主要關(guān)注室外空氣質(zhì)量。但是,人們每天在室內(nèi)環(huán)境中停留時(shí)間占一天的80%以上,年老、幼小及患有慢性病的人群在室內(nèi)停留更久的時(shí)間[1],室內(nèi)空氣污染往往比室外空氣污染對(duì)人體造成更持久的危害[2]。PM2.5對(duì)人體健康的影響包括損害呼吸系統(tǒng)、致癌、破壞人體免疫系統(tǒng)等[3-4],這提示著人們室內(nèi)環(huán)境與人群健康密切相關(guān)。因此,研究室內(nèi)外空氣中PM2.5的監(jiān)測(cè)和預(yù)測(cè)有重大的科學(xué)意義和現(xiàn)實(shí)意義。

        經(jīng)驗(yàn)?zāi)P秃徒y(tǒng)計(jì)模型是早年對(duì)空氣質(zhì)量進(jìn)行預(yù)測(cè)的主要方法,隨著大氣物理、化學(xué)機(jī)制研究的發(fā)展,機(jī)理模型逐漸取代之前的預(yù)測(cè)方法。在基于機(jī)理模型的空氣質(zhì)量預(yù)測(cè)方法研究中,主要的思路是對(duì)污染物在空氣中的傳播、擴(kuò)散、化學(xué)反應(yīng)等過(guò)程實(shí)施抽象模擬,通過(guò)研究大氣污染物的物理化學(xué)特性及其在特定條件下的轉(zhuǎn)化規(guī)律,對(duì)未來(lái)的空氣質(zhì)量狀況做出預(yù)測(cè)[5-6]。目前國(guó)內(nèi)外使用的空氣質(zhì)量預(yù)測(cè)模型一般是機(jī)理模型[7],但是對(duì)于我國(guó)室內(nèi)空氣的重要污染物之一PM2.5來(lái)說(shuō),其來(lái)源具有多樣性且其形成機(jī)理較為復(fù)雜,研究其在室內(nèi)空氣中的擴(kuò)散及復(fù)雜的轉(zhuǎn)化機(jī)理并進(jìn)行有效的建模難度較大[8]。同時(shí),在實(shí)際條件下,多種因素都可能影響空氣中污染物的含量,如溫度、濕度、光照等,所以空氣中污染物的含量具有很高的復(fù)雜性和不確定性。而隨著人工智能的發(fā)展,很多研究者開(kāi)始嘗試使用機(jī)器學(xué)習(xí)方法來(lái)進(jìn)行空氣質(zhì)量預(yù)測(cè)的研究。如Feng等[9]提出了一種將PM2.5軌跡分析與小波變換相結(jié)合的混合模型,以提高人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)PM2.5的平均預(yù)測(cè)精度;Yegaeh[10]將局部最小二乘方法與支持向量機(jī)方法結(jié)合對(duì)CO的日均值進(jìn)行了預(yù)測(cè),Garcia[11]利用支持向量回歸方法對(duì)臭氧濃度進(jìn)行了小時(shí)級(jí)預(yù)測(cè)。為了提高預(yù)測(cè)模型的精度,Kamali[12]提出一種通過(guò)譜分解構(gòu)建的模型預(yù)測(cè)空氣污染物濃度,通過(guò)Kolmogorov Zurbenko濾波器得到的人工神經(jīng)網(wǎng)絡(luò)(ANN),用于分離和單獨(dú)預(yù)測(cè)空氣污染物短期、季節(jié)和長(zhǎng)期時(shí)間序列的三個(gè)光譜成分。盡管上述單示例方法在空氣質(zhì)量預(yù)測(cè)上取得了一定的效果,但是仍然存在兩個(gè)問(wèn)題:第一,樣本采集粒度與預(yù)測(cè)粒度不一致,導(dǎo)致單示例方法難以準(zhǔn)確描述本問(wèn)題的實(shí)質(zhì);第二,對(duì)室內(nèi)PM2.5預(yù)測(cè)的重要特征研究不足。因此上述方法預(yù)測(cè)精度難以進(jìn)一步提高。且以上研究方法大多使用小時(shí)級(jí)測(cè)量的數(shù)據(jù)作為訓(xùn)練樣本,忽略了小時(shí)內(nèi)連續(xù)時(shí)刻的污染物數(shù)據(jù)隱藏的序列關(guān)系,導(dǎo)致最終預(yù)測(cè)的小時(shí)級(jí)污染物濃度不夠準(zhǔn)確。

        基于此,本文提出一種基于多示例遺傳神經(jīng)網(wǎng)絡(luò)的室內(nèi)外PM2.5實(shí)時(shí)預(yù)測(cè)方法,將遺傳神經(jīng)網(wǎng)絡(luò)與多示例方法結(jié)合,用遺傳神經(jīng)網(wǎng)絡(luò)構(gòu)建深層次預(yù)測(cè)模型,利用多示例機(jī)制將小時(shí)內(nèi)的多個(gè)連續(xù)數(shù)據(jù)進(jìn)行融合來(lái)挖掘其時(shí)序特征,最終提高了室內(nèi)PM2.5小時(shí)級(jí)預(yù)測(cè)的精度。室外預(yù)測(cè)模型中以時(shí)間戳、溫度和相對(duì)濕度作為輸入特征,室內(nèi)預(yù)測(cè)模型中選取與室內(nèi)PM2.5密切相關(guān)的氣溫、相對(duì)濕度等屬性作為輸入特征。同時(shí),研究表明[13],當(dāng)室內(nèi)無(wú)內(nèi)擾動(dòng)及污染源時(shí),由室內(nèi)外環(huán)境條件和外窗等特性決定的通風(fēng)率成為影響室內(nèi)PM2.5的重要因素,因此將通風(fēng)率也作為一項(xiàng)模型輸入特征。最后通過(guò)對(duì)醫(yī)院辦公室內(nèi)外歷史空氣質(zhì)量數(shù)據(jù)進(jìn)行分析和深度挖掘,構(gòu)建預(yù)測(cè)模型并進(jìn)行了驗(yàn)證。

        1 基于多示例遺傳神經(jīng)網(wǎng)絡(luò)的PM2.5預(yù)測(cè)方法

        1.1 數(shù)據(jù)采集與特征選取

        分別于測(cè)試房間室內(nèi)外設(shè)置監(jiān)測(cè)點(diǎn),室外監(jiān)測(cè)點(diǎn)布于醫(yī)院大樓3層,室內(nèi)監(jiān)測(cè)點(diǎn)布于1.5米呼吸帶區(qū)域。我們分別于2017年7月、10月和2018年1月,即夏季、秋季、冬季3個(gè)季節(jié)采集連續(xù)的7天數(shù)據(jù),形成3個(gè)數(shù)據(jù)集。采樣間隔為全天24小時(shí)每隔1分鐘進(jìn)行一次采樣,所采集數(shù)據(jù)分別為室內(nèi)外氣溫(單位:℃)、室內(nèi)外相對(duì)濕度(單位:%)以及室內(nèi)外PM2.5(單位:μg/m3),每個(gè)樣本集包含9 600條數(shù)據(jù),同時(shí)把時(shí)間戳也作為模型輸入特征之一。分別定義如下室外和室內(nèi)預(yù)測(cè)模型。

        moutdoor=F(t,wout,sout)

        (1)

        mindoor=F(t,pout,win,wout,sin,sout,v)

        (2)

        對(duì)于室內(nèi)模型,當(dāng)前室內(nèi)的PM2.5與當(dāng)前室內(nèi)外溫度、相對(duì)濕度、室外PM2.5以及通風(fēng)率共7個(gè)參數(shù)有關(guān)[14],對(duì)應(yīng)于示例子網(wǎng)的7個(gè)輸入,而當(dāng)前室內(nèi)PM2.5對(duì)應(yīng)于每個(gè)包的輸出。每個(gè)數(shù)據(jù)集中以9 000條樣本數(shù)據(jù)作為網(wǎng)絡(luò)的訓(xùn)練集,600條數(shù)據(jù)作為測(cè)試集,室外和室內(nèi)模型示例子網(wǎng)的特征輸入如表1所示。

        表1 室內(nèi)外模型輸入特征數(shù)據(jù)表

        v表示當(dāng)前房間室內(nèi)通風(fēng)率,計(jì)算公式如下:

        v=s×|wout-win|

        (3)

        式中:s是為窗口打開(kāi)的面積,wout為室外溫度,win為室內(nèi)溫度。在實(shí)驗(yàn)前先對(duì)樣本進(jìn)行歸一化處理,歸一化公式如下所示,使之分布在[-1,1]之間。

        (4)

        1.2 基于多示例遺傳神經(jīng)網(wǎng)絡(luò)的PM2.5預(yù)測(cè)模型

        多示例框架下的遺傳神經(jīng)網(wǎng)絡(luò)可由圖1來(lái)描述。我們把N個(gè)樣本作為N個(gè)包數(shù)據(jù),把1小時(shí)內(nèi)每隔1分鐘所測(cè)的數(shù)據(jù)作為1個(gè)示例,則每個(gè)包中有60個(gè)示例。每個(gè)示例均為一個(gè)7維的特征向量,分別對(duì)應(yīng)示例子網(wǎng)神經(jīng)網(wǎng)絡(luò)的室內(nèi)外溫濕度等7個(gè)輸入特征,記包Bi中的第j個(gè)示例為[Bij1,Bij2, … ,Bij7]T。圖中F1至F7表示表1室內(nèi)特征所示的7個(gè)特征。

        圖1 多示例遺傳神經(jīng)網(wǎng)絡(luò)模型框圖

        在多示例神經(jīng)網(wǎng)絡(luò)的回歸學(xué)習(xí)問(wèn)題中,包的實(shí)值標(biāo)記是已知的[15-16]。因此,本文利用訓(xùn)練包的實(shí)際輸出,在包的基礎(chǔ)上定義全局誤差函數(shù)為:

        (5)

        式中:Ei為包Bi對(duì)應(yīng)的輸出誤差。

        已有的相關(guān)研究指出[17],在多示例學(xué)習(xí)問(wèn)題中,包的實(shí)際輸出主要由包中示例的最大實(shí)際輸出所決定。將包Bi的誤差定義為:

        (6)

        式中:Ei為示例Bij經(jīng)過(guò)模型得到的預(yù)測(cè)值。

        神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)的設(shè)置至今還沒(méi)有確定的指導(dǎo)方法[18],試湊法是比較常見(jiàn)的方式。通常是使用不同的隱藏層節(jié)點(diǎn)數(shù)構(gòu)建多個(gè)網(wǎng)絡(luò),分別對(duì)同一組訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,取最優(yōu)模型的隱藏層節(jié)點(diǎn)數(shù)作為最佳網(wǎng)絡(luò)參數(shù)。

        也有研究者總結(jié)出一些經(jīng)驗(yàn)公式[19],用來(lái)計(jì)算可能的隱藏層節(jié)點(diǎn)數(shù)目,把它設(shè)成試湊法的起始數(shù)值。常用的經(jīng)驗(yàn)公式為:

        (7)

        式中:j、l、k分別對(duì)應(yīng)輸入、輸出、隱藏層神經(jīng)元數(shù)目,ξ為1到10 范圍內(nèi)的整數(shù)。綜合前文分析,本實(shí)驗(yàn)中的示例子網(wǎng)輸入層節(jié)點(diǎn)數(shù)為7,即j為7,輸出層節(jié)點(diǎn)數(shù)為1,即l=1,根據(jù)式(7)可算出該神經(jīng)網(wǎng)絡(luò)隱藏層的節(jié)點(diǎn)數(shù)范圍是3到12。經(jīng)過(guò)多次實(shí)驗(yàn)對(duì)比論證,當(dāng)隱藏層節(jié)點(diǎn)數(shù)k為11的時(shí)候,該多示例遺傳傳神經(jīng)網(wǎng)絡(luò)模型能得到最佳的預(yù)測(cè)結(jié)果。

        1.3 多示例遺傳神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)流程

        多示例遺傳神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)算法流程如圖2所示。

        圖2 多示例遺傳神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法流程圖

        在圖2所示的訓(xùn)練流程中,初始化網(wǎng)絡(luò)結(jié)構(gòu)包括每個(gè)包的多個(gè)示例子網(wǎng)中的前向神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),每個(gè)包的輸出變量為預(yù)測(cè)的PM2.5數(shù)據(jù)。同時(shí),根據(jù)本文前述分析針對(duì)本項(xiàng)目的實(shí)際情況,多示例子網(wǎng)中的隱藏層節(jié)點(diǎn)數(shù)設(shè)置為11。

        初始化種群中,對(duì)包中示例子網(wǎng)的權(quán)重和偏置進(jìn)行實(shí)數(shù)編碼,然后求出種群中每個(gè)個(gè)體的適應(yīng)度并進(jìn)行評(píng)價(jià),評(píng)價(jià)函數(shù)為誤差平方和的倒數(shù),即Fitness=1/SSE。

        (8)

        若滿足進(jìn)化結(jié)束條件則將當(dāng)前權(quán)重和偏置作為示例子網(wǎng)的最優(yōu)初始值來(lái)計(jì)算當(dāng)前網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果與實(shí)際值的誤差,并進(jìn)行權(quán)重和偏置更新,否則產(chǎn)生新的種群繼續(xù)迭代尋優(yōu)。迭代停止后,將全局較好解作為初始權(quán)值和偏置進(jìn)行接下來(lái)的多示例神經(jīng)網(wǎng)絡(luò)訓(xùn)練。

        多示例遺傳神經(jīng)網(wǎng)絡(luò)的優(yōu)化停止條件為如下兩個(gè)條件之一成立:

        1) 運(yùn)行到某一代時(shí),全局誤差Ei小于預(yù)先給定的閾值;

        2) 訓(xùn)練次數(shù)達(dá)到預(yù)先設(shè)置好的最大訓(xùn)練次數(shù)。

        1.4 多示例遺傳神經(jīng)網(wǎng)絡(luò)初始權(quán)值訓(xùn)練算法

        三層單元的神經(jīng)網(wǎng)絡(luò)可以滿意地再現(xiàn)任何連續(xù)函數(shù)[20],神經(jīng)網(wǎng)絡(luò)具有自適應(yīng)、自組織和實(shí)時(shí)學(xué)習(xí)的特點(diǎn)。常見(jiàn)的網(wǎng)絡(luò)一般都使用誤差導(dǎo)數(shù)來(lái)更新網(wǎng)絡(luò)參數(shù),從原理上來(lái)看并不是全局尋優(yōu)算法,在隨機(jī)初始化網(wǎng)絡(luò)權(quán)重和偏置的情況下很可能導(dǎo)致輸出結(jié)果陷入局部極小值點(diǎn)。

        遺傳算法起源于自然界“優(yōu)勝劣汰”法則,是一種全局尋優(yōu)算法。區(qū)別于傳統(tǒng)優(yōu)化算法的是,遺傳算法能同時(shí)處理種群中的不同個(gè)體并根據(jù)不確定性原則來(lái)引導(dǎo)算法搜索方向,極大地?cái)U(kuò)展了問(wèn)題解的覆蓋面和搜索方向的多樣性,降低陷入局部極小值點(diǎn)的可能性。由此,可以使用遺傳算法來(lái)對(duì)示例子網(wǎng)的初始權(quán)值和偏置進(jìn)行選取,以此來(lái)降低得到局部最小值的可能性,從而提高多示例框架下的神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能,算法實(shí)現(xiàn)如下所示:

        G:停止進(jìn)化代數(shù); Iter:繁殖代數(shù) w:網(wǎng)絡(luò)的權(quán)重CalFitness:計(jì)算適應(yīng)度;Copy:選擇個(gè)體進(jìn)行復(fù)制;Crossover:交叉;Mutation:變異;M:個(gè)體個(gè)數(shù);TN,Q:由N個(gè)包構(gòu)成的數(shù)據(jù)集,每個(gè)包包含Q個(gè)示例1. Input: TN,Q2. Initialize(Sk, k=1,2,…,M)3. whileTrue4. w=Encoding(Sk)5. for(i=0; i

        CalFitness(w,N,Q)用于按式(8)計(jì)算包的適應(yīng)度函數(shù)。該算法的時(shí)間復(fù)雜度為O(M×G),遺傳算法搜索最優(yōu)權(quán)值的停止條件定義為如下兩個(gè)條件之一成立。

        1) 運(yùn)行到一定代數(shù)時(shí),適應(yīng)度函數(shù)中最高的適應(yīng)度函數(shù)小于預(yù)先設(shè)定的閾值;

        2) 進(jìn)化次數(shù)增長(zhǎng)到初始給定的最大進(jìn)化次數(shù)。

        2 結(jié)果分析

        2.1 評(píng)價(jià)指標(biāo)

        多種指標(biāo)可用于對(duì)預(yù)測(cè)模型的性能進(jìn)行評(píng)價(jià),其原理都是對(duì)標(biāo)簽和預(yù)測(cè)值之間的差距進(jìn)行分析。對(duì)于回歸問(wèn)題來(lái)說(shuō),可以從2個(gè)方面來(lái)評(píng)價(jià)這種差異,分別是預(yù)測(cè)值與標(biāo)簽之間在數(shù)值上的偏差,以及二者的一致性程度。因此,本文采用2種指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),分別是相對(duì)誤差RE(Relative Error)、和擬合指數(shù)IA(Index of Agreement)[22],RE反映了預(yù)測(cè)值與標(biāo)簽之間在數(shù)值上的偏差,IA反映了預(yù)測(cè)值與標(biāo)簽之間的一致性,可以用來(lái)表示模型預(yù)測(cè)的效果,計(jì)算公式如下:

        (9)

        (10)

        2.2 結(jié)果與分析

        根據(jù)式(9)和式(10)可知,RE是越小越好,IA是越大越好。表2是多示例遺傳神經(jīng)網(wǎng)絡(luò)算法MI-GA(Multi-Instance Genetic Neural Network Algorithm)、遺傳神經(jīng)網(wǎng)絡(luò)算法GA(Genetic Neural Network Algorithm)、支持向量回歸(Support Vector Regression)、隨機(jī)森林(Random Forest)、線性回歸(Linear Regression)、決策樹(shù)(Decision Tree)、LASSO(Least Absolute Shrinkage and Selection Operator),在室外和室內(nèi)的3個(gè)測(cè)試集(每個(gè)測(cè)試集為600條數(shù)據(jù))上預(yù)測(cè)所得結(jié)果的平均相對(duì)誤差RE的比較,表3為這七種方法在是否加“通風(fēng)率”特征的實(shí)驗(yàn)比較。

        表2 室內(nèi)和室外預(yù)測(cè)結(jié)果相對(duì)誤差(RE)比較

        表3 MI-GA 與其他六種方法在室內(nèi)數(shù)據(jù)上預(yù)測(cè)結(jié)果比較

        續(xù)表3

        (1) 室內(nèi)與室外預(yù)測(cè)比較:

        從表2中可看出,在對(duì)室內(nèi)和室外PM2.5的預(yù)測(cè)中,對(duì)同一種方法,室外預(yù)測(cè)結(jié)果的相對(duì)誤差RE都要小于室內(nèi)預(yù)測(cè)結(jié)果,這是因?yàn)槭覂?nèi)PM2.5來(lái)源復(fù)雜,相較于室外PM2.5而言更加難預(yù)測(cè)。在對(duì)室外PM2.5的預(yù)測(cè)中,本文提出的MI-GA方法獲得了僅次于RF的預(yù)測(cè)結(jié)果,這是因?yàn)楸疚膶?shí)驗(yàn)中,室外特征較少,而在特征較少和小數(shù)據(jù)集的情況下,相對(duì)于其他算法, RF能發(fā)揮更大的優(yōu)勢(shì)。而相對(duì)于GA、SVR、LR、DT、LASSO,MI-GA方法取得了更好的預(yù)測(cè)效果,平均RE降低了0.33%、8.31%、2.03%、9.12%和2.74%。對(duì)于難度較大的室內(nèi)PM2.5的預(yù)測(cè),因?yàn)樘卣饔?個(gè)增加到7個(gè),MI-GA方法取得了最好的預(yù)測(cè)效果,相較于GA、SVR、RF、LR、DT和LASSO,平均RE分別降低了7.54%、5.97%、12.88%、8.84%、11.65%和7.32%。

        (2) 特征是否含通風(fēng)率實(shí)驗(yàn)比較:

        窗戶是連接室內(nèi)和室外的重要通道,通風(fēng)情況是影響室內(nèi)PM2.5的一個(gè)關(guān)鍵因素,因此,通風(fēng)率成為預(yù)測(cè)室內(nèi)PM2.5的一個(gè)重要特征。本文對(duì)室內(nèi)的3個(gè)數(shù)據(jù)集進(jìn)行了是否含“通風(fēng)率”特征的實(shí)驗(yàn)比較,實(shí)驗(yàn)結(jié)果見(jiàn)表3。從表3中可看出,在加入“通風(fēng)率”特征的情況下,七種方法預(yù)測(cè)結(jié)果的相對(duì)誤差RE分別降低了1.93%、0.04%、12.02%、3.93%、3.89%、3.77%和8.09%,擬合指數(shù)IA提高了0.07、0.10、0.01、0.04、0.06、0.10和0.06。實(shí)驗(yàn)結(jié)果證明了“通風(fēng)率”特征對(duì)于預(yù)測(cè)室內(nèi)PM2.5的重要性,為今后的模型改善提供了一個(gè)新思路,同時(shí)也可以為其他相關(guān)專(zhuān)業(yè)研究人員提供新的參考特征。

        2.3 MI-GA方法與其他六種方法預(yù)測(cè)結(jié)果比較

        從表3中可見(jiàn),在加入“通風(fēng)率”特征的結(jié)果中,本文提出的MI-GA方法預(yù)測(cè)結(jié)果RE為5.60%,比GA降低7.55%,比SVR降低5.98%,比RF低8.36%,比LR低7.66%,比DT低14.69%,比LASSO低8.21%。可見(jiàn),使用多示例機(jī)制將預(yù)測(cè)時(shí)間與采樣間隔時(shí)間有效融合后的遺傳神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,預(yù)測(cè)結(jié)果的相對(duì)誤差得到了很好的降低。

        圖3為MI-GA與GA方法在3個(gè)室內(nèi)數(shù)據(jù)集(包含“通風(fēng)率”特征)上所得結(jié)果相對(duì)誤差分布的散點(diǎn)圖。從圖中可以看到,分布于對(duì)角線上方的數(shù)據(jù)點(diǎn)都要多于直線下方的數(shù)據(jù)點(diǎn),即相較于GA方法所得結(jié)果中,MI-GA方法所得結(jié)果中相對(duì)誤差RE較大的點(diǎn)要更少,即MI-GA方法預(yù)測(cè)結(jié)果中有更多的數(shù)據(jù)比較接近標(biāo)簽。

        (a) Summer數(shù)據(jù)集預(yù)測(cè)結(jié)果

        (b) Autumn數(shù)據(jù)集預(yù)測(cè)結(jié)果

        (c) Winter數(shù)據(jù)集預(yù)測(cè)結(jié)果圖3 MI-GA與GA方法在三個(gè)數(shù)據(jù)集上的RE比較散點(diǎn)圖

        圖4為測(cè)試樣本在六種方法上預(yù)測(cè)結(jié)果在不同誤差區(qū)間內(nèi)的分布直方圖。從圖中可以看出,本文提出的MI-GA方法在室內(nèi)數(shù)據(jù)集預(yù)測(cè)結(jié)果中,RE低于5%的樣本個(gè)數(shù)有517個(gè),比GA方法多339個(gè),比SVR方法多252個(gè),比RF方法多226個(gè),比LR方法多92個(gè),比DT多194個(gè),比LASSO多138個(gè)。而在RE大于30%樣本中,MI-GA方法的樣本點(diǎn)最少,由此可見(jiàn)MI-GA方法不僅具有較高的預(yù)測(cè)準(zhǔn)確度,還具有很好的穩(wěn)定性。MI-GA能取得更好的預(yù)測(cè)結(jié)果,原因可能是多示例神經(jīng)網(wǎng)絡(luò)方法將某個(gè)時(shí)間范圍內(nèi)的多條數(shù)據(jù)集中于一個(gè)包中,充分考慮了包中各個(gè)示例之間隱藏的關(guān)系,進(jìn)而更深層地挖掘出PM2.5的序列特征,從而提高預(yù)測(cè)的精確度。

        圖4 不同RE區(qū)間內(nèi)樣本分布直方圖

        3 結(jié) 語(yǔ)

        綜合以上對(duì)多示例遺傳神經(jīng)網(wǎng)絡(luò)模型的分析和實(shí)驗(yàn)的實(shí)現(xiàn),表明以時(shí)間戳、溫濕度、通風(fēng)率以及室外PM2.5等因子作為網(wǎng)絡(luò)的特征輸入,可以較為準(zhǔn)確地預(yù)測(cè)出室內(nèi)的PM2.5。最后從醫(yī)院房間采集了28 800條數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果顯示相對(duì)誤差為5.60%,比傳統(tǒng)遺傳神經(jīng)網(wǎng)絡(luò)降低7.55%,比支持向量回歸方法降低5.98%,比隨機(jī)森林低8.36%,比線性回歸低7.66%,比決策樹(shù)低14.69%, 比LASSO回歸低8.21%。這樣的結(jié)果對(duì)于醫(yī)院房間內(nèi)預(yù)警污染的發(fā)生是可行的。

        本文中所采用的遺傳算法是最基本的遺傳算法,遺傳算法的設(shè)定在一定程度上會(huì)影響神經(jīng)網(wǎng)絡(luò)參數(shù)的優(yōu)化,所以如何對(duì)遺傳算法做進(jìn)一步的改良或者選取更優(yōu)的進(jìn)化算法,進(jìn)而優(yōu)化多示例神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu),從而降低預(yù)測(cè)模型的誤差率將是我們下一步的研究方向。同時(shí),醫(yī)院室內(nèi)空氣質(zhì)量的預(yù)測(cè)是一種小范圍問(wèn)題,接下來(lái)的工作將考慮到將算法用于住宅、教室等更為復(fù)雜的環(huán)境,進(jìn)一步驗(yàn)證算法的性能。

        猜你喜歡
        特征方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        国产精品久久久久免费a∨| 久久精品99国产精品日本| 免费va国产高清大片在线| 国产真实乱人偷精品人妻 | 国产一区二区三免费视频| 亚洲av无码乱码在线观看富二代| 国产成人无码免费网站| 亚洲中文字幕巨乳人妻| 熟女不卡精品久久av| 女人18片毛片60分钟| 亚洲日本中文字幕天天更新| 久久精品伊人无码二区| 久久夜色精品亚洲天堂| 日本亚洲国产精品久久| 毛多水多www偷窥小便| 538任你爽精品视频国产| 亚洲精品av一区二区日韩| 人人妻人人添人人爽欧美一区 | 成人国产一区二区三区| 水蜜桃精品一二三| 国产女人精品视频国产灰线| 成人免费播放片高清在线观看| 国产精品一区二区三久久不卡| 中文字幕无码日韩专区免费| 中文字幕精品久久天堂一区| 国产亚洲精品免费专线视频| 性色av一区二区三区四区久久| 美女视频黄a视频全免费网站色| a级国产乱理伦片| 色先锋资源久久综合5566| 女人被躁到高潮嗷嗷叫| 不卡av网站一区二区三区| 人妻少妇精品无码专区动漫| 亚洲Av午夜精品a区| 成人av一区二区亚洲精| 中文字幕日韩精品有码视频| 曰韩人妻无码一区二区三区综合部| 亚洲国产福利精品一区二区| 日本高清人妻一区二区| 中文字幕有码无码人妻av蜜桃| 午夜福利视频合集1000|