祝文軍,王思寧,高曉欣,鄭倩
(北京中電普華信息技術(shù)有限公司,北京 100192)
隨著信息化時(shí)代的建設(shè),物聯(lián)網(wǎng)技術(shù)與人們的生活息息相關(guān)。物聯(lián)網(wǎng)的發(fā)展遍及各地區(qū)各行業(yè)戰(zhàn)略性產(chǎn)業(yè)鏈,這些重要行業(yè)領(lǐng)域有能源電力行業(yè)、運(yùn)輸交通行業(yè)與智能醫(yī)療行業(yè)和服務(wù)行業(yè)等[1]。物聯(lián)網(wǎng)系統(tǒng)可分為感知層、應(yīng)用層、網(wǎng)絡(luò)層3 個(gè)層次,本文主要面向感知層,由各種具備感知性能的設(shè)備組合而成[2],如傳感器設(shè)備等,主要負(fù)責(zé)物理數(shù)據(jù)接入感知,是實(shí)現(xiàn)物聯(lián)網(wǎng)技術(shù)的基本層。感知技術(shù)是指利用現(xiàn)有的傳感器實(shí)現(xiàn)物聯(lián)網(wǎng)的物物交互與連接[3]。信息感知交互過程中,海量數(shù)據(jù)信息的采集、大規(guī)模信號(hào)的處理易出現(xiàn)不準(zhǔn)確性,數(shù)據(jù)冗余、計(jì)算量大、成本高、計(jì)算實(shí)時(shí)性差和無(wú)特征性的特點(diǎn),物聯(lián)信息感知、信息傳遞、信息存儲(chǔ)、信息處理等面臨巨大挑戰(zhàn),物聯(lián)智能化水平亟須提高[4]。目前多種方式正在改善各種形式物聯(lián)感知系統(tǒng),能源電力正著手于智能感知平臺(tái)的開發(fā),協(xié)助行業(yè)的發(fā)展,多家企業(yè)正致力于物聯(lián)感知技術(shù)的革新[5]?;谥R(shí)流的物聯(lián)感知為感知技術(shù)提供了新的研究思路,將知識(shí)流的思想遷移到物聯(lián)感知的整個(gè)過程,實(shí)現(xiàn)物聯(lián)狀態(tài)全面感知。知識(shí)流的過程可實(shí)現(xiàn)知識(shí)交互、知識(shí)挖掘、知識(shí)融合以及知識(shí)處理分析[6]。目前對(duì)于知識(shí)流的概念描述大致可以劃分為如下3 個(gè)類型[7]。
· 知識(shí)流類似于信息的傳遞。
· 知識(shí)流過程是信息傳遞和信息處理的融合。
· 知識(shí)流是信息傳遞和應(yīng)用的結(jié)合體。
本文將基于知識(shí)流的物聯(lián)感知概括為物聯(lián)感知過程中知識(shí)流動(dòng)過程或知識(shí)處理及應(yīng)用機(jī)制,即數(shù)據(jù)交互傳遞以及數(shù)據(jù)分析處理和應(yīng)用。
對(duì)于用電領(lǐng)域的物聯(lián)感知,如智能電表作為數(shù)據(jù)采集的基本設(shè)備之一,協(xié)助物聯(lián)系統(tǒng)完成負(fù)荷數(shù)據(jù)采集、信息集成、分析優(yōu)化和信息展現(xiàn)[8]。此外,對(duì)用電負(fù)荷數(shù)據(jù)進(jìn)行分析處理,輔助完成智能電網(wǎng)能源調(diào)度、用電耗能預(yù)判、用電負(fù)荷預(yù)測(cè)、分析用戶用電行為特征和判斷影響因子等是能源電力物聯(lián)感知系統(tǒng)中的重要環(huán)節(jié)[9]。利用遷移學(xué)習(xí)方法在計(jì)算智能、感知智能和認(rèn)知智能方面具有的強(qiáng)處理能力[10-11],改變能源傳統(tǒng)利用模式,促進(jìn)系統(tǒng)進(jìn)一步智能化[12]。文獻(xiàn)[13]提出了一種基于參數(shù)遷移的節(jié)假日負(fù)荷預(yù)測(cè)方法。將平常日負(fù)荷預(yù)測(cè)模型已學(xué)習(xí)到的負(fù)荷曲線的重要基礎(chǔ)特征遷移至節(jié)假日預(yù)測(cè)模型中微調(diào)參后完成節(jié)假日負(fù)荷預(yù)測(cè)模型的訓(xùn)練,但該方法并不具有適用性,訓(xùn)練量仍然較大,需要反復(fù)確定調(diào)參的層數(shù)。文獻(xiàn)[14]提出一種基于特征遷移學(xué)習(xí)的小樣本日前電力負(fù)荷預(yù)測(cè)方法,提取源域用戶在各不同用電時(shí)段的特征,并將該模型應(yīng)用于目標(biāo)域小樣本中,此方法僅驗(yàn)證了在小樣本電力負(fù)荷預(yù)測(cè)中的有效性。文獻(xiàn)[15]提出了遷移學(xué)習(xí)引導(dǎo)的變?cè)从蜷L(zhǎng)短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)建筑負(fù)荷預(yù)測(cè)方法,采用新的方法結(jié)合相對(duì)傳統(tǒng)的定源域遷移學(xué)習(xí)方法,所提變?cè)从騆STM 負(fù)荷預(yù)測(cè)方法可以保持不錯(cuò)的效果,但有待將數(shù)據(jù)特征有效融合。文獻(xiàn)[16]提出了一種基于LSTM、面向光伏發(fā)電功率預(yù)測(cè)的數(shù)字孿生模型,通過遷移學(xué)習(xí)將此模型應(yīng)用到其他發(fā)電功率預(yù)測(cè)場(chǎng)景,有效彌補(bǔ)了光伏系統(tǒng)發(fā)電功率預(yù)測(cè)中投入運(yùn)行時(shí)間較短、數(shù)據(jù)不足的缺點(diǎn)。文獻(xiàn)[17]面向樓宇用戶提出一種基于深度學(xué)習(xí)和遷移學(xué)習(xí)的負(fù)荷分解模型。該模型將多種神經(jīng)網(wǎng)絡(luò)模塊化并聯(lián)連接,并融合網(wǎng)絡(luò)特征,運(yùn)用到樓宇負(fù)荷分解,進(jìn)一步為基于遷移學(xué)習(xí)的發(fā)電功率負(fù)荷預(yù)測(cè)提供思路,有利于提高預(yù)測(cè)精度。文獻(xiàn)[18]采用了可以順利集成深度神經(jīng)網(wǎng)絡(luò)中的遷移學(xué)習(xí)和元學(xué)習(xí)用于短期電力負(fù)荷預(yù)測(cè),并展示了如何使用幾天內(nèi)收集的數(shù)據(jù)形成高性能的個(gè)性化模型,但此方法對(duì)模型提出了更高的要求,局限性較大。
本文應(yīng)用知識(shí)流體系的概念,實(shí)現(xiàn)知識(shí)的傳遞、交互、處理,將遷移學(xué)習(xí)與信息融合應(yīng)用到基于知識(shí)流的物聯(lián)感知過程,將感知源領(lǐng)域中學(xué)習(xí)到的知識(shí)應(yīng)用到新的目標(biāo)領(lǐng)域,同時(shí)融合多種特征信息,結(jié)合新的感知方法以提升物聯(lián)感知的可靠性、準(zhǔn)確性、高效性和智能化水平。根據(jù)遷移學(xué)習(xí)從少量學(xué)習(xí)到的知識(shí)可以在新的領(lǐng)域被吸收、擴(kuò)散、再創(chuàng)造的特點(diǎn),在從源域提取特征遷移到目標(biāo)域下用經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)提取特征影響因子,以及根據(jù)因子影響程度進(jìn)行權(quán)重的數(shù)據(jù)融合,以固定地區(qū)用電功率部分?jǐn)?shù)據(jù)做短期負(fù)荷預(yù)測(cè)的仿真計(jì)算,分析用戶用電行為影響因子,訓(xùn)練得到影響因子最佳權(quán)重分配,做好用電耗率預(yù)判,與真實(shí)數(shù)據(jù)相比較和計(jì)算評(píng)估,分析得到此方法的可行性。
大數(shù)據(jù)信息化時(shí)代,對(duì)數(shù)據(jù)分析能力要求越來(lái)越高,并且眾多機(jī)器學(xué)習(xí)算法都需要對(duì)大量數(shù)據(jù)進(jìn)行標(biāo)注保證算法的準(zhǔn)確度。在負(fù)荷預(yù)測(cè)應(yīng)用場(chǎng)景中,監(jiān)測(cè)和標(biāo)注數(shù)據(jù)需要耗費(fèi)大量的時(shí)間成本,訓(xùn)練結(jié)果常常達(dá)不到預(yù)期效果。因此,引入遷移學(xué)習(xí),從相關(guān)領(lǐng)域?qū)ふ覙?biāo)注過的數(shù)據(jù)進(jìn)行訓(xùn)練,將相關(guān)領(lǐng)域的預(yù)測(cè)知識(shí)很快地遷移到負(fù)荷預(yù)測(cè)場(chǎng)景中。相比于傳統(tǒng)的機(jī)器學(xué)習(xí),遷移學(xué)習(xí)的優(yōu)勢(shì)在于允許源域和目標(biāo)域的樣本、任務(wù)或者分布可以有較大的差異,從而解決了小數(shù)據(jù)、個(gè)性化等問題,節(jié)省了時(shí)間成本。
根據(jù)源領(lǐng)域和目標(biāo)領(lǐng)域的相似度,將遷移學(xué)習(xí)做如下分類[19]。
表1 遷移學(xué)習(xí)的分類
其中,用DS表示已經(jīng)學(xué)習(xí)過的領(lǐng)域——“源域”,用DT表示需要應(yīng)用的新的領(lǐng)域——“目標(biāo)域”,TS表示源任務(wù),TT表示目標(biāo)任務(wù)。
在此基礎(chǔ)上,根據(jù)源領(lǐng)域中是否有標(biāo)簽樣本把歸納遷移學(xué)習(xí)劃分成多任務(wù)學(xué)習(xí)、自學(xué)習(xí)。當(dāng)DS包含大量標(biāo)簽數(shù)據(jù)時(shí),歸納式遷移學(xué)習(xí)相當(dāng)于多任務(wù)學(xué)習(xí);當(dāng)DS沒有可用的標(biāo)簽數(shù)據(jù)時(shí),歸納式遷移學(xué)習(xí)就相當(dāng)于自我學(xué)習(xí)[20]。
遷移學(xué)習(xí)中的首要步驟是根據(jù)源領(lǐng)域和目標(biāo)領(lǐng)域間的概率分布差異確定域之間是否構(gòu)成正遷移關(guān)系,本文中,遷移學(xué)習(xí)的目標(biāo)領(lǐng)域與源領(lǐng)域?yàn)榘P(guān)系,即目標(biāo)領(lǐng)域包含于源領(lǐng)域。因此,本文的學(xué)習(xí)過程構(gòu)成正遷移學(xué)習(xí)。
遷移學(xué)習(xí)是一種學(xué)習(xí)的思想和模式,想要實(shí)現(xiàn)遷移學(xué)習(xí)還需要一定的方法,以下是遷移學(xué)習(xí)的常用方法。
(1)基于特征選擇方法
基于特征選擇的遷移學(xué)習(xí)方法是識(shí)別源領(lǐng)域與目標(biāo)領(lǐng)域中共有的特征表示,根據(jù)這些特征進(jìn)行知識(shí)遷移[21]。
(2)基于特征映射方法
基于特征映射的遷移學(xué)習(xí)方法是把源領(lǐng)域的數(shù)據(jù)從原始的高維特征空間映射到低維特征空間,使得在低維空間下,源領(lǐng)域數(shù)據(jù)與目標(biāo)領(lǐng)域數(shù)據(jù)擁有相同的概率分布,從而實(shí)現(xiàn)高維數(shù)據(jù)到低維數(shù)據(jù)的遷移學(xué)習(xí)。
(3)基于權(quán)重方法
基于權(quán)重的方法是判斷源域中樣本的采樣權(quán)重[22]。在遷移學(xué)習(xí)中,有標(biāo)簽的源領(lǐng)域數(shù)據(jù)的分布與無(wú)標(biāo)簽的目標(biāo)領(lǐng)域數(shù)據(jù)的分布是不一樣的,有標(biāo)簽的樣本數(shù)據(jù)并不一定是全部有用的。因此需要度量有標(biāo)簽的訓(xùn)練樣本與無(wú)標(biāo)簽的測(cè)試樣本之間的相似度,重新分配源領(lǐng)域中樣本的采樣權(quán)重。相似度大的樣本(即對(duì)訓(xùn)練目標(biāo)模型有利的訓(xùn)練樣本)權(quán)重被加大,否則權(quán)重被削弱。
通過對(duì)比負(fù)荷預(yù)測(cè)數(shù)據(jù)與源域數(shù)據(jù)的相似程度,本文利用特征選擇和權(quán)重相結(jié)合的方法,首先分析源域特征對(duì)其源域數(shù)據(jù)的影響,然后結(jié)合影響程度賦值權(quán)重進(jìn)行信息融合,為能源電力感知系統(tǒng)中數(shù)據(jù)分析和負(fù)荷預(yù)測(cè)奠定良好的數(shù)據(jù)基礎(chǔ)。
EMD 是一種信號(hào)分析的方法,將非平穩(wěn)信號(hào)按照不同尺度的波動(dòng)或者趨勢(shì)依次分解成若干個(gè)本征模式函數(shù)(intrinsic mode function,IMF),對(duì)源信號(hào)做平穩(wěn)化處理,減少了信號(hào)間特征信息的干擾。對(duì)負(fù)荷數(shù)據(jù)及影響因子數(shù)據(jù)分別采用EMD 進(jìn)行分解,可以充分地分解數(shù)據(jù),并獲得更具物理意義的分量[23]。但是,EMD 方法存在邊界效應(yīng),信號(hào)兩端的邊界效應(yīng)影響會(huì)向內(nèi)傳播,從而使整個(gè)數(shù)量序列被“污染”,最后的分解分量失去意義,尤其是低頻部分的電力負(fù)荷分量比重比較大,這種邊界效應(yīng)所引起的誤差更嚴(yán)重,最終直接影響預(yù)測(cè)結(jié)果[24]。
為了減少邊界效應(yīng)帶來(lái)的影響,本文采用遷移學(xué)習(xí)補(bǔ)充數(shù)據(jù)。遷移學(xué)習(xí)問題中,源任務(wù)和目標(biāo)任務(wù)的輸入和輸出能夠通過某些隱含關(guān)系關(guān)聯(lián),所以通過源任務(wù)的數(shù)據(jù)完善目標(biāo)任務(wù)的信息,從而提高預(yù)測(cè)精度。本文提出的基于遷移學(xué)習(xí)的EMD 方法,通過遷移源任務(wù)中多模型未來(lái)預(yù)測(cè)值,增加未來(lái)趨勢(shì)和未來(lái)變化信息,從而使得EMD 方法盡可能減少邊界效應(yīng)。
隨著大數(shù)據(jù)技術(shù)的發(fā)展,數(shù)據(jù)特征不再呈現(xiàn)單一形式,數(shù)據(jù)信息融合受到了廣泛的關(guān)注,在理論和實(shí)際應(yīng)用中都得到了發(fā)展[25]。數(shù)據(jù)信息融合技術(shù)將不同類型的數(shù)據(jù)進(jìn)行整合,提高數(shù)據(jù)輸出質(zhì)量,從合并后的數(shù)據(jù)中獲取更多的信息,而不是單獨(dú)考慮每個(gè)數(shù)據(jù)集[26]。針對(duì)多種來(lái)源的信息、多種結(jié)構(gòu)相關(guān)的特征以及多種任務(wù)相關(guān)的決策,首先利用多源異構(gòu)數(shù)據(jù)具有信息冗余以及信息互補(bǔ)的特點(diǎn)進(jìn)行綜合分析,然后濾除掉冗余或者錯(cuò)誤的信息,提高信息質(zhì)量,以此進(jìn)行更加精準(zhǔn)的模型訓(xùn)練,提高模型容錯(cuò)性和泛化性[27]。
數(shù)據(jù)信息融合主要包括數(shù)據(jù)層面融合、特征層面融合、決策層面融合[28]。數(shù)據(jù)層面融合是直接在各種傳感器采集到的未經(jīng)預(yù)處理的原始數(shù)據(jù)上進(jìn)行融合,不一定總是產(chǎn)生最佳推理,而且傳感器具有有限的計(jì)算能力[29];特征層面融合對(duì)傳感器采集到的原始數(shù)據(jù)進(jìn)行特征提取,然后對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行綜合分析,得到關(guān)鍵信息,是一種更有效的融合形式[30];決策層面融合先建立對(duì)目標(biāo)的初步結(jié)論,然后通過關(guān)聯(lián)處理進(jìn)行決策級(jí)融合判決,最終獲得聯(lián)合推斷結(jié)果,是一種全局評(píng)估的形式[31]。
常見的數(shù)據(jù)信息融合方法主要有加權(quán)平均法、貝葉斯估計(jì)法、產(chǎn)生式規(guī)則法、卡爾曼濾波法以及最新的人工神經(jīng)網(wǎng)絡(luò)方法[32]。董真杰等[33]利用加權(quán)平均法對(duì)各種傳感器采集到的不同數(shù)據(jù)分配一定的權(quán)重并計(jì)算其平均值得到融合處理后的信息。文獻(xiàn)[34]基于概率估計(jì)的思想提出貝葉斯估計(jì)法處理得到融合數(shù)據(jù)。拉爾曼濾波法主要針對(duì)冗余數(shù)據(jù)進(jìn)行處理,通過遞歸迭代得到最優(yōu)解[35]。近年來(lái),隨著人工智能技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)技術(shù)能夠以更加自主便捷的方式融合更加復(fù)雜的多源異構(gòu)數(shù)據(jù),而且具有更好的融合效果,在各類數(shù)據(jù)信息融合技術(shù)中具有突出優(yōu)勢(shì)。
本文采納的信息融合為中間層級(jí)即特征層的數(shù)據(jù)融合,即先對(duì)提取的源域數(shù)據(jù)進(jìn)行主成分分析,達(dá)到降維效果,然后根據(jù)各個(gè)影響因子影響程度大小設(shè)定影響權(quán)重,從而融合各個(gè)因子的影響關(guān)系。在能源用電感知系統(tǒng)下,分析源域下的影響因子(如月份、季節(jié)等)因子設(shè)定權(quán)重大小。
本文采用的用電負(fù)荷預(yù)測(cè)基本流程如圖1 所示,首先對(duì)相關(guān)負(fù)荷數(shù)據(jù)及影響因子進(jìn)行采集管理,如用電負(fù)荷的日期特點(diǎn)、溫度的變化、一天內(nèi)的時(shí)間特點(diǎn);做好嘗試數(shù)據(jù)處理和因素聯(lián)系的分析,處理包括找尋奇異/特殊數(shù)據(jù)并舍棄處理、數(shù)據(jù)標(biāo)準(zhǔn)化處理,并可視化相關(guān)數(shù)據(jù),估計(jì)分析包括影響負(fù)荷波動(dòng)的多元化成分,分析其與負(fù)荷相關(guān)性。通過量化后的相關(guān)性和影響因子的共同作用訓(xùn)練得到預(yù)測(cè)模型;經(jīng)由輸入特征和預(yù)測(cè)模型得到目標(biāo)時(shí)間段的短期負(fù)荷值;最后用評(píng)估參數(shù)評(píng)估此方法的可行性。
圖1 用電負(fù)荷預(yù)測(cè)流程
采用某地區(qū)2012 年1 月1 日至2013 年12 月31 日的整點(diǎn)負(fù)荷及相關(guān)影響因子數(shù)據(jù),如季節(jié)、工作日或節(jié)假日、氣溫作為試驗(yàn)數(shù)據(jù),源域樣本數(shù)據(jù)17 544 個(gè)。
因?yàn)楦鱾€(gè)影響因子有不同的量測(cè)方式和量測(cè)單位,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。用電負(fù)荷數(shù)據(jù)以時(shí)間為序列數(shù)據(jù),一般來(lái)說(shuō)出現(xiàn)短暫負(fù)荷突變的情況是不太可能的。設(shè)定某天的變化量ΔM_i是指該時(shí)刻和前后天的差值的平均值,i=0,1,2,3,…,n為天數(shù),則有:
根據(jù)數(shù)據(jù)處理經(jīng)驗(yàn)設(shè)定閾值,判斷ε值是否超過閾值,確定該i點(diǎn)是否為奇異值。
取每一天的最大需求負(fù)荷、最小需求負(fù)荷、平均需求負(fù)荷,用圖表示,發(fā)現(xiàn)是否有突變值,有則考慮受信號(hào)噪聲等因素的影響,為了整體數(shù)據(jù)分析處理而去除。
某地區(qū)兩年間負(fù)荷變動(dòng)趨勢(shì)如圖2 所示,負(fù)荷與日期呈現(xiàn)相關(guān)性,且存在信號(hào)噪聲無(wú)規(guī)律波動(dòng)振蕩,但仍能看出負(fù)荷波動(dòng)具有規(guī)律性,受外在因素影響。分別對(duì)負(fù)荷、氣溫等無(wú)規(guī)律數(shù)據(jù)進(jìn)行上述數(shù)據(jù)歸一化處理。負(fù)荷數(shù)據(jù)及氣溫?cái)?shù)據(jù)、季節(jié)數(shù)據(jù)如圖3~圖5 所示,可看出負(fù)荷數(shù)據(jù)具有明顯的非平穩(wěn)性和非線性,同時(shí)局部具有一定的周期性,且與氣溫變化、季節(jié)更替、日期性質(zhì)有較高的相關(guān)性。
圖2 某地區(qū)兩年間負(fù)荷變動(dòng)趨勢(shì)
圖5 該地區(qū)負(fù)荷與氣溫變化曲線情況
該地區(qū)負(fù)荷與季節(jié)相關(guān)性曲線如圖3 所示,可以發(fā)現(xiàn),春秋季用電相對(duì)平穩(wěn),夏季和冬季用電有大幅度波動(dòng),除此之外,是否工作日、是否節(jié)假日、氣溫變化等影響因子存在規(guī)律性影響,存在相關(guān)性,并非僅受日期變動(dòng)影響,受多方面規(guī)律性因素的共同制約。
圖3 該地區(qū)負(fù)荷與季節(jié)相關(guān)性曲線
圖4 一段時(shí)間用戶負(fù)荷與日期性質(zhì)曲線情況
采用EMD 方法分解一段用電時(shí)間負(fù)荷影響如圖6 所示,圖6 中包括了8 個(gè)IMF 分量和1 個(gè)趨勢(shì)分量。圖6 中,IMF1-3 波形較亂,不規(guī)律。IMF4-8可見其規(guī)律性,表示信息受規(guī)律性影響因子,如時(shí)間、天數(shù)周期制約較大。IMF 分量影響因子見表2。
表2 IMF 分量影響因子
EMD 處理分解該非線性的用電負(fù)荷,通過圖6可以看出用電負(fù)荷受不同影響因子制約,并且體現(xiàn)其與跟隨影響因子的相關(guān)性。可分析其處理過程中分解信號(hào)的制約因子。通過遷移學(xué)習(xí)補(bǔ)全信號(hào)的前后數(shù)據(jù),使數(shù)據(jù)在之后的處理中更加準(zhǔn)確,不會(huì)出現(xiàn)邊緣效應(yīng)。
圖6 采用EMD 方法分解一段用電時(shí)間負(fù)荷影響
本文采納皮爾遜相關(guān)系數(shù)表述用電負(fù)荷影響因素與IMF 分量之間的相關(guān)性分析,表示其密切程度和制約關(guān)系,該數(shù)值與影響程度呈現(xiàn)正相關(guān)關(guān)系。計(jì)算IMF0-10 中時(shí)間和幅度,將皮爾遜相關(guān)系數(shù)歸一化處理后再按比例給予賦值權(quán)重。
通過特征數(shù)據(jù)采掘,將多元化制約因子與IMF 分量匹配后,將2012—2013 年的負(fù)荷數(shù)據(jù)遷移學(xué)習(xí),以上述方式預(yù)測(cè)2014 年的負(fù)荷數(shù)據(jù),用傳統(tǒng)回歸模型預(yù)測(cè)方法預(yù)測(cè)一年后的模型,發(fā)現(xiàn)預(yù)測(cè)準(zhǔn)確性較高。2014 年負(fù)荷數(shù)據(jù)引入權(quán)重方法后真實(shí)值與實(shí)際值對(duì)比如圖7 所示。
圖7 2014 年負(fù)荷數(shù)據(jù)引入權(quán)重方法后真實(shí)值與實(shí)際值對(duì)比
用平均絕對(duì)百分誤差(MAPE)和均方根誤差(RMSE)指標(biāo)評(píng)估模型性能,評(píng)價(jià)用電負(fù)荷預(yù)測(cè)效果。
Di為第i天實(shí)際負(fù)荷數(shù)據(jù),iD˙為第i天預(yù)測(cè)數(shù)據(jù),n取采樣數(shù)8 760 個(gè)。引入特征權(quán)重前后評(píng)估參數(shù)對(duì)比見表3。
表3 引入特征權(quán)重前后評(píng)估參數(shù)對(duì)比
直觀發(fā)現(xiàn)加上權(quán)重的特征融合有改進(jìn)效果,代表預(yù)測(cè)比未加權(quán)重更準(zhǔn)確,性能更好。
對(duì)于用電領(lǐng)域的物聯(lián)感知,本文在從源域提取特征遷移到目標(biāo)域用EMD 方法分解提取特征影響因子,以及根據(jù)因子影響程度進(jìn)行權(quán)重的數(shù)據(jù)融合,以固定地區(qū)用電功率部分?jǐn)?shù)據(jù)進(jìn)行短期負(fù)荷預(yù)測(cè)的仿真計(jì)算,分析用戶用電行為影響因子,訓(xùn)練得到相關(guān)因素的最佳權(quán)重分配,做好用電耗率預(yù)判。在用電感知層面上,提出一種遷移學(xué)習(xí)EMD 加上基于權(quán)重?cái)?shù)值融合的知識(shí)流體系方法,并與未加權(quán)重前的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,所提方法預(yù)測(cè)的準(zhǔn)確性和性能都有所提高。
本文所使用的方法在用電感知層面負(fù)荷預(yù)測(cè)的準(zhǔn)確率上取得了良好的效果,目前僅僅將訓(xùn)練得到的模型遷移到了短時(shí)間相同區(qū)域問題,尚未對(duì)其他區(qū)域做出準(zhǔn)確判斷。因此,后續(xù)的工作是將該方法應(yīng)用到其他感知領(lǐng)域中,更深入了解知識(shí)流在物聯(lián)感知其他方面的深層次應(yīng)用。