亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于圖拉普拉斯變換和極限學(xué)習(xí)機(jī)的時間序列預(yù)測算法

        2021-04-15 03:48:50
        計算機(jī)應(yīng)用與軟件 2021年4期
        關(guān)鍵詞:拉普拉斯學(xué)習(xí)機(jī)特征選擇

        鄒 小 云

        (湖北職業(yè)技術(shù)學(xué)院公共課部 湖北 孝感 432000)

        0 引 言

        在許多領(lǐng)域內(nèi)均存在多元的時間序列數(shù)據(jù)[1],如互聯(lián)網(wǎng)中服務(wù)器的通信流量數(shù)據(jù)、虛擬現(xiàn)實技術(shù)的人體運動捕捉數(shù)據(jù)[2]和病人的腦電波實時監(jiān)測數(shù)據(jù)等。多元時間序列一般伴隨著高維數(shù)據(jù)的屬性,導(dǎo)致多元時間序列的預(yù)測難度升高,且難以在合理的時間內(nèi)取得理想的預(yù)測準(zhǔn)確率[3]。

        目前研究人員大多以時間為約束條件,以最大化預(yù)測準(zhǔn)確率為研究目標(biāo),設(shè)計了不同的多元時間序列預(yù)測算法。文獻(xiàn)[4]提出了基于無核相關(guān)向量機(jī)的多元時間序列預(yù)測算法,利用無核相關(guān)向量機(jī)不受核函數(shù)約束的特性,構(gòu)建了高維特征空間。但無核相關(guān)向量機(jī)的非線性擬合能力不足,導(dǎo)致多元時間序列的預(yù)測準(zhǔn)確率較低。文獻(xiàn)[5]通過因子分析提取高維儲備池狀態(tài)矩陣的公因子,利用降維后的因子變量與期望輸出之間的線性回歸關(guān)系,求解神經(jīng)網(wǎng)絡(luò)的未知參數(shù)。文獻(xiàn)[6]采用集群卷積神經(jīng)網(wǎng)絡(luò)對多元時間序列進(jìn)行預(yù)測,提出了訓(xùn)練階段新的數(shù)據(jù)結(jié)構(gòu),通過協(xié)方差矩陣對時間序列進(jìn)行快速分類。該網(wǎng)絡(luò)通過卷積運算和下采樣自動對時間域特征和空間域特征進(jìn)行選擇,獲得了較好的預(yù)測效果。但該網(wǎng)絡(luò)模型需要實時更新卷積層參數(shù)、隱層單元數(shù)量和權(quán)重向量等超參數(shù),訓(xùn)練時間過長。文獻(xiàn)[7]通過遞歸神經(jīng)網(wǎng)絡(luò)預(yù)測多元時間序列的類別,該算法的準(zhǔn)確率較高,但是對每個新到達(dá)時間序列需要很多輪數(shù)才能達(dá)到收斂??傮w而言,基于神經(jīng)網(wǎng)絡(luò)的預(yù)測算法具有學(xué)習(xí)能力強的優(yōu)勢,但存在網(wǎng)絡(luò)參數(shù)學(xué)習(xí)難度大的問題。當(dāng)前的時間序列學(xué)習(xí)方法大多基于前饋神經(jīng)網(wǎng)絡(luò)實現(xiàn),并通過梯度下降法和后向傳播算法實現(xiàn)在線地學(xué)習(xí)和更新,但梯度下降法和后向傳播需要很長的訓(xùn)練時間和復(fù)雜的參數(shù)調(diào)節(jié)。

        為了解決上述問題,本文提出了基于圖拉普拉斯特征提取和極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)在線學(xué)習(xí)的多元時間序列預(yù)測算法。將標(biāo)記觀察樣本和無標(biāo)記觀察樣本分別構(gòu)建圖拉普拉斯的散布矩陣,再利用圖拉普拉斯相關(guān)理論提取時間序列的特征子集。設(shè)計了新的時間序列在線極限學(xué)習(xí)機(jī),該模型隨機(jī)初始化隱層單元數(shù)量,在線學(xué)習(xí)程序通過最小二乘法遞歸地逼近問題最優(yōu)解,從而更新網(wǎng)絡(luò)的輸出權(quán)重。在線學(xué)習(xí)過程中僅需要學(xué)習(xí)和更新隱層和輸出層之間的權(quán)重即可完成訓(xùn)練。本文的貢獻(xiàn)主要如下:(1) 提出基于圖拉普拉斯的稀疏特征選擇方法,利用凸l2-p范數(shù)(p=1)和非凸l2,p范數(shù)(0

        1 多元時間序列的特征選擇

        1.1 基于圖拉普拉斯的特征選擇問題模型

        本文基于圖拉普拉斯建模特征學(xué)習(xí)問題[8],計算特征選擇的稀疏變換向量,采用l2-p范數(shù)保證向量的稀疏性,使其符合特征選擇的問題模型。圖1是時間序列特征提取流程。設(shè)X=[x1,x2,…,xl,xl+1,…,xn]T∈Rd×n為訓(xùn)練數(shù)據(jù)矩陣,X=[x1,x2,…,xl]T∈Rd×l為X的標(biāo)記訓(xùn)練數(shù)據(jù),n為訓(xùn)練數(shù)據(jù)的數(shù)量,l為標(biāo)記訓(xùn)練數(shù)據(jù)的數(shù)量。xi∈Rd(1≤i≤n)表示第i個訓(xùn)練樣本,Y=[y1,y2,…,yl]T∈Rl表示訓(xùn)練數(shù)據(jù)的標(biāo)記向量,yi∈R(1≤i≤l)為第i個標(biāo)記樣本的標(biāo)記。定義W∈Rd為特征選擇問題的變換向量。

        圖1 時間序列特征提取流程

        1.2 時間序列的特征選擇模型

        將l2-p范數(shù)引入圖拉普拉斯矩陣,以實現(xiàn)降維處理,目標(biāo)函數(shù)定義為:

        (1)

        第1個散布矩陣定義為圖拉普拉斯的監(jiān)督散布矩陣和無監(jiān)督散布矩陣的結(jié)合,其計算式為:

        (2)

        (3)

        式中:Lunsup∈Rn×n為訓(xùn)練數(shù)據(jù)的無監(jiān)督圖拉普拉斯矩陣?;谌繑?shù)據(jù)建立近鄰圖Gunsup,每個節(jié)點對應(yīng)一個觀察數(shù)據(jù)。如果xi屬于xj的k-近鄰,或者xj屬于xi的k-近鄰,則在兩個樣本間建立連接。圖Gunsup中邊權(quán)重的計算式為:

        (4)

        (5)

        式中:Lsup∈Rl×l為標(biāo)記數(shù)據(jù)的監(jiān)督圖拉普拉斯矩陣。

        基于標(biāo)記數(shù)據(jù)建立監(jiān)督近鄰圖Gsup,每個標(biāo)記數(shù)據(jù)為一個節(jié)點,根據(jù)觀察樣本的標(biāo)記信息在相似的樣本之間建立連接。圖Gsup的權(quán)重矩陣Ssup定義為:

        (6)

        第2個散布矩陣定義為:

        M2=XLSemiXT

        (7)

        式中:Lsemi∈Rn×n為半監(jiān)督圖拉普拉斯矩陣,表示標(biāo)記數(shù)據(jù)的標(biāo)記信息和局部結(jié)構(gòu)信息。為了計算半監(jiān)督圖拉普拉斯矩陣Lsemi,首先使用所有數(shù)據(jù)建立近鄰圖Gsemi,圖Gsemi的權(quán)重矩陣Ssemi定義為:

        (8)

        式中:dist為每對樣本的距離矩陣,其定義為:

        (9)

        1.3 多元時間序列的特征選擇

        (10)

        通過拉格朗日乘法求解式(10)的優(yōu)化問題,式(10)轉(zhuǎn)化為:

        (11)

        式(11)對W求導(dǎo),可得:

        (12)

        式(12)說明W為R=M+(2/p)λD的特征向量,“∧”為特征值。目標(biāo)問題是最小化式(1)的問題,即選擇特征值最小的特征向量來最小化目標(biāo)函數(shù)。

        算法1是計算l2-p范數(shù)的迭代搜索求解算法,其中,第5行迭代地求解了l2,p范數(shù)的最小化問題。

        算法1l2-p范數(shù)的迭代搜索求解算法

        輸入:訓(xùn)練數(shù)據(jù)X∈Rd×n,標(biāo)記訓(xùn)練數(shù)據(jù)X∈Rd×l,標(biāo)記訓(xùn)練數(shù)據(jù)的標(biāo)記向量Y∈Rl,泛化參數(shù)λ。

        輸出:選擇的特征。

        //式(3)

        //式(5)

        3. 計算半監(jiān)督散布矩陣M1和M2;

        //式(2)和式(7)

        4. 初始化:t=0,Wt∈Rd;

        //隨機(jī)初始化Wt

        5. while未達(dá)到收斂條件do

        計算對角矩陣:

        Rt=M+(2/p)λDt;

        更新Wt+1=r1;

        //r1為Rt的特征向量

        t=t+1;

        end while

        計算無監(jiān)督圖拉普拉斯矩陣的復(fù)雜度和半監(jiān)督拉普拉斯矩陣的復(fù)雜度均為O(n2),Rt特征分解的復(fù)雜度為O(d3),特征排序的復(fù)雜度為O(dlogd)。因此特征選擇的總體復(fù)雜度為O(n2)+O(d3)+O(dlogd)。

        2 時間序列的極限學(xué)習(xí)機(jī)

        2.1 極限學(xué)習(xí)機(jī)

        考慮一個單層前饋神經(jīng)網(wǎng)絡(luò)的ELM模型:

        (13)

        式中:gi(·)對應(yīng)第i個隱層單元的激活函數(shù)G(ai,bi,x);x∈Rd,βi∈Rm,d為輸入層節(jié)點的數(shù)量,m為輸出層節(jié)點的數(shù)量;L為隱層節(jié)點的數(shù)量;ai為輸入層和隱層的連接權(quán)重;bi為輸入層偏差向量;βi為隱層和輸出層的連接權(quán)重。gi定義為:

        gi=G(ai,bi,x)=g(ai·x+bi)

        (14)

        式中:ai∈Rd,bi∈R。采用徑向基激活函數(shù)(Radical Basis Function,RBF),其計算式為:

        (15)

        式中:ai∈Rd,bi∈R。假設(shè)共有N個實例(xi,ti)∈Rd×m,網(wǎng)絡(luò)的輸出oj定義為:

        (16)

        式中:j=1,2,…,N。

        (17)

        式中:j=1,2,…,N。式(17)的廣義形式為:

        Hβ=T

        (18)

        (19)

        (20)

        (21)

        式(18)中:H為隱層輸出的矩陣,H的第i列對應(yīng)第i個單元的輸出;x1,x2,…,xN為輸入。h(x)=G(a1,b1,x),G(a2,b2,x),…,G(aL,bL,x)為隱層的特征映射函數(shù)。

        本文將隱層單元的數(shù)量設(shè)為隨機(jī)數(shù),所以通過最小二乘解直接估計權(quán)重向量βi,訓(xùn)練ELM網(wǎng)絡(luò)的目標(biāo)等價于尋找線性系統(tǒng)Hβ=T的最小二乘解βms:

        (22)

        一般情況的隱層單元數(shù)量遠(yuǎn)小于數(shù)據(jù)量,即L<

        βms=H?T

        (23)

        式中:H?表示H的Moore-Penrose廣義逆矩陣。

        在線ELM通過式(23)計算矩陣βms,Moore-Penrose廣義逆矩陣的計算式為:

        H?=(HTH)-1HT

        (24)

        將式(24)代入式(23),矩陣βms變?yōu)椋?/p>

        βms=(HTH)-1HTT

        (25)

        (26)

        (27)

        (28)

        其中:Tk+1和Hk+1定義為:

        (29)

        (30)

        3 在線ELM的學(xué)習(xí)算法

        在線ELM的學(xué)習(xí)程序總結(jié)為以下5個步驟:

        ① 初始化階段。估計時間k的初始化矩陣βk,通過計算協(xié)方差直接估計Rk。

        ④ 在網(wǎng)絡(luò)中傳播狀態(tài)βk和誤差協(xié)方差矩陣。

        ⑤ 校準(zhǔn)網(wǎng)絡(luò)的狀態(tài)βk和誤差協(xié)方差矩陣。

        4 實 驗

        4.1 實驗方法和參數(shù)設(shè)置

        實驗環(huán)境為PC機(jī),Windows 10操作系統(tǒng),Intel Core i5處理器,主頻為3.10 GHz,內(nèi)存為8 GB。編程環(huán)境為MATLAB R2014b。

        選擇6個公開的多元時間序列數(shù)據(jù)集作為本文的benchmark數(shù)據(jù)集,如表1所示。將SinC之外的5個數(shù)據(jù)集屬性值均歸一化為[0,1]區(qū)間,SinC數(shù)據(jù)集的屬性值歸一化為[-1,1]區(qū)間。按照50%、25%和25%的比例將每個數(shù)據(jù)集分別劃分為訓(xùn)練集、驗證集和測試集。

        表1 數(shù)據(jù)集的基本屬性信息

        網(wǎng)絡(luò)的訓(xùn)練程序和測試程序均采用根均方誤差(RMSE)作為評價指標(biāo),其計算式為:

        (31)

        每組參數(shù)的實驗重復(fù)若干次,使實驗結(jié)果的置信度達(dá)到α=0.05。實驗將本文算法的參數(shù)t設(shè)為0.1,μ設(shè)為1(兩個散布矩陣重要性相同),參數(shù)p設(shè)為0.5?;€學(xué)習(xí)機(jī)隱層節(jié)點數(shù)量等于數(shù)據(jù)集的維度。

        4.2 多元時間序列的特征選擇實驗

        采用3個維度較高的時間序列數(shù)據(jù)集Lorentz、Mackey-Glass和Rossler數(shù)據(jù)集驗證本文特征選擇算法的降維效果,選擇幾個支持時間序列特征選擇的算法作為對比方法。對比方法分別為:MODIS[9]、TSD[10]、RHFE[11]、CFAP[12]和FBDST[13]。其中:MODIS采用隨機(jī)森林估計每個特征的重要性得分,再利用Jeffries-Matusita距離度量每個時間序列的類分離性;TSD通過時間序列的特征判別能力將選擇判別能力強的特征子集;RHFE是一種基于直方圖統(tǒng)計的時間序列特征選擇算法;CFAP是一種支持海量數(shù)據(jù)的時間序列特征選擇算法;FBDST是一種基于標(biāo)記符號檢測的時間序列特征選擇算法。

        采用4個分類指標(biāo)評價特征選擇的效果,包括:預(yù)測活動值R2、RMSE、平均絕對誤差(Mean Absolute Error,MAE)和一致性相關(guān)系數(shù)(Concordance Correlation Coefficient,CCC)。

        R2的計算式為:

        (32)

        MAE的計算式為:

        (33)

        式中:n為測試集的樣本數(shù)量。

        CCC的計算式為:

        (34)

        R2和CCC的值越大說明時間序列預(yù)測算法的性能越好,MAE和RMSE的值越小說明性能越好。

        圖2所示為時間序列特征選擇算法提取的特征數(shù)量。可以看出本文算法對于3個時間序列提取的特征數(shù)量均低于其他對比算法。因此,本文基于圖拉普拉斯的特征選擇算法具有較好的降維效果。圖3所示為不同算法對3個時間序列的分類準(zhǔn)確率結(jié)果??梢钥闯觯疚乃惴ǖ腗AE和RMSE值均低于其他5個對比算法,而R2和CCC值均高于其他5個對比算法,說明本文算法的分類性能優(yōu)于其他5個特征選擇算法。綜合特征選擇的實驗結(jié)果可得出結(jié)論:本文算法對時間序列實現(xiàn)了較好的降維效果,并且有助于后續(xù)的分類處理和預(yù)測處理。

        圖2 時間序列特征選擇算法提取的特征數(shù)量

        (a) R2指標(biāo)

        4.3 時間序列的預(yù)測性能實驗

        采用表1的6個時間序列數(shù)據(jù)集驗證本文時間序列預(yù)測算法的預(yù)測效果,選擇5個預(yù)測性能優(yōu)秀的算法作為比較方法,分別為:FS-ELM[9]、OS-ELM[10]、MC-ELM[11]、FDS-ELM[12]和MMA-SLA[13]。FS-ELM將隨機(jī)森林和極限學(xué)習(xí)機(jī)結(jié)合。OS-ELM通過選擇判別能力強的特征,提高極限學(xué)習(xí)機(jī)的效率和泛化性能。MC-ELM引入直方圖建模時間序列的走勢,對噪聲具有較強的魯棒性。FDS-ELM也是一種將特征選擇和極限學(xué)習(xí)機(jī)結(jié)合的算法,增強了極限學(xué)習(xí)機(jī)的效率和泛化性能。對比方法的模型采用對應(yīng)文獻(xiàn)內(nèi)推薦的參數(shù)。

        MMA-SLA對單層前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行了進(jìn)一步的簡化處理,其實驗結(jié)果表明該網(wǎng)絡(luò)對時間序列的預(yù)測效果優(yōu)于許多經(jīng)典的網(wǎng)絡(luò)模型。

        為了觀察激活函數(shù)對極限學(xué)習(xí)機(jī)預(yù)測性能的影響,實驗中極限學(xué)習(xí)機(jī)和MMA-SLA分別在RBF和Sigmod兩種激活函數(shù)的網(wǎng)絡(luò)模型下完成了預(yù)測實驗。圖4所示為時間序列預(yù)測實驗的結(jié)果,本文算法對Istanbul、Lorentz、Mackey-Glass、Rossler和Wine共5種數(shù)據(jù)集的平均預(yù)測誤差均明顯低于其他5種算法,并且兩種激活函數(shù)獲得了相同的結(jié)論。本文算法對于SinC數(shù)據(jù)集的平均預(yù)測誤差和FS-ELM、OS-ELM、FDS-ELM較為接近,SinC數(shù)據(jù)集的維度較低(僅為2),本文算法的特征選擇程序未能發(fā)揮作用。

        (a) RBF激活函數(shù)

        5 結(jié) 語

        為了提高多元時間序列預(yù)測算法的預(yù)測準(zhǔn)確率,提出基于圖拉普拉斯變換和極限學(xué)習(xí)機(jī)的時間序列預(yù)測算法。將標(biāo)記觀察樣本和無標(biāo)記觀察樣本分別構(gòu)建圖拉普拉斯的散布矩陣,再利用圖拉普拉斯相關(guān)理論提取時間序列的特征子集。設(shè)計了新的時間序列在線極限學(xué)習(xí)機(jī),在線學(xué)習(xí)程序通過最小二乘法遞歸地逼近問題最優(yōu)解,從而更新網(wǎng)絡(luò)的輸出權(quán)重。

        本文的特征選擇程序和后續(xù)的極限學(xué)習(xí)機(jī)程序是兩個分離的模塊,未來將研究把特征提取的迭代程序和極限學(xué)習(xí)機(jī)的迭代程序融合,從而提高總體的學(xué)習(xí)速度并降低迭代的次數(shù)。

        猜你喜歡
        拉普拉斯學(xué)習(xí)機(jī)特征選擇
        極限學(xué)習(xí)機(jī)綜述
        基于極限學(xué)習(xí)機(jī)參數(shù)遷移的域適應(yīng)算法
        分層極限學(xué)習(xí)機(jī)在滾動軸承故障診斷中的應(yīng)用
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        基于超拉普拉斯分布的磁化率重建算法
        聯(lián)合互信息水下目標(biāo)特征選擇算法
        位移性在拉普拉斯變換中的應(yīng)用
        含有一個參數(shù)的p-拉普拉斯方程正解的存在性
        一種基于AdaBoost的極限學(xué)習(xí)機(jī)分類方法
        基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
        精品无码人妻夜人多侵犯18| 极品新婚夜少妇真紧| 男人边吃奶边做好爽免费视频| 国精产品一区二区三区| 久草热这里只有精品在线| 少妇人妻中文字幕在线| 国产精品亚洲av无人区一区香蕉| 18禁裸男晨勃露j毛网站| 国模冰莲自慰肥美胞极品人体图 | 在线视频一区色| 欧美自拍丝袜亚洲| 午夜香蕉av一区二区三区| 国产一区二区三区我不卡 | 在线播放免费人成毛片乱码| 亚洲欧美日韩精品久久亚洲区| 另类专区欧美在线亚洲免费| 日韩丝袜人妻中文字幕| av在线免费高清观看| 18禁黄污吃奶免费看网站| 欧美精品免费观看二区| 日本人妻少妇精品视频专区| 手机av男人天堂免费网址| 狠狠爱婷婷网五月天久久| 亚洲中字慕日产2020| 国产高清视频91| 国产精品av网站在线| 久久精品亚洲成在人线av乱码| 人妻洗澡被强公日日澡电影| 国产第19页精品| 国产精品入口蜜桃人妻| 中文字幕一区二区va| 亚洲色图视频在线免费看| 国产精品一区二区无线| 精品国产一区二区三区19| 自拍视频在线观看成人| 国产精品一区二区三区卡| 四川老熟妇乱子xx性bbw| 精品国产性色av网站| 国产一品二品三区在线观看| 国产永久免费高清在线| 伊人色综合久久天天人手人停|