亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

改進(jìn)的極小極大概率終端學(xué)習(xí)機(jī)

2022-08-22 07:44:44李曉萌代永瀟范麗亞

聊城大學(xué)學(xué)報(bào)(自然科學(xué)版) 2022年4期

李曉萌代永瀟范麗亞

(聊城大學(xué) 數(shù)學(xué)科學(xué)學(xué)院，山東聊城 252059)

0 引言

近年來，由Huang等人[1，2]提出的終端學(xué)習(xí)機(jī)(Extreme Learning Machine，ELM)受到學(xué)者們的廣泛關(guān)注并不斷加以改進(jìn)。2017 年，受孿生支持向量機(jī)(Twin Support Vector Machine，TSVM)[3]的啟發(fā)，Wan等人[4]提出了優(yōu)化約束較少分類性能較好的孿生ELM(Twin Extreme Learning Machine，TELM)。2020年，Yang等人[5]提出了正則化ELM 套袋模型用于南海熱帶氣旋軌道預(yù)測。2021年，Yang等人[6]提出了用于網(wǎng)絡(luò)釣魚檢測的非逆矩陣在線序列ELM，該算法避免了矩陣的反演操作，并引入了在線序列ELM 的思想來更新訓(xùn)練模型。同年，Li等人[7]提出了混合數(shù)據(jù)徑向基函數(shù)ELM 算法，實(shí)現(xiàn)了對(duì)混合數(shù)據(jù)直接、快速、有效的分類，Ouyang[8]提出了基于ELM 的改進(jìn)自動(dòng)編碼器結(jié)構(gòu)，通過利用低秩矩陣分解來學(xué)習(xí)最優(yōu)低秩特征，Subudhi等人[9]提出了利用ELM 結(jié)合優(yōu)化技術(shù)對(duì)電力功率質(zhì)量自動(dòng)分類。

針對(duì)數(shù)據(jù)分類，極大極小概率機(jī)(Minimax Probability Machine，MPM)[10]是指將最大錯(cuò)分率的概率最小化，是利用樣本的均值和方差來尋找分類超曲(平)面。MPM 模型常被表述為一個(gè)二階錐規(guī)劃(SOCPs)，通過內(nèi)點(diǎn)算法進(jìn)行求解，如SeDu Mi[11]。近年來，MPM 得到了廣泛的應(yīng)用，2014年，Yoshiyama等人[12]提出了拉普拉斯MPM(Laplacian MPM)，將MPM 拓展到了半監(jiān)督問題。2019年，Maldonado等人[13]提出了正則化MPM(Regularized MPM)，降低了獲得不穩(wěn)定估計(jì)量的風(fēng)險(xiǎn)，提高了算法的泛化能力。2020年，He等人[14]提出了基于加權(quán)增量MPM 的汽油混合過程質(zhì)量預(yù)測方法，Song等人[15]利用最小誤差MPM 提出了新的奇偶校驗(yàn)空間故障隔離方法，Maldonado等人[16]提出了利用MPM 預(yù)測利潤流失的方法，該方法最大限度地提高目標(biāo)函數(shù)中的保留活動(dòng)的利潤。

2019年，Yang等人[17]將ELM 與MPM 結(jié)合，提出了極小極大概率終端學(xué)習(xí)機(jī)(Minimax Probability Extreme Learning Machine，MPME)框架用于模式識(shí)別，2020 年又提出了孿生MPM(Twin MPM，TWMPM)[18]用于模式分類。同年，Ma等人[19]也提出了孿生極小極大概率分類機(jī)(Twin Minimax Probability Machine Classification，TMPMC)。2020 年，Ma等人[20]還提出了孿生極小極大概率終端學(xué)習(xí)機(jī)(Twin Minimax Probability Extreme Learning Machine，TMPELM)用于模式識(shí)別。

由于在求解二階錐規(guī)劃問題的內(nèi)點(diǎn)算法中，初始點(diǎn)要受到嚴(yán)格可行的限制，而在實(shí)際的問題中有時(shí)候難以找到嚴(yán)格可行點(diǎn)。本文在文獻(xiàn)[10，13，17，20]的基礎(chǔ)上，改進(jìn)了MPM，MPME和TMPELM 算法的理論推導(dǎo)方法，將算法模型從二階錐規(guī)劃轉(zhuǎn)化為凸二次規(guī)劃，避免了初始點(diǎn)嚴(yán)格可行的限制，提出了改進(jìn)的TMPELM，MPM 和MPELM 算法，并進(jìn)行了對(duì)比實(shí)驗(yàn)。本文針對(duì)線性不可分?jǐn)?shù)據(jù)集Rd×{±1}，其中正類樣本m1個(gè)，負(fù)類樣本m2個(gè)，且m ＝m1＋m2。用I1＝{i∈{1，…，m}:y i ＝1} 和I2＝{i∈{1，…，m}:y i ＝－1} 分別表示正負(fù)類樣本的下標(biāo)集。利用核函數(shù)k:Rd ×Rd→R(H是其RKHS，φ:Rd→H是對(duì)應(yīng)的特征映射)可將數(shù)據(jù)集T轉(zhuǎn)化為映射數(shù)據(jù)集

1 預(yù)備知識(shí)

本節(jié)簡要回顧非線性RELM 算法和非線性TELM 算法，詳細(xì)內(nèi)容見文獻(xiàn)[2，4]。為表述方便，設(shè)l＝dim(H)(即H＝Rl)，其中l(wèi)為充分大的正整數(shù)。將特征映射φ(·)表示為φ(·)＝(φ1(·)，…，φl(·))T。其中φt(·):Rd→R，記φtk:R→R。

1.1 RELM 算法

取隱層神經(jīng)元個(gè)數(shù)為l，并設(shè)βt∈R是第t個(gè)隱層神經(jīng)元到輸出層(只有1個(gè)神經(jīng)元)的權(quán)向量。和y i分別表示樣本x i的網(wǎng)絡(luò)輸出和真實(shí)輸出。記，則XTβ∈Rm?？紤]下面的二次規(guī)劃模型

式中c＞0為調(diào)節(jié)參數(shù)。由于H＝span{φ(x1)，…，φ(x m)}且β＝[β1，…，βl]T∈Rl，故存在系數(shù)向量α∈Rm使得β＝χα，于是，模型(1)可轉(zhuǎn)化為

式中K ＝XTX∈Rm×m為核陣。令dF(α)/dα ＝0，可得

下面給出具體算法。

算法1(RELM)

步2 選擇適當(dāng)?shù)暮撕瘮?shù)和核參數(shù)；

步3 利用(3)式，計(jì)算系數(shù)向量α*；

步4 對(duì)任一輸入樣本∈Rd，其RELM 輸出為*∈R，其中x m)]。

1.2 TELM 算法

設(shè)輸出層有2個(gè)神經(jīng)元，一個(gè)是正類神經(jīng)元，一個(gè)是負(fù)類神經(jīng)元，并設(shè)β1t，β2t∈R分別是第t個(gè)隱層神經(jīng)元到正類神經(jīng)元和負(fù)類神經(jīng)元的權(quán)向量。TELM 是通過考慮下面兩個(gè)二次規(guī)劃模型

來尋找一對(duì)非線性超曲面f1(x)＝h(x)Tβ1＝0和f2(x)＝h(x)Tβ2＝0，使得一個(gè)超曲面距離一類樣本盡可能近，同時(shí)排斥另一類樣本盡可能遠(yuǎn)，其中c1，c2＞0是模型參數(shù)，h(x)是隱層神經(jīng)元的輸出向量。

記β1＝[β11，…，β1l]T，β2＝[β21，…，β2l]T∈Rl，則存在系數(shù)向量θ1＝(θ11，…，θ1m)T，θ2＝(θ21，…，θ2m)T∈Rm，使得β1＝Xθ1，β2＝Xθ2，其中K x ＝[k(x，x1)，…，k(x，x m)]∈R1×m，于是，模型(4)和(5)可分別轉(zhuǎn)化為

考慮模型(6)和(7)的Lagrange函數(shù)

并令?L1/?θ1＝?L1/?ξ ＝0和?L2/?θ2＝?L2/?η ＝0，可得

于是，模型(6)和(7)的Wolfe對(duì)偶形式分別為

式中P＝K(B，X)[K(A，X)TK(A，X)]－1K(B，X)T，Q＝K(A，X)[K(B，X)TK(B，X)]－1K(A，X)T，α1∈Rm2，α2∈Rm1為Lagrange乘子向量。下面給出具體算法。

算法2(TELM)

步1 給定數(shù)據(jù)集T ＝{(x i，y i)}mi＝1∈Rd×{±1}，選擇合適的模型參數(shù)c1，c2＞0和正則化參數(shù)；

步2 擇適當(dāng)?shù)暮撕瘮?shù)和核參數(shù)；

步3 分別求解對(duì)偶模型(9)和(10)，得最優(yōu)解α*1∈Rm2，α*2∈Rm1；

步4 利用(8)式計(jì)算系數(shù)向量θ*1，θ*2，其中α1＝α*1，α2＝α*2；

步5 構(gòu)造分類決策函數(shù)f1(x)＝K xθ*1和f2(x)＝K xθ*2；

步6 對(duì)任一輸入樣本~x∈Rd，其類標(biāo)簽可判斷為

2 極小極大概率機(jī)(MPM)

本節(jié)利用凸二次規(guī)劃的Wolfe形式對(duì)原始MPM 算法進(jìn)行改進(jìn)，并提出新的MPM 算法。

設(shè)φ(x＋)～(μ1，Σ1)∈Rl，φ(x－)～(μ2，Σ2)∈Rl是兩個(gè)隨機(jī)向量，其樣本取值分別為φ(x＋)∈Rl和φ(x－)∈Rl。記

來尋找分類超曲面f(x)＝wTφ(x)＋b＝0，使得兩個(gè)隨機(jī)向量的樣本取值分列超曲面兩側(cè)的最小概率(用概率的下確界表示)越大越好，其中w∈Rl，b∈R，α∈(0，1)。

引理1[21]設(shè)x ～(μ，Σx)是隨機(jī)向量。給定w∈Rd{0}，b∈R和α∈(0，1)使得wTμ≤b，則

推論1[21]設(shè)x ～(μ，Σx)是隨機(jī)向量。若存在w∈Rd{0}，b∈R和α∈[0，1)使得wTμ ＋b≥0，則，其中k(α)＝ α/(1－α)＞0。

由引理1和推論1，模型(11)可轉(zhuǎn)化為

模型(12)可用SeDu Mi算法進(jìn)行求解，詳細(xì)內(nèi)容見[10]。本文提供另一種思路和新的算法。

首先，將模型(12)等價(jià)地轉(zhuǎn)化為

由于w∈Rl，故存在系數(shù)向量β＝[β1，…，βm]T∈Rm使得w ＝Xβ。記

則分類超曲面和模型(13)可分別轉(zhuǎn)化為f(x)＝K xβ＋b＝0和

式中K x ＝[k(x，x1)，…，k(x，x m)]∈R1×m?？紤]模型(14)的Lagrange函數(shù)

并令?L/?β＝?L/?b＝0，可得Qβ＋(U1－U2)T(α－γ)T＝0，其中，α＝α1＝α2。不妨設(shè)矩陣Q非奇異(否則，將其正則化)，則有

根據(jù)模型(14)的約束，可取

于是，模型(14)的Wolfe對(duì)偶形式為

下面給出具體算法。

算法3(MPM)

步1 給定數(shù)據(jù)集T ＝{(x i，y i)}im＝1∈Rd×{±1} ，選擇合適的正則化參數(shù)t＞0；

步2 選擇適當(dāng)?shù)暮撕瘮?shù)和核參數(shù)；

步3 計(jì)算均值向量(μ1，μ2)和協(xié)方差矩陣(Σ1，Σ2)；

步4 求解模型(17)，得最優(yōu)解u*∈R；

步5 分別利用(15)式和(16)式計(jì)算系數(shù)向量β*∈Rm和閾值b*∈R，其中u＝u*；

步6 構(gòu)造分類決策函數(shù)f(x)＝K xβ*＋b*；

步7 對(duì)任一輸入樣本∈Rd，其類標(biāo)簽可判斷為

3 極小極大概率終端學(xué)習(xí)機(jī)(MPLEM)

類似于第2節(jié)，本節(jié)利用凸二次規(guī)劃的Wolfe形式對(duì)原始MPLEM 算法進(jìn)行改進(jìn)，并提出新的MPLEM 算法。本文縮寫符號(hào)均同第2節(jié)。不同于MPM，原始MPLEM 算法是通過下面的優(yōu)化模型來尋找分類超曲面f(x)＝wTX＝0使得兩類樣本分列其兩側(cè)的最小概率越大越好，且真實(shí)輸出與網(wǎng)絡(luò)輸出的誤差越小越好，其中X＝[φ1(x)，…，φl(x)]T∈Rl，α∈(0，1)，c＞0是模型參數(shù)。由引理1和推論1，模型(18)可轉(zhuǎn)化為

模型(19)可用SeDu Mi算法進(jìn)行求解，詳細(xì)內(nèi)容見[15]。本文提供另一種思路和新的算法。

首先，將模型(19)等價(jià)地轉(zhuǎn)化為

式中y＝Xw為網(wǎng)絡(luò)輸出。由于w∈Rl，故存在系數(shù)向量β＝[β1，…，βm]T∈Rm使得w＝Xβ。則分類超曲面和模型(20)可分別轉(zhuǎn)化為f(x)＝K xβ＝0和

式中K x ＝[k(x，x1)，…，k(x，x m)]∈R1×m。記

考慮模型(21)的Lagrange函數(shù)

令?L/?β＝0，可得

通過求解模型(21)的Wolfe對(duì)偶模型

可得最優(yōu)解u*，代入(22)式可得β*，下面給出具體算法。

算法4(MPELM)

步1 給定數(shù)據(jù)集T ＝{(x i，y i)}im＝1∈Rd×{±1}，選擇合適的正則化參數(shù)t＞0；

步2 選擇適當(dāng)?shù)暮撕瘮?shù)和核參數(shù)；

步3 計(jì)算均值向量(μ1，μ2)和協(xié)方差矩陣(Σ1，Σ2)；

步4 求解模型(23)，得最優(yōu)解u*∈R3；

步5 利用(22)式計(jì)算系數(shù)向量β*，其中u＝u*；

步6 構(gòu)造分類決策函數(shù)f(x)＝K xβ*；

步7 對(duì)任意一輸入樣本∈Rd，其類標(biāo)簽可判斷為

4 孿生極小極大概率終端學(xué)習(xí)機(jī)(TMPELM)

本節(jié)在第3節(jié)的基礎(chǔ)上進(jìn)一步改進(jìn)原始TMPLEM 算法，并提出新的TMPLEM 算法。

原始TMPELM 算法是通過如下優(yōu)化模型

來尋找正類超曲面f1(x)＝wT1φ(x)＝0和負(fù)類超曲面f2(x)＝wT2φ(x)＝0，其中w1，w2∈Rl表示超曲面的法向量，c1，c2＞0是模型參數(shù)，使得正類(負(fù)類)樣本位于正類(負(fù)類)超平面之上(下)的最小概率越大越好，同時(shí)排斥負(fù)類(正類)樣本越遠(yuǎn)越好。同第2節(jié)相似，類似于第3節(jié)，模型(24)和模型(25)可用Se-Du Mi算法進(jìn)行求解。詳細(xì)內(nèi)容見[20]。本文提供另一種思路和新的算法。

根據(jù)引理1和推論1，可將模型(26)和模型(27)分別轉(zhuǎn)化為

其次，采用第3節(jié)的方法，將模型(28)和模型(29)轉(zhuǎn)化為凸二次規(guī)劃模型

由于w1，w2∈H，存在系數(shù)向量θ1＝[θ11，…，θ1m]T，θ2＝[θ21，…，θ2m]T∈Rm使得w1＝φ(X)θ1，w2＝φ(X)θ2。于是，分類超曲面，模型(30)和模型(31)可分別轉(zhuǎn)化為f1(x)＝K xθ1＝0，f2(x)＝K xθ2＝0和

式中K x ＝[k(x，x1)，…，k(x，x m)]∈R1×m，Q1＝m－11K(A，X)TP1K(A，X)，Q2＝m－12K(B，X)TP2K(B，X)。記

式中，I m1∈Rm1×m1，I m2∈Rm2×m2為單位矩陣。分別考慮模型(32)和模型(33)的Lagrange函數(shù)

并分別令?L1/?θ1＝0和?L2/?θ2＝0可得

進(jìn)而得模型(32)和模型(33)的Wolfe對(duì)偶形式

下面給出具體算法。

算法5(TMPELM)

步2 選擇適當(dāng)?shù)暮撕瘮?shù)和核參數(shù)；

步3 計(jì)算均值向量(μ1，μ2)，協(xié)方差矩陣(Σ1，Σ2)和矩陣G1，G2，D1，D2；

步4 求解模型(35)和模型(36)，分別得最優(yōu)解u*1∈Rm2＋1，u*2∈Rm1＋1；

步5 利用(34)式計(jì)算系數(shù)向量θ*1，θ*2，其中u1＝u*1，u2＝u*2；

步6 構(gòu)造分類決策函數(shù)f1(x)＝K xθ*1和f2(x)＝K xθ*2；

步7 對(duì)任一輸入樣本~x∈Rd，其類標(biāo)簽可判斷為

5 實(shí)驗(yàn)與結(jié)果分析

本節(jié)將文中提出的MPM 算法，MPELM 算法和TMPELM 算法分別與原始的MPM 算法[10，13]，MPELM 算法[17]和TMPELM 算法[20]進(jìn)行準(zhǔn)確度、標(biāo)準(zhǔn)差和運(yùn)行時(shí)間的對(duì)比實(shí)驗(yàn)。采用的部分?jǐn)?shù)據(jù)集與運(yùn)算開銷同原始算法，使用十折交叉驗(yàn)證法并重復(fù)五次，分別取線性核和RBF核。所涉及的參數(shù)均使用網(wǎng)格搜索并取最優(yōu)結(jié)果，搜索范圍為10－3～103。實(shí)驗(yàn)結(jié)果分別見表1～3，其中ACC，S和T分別表示分類準(zhǔn)確度，標(biāo)準(zhǔn)差和運(yùn)行時(shí)間。為直觀起見，同時(shí)提供了準(zhǔn)確度對(duì)比柱狀圖。

表1 MPM 算法準(zhǔn)確度對(duì)比實(shí)驗(yàn)結(jié)果(原始MPM 算法只提供了準(zhǔn)確度實(shí)驗(yàn)結(jié)果)

圖1 MPM 算法準(zhǔn)確度對(duì)比柱狀圖

從表1中可以看出，本文算法在線性核下有六個(gè)優(yōu)于原始算法，在RBF核下有六個(gè)優(yōu)于原始算法。

圖2 MPELM 算法準(zhǔn)確度對(duì)比柱狀圖

從表2中可以看出，本文算法有五個(gè)優(yōu)于原始算法，尤其在數(shù)據(jù)集Pima，Spam 和Australian上準(zhǔn)確度有顯著提升，較原始算法分別提高了15.18%，11.59%和17.79%。

表2 MPELM 算法準(zhǔn)確度對(duì)比實(shí)驗(yàn)結(jié)果(原始MPELM算法只提供了線性核下的準(zhǔn)確度實(shí)驗(yàn)結(jié)果)

圖3 TMPELM 算法準(zhǔn)確度對(duì)比柱狀圖

從表3中可以看出，本文算法在線性核和RBF 核下均有七個(gè)優(yōu)于原始算法，其中在數(shù)據(jù)集Banknote和Diabetes上準(zhǔn)確度有顯著提升，線性核下提升了11.25%和17.10%，RBF核下提升了9.87%和8.15%。綜上所述，本文所提算法是有效的且具有可競爭性。

表3 TMPELM 算法準(zhǔn)確度、標(biāo)準(zhǔn)差、運(yùn)行時(shí)間對(duì)比實(shí)驗(yàn)結(jié)果

6 結(jié)論

針對(duì)二分類問題，MPELM 具有MPM 和ELM 的優(yōu)點(diǎn)，但與之不同的是，MPELM 可以提供泛化誤差的明確上界，這提供了一個(gè)分類精度的可靠性度量，且決策變量比MPM 和SVM 少。目前，MPM 算法，MPELM 算法和TMPELM 算法主要是通過求解二階錐規(guī)劃模型的內(nèi)點(diǎn)算法實(shí)現(xiàn)，該算法初始點(diǎn)要受到嚴(yán)格可行的限制，在實(shí)際問題中有時(shí)難以找到嚴(yán)格可行點(diǎn)。本文利用支持向量機(jī)思想和凸二次規(guī)劃的Wolfe對(duì)偶形式，對(duì)已有的MPM 算法，MPELM 算法和TMPELM 算法進(jìn)行了改進(jìn)，避免了尋找嚴(yán)格可行點(diǎn)，并提出了三個(gè)新算法。實(shí)驗(yàn)結(jié)果表明，本文所提算法是有效和可競爭的。在本文的基礎(chǔ)上，可進(jìn)一研究MPM 算法與其他形式的ELM 算法的有效結(jié)合，以期提高數(shù)據(jù)集的分類準(zhǔn)確度，并將研究成果應(yīng)用于信息的加密與解密領(lǐng)域。