周云龍,顧楊楊
(東北電力大學(xué)能源與動(dòng)力工程學(xué)院,吉林吉林132012)
氣液兩相流廣泛的存在于工程和自然界中,與人類的生活和生產(chǎn)密切相關(guān)。目前,在化工、石油、能源、冶金、環(huán)保和輕工等行業(yè)的許多生產(chǎn)設(shè)備中都涉及兩相流工況,而兩相流學(xué)科是以兩相流系統(tǒng)為研究對象,與數(shù)學(xué)、力學(xué)、信息、生物、環(huán)境、材料和電子計(jì)算機(jī)等學(xué)科相互融合交叉而逐步形成和發(fā)展起來的一門新興交叉學(xué)科[1]。流型的識(shí)別一直是兩相流研究的重中之重。傳統(tǒng)的流型識(shí)別方法一般分為兩類:一是直接法即根據(jù)兩相流流動(dòng)圖像的形式直接確定流型;二是間接法即是通過對反應(yīng)流型特性的參數(shù)進(jìn)行特征提取,后通過其他的識(shí)別系統(tǒng)以達(dá)到流型識(shí)別的目的。在文獻(xiàn)[2]中將獨(dú)立分量分析的方法應(yīng)用于故障診斷的特征提取中,但并沒有將其應(yīng)用于流型識(shí)別中。本文的創(chuàng)新點(diǎn)在于首次將獨(dú)立分量分析法應(yīng)用于流型識(shí)別的特征提取過程中。
近年來,信息技術(shù)和測量技術(shù)的快速發(fā)展為氣液兩相流的智能識(shí)別提供了重要的技術(shù)手段。而神經(jīng)網(wǎng)絡(luò)[3]的發(fā)展作為一種智能的識(shí)別技術(shù)已經(jīng)在流型識(shí)別的過程中得到了廣泛的應(yīng)用,應(yīng)用的主要形式集中在BP、RBF神經(jīng)網(wǎng)絡(luò)[4]上。但是,由于神經(jīng)網(wǎng)絡(luò)往往存在過學(xué)習(xí)的問題,產(chǎn)生的模型有時(shí)也會(huì)產(chǎn)生過度擬合,或擬合程度較差的現(xiàn)象,而支持向量機(jī)恰好可以彌補(bǔ)這個(gè)不足。支持向量機(jī)(Support Vector Machine,SVM)是AT&Be ll實(shí)驗(yàn)室Vapnik V針對分類和回歸問題(Classification and Recognition)提出的[5],此方法一經(jīng)提出就得到了廣泛的關(guān)注,并成功的應(yīng)用于多個(gè)領(lǐng)域。在本文中將獨(dú)立分量分析技術(shù)與支持向量機(jī)相結(jié)合,由此提出了一種新的流型識(shí)別方法,經(jīng)試驗(yàn)證明該方法可以很好的識(shí)別出泡狀流、間歇流、分層流和環(huán)狀流這四種流型,具有很好的識(shí)別準(zhǔn)確率,可以滿足工程要求,為流型的識(shí)別提供了一種新的技術(shù)手段。
獨(dú)立分量分析(Independent Component Analysis,ICA)是近幾年發(fā)展起來的一種新的信號(hào)處理技術(shù)[6],它是盲源分離技術(shù)的一種延伸。ICA算法的基本思路是:從多個(gè)未知的源信號(hào)的線性混合信號(hào)中分離出相對獨(dú)立的源信號(hào)。
由圖1可知[7],ICA算法的目標(biāo)是尋找一個(gè)矩陣B(n*m),使得經(jīng)過y=B*x后得到的各個(gè)獨(dú)立分量之間沒有相關(guān)性,即盡可能的相互獨(dú)立,這時(shí)的y可以看作是對源信號(hào)的最優(yōu)逼近。在進(jìn)行此方法的時(shí)候一般需要進(jìn)行如下假設(shè)[8]:
(1)m=n,觀測到的信號(hào)個(gè)數(shù)與源信號(hào)個(gè)數(shù)相同,解混矩陣為方陣;
圖1 ICA的混合-解混過程簡圖
(2)s中最多只包含一個(gè)高斯分量;
(3)假設(shè)模型無噪聲;
(4)矩陣A是非奇異的。
由于負(fù)熵作為高斯性度量的效果比累積量更具優(yōu)越性,因此本文采用基于負(fù)熵的FastICA算法對流型進(jìn)行特征提取[9]。
1.2.1 數(shù)據(jù)的白化處理
首先對收集到的四種流型的壓差波動(dòng)信號(hào)進(jìn)行處理,使其具有零均值、單位方差,其具體的步驟如下:
(1)將源信號(hào)S(t)去均值:
(2)根據(jù)圖1中的過程對數(shù)據(jù)進(jìn)行球化:
或簡記作:
式中:A是M*N混合矩陣。
(3)在解混過程中可以分為兩步,第一步先把觀察矢量x(t)經(jīng)線性系統(tǒng)W變換成中間輸出z(t);第二步再把z(t)變換成y(t)[10]。要求z(t)中各分量均經(jīng)過正交歸一化(即互相正交而且方差都等于1):
稱這一步為“球化”(sphering)[11],得到的z(t)就是可以滿足零均值和單位方差的數(shù)據(jù)。
計(jì)算標(biāo)準(zhǔn)差:
1.2.2 負(fù)熵的引入
熵可以用于定義一種非高斯性度量??梢院唵蔚貜奈⒎朱氐贸鲆环N度量,稱為負(fù)熵[12],它對高斯變量是零,并且永遠(yuǎn)是非負(fù)的。負(fù)熵J的定義如下:
式中:xgauss是和x具有相同的協(xié)方差矩陣∑的某個(gè)高斯隨機(jī)變量。它的熵可以計(jì)算出來,即
式中:n是x的維數(shù)。
負(fù)熵的一個(gè)重要性質(zhì)是:對于可逆的線性變換保持不變。在ICA中,該性質(zhì)使得可以將邊緣負(fù)熵J(Yi)作為代價(jià)函數(shù),然后尋找線性變換W使其最大化。這就導(dǎo)致了ICA算法中負(fù)熵判據(jù)的有效性。在本文中輸出量y基于高階矩表示最大熵準(zhǔn)則估計(jì)法的形式是:
其中,m是具有零均值和單位方差的高斯變量,函數(shù)Fi(·)為非二次函數(shù),而其選擇的形式通常有以下三種:
常數(shù)a1的取值范圍是1≤a1≤2,通常取1?;谪?fù)熵的快速不動(dòng)點(diǎn)算法的原理是尋找一種使非高斯性可以達(dá)到最大值的不動(dòng)點(diǎn)迭代方法,W為輸入向量z的權(quán)矢量。在進(jìn)行迭代算法時(shí)選擇F(u)=log cos u,它的導(dǎo)數(shù)f(y)=tanhy,初始迭代為w=E[zf(wTz)],但未達(dá)到理想的收斂條件,對其進(jìn)行調(diào)整:
進(jìn)行歸一化:
由于數(shù)據(jù)已經(jīng)是經(jīng)過白化后的數(shù)據(jù),因此采用牛頓迭代法進(jìn)行求解,得到基于負(fù)熵的快速不動(dòng)點(diǎn)ICA算法的迭代公式:
1.2.3 算法步驟
(1)將X去均值;
(2)對數(shù)據(jù)進(jìn)行球化處理得到Z;
(3)任意選擇wi的初值wi(0),并要求初值滿足條件:wi(0)2=1;
(6)如果未收斂返回(4);否則結(jié)束。
經(jīng)過以上步驟后分別以流型的歸一化數(shù)據(jù)、球化數(shù)據(jù)、標(biāo)準(zhǔn)差以及獨(dú)立分量這四個(gè)參數(shù)作為神經(jīng)網(wǎng)絡(luò)的樣本輸出到RBF神經(jīng)網(wǎng)絡(luò)中進(jìn)行流型的識(shí)別。
支持向量機(jī)(Support Vector Machine,簡稱SVM)[13]是統(tǒng)計(jì)學(xué)研究中最實(shí)用的部分。直到1992-1995年間它的主要內(nèi)容才基本完成,目前仍處于發(fā)展階段。支持向量機(jī)的基本思想可以簡單的理解為:首先通過內(nèi)積(核)函數(shù)將輸入空間變換到一個(gè)高維的空間中;然后在新空間中尋找最優(yōu)線性分類超平面即可。支持向量機(jī)求得的分類函數(shù)類似于神經(jīng)網(wǎng)絡(luò),其輸出是由若干個(gè)中間層節(jié)點(diǎn)的線性組合,而每一個(gè)中間層節(jié)點(diǎn)對應(yīng)于輸入樣本與一個(gè)支持向量的內(nèi)積,因此也可以稱之為支持向量網(wǎng)絡(luò),見圖2[14]。
圖2 支持向量機(jī)示意圖
首先用一個(gè)非線性映射 φ(x)=[φ1(x),…,φN(x)],把輸入數(shù)據(jù)從原始空間映射到N維特征空間,在特征空間構(gòu)造最優(yōu)分類超平面見圖3,尋找最大的距離使分類間距最大的優(yōu)化問題表示為:
的約束條件為求(13)式的最小值為:
該問題可以利用拉格朗日乘子方法將其轉(zhuǎn)化為對偶問題來解決,即在:
的約束條件下求:
對于標(biāo)準(zhǔn)的支持向量機(jī)他的優(yōu)化問題是:
圖3 最優(yōu)分類面
對獨(dú)立分量分析提取出的特征參數(shù)x進(jìn)行歸一化處理:
經(jīng)過歸一化后使數(shù)據(jù)位于[0,1]的范圍內(nèi)。令“+1”表示“有”,“-1”表示“無”。
支持向量機(jī)的成功取決于兩個(gè)方面:第一項(xiàng)是最優(yōu)分界面;第二項(xiàng)就是核函數(shù),這也是一個(gè)很受歡迎的研究領(lǐng)域。常用的滿足Mercer條件[15]的核函數(shù)主要有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基(RBF)核函數(shù)和Sigmoid函數(shù)等,當(dāng)選擇不同的核函數(shù)時(shí)就可以產(chǎn)生不同的支持向量機(jī)。他們的函數(shù)形式可以表示如下:
式中:v,r均d為核參數(shù)。
其中的RBF核函數(shù)[16](也稱為高斯核函數(shù))較為常用,可以將其定義為空間中任一點(diǎn)Xi到某一中心Xj之間歐式距離的單調(diào)函數(shù)。因此在本文中選擇了較常用的RBF核函數(shù),構(gòu)造的支持向量機(jī)判別函數(shù)是:
其中,s是支持矢量xi可確定徑向基函數(shù)的中心,s是中心的數(shù)目。
本文中將獨(dú)立分量分析技術(shù)與支持向量機(jī)相結(jié)合形成了一種新的組合式的分類器,首先用ICA法對數(shù)據(jù)進(jìn)行處理,提取出獨(dú)立的分量作為特征參數(shù),并建立學(xué)習(xí)樣本作為分類器的輸入,再利用支持向量機(jī)建立分類模型[17],以完成分類的目的。其具體步驟可以描述為以下三個(gè)方面:
(1)特征參數(shù)提取;
(2)建立分類模型;
(3)進(jìn)行分類預(yù)測;
(4)輸出結(jié)果及精度。
在實(shí)驗(yàn)中分別應(yīng)用了分層流、環(huán)狀流、泡狀流和間歇流四種流型參數(shù),應(yīng)用獨(dú)立分量分析法提取出流型的特征參數(shù)。選擇400個(gè)特征參數(shù)作為訓(xùn)練樣本,同時(shí)選取120個(gè)樣本作為測試樣本。支持向量機(jī)(SVM)的訓(xùn)練時(shí)間為0.35 s,分類時(shí)間是0.03 s。正確識(shí)別樣本數(shù)為116個(gè),其中分層流1個(gè)、環(huán)狀流0個(gè)、泡狀流1個(gè)以及間歇流2個(gè)。部分?jǐn)?shù)據(jù)的實(shí)驗(yàn)結(jié)果見表1。如果想適合在線識(shí)別,則應(yīng)考慮提高計(jì)算機(jī)的性能,以降低支持向量機(jī)(SVM)的訓(xùn)練時(shí)間和測試時(shí)間。
表1 SVM的部分樣本
流型誤識(shí)別的原因可以歸結(jié)為以下三點(diǎn):(1)訓(xùn)練樣本數(shù)目少,可能會(huì)由于重要特征點(diǎn)的缺失對識(shí)別的準(zhǔn)確率產(chǎn)生影響;(2)間歇流參數(shù)在較大的范圍,易與其他流型產(chǎn)生交叉,因此特征識(shí)別率較低;(3)試驗(yàn)中各元件的允許誤差疊加產(chǎn)生誤差積累,因此流型數(shù)據(jù)在測試的時(shí)候已經(jīng)收到了污染,使識(shí)別結(jié)果產(chǎn)生誤識(shí)別。但是本文的識(shí)別率已經(jīng)可以達(dá)到工程要求,具有一定的工程使用價(jià)值。
(1)將獨(dú)立分量分析法應(yīng)用于流型的特征提取是行之有效的,經(jīng)過此方法可以得到流型信號(hào)的獨(dú)立特征,由于參數(shù)的相關(guān)性較小,因此更能準(zhǔn)確的表現(xiàn)出流型的原狀態(tài)。
(2)應(yīng)用獨(dú)立分量分析與支持向量機(jī)相結(jié)合的氣液兩相流流型識(shí)別方法可以避免局部極小問題的出現(xiàn),此方法可以達(dá)到較好的流型識(shí)別效果,為流型的識(shí)別提供了一種新的、可靠的依據(jù)。
[1]周云龍,孫斌,陳飛.氣液兩相流智能識(shí)別理論及方法[M].北京:科學(xué)出版社,2007.
[2]姚福斌,王兆霞.獨(dú)立分量分析與神經(jīng)網(wǎng)絡(luò)在電力系統(tǒng)故障檢測中的應(yīng)用研究[D].天津:天津理工大學(xué),2008.
[3]朱大奇,朱慧.人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用[M].北京:科學(xué)出版社,2006.
[4]張德豐,周品,胡麗華.MATLAB程序設(shè)計(jì)與典型應(yīng)用[M].北京:電子工業(yè)出版社,2009.
[5]許建華,張學(xué)工,李衍達(dá).支持向量機(jī)的新發(fā)展[J].控制與決策,2004,1(5):481-484.
[6]楊福生,洪波.獨(dú)立分量分析的原理與應(yīng)用[M].北京:清華大學(xué)出版社,2004.
[7]Lee T W et al.Independent Component Analysis using an extended infomax algorithm for mixed sub-Gaussian and super-Gaussian sources[J].Neural Computation,1999,11(4):417-441.
[8]楊世錫,焦衛(wèi)東,吳昭同.基于獨(dú)立分量分析特征提取的復(fù)合神經(jīng)網(wǎng)絡(luò)故障診斷法[J].振動(dòng)工程學(xué)報(bào),2004,14(4):66-70.
[9]申麗言,方斌,沈毅.基于負(fù)熵極大的獨(dú)立分量分析方法[J].中北大學(xué)學(xué)報(bào),2005,2(6):396-399.
[10]A.Hyvarinen and E.Oja.A fast fixed-point algorithm for independent component analysis[J].Neural Computation,1997,9(7):1483-1492.
[11]A.Hyvarinen.Fast and robust fixed-point algorithm for independent component analysis[J].IEEE Transactions on Neural Network,1999,10(3):626-634.
[12]申麗言,方斌,沈毅.基于負(fù)熵極大的獨(dú)立分量分析方法[J].中北大學(xué)學(xué)報(bào),2005,2(6):396-399.
[13]周云龍,孫斌,李洪偉.多相流參數(shù)檢測理論及其應(yīng)用[M].北京:科學(xué)出版社,2010.
[14]白鵬,張喜斌,張斌.支持向量機(jī)理論及工程應(yīng)用實(shí)例[M].西安:西安電子科技大學(xué)出版社,2008.
[15]張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000,26(1):32-42.
[16]馮元戩,施鵬飛.基于支持向量機(jī)的彩色圖像人臉檢測方法[J].上海交通大學(xué)學(xué)報(bào),2003,37(6):947-951.
[17]方瑞明.支持向量機(jī)理論及其應(yīng)用分析[M].北京:中國電力出版社,2007:160-831.