亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于模糊C均值聚類-支持向量機(jī)的海底沉積物分類識(shí)別

2014-12-15 03:34:56尤加春毛慧慧段文豪李紅星

海洋科學(xué) 2014年11期

尤加春, 毛慧慧 , 段文豪, 李紅星

(1.中國(guó)地質(zhì)大學(xué) 地球物理與信息技術(shù)學(xué)院, 北京 100083; 2.中國(guó)科學(xué)院地質(zhì)與地球物理研究所, 北京100029; 3.中國(guó)科學(xué)院大學(xué), 北京100049; 4.東華理工大學(xué) 核工程與地球物理學(xué)院, 江西撫州344000)

海底底質(zhì)類型是一種重要的海洋環(huán)境參數(shù), 底質(zhì)類型的分布對(duì)海洋科學(xué)研究、海洋工程以及國(guó)防建設(shè)等具有重要的科學(xué)與實(shí)際意義。對(duì)于海底沉積物的探測(cè)主要有直接采樣法和間接采樣法, 由于直接采樣法的成本高, 采樣效率低(只能零星采樣)等缺點(diǎn), 間接采樣方法是目前海底沉積物類型探測(cè)的主要方法。海底沉積物的間接采樣分類方法主要是利用聲學(xué)、光學(xué)、地震學(xué)、生物化學(xué)等方法接受不同海底沉積物的響應(yīng), 并根據(jù)這些響應(yīng)的特征進(jìn)行分類。

國(guó)內(nèi)外對(duì)于海底底質(zhì)的分類進(jìn)行了大量的研究。國(guó)外早在1947~1948年瑞典科學(xué)家Arrhenius就開展了深海勘探計(jì)劃。經(jīng)過數(shù)十年的發(fā)展[1-4], 國(guó)外已經(jīng)形成了比較成熟的勘探技術(shù), 海底底質(zhì)分類的儀器和軟件也得到了極大的發(fā)展, 例如挪威 Simrad公司的 Triton軟件等。而國(guó)內(nèi)對(duì)海底沉積物分類研究起步較晚。孟金生[5]、王正垠[6]利用不同的探測(cè)手段[7]研究了海底底質(zhì)的響應(yīng)差異并進(jìn)行分類。對(duì)于實(shí)驗(yàn)室基礎(chǔ)理論性的研究, 目前主要是以物理模擬為主, 例如卜英勇等[8]、鄧躍紅等[9]在水槽實(shí)驗(yàn)平臺(tái)上建立沉積物模型, 利用超聲回波探測(cè)不同的沉積物,并基于回波信號(hào)對(duì)沉積物進(jìn)行分類研究。

實(shí)驗(yàn)室中的物理模擬主要是人為地按照一定比例配制海底沉積物樣本, 然后再利用裝置激發(fā)接受回波信號(hào)。物理模擬方法較為費(fèi)時(shí)費(fèi)力且實(shí)驗(yàn)可重復(fù)性差, 而利用計(jì)算機(jī)模擬聲波探測(cè)海底沉積物并進(jìn)行分類的研究鮮見于刊。本文嘗試采用計(jì)算機(jī)數(shù)值正演技術(shù)模擬實(shí)際的地震勘探數(shù)據(jù)采集過程, 數(shù)值模擬方法具有快速、高效、高重復(fù)性、易于操作、經(jīng)濟(jì)等特點(diǎn)?；诓煌暮５壮练e物在聲學(xué)上將產(chǎn)生不同強(qiáng)度的回波信號(hào), 本文分別采用一種無監(jiān)督分類方式: 模糊C均值聚類(Fuzzy C Means, FCM)和一種監(jiān)督分類方式: 支持向量機(jī)(Support VectorMachine, SVM)對(duì)提取的回波的特征向量進(jìn)行分類識(shí)別, 并對(duì)上述兩種方法作了融合, 提出了一種新型、實(shí)用、快速高效的分類方法。此外, 數(shù)值模擬方法更有利于研究不同的分類識(shí)別方法、屬性提取技術(shù)對(duì)各種海底沉積物的識(shí)別效果并為實(shí)際應(yīng)用提供理論依據(jù)。

1 雙相-隨機(jī)介質(zhì)模型

實(shí)際的海底沉積介質(zhì)為典型的雙相介質(zhì), 本文認(rèn)為海底沉積物由巖石骨架(例如礫石、黏土等)和流體填充的孔隙構(gòu)成, 利用基于雙相-隨機(jī)介質(zhì)的彈性波動(dòng)方程模擬實(shí)際地震勘探數(shù)據(jù)采集過程。基于Biot理論的雙相介質(zhì)彈性波動(dòng)方程[10-13]為:

式中:R為流相彈性系數(shù);Q為固流相耦合彈性系數(shù);e為固相體應(yīng)變;ε為流相體應(yīng)變;u為固相位移分量;U為流相位移分量;ρ11為單位體積中固體相對(duì)流體運(yùn)動(dòng)時(shí)固體部分總的等效質(zhì)量;ρ22為單位體積中流體相對(duì)固體運(yùn)動(dòng)時(shí)流體部分總的等效質(zhì)量;ρ12為單位體積中流體和固體之間的質(zhì)量耦合系數(shù);A, N相當(dāng)于單相各向同性彈性理論中的拉梅常數(shù);b為耗散系數(shù)。

為能更加準(zhǔn)確地描述實(shí)際海底復(fù)雜的沉積環(huán)境,在雙相介質(zhì)中引入隨機(jī)擾動(dòng)構(gòu)成雙相-隨機(jī)介質(zhì), 這種隨機(jī)介質(zhì)[14-17]中的隨機(jī)擾動(dòng)可以理解為雙相介質(zhì)中巖石骨架彈性參數(shù)的隨機(jī)變化。為了簡(jiǎn)化計(jì)算, 本文只考慮在排空情況下孔隙介質(zhì)中巖石骨架彈性系數(shù)引起的非均一性, 并假設(shè)彈性系數(shù)各量的相對(duì)擾動(dòng)是相同的, 從而可以只用一個(gè)相對(duì)擾動(dòng)量來描述隨機(jī)介質(zhì)在小尺度上的非均勻性[18]?？紤]空間隨機(jī)介質(zhì)擾動(dòng)的孔隙介質(zhì)彈性系數(shù)可以表示為N=N0(1+δ),A=A0(1+δ)。其中,A0,N0是背景介質(zhì)的彈性參數(shù),δ是空間隨機(jī)介質(zhì)通過一定的自相關(guān)函數(shù)產(chǎn)生的擾動(dòng)。本文在研究隨機(jī)介質(zhì)的自相關(guān)函數(shù)時(shí)選擇指數(shù)型函數(shù)來產(chǎn)生隨機(jī)擾動(dòng):

其中,a、b分別為介質(zhì)在x方向和z方向上的自相關(guān)長(zhǎng)度。

本文在已知泥巖、砂巖、礫巖的縱波、橫波和密度的情況下, 將這些參數(shù)轉(zhuǎn)換為泥質(zhì)礫巖、泥、泥質(zhì)砂巖的雙相介質(zhì)彈性參數(shù), 相關(guān)等效介質(zhì)理論可參考文獻(xiàn)[19-21]。雙相介質(zhì)彈性波動(dòng)方程的高階交錯(cuò)網(wǎng)絡(luò)有限差分離散形式參考文獻(xiàn)[10-13, 22]。

2 分類識(shí)別方法

2.1 支持向量機(jī)

傳統(tǒng)的統(tǒng)計(jì)學(xué)研究方法都是建立在大數(shù)定理這一基礎(chǔ)上的漸進(jìn)理論, 要求學(xué)習(xí)樣本數(shù)目足夠多。然而在實(shí)際應(yīng)用中, 由于各個(gè)方面的原因, 這一前提往往難以得到保證。因此在小樣本情況下, 建立在傳統(tǒng)統(tǒng)計(jì)學(xué)基礎(chǔ)上的學(xué)習(xí)方法也就很難取得理想的學(xué)習(xí)效果和泛化性能。

基于Vapnik的統(tǒng)計(jì)學(xué)習(xí)理論而提出的支持向量機(jī)[23-25]大大減小了算法設(shè)計(jì)的隨意性, 并很好地解決了在上述問題中提到的如何在有限樣本情況下實(shí)現(xiàn)機(jī)器學(xué)習(xí)的強(qiáng)泛化能力。利用支持向量機(jī)分類的基本思想是通過核函數(shù)變換的方法, 將低維空間非線性分類問題轉(zhuǎn)換為高維空間線性可分的問題, 然后在新空間中求解最優(yōu)分類面。

在實(shí)際的海底沉積物底質(zhì)調(diào)查中, 勘測(cè)區(qū)域的沉積物樣本是較少的, 研究人員需要對(duì)大量的反射波信號(hào)進(jìn)行分類研究, 進(jìn)而繪制勘測(cè)區(qū)域的海底沉積物底質(zhì)分布情況。本文正是在這種實(shí)際需求下, 考慮有限樣本情況, 利用支持向量機(jī)對(duì)海底沉積物進(jìn)行分類識(shí)別研究。

2.1.1 支持向量機(jī)基本原理

支持向量機(jī)最初用來對(duì)線性可分?jǐn)?shù)據(jù)進(jìn)行二值分類處理的, 對(duì)線性可分問題, 給定訓(xùn)練樣本{(x1,y1) ,(x2,y2),… ,(xN,yN)}, 期望輸出y∈ {-1,1},分別代表兩類的類別標(biāo)識(shí)。用于分類的最優(yōu)超平面方程為:ωTx+b=0, 其中ω為權(quán)重向量,x為輸入向量,b為偏置。支持向量機(jī)的目的是尋找一個(gè)分離邊緣最大的超平面(即最優(yōu)超平面)使兩類數(shù)據(jù)最大可能地分離, 離最優(yōu)超平面最近的特殊樣本稱為支持向量。則對(duì)于一確定的最優(yōu)超平面, 所有的樣本都滿足:

對(duì)于非線性可分模式的分類問題, 會(huì)有一些樣本不滿足(2)式的約束條件, 而出現(xiàn)分類誤差。因此需要適當(dāng)放寬該約束條件, 將其變?yōu)?

式中引入了松弛變量ξi,i= 1 ,2,L ,N, 它用于量度一個(gè)數(shù)據(jù)點(diǎn)對(duì)線性可分理想條件的偏離程度。當(dāng)0≤ξ≤1時(shí), 數(shù)據(jù)點(diǎn)落入分離區(qū)域的內(nèi)部, 且在分類超平面的正確一側(cè); 當(dāng)ξ＞1時(shí), 數(shù)據(jù)點(diǎn)進(jìn)入分類超平面的錯(cuò)誤一側(cè); 當(dāng)ξ=0時(shí), 退化為線性可分問題。

對(duì)于非線性問題, 尋找ω和b的最優(yōu)值, 使其在(3)式的約束下, 最小化關(guān)于ω和ξi的目標(biāo)函數(shù), 即

其中,Ck為懲罰系數(shù)。

利用 Lagrange乘數(shù)法求解上述最優(yōu)化問題, 上述方程可變?nèi)缦聦?duì)偶問題:

其中,e為單位矩陣,Q為半正定矩陣,Qij=yiyjK(xi,xj),為核函數(shù), 本文采用的 RBF核函數(shù)為, 其中2σ為給定參數(shù)。

在實(shí)際應(yīng)用中,Ck和σ的選取對(duì)于支持向量機(jī)分類的效果影響極其重要, 而目前對(duì)于上述參數(shù)的選取并無統(tǒng)一的準(zhǔn)則, 往往是采用大量試驗(yàn)的方法來獲得較優(yōu)的參數(shù)值, 但這種方法比較繁瑣、費(fèi)時(shí),而且獲得的參數(shù)也不一定能使分類效果最優(yōu)。其實(shí),選擇合適的Ck和σ值使支持向量機(jī)的分類效果達(dá)到最優(yōu)的問題屬于優(yōu)化問題。本文提出采用差分進(jìn)化(Differential Evolution, DE)算法[26]實(shí)現(xiàn)對(duì)支持向量機(jī)參數(shù)的自動(dòng)最優(yōu)化搜索。

2.1.2 差分進(jìn)化算法

差分進(jìn)化算法[28-29]是一種隨機(jī)的并行直接搜索算法, 整個(gè)算法包含3個(gè)過程: 變異、交叉、選擇, 類似于遺傳算法的變異、交叉和選擇操作。3種操作描述如下:

(1) 變異

設(shè)有N個(gè)個(gè)體xi(t),i=1, 2, …,N, 對(duì)于第i個(gè)體xi(t), 根據(jù)下面公式生成下一代變異個(gè)體:

其中,xr3(t),xr2(t),xr1(t)為從進(jìn)化群體中隨機(jī)選取的互不相同的 3個(gè)個(gè)體, 其中i和r1、r2、r3之間必須是不同的。F為縮放比例因子, 用于控制差向量的影響大小。

(2) 交叉

為了增加群體的多樣性, 交叉操作被引入差分進(jìn)化算法。將個(gè)體xi(t)和變異個(gè)體進(jìn)行二項(xiàng)分布雜交生成雜交個(gè) 體:

具體操作如下:

其中,R∈ [ 0,1], 為雜交參數(shù),P∈ [0,1]之間的隨機(jī)數(shù),D為解空間維數(shù)。

(3) 選擇

在基本差分進(jìn)化算法中, 選擇操作采取貪婪策略, 即只有當(dāng)產(chǎn)生的子代個(gè)體優(yōu)于父代個(gè)體時(shí)(對(duì)應(yīng)目標(biāo)函數(shù)值f(xi(t+ 1 ))≤f(xi(t)))才被保留, 否則父代個(gè)體被保留至下一代。

2.1.3 基于差分進(jìn)化算法的支持向量機(jī)參數(shù)優(yōu)化

本文采用交叉驗(yàn)證(Cross Validation, CV)的思想利用差分進(jìn)化算法求取支持向量機(jī)的最優(yōu)化參數(shù)。CV是用來驗(yàn)證分類器性能的一種統(tǒng)計(jì)分析方法, 基本思想是在某種意義下將原始數(shù)據(jù)進(jìn)行分組, 一部分用于訓(xùn)練集, 另一部分用于驗(yàn)證集。其方法是首先用訓(xùn)練集對(duì)分類器進(jìn)行訓(xùn)練, 再利用驗(yàn)證集來測(cè)試訓(xùn)練得到的模型, 以得到的分類準(zhǔn)確率作為評(píng)價(jià)分類性能指標(biāo)。本文選擇 K-折交叉驗(yàn)證(K-fold Cross Validation, K-fold CV)來評(píng)估分類模型的泛化性能。

為驗(yàn)證模型的測(cè)試效果, 本文以準(zhǔn)確率作為差分進(jìn)化算法的目標(biāo)函數(shù)。準(zhǔn)確率定義為: 準(zhǔn)確率＝測(cè)試樣本中分類正確的樣本數(shù)/測(cè)試樣本總數(shù)。利用差分進(jìn)化算法對(duì)支持向量機(jī)中Ck和σ的尋優(yōu)計(jì)算可轉(zhuǎn)化為一個(gè)二維最優(yōu)化問題。具體操作步驟為:

步驟1: 初始化參數(shù), 給定差分進(jìn)化算法的種群規(guī)模,F值, 最大迭代次數(shù), 精度要求,R、Ck和σ的初始值。

步驟 2: 根據(jù)種群參數(shù)利用支持向量機(jī)對(duì)訓(xùn)練樣本集進(jìn)行訓(xùn)練, 并用訓(xùn)練好的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè), 計(jì)算每個(gè)個(gè)體的目標(biāo)函數(shù)值(即準(zhǔn)確率)。

步驟3: 根據(jù)差分進(jìn)化算法中的變異、交叉由父代種群產(chǎn)生子代種群, 利用子代種群參數(shù)對(duì)支持向量機(jī)進(jìn)行訓(xùn)練和測(cè)試, 計(jì)算子代種群每個(gè)個(gè)體的目標(biāo)函數(shù)值; 執(zhí)行差分進(jìn)化算法中的選擇操作。

步驟 4: 判斷是否滿足計(jì)算精度要求或是否達(dá)到最大迭代次數(shù), 不滿足時(shí), 返回步驟 3; 否則, 執(zhí)行步驟5。

步驟5: 迭代結(jié)束, 輸出支持向量機(jī)模型最優(yōu)的Ck和σ的值。

2.2 模糊C均值聚類

模糊C均值聚類[27-28]是Bezkek于1981年提出的, 它是目前廣泛采用的一種聚類算法, 其主要思想是將經(jīng)典劃分的定義模糊化, 用隸屬度來確定屬于某個(gè)聚類程度的一種聚類方法。模糊 C均值聚類是模糊聚類算法中非常有效的一種, 即使對(duì)于很難明顯分類的變量, 模糊 C均值聚類也能得到較為滿意的效果。

考慮一個(gè)樣本集合X={x1,x2,… ,xn}, 將其分為c個(gè)模糊組, 并求每組的聚類中心cj(j= 1,2,… ,C0),使目標(biāo)函數(shù)達(dá)到最小。目標(biāo)函數(shù)定義如下:

其中:uij∈[0,1]間;ci為模糊組i的聚類中心,C0是期望聚類的數(shù)目,為第i個(gè)聚類中心與第j個(gè)數(shù)據(jù)點(diǎn)間的歐幾里德距離; 且m∈ [ 1 , ∞)是一個(gè)加權(quán)指數(shù)。式(8)需要滿足

模糊聚類就是通過迭代最優(yōu)化目標(biāo)函數(shù)Jc實(shí)現(xiàn)的, 這是一個(gè)進(jìn)行優(yōu)化的過程。其中模糊隸屬度uij和聚類中心cij分別為:

這個(gè)過程從一個(gè)隨機(jī)的聚類中心開始, 通過搜索目標(biāo)函數(shù)的最小點(diǎn), 不斷調(diào)整聚類中心和每一個(gè)樣本的模糊隸屬度, 達(dá)到確定樣本類別的過程。

加權(quán)指數(shù)m控制著聚類的模糊性。m越接近于1, 聚類越趨向于突變(crisp),m越大, 結(jié)果越模糊、相對(duì)更易于反映空間的漸變性, 但過大的m值將導(dǎo)致類別間的重疊太多, 聚類結(jié)構(gòu)不清晰, 因此對(duì)m的選取需要在模糊度與清晰度的聚類結(jié)構(gòu)間進(jìn)行權(quán)衡。參考文獻(xiàn)[29]根據(jù)實(shí)驗(yàn)建議最佳m位于區(qū)間 [1.5,2.5]之間。

3 實(shí)驗(yàn)數(shù)據(jù)分析

根據(jù)前文建立的雙相-隨機(jī)介質(zhì)模型, 利用高階有限差分技術(shù)正演計(jì)算海底沉積物的一次反射波信號(hào)。為簡(jiǎn)化計(jì)算, 本文設(shè)計(jì)了一個(gè)雙層地質(zhì)模型, 第一層(0~400 m)為海水, 第二層為海底沉積介質(zhì), 該部分介質(zhì)為雙相-隨機(jī)介質(zhì), 彈性參數(shù)的隨機(jī)擾動(dòng)由指數(shù)自相關(guān)函數(shù)給出, 見圖1。正演模型尺度為1 000 m×750 m,空間網(wǎng)格步長(zhǎng)為 5 m, 時(shí)間步長(zhǎng)為 0.1 ms, 所用Ricker子波主頻為30 Hz, 震源深度保持H= 300 m不變, 接受器置于炮點(diǎn)相同位置, 使之水平移動(dòng)得到海底反射波的自激自收剖面, 每個(gè)模型通過正演模擬計(jì)算得到 100道地震記錄。海底沉積物底質(zhì)顆粒的彈性參數(shù)見表1。利用等效介質(zhì)理論計(jì)算的雙相介質(zhì)的彈性參數(shù)見表2。根據(jù)Folk沉積物分類[30]方法, 在本文中, 泥質(zhì)礫巖中礫巖: 泥巖=7∶3, 泥質(zhì)砂巖中砂巖∶泥巖=1∶1。

圖1 由隨機(jī)函數(shù)產(chǎn)生的隨機(jī)擾動(dòng)Fig.1 Random disturbance generated by the random function

表1 固體顆粒彈性參數(shù)Tab.1 Elastic property of solid particles

在得到海底反射波之后, 利用小波變換[31]提取該反射波的特征向量。提取步驟: (1)首先對(duì)信號(hào)進(jìn)行Hilbert變換得到原信號(hào)的解析表達(dá)式; (2)對(duì)信號(hào)的解析表達(dá)式的實(shí)部和虛部分別作小波變換, 之后對(duì)某一級(jí)小波分解信號(hào)求模, 即為反射波的包絡(luò)特征向量。

表2 沉積物底質(zhì)彈性參數(shù)Tab.2 Elastic property of marine sediments

綜合考量了輸入神經(jīng)網(wǎng)絡(luò)的特征向量個(gè)數(shù)應(yīng)盡可能少及特征向量要充分體現(xiàn)反射波特性時(shí)應(yīng)盡可能多的特點(diǎn), 經(jīng)本文試驗(yàn)計(jì)算后選擇對(duì)小波分解的第五層系數(shù)作求模運(yùn)算。本文選擇的小波基為harr小波。

有限差分正演計(jì)算的 3個(gè)模型的第 100道地震記錄見圖2。利用小波變換計(jì)算其包絡(luò)作為特征向量見圖3。本文在每個(gè)模型中選取20個(gè)一次反射波的特征向量作為支持向量機(jī)的訓(xùn)練數(shù)據(jù), 將其余數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù), 同時(shí)利用算法對(duì)支持向量機(jī)要預(yù)測(cè)的數(shù)據(jù)進(jìn)行分類以便對(duì)比這兩種方法的分類效果。從圖4中可見利用差分進(jìn)化算法優(yōu)化過的支持向量機(jī)的預(yù)測(cè)分類正確率達(dá)到了100%。圖5為模糊C均值聚類算法的聚類效果, 正確率也為100%。從圖4、圖5中可見, 支持向量機(jī)分類方法和模糊 C均值聚類分類方法均取得了極好的分類結(jié)果。

為了驗(yàn)證本文所用方法的穩(wěn)定性, 本文對(duì)反射波信號(hào)中分別加入10%, 30%, 50%的高斯白噪音, 某一道地震記錄及加噪后的波形見圖6。從圖中可見高斯白噪音幾乎全部掩蓋了原始信號(hào)的特征, 單純地依靠人的經(jīng)驗(yàn)已經(jīng)無法區(qū)分海底沉積物底質(zhì)類型了。本文仍然采用支持向量機(jī)和模糊 C均值聚類進(jìn)行分類識(shí)別, 訓(xùn)練樣本和預(yù)測(cè)樣本同上。此時(shí), 本文以訓(xùn)練樣本的最大分類正確率為目標(biāo)函數(shù), 利用差分進(jìn)化算法對(duì)支持向量機(jī)分類參數(shù)進(jìn)行優(yōu)化選擇計(jì)算。最優(yōu)化的支持向量機(jī)預(yù)測(cè)分類的結(jié)果與模糊 C均值聚類分類結(jié)果見表3。

圖2 三個(gè)模型第100道地震記錄對(duì)比Fig.2 Seismic record of trace No.100 in three models

圖3 三個(gè)模型反射波第100道的特征向量Fig.3 Characteristic vector of trace No.100 in three models

圖4 支持向量機(jī)預(yù)測(cè)分類結(jié)果Fig.4 The classification predicted by SVM

從表3中可見, 在信號(hào)中加一定的噪音之后,模糊C均值聚類相較于最優(yōu)化支持向量機(jī)預(yù)測(cè)分類的正確率明顯較低?？梢娫诘托旁氡取⑿颖厩闆r下, 支持向量機(jī)仍然取得了比較好的分類效果。這充分說明了支持向量機(jī)對(duì)于分類數(shù)據(jù)具有很好的泛化能力和分類識(shí)別能力且具有較好的抗噪能力和魯棒性。

圖5 模糊C均值聚類3D聚類分類圖Fig.5 The clustering result produced by FCM

表3 加噪信號(hào)預(yù)測(cè)分類正確率Tab.3 The accuracy of using Optimized-SVM and FCM to classify the data with noise

從兩種方法實(shí)現(xiàn)的原理上, 本文分析了模糊 C均值聚類和支持向量機(jī)對(duì)于分類識(shí)別問題各自的優(yōu)缺點(diǎn): 模糊 C均值聚類相較于支持向量機(jī)不需要先驗(yàn)信息, 直接根據(jù)聚類方法中的距離函數(shù)即可進(jìn)行分類, 屬于無監(jiān)督分類方法, 但對(duì)噪音數(shù)據(jù)比較敏感, 分類正確率不高; 支持向量機(jī)需要一定數(shù)目的先驗(yàn)信息(訓(xùn)練樣本), 屬于監(jiān)督分類方法, 但支持向量機(jī)對(duì)數(shù)據(jù)泛化能力強(qiáng), 預(yù)測(cè)分類正確率較高。

鑒于此, 本文提出一種混合分類方法, 即模糊C均值聚類-支持向量機(jī)分類方法, 該方法充分利用上述兩種方法的優(yōu)點(diǎn)而達(dá)到無需先驗(yàn)信息的高精度、快速分類。這種混合分類方法, 從算法的實(shí)現(xiàn)上也可以稱為兩步分類法。兩步分類法計(jì)算步驟如下:

步驟1: 數(shù)據(jù)初步聚類分析, 此步驟主要是通過模糊C均值聚類實(shí)現(xiàn)。具體操作如下:

(a) 確定分類數(shù)C0、m、精度要求等參數(shù);

(b) 初始化cj(j= 1,2,… ,C0);

(d) 根據(jù)式(8)計(jì)算模糊聚類目標(biāo)函數(shù), 判斷是否滿足聚類精度要求, 滿足則算法終止, 否則返回(c)。

步驟2: 支持向量機(jī)訓(xùn)練樣本篩選, 根據(jù)模糊聚類的結(jié)果選擇最靠近每類中心的樣本作為支持向量機(jī)的訓(xùn)練樣本; 首先計(jì)算每類的類內(nèi)均值, 然后計(jì)算每類的類中所有樣本到中心值的距離矩陣, 從每類的距離矩陣中篩選出距離最小的若干個(gè)樣本構(gòu)成支持向量機(jī)的訓(xùn)練集;

步驟3: 在用訓(xùn)練數(shù)據(jù)訓(xùn)練支持向量機(jī)時(shí), 利用差分進(jìn)化算法對(duì)支持向量機(jī)中關(guān)鍵參數(shù)進(jìn)行最優(yōu)化搜索;

步驟 4: 用上述訓(xùn)練好的支持向量機(jī)模型對(duì)其余數(shù)據(jù)進(jìn)行預(yù)測(cè)分類輸出。

基于上述對(duì)海底沉積物數(shù)值模擬分類方法的論證, 可見本文所用方法是全完可行的。為了便于進(jìn)一步對(duì)不同海底沉積物底質(zhì)產(chǎn)生的地震反射波進(jìn)行深入研究, 也為研究不同特征提取技術(shù)或其他分類識(shí)別算法對(duì)海底沉積物類型的識(shí)別能力, 本文歸納總結(jié)了利用計(jì)算機(jī)數(shù)值模擬技術(shù)對(duì)海底沉積物進(jìn)行分類識(shí)別的一般化研究流程:

(1) 模型構(gòu)制, 先將固體顆粒的彈性參數(shù)按照一定的體積百分比利用等效介質(zhì)理論轉(zhuǎn)變?yōu)楹５壮练e物的彈性參數(shù);

(2) 地震反射波信號(hào)采集, 基于雙相-隨機(jī)介質(zhì)彈性波動(dòng)方程, 利用有限差分技術(shù)計(jì)算模型的地震反射波信號(hào);

(3) 特征向量提取, 利用小波變換或其他特征提取技術(shù)提取海底沉積物底質(zhì)反射波的特征向量;

(4) 分類效果評(píng)價(jià), 利用模糊 C均值聚類-支持向量機(jī)分類方法預(yù)測(cè)分類并進(jìn)行評(píng)價(jià)。

此外, 鑒于本文所提方法具備較好的函數(shù)泛化能力及模糊 C均值聚類的無監(jiān)督模式識(shí)別的特點(diǎn),本文所采用的方法也有利于應(yīng)對(duì)實(shí)際復(fù)雜的海底沉積物底質(zhì)的分類識(shí)別, 這也是本文下一步的研究目標(biāo)。

圖6 原始地震記錄與加噪音地震記錄波形對(duì)比Fig.6 The comparison of the original data and the data with noise

4 總結(jié)

海底底質(zhì)類型進(jìn)行分類研究一直是一個(gè)經(jīng)典、熱點(diǎn)的課題。本文在總結(jié)了前人關(guān)于海底沉積物分類研究的基礎(chǔ)上, 率先提出采用計(jì)算機(jī)數(shù)值模擬手段來開展海底沉積物的分類識(shí)別研究。首先利用計(jì)算機(jī)數(shù)值正演技術(shù)模擬實(shí)際地震勘探數(shù)據(jù)采集過程,然后分別利用模糊 C均值聚類和基于差分進(jìn)化算法優(yōu)化的支持向量機(jī)對(duì)地震反射波進(jìn)行分類識(shí)別, 再分析了上述兩種方法的優(yōu)缺點(diǎn)之后, 本文提出了一種對(duì)海底沉積物分類識(shí)別的兩步法操作, 該方法有機(jī)地結(jié)合了模糊 C均值聚類的無監(jiān)督特性和支持向量機(jī)的強(qiáng)泛化能力。在論證了本方法的可行性之后,本文歸納總結(jié)了一套利用計(jì)算機(jī)數(shù)值模擬技術(shù)進(jìn)行海底沉積物分類識(shí)別的一般化流程以便進(jìn)一步開展更加廣泛深入的研究。

[1]Mackenzie K V.Reflection of sound from coastal bottoms [J].Acoust Soe Am, 1960, 32(2): 221-231.

[2]Biot M A.Theory of propagation of elastic waves in a fluid-saturated porous solid, I.Low-frequency range[J].Acoust Soc Am, 1956, 28(2): 168-178.

[3]Biot M A.Theory of propagation of elastic waves in a fluid-saturated porous solid, II.high-frequency range[J].Acoust Soc Am, 1956, 28(2): 168-179.

[4]Biot M A.Mechanics of deformation and acoustic propagation in porous Media [J].Journal of Applied Physics, 1964, 33(4): 1482-1498.

[5]孟金生, 關(guān)定華.海底沉積物的聲學(xué)方法分類[J].聲學(xué)學(xué)報(bào), 1982, 7(6): 337-343.

[6]王正垠, 馬遠(yuǎn)良.寬帶聲吶湖底沉積物分類研究[J].聲學(xué)學(xué)報(bào), 1996, 4: 517-524.

[7]劉建國(guó), 李志舜.基于連續(xù)小波變換的湖底回波特征提取[J].西北工業(yè)大學(xué)學(xué)報(bào), 2006, 1: 111-114.

[8]卜英勇, 張超, 聶雙雙.基于離散小波變換的水下回波信號(hào)尾波包絡(luò)特征提取[J].鄭州大學(xué)學(xué)報(bào)(工學(xué)版),2007, 4: 80-83.

[9]鄧躍紅, 聶雙雙.基于小波變換的水下超聲波測(cè)距方法研究[J].鄭州大學(xué)學(xué)報(bào)(工學(xué)版), 2007, 28(4):75-79.

[10]裴正林.雙相各向異性介質(zhì)彈性波傳播交錯(cuò)網(wǎng)格高階有限差分法模擬[J].石油地球物理勘探, 2006,41(2): 137-143.

[11]楊頂輝.雙相各向異性介質(zhì)中彈性波方程的有限元解法及波場(chǎng)模擬[J].地球物理學(xué)報(bào), 2002, 45(4): 575-583.

[12]Zhu X, Mcmechan G A.Numerical simulation of seismic responses of poroelastic reservoirs using Biot theory[J].Geophysics, 1991, 56(3): 328-339.

[13]王東, 張海瀾, 王秀明.部分飽和孔隙巖石中聲波傳播數(shù)值研究[J].地球物理學(xué)報(bào), 2006, 49(2): 524-532.

[14]姚姚, 奚先.隨機(jī)介質(zhì)模型正演模擬及其地震波場(chǎng)分析[J].石油物探, 2002, 41(1): 31-36.

[15]奚先, 姚姚.隨機(jī)介質(zhì)模型的模擬與混合型隨機(jī)介質(zhì)[J].地球科學(xué)-中國(guó)地質(zhì)大學(xué)學(xué)報(bào), 2002, 27(1): 67-71.

[16]Li C P, Liu X W.Study on the scales of heterogeneous geologic bodies in random media[J].Applied Geophysics, 2011, 4: 363-369.

[17]殷學(xué)鑫, 劉洋.二維隨機(jī)介質(zhì)模型正演模擬及其波場(chǎng)分析[J].石油地球物理勘探, 2011, 6: 862-872

[18]李紅星, 陶春輝.雙相各向異性隨機(jī)介質(zhì)偽譜法地震波場(chǎng)特征分析[J].物理學(xué)報(bào), 2009, 4: 2836-2842.

[19]Mavko G, Mukerji T, Dvorkin J.the rock physics handbook: tools for seismic analysis in porous media[M].Cambridge: Cambridge university press, 2003.

[20]Gassmann F.Uber die Elastizitat porous media[J].Vier der Natur Gesellschaft in Zurich, 1951, 96: 1-23.

[21]Gessrtsna J, Smit D C.Some aspects of elastic wave propagation in a fluid-saturated porous solids[J].Geophysics, 1990, 95: 15643-15656.

[22]Zeng Y Q, He J Q, Liu Q H.The applieation of the perfeetly matehed layer in numerical modeling of wave propagation in poroelastic media[J].Geophsics, 2001,66(4): 1258-1266.

[23]Haykin S.神經(jīng)網(wǎng)絡(luò)原理(第二版)[M].葉世偉譯.北京: 機(jī)械工業(yè)出版社, 2004: 229-237.

[24]Cortes C, Vapnik V N.Support vector networks[J].Machine Learning, 1995, 20: 273-297.

[25]Vapnik V N.Statistical learning theory[M].New York:Wiley, 1998.

[26]Rainer S, Kenneth P.Differential evolution: A simple and efficient adaptive scheme for global optimization over continuous spaces [J].Global Optimization, 1997,11: 341-359.

[27]Bezdek J C.Pattern Recognition with Fuzzy objective Function Algorithms[M].New York: Plenum Press,1981.

[28]Bezdek J C, Hathaway R J.Recent convergence results for the fuzzy c-means clustering algorithm[J].Classifieation, 1988, 5(2): 237-247.

[29]高新波, 李潔, 謝維信.FCM算法中參數(shù)m的優(yōu)選[J].模式識(shí)別與人工智能, 2000, 13(1): 7-11.

[30]Folk R L, Andrews P B, Lewis D W.Detrital sedimentary rock classification and nomenclature for use in New Zealand[J].New Zealand Journal of Geology and Geophysics, 1970, 13: 937-968.

[31]Daubechies I.小波變換十講[M].李建平, 楊萬年,譯.北京: 國(guó)防工業(yè)出版社, 2004: 56-99.