(1.湖南師范大學(xué) 物理與信息科學(xué)學(xué)院,湖南 長(zhǎng)沙 410081; 2.長(zhǎng)沙師范學(xué)院 信息與工程系,湖南 長(zhǎng)沙 410100)
高強(qiáng)度聚焦超聲(High Intensity Focused Ultrasound,HIFU)作為一種非侵入式病變組織治療新手段,是把高強(qiáng)度超聲的能量聚焦于靶區(qū),由于瞬間高溫效應(yīng)、瞬間化學(xué)效應(yīng)、機(jī)械效應(yīng)、聲化學(xué)等,致使腫瘤細(xì)胞蛋白質(zhì)發(fā)生變性而產(chǎn)生凝固性死亡,卻不損傷周圍正常細(xì)胞[1]。準(zhǔn)確地對(duì)HIFU輻照后的生物組織進(jìn)行變性分類識(shí)別,是對(duì)HIFU治療效果評(píng)判的基礎(chǔ)[2]。
目前組織變性分類識(shí)別方法主要有基于成像技術(shù)和信號(hào)檢測(cè)兩種。Sun等人[3]提出多光譜光聲成像的生物組織變性評(píng)估方法。鄒孝等人[4]提出了B超圖像灰度和小波變換系數(shù)并結(jié)合BP神經(jīng)網(wǎng)絡(luò)監(jiān)測(cè)HIFU輻照生物組織變性識(shí)別。此外,明文[5]從信號(hào)處理方面提出了基于BP神經(jīng)網(wǎng)絡(luò)的HIFU輻照生物組織損傷分類識(shí)別方法,利用多參量構(gòu)成矢量矩陣輸入神經(jīng)網(wǎng)絡(luò),訓(xùn)練神經(jīng)網(wǎng)絡(luò)并對(duì)樣本進(jìn)行損傷分類識(shí)別。然而,這些方法主要基于生物組織變性的某個(gè)參量,難以全面反映組織特性變化。
主元分析(Principal Component Analysis,PCA)是一種基于高斯統(tǒng)計(jì)假設(shè)的常用的特征提取方法,但它對(duì)非線性問(wèn)題的處理效果通常不佳,而生物組織變性識(shí)別中各特征要素之間在本質(zhì)上是非線性關(guān)系。Scholkopf等提出的KPCA(核主元分析,Kernel PCA)在非線性特征提取方面優(yōu)于PCA。與SVM(支持向量機(jī),Support Vector Machine)相比,F(xiàn)SVM(模糊支持向量機(jī),F(xiàn)uzzy SVM)具有更高的分類準(zhǔn)確率[6]。本文對(duì)離體豬肉組織多個(gè)變性特征參量進(jìn)行二次特征提取,以HIFU輻照后豬肉組織中的超聲回波信號(hào)特征為研究對(duì)象,提出了一種結(jié)合KPCA和FSVM各自優(yōu)勢(shì)的豬肉組織變性分類識(shí)別方法。
Kij=exp[-‖xi-xj‖2/(2σ2)]
(1)
y=(y1,y2,…,yq)T=UTφ(x)
(2)
通過(guò)求累計(jì)方差貢獻(xiàn)率最終決定KPCA主元特征數(shù)量。累計(jì)方差貢獻(xiàn)率定義為
(3)
模糊聚類(Fuzzy C-Means,FCM)的效果取決于最初聚類中心選擇,此外,初始值也對(duì)聚類性能有較大的影響。樣本模糊隸屬度的求解屬于局部搜索,易出現(xiàn)局部極值問(wèn)題[8]。而粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種全局尋優(yōu)方法,結(jié)合PSO全局尋優(yōu)和FCM局部尋優(yōu)來(lái)求解樣本的模糊隸屬度。將FCM獲取的聚類中心當(dāng)作初始參照中心,利用FCM計(jì)算模糊隸屬度,通過(guò)PSO搜尋最優(yōu)聚類中心。因此,關(guān)鍵是尋找最優(yōu)聚類中心。對(duì)聚類中心Ai(i=1,2,…,c)的任一粒子編碼定義如下:
xi=(ai1,ai2,…,aij,…,aic)
(4)
式中,aij為第i種聚類中的第j個(gè)聚類中心。針對(duì)FCM算法,最優(yōu)聚類即目標(biāo)函數(shù)值取最小時(shí)所對(duì)應(yīng)結(jié)果;PSO通常取適應(yīng)度的最大值所對(duì)應(yīng)的最優(yōu)解,適應(yīng)度函數(shù)如下定義[8]:
f=1/(JFCM(X;U,A)+1)
(5)
聚類效果越好,其JFCM(X;U,A)越小,個(gè)體的適應(yīng)度f(wàn)越高,尋找粒子在每次迭代過(guò)程中的適應(yīng)度,尋找到該粒子當(dāng)前的最優(yōu)解就是個(gè)體極值,同時(shí)也可尋找到粒子群當(dāng)前的最優(yōu)解,也就是全局極值。PSO優(yōu)化FCM求解模糊隸屬度步驟如下:
(1) 初始化。設(shè)定學(xué)習(xí)因子c1、c2、最大迭代次數(shù)M、模糊因子m′、聚類類別數(shù)c、粒子種群規(guī)模n的初始值,初始迭代次數(shù)k=1,隨機(jī)選出c個(gè)樣本作為聚類中心集,確定粒子的開(kāi)始速度,設(shè)定粒子的最大速度為Vmax,迭代終止閾值定為ε。
(2) 計(jì)算每一個(gè)粒子與聚類中心之間歐氏距離,然后計(jì)算粒子的隸屬度,可得隸屬度矩陣U,對(duì)聚類中心值進(jìn)行更新。
(3) 對(duì)種群進(jìn)行評(píng)估。依據(jù)適應(yīng)度函數(shù)f來(lái)計(jì)算每一個(gè)粒子的適應(yīng)值,得到個(gè)體的最優(yōu)值與全局的最優(yōu)值。
(4) 對(duì)每一個(gè)粒子所經(jīng)歷的個(gè)體的最優(yōu)值、全局的最優(yōu)值分別進(jìn)行比較,若較好則替換目前個(gè)體的最優(yōu)值與全局的最優(yōu)值。
(5) 尋優(yōu)結(jié)束。若粒子完成最大迭代次數(shù)M或符合小于規(guī)定的閾值ε,則計(jì)算終止;否則將粒子的速度及位置進(jìn)行更新,迭代數(shù)自加1,用最優(yōu)粒子的位置產(chǎn)生新的聚類中心,再轉(zhuǎn)至步驟(2)重新循環(huán)。輸出模糊隸屬度矩陣,獲得最終的模糊隸屬度。
(6)
式中,ω為權(quán)重向量;b為偏置;ξi為松弛變量;C為懲罰因子。將式(6)轉(zhuǎn)化為其對(duì)偶問(wèn)題[8]:
(7)
求得拉格朗日乘子αi和偏置b,得到最優(yōu)分類超平面的決策函數(shù)(也稱分類器):
(8)
實(shí)驗(yàn)系統(tǒng)主要由HIFU探頭、B超探頭、A/D信號(hào)采集卡、計(jì)算機(jī)控制系統(tǒng)等組成,如圖1所示。實(shí)驗(yàn)所用的HIFU探頭頻率為1.391 MHz,焦距約為13 cm,輸出的最大功率為300 W。新鮮豬肉樣品放置在正對(duì)HIFU探頭下面的吸聲橡膠上。信號(hào)通過(guò)A/D采集卡送入計(jì)算機(jī),通過(guò)改變HIFU劑量及輻照方式重復(fù)進(jìn)行大量實(shí)驗(yàn)。為確定組織是否發(fā)生變性,每次輻照實(shí)驗(yàn)后都作組織切片驗(yàn)證。
圖1 HIFU輻照組織回波信號(hào)提取實(shí)驗(yàn)系統(tǒng)
分別提取能反映豬肉組織變性的時(shí)頻域特征[8-9]:回波能量、峭度、裕度、方差、回波功率譜積分、頻率方差、衰減系數(shù)、背向散射積分、樣本熵、模糊熵、shannon小波熵、對(duì)數(shù)能量小波熵、q內(nèi)積小波熵、小波時(shí)間熵、小波能量、EMD能量熵、EMD奇異熵等,建立混合域特征集。為提高FSVM分類器的分類能力,先對(duì)初始特征集作KPCA二次特征的提取。由于RCVC與核主元向量成正比,需選取合適特征向量維數(shù),防止增加冗余數(shù)據(jù);與此同時(shí),為了保證豬肉組織變性識(shí)別準(zhǔn)確率,需要較高的累積貢獻(xiàn)率以保證數(shù)據(jù)的可靠性。按累計(jì)貢獻(xiàn)率大于95%的標(biāo)準(zhǔn),經(jīng)過(guò)多次取值實(shí)驗(yàn),當(dāng)標(biāo)準(zhǔn)差σ=86,前2個(gè)特征主元RCVC≥95%,如圖2所示。因此,核主元特征向量個(gè)數(shù)為2,將選出的前2個(gè)核主元特征向量作為FSVM訓(xùn)練樣本的特征向量。
圖2 KPCA核主元數(shù)與累積貢獻(xiàn)率的關(guān)系
針對(duì)FCM求解樣本模糊隸屬度時(shí)易陷入局部極值問(wèn)題,利用PSO全局尋優(yōu)能力搜尋最優(yōu)聚類中心,結(jié)合PSO和FCM求解噪聲樣本較小的模糊隸屬度,降低異常點(diǎn)對(duì)最優(yōu)超平面選擇的影響。設(shè)置FSVM的最初參數(shù),用KPCA選取的前2個(gè)核主元特征向量訓(xùn)練FSVM分類器。將待測(cè)樣本的核主元特征向量輸送到訓(xùn)練好的FSVM分類器中,實(shí)現(xiàn)組織變性分類識(shí)別。組織變性識(shí)別流程圖如圖3所示。
圖3 基于KPCA-FSVM的組織變性識(shí)別流程圖
實(shí)驗(yàn)選擇102例離體豬肉組織經(jīng)HIFU輻照產(chǎn)生的超聲散射回波信號(hào)作為FSVM的訓(xùn)練樣本,獲取FSVM最優(yōu)超平面。利用KPCA對(duì)回波信號(hào)進(jìn)行特征參數(shù)二次提取,將提取的前2個(gè)特征輸入FSVM并對(duì)116例超聲輻照后的豬肉組織進(jìn)行變性分類識(shí)別。這116例組織通過(guò)手工切片驗(yàn)證得到60例變性樣本,56例未變性樣本。為了驗(yàn)證提出的KPCA-FSVM組織變性識(shí)別方法的有效性,選取與KPCA二次混合域特征集提取的前2個(gè)特征呈非線性映射關(guān)系的衰減系數(shù)及背向散射積分特征,將其分別輸入FSVM中進(jìn)行變性識(shí)別比較。
116例豬肉組織回波信號(hào)分別采用衰減系數(shù)、背向散射積分變性檢測(cè)結(jié)果,如圖4所示。針對(duì)KPCA二次特征提取的2個(gè)特征、衰減系數(shù)及背向散射積分的FSVM豬肉組織變性分類識(shí)別結(jié)果如表1所示。由表1可知,檢測(cè)樣本為116例,通過(guò)切片驗(yàn)證變性的樣本數(shù)60例,未變性樣本數(shù)56例。變性識(shí)別率是待測(cè)樣本中判斷正確的變性樣本數(shù)與切片驗(yàn)證所得的變性樣本數(shù)的比值;未變性識(shí)別率是待測(cè)樣本中判斷正確的未變性樣本數(shù)與切片驗(yàn)證所得的未變性樣本數(shù)的比值。
圖4 116例豬肉組織變性識(shí)別的衰減系數(shù)及背向散射積分檢測(cè)結(jié)果
特征變性樣本未變性樣本數(shù)量誤判數(shù)量識(shí)別率/%數(shù)量誤判數(shù)量識(shí)別率/%總識(shí)別率/%衰減系數(shù)60690.056394.692.2背向散射積分60493.356492.993.1KPCA二次混合域特征提取的2個(gè)特征60296.756296.496.5
利用KPCA二次提取混合域特征集的前2個(gè)特征并用FSVM進(jìn)行分類識(shí)別,其變性樣本識(shí)別率、未變性樣本識(shí)別率、總識(shí)別率分別高于衰減系數(shù)6.7%、1.8%、4.3%,高于背向散射積分3.4%、3.5%、3.4%。
由此可見(jiàn),在相同條件下,本文提出的KPCA方法降低了輸入特征維數(shù),并保證輸出的特征能較好地反映組織特性并具有適合模式識(shí)別的可分性。通過(guò)KPCA二次提取混合域特征集的前2個(gè)特征,并運(yùn)用FSVM對(duì)組織變性進(jìn)行分類識(shí)別,獲得的總識(shí)別率超過(guò)了96%,KPCA二次提取混合域特征集相對(duì)單一特征能更準(zhǔn)確地檢測(cè)豬肉組織是否發(fā)生變性。
結(jié)合非平穩(wěn)信號(hào)處理方法,分別從時(shí)域和頻域取得反映組織變性的特征,并建立相應(yīng)的混合域特征集,該特征集可較全面、準(zhǔn)確地反映組織變性信息。利用KPCA對(duì)混合域特征集作二次特征提取,將特征集映射到一個(gè)較低維的特征空間,剔除那些對(duì)豬肉組織變性識(shí)別貢獻(xiàn)不大或不敏感的特征量,并提取出對(duì)組織變性敏感的特征,從而獲得數(shù)目少、敏感度高且分類錯(cuò)誤率低的主要特征。綜合PSO、FCM及SVM 各自優(yōu)點(diǎn)構(gòu)建FSVM分類器,使傳統(tǒng)SVM具有更好的離體豬肉組織變性分類識(shí)別能力。對(duì)116例離體豬肉樣本在HIFU輻照后獲得的超聲回波信號(hào)進(jìn)行特征提取并用KPCA-FSVM進(jìn)行分類識(shí)別。結(jié)果表明,KPCA二次提取混合域特征集后的總識(shí)別率為96.5%,高于單一特征識(shí)別率。后續(xù)將進(jìn)一步提高樣本數(shù)量并收集多種不同生物組織的樣本,使該分類識(shí)別方法具有可推廣性。