何建春,夏茂寧,趙 倩
(1.重慶市大足區(qū)人民醫(yī)院,重慶 402360;2.四川輕化工大學(xué),四川 自貢 643000)
HBV血清是檢測(cè)患者是否感染HBV的鑒定標(biāo)準(zhǔn),目前已有學(xué)者表明采用醋酸纖維素膜與料銀納米顆粒SERS相結(jié)合的簡(jiǎn)單方法進(jìn)行血清蛋白分離和生化分析,其中銀納米顆粒是通過(guò)使用硝酸鹽和鹽酸羥胺制作而成的,加入銀納米顆??梢栽鰪?qiáng)蛋白質(zhì)拉曼信號(hào),另外,醋酸纖維素膜除了能除去蛋白質(zhì)以外,還能除去其他各種化學(xué)成分,為血清檢測(cè)提供了一種獨(dú)特的蛋白檢測(cè)手段。進(jìn)一步提高HBV血清的識(shí)別度。同時(shí)醋酸纖維素膜與銀納米顆粒可以與血清中的氨基酸、維生素、無(wú)機(jī)鹽、葡萄糖和蛋白質(zhì)等無(wú)機(jī)、有機(jī)混合物發(fā)生一定反應(yīng),進(jìn)一步促進(jìn)血清檢測(cè)效率。
目前對(duì)血清檢測(cè)通常采用拉曼光譜,而拉曼光譜分析法具有非接觸、速度快以及無(wú)損的優(yōu)點(diǎn)[1-3],近年來(lái)拉曼光譜分析成為有機(jī)化學(xué)、材料科學(xué)、生物醫(yī)學(xué)等研究領(lǐng)域的研究熱點(diǎn)問(wèn)題[4-5]。拉曼光譜進(jìn)行生物樣品檢測(cè)時(shí),樣品無(wú)需進(jìn)行前置處理并且樣品用量少。由于拉曼光譜資料具有特征峰多、數(shù)據(jù)維數(shù)大等缺陷,因此能夠獲得較好的生物樣本資料;拉曼光譜對(duì)生物探測(cè)的準(zhǔn)確性有直接的影響。為了提高HBV血清檢測(cè)的精度,降低拉曼光譜的冗余信息和特征峰值數(shù)量,提出一種基于連續(xù)投影法的拉曼光譜特征波長(zhǎng)篩選和灰狼優(yōu)化算法優(yōu)化極限學(xué)習(xí)機(jī)[6]的HBV血清檢測(cè)模型。在醋酸纖維素膜與銀納米顆粒對(duì)血清進(jìn)行分離的基礎(chǔ)上,針對(duì)HBV血清拉曼光譜數(shù)據(jù)具有維度高、非線性強(qiáng)的特點(diǎn),將拉曼光譜、連續(xù)投影法、主組分法等多種光譜的特征篩查進(jìn)行了比較,并初步建立了一種用于 HBV的熒光光譜的光譜特性波長(zhǎng)選擇??紤]到 ELM模式的參數(shù)設(shè)定會(huì)對(duì) ELM模式進(jìn)行性能的影響,采用 GWO方法進(jìn)行 ELM模型的參數(shù)優(yōu)選,并采用GWO-ELM方法進(jìn)行了基于GWO-ELM的 HBV病毒抗體的識(shí)別。與PSO-ELM、GA-ELM和ELM相比,GWO-ELM的HBV血清檢測(cè)模型的識(shí)別精度最高,為HBV血清檢測(cè)提供了新的方法。
銀納米顆粒是通過(guò)使用硝酸鹽和鹽酸羥胺生產(chǎn)的。首先將10 mL鹽酸羥胺溶液(6×10-2mol/L)與9 mL氫氧化鈉溶液(10-2mol/L),并將混合物加入到180 mL硝酸銀(1.11×10-3mol/L)中,然后將混合溶液在室溫下連續(xù)攪拌15 min。銀納米顆粒的尺寸遵循平均直徑為45 nm,標(biāo)準(zhǔn)偏差為8 nm。
為驗(yàn)證本文方法進(jìn)行拉曼光譜生物醫(yī)學(xué)檢測(cè)的效果,選取2例 HBV病人的血樣和2例正常人群的血樣進(jìn)行檢測(cè)。10 μL的血清用吸管在醋酸纖維薄膜上進(jìn)行標(biāo)記;1 min后,該標(biāo)本已被膜完全吸附。之后,將包含血清的醋酸酯薄膜的部位切開(kāi),并在包含10 mL冰乙酸、90 mL體積分?jǐn)?shù)95%酒精和100 mL超級(jí)純水的緩沖劑中清洗,以除去包含在血漿中的其他成分(諸如電解質(zhì)和某些外來(lái)物質(zhì)),并且將血漿蛋白質(zhì)僅保留在醋酸纖維薄膜中。隨后,將僅含有血清蛋白的醋酸纖維素膜切割并收集在管中,并向管中加入60 μL乙酸,目的是將醋酸纖維素膜的片段溶解到透明溶液中。之后,將 140 μL 膠體銀納米顆粒加入試管中。將管置于37 ℃溫水中,將混合物攪拌30 min。在此過(guò)程中,絮狀沉淀物(溶解的膜碎片)出現(xiàn)在管中。離心后(1 000 r/min,10 min),收集 10 μL 上清液(蛋白質(zhì)-銀納米顆?;旌衔?并轉(zhuǎn)移到鋁板上進(jìn)行拉曼光譜測(cè)量,選取每個(gè)樣品的中心位置,分別測(cè)試得到50組拉曼光譜數(shù)據(jù)。首先使用離心機(jī)提取全血的血清,然后在測(cè)試晶片上用棉花蘸取血液樣本,待血清風(fēng)干之后進(jìn)行檢測(cè)。用拉曼光譜測(cè)定血清,用最高峰值的拉曼光譜進(jìn)行規(guī)范化處理,得到拉曼光譜圖。在圖1、圖2及圖3、圖4分別為2個(gè)正常人的血清和2個(gè)B型感染人的血清。
圖1 測(cè)試區(qū)域和光譜圖Fig.1 Test area and spectrogram
圖2 測(cè)試區(qū)域和光譜圖 Fig.2 Test area and spectrogram
圖3 測(cè)試區(qū)域和光譜圖Fig.3 Test area and spectrogram
圖4 測(cè)試區(qū)域和光譜圖Fig.4 Test area and spectrogram
標(biāo)準(zhǔn)的GWO算法包括3種行為:包圍行為、捕獵行為以及攻擊行為[7]。
1.2.1包圍行為
這一階段,按照式(1)和(2)式對(duì)灰狼進(jìn)行圍捕:
(1)
(2)
1.2.2捕獵行為
α、β、δ分別為最優(yōu)解、第2解和第3解,則α、β、δ根據(jù)式(3)~式(5)可以重新定位[8]:
(3)
(4)
(5)
(6)
(7)
(8)
(9)
1.2.3攻擊行為
該階段,狼群攻擊捕獲獵物。當(dāng)|A|≤1時(shí),狼接近目標(biāo)(X*,Y*)并將目標(biāo)鎖定在目標(biāo)身上;當(dāng)|A|>1時(shí),狼從他們的捕食范圍內(nèi)移開(kāi),去找新的目標(biāo)。
ELM模型的輸入層權(quán)重值與隱含層偏置值初始值是隨機(jī)產(chǎn)生,通過(guò)反復(fù)訓(xùn)練,不斷調(diào)整逼近期望輸出。為改進(jìn)ELM模型初始權(quán)值和隱含層偏置對(duì)檢測(cè)結(jié)果的影響,提高ELM模型的性能,本文采用GWO算法優(yōu)化ELM模型參數(shù),將平均誤差作為適方函數(shù)的選取[9]:
(10)
式中:Ti和Oi是第一采樣的真實(shí)值和期望值;k用于培訓(xùn)的樣本數(shù)目;wmin、wmax分別為輸入權(quán)值w的取值上限和下限[10-12];bmin、bmax分別為隱含層偏置b的取值上限和下限。
基于GWO改進(jìn)ELM模型的血清檢測(cè)的算法流程如下。
Step1:讀取乙肝血清近紅外拉曼光譜數(shù)據(jù),并過(guò)程進(jìn)行標(biāo)準(zhǔn)化,同時(shí)對(duì)測(cè)試數(shù)據(jù)進(jìn)行分割:
(11)
式中:拉曼光譜的最大值和最小值是xmax和xmin;LB和UB為標(biāo)準(zhǔn)化后的Raman譜的最大值和最小值,取LB=-1,UB=1;x和xnew為原始拉曼光譜數(shù)據(jù)與歸一化處理之后的拉曼光譜數(shù)據(jù);
Step2:固定 GWO的方法主要包括:最大迭代數(shù)Tmax;搜索維D;群體規(guī)模N;w和b的搜尋區(qū)間是[wmin,wmax]和[bmin,bmax]。將灰狼群的初始群體進(jìn)行隨機(jī)初始化,各群體的位置與ELM模式的輸入權(quán)重及隱含層偏差的參數(shù)結(jié)合(w,b);
Step3:每個(gè)灰狼種的適應(yīng)程度由式(10)來(lái)計(jì)算[13];
Step4:根據(jù)適應(yīng)程度的不同,灰狼的數(shù)量被分為2類(lèi)α、β、δ和ω;
Step5:按照式(3)~式(5)更新灰狼種群個(gè)體的位置;
Step6:計(jì)算灰狼群中的更新點(diǎn)的適應(yīng)程度f(wàn)(w,b)new,并與上一代最優(yōu)適應(yīng)度f(wàn)(w,b)best相比較,如果f(w,b)new>f(w,b)best,則該灰狼種群個(gè)體適應(yīng)度f(wàn)(w,b)new替換掉f(w,b)best,并且保存這一群體的個(gè)體的地理分布;否則,保留f(w,b)best;
Step7:判定方法結(jié)束條件,如果目前的迭代數(shù)為t>Tmax,則該方法結(jié)束,并給出最優(yōu)化的最優(yōu)化位置,也就是ELM的最佳參數(shù)(w*,b*)。相反,則回到Step3到Step6的迭代式;
Step8:運(yùn)用ELM模型的最優(yōu)參數(shù)組合(w*,b*)對(duì)測(cè)試數(shù)據(jù)進(jìn)行血清檢測(cè)[14]。
基于GWO改進(jìn)ELM模型的HBV血清檢測(cè)的建模流程可以描述:
(1)選擇血清樣本;
(2)采集HBV者和正常人的拉曼光譜;
(3)拉曼光譜數(shù)據(jù)預(yù)處理;
(4)建立HBV血清GWO-ELM檢測(cè)模型;
(5)HBV血清檢測(cè)模型的驗(yàn)證。
拉曼光譜的預(yù)處理技術(shù)主要有:一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、多元散射以及標(biāo)準(zhǔn)化的正態(tài)變化法[15]。原始數(shù)據(jù)在表1中顯示了各種預(yù)加工模式下的模型探測(cè)。
表1 不同預(yù)處理方式的建模檢測(cè)結(jié)果對(duì)比Tab.1 Comparison of modeling test results with different pretreatment methods
由表1可知,使用多重散射修正(MSC)進(jìn)行模型檢驗(yàn)是最佳的[16]。故本文使用 MSC的拉曼光譜化學(xué)分析進(jìn)行了預(yù)處理,建模方法采用ELM模型。
HBV拉曼光譜資料的特征:信號(hào)峰多,數(shù)據(jù)多,HBV血清檢測(cè)模型建立之前需要先對(duì)拉曼光譜數(shù)據(jù)進(jìn)行特征波長(zhǎng)選擇。文中分別運(yùn)用全波段(FS)、連續(xù)投影法[17-18](SPA)和主成分分析(PCA)進(jìn)行乙肝血清近紅外拉曼光譜有效特征波長(zhǎng)選擇。在選擇了有效特性波長(zhǎng)之后,模型探測(cè)的結(jié)果比較如下。由表2可知,采用持續(xù)投射方法進(jìn)行的 HBV血清模型試驗(yàn)效果最佳。
表2 波長(zhǎng)選擇結(jié)果對(duì)比Tab.2 Comparison of wavelength selection results
由表3可知,第1個(gè)主成分(PC1)的貢獻(xiàn)率為64.84%;第2個(gè)主成分(PC2)的貢獻(xiàn)率為26.24%,前2個(gè)主成分累計(jì)貢獻(xiàn)率達(dá)到了91.07%。
表3 PCA前7個(gè)主成分的貢獻(xiàn)率和累計(jì)貢獻(xiàn)率Tab.3 Contribution rate and cumulative contribution rate of the first seven principal components of PCA
從圖5可以看出,主成分?jǐn)?shù)為8時(shí),HBV血清檢測(cè)的正確率最高,均方根誤差最小。
圖5 SPA有效特征波長(zhǎng)選擇結(jié)果Fig.5 SPA effective characteristic wavelength selection results
為了驗(yàn)證GWO-ELM模型的有效性和可靠性,將GWO-ELM與PSO-ELM、GA-ELM和ELM模型進(jìn)行對(duì)比[19]。ELM模型的激活函數(shù)為sig函數(shù),為確定隱層節(jié)點(diǎn)數(shù),初始隱層節(jié)點(diǎn)數(shù)為1時(shí),其不斷增加,直到隱層節(jié)點(diǎn)數(shù)為50;不同隱層節(jié)點(diǎn)數(shù)的HBV血清檢測(cè)準(zhǔn)確率如圖6所示。
圖6 隱層節(jié)點(diǎn)數(shù)與準(zhǔn)確率關(guān)系圖Fig.6 Relationship between number of hidden layer nodes and accuracy
從圖6可以看出,SPA-ELM模型的隱層節(jié)點(diǎn)數(shù)為30時(shí),HBV血清檢測(cè)的準(zhǔn)確率最高,故文中ELM模型的隱層節(jié)點(diǎn)數(shù)設(shè)定為30。在表4中給出了各種模式的校正集合和預(yù)報(bào)集合的評(píng)估準(zhǔn)確率。
由表4可知,在校正集和預(yù)測(cè)集上,GWO-ELM的準(zhǔn)確率分別為92.02%和81.69%,優(yōu)于PSO-ELM的90.80%和78.87%;GA-ELM的89.57%和76.06%以及ELM的88.96%和74.65%。與ELM模型相比,GWO-ELM的HBV血清檢測(cè)的準(zhǔn)確率分別提高了3.06%和7.04%,說(shuō)明GWO-ELM有效提高了HBV血清檢測(cè)的精度。
表4 不同模型評(píng)價(jià)結(jié)果Tab.4 Evaluation results of different models
為了進(jìn)一步說(shuō)明GWO-ELM對(duì)HBV血清檢測(cè)的有效性,將GWO-ELM與隨機(jī)森林回歸(RFR)、網(wǎng)格搜索優(yōu)化隨機(jī)森林回歸(Grid-RFR)和粒子群優(yōu)化隨機(jī)森林回歸(PSO-RFR)進(jìn)行對(duì)比,對(duì)比結(jié)果如表5所示。
表5 不同算法HBV血清檢測(cè)結(jié)果Tab.5 HBV serum detection results of different algorithms
由表5可知,在校正集和測(cè)試集上,GWO-ELM模型HBV血清檢測(cè)的準(zhǔn)確率最高。在評(píng)價(jià)指標(biāo)準(zhǔn)確率、精準(zhǔn)率、召回率和Fscore4個(gè)評(píng)價(jià)指標(biāo)上,GWO-ELM均優(yōu)于PSO-RFR模型、Grid-RFR模型和RFR模型,從而驗(yàn)證了GWO-ELM進(jìn)行HBV血清檢測(cè)的有效性和可靠性,為HBV血清檢測(cè)提供了新的方法。
拉曼光譜技術(shù)是一種無(wú)創(chuàng)、無(wú)損的光學(xué)工具,可用于通過(guò)激光激發(fā)生物標(biāo)本的振動(dòng)和旋轉(zhuǎn)光譜信息來(lái)研究生物分子的光譜分布。血清拉曼光譜分析已被用于檢測(cè)核酸,蛋白質(zhì)和脂質(zhì)的存在。拉曼光譜的形狀和趨勢(shì)可能有助于識(shí)別這些分子成分的變化。一些光譜指紋可能與對(duì)疾病診斷和分類(lèi)有用的特定生物標(biāo)志物相關(guān)聯(lián)。早期研究還表明,使用血清拉曼光譜分析診斷HBV可能是可行的。本研究分析了2例 HBV病人的血樣和2例正常人群的血樣進(jìn)行拉曼光譜檢測(cè)。分別運(yùn)用全波段(FS)、連續(xù)投影法(SPA)和主成分分析(PCA)進(jìn)行HBV血清近紅外拉曼光譜有效特征波長(zhǎng)選擇。從模型探測(cè)的結(jié)果可知,采用連續(xù)投射方法進(jìn)行的 HBV血清模型試驗(yàn)效果最佳。機(jī)器學(xué)習(xí)技術(shù)已被用于分析高維拉曼光譜數(shù)據(jù)。且先前的研究表明,在識(shí)別性能方面,SPA算法優(yōu)于其他傳統(tǒng)分類(lèi)算法,例如FS,PCA等。
通過(guò)將ELM-GWO與優(yōu)化方法集成,可以實(shí)現(xiàn)最佳的輸入權(quán)重和隱藏層偏差,從而保證最佳的ELM/GWO性能,從而有效識(shí)別HBV血清。極限學(xué)習(xí)機(jī)(ELM)是近年來(lái)提出的一種新算法,它基于單隱層前饋神經(jīng)網(wǎng)絡(luò)(SLFN),解決了神經(jīng)網(wǎng)絡(luò)中隱含層數(shù)難以確定的問(wèn)題,且ELM具有學(xué)習(xí)速度更快,泛化能力好,產(chǎn)生獨(dú)特的最優(yōu)解等特點(diǎn)。因此,ELM最受歡迎的改進(jìn)之一是灰狼優(yōu)化-極限學(xué)習(xí)機(jī)(GWO-ELM),其中GWO集成到ELM中,以獲得最佳的輸入權(quán)重和偏差。GWO是通過(guò)研究灰狼的狩獵行為而建立的,其概念簡(jiǎn)單,易于實(shí)現(xiàn),只需要很少的編碼行,允許許多人利用它。與其他進(jìn)化算法相比,GWO在調(diào)節(jié)參數(shù)方面具有更高的計(jì)算效率。這種整合 (GWO-ELM) 的有效性已在本文中所證實(shí),該方法可以有效地改善 HBV的血清學(xué)診斷的正確性。
為了提高HBV血清檢測(cè)的精度,基于連續(xù)投射技術(shù)的特點(diǎn)波長(zhǎng)篩選和灰狼優(yōu)化算法對(duì)極限學(xué)習(xí)機(jī)的血清檢測(cè)模式的改進(jìn)。為提高ELM模型的性能,運(yùn)用GWO算法優(yōu)化選擇ELM模型的輸入權(quán)值和隱含層偏置,本文介紹了一種基于GWO-ELM技術(shù)的連續(xù)投射技術(shù)進(jìn)行特征波長(zhǎng)篩選的HBV血清學(xué)研究。與PSO-ELM、GA-ELM和ELM相比,利用GWO-ELM技術(shù)建立的 HBV血清檢測(cè)方法能有效地改善 HBV的血清學(xué)診斷的正確性,為HBV血清檢測(cè)提供了新的方法。