亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多變量光譜數(shù)據(jù)分析方法的乳腺癌血清拉曼光譜特征研究

        2023-02-22 06:42:42張寶萍張富榮陳一申張占琴
        光譜學(xué)與光譜分析 2023年2期
        關(guān)鍵詞:曼光譜光譜準(zhǔn)確率

        張寶萍, 寧 甜, 張富榮, 陳一申, 張占琴, 王 爽*

        1. 西北大學(xué)光子學(xué)與光子技術(shù)研究所, 陜西 西安 721710 2. 西安交通大學(xué)第一附屬醫(yī)院, 陜西 西安 710061

        引 言

        乳腺癌是乳腺上皮細(xì)胞在多種致癌因子作用下, 發(fā)生增值失控的現(xiàn)象[1]。 乳腺癌發(fā)病率和致死率雖位于女性惡性腫瘤首位, 但如在早期得到診斷治療, 約90%的病例可以治愈[2]。 臨床常采用影像學(xué)(鉬靶和超聲相結(jié)合)和體格檢查, 結(jié)合穿刺或切除活檢的方式, 開展乳腺癌早期篩查與病理診斷。 準(zhǔn)確的組織學(xué)病理診斷, 對(duì)制定恰當(dāng)?shù)呐R床治療方案及預(yù)后評(píng)估意義重大, 這要求檢測(cè)人員具有深厚的專業(yè)知識(shí)背景與臨床經(jīng)驗(yàn)。 相比于細(xì)胞、 組織等其他臨床病理樣品, 血液更容易采集, 且其生化構(gòu)成變化信息在醫(yī)學(xué)影像學(xué)中常檢測(cè)到的臨床癥狀出現(xiàn)之前, 就會(huì)出現(xiàn)較為明顯的變化[3-4]。 研究血液樣品生化分析技術(shù), 有望發(fā)展一種針對(duì)乳腺癌早期篩查與診斷技術(shù)。

        振動(dòng)光譜[包括紅外光譜和拉曼光譜(Raman spectroscopy, RS)]技術(shù)能夠以快速、 無損、 非侵入式的方式特異性闡釋生物構(gòu)成信息, 已被研究證明具有提供檢測(cè)及診斷信息的能力[1], 其在研究惡性疾病病理演進(jìn)、 早期診斷和預(yù)后評(píng)估等方面具有重要應(yīng)用價(jià)值。 紅外光譜根據(jù)入射光頻率被分為近紅外(near-IR, NIR)、 中紅外(mid-IR, MIR)和遠(yuǎn)紅外光譜(far-IR, FIR), 其中, MIR是分析生物材料的主要技術(shù), 因?yàn)樗w了重要生物分子的基本振動(dòng)模式。 NIR光譜也可以作為生物光譜分析工具, 但由于其主要由MIR泛音組成, 使得該信號(hào)非常復(fù)雜且包含許多重疊的特征, 例如: 使用NIR進(jìn)行生物標(biāo)志物識(shí)別比MIR更困難、 更模糊。 而拉曼散射可以用于光譜的紫外光、 可見光或NIR區(qū)域, 因而可以在本質(zhì)上提供更高的空間分辨率[5]。 相對(duì)于紅外光譜, 水的O—H振動(dòng)在拉曼光譜中極弱, 使得拉曼光譜更適合于某些生物醫(yī)學(xué)應(yīng)用, 特別是體液樣本(血漿、 血清、 唾液或尿液)的分析測(cè)量[6]。 在基于血液樣本(血漿、 血清)拉曼光譜惡性腫瘤診斷方面, 許多研究團(tuán)隊(duì)已開展了多項(xiàng)實(shí)驗(yàn)探索。 其中, Lin等通過血漿表面增強(qiáng)拉曼光譜技術(shù)建立了鼻咽癌腫瘤病理分期方法[7]; Li等[8]結(jié)合多變量光譜數(shù)據(jù)分析方法, 探索了基于血漿共振拉曼光譜分析技術(shù)的食道癌檢測(cè)方法; Wang等[9]通過血清激光拉曼光譜技術(shù)探討了該技術(shù)在非小細(xì)胞肺癌早期篩查和臨床分期中的作用; Bilal等[10]結(jié)合偏最小二乘回歸分析, 通過血清拉曼光譜技術(shù)表明了乳腺癌從健康到癌變過程中的生化變化。

        采用顯微拉曼光譜檢測(cè), 分析不同病變階段(健康, 早期癌變和晚期癌變)乳腺癌血清樣品生化特征信息, 采用主成分分析(principal component analysis, PCA)與線性判別分析(linear discriminant analysis, LDA)、 支持向量機(jī)(support vector machines, SVM)和偏最小二乘算法(partial least squares discriminant analysis, PLS-DA)等多種光譜分析手段, 構(gòu)建多種光譜數(shù)據(jù)歸類鑒別模型。 進(jìn)而, 采用留一交叉驗(yàn)證方法(leave-one-out cross-validation, LOOCV)評(píng)估、 比較這些模型的靈敏度、 特異性和準(zhǔn)確率, 最終, 闡釋血清拉曼光譜分析技術(shù)在乳腺癌早期篩查與病理分期分級(jí)中的應(yīng)用基礎(chǔ)。

        1 實(shí)驗(yàn)部分

        1.1 樣品

        血清樣品來源于西安交通大學(xué)第一附屬醫(yī)院。 根據(jù)臨床診斷, 樣品包括健康(healthy, H)、 早期癌癥(early cancer, EC)和晚期癌癥(advanced cancer, AC)三種類型, 其中, 10名健康志愿者經(jīng)檢查沒有任何疾病, 早期癌癥由20例浸潤性導(dǎo)管癌組成[臨床TNM分期分別為三期一級(jí)(s3g1)和三期二級(jí)(s3g2)], 晚期癌癥包括20例浸潤性導(dǎo)管癌[臨床TNM分期分別為三期三級(jí)(s3g3)和二期三級(jí)(s2g3)]。 早期和晚期癌癥組均在臨床通過病理學(xué)方法確診, 其中, 健康組年齡36~69歲, 平均53歲, 早期癌癥組的年齡為49~68歲, 平均為62歲, 晚期癌癥組的年齡為46~79歲, 平均為69歲。 禁食12 h后抽血采集的新鮮血液, 不添加任何抗凝劑, 用高速離心機(jī)(4 000 r·min-1)在4 ℃下離心20 min后, 提取上清液即血清, 用于拉曼光譜實(shí)驗(yàn)分析。 將獲得的血清分裝于離心管中并儲(chǔ)存在溫度為-80 ℃的冰箱中以備實(shí)驗(yàn)所需要。

        1.2 方法

        使用532 nm半導(dǎo)體激光器作為激發(fā)光源, 與顯微拉曼光譜系統(tǒng)(Alpha 500R, WITec GmbH, Germany)進(jìn)行拉曼光譜檢測(cè)。 血清樣品室溫解凍10 min后, 放置在內(nèi)徑0.5 mm、 外徑0.8 mm、 5 μL量的石英毛細(xì)管中, 以減小在實(shí)驗(yàn)過程中空氣對(duì)血清成分的影響, 降低激光對(duì)血清樣品的灼傷(樣品表面的最大激光功率約10 mW), 然后將其置于載物平臺(tái)用于光譜測(cè)量。 采用20倍顯微鏡激發(fā)樣品光譜, 并由拉曼光譜儀(UHTS300, WITec GmbH, Germany)采集600~3 000 cm-1范圍內(nèi)的光譜信息。 單個(gè)血清樣品每次光譜采集時(shí)間為5 s, 每種類型樣品獲取100條光譜。 實(shí)驗(yàn)測(cè)量前使用標(biāo)準(zhǔn)鎢燈(RS-3, EG&G Gamma Scientific, USA)校準(zhǔn)系統(tǒng)光譜響應(yīng), 并采用硅片520.7 cm-1光譜特征峰校準(zhǔn)系統(tǒng)波長。

        1.3 數(shù)據(jù)處理

        采用本團(tuán)隊(duì)自行開發(fā)的NWU-Spectral-Analysis(NWUSA)Toolbox[11], 對(duì)實(shí)驗(yàn)所采集的原始光譜依次進(jìn)行去宇宙射線、 扣除熒光背景、 九階多項(xiàng)式擬合, 以及五階Savitzky-Golay平滑等預(yù)處理。 預(yù)處理之后, 對(duì)每條光譜作曲線下面積歸一化, 以消除如激光功率不穩(wěn)定等外界因素的干擾; 然后將所有光譜特征峰的強(qiáng)度值矩陣進(jìn)行均值中心化, 以消除樣品內(nèi)和/或樣品間光譜變異性對(duì)多變量分析的干擾; 隨后采用主成分分析方法(PCA)降低光譜數(shù)據(jù)集維度, 并結(jié)合單因素方差分析(one-way ANOVA)提取、 識(shí)別顯著差異主成分信息(principal components, PCs,p<0.01)。 最后, 將所提取的PCs作為線性判別函數(shù)(LDA)的輸入變量, 生成PCA-LDA光譜特征鑒別模型, 并采用LOOCV方法驗(yàn)證此模型的分類鑒別能力。 此外, 將主成分信息輸入支持向量機(jī)(SVM)算法, 采用三種核函數(shù)(線性式、 多項(xiàng)式和RBF)構(gòu)建PCA-SVM模型。 該模型的分類鑒別性能主要受到誤差懲罰參數(shù)C, 以及核函數(shù)形式和參數(shù)影響。 對(duì)于線性SVM內(nèi)核只需要優(yōu)化一個(gè)誤差懲罰參數(shù)C, 在確定的特征子空間中C的取值小時(shí), 表明機(jī)器學(xué)習(xí)的復(fù)雜度小且經(jīng)驗(yàn)風(fēng)險(xiǎn)值較大; 當(dāng)C取無窮大時(shí), 滿足所有約束條件, 意味著訓(xùn)練樣本必須準(zhǔn)確地分類; 當(dāng)C超過一定值時(shí), SVM的復(fù)雜度達(dá)到了特征子空間允許的最大值, 其經(jīng)驗(yàn)風(fēng)險(xiǎn)值和泛化性能幾乎不再變化。 對(duì)于多項(xiàng)式和RBF核函數(shù), 除需優(yōu)化參數(shù)C外, 還需要分別對(duì)多項(xiàng)式階數(shù)(d)和RBF核函數(shù)寬度(γ)進(jìn)行優(yōu)化, 其中d值越大, 多項(xiàng)式核矩陣元素值與核函數(shù)維度越大, 計(jì)算也越復(fù)雜, 對(duì)數(shù)據(jù)的分類能力更好, 但易出現(xiàn)過擬合現(xiàn)象; RBF核函數(shù)中的參數(shù)γ定義了單個(gè)樣本對(duì)整個(gè)分類超平面的影響, 當(dāng)γ比較小時(shí), 單個(gè)樣本對(duì)整個(gè)分類超平面的影響比較小, 反之, 當(dāng)γ比較大時(shí), 單個(gè)樣本對(duì)整個(gè)分類超平面的影響比較大, 更容易被選擇為支持向量[12]。 研究以80%實(shí)驗(yàn)數(shù)據(jù)構(gòu)造訓(xùn)練數(shù)據(jù)集, 采用網(wǎng)格搜索結(jié)合LOOCV來優(yōu)化每個(gè)核的參數(shù), 獲取分類精度最高的參數(shù)作為構(gòu)建最終SVM模型的最佳參數(shù), 并將其應(yīng)用于驗(yàn)證測(cè)試集數(shù)據(jù)(其他20%光譜數(shù)據(jù))。 在構(gòu)建PCA-LDA和PCA-SVM模型后, 進(jìn)一步通過均值中心化后的強(qiáng)度矩陣構(gòu)建偏最小二乘分類(PLS-DA)模型。 最終, 采用LOOCV方法評(píng)估、 比較三種判別模型光譜鑒別分析性能。

        2 結(jié)果與討論

        2.1 乳腺癌血清樣品的拉曼光譜

        表1 血清拉曼光譜特征峰位及其生化分配Table 1 Raman spectral characteristic peaks of serum and their biochemical assignments

        圖1(a) 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)血清原始拉曼光譜Fig.1(a) Original serum Raman Spectra from Healthy (H), Early Breast Cancer (EC, s3g1, s3g2), and Advanced Cancer (AC, s3g3, s2g3) groups

        圖1(b) 每一步預(yù)處理后的數(shù)據(jù)圖(以健康組為例)Fig.1(b) Plot of data after each step of pre-processing (healthy)

        圖2 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)血清平均拉曼光譜Fig.2 Mean serum Raman spectra from Healthy (H), Early Breast Cancer (EC, s3g1, s3g2), and Advanced Cancer (AC, s3g3, s2g3) groups

        2.2 PCA-LDA模型

        從圖2可以看出, 不同血清樣品表現(xiàn)出較為相似的光譜特征, 如果僅從個(gè)別拉曼峰位、 峰值、 峰強(qiáng)等光譜參量特征分析, 無法準(zhǔn)確反映樣品所隱含的組織癌變信息。 為了獲取更具代表性的分子光譜特征信息, 在有效剔除光譜背景干擾后, 采用多模數(shù)據(jù)歸類分析方法, 將大量的光譜數(shù)據(jù)約化為可管理且含有豐富信息的形式, 將主成分(PCA)和線性判別分析方法(LDA)相結(jié)合, 建立PCA-LDA分析方法, 分別對(duì)實(shí)驗(yàn)光譜數(shù)據(jù)的低波數(shù)(600~1 800 cm-1)和高波數(shù)區(qū)域(2 800~3 000 cm-1)的特征信息進(jìn)行分析計(jì)算, 并通過One-way ANOVA(p<0.01)識(shí)別前三個(gè)最具顯著差異的PC值(PC1, PC2和PC3), 其主成分載荷分布及其光譜如圖3所示。 PC1在光譜數(shù)據(jù)集中占總方差(52.37%)最大, 而PC2和PC3分別占總方差的18.42%和5.18%。 如圖3(a)—(c)所示, 對(duì)于不同血清樣品而言, PC1的正半軸上主要分布EC組, 負(fù)軸上分布H組與AC組; 而PC2正半軸上的載荷分布只有H和EC組中的s3g1血清樣品, 負(fù)半軸部分則分布著AC與EC組中的s3g2血清樣品載荷; PC3正半軸分布著AC組s2g3和EC組s3g1血清樣品, 負(fù)半軸則分布著EC組s3g2, AC組s3g3和H組。 圖3(d)所示為PC1, PC2和PC3載荷光譜, 與圖2中血清特征光譜相對(duì)比, 可以發(fā)現(xiàn)每個(gè)主成分載荷中的正負(fù)特征均來源于血清中生化光譜特征變化。 具體而言, PC1載荷光譜主要表現(xiàn)為, 苯基丙氨酸(1 003 cm-1)、 β型類胡蘿卜素(1 159與1 524 cm-1)和蛋白質(zhì)(2 663 cm-1)成分的負(fù)向光譜貢獻(xiàn), 以及脂類成分(2 928 cm-1)的正向光譜貢獻(xiàn); PC2與PC1載荷光譜之間的載荷光譜差別主要表現(xiàn)為, β型類胡蘿卜素(1 159, 1 524 cm-1)、 蛋白質(zhì)(2 663 cm-1)和脂質(zhì)(1 668, 2 928 cm-1)的負(fù)向光譜貢獻(xiàn); PC3的載荷光譜噪聲相對(duì)較大, 但其與PC1和PC2的主要差別為正向的β型類胡蘿卜素(1 524 cm-1)光譜特征。 結(jié)合圖2所示血清特征光譜分析, PC1所提取的負(fù)特征主要來自H和AC組血清光譜貢獻(xiàn), 而其正特征主要來自EC組患者血清光譜; PC2所提取的負(fù)特征主要來自EC組(s3g2)和AC組患者血清光譜貢獻(xiàn), 而其正特征主要來自H組和EC(s3g1)患者血清的光譜貢獻(xiàn); PC3所提取的負(fù)特征則主要來自EC組(s3g2)、 AC組(s3g3)和H組血清光譜貢獻(xiàn), 而其正特征主要來自AC組(s2g3)和EC組(s3g1)血清光譜貢獻(xiàn)。 這與圖3(a), (b)和(c)圖中所顯示的分布結(jié)果一致, 表明通過主成分差異光譜信息可以來描述不同血清之間潛在的生化差異。

        圖3 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)組血清主成分載荷分布圖(a): PC1與PC2; (b): PC1與PC3; (c): PC2與PC3; (d): PC1, PC2和PC3載荷光譜Fig.3 Scatter plots of the main components of the healthy (H), early cancer (EC, s3g1, s3g2) and advanced cancer (AC, s3g3, s2g3) groups(a): PC1 versus PC2; (b): PC1 versus PC3; (c): PC2 versus PC3; (d): The PCA loading of PC1, PC2 and PC3

        把所提取的最顯著差異主成分光譜信息, 用于H, EC(s3g1, s3g2)和AC(s3g3, s2g3)組血清的光譜特征鑒別分類, 即, 采用PC1, PC2 和PC3作為LDA的輸入變量, 構(gòu)建生成PCA-LDA分類診斷模型, 如圖4所示。 H, EC和AC組不同病理階段的血清之間分離明顯, 分別被第一和第二個(gè)判別函數(shù)區(qū)分。 第一判別函數(shù)的正半軸分布著EC組s3g2與AC組s3g3血清光譜, 負(fù)半軸主要分布著H, EC組s3g1和AC組s2g3血清光譜; 第二判別函數(shù)的正半軸則分布的是H組、 AC組(s2g3, s3g3)血清光譜, 負(fù)軸上則分布的是EC組(s3g1, s2g3)血清光譜。 通過LOOCV交叉驗(yàn)證, 如表2所示的混淆矩陣中, 絕大部分血清光譜特征被準(zhǔn)確診斷分類, 只有s2g3和s3g1患者的血清光譜出現(xiàn)較小的錯(cuò)誤分類結(jié)果, 這可能來源于兩者相似的光譜參量特征。 以上結(jié)果表明, 基于PCA-LDA算法鑒別靈敏度分別為100%, 100%, 100%, 100%和99%, 特異性分別為100%, 99.75%, 100%, 100%和100%, 總體分類準(zhǔn)確率為99%。

        圖4 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)組血清的PCA-LDA分?jǐn)?shù)散點(diǎn)圖Fig.4 Scatter plots of the PCA-LDA scores of the serum in the healthy(H), early cancer (EC, s3g1, s3g2) and advanced cancer (AC, s3g3, s2g3) groups

        表2 PCA-LDA結(jié)合LOOCV對(duì)五種血清的拉曼光譜進(jìn)行分類的結(jié)果Table 2 Results of classifying the Raman spectra of the five sera based on the PCA-LDA algorithm combined with LOOCV

        2.3 PCA-SVM模型

        采用PCA對(duì)光譜數(shù)據(jù)集進(jìn)行降維并提取其特征信息后, 把最顯著特征變量PC1和PC2輸入至SVM算法, 建立PCA-SVM診斷模型, 篩選實(shí)驗(yàn)所獲H、 EC和AC組血清光譜數(shù)據(jù)的特征信息。 在此基礎(chǔ)上, 利用網(wǎng)格搜索方法結(jié)合交叉驗(yàn)證從訓(xùn)練集光譜(占數(shù)據(jù)總量的80%)中確定線性核、 多項(xiàng)式核與RBF的最優(yōu)參數(shù), 用以觀察PCA-SVM模型訓(xùn)練過程中不同參數(shù)對(duì)分類精度的影響。 如圖5(a)和(b)所示為不同參數(shù)對(duì)分類精度影響的三維曲面圖。 在圖5(a)中, RBF內(nèi)核PCA-SVM 模型中參數(shù)C在2-8~210的范圍內(nèi)變化, 參數(shù)γ在2-10~210的范圍內(nèi)變化; 并且隨著C和γ在這一變化范圍內(nèi)增大, RBF核的精度逐漸提高。 實(shí)驗(yàn)結(jié)果表明, 當(dāng)C=0.125,γ=256時(shí), 模型的準(zhǔn)確率達(dá)到了最高95.625%。 當(dāng)構(gòu)建多項(xiàng)式內(nèi)核PCA-SVM模型時(shí), 同樣需要對(duì)兩個(gè)參數(shù)(參數(shù)C和多項(xiàng)式階數(shù)d)進(jìn)行優(yōu)化, 如圖5(b)中所示。 當(dāng)C值逐漸增大、 多項(xiàng)式階數(shù)d相應(yīng)減小時(shí), 光譜鑒別準(zhǔn)確率也逐漸提高; 參數(shù)C=0.003, 多項(xiàng)式階數(shù)d=1時(shí), 模型的分類準(zhǔn)確率最高, 可以達(dá)到95.625%。 對(duì)于線性核PCA-SVM模型, 只需要優(yōu)化一個(gè)參數(shù)C, 如圖5(c)顯示了分類精度與參數(shù)C的關(guān)系, 當(dāng)C=0.003時(shí), 分類準(zhǔn)確率達(dá)到最高值95.625%。

        圖5 (a)RBF內(nèi)核PCA-SVM模型分類準(zhǔn)確率隨參數(shù)C和γ變化關(guān)系; (b)多項(xiàng)式內(nèi)核PCA-SVM模型分類準(zhǔn)確率隨參數(shù)C和多項(xiàng)式階數(shù)d的變化關(guān)系; (c)線性核函數(shù)PCA-SVM算法分類準(zhǔn)確度與參數(shù)C的關(guān)系Fig.5 (a) 3D classification accuracy plot of parameters C and γ in RBF kernel PCA-SVM model; (b) 3D classification accuracy plot of C and polynomial order d in polynomial kernel PCA-SVM model; (c) The classification accuracy of linear kernel function PCA-SVM algorithm with parameter C

        在優(yōu)化SVM算法核參數(shù)后, 對(duì)測(cè)試集光譜特征進(jìn)行鑒別分析, 如表3所示。 RBF核PCA-SVM模型在測(cè)試集中的分類準(zhǔn)確率為94%, 而線性核PCA-SVM模型和多項(xiàng)式核PCA-SVM模型的分類準(zhǔn)確率均為92%。 比較三種內(nèi)核函數(shù)PCA-SVM模型的準(zhǔn)確率, RBF核函數(shù)PCA-SVM模型明顯高于線性核函數(shù)和多項(xiàng)式核。 由于RBF核函數(shù)PCA-SVM算法所具有的簡單性, 以及對(duì)任意復(fù)雜度數(shù)據(jù)的建模能力, RBF核函數(shù)PCA-SVM模型被認(rèn)為是SVM中更合理的選擇[19]。 此外, 三種內(nèi)核函數(shù)的PCA-SVM模型性能與訓(xùn)練集相比略有差異, 但差異在允許范圍內(nèi), 說明三種SVM分類模型沒有出現(xiàn)明顯的過擬合現(xiàn)象。

        表3 基于RBF、 多項(xiàng)式與線性核函數(shù)的PCA-SVM診斷模型對(duì)血清測(cè)試集的光譜進(jìn)行分類Table 3 The spectra of the serum test set were classified based on the PCA-SVM diagnostic models of the RBF, polynomial, and linear kernel functions, respectively

        2.4 PLS-DA模型

        分別討論P(yáng)CA-LDA和PCA-SVM診斷模型對(duì)于不同血清樣品的鑒別分析性能后, 均值中心化所有光譜特征峰的強(qiáng)度矩陣, 構(gòu)建PLS-DA模型, 并將該模型的性能與上述兩類鑒別手段進(jìn)行比較。 對(duì)H, EC和AC組光譜數(shù)據(jù)進(jìn)行PLS-DA算法, 計(jì)算LVs, 構(gòu)建來自不同血清樣本的數(shù)據(jù)集之間的關(guān)系, 并將其顯示在評(píng)分散點(diǎn)圖中。 圖6(a), (b)和(c)分別顯示了數(shù)據(jù)集的前三個(gè)LVs(LV1和LV2, LV1和LV3及LV2和LV3)的散點(diǎn)分布。 在圖6(a)和(b)中, H組與EC組的s3g1完全分布在LV1正半軸部分, AC組分布在LV1負(fù)半軸部分。 根據(jù)圖6(a)和(c), LV2的零線將H組與EC組和AC組明顯區(qū)分。 在圖6(b)與(c)中, AC組的s2g3分布于LV3正半軸部分, EC組、 H組和AC組的s3g3均分布在LV3的負(fù)半軸部分, 分布差異不明顯。 如圖6(d)所示, 通過分析LV1, LV2與LV3載荷光譜, 提取不同病理階段乳腺癌血清中的分子特征信息。 LV1載荷光譜特征主要為正向加載, 主要表現(xiàn)為苯基丙氨酸(1 003 cm-1)、 β型類胡蘿卜素(1 159和1 524 cm-1)及蛋白質(zhì)(2 663 cm-1)的光譜特征成分; 在LV2載荷光譜中, 脂質(zhì)(2 928, 1 668 cm-1)為正向特征, 苯基丙氨酸(1 003 cm-1)和β型類胡蘿卜素(1 159和1 524 cm-1)為負(fù)向特征; LV3載荷光譜噪聲較大, 主要表現(xiàn)為LV1和LV2混合光譜特征, 即, β型類胡蘿卜素(1 524 cm-1)正向和脂質(zhì)(2 928 cm-1)負(fù)向特征。 結(jié)合圖2所示特征光譜, LV1正向特征主要來自H與EC組s3g1光譜貢獻(xiàn), 負(fù)向特征則主要來自AC組的光譜貢獻(xiàn); LV2的正向特征來自H組光譜貢獻(xiàn), 負(fù)向特征則來自EC和AC組的光譜貢獻(xiàn)。 以上結(jié)果再次表明, 乳腺癌不同病理階段的苯丙氨酸、 蛋白質(zhì)和脂質(zhì)等成分含量差異。

        圖6 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)組血清主成分載荷分布圖(a): LV1與LV2; (b): LV1與LV3; (c): LV2與LV3; (d): LV1, LV2和LV3的載荷光譜Fig.6 Scatter plots of the main components of the healthy (H), early cancer (EC, s3g1, s3g2) and advanced cancer (AC, s3g3, s2g3) groups(a): LV1 versus LV2; (b): LV1 versus LV3; (c): LV2 versus LV3; (d): The LVs loading of LV1, LV2 and LV3

        表4為LOOCV混淆矩陣表, EC(s3g1, s3g2)和AC(s3g3, s2g3)存在錯(cuò)誤分類結(jié)果, 可能與這兩組血清的光譜特征差異較小有關(guān), 也有可能是PLS-DA診斷模型的性能問題。 PLS-DA診斷模型的靈敏度分別為100%, 92%, 72%, 65%和71%, 特異性分別為99.75%, 94.25%, 97.25%, 91.75%和92%, 總體準(zhǔn)確率為80%。 與本文中所構(gòu)建的另兩種診斷模型(PCA-LDA, PCA-SVM)相比較, PLS-DA模型鑒別準(zhǔn)確率最低。 PCA-LDA和PCA-SVM分類準(zhǔn)確率相對(duì)較高, 可見PCA對(duì)光譜數(shù)據(jù)集進(jìn)行降維并提取更具代表性的特征信息, 有助于提高診斷分類結(jié)果。 對(duì)于PCA-SVM, 對(duì)光譜數(shù)據(jù)的分類精度可以達(dá)到很高, 但是當(dāng)它在處理大規(guī)模數(shù)據(jù)時(shí)耗時(shí)較長且參數(shù)選擇困難, 如何進(jìn)一步提高該算法的計(jì)算速度和泛化性能, 還需要進(jìn)一步通過積累光譜數(shù)據(jù)進(jìn)行論證; 對(duì)于PLS-DA, 該算法易受類(所含數(shù)據(jù)量大小)的影響[5]。 相對(duì)而言PCA-LDA模型更適用于分類診斷。

        表4 基于PLS-DA算法結(jié)合LOOCV對(duì)血清的拉曼光譜進(jìn)行分類的結(jié)果Table 4 Discrimination results obtained by Raman spectroscopy of serum using PLS-DA algorithms with the LOOCV method

        3 結(jié) 論

        采用拉曼光譜分析手段, 在研究多種乳腺病變(健康、 早期和晚期癌變)血清生化構(gòu)成的基礎(chǔ)上, 采用多模數(shù)據(jù)分析手段構(gòu)造多個(gè)光譜特征分類鑒別模型(PCA-LDA, PCA-SVM和PLS-DA), 進(jìn)一步挖掘光譜信息中所暗含的生物組成差異信息。 由于選用了與類胡蘿卜素的π—π*電子躍遷耦合能量符的532 nm激光作為激發(fā)光源, 研究觀察到了血清β型類胡蘿卜素成分的共振拉曼光譜峰(1 159與1 524 cm-1), 在此基礎(chǔ)上, 分析了乳腺癌病理演變過程中的生化構(gòu)成變化; 采用多種多變量光譜分析手段, 建立光譜數(shù)據(jù)分類鑒別模型(PCA-LDA, PCA-SVM和PLS-DA), 用于進(jìn)一步提取更具代表性的分子光譜特征信息。 其中, PCA-LDA模型的分類準(zhǔn)確率達(dá)99%; PCA-SVM(三個(gè)內(nèi)核函數(shù): 線性核、 多項(xiàng)式核及RBF核)模型中, 當(dāng)線性核函數(shù)PCA-SVM模型誤差懲罰參數(shù)C為0.003時(shí), 其分類準(zhǔn)確率可達(dá)95.625%; 當(dāng)RBF核函數(shù)PCA-SVM模型參數(shù)C和參數(shù)γ分別為0.125和256時(shí), 模型的準(zhǔn)確率達(dá)到了最高95.625%; 當(dāng)多項(xiàng)式核函數(shù)PCA-SVM參數(shù)C為0.003、 多項(xiàng)式階數(shù)d等于1時(shí), 其模型分類準(zhǔn)確率為95.625%最高; 選擇此時(shí)的參數(shù)值構(gòu)建模型, RBF核PCA-SVM模型在測(cè)試集中的分類準(zhǔn)確率為94%, 而線性核PCA-SVM模型和多項(xiàng)式核PCA-SVM模型的分類準(zhǔn)確率均為92%。 PLS-DA模型的分類準(zhǔn)確率為80%。 以上結(jié)果, 不但以光譜特征的角度描述了不同病理?xiàng)l件下血清的物質(zhì)構(gòu)成信息, 更為拓展血清拉曼光譜分析技術(shù)在乳腺癌早期篩查與病理分期分級(jí)中的應(yīng)用范疇, 奠定了一定實(shí)驗(yàn)與理論基礎(chǔ)。

        猜你喜歡
        曼光譜光譜準(zhǔn)確率
        基于三維Saab變換的高光譜圖像壓縮方法
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
        高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
        星載近紅外高光譜CO2遙感進(jìn)展
        苦味酸與牛血清蛋白相互作用的光譜研究
        鋱(Ⅲ)與PvdA作用的光譜研究
        BMSCs分化為NCs的拉曼光譜研究
        便攜式薄層色譜-拉曼光譜聯(lián)用儀重大專項(xiàng)獲批
        中文字幕第七页| 国产日韩精品欧美一区喷水| 香蕉人人超人人超碰超国产| 亚洲国产一区二区在线| 日韩美女av二区三区四区| 福利利视频在线观看免费| 色欲综合一区二区三区| 精品熟女少妇av免费观看| 国产福利小视频91| 亚洲男人的天堂av一区| 亚洲人成人无码www影院| 精品国产a∨无码一区二区三区 | 久久久亚洲欧洲日产国码αv| 亚洲饱满人妻视频| 久久婷婷国产五月综合色| 最新日本人妻中文字幕| 一区二区三区人妻无码| 国产爆乳乱码女大生Av| 国产一区二区av在线观看| 国产精品国产三级国产a | 在线观看av片永久免费| 丰满岳乱妇久久久| 高跟丝袜一区二区三区| 青青草视频网站在线观看| 丰满人妻一区二区三区视频53 | 中国免费一级毛片| 国产一区白浆在线观看| 亚洲精品无人区| 国产精品原创巨作av无遮| 国内揄拍国内精品久久| 国产日产亚洲系列最新| 亚洲 高清 成人 动漫| 中文字幕一区二区三区在线视频| 漂亮丰满人妻被中出中文字幕| 久久www色情成人免费观看| 国产福利小视频在线观看| 精品国产亚洲av高清日韩专区| 久久久久夜夜夜精品国产| 亚洲综合欧美日本另类激情| 一本色道亚州综合久久精品| 欧洲美熟女乱av亚洲一区 |