鄭成霞
(新疆昌吉職業(yè)技術(shù)學院 機電工程分院,新疆 昌吉 831100)
拉曼光譜被稱為物質(zhì)的指紋光譜。因為,拉曼光譜是由物質(zhì)的分子振動產(chǎn)生的非彈性散射光譜,物質(zhì)決定了光譜頻率的唯一性。物質(zhì)的濃度與光譜強度息息相關(guān)。已有研究利用拉曼光譜的這些特性,來對物質(zhì)做定性與定量分析。當生物組織發(fā)生病變時,一定會導致病變部分組織的生化成分或含量的變化,甚至是在發(fā)病前期,病變組織在物理形狀上并未發(fā)生改變,但是其內(nèi)部生化成分或其含量已發(fā)生輕微改變。此時,傳統(tǒng)的醫(yī)學檢測技術(shù)很難檢測出疾病的發(fā)生,并且傳統(tǒng)的醫(yī)療檢測技術(shù)多依賴于操作醫(yī)師的經(jīng)驗與知識技能水平,從而不容易檢測出早期疾病,耽誤早期治療導致嚴重后果。拉曼光譜是一種極其敏感的光譜,能夠在分子水平上探測到被測樣本的微弱變化,并且具有客觀性、無創(chuàng)傷性、快速性等優(yōu)點。因此,拉曼光譜已成為醫(yī)學疾病診斷研究的熱點與發(fā)展方向[1]。
拉曼光譜的背景噪聲主要來自于被測樣本的自發(fā)熒光。熒光會降低后續(xù)光譜分析結(jié)果的可靠性。因此,需要扣除拉曼光譜中的熒光背景。在自動扣除拉曼光譜中熒光背景的算法中,自適應迭代重加權(quán)懲 罰最小二乘法(airPLS),是一種精度較高的方法,也被用于基于拉曼光譜的宮頸癌診斷研究中去除拉曼光譜中的熒光背景[2]。在醫(yī)學診斷中,診斷的精確性十分重要,若扣除背景時部分有用信息也被扣除,則診斷正確性必然會降低。目前還沒有文獻報道關(guān)于airPLS扣除生物組織樣本拉曼光譜中熒光背景的有效性研究。因此,本文將對airPLS扣除宮頸癌組織拉曼光譜中的熒光背景的有效性展開研究。
airPLS通過自適應的迭代過程不斷的自行調(diào)整加權(quán)值,最終擬合出與實際背景有較高契合背景的背景擬合算法。airPLS算法應用于拉曼光譜背景扣除中,具有運算速度快,精度高的特點[7-8]。用于醫(yī)學診斷研究的拉曼光譜通常都具有較高的數(shù)據(jù)維數(shù),因此,扣除背景所需的時間也較長。airPLS算法在扣除高維拉曼光譜中熒光背景時,所需時間隨數(shù)據(jù)維度增長線性增加。因此,airPLS算法即使被用于去除高維光譜中的熒光背景時,任然具備處理時間快的優(yōu)勢[3-6]。
論文共使用了10條宮頸癌癥組織拉曼光譜數(shù)據(jù)(腺癌與鱗癌光譜各5條)。
采用airPLS算法,扣除原始拉曼光譜中的熒光背景。
圖1 扣除背景前后光譜對比圖
圖1中虛線是原始拉曼光譜的曲線圖,10條原始光譜曲線的基線各不相同,差異較大,背景噪聲是產(chǎn)生基線差異的原因。為了提升后期數(shù)據(jù)分析的正確性,去除背景噪聲十分有必要。圖1中實線是扣除背景后的光譜曲線圖。可以看出,扣除背景后的拉曼光譜曲線的基線已基本一致了。從圖1中,可以直觀的觀察到airPLS算法的背景扣除效果是較好的,但是卻無法觀察出,airPLS算法在扣除拉曼光譜中的背景的同時,是否保留了拉曼光譜中的有用信息。為了驗證airPLS算法是否能夠有效的扣除宮頸癌組織拉曼光譜中的熒光背景,將采用主成份分析法(PCA)來進一步驗證airPLS算法是否扣除了宮頸癌組織拉曼光譜中的熒光背景,采用PCA及微分法來驗證airPLS算法在扣除熒光背景的同時是否完整保留了拉曼光譜中的有用信息。
采用PCA驗證airPLS算法是否能夠切實的去除宮頸癌組織拉曼光譜中的背景成分。對經(jīng)airPLS算法扣除背景前后的各10條光譜做相同的PCA處理,并以散點圖的形式繪制出20條光譜在1,2主成份空間的分布情況。繪圖時,采用顏色結(jié)合形狀來區(qū)分扣除背景前后的兩類光譜,未扣除背景的原始光譜用紫色三角形表示,扣除背景后的光譜用橙色菱形表示,如圖2所示。
圖2 扣除背景前后,光譜在第1,2 主成份空間的分布散點圖
觀察圖2,容易發(fā)現(xiàn)三角分布分散,位置差異大,這是由熒光背景對光譜的影響導致的。菱形分布集中,相互之間位置差異較小??煽闯?,熒光背景的影響基本被去除。由對圖2的觀察可知,airPLS算法較好的扣除了宮頸癌組織拉曼光譜中的背景成分。
拉曼光譜中的熒光背景包絡(luò),是變化緩慢的曲線,因此可以被微分法去除。采用相同的微分法處理10條原始光譜以及10條經(jīng)airPLS算法扣除背景的光譜。然后,采用PCA,對微分后的20條光譜做同樣的主成份分析。基于得分越高的主成份所包含的信息量越大的原理,取前4個主成份得分,來繪制20條光譜在主成份空間的二維分布散點圖,共繪制出12幅圖,如圖3所示。
圖3 微分處理后20 條光譜的主成份空間二維分布散點圖
繪圖時,將光譜進行編號,微分處理后的10條原始光譜與微分處理后的經(jīng)airPLS算法扣除背景的10條光譜,一一對應地均編為1-10號。圖3中,采用不同形狀的圖形來區(qū)分不同編號的光譜。編號與形狀之間的對應關(guān)系為:1號:,2號:,3號:,4號:,5號:,6號:,7號:,8號:,9號:,10號:。由于,相同編號的光譜有兩條,則在圖3中,每種形狀的圖形都應該出現(xiàn)2次。觀察圖3,發(fā)現(xiàn)在12個主成份空間分布散點圖中,10種不同形狀的圖形,幾乎都只能觀察到一個,這說明,相同形狀的兩個圖形重疊在了一起。這一結(jié)果表明,airPLS算法能夠在去除宮頸癌拉曼光譜背景的同時,保留其中的有用信息。
至此,airPLS算法扣除宮頸癌組織拉曼光譜熒光背景的效果,以及保留光譜中有用信息的效果都得到了驗證,即airPLS算法能夠有效的扣除宮頸癌組織拉曼光譜中的熒光背景。
本文將airPLS算法用于扣除宮頸癌組織拉曼光譜中的熒光背景,并從算法扣除背景的效果,保留光譜中有用信息的效果兩方面,對airPLS算法扣除宮頸癌組織拉曼光譜中熒光背景的有效性進行了研究。研究結(jié)果表明,airPLS算法能夠有效的扣除宮頸癌組織拉曼光譜中的熒光背景。