都 月,孟曉辰,祝連慶
(北京信息科技大學 光電測試技術北京市重點實驗室,北京 100192)
光譜測量方法具有高效、快速、環(huán)保、選擇性好、測量精度高等優(yōu)點,應用領域非常廣泛。近年來,為了更加精細地分析細胞特性而進行多色法熒光測量,即使用多種熒光染料標記微粒,并且使用光學掃描顯微鏡來檢測各個熒光染料被激發(fā)后所發(fā)射的熒光。然而目前所使用的熒光染料的激發(fā)或發(fā)射光譜較寬,發(fā)射光譜范圍會有一定的干擾重疊,形成重疊峰,這是定性和定量分析的一大障礙[1]。因此,必須提出有效的理論和方法來分離光譜信號重疊峰。
針對此問題,國內(nèi)外進行了深入的研究。早期,Kauppinen等[2]提出傅里葉變換的自去卷積技術,被廣泛地用到光譜信號的解析,但較難選取合適的去卷積函數(shù),且過程中噪音會呈指數(shù)增加,在提高分辨率的同時也降低了信噪比,易產(chǎn)生負旁瓣效應。隨著現(xiàn)代信息處理方法的發(fā)展,馮飛等[4]利用小波變換對光譜信號進行多尺度分解,結合高斯函數(shù)進行光譜擬合,但結果受小波母函數(shù)及分解層數(shù)的影響較大,且擬合具有較大的隨機性;陶維亮等[5]提出將光譜信號轉(zhuǎn)到小波時頻域后進行分形維數(shù)計算,并利用人工神經(jīng)網(wǎng)絡法進行獨立峰提取,可以較高精度分離重疊峰,但效率不高且算法較為復雜。此外,人們發(fā)現(xiàn)可以借鑒分析化學中的數(shù)學工具來研究光譜信號,為解析光譜重疊提供了新的方式。嚴彩娟等[6]通過單峰平移縮放對原始峰型進行修正,利用縱向迭代算法實現(xiàn)重疊峰分離;葉國陽等[7]在傳統(tǒng)垂線法和切線法的基礎上進行改進,提出交點垂線法及比例分配法,提高了峰面積的計算精度,但誤差相對較大;朱強等[8]基于函數(shù)二分原理,重新規(guī)定了迭代方向,但結果受原始峰型的影響較大。上述方法雖對分析化學信號的重疊峰的解析取得了一定的運用效果,但仍具有一定的局限性。因此,為進一步有效分離細胞熒光重疊峰,本文提出一種優(yōu)化迭代算法,既保證了迭代效率,又提高了分峰的準確性和面積的計算精度。
多色分析時細胞樣本攜帶多種熒光染料,可以同時被相同波長的激發(fā)光源激發(fā),得到不同的發(fā)射光譜。由于目前的熒光染料發(fā)射出的熒光具有比較寬的光譜范圍,即使每種熒光的發(fā)射峰不同,發(fā)射光譜范圍仍會有部分的光譜重疊[1]。但光譜并不是離散的譜線,而是表現(xiàn)為Gaussian、Lorentz線型等形式的結構相近的譜峰[4]。因此,為方便研究,可假設構成重疊峰的單峰都是相似的。
以高斯模型ae-(x-b)2/2c2作為各個單峰數(shù)學模型,其中:a為高斯曲線峰值;b為其對應的橫坐標;c為標準差(高斯RMS寬度)。實際情況中,三峰以上重疊的現(xiàn)象較少,所以本文僅對兩峰及三峰重疊的情形進行分析。
兩峰重疊時,建立對應模擬曲線圖如圖1所示。定義重疊峰為F,構成重疊峰的單峰分別為A和B,可用下式來表示兩峰重疊時重疊峰的構成情況:
(1)
(1)式即為雙峰重疊時重疊峰的數(shù)學模型。如圖1,其中:橫坐標表示模擬光譜范圍;縱坐標表示熒光強度。
圖1 雙峰重疊時重疊峰模型Fig.1 Overlapping peaks model of two peaks superimposed
圖2 三峰重疊時重疊峰模型Fig.2 Overlapping peaks model of three peaks superimposed
同理,三峰重疊時,建立對應模擬曲線圖如圖2所示,同時滿足(2)式:
(2)
(2)式即為三峰重疊時重疊峰的數(shù)學模型。其中A、B、C為構成重疊峰F的三個單峰。
為便于描述和理解,本節(jié)僅討論雙峰重疊時的重疊峰分峰步驟。根據(jù)構成重疊峰的單峰的相似性,重疊峰的前沿和后沿的重疊程度很小,主要重疊部分大部分分布在除前后沿以外的中間部分。故可利用前后沿對中間重疊部分進行修正,通過迭代實現(xiàn)對單峰的逼近[6]。確定每次的構造峰頂點是本文提出算法的關鍵,具體步驟如下:
1) 尋找重疊峰F的兩個頂點,并以此作為第1次構造峰的頂點。重疊峰的前沿即為第1次左構造峰g11的前沿,根據(jù)頂點求出縱向修正系數(shù)K1,對重疊峰后沿使用系數(shù)K1進行修正,得到g11的后沿,即構造出第1次左構造峰g11;用重疊峰F的面積減去左構造峰g11的面積,即得到第1次右模擬峰f12。同理,可得出第1次右構造峰g12和右模擬峰f12,如圖3所示。
圖3 第1次構造峰和模擬峰Fig.3 Primary tectonic and simulated peaks
2) 在此基礎上計算出模擬峰f11、f12的頂點,作為第2次構造峰的頂點。求出縱向修正系數(shù)K2,對f11的前沿使用系數(shù)K2進行修正,得出第2次右構造峰g22的前沿;同時f12的后沿即為g22的后沿,即構造出第2次右構造峰g12。同理可得出第2次左構造峰g11。最后用重疊峰F分別減去左右構造峰,得到第2次模擬峰f21和f22。前兩次得出的模擬峰如圖4所示。
3) 按上述步驟繼續(xù)修正,得到第3次構造峰g31和g32。第3次模擬峰構造方式如下:如果滿足g31+g32
4) 重復3)中的步驟,當fn1+fn2無限接近F時,迭代停止。fn1、fn2即為所分離出的單峰。
圖4 第1、2次模擬峰Fig.4 The first & second simulated peaks
在重疊峰分離的過程中,分離結果會受單峰的峰高比和原始重疊峰的分離度影響。本文分別模擬了相同峰高比下不同分離度和相同分離度下不同峰高比的重疊峰模型,然后分別算出原始重疊峰在優(yōu)化迭代算法、原縱向迭代算法及平分迭代算法下的解析誤差,進一步對比和驗證優(yōu)化迭代法的分離性能。在分離之前,首先對以下參數(shù)進行定義。
1) 峰高比:
(3)
其中HA和HB分別為兩單峰頂點高度。
2) 分離度:
(4)
其中:μ1和μ2分別為兩單峰位置:ω1和ω2分別為單峰峰寬。R越大,則表明兩峰分離越好。通常說當R=1.0時,分離度可達98%。
3) 解析誤差:
(5)
其中:S′為計算峰面積;S為真實峰面積。
4) 迭代效率比:
(6)
通常,迭代效率用達到一定計算精度所需的迭代次數(shù)來表示。本文定義迭代效率比為相同迭代次數(shù)下,進行對比的兩種方法的相對解析誤差,用來表明迭代效率的提高程度。其中:w1為進行對比的第1種方法達到該迭代次數(shù)時的解析誤差;w2為進行對比的第2種方法達到該迭代次數(shù)時的解析誤差。迭代效率比越大,說明后種方法的迭代效率相對前種方法越高。
首先分析了優(yōu)化迭代算法分離重疊峰的解析誤差。為進一步精確地討論優(yōu)化迭代法的性能,本次分析使用的重疊峰數(shù)學模型均由兩高斯峰的疊加而得到。調(diào)整高斯函數(shù)的各個參數(shù),首先分別計算了在分離度為0.621 8的情況下,峰高比分別為1∶1、1∶2、1∶3、2∶1和3∶1時不同形狀重疊峰的解析誤差,及在峰高比為2∶3的情況下,分離度分別為0.466 3、0.559 6、0.632 8、0.777 2和0.808 3時不同形狀重疊峰的解析誤差,分別迭代6次,并與傳統(tǒng)縱向迭代法及平分迭代法進行了比較。計算結果如表1、2所示,并作出對應柱狀圖如圖5、6所示。
結果表明,分離度一定時,隨著峰高比的增加,傳統(tǒng)縱向迭代法的誤差較大且會隨之增加,平分迭代法的誤差穩(wěn)定在1%之內(nèi),優(yōu)化迭代法的誤差相對較小,且維持在0.15%之內(nèi);峰高比一定時,隨著分離度的減小,傳統(tǒng)縱向迭代法的誤差較大且也會隨之增加,平分迭代法的誤差穩(wěn)定在0.5%之內(nèi),優(yōu)化迭代法的誤差相對較小,且維持在0.1%之內(nèi)。
表1 分離度為0.621 8時的解析結果
表2 峰高比為2∶3時的解析結果
圖5 分離度為0.621 8時的解析結果Fig.5 Analysis results at resolution of 0.612 8圖6 峰高比為2∶3時的解析結果Fig.6 Analysis results at peak height ratio of 2∶3
其次分析了優(yōu)化迭代算法分離重疊峰的迭代效率。考慮到實際操作時會遇到三峰重疊現(xiàn)象,本次分析使用的重疊峰數(shù)學模型為三個高斯峰的疊加。其中:峰A、B、C的峰高比為4∶5∶6;峰A、峰B分離度為0.621 8,峰B、峰C分離度為0.466 3,峰A、峰C分離度為1.088 1。分別使用優(yōu)化迭代法、縱向迭代法、平分迭代法分離該重疊峰,根據(jù)所得的誤差大小來比較三者的迭代效率。三峰重疊時的解析結果如表3所示。由表3可知,由于在第1、2次迭代時,三個方法得出構造峰的方式相同,故有相同的迭代效率;在進行第3至第6次迭代時,使用優(yōu)化迭代法時明顯效率更高;迭代第6次時,迭代效率相對于縱向迭代法和平分迭代法分別提高了88.46%和66.67%。
表3 三峰重疊時的解析結果
此外,還對含有隨機噪聲時分離重疊峰的迭代效率進行了分析。為方便實驗,本次分析使用的重疊峰數(shù)學模型為峰高比為3∶4、分離度為0.621 8的兩個高斯峰的疊加,解析結果如表4所示。由表4可知,迭代第6次時,迭代效率相對于縱向迭代法和平分迭代法分別提高了57.73%和32.20%。
表4 加隨機噪聲時的解析結果
為進一步分析算法性能,使用縱向迭代法、平分迭代法和優(yōu)化迭代法對實際光譜進行了分離及計算。將淋巴凍干粉與血清混合1 000 μL作為待測細胞,分別加入60 μL異硫氰酸熒光素(FITC)染劑、60 μL藻紅蛋白(PE)染劑及30 μL藻紅蛋白-得克薩斯紅(ECD)染劑將其進行染色。將染色后的細胞充分拌勻后避光靜置15 min,并將其放置在共聚焦培養(yǎng)皿上,用共聚焦熒光顯微鏡觀察細胞染色情況,并對其測量到的細胞熒光光譜數(shù)據(jù)進行曲線擬合。擬合結果如圖7所示。
圖7 細胞熒光光譜擬合圖Fig.7 Fitting results of cell fluorescence spectrum
對數(shù)據(jù)進行高斯擬合后,分別用縱向迭代、平分迭代和優(yōu)化迭代法進行解析的結果如表5所示。從表中可知, 迭代6次后,優(yōu)化迭代法的解析誤差為0.36%,優(yōu)于縱向迭代法和平分迭代法。并且,此時迭代效率相對于其他方法分別提高了90.55%和75.17%。故使用優(yōu)化迭代法的分離結果更接近實際情況,進而進一步驗證了該算法精度。
表5 細胞熒光光譜解析結果
針對熒光光譜譜峰重疊現(xiàn)象,本文結合并改進了傳統(tǒng)縱向迭代法和平分迭代法,重新確定構造峰的構造方式,提出優(yōu)化迭代重疊峰分峰新方法。為評估該算法精度,通過模擬不同峰高比和分離度的重疊峰,計算其面積的真實值與解析結果,并同縱向迭代法及平分迭代法進行了比較。結果表明優(yōu)化迭代算法解析誤差穩(wěn)定在0.15%以內(nèi);加入隨機噪聲后,解析誤差可穩(wěn)定在0.85%以內(nèi),均優(yōu)于另外兩種算法。此外分析了該算法的迭代效率,其中三峰重疊情況下,迭代效率在原有基礎上提高了66.67%;引入隨機噪聲時,迭代效率在原有基礎上提高了32.20%。對實際細胞熒光光譜中的重疊峰進行了解析,在相同迭代次數(shù)下,優(yōu)化迭代法的解析誤差為0.36%,優(yōu)于縱向迭代法和平分迭代法;且迭代效率分別提高了90.55%和75.17%。此實驗進一步驗證了優(yōu)化迭代算法的精度,故可使用該算法對重疊光譜準確進行定性和定量分析。