朱文艷,周連群,張芷齊,李金澤,李龍輝,4,高 旭,李樹力,5,郭 振*,姚 佳,3*
(1.中國科學(xué)技術(shù)大學(xué),安徽 合肥 230026;2.中國科學(xué)院 蘇州生物醫(yī)學(xué)工程技術(shù)研究所,中國科學(xué)院生物醫(yī)學(xué)檢驗(yàn)技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 蘇州 215163;3.蘇州大學(xué) 電子信息學(xué)院,江蘇 蘇州 215006;4.長春理工大學(xué) 機(jī)電工程學(xué)院,吉林 長春 130022;5.上海大學(xué) 通信與信息工程學(xué)院,上海 200444)
數(shù)字聚合酶鏈反應(yīng)(Digital Polymerase Chain Reaction,dPCR)是一種測量靶DNA絕對拷貝數(shù)的獨(dú)特方法,是一種絕對定量技術(shù),最早由Saiki等發(fā)表[1-2],與實(shí)時熒光定量PCR(Real-time Quantitative PCR,RT-qPCR)相比,dPCR已被證明具有更高的靈敏度,精度及重復(fù)性[3-5]。從擴(kuò)增后的dPCR芯片中獲取到有用的信息依賴于dPCR檢測分析系統(tǒng),如進(jìn)行無創(chuàng)產(chǎn)前檢測[6],人類乳腺癌中HER2癌基因的檢測[7]等。目前,dPCR熒光信息的檢測方式主要包括兩種:一是熒光成像,二是流式細(xì)胞熒光分選[8-9]。熒光成像技術(shù)隨著相機(jī)成像技術(shù)的發(fā)展,其成像速度越來越快,分辨率也越來越高,這種成像方式在顯微成像中得到越來越廣泛地應(yīng)用[10-12]。
熒光成像技術(shù)易存在失焦的問題,針對微孔式數(shù)字PCR信息統(tǒng)計對于高質(zhì)量熒光圖像的需求,若圖像離焦問題嚴(yán)重,則會影響統(tǒng)計數(shù)據(jù)的準(zhǔn)確性。不同樣本之間垂直位置的差異性,導(dǎo)致相機(jī)獲得的圖像呈現(xiàn)不同程度的模糊,因此,對焦在光學(xué)視覺成像系統(tǒng)中起著重要作用,例如各類相機(jī)、掃描儀、顯微鏡[13-14]。而自動對焦可以在最少的人工干預(yù)下獲得清晰圖像[15-16],進(jìn)而獲得準(zhǔn)確的統(tǒng)計數(shù)據(jù)。為快速獲取清晰的圖像以便于后續(xù)數(shù)據(jù)處理得到準(zhǔn)確的檢測結(jié)果,必須根據(jù)樣品變化動態(tài)的改變樣品與物鏡或物鏡與成像面之間的距離,以實(shí)現(xiàn)樣品的自動對焦[17]。
自動對焦可以通過主動、被動或者兩者混合來實(shí)現(xiàn)[17-19]。主動方法一般是通過激光等測距工具來測量離焦距離后進(jìn)行對焦,需要在系統(tǒng)中額外嵌入測距系統(tǒng),并且當(dāng)使用激光時,會造成芯片上的熒光基團(tuán)淬滅[20],對后續(xù)數(shù)據(jù)的準(zhǔn)確性造成影響。被動方法可以分為相位檢測法和對比度檢測法,前者通過測量兩幅圖像之間的相位差來估計聚焦位置,依賴于特殊的傳感器檢測系統(tǒng)[21];后者計算每一幀的清晰度以尋找最佳位置,無需額外檢測附件,精簡整體系統(tǒng),降低成本[22-23],但搜索每一幀并計算,明顯增加了計算量和搜索步驟,進(jìn)而造成對焦時間延長。
考慮到微孔式數(shù)字PCR芯片弱熒光樣本分布差異造成其計算對象存在片內(nèi)差異與片間差異,若對焦方法不當(dāng),熒光基團(tuán)長時間暴露在激發(fā)光下會發(fā)生淬滅,影響后續(xù)結(jié)果統(tǒng)計。為了實(shí)現(xiàn)快速且準(zhǔn)確對焦,本文基于數(shù)字PCR芯片多個排列孔的特征,提出了一種新的對焦算法,單曲線擬合函數(shù)法。通過計算包含單個孔的區(qū)域內(nèi)大于閾值的像素的個數(shù),得到隨離焦距離變化,其像素數(shù)變化的曲線。在這里,閾值隨圖像平均灰度的變化而變化,從而得到一條與圖像灰度無關(guān)的像素數(shù)隨離焦距離變化曲線,通過正弦函數(shù)擬合得到該曲線的擬合函數(shù),即為微孔式數(shù)字PCR芯片的對焦評價算法。通過該對焦算法,可以快速得到離焦圖像的離焦距離與離焦方向,進(jìn)而實(shí)現(xiàn)快速準(zhǔn)確對焦。
自動調(diào)焦的目的是通過對光學(xué)成像系統(tǒng)的不斷校正,使其能夠?qū)δ繕?biāo)清晰成像,為后續(xù)的圖像處理、信息提取提供紋理豐富、畫面清晰的圖像。對于不同結(jié)構(gòu)的任何光學(xué)成像系統(tǒng),其成像原理基本一致,如圖1所示(彩圖見期刊電子版)。OP和IP分別表示物平面和像平面,D為透鏡直徑,R為模糊圓半徑,u為物距,v為圖像距離,s為透鏡到圖像檢測器平面上的距離。黃實(shí)線和藍(lán)虛線表示成像對象不同物距的聚焦結(jié)果。
根據(jù)幾何光學(xué)原理,物距u、像距v與焦距f滿足高斯成像公式,如式(1):
(1)
由高斯成像公式可知,對于固定焦距的成像系統(tǒng),物空間任意物距的目標(biāo)點(diǎn)在像空間存在唯一確定的點(diǎn)與其對應(yīng)。當(dāng)目標(biāo)離焦時,目標(biāo)點(diǎn)在圖像探測器上的像不再是清晰的點(diǎn),而是一個半徑為R的彌散圓。結(jié)合光學(xué)系統(tǒng)的成像模型,根據(jù)三角形相似原理可以得到光學(xué)系統(tǒng)參數(shù)與彌散圓半徑的關(guān)系式滿足式(2)[24]:
(2)
根據(jù)式(1)和式(2)可得彌散圓半徑R的具體值為式(3):
(3)
根據(jù)式(3),當(dāng)s=v時,彌散斑半徑R=0,物點(diǎn)OP在圖像探測器上的像為理想的像點(diǎn);當(dāng)s≠v時,則有R≠0,物點(diǎn)OP在圖像探測器上的像便不再是一個理想的點(diǎn),而是一個半徑為R的彌散斑,即產(chǎn)生離焦圖像。
圖1 透鏡光學(xué)成像模型。Fig.1 Lens optical imaging model
彌散斑亮度分布可以通過簡單的圓盤模型來近似[25],如式(4)所示:
(4)
其中R是彌散斑半徑。
傳統(tǒng)的成像理論認(rèn)為,固定對象成像的綜合強(qiáng)度應(yīng)與聚焦無關(guān)[26-27]。因此,圖像離焦是一個彌散斑半徑逐漸變大,亮度分散的過程,擁有高亮度的像素數(shù)也逐漸減少,表現(xiàn)為亮度分布逐漸呈現(xiàn)均勻性,若灰度閾值選取得當(dāng),離焦過程中,大于該閾值的像素數(shù)逐漸增大,而在準(zhǔn)焦時取得最小 值。
(a)微孔陣列芯片(a)Microarray chip
(b)芯片部分放大圖(b)Enlarged image圖2 數(shù)字PCR系統(tǒng)的成像對象Fig.2 Imaging objects of the digital PCR system
在本文中,系統(tǒng)的成像對象是完成進(jìn)樣及封裝的微孔陣列芯片,芯片上規(guī)則排列的微孔,將稀釋的dPCR樣本溶液分割,一部分微孔內(nèi)填充有DNA樣本,引物及特異性的熒光探針,DNA每擴(kuò)增一條DNA鏈,就會產(chǎn)生一個熒光分子。經(jīng)過熱循環(huán)的芯片在激光激發(fā)的作用下,熒光分子累積的孔呈現(xiàn)高亮度,其他孔亮度則無較大區(qū)別。如圖2所示,芯片內(nèi)灰度差異的存在及芯片間灰度差異的存在,使得傳統(tǒng)的根據(jù)像素灰度梯度差來評價離焦量的自動對焦體系出現(xiàn)了片內(nèi)差異及片間差異,這就要求其計算窗口需要盡可能大以減少這種誤差,從而增加了計算量。
采用包含單孔的一定區(qū)域內(nèi),大于某一閾值像素數(shù)量的變化曲線對焦評價算法,其計算對象為單孔及其附近區(qū)域,在保證對焦精度的條件下,可以選擇很小的對焦窗口,只需包含單孔及其附近區(qū)域,從而減小計算量。因此,該對焦算法理論上可以實(shí)現(xiàn)微孔式數(shù)字PCR芯片的準(zhǔn)確快速對焦。
對焦窗口是在自動對焦過程中利用評價函數(shù)對拍攝場景進(jìn)行清晰度評價所選取的某一區(qū)域,通常為人們所感興趣的區(qū)域(Region-of-interest,ROI),而非對整幅圖像進(jìn)行計算。對焦窗口的選擇影響對焦精度和速度[18]。窗口太大則包含過多背景對象,導(dǎo)致數(shù)據(jù)冗余,從而增加計算負(fù)載;窗口選擇太小,可能丟失關(guān)注對象的部分?jǐn)?shù)據(jù),因而合適的對焦窗口對完成快速對焦很重要。
常用的窗口選擇算法有,中央?yún)^(qū)域?qū)勾翱谶x擇法[28]、多區(qū)域?qū)勾翱谶x擇法、非均勻采樣對焦窗口選擇法等[29]。這些方法在一定程度上節(jié)省了計算時間,在一些領(lǐng)域具有實(shí)用價值,但這些方法一旦選定區(qū)域后,對焦窗口就固定不變,面對不同的對焦對象及對焦過程中出現(xiàn)的物體偏移情況無法做出有效應(yīng)對,所以需要根據(jù)對焦對象及離焦距離的不同自適應(yīng)選取對焦窗口以提高對焦精度。
圖3 自適應(yīng)窗口選擇流程圖Fig.3 Adaptive window selects flowchart
基于大于灰度閾值像素數(shù)量的自動調(diào)焦算法選取對焦對象的步驟為:首先選取視野中心31×31 pixel區(qū)域,在該區(qū)域中尋找與截取圖像邊沿相差6 pixel的第一個質(zhì)心點(diǎn);以第一個質(zhì)心點(diǎn)為中心取周圍13×13 pixel的區(qū)域?yàn)閷勾翱冢蝗缓笏嬎阍搮^(qū)域的閾值及評價值,獲得離焦數(shù)據(jù)并進(jìn)行對焦后將會判斷是否完成對焦。若是,則結(jié)束,若否,則在下一次對焦前再進(jìn)行一次窗口選取步驟,進(jìn)而做到自適應(yīng)窗口選取。根據(jù)不同對焦對象自適應(yīng)選取對焦孔的步驟如圖3所示。
判斷閾值的選取關(guān)系到對焦準(zhǔn)確度,同時又要隨樣本的改變而自動變化,才能達(dá)到自動準(zhǔn)確對焦的目的。文中根據(jù)對焦對象的特征提出了基于區(qū)域最值的自動閾值選取方法,在跟隨樣本變化的同時,能夠做到準(zhǔn)確對焦。
在對焦區(qū)域內(nèi),根據(jù)區(qū)域內(nèi)的最大值與最小值變化曲線可知,其最值的和在一定范圍內(nèi)呈現(xiàn)一個穩(wěn)定的值,這個穩(wěn)定的值除以一個經(jīng)統(tǒng)計后得出的固定的系數(shù),即為所取閾值如式(5):
T={max(Iout(x,y,zr))+min(Iout(x,y,zr))}/2.5,
(5)
其中:T表示所取閾值,Iout表示樣本I在zr處的離焦圖像。
閾值T隨對焦對象的亮度增大或減小,提供了一個具有普適性的閾值選取辦法,同時為下面的評價算法的提出奠定了基礎(chǔ)。如圖4所示,x軸表示圖像位置的變化,y軸表示灰度最值的變化。紅色表示maxI,黃色表示minI,藍(lán)色表示(maxI+minI)/2.5(彩圖見期刊電子版)。
圖4 灰度最值曲線及閾值曲線Fig.4 Gray minimum and maxmum curve and threshold curve
依據(jù)對焦窗口的選取及閾值的選取,通過統(tǒng)計對焦窗口內(nèi)大于閾值像素點(diǎn)數(shù)量的變化,得到對焦評價曲線。
在離焦到正焦再到離焦的序列圖像中,圖像的離焦量越小,彌散斑半徑越小,亮度越集中,大于某一閾值的像素數(shù)量值達(dá)到最小,如圖5所示。x軸表示樣本的位置,y軸表示像素數(shù)的變化。
圖5 窗口內(nèi)大于閾值的像素數(shù)隨位置變化曲線及A,B,C,3點(diǎn)位置對應(yīng)的微觀孔的圖像
傳統(tǒng)的搜索方法通常根據(jù)一些自定義的規(guī)則來尋找最高峰,本文通過對不同芯片對焦窗口中不同灰度級像素的數(shù)量進(jìn)行統(tǒng)計得到三組統(tǒng)計數(shù)據(jù)。如圖6所示,組圖左側(cè)給出了對焦窗口內(nèi)像素灰度最大值,最小值以及閾值的變化曲線,根據(jù)閾值的取值得到對焦窗口內(nèi)大于閾值的像素數(shù)量的變化散點(diǎn)圖,根據(jù)散點(diǎn)圖的變化趨勢擬合出了變化曲線。
(a)第一組(a)First group
(b)第二組(b)Second group
(c)第三組(c)Third group
從3組灰度變化曲線可知,3個樣本芯片的灰度最值及閾值選取的大小并不相同。但從像素數(shù)量變化散點(diǎn)圖及其正弦擬合曲線的變化趨勢來說,在此閾值的選取方法下,3組像素數(shù)量變化曲線在突變區(qū)間橫坐標(biāo)與縱坐標(biāo)的差值大小,平穩(wěn)區(qū)間的縱坐標(biāo)的大小上具有一定的一致性。
(a)散點(diǎn)圖
(b)擬合曲線
根據(jù)分組圖中,大于閾值的像素數(shù)量變化趨勢的一致性,在同一圖中做出像素數(shù)量隨離焦距離的變化散點(diǎn)圖及其擬合曲線[30],如圖7所示。
3組數(shù)據(jù)中,像素數(shù)量隨離焦距離的變化趨勢主要表現(xiàn)為2個特征:一是在一定離焦距離范圍內(nèi),對于不同灰度的樣本芯片,其像素數(shù)隨離焦距離的變化趨勢呈現(xiàn)高度的一致性,擬合曲線符合四參數(shù)正弦擬合曲線的變化特征[31-32];二是,在上述離焦距離范圍之外,對于不同灰度的樣本芯片,其像素數(shù)量穩(wěn)定在169,即對焦窗口所包含的總的像素數(shù)。這兩個特征符合光學(xué)成像原理所述的彌散斑半徑及亮度分布特征,可用分段函數(shù)表示為:
(6)
其中:d表示離焦距離,參數(shù)a,b,c表示擬合曲線的參數(shù)。在95%的置信區(qū)間內(nèi),方差R-square為0.944條件下,a,b,c的取值如表1。
曲線的d,f取值只與離焦距離,大于閾值的像素數(shù)有關(guān),在窗口和閾值確定的條件下,可認(rèn)為曲線的變化特征唯一確定。因此,在計算得出大于閾值的像素數(shù)后,可根據(jù)擬合曲線來計算離焦距離與方向。根據(jù)像素數(shù)反推出的數(shù)字的絕對值代表離焦距離,正負(fù)代表方向,為正時,代表取相位置在準(zhǔn)焦點(diǎn)位置的下方,應(yīng)向上運(yùn)動;為負(fù)時,代表取相位置在準(zhǔn)焦點(diǎn)位置的上方,應(yīng)向下運(yùn)動。
表1 擬合曲線系數(shù)
(a)f1(d)>f2(d)>f3(d)
(b)f1(d)>f3(d)>f2(d)
(c)f3(d)>f2(d)>f1(d)
(d)f1(d)>f3(d)>f2(d)圖8 根據(jù)3個位置像素數(shù)值分布情況進(jìn)行方向判斷Fig.8 Judging the direction according to the distribution of the number of pixels in 3 locations
為了評估所提出方法的有效性和效率,本文對3張新的芯片進(jìn)行測試,每張芯片采集A,B,C共3組不同初始位置的數(shù)據(jù),每組數(shù)據(jù)包含3個等間隔位置的圖像。通過計算每個位置圖像上大于閾值的像素個數(shù),來計算離焦距離和進(jìn)行離焦方向的判斷,結(jié)果如表2~表4,圖9~圖11。此外,每張芯片在離焦到正焦再到離焦的過程中都均勻的提取了600張圖像,對每組的600張圖片進(jìn)行處理,并利用清晰度計算方法對每組圖像進(jìn)行計算統(tǒng)計,做出清晰度評價值擬合曲線,選取曲線的最值對應(yīng)的位置作為準(zhǔn)焦點(diǎn)位置,進(jìn)而計算出每個初始位置的實(shí)際離焦距離。
表2、表3、表4中分別統(tǒng)計了每張芯片的灰度及每個位置的計算離焦信息,并與實(shí)際離焦信息進(jìn)行對比,得出對焦誤差,該誤差反映到實(shí)際圖像上,即為圖9、圖10、圖11。
表2 第一張芯片測試數(shù)據(jù)
圖中Initial列是芯片位于初始位置時整幅芯片圖像及5個區(qū)域微觀圖,A,B,C組分別代表3個初始圖像;Autofocus列是對焦后整幅芯片圖像及5個區(qū)域微觀圖,A,B,C組分別代表3幅對焦后圖像;Focus right,即D組是準(zhǔn)焦點(diǎn)整幅芯片圖像及5個區(qū)域的微觀圖,圖中的紅色方框代表截取的圖像在整幅芯片圖像中所處位置。
Autofocus列的A,B,C三組圖像中,孔與孔之間已經(jīng)可以明顯分辨。經(jīng)過與準(zhǔn)焦點(diǎn)的D組圖像對比發(fā)現(xiàn),在肉眼觀察條件下,并不能清晰判別幾幅圖像之間的差異。在預(yù)設(shè)清晰度條件下,所有對焦測試結(jié)果已滿足后續(xù)計算要求,經(jīng)過測試,目前所界定的清晰地范圍為準(zhǔn)焦點(diǎn)上下15個位置。
圖9 第一張芯片準(zhǔn)焦圖像與3組對焦前后圖像Fig.9 First chip quasi-focal image and three groups of pre-and post-focal images
表3 第二張芯片測試數(shù)據(jù)
圖10 第二張芯片準(zhǔn)焦圖像與3組對焦前后圖像Fig.10 Second chip quasi-focal image and three groups of pre-and post-focal images
表4 第三張芯片測試數(shù)據(jù)
圖11 第三張芯片準(zhǔn)焦圖像與3組對焦前后圖像Fig.11 Third chip quasi-focal image and three groups of pre-and post-focal images
以速度和準(zhǔn)確性為標(biāo)準(zhǔn),在同等初始條件下,與傳統(tǒng)的爬山算法進(jìn)行比較(各類爬山算法的區(qū)別主要在于步長與精度的選擇上,但是基本思想是相同的)。Hen等[33]提出粗細(xì)結(jié)合的對焦方法,該方法采用粗略或較大步距找到一個峰值,然后反轉(zhuǎn)方向采用精細(xì)或較小步距來縮小范圍。峰和反轉(zhuǎn)方向、停止搜索的條件是手動創(chuàng)建的,不同研究者給與的峰和反向以及停止搜索的條件是不同的。在這里,根據(jù)對象創(chuàng)建的搜索條件是,粗搜索步距,20個位置差,較為精細(xì)搜索,10個位置差,初始搜索方向定位向上搜索,搜索到峰值即停止搜索,對焦過程中,每運(yùn)動一步均需要重新取相計算,直到完成對焦。假設(shè)使用兩種不同的算法在相同的初始位置對同一樣本進(jìn)行對焦,并且電機(jī)驅(qū)動位移臺進(jìn)行相同的勻速運(yùn)動,以此忽略多次啟停造成的時間延長,則在對焦過程中耗費(fèi)時間的動作集中在取相計算上,當(dāng)對焦所需步驟數(shù)越多,重復(fù)取相與計算次數(shù)越多,整體上對焦耗時越多。若不忽略多次啟停造成的時間延長,則步驟數(shù)越多,啟停引起的時耗越多。因此,文中以所需步驟數(shù)的多少的來評價對焦過程的快慢[34-35],對傳統(tǒng)爬山搜索算法和本文中所提算法對焦過程中所需步驟數(shù)進(jìn)行了統(tǒng)計。文中所提方法完成對焦僅需4步,與傳統(tǒng)爬山算法相比,步驟數(shù)明顯減少,并在表5中做出統(tǒng)計。
同時,爬山完成所需步驟數(shù)明顯與芯片的初始位置以及初始運(yùn)動方向的設(shè)定有關(guān)。當(dāng)設(shè)定初始方向?yàn)橄蛏希酒跏嘉恢梦挥诮裹c(diǎn)以下比初始位置位于焦點(diǎn)以上對焦步驟數(shù)明顯減少,原因是少了第三次取相后的換向過程。另外,若爬山步距設(shè)置較小,并且評價函數(shù)選取不恰當(dāng),搜索過
程中很容易陷入局部極值,在未到達(dá)峰值點(diǎn)的情況下就退出搜索,對焦過程中斷。
表5 不同對焦方法所需步驟數(shù)對比
以上研究表明,一定區(qū)域內(nèi),通過灰度大于閾值的像素數(shù)變化曲線作為微孔式數(shù)字PCR芯片的自動對焦算法是可行的。利用對焦窗口和判斷閾值的自適應(yīng)選取,統(tǒng)計窗口內(nèi)大于閾值的像素數(shù),并得出其隨離焦距離變化的特征擬合曲線以及曲線的函數(shù)表達(dá)式,該函數(shù)在后續(xù)測試中成功實(shí)現(xiàn)了對焦。該方法不受灰度變化的影響,與混合爬山對焦方法相比,對焦步驟數(shù)最少減少了33.3%,最多減少了66.7%,平均減少了51.89%,實(shí)現(xiàn)了微孔式數(shù)字PCR芯片微尺度陣列單元的準(zhǔn)確快速對焦,在最大程度上減少熒光曝光時間,進(jìn)而減少熒光的淬滅,為后續(xù)計算提供更為原始而準(zhǔn)確的圖像。