程昱之,鐘麗輝,何 鑫,王 遠(yuǎn),李朝嵐
(1. 西南林業(yè)大學(xué) 機(jī)械與交通學(xué)院,云南 昆明 650224;2. 西南林業(yè)大學(xué) 大數(shù)據(jù)與智能工程學(xué)院,云南 昆明650224)
闊葉材橫截面微觀圖像由管孔、木射線、生長輪、木纖維和軸向薄壁組織構(gòu)成,其中管孔是木材研究最重要的特征之一[1?3]。管孔不僅是分析考古木材樣品的構(gòu)造特征與保護(hù)狀態(tài)的研究要素[3],也是研究某一地區(qū)若干年內(nèi)木材生長量和環(huán)境氣候變化相關(guān)性的依據(jù)[4]。管孔的分割是微觀木材圖像中提取管孔特征量和進(jìn)行木材樹種自動(dòng)識別的關(guān)鍵步驟[5?6],因此,微觀木材圖像中的管孔分割有重要的研究意義。近些年來應(yīng)用于管孔分割的算法主要有數(shù)學(xué)形態(tài)學(xué)、區(qū)域生長、目標(biāo)遺傳和水平集等[7?9]。張廣群等[9]首先運(yùn)用多目標(biāo)遺傳算法成功地分割出圖像中的大部分管孔,但會出現(xiàn)復(fù)管孔或管孔團(tuán)的漏分,同時(shí)部分軸向薄壁組織會連同其附近的管孔一起被分割出來。汪杭軍[10]運(yùn)用局部水平集算法,以局部灰度分布的均值作為統(tǒng)計(jì)信息,加強(qiáng)了管孔區(qū)域和背景區(qū)域的對比度,該算法雖然克服了漏分問題,但出現(xiàn)了噪聲的誤分割,一部分噪聲為一些輪廓較大的木射線組織,另一部分為形狀大小與管孔相似的木纖維組織。祁亨年等[11]運(yùn)用改變結(jié)構(gòu)元素和形態(tài)尺度的數(shù)學(xué)形態(tài)學(xué)算法對管孔進(jìn)行分割,該算法克服了木射線和木纖維組織等噪聲的影響,但出現(xiàn)了圖像邊緣細(xì)節(jié)丟失,如較小的管孔被當(dāng)作噪聲去除或是較大的管孔部分組織缺失。SHEN等[12]通過檢測閉合區(qū)域的平均面積得出最適合的結(jié)構(gòu)元素,并運(yùn)用形態(tài)學(xué)算法對管孔進(jìn)行分割,但還是會出現(xiàn)小孔漏分,大孔誤分的情況。由于木材橫截面微觀圖像中管孔數(shù)量眾多、形態(tài)各異且隨機(jī)分布,木纖維和軸向薄壁組織橫截面也呈現(xiàn)一個(gè)個(gè)相對較小的孔洞,從而對管孔進(jìn)行分割較為困難。綜上所述,微觀木材圖像中管孔的分割依然是目前的研究熱點(diǎn)和難點(diǎn)。本研究提出了一種改進(jìn)K-means聚類與分水嶺的木材橫截面管孔分割算法,旨在解決管孔漏分、誤分和噪聲去除的問題并快速分割出管孔區(qū)域。
日本森林?jǐn)?shù)據(jù)庫(https://db.ffpri.go.jp/WoodDB/JWDB/home.php)。該數(shù)據(jù)庫成立于1928年,現(xiàn)有木材標(biāo)本29 000余號,隸屬270科2 050屬8 500種;切片標(biāo)本約90 000號[13]。本研究用到的木材樹種為大紅葉楓 Acer amoenum(15幀圖像)、尖齒槭A. argutum(5幀)、細(xì)柄槭A. capillipes(4幀)、茶條槭 A.ginnala(1幀)、桑葉槭 A. morifolium(3幀)、毛果槭 A. nikoense(3幀)、日本槭 A. nipponicum(5幀)、賽波德槭A. sicboldianum(24幀)、 花 楷 槭A. ukurunduense(6幀)、 紅 脈 槭A. rufinerve(25幀)、 薄 葉 槭A.tenuifolium(3幀)和褐枝獼猴桃Actinidia rufa(7幀)。
傳統(tǒng)的K-means聚類算法以距離作為相似性的評價(jià)指標(biāo),基本思想是按照距離將樣本聚成不同的簇,兩點(diǎn)距離越近,相似度就越大,以得到緊湊且獨(dú)立的簇作為聚類目標(biāo)[14?15]。傳統(tǒng)的K-means聚類算法將樣本映射到RGB顏色特征空間,構(gòu)造新的映射關(guān)系,能夠打破聚類只能是球狀的限制,但聚類中心的選擇會較大程度上影響分類效果,尤其是當(dāng)聚類中心的選取全部位于管孔以外時(shí),管孔區(qū)域會被整體歸為噪聲。此外,由于初始聚類中心的隨機(jī)生成,可能會導(dǎo)致分類結(jié)果不一致或?qū)⒛纠w維或軸向薄壁組織被整體分割出來?;诖?,針對以上問題進(jìn)行算法改進(jìn),實(shí)現(xiàn)聚類中心的自適應(yīng)選取。在RGB色彩空間下提取彩色木材微觀圖像的三通道分量。結(jié)合木材橫截面原圖,能夠看出生長輪和木射線區(qū)域顏色較深,顏色值較小,所以其對應(yīng)顏色值較小的峰值附近區(qū)域;管孔區(qū)域顏色較淺,顏色值較大,所以其對應(yīng)顏色值較大的峰值附近區(qū)域;軸向薄壁組織和木纖維區(qū)域顏色較為平均,顏色值介于前兩者之間,所以其對應(yīng)兩峰之間的波谷附近區(qū)域。分別取3個(gè)分量的均值組成第1個(gè)中心點(diǎn),代表顏色直方圖波谷附近區(qū)域,該點(diǎn)作為軸向薄壁組織和木纖維區(qū)域的簇類中心;遍歷三通道分量,對于大于各自均值的所有顏色值取中值作為第2個(gè)中心點(diǎn),由于該點(diǎn)對應(yīng)顏色值較大,所以該點(diǎn)作為管孔的簇類中心;小于各自均值的所有顏色值取中值作為第3個(gè)中心點(diǎn),由于該點(diǎn)對應(yīng)顏色值較小,所以作為生長輪和木射線區(qū)域的簇類中心,分別代表顏色直方圖兩峰峰值附近區(qū)域。設(shè)通道分量處的顏色值為計(jì)算每個(gè)通道分量的均值,均值兩側(cè)的中值為M1和M2,Meidan表示取目標(biāo)數(shù)組的中值函數(shù)。
根據(jù)圖像中各組織部分對應(yīng)的顏色峰值或波谷得出這一組織部分的中心點(diǎn),再以這3個(gè)點(diǎn)作為初始聚類中心點(diǎn),運(yùn)用K-means算法實(shí)現(xiàn)管孔的粗分割。
雖然K-means聚類算法能夠?qū)⒛静奈⒂^圖像中的管孔區(qū)域和背景區(qū)域區(qū)分開,但兩者的顏色梯度差異較小,這可能會導(dǎo)致分水嶺變換的過度分割。為了增加管孔區(qū)域和背景區(qū)域的顏色梯度差異,使分水嶺變換在梯度運(yùn)算判斷極大值點(diǎn)時(shí)更加準(zhǔn)確,更加有效地實(shí)現(xiàn)管孔的精分割,按照聚類的結(jié)果將木材微觀圖像進(jìn)行3類顏色編碼。第1類軸向薄壁組織細(xì)胞壁和木纖維區(qū)域進(jìn)行紅色編碼,第2類管孔區(qū)域進(jìn)行綠色編碼,第3類生長輪和木射線區(qū)域進(jìn)行藍(lán)色編碼。最后,通過形態(tài)學(xué)操作和分水嶺變換實(shí)現(xiàn)管孔的精分割。
為實(shí)現(xiàn)木材橫截面微觀圖像的管孔分割,具體步驟如下(圖1):①提取木材橫截面微觀圖像的RGB分量并繪制顏色直方圖;②根據(jù)木材微觀圖像中的3類目標(biāo)區(qū)域,即軸向薄壁組織和木纖維、管孔、生長輪和木射線,確定聚類初始中心點(diǎn);③根據(jù)像素點(diǎn)與聚類中心點(diǎn)之間的歐式距離求出新的簇類中心并判斷中心點(diǎn)是否改變,若不一致則繼續(xù)迭代,一致則進(jìn)行下一步;④對劃分出的3類區(qū)域進(jìn)行顏色編碼;⑤最后通過形態(tài)學(xué)操作去除面積較小的噪聲,運(yùn)用分水嶺算法分割出管孔。
圖1 改進(jìn) K-means 與分水嶺算法流程Figure 1 Improved K-means and watershed algorithm flow
以大紅葉楓橫截面原圖(997×1 418)為例,將本研究算法和現(xiàn)有算法(閾值分割、分水嶺、K-means聚類與閾值分割)的分割效果進(jìn)行對比分析,并以平均管孔有效分割率(F)作為算法分割性能的評價(jià)指標(biāo)進(jìn)行評價(jià)。
式(4)~(5)中,Ti表示每張圖像的管孔實(shí)際分割總數(shù),Ni表示每張圖像中的管孔總數(shù),Pi表示每張圖像的管孔有效分割率,重復(fù)次數(shù)n的取值為101,,F(xiàn)表示平均管孔有效分割率。
隨機(jī)選擇3種木材微觀橫截面原圖(圖2)。在RGB色彩空間下提取彩色木材微觀圖像的三通道分量(圖3)??梢钥闯?個(gè)分量均有2個(gè)峰和1個(gè)波谷組成,其中2個(gè)峰分別代表管孔區(qū)域和生長輪、木射線區(qū)域,波谷代表軸向薄壁組織和木纖維區(qū)域。
圖2 木材橫截面原圖Figure 2 Original cross-section of wood
圖3 紅脈槭顏色直方圖Figure 3 Color histogram of A. rufinerve
按照顏色直方圖得到初始聚類中心點(diǎn)。尖齒槭顏色值為 (130.0, 144.0, 169.0),(20.0, 22.0, 49.0),(68.0, 78.4, 104.8);紅脈槭顏色值為 (84.6, 89.2, 110.4),(167.0, 184.0, 193.0),(32.0, 28.0, 56.0);賽波德槭顏色值為 (181.0, 173.0, 207.0),(64.0, 40.0, 110.0),(113.0, 99.4, 154.9)。運(yùn)用改進(jìn) K-means 聚類算法劃分簇類 (圖 4)。
圖4 管孔粗分割結(jié)果Figure 4 Rough segmentation results of pores
為了增加管孔區(qū)域和背景區(qū)域兩者的顏色梯度差異,對聚類粗分割結(jié)果進(jìn)行色彩編碼(圖5),第1類對軸向薄壁組織細(xì)胞壁和木射線區(qū)域進(jìn)行紅色編碼,顏色值為(202, 12, 22);第2類對管孔區(qū)域進(jìn)行綠色編碼,顏色值為(53, 106, 195);第3類對生長輪以及木射線區(qū)域歸進(jìn)行藍(lán)色編碼,顏色值為(29,209, 107)。
圖5 顏色編碼結(jié)果Figure 5 Color coding results
經(jīng)過灰度轉(zhuǎn)換、開閉運(yùn)算等圖像形態(tài)學(xué)處理后,消除了絕大部分的木射線、木纖維和軸向薄壁組織等面積較小的噪聲。此外運(yùn)用分水嶺變換對已分類的木材微觀圖像進(jìn)行目標(biāo)分割,即管孔分割(圖6),將管孔快速準(zhǔn)確地分割。從最終的分割結(jié)果來看,除了極個(gè)別的細(xì)小管孔未被檢測到之外,其余管孔均被完整地分割,分割出的輪廓也與實(shí)際輪廓基本吻合。
圖6 管孔精分割結(jié)果Figure 6 Fine segmentation results of pores
如圖7所示:閾值分割算法每張木材橫截面微觀圖像平均有88.1%的管孔被準(zhǔn)確有效地分割出來;分水嶺算法每張木材橫截面微觀圖像平均有91.4%的管孔被準(zhǔn)確有效地分割出來,但存在噪聲誤分的問題;K-means聚類與閾值分割算法先運(yùn)用K-means聚類算法將木材圖像分為3類,再采用閾值分割和canny算子做管孔精分割,結(jié)果每張木材橫截面微觀圖像平均有96.3%的管孔被準(zhǔn)確有效地分割出來,但部分木射線和軸向薄壁組織也被分割出來,且存在輪廓不飽滿的問題;本研究算法為改進(jìn)K-means聚類與分水嶺算法,結(jié)果每張木材橫截面微觀圖像平均有97.1%的管孔被準(zhǔn)確有效地分割出來,分割出的管孔與實(shí)際管孔基本吻合。
圖7 各算法分割效果Figure 7 Segmentation effect diagram of each algorithm
為驗(yàn)證本研究算法分割管孔的準(zhǔn)確性,對12類樹種的橫截面微觀圖像在各算法下的分割結(jié)果進(jìn)行了比較(表1),能夠看出閾值分割不存在管孔誤分,但因面積較小而漏分的管孔較多;分水嶺算法不僅存在管孔漏分且會誤分割出木射線、木纖維以及軸向薄壁組織;K-means聚類與閾值分割存在木射線和軸向薄壁組織的誤分割;本研究算法基本不存在管孔的漏分和誤分問題。
表1 各算法分割效果對比Table 1 Comparison of segmentation effects of various algorithms
本研究改進(jìn)的K-means聚類與分水嶺的管孔分割算法,解決了初始中心點(diǎn)的隨機(jī)性,并能有效地區(qū)分管孔區(qū)域與木纖維、木射線以及軸向薄壁組織等噪聲區(qū)域,對管孔分割更為準(zhǔn)確。本研究算法采用取圖像顏色直方圖對應(yīng)的峰值確定初始聚類中心點(diǎn)和色彩編碼的方式,充分將管孔與絕大部分噪聲區(qū)域區(qū)分開,更適合于木材橫截面微觀圖像分割任務(wù)。通過形態(tài)學(xué)處理和分水嶺算法,對管孔進(jìn)行精分割,將兩者結(jié)合從而得到更為準(zhǔn)確的分割結(jié)果。與其他分割算法相比,本研究算法分割效果顯著提升,在大小不一且隨機(jī)分布的管孔分割過程中魯棒性高,有效避免了管孔漏分問題,具有良好的分割性能。