王一丁 孫 霞 李耀利 蔡少青 袁 媛
1(北方工業(yè)大學(xué) 北京 100144) 2(北京大學(xué) 北京 100041) 3(中國(guó)中醫(yī)科學(xué)院中藥資源中心 北京100700)
中藥材粉末顯微鑒定[1]由于使用的樣品用量較少且儀器相對(duì)簡(jiǎn)單,在中藥材鑒定領(lǐng)域有著簡(jiǎn)捷、實(shí)用和環(huán)保等獨(dú)特的優(yōu)勢(shì)。但是傳統(tǒng)的主要依靠人工識(shí)別的顯微鑒定存在需要專業(yè)知識(shí)、主觀因素多的劣勢(shì)。近年來(lái)隨著計(jì)算機(jī)運(yùn)算處理速度的提高和圖像智能識(shí)別技術(shù)的快速發(fā)展,在顯微圖像領(lǐng)域?qū)χ兴幉姆勰┻M(jìn)行鑒別的技術(shù)進(jìn)一步得到發(fā)展[2]。將計(jì)算機(jī)應(yīng)用于傳統(tǒng)的顯微鑒定,能夠利用計(jì)算機(jī)代替人工完成對(duì)中藥材的鑒定[3],這一發(fā)展使得顯微鑒定不再需要對(duì)鑒定人員提出既要具備豐富的實(shí)踐經(jīng)驗(yàn)又要擁有較高的理論知識(shí)水平等嚴(yán)格的要求,因此顯微鑒定的客觀性和自動(dòng)化的程度均得到提高。
王亞杰等[3]早在2006年就提出使用多種方法來(lái)提取中藥材粉末顯微圖像的主要特征。2012年,針對(duì)葉類中藥顯微圖像的基于閾值進(jìn)行圖像分割的方法[4]被提出,主要通過(guò)多種圖像領(lǐng)域的處理方法實(shí)現(xiàn)了對(duì)葉類中藥材顯微圖像的有效分割。2013年,針對(duì)植物中草藥顯微圖像,有學(xué)者提出另一種圖像分割方法[5],該方法通過(guò)獲取合適的分割閾值來(lái)實(shí)現(xiàn)更好的圖像分割結(jié)果。2014年,一種改進(jìn)的邊緣提取算法[6]被提出并用于中藥材顯微圖像,該濾波算法對(duì)原圖像的細(xì)節(jié)部分和邊緣部分實(shí)現(xiàn)了較好的保存,從而提高了顯微圖像的識(shí)別效果。中藥材中的一些近緣藥材也可使用合適的圖像處理方法進(jìn)行分析,從而完成種類鑒定。2017年,對(duì)于牛膝和川牛膝,王耐等[7]采用神經(jīng)網(wǎng)絡(luò)的識(shí)別方法實(shí)現(xiàn)對(duì)這兩種近緣藥材的有效識(shí)別,這也證明了對(duì)多種藥材進(jìn)行顯微識(shí)別的可能。
以上研究充分表明在顯微圖像微觀領(lǐng)域進(jìn)行中藥材鑒定識(shí)別研究已經(jīng)受到越來(lái)越多研究人員的關(guān)注。但是傳統(tǒng)的圖像處理和模式識(shí)別方法通常適用于小類別和小數(shù)量的數(shù)據(jù)類型,且該方法提取到的特征相對(duì)較淺,不適用于多類別和大數(shù)據(jù)量的顯微特征圖像的檢測(cè)識(shí)別研究。目前,使用深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)方法對(duì)中藥材粉末顯微特征圖像進(jìn)行特征檢測(cè)[8],能夠利用計(jì)算機(jī)對(duì)圖像中的目標(biāo)特征進(jìn)行自動(dòng)定位以及完成特征種類的自動(dòng)識(shí)別,減少了人工判斷中主觀因素造成的影響,具有良好的推廣性和普適性。但是,由于中藥材粉末顯微圖像常常存在目標(biāo)特征斷裂殘缺的問(wèn)題,導(dǎo)致檢測(cè)效果不佳。本文針對(duì)這一問(wèn)題,提出了一種改進(jìn)型SSD檢測(cè)算法,將SSD檢測(cè)網(wǎng)絡(luò)[9]與SE模塊[10]結(jié)合起來(lái),使得改進(jìn)后的SSD算法能對(duì)網(wǎng)絡(luò)中的特征通道按照對(duì)目標(biāo)任務(wù)的重要程度進(jìn)行權(quán)重的分配,這樣即使圖像中的目標(biāo)特征是不完整的,改進(jìn)型網(wǎng)絡(luò)也能對(duì)其包含的關(guān)鍵信息進(jìn)行充分的學(xué)習(xí),從而提升網(wǎng)絡(luò)的檢測(cè)性能,得到更好的檢測(cè)效果。
本文使用中藥材粉末顯微特征圖像數(shù)據(jù)集,這一數(shù)據(jù)集是通過(guò)專業(yè)的采集和合理的特征種類劃分后得到的。經(jīng)過(guò)對(duì)數(shù)據(jù)集圖像的分析,發(fā)現(xiàn)圖像中存在細(xì)胞或組織特征斷裂殘缺的情況,這會(huì)影響到最終的檢測(cè)精度。
針對(duì)本課題的研究?jī)?nèi)容,本文經(jīng)過(guò)多次實(shí)驗(yàn)確立了一套適于計(jì)算機(jī)檢測(cè)與識(shí)別的中藥材粉末顯微特征圖像的采集操作規(guī)程。
操作流程大致包括:收集樣品、粉碎、過(guò)篩、制粉末片和拍攝顯微特征圖像。其中采集設(shè)備如圖1所示[9]。
(a) 粉碎機(jī)和藥篩 (b) 中藥材粉末
(c) 粉末顯微標(biāo)本片 (d) 顯微數(shù)碼成像系統(tǒng)圖1 中藥材粉末顯微特征圖片的采集
對(duì)采集到的2 417幅圖像進(jìn)行類別歸納。結(jié)合中藥材自身細(xì)胞或組織特征所屬類別的情況和利用計(jì)算機(jī)實(shí)現(xiàn)顯微圖像特征自動(dòng)檢測(cè)的實(shí)際需求,對(duì)采集到的原始圖像進(jìn)行中藥材粉末顯微特征的分類,其中:將下皮厚壁細(xì)胞、內(nèi)種皮杯狀細(xì)胞、石細(xì)胞和種皮石細(xì)胞都?xì)w為厚壁細(xì)胞;將花粉和孢子歸為花粉孢子類;由于導(dǎo)管與其他中藥材特征差別較大且普遍存在于各種中藥材中,故將導(dǎo)管單獨(dú)歸為一類。表1為最終的歸納結(jié)果。
表1 中藥材粉末顯微特征分類歸納
中藥材在粉碎過(guò)程中會(huì)出現(xiàn)各種組織和細(xì)胞隨機(jī)破碎和斷裂的情況,殘缺的組織和細(xì)胞是檢測(cè)中的重點(diǎn)難點(diǎn)問(wèn)題,組織和細(xì)胞特征的不完整性會(huì)影響著最終的檢測(cè)效果。本文對(duì)厚壁細(xì)胞、花粉孢子和導(dǎo)管這三類中藥材粉末顯微特征的圖像進(jìn)行檢測(cè),針對(duì)其中的斷裂殘缺目標(biāo)進(jìn)行重點(diǎn)研究。圖2為部分細(xì)胞或組織的斷裂殘缺圖像。
(a) 厚壁細(xì)胞 (b) 厚壁細(xì)胞
(c) 花粉孢子 (d) 花粉孢子
(e) 導(dǎo)管 (f) 導(dǎo)管圖2 細(xì)胞或組織斷裂殘缺圖
由于采集得到的每幅圖像是大小為5 440×3 648像素、3通道的RGB彩色高清顯微圖像,較大的高清晰度圖像會(huì)使深度學(xué)習(xí)檢測(cè)網(wǎng)絡(luò)在前端讀入圖片和進(jìn)行圖像預(yù)處理時(shí)耗時(shí)較多。本文在保持其他參數(shù)相同的條件下,使用SSD算法對(duì)5 440×3 648和1 000×670這兩種大小的數(shù)據(jù)集進(jìn)行檢測(cè)實(shí)驗(yàn),取訓(xùn)練1 000步(step值)和2 000步(step值)時(shí)的準(zhǔn)確率(accuracy)和平均每秒跑的步數(shù)(global_step/sec)進(jìn)行對(duì)比,其中一步完成16幅圖片的訓(xùn)練。結(jié)果如表2所示,實(shí)驗(yàn)結(jié)果證明將原始圖像按照原圖的長(zhǎng)寬比縮小至1 000×670可以在不影響最終檢測(cè)結(jié)果的同時(shí)加快網(wǎng)絡(luò)的訓(xùn)練速度。故本文使用大小為1 000×670的圖像完成實(shí)驗(yàn)。
表2 兩種圖片大小消耗時(shí)間對(duì)比圖
由于采集到的大量的顯微圖像是由不同的專家采用不同的設(shè)備在不同的時(shí)間點(diǎn)進(jìn)行拍攝采集的,所以圖像中會(huì)存在光照影響、角度偏移、尺度不同等多個(gè)影響最終檢測(cè)結(jié)果的問(wèn)題。
為了獲得更具多樣性的圖像數(shù)據(jù),去除數(shù)據(jù)庫(kù)中圖像的一些干擾因素對(duì)檢測(cè)結(jié)果的影響,獲取更多的殘缺圖像樣本,進(jìn)而得到更好的檢測(cè)效果,本文使用多種圖像多樣性擴(kuò)充方式對(duì)采集得到的中藥材顯微特征圖像進(jìn)行處理來(lái)提高最終的檢測(cè)精確率,圖3為此操作過(guò)程的流程。
圖3 擴(kuò)充圖像多樣性流程
2.2.1圖像色彩調(diào)整
圖像色彩調(diào)整主要包括對(duì)亮度、飽和度、色相和對(duì)比度的隨機(jī)調(diào)整。
由于經(jīng)過(guò)不同順序的色彩調(diào)整后會(huì)得到不同效果的圖片,所以本文采用多種圖像色彩調(diào)整方法的隨機(jī)組合來(lái)對(duì)圖像進(jìn)行色彩的調(diào)整。本文選用4種圖像色彩調(diào)整方法組合方式,如圖4所示,每一種組合方式的調(diào)整方法的使用順序?yàn)閺淖蟮接摇?/p>
圖4 色彩調(diào)整方式組合圖
圖5是經(jīng)過(guò)四種組合方式得到的調(diào)整后的圖像。
(a) 組合方式1 (b) 組合方式2
(c) 組合方式3 (d) 組合方式4圖5 四種組合方式調(diào)整效果圖
2.2.2圖像裁剪
為獲取斷裂殘缺目標(biāo)的訓(xùn)練樣本,本文在一定條件下對(duì)圖像進(jìn)行圖像裁剪,圖6為圖像裁剪的流程。
圖6 圖像裁剪流程
由圖6可知,圖像裁剪的步驟大致分為:
(1) 對(duì)圖像隨機(jī)進(jìn)行擴(kuò)充。圖像擴(kuò)充的概率為0.5,從1.1~4之間選取一個(gè)隨機(jī)數(shù)k作為圖像的擴(kuò)大倍數(shù),對(duì)原圖像的四周進(jìn)行填充,填充的值為數(shù)據(jù)集的R、G和B各通道的均值。圖7是擴(kuò)充后得到的圖像。
(a) k=2.7 (b) k=1.6圖7 圖像擴(kuò)充結(jié)果
(2) 選取合適的ROI。首先隨機(jī)選取小于原圖的高和寬作為ROI的高和寬。然后隨機(jī)確定ROI的位置,使得ROI能夠包含標(biāo)注框box的中心點(diǎn)且該ROI與圖像標(biāo)注框box的交并比iou滿足一定的條件,本文iou∈{0.1,0.3,0.5,0.7,0.9,1}。
(3) 用隨機(jī)選好的ROI對(duì)圖像和標(biāo)注框box對(duì)擴(kuò)充后的圖像或者原圖進(jìn)行裁剪,為斷裂殘缺的目標(biāo)的訓(xùn)練提供了大量的訓(xùn)練樣本。部分裁剪的圖像如圖8所示,其中圖8(a)是在擴(kuò)大的圖像上進(jìn)行裁剪,圖8(b)是在原始圖像上進(jìn)行裁剪,框內(nèi)的部分是裁剪后的圖像目標(biāo),該操作為實(shí)驗(yàn)提供了大量斷裂殘缺的特征不完整的樣本。
(a) 擴(kuò)充圖像的裁剪圖(b) 原圖的裁剪圖圖8 圖像裁剪結(jié)果
2.2.3隨機(jī)水平翻轉(zhuǎn)
對(duì)圖像和標(biāo)注框box隨機(jī)進(jìn)行水平翻轉(zhuǎn)(從左到右),輸出沿原圖寬度方向翻轉(zhuǎn)的圖像,同時(shí)也將標(biāo)注框box做相應(yīng)的變化。圖9為處理前后的對(duì)比圖。
(a) 原圖 (b) 水平翻轉(zhuǎn)后的圖像圖9 圖像水平翻轉(zhuǎn)結(jié)果
2.2.4去均值
對(duì)圖像進(jìn)行去均值處理使得每個(gè)圖像樣本減去數(shù)據(jù)集的統(tǒng)計(jì)平均值,從而將圖像中的一些共同部分移除,凸顯出個(gè)體之間的差異,提高網(wǎng)絡(luò)訓(xùn)練速度和精度。圖像去均值處理后的結(jié)果如圖10所示。
(a) 原圖 (b) 去均值后的圖像圖10 圖像去均值結(jié)果
SSD算法是不需要生成候選框就直接通過(guò)卷積操作對(duì)檢測(cè)目標(biāo)進(jìn)行坐標(biāo)定位和類別判斷的目標(biāo)檢測(cè)算法。SSD算法一步到位的檢測(cè)過(guò)程在保證檢測(cè)精度的同時(shí)提高了檢測(cè)速度,是目前被大家廣泛使用的檢測(cè)算法[11-12]。SSD 算法的結(jié)構(gòu)包含兩個(gè)部分,即前端基礎(chǔ)的提取特征網(wǎng)絡(luò)和后端的金字塔網(wǎng)絡(luò),圖11為SSD結(jié)構(gòu)圖。
圖11 SSD結(jié)構(gòu)框圖
由圖11可知,將圖片送入SSD網(wǎng)絡(luò),先用基礎(chǔ)網(wǎng)絡(luò)VGG16(Visual Geometry Group)[13]進(jìn)行特征提取,將原VGG16網(wǎng)絡(luò)中的最后兩層去掉,在其位置上加兩層卷積層,然后再加4個(gè)額外的卷積層,提取其中6個(gè)卷積層組成金字塔網(wǎng)絡(luò)用于目標(biāo)的分類和回歸,最終用非極大值抑制完成框體篩選以后輸出預(yù)測(cè)結(jié)果。
SSD 算法主要有以下優(yōu)點(diǎn):
(1) 多尺度特征圖:SSD算法使用金字塔網(wǎng)絡(luò)來(lái)對(duì)不同尺度下的特征圖進(jìn)行目標(biāo)的檢測(cè)。由于網(wǎng)絡(luò)前面較淺層的特征圖較大,包含較多的紋理細(xì)節(jié)信息,更適合進(jìn)行小物體的檢測(cè);而后面較深的特征圖相對(duì)較小,包含了更多的全局信息,包括物體的輪廓、形狀等特征,適合大物體的檢測(cè)。所以采用金字塔網(wǎng)絡(luò)在逐漸變小的特征圖上進(jìn)行目標(biāo)檢測(cè),網(wǎng)絡(luò)對(duì)不同尺寸的物體都有較好的檢測(cè)結(jié)果。
(2) 多尺度候選框:SSD算法中的特征圖經(jīng)過(guò)劃分得到多個(gè)小單元,每個(gè)小單元又會(huì)設(shè)置多個(gè)不同尺度和不同長(zhǎng)寬比的先驗(yàn)框。這種先驗(yàn)框的選擇方式使得先驗(yàn)框在不同的特征圖中有不同的大小,在同一個(gè)特征圖中又有不同的長(zhǎng)寬比,所以有著不同形狀和大小的檢測(cè)目標(biāo)都能被SSD算法大致覆蓋到。
深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)在卷積過(guò)程中每經(jīng)過(guò)一個(gè)卷積操作都會(huì)輸出一個(gè)特征圖,這個(gè)多通道的特征圖能夠用來(lái)描述經(jīng)卷積提取到的不同的圖像特征。SE模塊可以對(duì)特征圖的多個(gè)特征通道間的關(guān)系建模,在網(wǎng)絡(luò)訓(xùn)練中通過(guò)迭代學(xué)習(xí)獲得每個(gè)特征通道對(duì)當(dāng)前任務(wù)的重要程度,根據(jù)學(xué)習(xí)到的重要程度將一些重要的圖像特征進(jìn)行提升[14],突出其作用,圖12為SE模塊的結(jié)構(gòu)圖。
圖12 SE結(jié)構(gòu)框圖
SE模塊的結(jié)構(gòu)分為兩個(gè)部分,分別是Squeeze操作部分和Excitation操作部分,其原理和操作過(guò)程分為以下幾個(gè)步驟:
(1) Squeeze:對(duì)輸入的特征圖進(jìn)行特征層面上的壓縮,將每一個(gè)二維空間的特征通道中所有點(diǎn)的信息都?xì)w為一個(gè)值,操作過(guò)程如下:
(1)
式中:xc指特征圖x的第c個(gè)通道;H和W分別是特征圖的高和寬。
(2) Excitation:為經(jīng)過(guò)Squeeze操作得到的特征通道生成相應(yīng)的通道權(quán)重,圖12中字母a、b、c、d、e、f、g和h分別代表進(jìn)行權(quán)重分配后不同的特征通道。該操作過(guò)程如下:
s=Fex(z,W)=σ(W2δ(W1z))
(2)
式中:δ指ReLU函數(shù),σ指Sigmoid函數(shù)。s表示c個(gè)特征通道的權(quán)重系數(shù)。最后通過(guò)將系數(shù)s與之前輸入的特征圖相乘的方法,輸出得到有權(quán)重分布的能夠體現(xiàn)通道重要性的新的特征圖。計(jì)算公式為:
Y=Fscale(xc,sc)=xc×sc
(3)
本文結(jié)合SE和 SSD算法的優(yōu)越性,提出改進(jìn)型的SSD算法,將SE模塊加在SSD算法的每一個(gè)預(yù)測(cè)卷積特征圖之后,使得SSD算法中特征圖的各通道按照對(duì)檢測(cè)任務(wù)重要性的不同進(jìn)行通道權(quán)重分配,權(quán)重系數(shù)是在訓(xùn)練過(guò)程中經(jīng)過(guò)不斷地迭代學(xué)習(xí)得到的。在訓(xùn)練階段,將網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽作對(duì)比,通過(guò)梯度回傳的方式將兩者的偏差反饋到各個(gè)變量,權(quán)重系數(shù)根據(jù)反饋的情況自動(dòng)更新,預(yù)測(cè)結(jié)果逐漸趨于穩(wěn)定,當(dāng)結(jié)果最佳時(shí)權(quán)重系數(shù)也取得最優(yōu)值。通過(guò)通道權(quán)重分配可以增強(qiáng)網(wǎng)絡(luò)所提取特征的可分辨性,這樣網(wǎng)絡(luò)可以對(duì)提取到的重要的圖像特征進(jìn)行充分學(xué)習(xí),即使是殘缺破碎的目標(biāo),網(wǎng)絡(luò)也能對(duì)其保留著的重要的特征進(jìn)行提取判斷,最終獲得更好的檢測(cè)結(jié)果。
基于SE的改進(jìn)型SSD算法結(jié)構(gòu)如圖13所示,其中有六個(gè)特征圖用來(lái)生成最終的預(yù)測(cè)框,分別在這些特征圖之后加一個(gè)SE模塊,生成有權(quán)重分布的卷積特征圖,將該有權(quán)分布的多通道特征圖一方面用于最終檢測(cè)框的預(yù)測(cè),另一方面作為下一級(jí)卷積操作的輸入。
圖13 改進(jìn)型SSD結(jié)構(gòu)框圖
可以看出,將SE與Conv7相結(jié)合得到有不同通道權(quán)重的卷積特征圖,將這一突出關(guān)鍵信息、抑制無(wú)關(guān)信息的特征圖用于檢測(cè)框的預(yù)測(cè)可以更好地發(fā)揮關(guān)鍵信息對(duì)預(yù)測(cè)結(jié)果的指導(dǎo)作用,從而實(shí)現(xiàn)更準(zhǔn)確的框體預(yù)測(cè)和種類判別。同時(shí),將SE與Conv7結(jié)合后的卷積特征圖作為下一卷積層的輸入,經(jīng)過(guò)卷積輸出特征圖Conv8,同理,圖13中其他加入SE模塊的詳細(xì)結(jié)構(gòu)框圖與圖中下半部分虛線內(nèi)的框圖類似。在不斷的迭代訓(xùn)練中,網(wǎng)絡(luò)充分學(xué)習(xí)到大權(quán)重所對(duì)應(yīng)通道的關(guān)鍵信息,從而獲得更好的檢測(cè)效果。
本文搭建網(wǎng)絡(luò)模型所使用的框架為T(mén)ensorflow框架[15]。使用顯微圖像共2 417幅,其中包含厚壁細(xì)胞(812幅)、花粉孢子(622幅)和導(dǎo)管(983幅)三類數(shù)據(jù),從中隨機(jī)選取1 931(約占總數(shù)80%)幅圖片作為訓(xùn)練集,選取486(約占總數(shù)20%)幅圖片作為測(cè)試集。
AP可以用來(lái)評(píng)價(jià)訓(xùn)練得到的模型在各個(gè)類別上的表現(xiàn)效果,而mAP可以衡量經(jīng)過(guò)訓(xùn)練得到的模型在總類別上的表現(xiàn)效果,取所有AP值的平均值即為mAP。本文選取AP和mAP來(lái)對(duì)改進(jìn)前后的算法進(jìn)行評(píng)價(jià)。
本文將厚壁細(xì)胞、花粉孢子和導(dǎo)管三類中藥材粉末顯微特征圖像作為數(shù)據(jù)集,使用基于SE的改進(jìn)型SSD算法和原始SSD算法進(jìn)行對(duì)比實(shí)驗(yàn),訓(xùn)練過(guò)程中預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽之間的偏差即損失函數(shù)值(loss)的變化趨勢(shì)如圖14所示??梢钥闯?,基于SE的改進(jìn)型SSD算法相較原始SSD算法能取得更理想的收斂效果,在訓(xùn)練前期,原始SSD算法由于相對(duì)較小的網(wǎng)絡(luò)模型而率先取得較低的loss值,但是隨著訓(xùn)練時(shí)長(zhǎng)的增加,改進(jìn)型SSD算法發(fā)揮自身優(yōu)勢(shì),loss值逐漸低于原始SSD算法的loss值,最終取得較低的loss值,獲得最優(yōu)解。
圖14 原始SSD算法與改進(jìn)型SSD算法loss對(duì)比圖
使用測(cè)試集圖片對(duì)原始SSD算法和改進(jìn)型SSD算法在不同訓(xùn)練階段保存的網(wǎng)絡(luò)模型進(jìn)行測(cè)試,對(duì)這兩種算法測(cè)試結(jié)果的mAP值進(jìn)行統(tǒng)計(jì),結(jié)果如圖15所示,二者mAP值的變化趨勢(shì)與二者loss值的變化趨勢(shì)大致相反,在訓(xùn)練初期,原始SSD算法取得較高的mAP值,隨著訓(xùn)練時(shí)長(zhǎng)的增加,改進(jìn)型SSD算法由于模型有著更高的穩(wěn)定性和優(yōu)越性,其mAP值逐漸超越原始SSD算法的mAP值。
圖15 原始SSD算法與改進(jìn)型SSD算法mAP對(duì)比圖
對(duì)原始SSD算法、改進(jìn)型SSD算法和其他的一些基于SSD的算法模型進(jìn)行檢測(cè)實(shí)驗(yàn),實(shí)驗(yàn)得到每一類圖片的AP和總類別的mAP情況如表3所示,由對(duì)比結(jié)果可知,對(duì)每一類圖片來(lái)說(shuō),本文改進(jìn)的SSD算法的AP高于原始SSD、DSSD[16]、RFB-SSD[17]和FSSD[18]等算法,對(duì)總數(shù)據(jù)集來(lái)說(shuō),本文的改進(jìn)型SSD算法也取得較高的mAP值。用改進(jìn)型SSD算法進(jìn)行測(cè)試的部分檢測(cè)圖如圖16所示。
表3 各類別AP與總類別mAP統(tǒng)計(jì)表
(a) 厚壁細(xì)胞測(cè)試結(jié)果
(b) 花粉孢子測(cè)試結(jié)果
(c) 導(dǎo)管測(cè)試結(jié)果圖16 改進(jìn)型 SSD算法測(cè)試結(jié)果
對(duì)測(cè)試集圖片中斷裂破碎程度較大的58個(gè)目標(biāo)進(jìn)行測(cè)試對(duì)比,結(jié)果統(tǒng)計(jì)如表4所示。
表4 錯(cuò)檢漏檢測(cè)試結(jié)果統(tǒng)計(jì)表
由表4中的對(duì)比數(shù)據(jù)可知,相對(duì)于原始算法,改進(jìn)型SSD算法錯(cuò)檢和漏檢的數(shù)量更少,能夠?qū)?8個(gè)測(cè)試目標(biāo)全部檢測(cè)出來(lái)。
針對(duì)同一檢測(cè)目標(biāo),對(duì)比兩種算法所得的置信度,結(jié)果如表5所示,可以看出,改進(jìn)型SSD算法也表現(xiàn)出較好的有效性。
表5 目標(biāo)測(cè)試置信度結(jié)果統(tǒng)計(jì)表
從58個(gè)斷裂破碎程度較大的目標(biāo)中選取兩個(gè)目標(biāo)進(jìn)行詳細(xì)的分析說(shuō)明,結(jié)果如圖17所示,其中圖17(a)與圖17(b)分別是使用原始SSD算法與改進(jìn)型SSD算法對(duì)后壁細(xì)胞進(jìn)行測(cè)試的結(jié)果圖,通過(guò)對(duì)比發(fā)現(xiàn)圖17(a)出現(xiàn)了錯(cuò)檢的情況,正確檢出的目標(biāo)置信度為99.5%,而圖17(b)并沒(méi)有錯(cuò)檢問(wèn)題,正確檢出的目標(biāo)置信度高達(dá)99.9%。同理,圖17(c)與圖17(d)分別是使用原始SSD算法與改進(jìn)型SSD算法對(duì)導(dǎo)管進(jìn)行測(cè)試的結(jié)果圖,其中圖17(c)出現(xiàn)漏檢的情況,正確檢出的目標(biāo)置信度為96.9%,而圖17(d)檢出了圖17(c)漏掉的目標(biāo),并且對(duì)于正確檢出的目標(biāo),圖17(d)有著更高的置信度,高達(dá)99%。
(a) 原始SSD對(duì)后壁細(xì)胞測(cè)試 (b) 改進(jìn)型SSD對(duì)后壁細(xì)胞測(cè)試
(c) 原始SSD對(duì)導(dǎo)管測(cè)試 (d) 改進(jìn)型SSD對(duì)導(dǎo)管測(cè)試圖17 原始SSD算法與改進(jìn)型SSD算法測(cè)試圖
圖17的對(duì)比結(jié)果說(shuō)明相對(duì)于原始SSD算法,改進(jìn)型SSD算法對(duì)于不完整的斷裂殘缺的圖片具有更好的檢測(cè)效果,能更好地解決錯(cuò)檢、漏檢的問(wèn)題,并且對(duì)于檢測(cè)目標(biāo)能更精確地進(jìn)行位置預(yù)測(cè),從而對(duì)目標(biāo)的檢測(cè)結(jié)果具有更高的置信度,這也證明了改進(jìn)型SSD算法具有更好的有效性和魯棒性。
針對(duì)中藥材粉末顯微特征圖像存在的目標(biāo)斷裂殘缺的問(wèn)題,本文通過(guò)多種圖像預(yù)處理方法增加了圖像數(shù)據(jù)的多樣性,同時(shí)也為殘缺破碎的不完整目標(biāo)提供了大量的訓(xùn)練樣本。本文還提出了一種改進(jìn)型SSD檢測(cè)算法,在SSD網(wǎng)絡(luò)的每一個(gè)預(yù)測(cè)卷積特征圖之后添加了SE模塊,通過(guò)不斷迭代訓(xùn)練,網(wǎng)絡(luò)學(xué)習(xí)到各個(gè)預(yù)測(cè)卷積特征圖特征通道的重要程度,并且據(jù)此對(duì)特征圖的多個(gè)通道進(jìn)行權(quán)重的分配,從而使得網(wǎng)絡(luò)能對(duì)圖像的重要特征進(jìn)行更加充分的學(xué)習(xí),特別是對(duì)一些斷裂殘缺圖像保留的重要特征進(jìn)行充分學(xué)習(xí)從而對(duì)其做出正確的檢測(cè)判斷,提升了網(wǎng)絡(luò)對(duì)殘缺破碎目標(biāo)的檢測(cè)效果。如何找到SE模塊在SSD網(wǎng)絡(luò)中的最佳有效添加位置,用更小參數(shù)量的模型達(dá)到更好的檢測(cè)效果將是今后研究的重點(diǎn)工作。