張涵鈺 趙 平
(天津農(nóng)學(xué)院 計(jì)算機(jī)與信息工程學(xué)院,天津 300384)
在國(guó)內(nèi)這幾年,中國(guó)農(nóng)業(yè)大學(xué)于新文教授對(duì)圖像的研究取得了較為明顯的進(jìn)步,于新文教授主要采用相似距離分類法、二差分類法以及判別模型分類法三種方法對(duì)相關(guān)數(shù)字圖像的識(shí)別進(jìn)行鉆研,在待識(shí)別目標(biāo)圖像極其規(guī)范的情況下有著極高的識(shí)別精準(zhǔn)度。
在國(guó)外,美國(guó)新墨西哥州立大學(xué)哈比卜·加蘇米和納迪普拉薩德教授等人利用人工神經(jīng)網(wǎng)絡(luò)對(duì)棉花生態(tài)系統(tǒng)中的昆蟲(chóng)進(jìn)行分類識(shí)別。他們根據(jù)數(shù)學(xué)形態(tài)學(xué)中的基本理論對(duì)圖像進(jìn)行膨脹與腐蝕操作,以達(dá)到對(duì)圖像進(jìn)行分割的目的,最終成功實(shí)現(xiàn)了對(duì)生態(tài)系統(tǒng)中的植物進(jìn)行識(shí)別[1]。
雖然現(xiàn)如今的圖像識(shí)別技術(shù)已經(jīng)有了顯著的發(fā)展,但是還沒(méi)有一個(gè)專門(mén)用于菌類識(shí)別的應(yīng)用技術(shù)去幫助人們了解想要了解的菌類的對(duì)應(yīng)情況,來(lái)區(qū)分哪些菌類可食用,而那些菌類不可食用。
通過(guò)運(yùn)用現(xiàn)如今的已經(jīng)趨近成熟的圖像處理技術(shù),舉一反三實(shí)現(xiàn)菌類識(shí)別,其中具體方法如圖1 所示。
圖1 圖像識(shí)別技術(shù)流程示意圖
通過(guò)對(duì)圖像識(shí)別技術(shù)的研究,使機(jī)器具有視覺(jué)能力,然后直接對(duì)接收到的視覺(jué)信息進(jìn)行處理,并行反饋處理。圖像識(shí)別過(guò)程首先需要從外界獲取目標(biāo)圖像。 這一過(guò)程通常稱為圖像采集,它可以通過(guò)使用攝像機(jī)、攝像機(jī)等圖像采集設(shè)備實(shí)現(xiàn),然后根據(jù)圖像識(shí)別模式對(duì)采集到的圖像進(jìn)行處理,在圖像識(shí)別過(guò)程中稱為圖像預(yù)處理,預(yù)處理后的圖像去除源圖像中的冗余信息,保存圖像的主要特征,最后選擇圖像的主要特征形成相應(yīng)的信息映射和信息存儲(chǔ)在信息庫(kù)中進(jìn)行比較,最終實(shí)現(xiàn)圖像識(shí)別[1]。
在中國(guó),大約有180 種毒蕈,其中至少有30 種可以導(dǎo)致死亡。一般來(lái)說(shuō),有毒菌的顏色比較鮮艷,菌帽上可能會(huì)有突起,紅點(diǎn),溝渠和裂縫,有的菌子上有菌托、菌環(huán),因此此次項(xiàng)目可以利用這些真菌的特征信息來(lái)識(shí)別真菌,而圖像特征識(shí)別的步驟包括圖像預(yù)處理、圖像特征提取、圖像識(shí)別分類三個(gè)步驟。
2.2.1 圖像預(yù)處理
預(yù)處理是真菌鑒定過(guò)程中的重要環(huán)節(jié)。 由于圖像采集環(huán)境的不同,如光照程度和設(shè)備性能等因素,輸入圖像往往存在噪聲和對(duì)比度低等缺點(diǎn)。
因此菌類識(shí)別的預(yù)處理如下:a. 一幅圖像在實(shí)際應(yīng)用過(guò)程中可能存在各種各樣的噪聲,這些噪聲可能是在傳輸或量化過(guò)程中產(chǎn)生的。菌類圖像也是一樣,在采集過(guò)程中會(huì)產(chǎn)生各種噪聲,所以必須進(jìn)行去噪處理。b.去除背景,即將真菌從背景中分離出來(lái),形成二值圖像進(jìn)行邊緣檢測(cè)和形狀特征參數(shù)計(jì)算。c.真菌圖像經(jīng)過(guò)去噪和背景去除后,可能仍會(huì)存在一些孤立的噪聲點(diǎn),或者由于所選取的菌類本身受到過(guò)害蟲(chóng)侵蝕而導(dǎo)致在其內(nèi)部有一些孔洞,這些都會(huì)影響菌類特征參數(shù)的準(zhǔn)確計(jì)算。因此有必要對(duì)去除背景后的圖像進(jìn)行膨脹運(yùn)算,然后進(jìn)行腐蝕運(yùn)算,經(jīng)過(guò)多次處理,從而消除孤立的噪聲點(diǎn)和內(nèi)部孔洞,得到完整、準(zhǔn)確的真菌二值圖像。
2.2.2 圖像特征提取
由于自然界中的菌類具有不同的形狀與顏色,因此這些特征都可以作為菌類分類的依據(jù)。
顏色是菌類的一個(gè)重要性狀特征,因?yàn)镠SI 顏色模型更符合人類的顏色視知覺(jué),因此我們使用HSI 顏色模型的色度(Hue)表示菌類的顏色特征不同的形狀特征為菌類識(shí)別提供分了分類依據(jù)。考慮到一些菌類菌帽呈扇形、一些菌帽形雨傘形等特征情況,我們選用致密度和三個(gè)不變矩等特征建模菌類的形狀特征,其計(jì)算方式如下[3]:
2.2.3 基于SVM的圖像識(shí)別分類
SVM 是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的可訓(xùn)練的通用機(jī)器學(xué)習(xí)方法,簡(jiǎn)單概括來(lái)說(shuō)的話,它只是一個(gè)分類器。支持向量機(jī)方法的原理即簡(jiǎn)單的線性化和增維過(guò)程。在線性可分離情形下,從最優(yōu)分類超平面發(fā)展出支持向量機(jī)。如圖2 所示,空心點(diǎn)和實(shí)心點(diǎn)表示兩種類型的樣本,H 是H 維分類超平面,H1 和H2 分別為過(guò)各類點(diǎn)且離分類超平面舉例最近且平行于H 的超平面。最優(yōu)分類超平面理論要求分類超平面在正確分開(kāi)兩類的基礎(chǔ)上最大化分類區(qū)間。
圖2 SVM 解釋圖
在得到含有真菌顏色和形狀特征的五維向量后,將這些特征作為真菌分類方法的輸入向量進(jìn)行真菌鑒定。由于支持向量機(jī)(SVM)分類法具有非線性分類及良好的泛化性能,在模式識(shí)別領(lǐng)域是最具影響力的方法,所以此次項(xiàng)目選用SVM作為菌類的分類方法,在核函數(shù)上選擇徑向基核,因?yàn)樗哂蟹蔷€性分類性能和魯棒的性能。
2.2.4 研究效果
選擇5 種不同的真菌,每種真菌隨機(jī)選取30 個(gè)特征值作為訓(xùn)練數(shù)據(jù),其余的20 個(gè)特征值作為測(cè)試數(shù)據(jù)。在訓(xùn)練模型中,利用五折交叉驗(yàn)證對(duì)訓(xùn)練模型進(jìn)行優(yōu)化(訓(xùn)練樣本分為5 組,隨機(jī)選擇4 組進(jìn)行訓(xùn)練,1 組進(jìn)行模型性能測(cè)試),選擇最優(yōu)SVM懲罰參數(shù)c 和徑向基中的g[3]。
表1 基于徑向基SVM 的菌類分類性能
效果測(cè)試顯示此次項(xiàng)目所研究的菌類識(shí)別技術(shù)對(duì)于不同菌類的識(shí)別準(zhǔn)確率較高,此方法具有一定科學(xué)效應(yīng)。
在此僅將菌類識(shí)別技術(shù)與人臉識(shí)別技術(shù)與指紋識(shí)別技術(shù)進(jìn)行對(duì)比,對(duì)比情況具體如下:
菌類識(shí)別技術(shù)沒(méi)有人臉識(shí)別的技術(shù)復(fù)雜,由于人臉的差異性不大,甚至有雙胞胎相貌相同等情況,所以人臉識(shí)別的預(yù)處理和特征提取的算法要比菌類識(shí)別的算法更加復(fù)雜,而菌類識(shí)別技術(shù)則是僅僅對(duì)真菌的形狀與顏色作為特征提取。
其實(shí)菌類識(shí)別技術(shù)與指紋識(shí)別技術(shù)根據(jù)有相似性,都是通過(guò)把一個(gè)現(xiàn)場(chǎng)采集到的圖像與一個(gè)已經(jīng)登記錄入系統(tǒng)的圖像進(jìn)行一對(duì)一的比對(duì)來(lái)確定身份的過(guò)程,但是,兩者的區(qū)別是指紋識(shí)別使用不同的數(shù)字化算法在指紋圖像上找到并比對(duì)指紋的特征,人們的十個(gè)手指產(chǎn)生最少4900 個(gè)獨(dú)立可測(cè)量的特征,指紋識(shí)別所提取的特征點(diǎn)更多也因此更加準(zhǔn)確。
對(duì)比來(lái)看,如今項(xiàng)目所研究的菌類識(shí)別技術(shù)還處于初步階段,與現(xiàn)已成熟的熱門(mén)識(shí)別技術(shù)相比,菌類識(shí)別技術(shù)還太簡(jiǎn)單,在后續(xù)的工作中需要對(duì)菌類識(shí)別技術(shù)進(jìn)行不斷地更新完善。
菌類識(shí)別APP 的開(kāi)發(fā)使得人們的生活更加快捷方便,其中主要特點(diǎn)列舉如下:
4.1.1 讓人們可以以快捷的方式學(xué)習(xí)相關(guān)的菌類知識(shí)
4.1.2 減少了人們誤食毒蘑菇的風(fēng)險(xiǎn)
4.1.3 擺脫了過(guò)往只能輸入名稱查百度詞條的方法
所有的科技發(fā)展都是為了使人們的生活更加方便快捷,我們此次對(duì)于菌類識(shí)別APP 的開(kāi)發(fā)也是以此目的出發(fā),幫助人們擺脫菌類盲區(qū)。
2017 年的一篇報(bào)道顯示:“目前有一款號(hào)稱使用‘革命性的AI’來(lái)識(shí)別蘑菇的APP,微生物學(xué)博士c(Colin Davidson)解釋說(shuō),用戶不能通過(guò)外觀識(shí)別APP來(lái)識(shí)別蘑菇,比如可致病的亮黃蘑菇在外觀上和可食用的馬菇外觀非常類似,用戶把它拿起來(lái)觸摸外觀或者聞它們的味道,需要從多角度觀察和判斷才行”。
這是此次項(xiàng)目開(kāi)發(fā)菌類識(shí)別APP的一個(gè)顯著問(wèn)題,畢竟識(shí)別菌類不是簡(jiǎn)單地通過(guò)圖像識(shí)別就能識(shí)別出所有的菌類,有些菌類可能還需要通過(guò)其生長(zhǎng)環(huán)境和氣味等等各種情況來(lái)辨別,而現(xiàn)在所研究的菌類識(shí)別卻只是將形狀與顏色作為識(shí)別特征,很多菌類仍無(wú)法識(shí)別,只能將現(xiàn)時(shí)期的菌類識(shí)別APP當(dāng)作一個(gè)“識(shí)別蘑菇的粗略指南”。
在后續(xù)的菌類識(shí)別開(kāi)發(fā)中可以將菌類的生長(zhǎng)環(huán)境也納入特征識(shí)別當(dāng)中,使得菌類識(shí)別的技術(shù)更加完善,成為一個(gè)真正能識(shí)別所有菌類的APP。