梁培生++孫輝+++張國(guó)政++方璦++周二杰
doi:10.15889/j.issn.1002-1302.2016.10.124
摘要:為探究快速、無(wú)損進(jìn)行蠶蛹雌雄分類(lèi)的可行性,利用機(jī)器視覺(jué)技術(shù)對(duì)蠶蛹圖像進(jìn)行獲取,應(yīng)用主成分分析法結(jié)合BP人工神經(jīng)網(wǎng)絡(luò)方法進(jìn)行分析識(shí)別。首先,對(duì)所得圖像進(jìn)行灰度化、濾波去噪、二值化、特征提取等預(yù)處理,再應(yīng)用主成分分析法得到包含蠶蛹88.94%特征信息的4個(gè)主成分,將其作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量,對(duì)應(yīng)的蠶蛹性別作為輸出。建立1個(gè)BP神經(jīng)網(wǎng)絡(luò)的識(shí)別模型,該模型對(duì)于蠶蛹分類(lèi)的準(zhǔn)確率達(dá)到98%,符合我國(guó)農(nóng)業(yè)部桑蠶行業(yè)的標(biāo)準(zhǔn)。機(jī)器視覺(jué)結(jié)合主成分分析和BP神經(jīng)網(wǎng)絡(luò)的方法能夠準(zhǔn)確進(jìn)行蠶蛹分類(lèi),對(duì)實(shí)際生產(chǎn)具有積極的指導(dǎo)意義。
關(guān)鍵詞:機(jī)器視覺(jué);蠶蛹;主成分分析;BP神經(jīng)網(wǎng)絡(luò);分類(lèi)
中圖分類(lèi)號(hào): TP391.41;S126文獻(xiàn)標(biāo)志碼: A文章編號(hào):1002-1302(2016)10-0428-03
收稿日期:2015-09-06
基金項(xiàng)目:國(guó)家科技支撐計(jì)劃(編號(hào):2011BAD33B04)。
作者簡(jiǎn)介:梁培生(1964—),男,廣西蒼梧人,副研究員,主要從事蠶業(yè)機(jī)械與裝備研究。E-mail:305141797@qq.com。桑蠶養(yǎng)殖是我國(guó)的傳統(tǒng)行業(yè),也是中國(guó)重要的歷史文化產(chǎn)業(yè)。為了最大限度地提高桑蠶業(yè)的經(jīng)濟(jì)價(jià)值及產(chǎn)品附加值,在實(shí)際生產(chǎn)中通常要將雌雄蠶繭分類(lèi)使用。目前,蠶種場(chǎng)及相關(guān)生產(chǎn)企業(yè)往往在家蠶化蛹后的幾天內(nèi)手工進(jìn)行雌雄蠶蛹分類(lèi)鑒別工作,此方法不僅耗費(fèi)大量人工成本,且因工人主觀因素及技術(shù)程度的不同導(dǎo)致識(shí)別準(zhǔn)確率不高,實(shí)際過(guò)程中還可能對(duì)蠶蛹造成傷害。近年來(lái),關(guān)于蠶繭的無(wú)損檢測(cè)法主要有近紅外光譜技術(shù)、X射線成像技術(shù)等,但由于檢測(cè)設(shè)備價(jià)格昂貴、檢測(cè)精度及檢測(cè)環(huán)境要求等原因均未得到推廣。
不同性別的蠶蛹其身體形態(tài)、紋理特征有較大差異,人工識(shí)別是基于這些差異特性而進(jìn)行的,因此可運(yùn)用識(shí)別蠶蛹圖像的方式達(dá)到目的。通過(guò)試驗(yàn)設(shè)備獲得蠶蛹圖像,對(duì)蠶蛹的形態(tài)特征、紋理特征進(jìn)行提取并轉(zhuǎn)化為數(shù)據(jù)信息,利用主成分分析和神經(jīng)網(wǎng)絡(luò)的方式進(jìn)行識(shí)別。
1設(shè)備與材料
1.1試驗(yàn)設(shè)備
采用MER-125-30UM型工業(yè)攝像機(jī)(北京大恒圖像公司)進(jìn)行圖像采集。采用自行設(shè)計(jì)的采集試驗(yàn)平臺(tái),包括環(huán)形光源、透明的PVC材料輸送帶、簡(jiǎn)易暗箱等。采用DELL的I5計(jì)算機(jī)主機(jī),采用Matlab 12.0作為軟件支持設(shè)備進(jìn)行圖像預(yù)處理、分析、模型建立、識(shí)別等。以上設(shè)備經(jīng)過(guò)性能測(cè)試,均符合試驗(yàn)條件。
1.2樣品
供試的150粒蠶蛹樣品均由中國(guó)農(nóng)業(yè)科學(xué)院蠶業(yè)研究所提供,其中雌雄蠶蛹各75粒。蠶蛹為同一品種在飼養(yǎng)條件基本一致的情況下培育,蠶蛹所處時(shí)期為化蛾期的前3~4 d,此時(shí)蠶蛹的形態(tài)特征未發(fā)生改變,且蠶蛹的紋理特征最為明顯,利于對(duì)特征數(shù)據(jù)的準(zhǔn)確提取。
2原理與方法
對(duì)工業(yè)攝像機(jī)采集得到的圖像進(jìn)行圖像預(yù)處理和圖像形狀、紋理特征的提取,然后應(yīng)用主成分分析對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,得到低維的主成分變量,作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量。利用建立的BP神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)對(duì)數(shù)據(jù)的分析和識(shí)別。
2.1圖像預(yù)處理及特征提取
通過(guò)設(shè)計(jì)的試驗(yàn)平臺(tái)及試驗(yàn)設(shè)備采集蠶蛹圖像,由于采集過(guò)程中受到設(shè)備、光線等條件的干擾,會(huì)產(chǎn)生一定的噪聲,影響圖像質(zhì)量。通過(guò)對(duì)圖像的預(yù)處理可去除圖像的干擾及不必要的背景信息,獲取高質(zhì)量的目標(biāo)圖像。主要的預(yù)處理措施有圖像的灰度化、濾波去噪、直方圖均衡化、邊緣提取、圖像分割、二值化、形態(tài)學(xué)處理等(圖1)。
經(jīng)過(guò)預(yù)處理后,圖像的質(zhì)量得到提高,為圖像的特征提取做好準(zhǔn)備。試驗(yàn)共提取了150幅圖像的周長(zhǎng)、面積、偏心率、圓度、對(duì)比度、能量、逆差距、相關(guān)性、熵等9個(gè)信息量,為試驗(yàn)準(zhǔn)備了充足的數(shù)據(jù)。
2.2主成分分析法
主成分分析是一種常用且重要的多元統(tǒng)計(jì)分析方法,該方法通過(guò)對(duì)相關(guān)范圍內(nèi)的數(shù)據(jù)結(jié)構(gòu)內(nèi)在關(guān)系進(jìn)行分析研究,以方差最大化為原則,以多指標(biāo)數(shù)據(jù)轉(zhuǎn)化成較少數(shù)量的相互獨(dú)立且能表示原數(shù)據(jù)大部分信息的變量為目的,對(duì)原始蠶蛹圖像所包含的信息量進(jìn)行線性擬合,從而得到較低維數(shù)的變量,取代原始高維數(shù)據(jù)變量。在實(shí)際試驗(yàn)應(yīng)用中通常取前幾個(gè)主成分,不僅能達(dá)到數(shù)據(jù)降維的目的,同時(shí)也利于數(shù)據(jù)的觀察,一般推薦T值(各主成分的累積貢獻(xiàn)率)應(yīng)大于80%。該T值可用較少數(shù)量的不相關(guān)主成分表示原始數(shù)據(jù),減少了數(shù)據(jù)的交叉及信息冗余;同時(shí),通過(guò)對(duì)原始數(shù)據(jù)自身相關(guān)性進(jìn)行分析來(lái)確定各分量權(quán)重,基于數(shù)據(jù)的內(nèi)在結(jié)構(gòu)關(guān)系,不需要人為確定,使試驗(yàn)結(jié)果更加公正、合理化且具有說(shuō)服力。
2.3BP神經(jīng)網(wǎng)絡(luò)
誤差反向傳播網(wǎng)絡(luò)(back-propagation network,BP)是人工神經(jīng)網(wǎng)絡(luò)的一種,是一種按誤差逆?zhèn)鞑ニ惴ㄔ瓌t進(jìn)行訓(xùn)練的多層前饋網(wǎng)絡(luò),實(shí)現(xiàn)輸入、輸出變量之間的高度非線性映射關(guān)系。BP神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層、輸出層,同層之間相互獨(dú)立,數(shù)據(jù)信息前向傳播(圖2)。該網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則為最速下降法,然后通過(guò)數(shù)據(jù)的反向傳播來(lái)調(diào)整神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的各權(quán)重及偏置量,達(dá)到數(shù)據(jù)的誤差平方和最小的目的,使網(wǎng)絡(luò)的輸出值逼近期望值,誤差滿(mǎn)足學(xué)習(xí)要求才結(jié)束。近年來(lái),BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用在分類(lèi)、預(yù)測(cè)等方面表現(xiàn)出優(yōu)越性,本研究在蠶蛹分類(lèi)中進(jìn)行試驗(yàn)探討。
3結(jié)果與分析
3.1主成分提取
利用主成分分析方法對(duì)蠶蛹圖像提取出的數(shù)據(jù)進(jìn)行優(yōu)化,即輸入各蠶蛹圖像的特征數(shù)據(jù),計(jì)算出其數(shù)據(jù)的特征矩陣以及各主因子載荷矩陣,然后選取合適的主成分矩陣,將二者組合得到的新向量作為BP神經(jīng)網(wǎng)絡(luò)的輸入向量。主成分分析不僅能夠降低神經(jīng)網(wǎng)絡(luò)的復(fù)雜程度,對(duì)提高網(wǎng)絡(luò)模型的收斂速度和識(shí)別率也有較好作用。
蠶蛹圖像經(jīng)過(guò)預(yù)處理及特征提取后,將提取到的蠶蛹圖像周長(zhǎng)、面積、偏心率、圓度、對(duì)比度、能量、逆差距、相關(guān)性、熵等9個(gè)信息量作為原始數(shù)據(jù)。運(yùn)用主成分分析的方法進(jìn)行降維處理之后,在保證主成分的累積貢獻(xiàn)率不低于80%的情況下,提取前4個(gè)主成分作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量,由此得到圖像原始數(shù)據(jù)的特征值(表1)。
根據(jù)試驗(yàn)的精度及識(shí)別準(zhǔn)確率要求,本試驗(yàn)取前4個(gè)較大的特征值,分別為5.261 3、1.280 3、0.929 4、0.533 1,此時(shí)累積貢獻(xiàn)率達(dá)到88.935%。根據(jù)特征向量與原始數(shù)據(jù)組合形成的新向量,即分析后得到的主成分。每個(gè)圖像樣本的9
個(gè)信息量經(jīng)主成分分析后化簡(jiǎn)為4個(gè)輸入變量。
3.2BP神經(jīng)網(wǎng)絡(luò)
根據(jù)主成分分析結(jié)果(表1),選取前4個(gè)主成分即可表示蠶蛹圖像的主要信息,使圖像數(shù)據(jù)由原來(lái)的150×9減少至150×4,大幅降低了運(yùn)算量。建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型,進(jìn)行蠶蛹雌雄分類(lèi)的訓(xùn)練和預(yù)測(cè)。將數(shù)據(jù)樣本分為訓(xùn)練集和測(cè)試集,分別從雌雄蠶蛹中隨機(jī)選取各50個(gè)樣本用來(lái)建立模型,剩余的50粒蠶蛹用來(lái)預(yù)測(cè)結(jié)果。
利用Matlab 12.0軟件編寫(xiě)程序,對(duì)輸入變量進(jìn)行數(shù)據(jù)歸一化操作,并建立BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)。經(jīng)過(guò)多次試驗(yàn)對(duì)比分析,在輸入層為4層、輸出層為2層、系統(tǒng)允許誤差為0001、學(xué)習(xí)速率為0.05、慣性系數(shù)為0.8、最大迭代次數(shù)為 1 000 次時(shí),驗(yàn)證當(dāng)神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)目為8時(shí),該神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)較為簡(jiǎn)單,且收斂速度快、精度高。選取 4-8-2的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練和識(shí)別驗(yàn)證,其中隱含層傳輸函數(shù)為非線性的tansig型函數(shù),輸出層的隱含函數(shù)為純線性的purelin型函數(shù)。
3.3PCA-BP模型預(yù)測(cè)
將經(jīng)過(guò)降低維數(shù)處理的預(yù)測(cè)樣本主成分?jǐn)?shù)據(jù)在訓(xùn)練好的預(yù)測(cè)模型中進(jìn)行驗(yàn)證,并利用網(wǎng)絡(luò)的識(shí)別結(jié)果與蠶蛹的真實(shí)性別進(jìn)行對(duì)比。由模型生成的神經(jīng)網(wǎng)絡(luò)回歸圖(圖3)可知,模型的歸一化系數(shù)均大于99.5%,即驗(yàn)證網(wǎng)絡(luò)預(yù)測(cè)識(shí)別建立的模型對(duì)蠶蛹性別的識(shí)別較為成功。
一般來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)的性能優(yōu)劣主要由其泛化能力來(lái)評(píng)價(jià)。對(duì)測(cè)試樣本的驗(yàn)證分析表明,該網(wǎng)絡(luò)模型具有很強(qiáng)的泛化能力,能夠較為真實(shí)地反映輸入與輸出之間的關(guān)系。由圖4可知,神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練收斂曲線在迭代次數(shù)為112時(shí)達(dá)到要求。檢測(cè)結(jié)果(表2)顯示,50粒蠶蛹的識(shí)別準(zhǔn)確率達(dá)到98%。結(jié)果表明,本方法所建立的PCA-BP神經(jīng)網(wǎng)絡(luò)模型能夠較為準(zhǔn)確地對(duì)蠶蛹性別進(jìn)行分類(lèi)識(shí)別。
4結(jié)論
利用機(jī)器視覺(jué)技術(shù)獲取蠶蛹圖像,經(jīng)圖像處理得到了蠶蛹的形態(tài)及紋理特征,結(jié)合主成分分析法和BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立了蠶蛹的雌雄識(shí)別模型,對(duì)蠶蛹進(jìn)行分類(lèi)識(shí)別研究。由對(duì)測(cè)試集的驗(yàn)證結(jié)果可知,蠶蛹的識(shí)別準(zhǔn)確率達(dá)到了98%,但仍存在一定的誤判率。BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練及網(wǎng)絡(luò)記憶仍存在不穩(wěn)定性,有待進(jìn)一步研究。
機(jī)器視覺(jué)結(jié)合主成分分析和BP神經(jīng)網(wǎng)絡(luò)的方法,對(duì)蠶蛹的識(shí)別分類(lèi)具有很好的作用,為蠶蛹雌雄識(shí)別分類(lèi)提供了一種新途徑,對(duì)桑蠶業(yè)具有重要的經(jīng)濟(jì)和實(shí)用價(jià)值。
參考文獻(xiàn):
[1]劉敬全,于振誠(chéng),崔玉梅,等. 家蠶熒光繭色判性蠶品種熒光、春玉的育成及其一代雜交種的選配[J]. 蠶業(yè)科學(xué),1996,22(3):155-159.
[2]王茜蒨,黃志文,劉凱,等. 基于主成分分析和人工神經(jīng)網(wǎng)絡(luò)的激光誘導(dǎo)擊穿光譜塑料分類(lèi)識(shí)別方法研究[J]. 光譜學(xué)與光譜分析,2012,32(12):3179-3182.
[3]Jin T M,Wu X Q,Pan S Y,et al. Distinguishing sex of silkworm chrysalis in cocoon by NIR with fiber optics[J]. Acta Agriculturae Boreali-Sinica,1994,9:35-37.
[4]吳江,黃富榮,黃才歡,等. 近紅外光譜結(jié)合主成分分析和BP神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)基因大豆無(wú)損鑒別研究[J]. 光譜學(xué)與光譜分析,2013,33(6):1537-1541.
[5]李玉品,陳斌,顏輝,等. 近紅外光譜分析法在蠶繭性別鑒定上的應(yīng)用[J]. 江蘇農(nóng)業(yè)科學(xué),2009(1):237-239.
[6]Chen Q S,Zhao J W,F(xiàn)ang C H,et al. Feasibility study on identification of green,black and Oolong teas using near-infrared reflectance spectroscopy based on support vector machine(SVM)[J]. Spectrochimica Acta,Part a,2007,66(3):568-574.
[7]蔡健榮,劉兵,李永平,等. X射線成像技術(shù)判別蠶繭性別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(8):275-279.
[8]楊丹,趙海濱,龍哲,等. MATLAB圖像處理[M]. 北京:清華大學(xué)出版社,2013.
[9]MATLAB中文論壇. MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M]. 北京:北京航空航天大學(xué)出版社,2010.
[10]馬嘯,袁洪福,宋春風(fēng),等. 衰減全反射紅外光譜法快速分類(lèi)和識(shí)別多種食用油的方法[J]. 光譜學(xué)與光譜分析,2015,35(7):1879-1884.
[11]岳田利,彭幫柱,袁亞宏,等. 基于主成分分析法的蘋(píng)果酒香氣質(zhì)量評(píng)價(jià)模型的構(gòu)建[J]. 農(nóng)業(yè)工程學(xué)報(bào),2007,23(6):223-227.
[12]Zhang J H,Qi L J,Ji R H,et al. Cotton diseases identification based on rough sets and BP neural network[J]. Transactions of the Chinese Society of Agricultural Engineering,2012,28(7):161-167.