摘 要:為了準(zhǔn)確鑒別葡萄干等級(jí),提出一種基于人工神經(jīng)網(wǎng)絡(luò)和VPMCD的葡萄干等級(jí)檢測(cè)新方法。以新疆綠無(wú)核三個(gè)等級(jí)的葡萄干作為研究對(duì)象,提取顏色、形狀的特征參數(shù)。采用BP神經(jīng)網(wǎng)絡(luò)算法,對(duì)比各特征組合對(duì)識(shí)別率的影響,確定了識(shí)別率較高的4個(gè)特征參數(shù)組合。最后應(yīng)用VPMCD方法進(jìn)行樣本訓(xùn)練并進(jìn)行葡萄干等級(jí)檢測(cè)。將提出的方法與SVM、BP神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果進(jìn)行對(duì)比分析,結(jié)果表明,VPMCD算法識(shí)別率達(dá)到100%,分級(jí)效果明顯,運(yùn)算時(shí)間少,識(shí)別精度高,為農(nóng)產(chǎn)品等級(jí)檢測(cè)提供了一個(gè)新途徑。
關(guān)鍵詞: 葡萄干; 等級(jí)檢測(cè); BP神經(jīng)網(wǎng)絡(luò); VPMCD
中圖分類號(hào): TN926?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)12?0018?04
Abstract: To precisely identify the raisin grades, a new raisin grade detection method based on artificial neural network and VPMCD is proposed. The Xinjiang Green seedless raisins of three grades are taken as the research object to extract the characteristic parameters of color and size. The BP neural network algorithm is used to compare the influence of each feature combination on identification rate. The four characteristic parameter combinations with high identification rate were determined. The VPMCD method is adopted to train the sample and detect the raisin grade. The identification result of the proposed method was compared with those of SVM method and BP neural network method. The comparison results show that the identification rate of VPMCD algorithm can reach up to 100%, and has superior classification effect, less operation time and high identification precision. It provides a new approach for grade detection of agricultural products.
Keywords: raisin; grade detection; BP neural network; VPMCD
0 引 言
葡萄干營(yíng)養(yǎng)價(jià)值豐富,美味可口,受到全國(guó)人民青睞。目前,葡萄干的品質(zhì)檢測(cè)主要分為外部和內(nèi)部檢測(cè)兩類,內(nèi)部檢測(cè)主要是對(duì)其味道、糖分、水分的檢測(cè),檢測(cè)技術(shù)已經(jīng)比較成熟;外部檢測(cè)方法主要是對(duì)顏色、形狀、大小及表面缺陷的檢測(cè),檢測(cè)技術(shù)不夠成熟,仍需進(jìn)一步研究,如何對(duì)大批量葡萄干進(jìn)行實(shí)時(shí)檢測(cè),成為研究的關(guān)鍵,迅速有效的檢測(cè)方法對(duì)我國(guó)的葡萄干進(jìn)出口貿(mào)易有促進(jìn)作用。目前農(nóng)產(chǎn)品識(shí)別、分級(jí)檢測(cè)技術(shù)日趨成熟,檢測(cè)方法多種多樣,其中神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用較為廣泛[1?3],數(shù)據(jù)挖掘算法[4]、基于稀疏表示的分類算法[5]也在各類識(shí)別中應(yīng)用,識(shí)別精度成為比較各種算法優(yōu)劣的關(guān)鍵。
VPMCD方法是一種基于變量預(yù)測(cè)模型的模式識(shí)別方法,它認(rèn)為不同類別的系統(tǒng)中,全部或者部分特征之間存在一定的內(nèi)在關(guān)系,根據(jù)這種關(guān)系建立數(shù)學(xué)模型,采集研究對(duì)象的數(shù)據(jù),對(duì)模型參數(shù)進(jìn)行訓(xùn)練可以得到預(yù)測(cè)模型,利用預(yù)測(cè)模型可以對(duì)各類對(duì)象進(jìn)行預(yù)測(cè)分類[6]。目前,這種方法在滾動(dòng)軸承故障診斷、機(jī)械故障診斷、齒輪故障診斷及其他的一些故障診斷中應(yīng)用較為廣泛[7?10],在農(nóng)產(chǎn)品等級(jí)檢測(cè)中尚未應(yīng)用。試驗(yàn)中嘗試采用VPMCD方法對(duì)葡萄干進(jìn)行等級(jí)檢測(cè)。
1 研究對(duì)象與方法
1.1 研究對(duì)象
以新疆綠無(wú)核葡萄干作為研究對(duì)象,分別選取三個(gè)等級(jí)(一級(jí)、二級(jí)、三級(jí))的葡萄干各100粒,其中,每個(gè)等級(jí)各40粒作為訓(xùn)練樣本,剩余60粒作為測(cè)試樣本。
1.2 研究方法
設(shè)計(jì)適宜的照明裝置,選擇合適的照明條件,采集三個(gè)等級(jí)葡萄干圖像后進(jìn)行圖像預(yù)處理,提取出單個(gè)葡萄干圖像,圖1為采集的原始一級(jí)葡萄干圖像,進(jìn)行圖像去噪、背景分割、輪廓跟蹤后,提取出單個(gè)葡萄干圖像。對(duì)所有樣本的單個(gè)葡萄干圖像,
提取顏色及形狀特征,編寫人工神經(jīng)網(wǎng)絡(luò)算法進(jìn)行試驗(yàn),選擇識(shí)別率較高的特征組合作為識(shí)別參數(shù),利用VPMCD方法進(jìn)行等級(jí)測(cè)試。研究流程如圖2所示。
2 葡萄干特征提取
2.1 顏色特征
顏色是葡萄干等級(jí)識(shí)別的最主要特征,一級(jí)葡萄干顏色碧綠且著色均勻,試驗(yàn)前需要選擇合適的顏色模型,提取葡萄干的顏色特征。HSI顏色模型以人眼的視覺(jué)特征為基礎(chǔ),使用色調(diào)(H)、飽和度(S)、亮度(I)來(lái)表示顏色,與人觀察顏色的感覺(jué)最相似,因此,在獲取了葡萄干的24位的真彩色圖像后,利用轉(zhuǎn)換公式,需將RGB模型轉(zhuǎn)換為HSI顏色模型,提取H,S,I三個(gè)顏色特征。
2.2 形狀特征
形狀特征能夠反映出葡萄干的大小、外形特征,一級(jí)葡萄干往往粒大且飽滿,提取合適的形狀特征也是分級(jí)的關(guān)鍵。試驗(yàn)中,提取了單個(gè)葡萄干圖像的周長(zhǎng)(P)、面積(A)、長(zhǎng)軸(L)、短軸(M)、長(zhǎng)寬比(W)、圓形度(C)六個(gè)基本形狀特征。
提取了葡萄干樣本的特征數(shù)據(jù)后,應(yīng)初步篩選識(shí)別特征,由表1中三個(gè)等級(jí)各40粒葡萄干樣本的特征均值可以看出,在長(zhǎng)寬比、圓形度特征上,三個(gè)等級(jí)數(shù)據(jù)差別甚微,原因在于同品種的葡萄晾制的葡萄干外形較為相似,因此,這兩個(gè)特征不能作為識(shí)別的有效特征,初步選定色調(diào)(H)、飽和度(S)、亮度(I)、周長(zhǎng)(P)、面積(A)、長(zhǎng)度(L)、寬度(M)七個(gè)特征參數(shù)參與人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練識(shí)別。
表1 各級(jí)葡萄干特征均值
葡萄干樣本的各個(gè)特征物理意義和取值范圍不同,需進(jìn)行數(shù)值歸一化處理,使其處于同一量綱之中,試驗(yàn)中采用極值歸一化方法處理。設(shè)采集樣本中有N個(gè)葡萄干圖像,特征向量的維數(shù)為I,第n個(gè)圖像的第i個(gè)特征值為ln,i,將向量li中每個(gè)元素的數(shù)值歸一化到[0,1]范圍。極值歸一化公式為:[ ln,i=ln,i-minlimaxli-minli, n=0,1,2,…,N-1, i=0,1,2,…,I-1] (1)
式中: min(li)為采集樣本中圖像的第i個(gè)特征向量li的最小值;max(li)為采集樣本中圖像的第i個(gè)特征向量li的最大值。
3 采用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行特征優(yōu)選
人工神經(jīng)網(wǎng)絡(luò)是模擬生物神經(jīng)網(wǎng)絡(luò)進(jìn)行信息處理的一種數(shù)學(xué)模型。試驗(yàn)中,采用BP神經(jīng)網(wǎng)絡(luò)模型,利用Matlab編寫程序,構(gòu)建了具有一個(gè)隱含層的三層網(wǎng)絡(luò)模型,輸入層節(jié)點(diǎn)數(shù)采用特征參數(shù)個(gè)數(shù),初步選定為7個(gè),輸出節(jié)點(diǎn)為3個(gè),對(duì)應(yīng)3個(gè)等級(jí)的葡萄干,初始學(xué)習(xí)速率為0.01,目標(biāo)誤差采用0.001。采用雙曲正切函數(shù)tansig作為隱含層激活函數(shù)、對(duì)數(shù)S型激活函數(shù)logsig作為輸出層激活函數(shù),網(wǎng)絡(luò)輸出值在0和1之間。
(1) 確定識(shí)別率較高的網(wǎng)絡(luò)結(jié)構(gòu)。根據(jù)對(duì)測(cè)試樣本的識(shí)別準(zhǔn)確率,選取識(shí)別率較高的網(wǎng)絡(luò)結(jié)構(gòu),如表2所示為各種網(wǎng)絡(luò)結(jié)構(gòu)下樣本的識(shí)別率。由表2可以看出,輸入層為7、隱含層為17、輸出層為3時(shí)識(shí)別率較高,且訓(xùn)練速度也相對(duì)較快。
表2 不同網(wǎng)絡(luò)結(jié)構(gòu)下的識(shí)別率比較
(2) 選取最優(yōu)特征組合。各個(gè)特征在識(shí)別中所起作用不同,特征少、識(shí)別效率高是算法追求的目標(biāo)。試驗(yàn)中,在確定了網(wǎng)絡(luò)結(jié)構(gòu)后,通過(guò)對(duì)不同特征參數(shù)組合下識(shí)別率的比較,選取最佳特征組合。不同參數(shù)組合識(shí)別率的比較如表3所示??梢钥闯?,使用色度(H)、面積(A)、長(zhǎng)度(L)、寬度(M)4個(gè)特征組合識(shí)別率最高,訓(xùn)練速度快,因此選擇這4個(gè)特征作為最終識(shí)別特征。
4 基于VPMCD的等級(jí)檢測(cè)算法
在農(nóng)產(chǎn)品的等級(jí)檢測(cè)中,神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)等檢測(cè)識(shí)別方法沒(méi)有考慮到對(duì)象特征間的相互內(nèi)在關(guān)系。VPMCD方法根據(jù)這種關(guān)系,對(duì)不同類別對(duì)象建立不同的數(shù)學(xué)模型,利用這些數(shù)學(xué)模型對(duì)測(cè)試樣本特征值進(jìn)行預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果對(duì)農(nóng)產(chǎn)品進(jìn)行分級(jí)。因此,在處理非線性分類問(wèn)題時(shí),VPMCD方法避免了神經(jīng)網(wǎng)絡(luò)的迭代過(guò)程,大大減少了計(jì)算量和訓(xùn)練時(shí)間。
試驗(yàn)中,對(duì)每個(gè)訓(xùn)練樣本提取色度、面積、長(zhǎng)度、寬度4個(gè)特征值,根據(jù)特征值之間的非線性特性,選用二次交互模型QI[11],建立預(yù)測(cè)模型;提取每個(gè)測(cè)試樣本特征向量作為測(cè)試數(shù)據(jù)。利用VPMCD方法進(jìn)行等級(jí)檢測(cè)分為模型訓(xùn)練和模型分級(jí)兩個(gè)過(guò)程,具體如下:
(1) 模型訓(xùn)練過(guò)程:
① 在三個(gè)等級(jí)的葡萄干中,共收集n個(gè)訓(xùn)練樣本(n=120),每一等級(jí)分別有nk(k=1,2,3)個(gè)樣本。
② 提取訓(xùn)練樣本4個(gè)特征向量X=[X1,X2,X3,X4]。
③ 對(duì)任意被預(yù)測(cè)變量Xi(i=1,2,…,4),選擇二次交互模型(QI)。
④ 令k=1,對(duì)于k等級(jí)的nk個(gè)訓(xùn)練樣本中的任意一個(gè),對(duì)其每個(gè)特征值Xi建立數(shù)學(xué)模型,得到nk個(gè)方程,用最小二乘法對(duì)這nk個(gè)方程的模型參數(shù)進(jìn)行估計(jì),得到各特征值Xi的預(yù)測(cè)模型VPMik。
⑤ 令k=k+1,循環(huán)步驟④,直至k=3結(jié)束。此時(shí)對(duì)各等級(jí)葡萄干的所有特征值都分別建立了預(yù)測(cè)模型VPMik,模型訓(xùn)練過(guò)程結(jié)束。
(2) 模型分級(jí)過(guò)程:
① 提取測(cè)試樣本葡萄干特征值X=[X1,X2,…,X4];
② 對(duì)于測(cè)試樣本所有特征值Xi(i=1,2,…,4),分別采用VPMik(k=1,2,3)進(jìn)行預(yù)測(cè),得到測(cè)試值ik;
③ 在同一等級(jí)下,計(jì)算所有特征值的預(yù)測(cè)誤差平方和值δk(k=1,2,3),分級(jí)時(shí),當(dāng)預(yù)測(cè)樣本中所有δk第k個(gè)最小時(shí),將測(cè)試樣本識(shí)別為第k等級(jí)。
[δk=i=14Xi-ik2] (2)
5 試驗(yàn)及分析
利用Matlab編程實(shí)現(xiàn)了BP神經(jīng)網(wǎng)絡(luò)方法、支持向量機(jī)(SVM)和VPMCD識(shí)別算法。對(duì)40個(gè)訓(xùn)練樣本進(jìn)行訓(xùn)練,并對(duì)60個(gè)測(cè)試樣本進(jìn)行了識(shí)別。識(shí)別精度與SVM,BP神經(jīng)網(wǎng)絡(luò)識(shí)別比較如表4所示,在一級(jí)葡萄干識(shí)別中,識(shí)別精度及識(shí)別時(shí)間如表5所示。
試驗(yàn)中,BP神經(jīng)網(wǎng)絡(luò)與SVM 中的多個(gè)參數(shù)需要經(jīng)過(guò)若干次優(yōu)化確定,而在VPMCD方法中,訓(xùn)練樣本的特征值預(yù)測(cè)誤差平方和最小即為最佳預(yù)測(cè)模型,分級(jí)時(shí)就以測(cè)試樣本預(yù)測(cè)誤差平方和最小來(lái)判定屬于哪個(gè)等級(jí)。結(jié)果表明,該方法不但識(shí)別精度高于其他兩種方法,且由于避免了神經(jīng)網(wǎng)絡(luò)中結(jié)構(gòu)和類型的選擇、迭代學(xué)習(xí)的過(guò)程,SVM中參數(shù)尋優(yōu)過(guò)程,運(yùn)算時(shí)間也大大減小,因此,VPMCD方法在葡萄干的等級(jí)檢測(cè)中是一種可行且有效的模式識(shí)別方法。
表5 BP神經(jīng)網(wǎng)絡(luò),SVM,VPMCD識(shí)別一級(jí)葡萄干結(jié)果
6 結(jié) 論
采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行特征優(yōu)選,對(duì)葡萄干提取的9個(gè)特征參數(shù)進(jìn)行訓(xùn)練,通過(guò)對(duì)比識(shí)別精度,確定了最佳網(wǎng)絡(luò)結(jié)構(gòu)及最佳特征組合,選用色度、面積、長(zhǎng)度、寬度作為最終識(shí)別特征。該文提出一種基于VPMCD對(duì)葡萄干進(jìn)行等級(jí)檢測(cè)的新方法,試驗(yàn)結(jié)果顯示,提出方法識(shí)別率達(dá)到100%,將識(shí)別結(jié)果與使用BP神經(jīng)網(wǎng)絡(luò)和SVM識(shí)別做了比較,結(jié)果表明,VPMCD方法不論在識(shí)別率還是訓(xùn)練時(shí)間上,均優(yōu)于其他兩種方法。試驗(yàn)證明,VPMCD方法運(yùn)算時(shí)間少、識(shí)別精度高,在農(nóng)產(chǎn)品等級(jí)檢測(cè)中可行且有效,為等級(jí)檢測(cè)提供了一個(gè)新途徑。
參考文獻(xiàn)
[1] 詹映,羅華平,彭云發(fā),等.BP人工神經(jīng)網(wǎng)絡(luò)南疆紅棗顏色分級(jí)方法的研究[J].食品工業(yè),2015,36(1):165?167.
[2] 李國(guó)進(jìn),董第永,陳雙.基于計(jì)算機(jī)視覺(jué)的芒果檢測(cè)與分級(jí)研究[J].農(nóng)機(jī)化研究,2015(10):13?18.
[3] 楊眉,魏鴻磊,華順剛.一種基于神經(jīng)網(wǎng)絡(luò)的扇貝圖像識(shí)別方法[J].大連海洋大學(xué)學(xué)報(bào),2014,29(1):70?74.
[4] 張昭,羅文亮,喬永亮,等.基于數(shù)據(jù)挖掘算法的竹塊顏色分級(jí)研究[J].中國(guó)農(nóng)機(jī)化學(xué)報(bào),2013,34(2):217?220.
[5] 向金海,楊申,樊恒,等.基于稀疏表示的烤煙煙葉品質(zhì)分級(jí)研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2013,44(11):287?292.
[6] 楊宇,王歡歡,曾鳴,等.基于變量預(yù)測(cè)模型的模式識(shí)別方法在滾動(dòng)軸承故障診斷中的應(yīng)用[J].湖南大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,40(3):36?40.
[7] 程軍圣,馬興偉,楊宇.基于ICA相關(guān)系數(shù)和VPMCD的滾動(dòng)軸承故障診斷[J].振動(dòng)、測(cè)試與診斷,2015,35(4):645?648.
[8] 賈民平,韓冰.改進(jìn)VPMCD法及其在機(jī)械故障診斷中的應(yīng)用[J].中國(guó)機(jī)械工程,2015,26(14):1861?1865.
[9] 許有才,萬(wàn)舟.基于條件局部均值分解與變量預(yù)測(cè)模型的軸承故障診斷方法[J].計(jì)算機(jī)應(yīng)用,2015,35(9):2606?2610.
[10] 李葵,范玉剛,吳建德.基于 MRSVD 和 VPMCD 的軸承故障智能診斷方法研究[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(8):153?157.
[11] YANG Yu, WANG Huanhuan, CHENG Junsheng, et a1. A fault diagnosis approach for roller bearing based on VPMCD under variable speed condition [J]. Measurement, 2013, 46(8): 2306?2312.