楊 森, 張新奡, 邢 鍵, 戴景民
1. 東北林業(yè)大學(xué)計(jì)算機(jī)與控制工程學(xué)院, 黑龍江 哈爾濱 150040
2. 哈爾濱工業(yè)大學(xué)儀器科學(xué)與工程學(xué)院, 黑龍江 哈爾濱 150001
大米是我國最重要的谷類作物, 其品質(zhì)會隨著土壤、 環(huán)境和水質(zhì)等地域因素產(chǎn)生差異性。 例如五常大米和響水大米, 其獨(dú)特的地理環(huán)境形成特有的口感和營養(yǎng)價(jià)值, 使其成為具有鮮明地理標(biāo)識的大米產(chǎn)品。 消費(fèi)者愿意為優(yōu)質(zhì)產(chǎn)品支付額外價(jià)錢, 導(dǎo)致詐騙者經(jīng)常通過虛假的產(chǎn)地標(biāo)簽或摻假獲取不公平的經(jīng)濟(jì)利益, 損壞了消費(fèi)者、 零售商和生產(chǎn)商的利益[1]。 此外, 大米的白堊米率、 碎米率、 黃粒米率、 裂紋米率等外觀品質(zhì)參數(shù)也是人們普遍關(guān)心的問題, 因?yàn)槠渲苯雨P(guān)系口感和定價(jià)[2]。 因此, 對于消費(fèi)者、 零售商和生產(chǎn)商來說, 如何準(zhǔn)確的實(shí)現(xiàn)精米品種鑒別和外觀品質(zhì)評價(jià)是一項(xiàng)亟待解決的重要工作。
圖像法是精米外觀品質(zhì)檢測的常用方法, 具有快速和無損檢測的優(yōu)勢。 陳昊然提出了一種基于圖像顯著性區(qū)域提取的堊白區(qū)域提取算法[3]。 張玲設(shè)計(jì)了一種圖像處理系統(tǒng)進(jìn)行碎米識別[4]。 Chen開發(fā)了一種機(jī)器視覺系統(tǒng)來檢查缺陷米粒[5]。 Singh結(jié)合圖像處理和機(jī)器學(xué)習(xí)測量米粒大小和質(zhì)量[6]。 Zareiforoush利用圖像處理對碾米的碾磨度和破碎率進(jìn)行了定性分級[7]。 然而, 現(xiàn)有基于圖像法的精米外觀品質(zhì)檢測主要針對單參數(shù)或相類似參數(shù)檢測進(jìn)行研究, 缺少一種集成一體化應(yīng)用方案可以實(shí)現(xiàn)外觀品質(zhì)的多參數(shù)檢測。
近紅外光譜法是精米品種分類的常用方法, 且被證實(shí)基于4 300~7 800 cm-1波段光譜數(shù)據(jù)可以獲取較高的精米品種分類精度。 宋雪健研究了基于近紅外光譜法的五常和查哈陽大米產(chǎn)地溯源[8]。 錢麗麗基于近紅外光譜法, 分別研究了五常和建三江大米[9]、 查哈陽和非查哈陽大米[10]、 五常和建三江大米[11]的鑒別方法。 劉亞超研究了近紅外二維相關(guān)光譜進(jìn)行摻和五常大米判別的可行性[12]。 然而, 現(xiàn)有基于近紅外光譜法的精米品種分類, 主要集中于如何完善方法以及其在不同精米品種分類上的應(yīng)用, 缺少從4 300~7 800 cm-1波段光譜數(shù)據(jù)和包括紋理、 顏色、 形態(tài)的多圖像參數(shù)進(jìn)行多特征融合建模的角度研究如何提高精米品種分類精度。
針對上述問題, 建立了基于傅里葉近紅外光譜儀和CMOS顯微相機(jī)的精米品種分類與外觀品質(zhì)檢測系統(tǒng), 通過CMOS顯微相機(jī)配合機(jī)電一體化控制系統(tǒng)實(shí)現(xiàn)批量化的裂紋米、 碎米、 堊白米、 黃粒米和粒型的外觀品質(zhì)多參數(shù)檢測應(yīng)用。 以此檢測系統(tǒng)為基礎(chǔ), 通過不同融合方案對比, 建立基于光譜-圖像特征模型融合的最優(yōu)精米品種分類模型, 并與傳統(tǒng)方法作實(shí)驗(yàn)對比以驗(yàn)證其優(yōu)越性。
建立的精米品種分類與外觀品質(zhì)檢測系統(tǒng)如圖1所示, 主要分為光譜采集和圖像采集兩部分。 系統(tǒng)控制由LabVIEW程序完成, 數(shù)據(jù)處理由內(nèi)嵌入LabVIEW的Matlab算法實(shí)現(xiàn)。
圖1 精米品種和外觀品質(zhì)檢測系統(tǒng)
系統(tǒng)內(nèi)部光譜采集設(shè)備為iCAN-9近紅外光譜儀(天津能譜), 掃描波長為350~7 800 cm-1。 漫反射配件型號為PN044-60XX(美國PIKE)。 每個(gè)樣品的光譜數(shù)據(jù)由三次加載求平均所得, 每次加載包括32次掃描。
系統(tǒng)內(nèi)部圖像采集設(shè)備為帶有變焦鏡頭的USB-500顯微相機(jī)(拓日偉業(yè)科技)。 被測米粒放置于盛樣板上, 每個(gè)盛樣板包括10個(gè)橢圓形孔。 旋轉(zhuǎn)盤上可放置4個(gè)盛樣板, 由配有電機(jī)驅(qū)動(dòng)器和運(yùn)動(dòng)控制器的步進(jìn)電機(jī)控制依次進(jìn)行圖像采集。 被測樣本采用LED環(huán)形燈進(jìn)行照明。
精米外觀品質(zhì)參數(shù)包括粒型、 堊白、 碎米、 黃粒米和裂紋。 設(shè)計(jì)的精米外觀多品質(zhì)參數(shù)檢測示意圖如圖2所示。 其中, 圖像預(yù)處理算法包括灰度化處理、 均值濾波、 閾值分割、 開運(yùn)算和圖像融合。
圖2 精米外觀多品質(zhì)參數(shù)檢測示意圖
為避免盛樣板中米粒未放滿對檢測準(zhǔn)確性的不利影響, 對每個(gè)盛樣板進(jìn)行基于區(qū)域標(biāo)記法的米粒數(shù)量檢測。 為降低碎米對米型檢測的影響, 在米型檢測時(shí)自動(dòng)排除已識別出的碎米。 為降低堊白對黃粒米檢測的影響, 在黃粒米檢測時(shí)排除堊白米。
對不同外觀品質(zhì)參數(shù)的檢測, 碎米檢測采用標(biāo)準(zhǔn)值對比法, 粒型檢測采用橢圓匹配測量法, 裂紋米檢測基于圖像行灰度平均值波谷特性實(shí)現(xiàn), 堊白米檢測采用最大熵多閾值分割算法, 黃粒米檢測基于R-B特征值偏差實(shí)現(xiàn)。
將不同品種大米混合, 形成共167×10=1 670個(gè)米粒樣本開展外觀品質(zhì)檢測實(shí)驗(yàn)。 不同參數(shù)的標(biāo)準(zhǔn)值參考中國食品總局的官方檢驗(yàn)標(biāo)準(zhǔn)通過人工視覺檢驗(yàn)獲取。 精米原始圖像和預(yù)處理后的圖像如圖3所示。 外觀品質(zhì)多參數(shù)檢測準(zhǔn)確率如表1所示。
表1 外觀品質(zhì)多參數(shù)檢測準(zhǔn)確率
圖3 精米原始圖像和預(yù)處理后的圖像
通過機(jī)器視覺檢測結(jié)果和標(biāo)準(zhǔn)值的對比, 分析表1中測量誤差的產(chǎn)生原因包括: (1) 米粒破碎程度不同, 某些碎米較長, 此問題不僅影響碎米率檢測, 也會影響長寬比檢測(長寬比檢測中不考慮已檢測出的碎米); (2) 人工測量與橢圓匹配算法獲取的長寬比存在偏差; (3) 米粒裂紋形式和程度的差異性較大; (4) 米粒堊白程度不同, 某些米粒的堊白面積較小。 (5) 反光現(xiàn)象和加工精度的差異性影響。
1.3.1 圖像特征參數(shù)提取
共提取了35個(gè)圖像特征參數(shù)供后續(xù)使用, 可分為形態(tài)、 紋理和顏色三個(gè)大類。 其中, 形態(tài)參數(shù)包括米粒的面積S1、 周長C1、 長度L1和寬度D1, 米粒的長寬比K、 圓度R和緊致度CO, 米粒的長軸長度L、 短軸長度D和凸面面積TA, 以及根據(jù)長度、 寬度和面積三個(gè)參數(shù)計(jì)算所得特征參數(shù)SF1、 SF2和SF3。 紋理參數(shù)包括對比度CS、 同質(zhì)性HT、 相關(guān)CL和能量EG。 顏色參數(shù)包括RGB、 HSV和YCbCr每個(gè)顏色空間中三個(gè)顏色分量的均值mean和二階矩std。 預(yù)處理后的米粒圖像進(jìn)行圖像特征參數(shù)提取的示意圖如圖4所示。
圖4 圖像特征參數(shù)提取示意圖
1.3.2 光譜數(shù)據(jù)采集
對五常、 響水、 銀水和越光大米進(jìn)行光譜采集。 共320組光譜數(shù)據(jù), 每種大米80組數(shù)據(jù), 隨機(jī)分為40組建模數(shù)據(jù)和40組驗(yàn)證數(shù)據(jù), 每組數(shù)據(jù)包括1972個(gè)光譜點(diǎn)。 獲取的原始光譜數(shù)據(jù)如圖5所示, 其中WC、 XS、 YS和YG分別代表五常、 響水、 銀水和越光四種大米。
圖5 原始光譜數(shù)據(jù)
1.3.3 基于光譜-圖像特征融合的品種分類模型建立
本節(jié)研究光譜特征與圖像特征融合建模提高精米品種分類精度的有效性。 基于PLS算法建立融合分類模型, 模型輸入?yún)?shù)包括經(jīng)SNV處理的4 331~5 102 cm-1波段的光譜數(shù)據(jù)和35個(gè)圖像參數(shù), 模型輸出參數(shù)為不同產(chǎn)地大米的賦值編號。 為了優(yōu)化分類模型, 采用變量重要性分析方法(VIP)進(jìn)行輸入?yún)?shù)的最優(yōu)篩選。 不同融合方案的實(shí)驗(yàn)結(jié)果如下:
(1) 融合方案1: 采用全部圖像特征和不同VIP閾值篩選光譜特征進(jìn)行融合建模, 選取不同VIP閾值時(shí)獲取的分類精度如表2所示。 從表2可以看出, 僅針對光譜特征進(jìn)行最優(yōu)篩選時(shí), 選取VIP值大于0.65的光譜特征與全圖像特征進(jìn)行融合建模時(shí)分類結(jié)果最佳, 四種大米的分類精度為87.5%~90%。
表2 基于全圖像特征和VIP篩選光譜特征的分類精度(%)
(2) 融合方案2: 采用全光譜特征和不同VIP閾值篩選圖像特征進(jìn)行融合建模, 選取不同VIP閾值時(shí)獲取的分類精度如表3所示。 從表3可以看出, 僅針對圖像特征進(jìn)行最優(yōu)篩選時(shí), 選取VIP值大于0.8或0.86的圖像特征與全光譜特征進(jìn)行融合建模時(shí)分類結(jié)果最佳, 四種大米的分類精度為87.5%~95%。 此時(shí), 從模型精簡的角度分析, 應(yīng)選取VIP值大于0.86的圖像特征與全光譜特征進(jìn)行融合建模, 此時(shí)不僅分類結(jié)果最佳且模型最簡。
表3 基于全光譜特征和VIP篩選圖像特征的分類精度(%)
(3) 融合方案3: 采用篩選后的圖像特征與篩選后的光譜特征進(jìn)行融合建模, 獲取的分類精度如表4所示。 將表4與表2和表3進(jìn)行對比可知, 兩種類型數(shù)據(jù)都進(jìn)行篩選然后進(jìn)行融合建??梢蕴岣呔灼贩N分類精度。
表4 基于篩選后圖像特征和篩選后光譜特征的分類精度
(4) 融合方案4: 采用全部圖像特征和全部光譜特征進(jìn)行融合建模, 選取不同VIP閾值時(shí)獲取的分類精度如表5所示。 由表5可知, 針對全部特征數(shù)據(jù)進(jìn)行最優(yōu)篩選時(shí), 選取VIP值大于0.5的圖像特征和光譜特征進(jìn)行融合建模時(shí)獲取的分類結(jié)果最佳, 四種大米的分類精度為95%~97.5%。
表5 選取不同VIP閾值時(shí)基于全圖像特征和全光譜特征的分類精度(%)
綜合表2—表5中不同條件下獲取的分類精度可知, 將全部特征數(shù)據(jù)作為建模輸入?yún)?shù), 然后進(jìn)行最優(yōu)參數(shù)篩選, 選取VIP值大于0.5的圖像特征和光譜特征進(jìn)行融合建模時(shí)獲取的分類結(jié)果最佳。 因此, 基于融合方案4建立基于光譜-圖像特征融合的精米品種分類模型, 五常、 響水、 銀水和越光四種大米的分類精度分別為95%、 95%、 95%和97.5%。
為驗(yàn)證本文提出的精米多特征融合品種分類方法的性能, 開展不同精米品種分類方法性能對比。 對比方法包括光譜法、 圖像法和光譜-圖像特征模型融合法。
采用光譜法進(jìn)行精米品種分類建模時(shí), 選取不同VIP閾值時(shí)獲取的分類精度如表6所示。 由表6可知, 選取VIP值大于0.7的光譜特征進(jìn)行建模時(shí)獲取的分類結(jié)果最佳, 即采用光譜法時(shí), 五常、 響水、 銀水和越光四種大米的分類精度分別為92.5%、 92.5%、 90%和92.5%。
表6 選取不同VIP閾值時(shí)基于光譜法的分類精度(%)
采用圖像法進(jìn)行精米品種分類建模時(shí), 實(shí)驗(yàn)方案設(shè)置為三個(gè)品種分類試驗(yàn)和四個(gè)品種分類試驗(yàn), 選取不同VIP閾值時(shí)獲取的分類精度如表7所示。 由表7可知, 針對五常、 響水和越光三種大米, 選取VIP值大于0.86的圖像特征進(jìn)行建模獲取的分類結(jié)果最佳, 此時(shí)三種大米的分類精度分別為95%、 92.5%和95%。 然而, 當(dāng)加入與五常和響水大米產(chǎn)地相近的銀水大米后, 由于三者之間的外觀相類似, 導(dǎo)致五常和響水大米的分類精度下降, 而越光大米則因其外觀與其他三者有較大差異, 能夠保持較好的分類精度。 基于上述實(shí)驗(yàn)結(jié)果推斷, 圖像法在面向產(chǎn)地或外觀差異性較大的精米品種分類時(shí)效果較好, 但在面向產(chǎn)地或外觀相近的精米品種分類時(shí)效果較差。 針對五常、 響水、 銀水和越光四種大米, 采用圖像法進(jìn)行品種分類時(shí)可獲取的分類精度分別為62.5%、 47.5%、 47.5%和92.5%。
表7 選取不同VIP閾值時(shí)基于圖像特征的分類精度(%)
綜上所述, 光譜法、 圖像法和光譜-圖像特征模型融合法的性能對比如圖6所示。
圖6 不同精米品種分類方法性能對比
由圖6可知, 與圖像法和光譜法對比, 光譜-圖像模型融合法可以獲取最高的精米分類精度, 四種大米的分類精度可以達(dá)到95%~97.5%。 光譜法作為精米品種分類的傳統(tǒng)且常用方法, 可以保證較好的分類精度, 四種大米的分類精度可以達(dá)到90%~92.5%。 而圖像法相對來說分類性能不足, 但是其在融合法中的有效應(yīng)用可以證明該方法是一種提高精米品種分類精度的有效輔助方法。 上述實(shí)驗(yàn)結(jié)果驗(yàn)證了本文提出的光譜-圖像特征模型融合方法在傳統(tǒng)方法基礎(chǔ)上提高精米品種分類精度的有效性, 為實(shí)現(xiàn)準(zhǔn)確的地理標(biāo)志性大米品種鑒別提供了方法支撐。
建立了一種精米品種分類與外觀品質(zhì)多參數(shù)檢測系統(tǒng), 通過集成一體化應(yīng)用方案實(shí)現(xiàn)了裂紋、 粒型、 堊白、 碎米和黃粒米的多參數(shù)外觀品質(zhì)檢測。 實(shí)驗(yàn)結(jié)果表明, 裂紋米率、 長寬比、 堊白米率、 碎米率、 黃粒米率的檢測精度分別為97.0%、 97.6%、 89.2%、 95.2%和95.5%。 以此系統(tǒng)為基礎(chǔ), 挖掘以光譜法為基礎(chǔ)融合圖像法提高精米品種分類精度的可行性, 提出了一種基于光譜-圖像特征模型融合的精米品種分類方法。 實(shí)驗(yàn)結(jié)果表明, 基于新方法獲取的五常、 響水、 銀水和越光四種大米的分類精度分別為95%、 95%、 95%和97.5%, 相比于傳統(tǒng)方法中效果較好的近紅外光譜法分類精度可提高2.5%~7.5%。 本研究為精米外觀品質(zhì)檢測技術(shù)的發(fā)展提供了應(yīng)用方案支撐, 為精米品種分類技術(shù)的發(fā)展提供了方法支撐。