張孝紅,蔣雪松*,沈 飛,姜洪喆,周宏平,何學(xué)明,江殿程,張 祎
1. 南京林業(yè)大學(xué)機械電子工程學(xué)院,江蘇 南京 210037 2. 南京財經(jīng)大學(xué)食品科學(xué)與工程學(xué)院,江蘇 南京 210023 3. 江蘇省糧油質(zhì)量監(jiān)測中心,江蘇 南京 210031
我國是世界上小麥生產(chǎn)量最大的國家,小麥作為我國三大谷物之一,2020年國家統(tǒng)計局統(tǒng)計我國播種面積達23 380千公頃,約占全國全年糧食播種面積的20%,總產(chǎn)量達13 425萬噸,約占全國全年糧食總產(chǎn)量的20%。
長江中下游的小麥,由于溫暖潮濕的氣候環(huán)境,極易感染赤霉病,小麥中水分的含量是引發(fā)赤霉病感染的重要因素。 被赤霉病感染的小麥會產(chǎn)生一種嘔吐毒素,其學(xué)名為脫氧雪腐鐮刀菌烯醇(Deoxynivalenol,DON)。 研究表明,DON不僅會侵染破壞小麥的細胞組織,降低小麥的出粉率從而影響小麥的產(chǎn)量,而且還會引發(fā)人體中毒,具有致癌、致畸等潛在健康風(fēng)險[1]。 Javier Enrione等[2]通過測量藜麥面粉的五種不同相對濕度下的重量數(shù)據(jù)和傅里葉變換紅外光譜面積之間的相關(guān)性來建立預(yù)測方程,實現(xiàn)藜麥面粉中水分含量的預(yù)測,其R2能達到0.872 9,表明該模型具有預(yù)測功能。 蔣雪松等[3]對感染不同程度赤霉病的小麥樣品的光譜信息和傳統(tǒng)方法(UPLC-MS/MS)測得的DON含量建立PLSR定量分析模型和LDA、PLS-DA定性分析模型,根據(jù)全光譜以及特征光譜所構(gòu)建的定性分析模型的識別率高達87.69%,但定量分析模型效果不太理想。 劉亞超等[4]設(shè)計了大米多品質(zhì)參數(shù)檢測儀,通過試驗驗證大米含水率、直鏈淀粉質(zhì)量分數(shù)和蛋白質(zhì)質(zhì)量分數(shù)的相關(guān)系數(shù)為0.972 7,0.949和0.901 5,預(yù)測均方根誤差為0.363 2%,1.318 1%和0.243 0%。
相關(guān)研究發(fā)現(xiàn)[5-7],不少開發(fā)的有關(guān)農(nóng)產(chǎn)品品質(zhì)的檢測儀器,多采用漫反射檢測方式,儀器尺寸小,適合形狀大小質(zhì)地相同的檢測對象,不適用于粉末狀面粉。 由于面粉受潮極易感染赤霉病,因此檢測面粉中水分的含量以及DON超標與否對面粉制食品安全行業(yè)具有重要的指導(dǎo)意義[8-10]。
DON由于具有穩(wěn)定的化學(xué)結(jié)構(gòu),一般的方法無法破壞其結(jié)構(gòu),去除麩皮能夠有效的降低面粉中DON的含量。 本文以去除麩皮后的小麥磨成的面粉為研究對象,基于漫透射近紅外光譜分析技術(shù), 設(shè)計了便攜式面粉品質(zhì)安全檢測儀,編寫了實時檢測軟件,分別建立了面粉濕度的最優(yōu)PLS回歸預(yù)測模型和DON超標與否的PCA-邏輯回歸分類模型,并將模型導(dǎo)入便攜式檢測儀中,通過試驗驗證儀器的穩(wěn)定性和精確性,以實現(xiàn)面粉品質(zhì)的檢測目的。
以面粉為研究對象,運用漫透射近紅外光譜檢測技術(shù),是因為漫透射檢測方式可以透過樣品使攜帶有大量樣品內(nèi)部的光譜信息被捕捉接收,且加裝反射罩不僅可以使得未被光譜儀采集到的信息通過樣品表面的反射再次被光譜儀所接收,還可以防止外界雜散光的干擾,使得光譜更能如實的反應(yīng)樣品內(nèi)部信息[11-12]。 近紅外是基于可見光和中紅外之間的電磁波,當近紅外照射到物體上時,特定頻率的光與被照物體的某個含氫基團的振動頻率一樣,那么該特定頻率的光會被吸收,經(jīng)過該物體透射后的近紅外光便可反映其內(nèi)部結(jié)構(gòu)信息[13]。 該面粉多品質(zhì)檢測儀包括光譜采集模塊、光源控制模塊、處理與顯示模塊和電源模塊構(gòu)成, 通過實時檢測軟件來控制光源的開關(guān), 利用USB數(shù)據(jù)線實現(xiàn)光譜儀與樹莓派之間的通信。 利用移植好的預(yù)測模型進行面粉的濕度和DON的預(yù)測,其工作原理圖如圖1所示。
圖1 檢測儀工作原理圖Fig.1 Working principle of detection system
為了縮小儀器尺寸,使儀器更具便攜性,將鋰電池放入自行設(shè)計的檢測附件下面,儀器外殼背面留有鋰電池充電口,儀器內(nèi)壁分別安裝光譜儀、樹莓派4B和光源控制板,通過擋板的上下移動帶動附件中反射罩的上下移動,實現(xiàn)樣品的放置與取出。 自行設(shè)計的檢測附件不僅可以通過反射罩實現(xiàn)光譜補償功能還可以避免外界光的干擾。 通過移動燕尾導(dǎo)軌滑塊帶動反射罩上下移動,實現(xiàn)與外界光的隔絕,保證光譜采集時免受外界雜散光的干擾,提高光譜的信噪比。 整個儀器的結(jié)構(gòu)示意圖如圖2所示,結(jié)構(gòu)緊湊,空間布置合理。 儀器尺寸大小為250 mm×170 mm×300 mm。
圖2 檢測儀器硬件示意圖(a): 儀器結(jié)構(gòu)圖;(b): 儀器實物圖1: 殼體;2: 通風(fēng)孔;3: 微型光譜儀;4: 把手;5: 上蓋及觸摸屏; 6: 樹莓派4B;7: 凸臺;8: 光源控制電路板; 9: 卡槽;10: 檢測附件;11: 電源Fig.2 Schematic diagram of device hardware(a): Instrument strumcture diagram; (b): Physical drawing of instrument
1.2.1 光譜采集模塊
光譜采集模塊由光譜儀和檢測附件組成,光譜儀選購了德國INSION公司的NIR 1.7/S 微型近紅外光譜儀,有效波段為: 910~1 900 nm,分辨率為16 nm,波長重復(fù)性為 0.1 nm,信噪比為5 000∶1,自帶散熱風(fēng)扇。 該光譜儀把所有的光學(xué)元器件集成在一塊基底材料上,具有良好的抗震性。 由自行設(shè)計的檢測附件不僅具有光補償?shù)墓δ芷渖舷乱苿拥膶?dǎo)軌滑塊帶動調(diào)節(jié)桿再帶動反射罩還可以防止外界雜散光的干擾,有效降低光譜采集時的噪聲。 該檢測附件如圖3所示。
光譜儀通過自身攜帶的光纖與檢測附件通過光纖準直鏡7連接,實現(xiàn)樣品光譜信息的采集。 參考盒中分別放入1,1.5,2,2.5,3和3.5 g面粉樣品,表面等重壓平,在外界光源環(huán)境相同的情況下,利用自己編寫的檢測軟件設(shè)置積分時間為50 ms,平均掃描次數(shù)為2,采集全波段吸光度,如圖4所示。 從圖中可以看出,不同樣品量的光譜曲線大致相同,由于長波近紅外穿透力較弱,隨著樣品量的增加,不僅長波區(qū)域采集到的噪音會增加,而且相應(yīng)樣品的吸光度也會增加。 1 200 nm波長點附近具有明顯的吸收峰,表明隨著樣品量的增加水分的倍頻信息也會相應(yīng)增加。 故選擇樣品量為2 g,光譜噪音較少,利于后續(xù)建模。
1.2.2 光源控制模塊
光源控制模塊由鹵素燈珠、光源座、電路板、1 kΩ上拉電阻和TIP120達林頓晶體管。 通過達林頓晶體管來控制12 V的大功率光源,使用1 kΩ的上拉電阻是為了防止由晶體管的開關(guān)切換引起的電流峰值導(dǎo)致GPIO引腳過載。 光源選用六個飛利浦鹵素燈珠(10 W 12 V),五個排成環(huán)形,還有一個位于環(huán)形中間,其有效波長可達900~1 900 nm。 光源控制模塊的電路板接線圖如圖5所示。
圖3 檢測附件
圖4 不同樣品量的光譜曲線Fig.4 Spectra of flour samples with different quantities
1.2.3 處理與顯示模塊
作為便攜式面粉多品質(zhì)檢測儀的核心部件,其不僅要與光譜儀進行通信,實現(xiàn)數(shù)據(jù)傳輸,還要對采集到的光譜信息進行數(shù)據(jù)處理,控制光源的開和關(guān)以及顯示信息。 選擇樹莓派4B作為整個核心處理器,是因為其集成度高,便于開發(fā)軟件。 樹莓派4B是基于ARM(CortexA-72)的微型計算機主板,采用BroadcomBCM2711BO(1.5 GHz主頻,4核,4 G內(nèi)存)處理器,擁有2個USB3.0和2個USB2.0,還有1個以太網(wǎng)接口,40針引腳,1個HDMI接口,1個TYPE-C充電接口,非常適合用于便攜式設(shè)備的開發(fā)。 其尺寸大小為88 mm×58 mm×19.5 mm,為防止程序加載時間過長,芯片過熱,樹莓派4B還需安裝風(fēng)扇以及在芯片上安裝散熱片。 另外選擇7寸液晶觸摸屏實現(xiàn)終端顯示功能,其屏幕分辨率為800×480像素,觸摸屏通過樹莓派4B的HDMI接口實現(xiàn)連接。 光譜儀通過USB數(shù)據(jù)線實現(xiàn)與樹莓派4B的通信。
圖5 光源控制模塊1: 電路板;2: 樹莓派4B;3: 鋰電池;4: 1 kΩ上拉電阻; 5: 鹵素燈珠;6: TIP120達林頓晶體管Fig.5 Light source control module 1: Circuit board; 2: Raspberry Pi 4B; 3: Lithium battery; 4: 1 kΩ pull-up resistor; 5: Halogen lamp bead; 6: TIP120 Darlington transistor
1.2.4 電源模塊
電源模塊選擇可充電鋰電池,該電池擁有1 1800 mA·h的容量,可持續(xù)供電2 h。 輸入12 V,輸出為5,9和12 V,分別給樹莓派、光譜儀和鹵素燈供電。
面粉樣品來自江蘇三零面粉海安有限公司,共采購200份樣品。 將采購后的200份樣品標記并封于塑料袋中,其中取180份樣品用于建模集和預(yù)測集,20份樣品用于外部驗證集,將180份樣品中的每份樣品再分三份,每份取100 g,分別用紅黃藍三種顏色標記每種樣品中分成的三份。 紅色用于采集光譜信息,黃色用于理化試驗以便獲取濕度值,藍色樣品用于理化試驗以便獲取DON的含量。 所有樣品使其受一定程度的赤霉病感染,放置于常溫中保存。
取所有黃色樣品用于面粉濕度值的測定,根據(jù)《GB/T 5009.3—2016》使用直接干燥法測得,每份樣品測二次,取平均值。 根據(jù)《SN/T3137—2012出口食品中脫氧雪腐鐮刀菌烯醇、3-乙酰脫氧雪腐鐮刀菌烯醇、15-乙酰脫氧雪腐鐮刀菌烯醇及其代謝物的測定液相色譜-質(zhì)譜/質(zhì)譜法》測得所有藍色樣品的DON含量。 為保證面粉的濕度與DON不會隨著同一種樣品之間因為測量時間間隔過長而導(dǎo)致的誤差,需要同時進行所有紅色樣品的光譜信息采集,所有黃色樣品的濕度值測量以及所有藍色樣品的DON含量測量[14]。
面粉濕度和DON含量的統(tǒng)計結(jié)果如表1、表2所示。 建模集和預(yù)測集的標準偏差相差不大表明兩類樣本之間的差距很小。 DON測量結(jié)果中發(fā)現(xiàn)偏高的標準偏差反映了各個樣品之間DON含量相差較大,表明樣品受到了不同程度的赤霉病的感染。
表1 面粉濕度測量結(jié)果Table 1 Moisture measurement results of flour
表2 面粉DON含量測量結(jié)果Table 2 Measurement results of DON content in flour
將所有紅色樣品的70%和30%分別設(shè)置成建模集和預(yù)測集,然后從每個待測樣品中分別依次取2 g平鋪于樣品池中并使用自行設(shè)計的檢測儀采集光譜。 采集波段為900~1 870 nm,原始光譜如圖6所示。
圖6 面粉原始光譜圖Fig.6 Original spectra of flour
原始圖譜中1 195和1 470 nm波長點處存在水分的倍頻吸收峰,表明面粉的水分對近紅外光譜的影響。 由于赤霉病在感染小麥時,會使得面粉中蛋白質(zhì)、淀粉等成分減少,受感染的越嚴重,反映在1 140,1 420和1 582 nm波長處的吸光度會呈現(xiàn)下降趨勢[15]。
利用箱線圖可以進行異常值的檢測,圖7為原始樣品前20個光譜波段的箱線圖,發(fā)現(xiàn)在900~1 048和1 788~1 870 nm之間存在異常值,即存在有吸光度值大于上四分位數(shù)加上1.5倍四分位間距的樣本,原因是光譜首尾端存在相當大的噪聲,導(dǎo)致出現(xiàn)異常吸光度值。 在1 327~1 351 nm波段也出現(xiàn)異常吸光度值,是因為存在一個異常樣本。 圖8為剔除異常值后前20個光譜波段的箱線圖,最終截取1 048~1 747 nm波段的光譜數(shù)據(jù)進行后續(xù)處理。
圖7 原始光譜箱線圖Fig.7 Box plot graphics depicting the outliers in original spectra
圖8 剔除異常值后的箱線圖Fig.8 Box plot graphics depicting the outliers removed
由于附件的制造精度誤差以及光譜采集時不可避免的系統(tǒng)誤差等原因,存在基線漂移和光散射等現(xiàn)象,會影響模型的精度。 因此選擇多元散射校正(MSC)、S-G卷積平滑和標準正態(tài)變換(SNV)對原始光譜數(shù)據(jù)進行預(yù)處理。 其中S-G平滑法的預(yù)處理效果如圖9所示。
通過The Unscrambler X 10.4光譜分析軟件將未經(jīng)過預(yù)處理和經(jīng)過預(yù)處理的數(shù)據(jù)通過偏最小二乘回歸法(PLS)建立定量模型。 根據(jù)表格3所示,不采用任何預(yù)處理的建模效果要優(yōu)于經(jīng)過預(yù)處理的建模效果,其建模集和預(yù)測集相關(guān)系數(shù)分別為0.883和0.853,均方根誤差分別為0.145%和0.286%,殘差預(yù)測偏差RPD為2.5。
圖9 S-G卷積平滑F(xiàn)ig.9 Savitzky-Golay smoothing
表3 不同預(yù)處理后的PLSR預(yù)測模型Table 3 PLSR prediction models after different pretreatment
根據(jù)我國GB 2715—2005《糧食衛(wèi)生標準》對于小麥中嘔吐毒素含量的限量標準規(guī)定,把含量超過1 000 μg·kg-1的樣品歸為超標樣品,不超過1 000 μg·kg-1的樣品歸為未超標樣品,將未超標樣本標記為0類標簽,超標樣本標記為1類標簽。
3.4.1 主成分分析
對126份建模集的面粉樣品進行主成分分析,如圖10所示,第一主成分和第二主成分的累積貢獻率已經(jīng)超過了99.6%,故運用前兩個主成分就能基本表示原先86個波段下的特征信息。 利用第一第二主成分畫出圖11,發(fā)現(xiàn)樣品明顯的分類趨勢,因此接下來使用邏輯回歸對樣品進行分類并評估模型。
圖10 主成分得分圖Fig.10 Score plot of PCA
圖11 建模集樣本的主成分分析Fig.11 PCA of modeling set samples
3.4.2 邏輯回歸
邏輯回歸是一個經(jīng)典的二分類模型,基于上述PCA的分析,使用邏輯回歸對預(yù)測集進行分類。 決策邊界如圖12所示,預(yù)測結(jié)果的混淆矩陣如圖13所示,對未超標樣本的預(yù)測準確率高達96%,對超標樣本的預(yù)測準確率高達89%。
圖12 決策邊界Fig.12 Decision boundary
圖13 邏輯回歸預(yù)測結(jié)果混淆矩陣Fig.13 Confusion matrix of LR prediction result
為進一步驗證模型的分類性能,做出了邏輯回歸分類模型的受試者工作特征曲線(ROC),如圖14所示,代表模型性能指標的AUC值達到了0.927。 表明PCA-邏輯回歸模型對面粉中DON超標與否的判別有較高的準確率。
圖14 邏輯回歸ROC曲線Fig.14 LR ROC curves
本檢測儀配套的軟件是基于python語言對德國INSION公司的NIR 1.7/S 微型近紅外光譜儀進行二次開發(fā)。 在Win10操作系統(tǒng)上使用PyQt5編寫人機交互界面,PyCharm Community Edition 2020.1.2 x64編寫后臺邏輯文件,然后將程序移植到樹莓派4B系統(tǒng)中,從而實現(xiàn)面粉的濕度預(yù)測和DON超標與否的判別。 如圖15所示,該檢測系統(tǒng)主要分為4個模塊: 光譜圖像顯示區(qū)、目標預(yù)測區(qū)、光譜儀控制模塊和模型與數(shù)據(jù)模塊。 光譜圖像顯示區(qū)主要用來顯示由光譜儀采集到的光譜數(shù)據(jù),包括采集暗背景、白參考和樣品光譜。 目標預(yù)測區(qū)即顯示面粉的濕度值和DON有無超標情況。 光譜儀控制模塊可以控制光源的開關(guān),連接光譜儀設(shè)置積分時間,平均掃描次數(shù),采集暗背景,白參考以及樣品光譜,也可以進行連續(xù)測量,若勾選預(yù)測,即可實現(xiàn)預(yù)測功能。 模型與數(shù)據(jù)模塊可以對采集到的數(shù)據(jù)進行顯示和保存以及導(dǎo)入本地的數(shù)據(jù)進行模型訓(xùn)練和保存,若本地有模型,也可直接導(dǎo)入用于預(yù)測和判別分析。
其工作流程圖如圖16所示。 當顯示連接光譜儀成功后,設(shè)置積分時間50 ms和平均掃描次數(shù)2次,可以采集暗光譜和白參考,并將采集到的數(shù)據(jù)經(jīng)過計算繪制成圖像顯示在光譜圖像顯示區(qū);可以添加、刪除和保存已經(jīng)采集好的數(shù)據(jù);采集完一組數(shù)據(jù)后,可以進行模型訓(xùn)練,并將訓(xùn)練好的模型保存,以便為下次采集樣本提供模型;也支持從外部導(dǎo)入數(shù)據(jù)進行模型訓(xùn)練并保存;當采集完暗背景和白參考后,可以測量樣品,選擇建立好的模型后,勾選預(yù)測,點擊采集樣本,便會在目標預(yù)測區(qū)顯示出結(jié)果;本程序也支持連續(xù)采集,設(shè)置連續(xù)采集時的時間間隔后,勾選連續(xù)測量,點擊采集樣本,此時光譜圖像顯示區(qū)將會連續(xù)顯示光譜圖像,目標預(yù)測區(qū)將會連續(xù)顯示檢測結(jié)果。
圖16 工作流程圖Fig.16 Work flow chart
取剩余的20份外部驗證集樣品并分別編號用于對便攜式面粉多品質(zhì)檢測儀的精確性和穩(wěn)定性的驗證,使用該檢測儀對20份樣品進行面粉濕度和DON超標與否的預(yù)測,將軟件所預(yù)測的結(jié)果與標準理化值進行比較。 其中每份樣品的濕度分別測量3次,取3次預(yù)測結(jié)果的平均值作為最終預(yù)測結(jié)果,用最大相對誤差來衡量儀器的穩(wěn)定性,每份樣品的DON超標與否只測量一次,與實際結(jié)果進行比較,計算識別準確率來衡量儀器的精確性。
試驗結(jié)果顯示面粉水分的最大相對誤差為2.89%,面粉濕度的預(yù)測值與真實值的相關(guān)性如圖17所示,面粉濕度預(yù)測模型的相關(guān)系數(shù)為0.876,均方根誤差為0.21%,檢測儀對外部驗證集樣品DON超標與否的判定結(jié)果如表4所示,有2個樣本被誤判,其余全部判別正確,識別準確率達到了90%,外部驗證集的準確率略低于測試集可能是因為外部驗證集放置時間太長導(dǎo)致禾谷鐮刀菌繁殖,使原本未超標的樣本被檢測儀預(yù)測為超標。 檢測儀測定的結(jié)果與實際結(jié)果相差不大且具有較高的識別準確率表明該儀器可以實現(xiàn)面粉濕度和DON超標與否的預(yù)測。
圖17 面粉濕度測試結(jié)果Fig.17 Test results of flour moisture
表4 外部驗證集判別結(jié)果統(tǒng)計Table 4 Detection result of samples in external verification set
(1)基于近紅外漫透射光譜,設(shè)計了便攜式面粉多品質(zhì)檢測儀,該檢測儀主要包括光譜采集模塊、光源控制模塊、處理與顯示模塊以及電源模塊。 其中漫透射檢測附件可以自由升降方便樣品的放置以及可以有效避免外界雜散光的干擾,設(shè)計了控制光源開關(guān)的電路,選用樹莓派4B作為核心處理器,選用可充電鋰電池供電,可持續(xù)供電2 h,儀器大小250 mm×170 mm×300 mm,滿足便攜式設(shè)備要求。
(2)將選取的180份樣品中的紅色樣品進行光譜采集的同時測定黃色樣品的濕度理化值和藍色樣品的DON含量值。 利用箱線圖剔除光譜倆端的噪音和一個異常樣本,最終選取1 048~1 747 nm波段光譜進行建模。 通過The Unscrambler X 10.4光譜分析軟件利用多元散射校正(MSC)、S-G卷積平滑和標準正態(tài)變換(SNV)對原始光譜數(shù)據(jù)進行預(yù)處理,建立面粉水分的偏最小二乘回歸預(yù)測模型,結(jié)果顯示不采用任何預(yù)處理的建模效果要優(yōu)于經(jīng)過預(yù)處理的建模效果,其建模集和預(yù)測集相關(guān)系數(shù)分別為0.901和0.855,均方根誤差分別為0.145%和0.286%,殘差預(yù)測偏差RPD為2.5。 利用主成分分析和邏輯回歸對面粉中DON含量超標與否進行判別分析,使用混淆矩陣和ROC曲線下的AUC值來評價分類模型的性能。 其中混淆矩陣結(jié)果顯示未超標樣本的預(yù)測準確率高達96%,超標樣本的預(yù)測準確率高達89%,ROC曲線下的AUC值為0.927。
(3)基于PyQt5開發(fā)工具應(yīng)用python語言編寫了面粉濕度和DON超標與否的實時分析檢測系統(tǒng)。 利用該系統(tǒng)中模型與數(shù)據(jù)模塊得到面粉濕度的PLSR預(yù)測模型和DON超標與否的判別分析模型,實現(xiàn)模型訓(xùn)練和加載一體式,滿足便攜式面粉多品質(zhì)檢測儀的快速無損檢測。
(4)利用外部驗證集試驗驗證了便攜式面粉多品質(zhì)檢測儀的精確性和穩(wěn)定性。 結(jié)果顯示面粉水分的最大相對誤差為2.89%,面粉濕度的預(yù)測值和實際值的相關(guān)系數(shù)為0.876,均方根誤差為0.21%。 面粉中DON含量超標與否的識別準確率為90%,表明該儀器可以對面粉的濕度和DON含量超標與否進行無損檢測分析。