錢 曼,黃文倩,王慶艷,樊書祥,張保華,陳立平*
1. 西北農(nóng)林科技大學機械與電子工程學院,陜西 楊凌 712100 2. 國家農(nóng)業(yè)智能裝備工程技術研究中心,北京 100097 3. 農(nóng)業(yè)部農(nóng)業(yè)信息技術重點實驗室,北京 100097 4. 農(nóng)業(yè)智能裝備技術北京市重點實驗室,北京 100097
西瓜檢測部位差異對近紅外光譜可溶性固形物預測模型的影響
錢 曼1, 2, 3, 4,黃文倩2, 3, 4,王慶艷2, 3, 4,樊書祥1, 2, 3, 4,張保華2, 3, 4,陳立平1, 2, 3, 4*
1. 西北農(nóng)林科技大學機械與電子工程學院,陜西 楊凌 712100 2. 國家農(nóng)業(yè)智能裝備工程技術研究中心,北京 100097 3. 農(nóng)業(yè)部農(nóng)業(yè)信息技術重點實驗室,北京 100097 4. 農(nóng)業(yè)智能裝備技術北京市重點實驗室,北京 100097
西瓜可溶性固形物含量的無損檢測對提升其內(nèi)部品質十分重要。為實現(xiàn)近紅外光譜對小型西瓜表面各部位可溶性固形物含量的準確預測,減小檢測部位差異對預測模型的影響,以“京秀”西瓜為研究對象,分別采集赤道、瓜臍和瓜梗三部位的漫透射光譜信息,利用偏最小二乘算法(PLS)建立并比較單一檢測部位和混合所有檢測部位的西瓜可溶性固形物近紅外光譜預測模型,并分別采用連續(xù)投影算法(SPA)和競爭性自適應重加權算法(CARS)對西瓜可溶性固形物近紅外光譜變量進行特征波長篩選。結果顯示,相比于單一檢測部位的模型,混合所有檢測部位的校正集樣本建立的模型取得了較優(yōu)的預測結果。同時,利用CARS算法篩選的42個特征波長變量建模,對三種檢測部位預測集樣本的預測結果分別為赤道RP=0.892和RMSEP= 0.684 °Brix,瓜臍RP=0.905和RMSEP= 0.629 °Brix,瓜梗RP=0.899和RMSEP= 0.721 °Brix。模型得到了很大的簡化,且預測精度較高。比較發(fā)現(xiàn),利用SPA算法篩選的19個特征波長變量所建模型的預測精度較低。利用三種檢測部位的西瓜樣本建立的PLS混合預測模型,結合CARS算法進行有效特征波長變量篩選,可提高西瓜可溶性固形物預測模型的精度,實現(xiàn)西瓜表面各部位可溶性固形物含量的準確預測,減小檢測部位差異對近紅外光譜預測模型的影響。結果為今后開發(fā)便攜式設備檢測西瓜表面各部位可溶性固形含量提供參考依據(jù)。
小型西瓜; 檢測部位; 近紅外光譜; 可溶性固形物
西瓜是我國夏季最主要的水果之一,甘甜多汁,含有大量的葡萄糖、氨基酸、維生素C等多種營養(yǎng)成分,是一種純凈安全的食品[1]。隨著消費者對食品品質要求的不斷提高,在選購西瓜時越來越注重其內(nèi)部品質(如糖度、口感及營養(yǎng)成分等)。可溶性固形物(soluble solids content, SSC)是包括糖、酸、纖維素、礦物質等成分的綜合參數(shù),是評價水果內(nèi)部品質高低的一個重要指標[2]。西瓜SSC含量的快速、無損檢測對于提升西瓜的生產(chǎn)效益及我國西瓜的國際競爭力具有十分重要的意義。相比于傳統(tǒng)破壞性檢測方法,近紅外光譜分析技術具有非破壞、無需制樣、分析效率高、速度快、重現(xiàn)性好等優(yōu)勢,已廣泛應用于水果及農(nóng)產(chǎn)品無損檢測領域[3]。
相關研究顯示,檢測部位的差異可能會對近紅外光譜預測模型的精度產(chǎn)生影響。介鄧飛等[4]利用自主研發(fā)的檢測裝置采集西瓜不同部位的光譜信息進行糖度預測,得出瓜臍為較優(yōu)的光譜采集部位。韓東海等[5]研究得出在西瓜的中層信息區(qū)域,無論是組織含水率還是SSC含量,瓜頂部位所建模型優(yōu)于赤道部位。田海清考察了光譜采集部位對建模的影響,得出各部位均可取得較好預測結果,沒有明顯優(yōu)劣之分。同時,文獻[6-7]采用特征波長篩選算法,在簡化了近紅外光譜預測模型的基礎上,其預測精度也得到了一定提高。
西瓜體型較大,在其生長過程中,由于光照、溫度、養(yǎng)分等不均衡,不同部位的內(nèi)部品質也存在一定差異。之前的研究表明,西瓜檢測部位差異可能會對SSC近紅外光譜預測模型產(chǎn)生影響,且分析指出了西瓜預測模型精度較高的檢測部位,但在如何提高西瓜表面各部位SSC含量預測精度方面鮮有報道。因此以“京秀”西瓜為研究對象,分別采集赤道、瓜臍和瓜梗三種檢測部位的漫透射光譜信息,建立并比較單一檢測部位和混合所有檢測部位的西瓜SSC近紅外光譜預測模型,同時結合特征波長變量優(yōu)選算法簡化模型,實現(xiàn)了對三種檢測部位預測集樣本的SSC含量的準確預測。為開發(fā)便攜式檢測設備實現(xiàn)對西瓜表面各部位SSC含量的準確預測提供參考。
1.1 材料
樣本品種為“京秀”西瓜,挑選形狀規(guī)則且表皮無損傷缺陷的樣品50個,樣品采收當天運回實驗室。將西瓜樣品表面清洗干凈后,依次編號并標記光譜采集部位,每個西瓜樣品赤道部位均勻采集2個點(間隔約180°),瓜臍和瓜梗部位各采集1個點。為避免溫度對光譜采集及SSC含量測定產(chǎn)生影響,將西瓜樣品室溫放置48 h,以確保樣本溫度與室溫一致[8]。
1.2 光譜采集及SSC含量測定
光譜采集系統(tǒng)如圖1所示,該系統(tǒng)主要由光譜儀、光源、環(huán)形光纖探頭、計算機等組成。其中,光譜儀為便攜式USB2000+微型光纖光譜儀(Ocean Optics Inc., USA),其采用CCD陣列Vis/NIRS檢測器,采樣范圍為489~1 156 nm,數(shù)據(jù)點為2 048; 光源為50 W的外置鹵素燈; 自主設計的環(huán)形光纖探頭通過兩條光纖(環(huán)形光纖和探測光纖)分別與外置光源和光譜儀連接,其中環(huán)形光纖將光源發(fā)出的光傳輸并照射到檢測部位,探測光纖將檢測器采集到的光返回給光譜儀。利用此系統(tǒng)采集西瓜樣品標記部位的漫透射光譜信息,光譜采集完成后,使用阿貝折光儀(ARIAS 500, Reichert Technologies, New York, USA)對相應光譜采集部位的SSC進行測定。從每個西瓜樣品標記部位取出一定厚度果肉,利用紗布對果肉進行擠壓過濾,將果汁滴于折光儀鏡面,讀取SSC數(shù)據(jù)并記錄。
圖1 光譜采集系統(tǒng)示意圖
1.3 SSC近紅外光譜預測模型的建立
偏最小二乘(partial least squares, PLS)算法是一種多元統(tǒng)計數(shù)據(jù)分析方法,有機結合了主成分分析、典型相關分析及多元線性回歸,具有較高的抗干擾能力和穩(wěn)定性[9]。該算法可根據(jù)對應Y值(SSC)將X值(光譜數(shù)據(jù))進行主成分的提取,然后對兩組變量進行典型相關分析,最后建立光譜數(shù)據(jù)與SSC的回歸關系[10-11]。利用PLS算法分別建立三種單一檢測部位及混合所有檢測部位西瓜SSC近紅外光譜預測模型,并利用所建模型(赤道、瓜臍、瓜梗和混合模型)對三種不同檢測部位預測集樣本的SSC進行預測。模型預測性能通過預測相關系數(shù)(RP)和預測均方根誤差(root mean square error of prediction, RMSEP)定量評價。
1.4 有效特征波長變量的篩選
由于全波段光譜數(shù)據(jù)具有較強的共線性,存在大量冗余信息,特征波長的篩選一方面可以簡化預測模型,另一方面剔除了不相關和非線性的光譜變量,可提高模型的穩(wěn)定性和預測精度。連續(xù)投影算法(successive projections algorithm, SPA)利用向量的投影分析,在大量波長變量之間篩選含有最小冗余信息的變量組,根據(jù)校正集內(nèi)部均方根誤差(root mean square error, RMSE)確定最佳變量數(shù),使變量之間的共線性達到最小[12]。競爭性自適應重加權算法(competitive adaptive reweighted sampling, CARS)依據(jù)達爾文進化論,利用自適應加權采樣技術選擇PLS模型中回歸系數(shù)絕對值較大的波長變量,最后根據(jù)交互驗證均方根誤差(root mean square error of cross validation, RMSECV)的最小值選取與所測成分相關的波長變量[13]; 采用SPA算法和CARS算法分別對西瓜SSC近紅外光譜特征波長變量進行篩選,并利用優(yōu)選的特征波長變量建立西瓜SSC近紅外光譜預測模型。
2.1 光譜分析及西瓜樣本劃分
由于存在系統(tǒng)誤差,光譜儀采樣波長首尾兩端噪聲較大,信噪比較差,故選擇700~1 050 nm波段內(nèi)共1 088個波長點進行建模分析。為消除隨機噪聲和光散射等因素影響,校正光譜光程,提高有用信息強度,采用多元散射校正(multiplicative scatter correction, MSC)方法對光譜進行預處理。圖2為50個西瓜樣品不同檢測部位的近紅外漫透射光譜信息經(jīng)MSC預處理后的光譜圖,其中包括赤道部位光譜曲線100條,瓜臍和瓜梗部位各50條。三種檢測部位的光譜趨勢相同,從圖2難以分辨出不同檢測部位西瓜樣本的光譜信息差異。
圖2 西瓜樣本MSC預處理后的光譜
表1為西瓜樣本不同檢測部位SSC含量測量值統(tǒng)計結果。PLS建模時,按照隨機方式分別從赤道、瓜臍、瓜梗三種檢測部位中挑選出校正集樣本和預測集樣本。由表1可知,三種檢測部位的校正集樣本的SSC含量分布范圍較寬,涵蓋了預測集樣本的SSC含量范圍區(qū)域,這樣更利于構建穩(wěn)定可靠的預測模型[14]。
表1 西瓜樣本SSC含量測量值統(tǒng)計
2.2 單一檢測部位校正集樣本建模預測結果
利用赤道、瓜臍、瓜梗三種檢測部位的校正集樣本建立各單一檢測部位近紅外光譜SSC預測模型,分別對三種不同檢測部位的預測集樣本進行預測,結果如表2所示。對于同一檢測部位的西瓜樣本,其校正集建立的單一檢測部位模型對其預測集樣本均實現(xiàn)了較準確的預測。赤道部位預測結果RP=0.874,RMSEP=0.627 °Brix; 瓜臍部位預測結果RP=0.909,RMSEP=0.722 °Brix; 瓜梗部位預測結果RP=0.871,RMSEP=0.791 °Brix。比較發(fā)現(xiàn),利用單一檢測部位模型預測其他兩種不同檢測部位的預測集樣本預測相關系數(shù)(RP)會有不同程度降低,RMSEP也相對較大。在實際應用中,利用便攜式設備檢測未知樣品時,由于西瓜體型較大,對其檢測位置不固定,若只根據(jù)某單一檢測部位建立的模型對未知西瓜樣品的SSC含量進行預測,會產(chǎn)生很大偏差。因此,建立混合檢測部位的預測模型具有實際意義。
表2 單一檢測部位SSC含量預測模型的預測結果
2.3 混合檢測部位的校正集樣本建模預測結果
混合三種檢測部位的校正集樣本,建立混合檢測部位的近紅外光譜SSC預測模型,三種不同檢測部位預測集樣本的預測結果如表3所示。赤道部位預測結果RP=0.858,RMSEP=0.767 °Brix; 瓜臍部位預測結果RP=0.874,RMSEP=0.703 °Brix; 瓜梗部位預測結果RP=0.859,RMSEP=0.810 °Brix。比較發(fā)現(xiàn),當校正集中含有三種檢測部位的西瓜樣本光譜信息時,建立的混合預測模型對赤道、瓜臍、瓜梗三種部位的預測集樣本均取得了較好的預測結果,預測相關系數(shù)均大于0.85,減小了西瓜檢測部位差異對近紅外光譜SSC預測模型的影響,實現(xiàn)了對西瓜表面各部位SSC含量的準確預測。
表3 混合檢測部位SSC含量預測模型的預測結果
2.4 基于特征波長的混合檢測部位模型預測結果
為提高檢測效率,簡化預測模型,在700~1 050 nm波段內(nèi),利用SPA算法和CARS算法分別對混合三種檢測部位校正集樣本的光譜變量進行SSC特征波長篩選。圖3為采用SPA算法對西瓜SSC光譜變量進行篩選的結果,圖3(a)表示SPA算法所選的特征波長變量在進行PLS建模時RMSE的分布,圖3(b)表示SPA算法分析后獲得的波長點分布。圖4為CARS算法運行過程和結果,由于每次運行CARS算法得到的最優(yōu)采樣次數(shù)稍有偏差,故運行CARS算法50次,根據(jù)交互驗證均方根誤差(RMSECV)最小的一次,挑選出西瓜SSC的特征波長變量。當采樣次數(shù)為52時,RMSECV達到最小值0.682,同時對應的最優(yōu)建模變量數(shù)為42。分別利用SPA算法和CARS算法篩選的有效特征波長變量建立混合檢測部位西瓜SSC近紅外光譜模型,預測結果如表4所示。
圖3 基于SPA算法的特征變量篩選
圖4 基于CARS算法的特征變量篩選
表4 不同PLS模型的預測結果
Table 4 SSC predicted results of different PLS prediction models
預測模型變量數(shù)預測結果赤道瓜臍瓜梗RPRMSEPRPRMSEPRPRMSEPPLS10880.8580.7670.8740.7030.8590.810SPA-PLS190.7520.8830.5790.9630.6131.208CARS-PLS420.8920.6840.9050.6290.8990.721
由表4可知,利用SPA算法篩選的特征波長變量數(shù)為19,雖然建模變量數(shù)較少,模型得到了很大簡化,但SPA-PLS模型對三種檢測部位預測集樣本的RP均較低,RMSEP均較大。相比于SPA算法,利用CARS算法進行有效特征波長篩選后,建模變量數(shù)由1 088減少到42,不僅模型得到了很大簡化,同時預測精度也得到了一定提升。CARS-PLS模型對三種檢測部位預測集樣本的預測結果分別為赤道RP=0.892和RMSEP=0.684 °Brix,瓜頂RP=0.905和RMSEP= 0.629 °Brix,瓜梗RP=0.899和RMSEP=0.721 °Brix。圖5為CARS-PLS模型對三種檢測部位預測集樣本的西瓜SSC含量的預測值與實際測量值之間的散點圖。通過CARS算法進行有效特征波長變量篩選,預測精度得到了一定提升,同時模型也得到了很大的簡化。
圖5 CARS-PLS模型的預測集樣本 的實測值與預測值散點圖
以“京秀”西瓜為研究對象,分別對赤道、瓜臍及瓜梗三種不同檢測部位進行研究,探討了西瓜檢測部位差異對近紅外光譜SSC預測模型的影響。相比于單一檢測部位模型,混合三種檢測部位的校正集樣本建立的預測模型較優(yōu),同時利用CARS算法優(yōu)選的42個特征波長變量建模,模型得到了很大簡化,預測精度也得到了一定提升,其對三種檢測部位預測集樣本的預測結果分別為赤道RP=0.892和RMSEP= 0.684 °Brix,瓜臍RP=0.905和RMSEP= 0.629 °Brix,瓜梗RP=0.899和RMSEP=0.721 °Brix。結果表明,含有三種檢測部位的西瓜樣本建立的預測模型,結合CARS算法進行有效特征波長的篩選,可實現(xiàn)對西瓜不同檢測部位SSC含量的準確預測,減小檢測部位差異對近紅外光譜SSC預測模型的影響,為今后利用近紅外光譜技術對西瓜表面各部位的SSC含量的便攜式檢測研究提供參考依據(jù)。
[1] ZHANG Jun-jie, CHENG Zhi-qiang(張俊杰, 程志強). Southern Horticulture(南方園藝), 2013 (2): 49.
[2] Mendoza F, Lu R, Ariana D, et al. Postharvest Biology and Technology, 2011, 62(2): 149.
[3] Nicola? B M, Defraeye T, De Ketelaere B, et al. Annual Review of Food Science and Technology, 2014, 5: 285.
[4] JIE Deng-fei, CHEN Meng, XIE Li-juan, et al(介鄧飛, 陳 猛, 謝麗娟, 等). Transactions of the Chinese Society of Agricultural Engineering(農(nóng)業(yè)工程學報), 2014, 30(9): 229.
[5] HAN Dong-hai, CHANG Dong, SONG Shu-hui, et al(韓東海, 常 冬, 宋曙輝, 等). Transactions of the Chinese Society for Agricultural Machinery(農(nóng)業(yè)機械學報), 2013, 44(7): 174.
[6] Xiaobo Z, Jiewen Z, Xingyi H, et al. Chemometrics and Intelligent Laboratory Systems, 2007, 87(1): 43.
[7] JIE Deng-fei, XIE Li-juan, RAO Xiu-qin, et al(介鄧飛, 謝麗娟, 饒秀勤, 等). Transactions of the Chinese Society of Agricultural Engineering(農(nóng)業(yè)工程學報), 2013, 29(12): 264.
[8] CAO Jian-kang, JIANG Wei-bo, ZHAO Yu-mei(曹建康, 姜微波, 趙玉梅). Experiment Guidance of Postharvest Physiology and Biochemistry of Fruits and Vegetables(果蔬采后生理生化實驗指導). Beijing: China Light Industry Press(北京: 中國輕工業(yè)出版社), 2007.
[9] TIAN Hai-qing, YING Yi-bin, XU Hui-rong, et al(田海清, 應義斌, 徐惠榮, 等). Transactions of the Chinese Society for Agricultural Machinery(農(nóng)業(yè)機械學報), 2007, 38(5): .
[10] Wold S, Sj?str?m M, Eriksson L. Chemometrics and Intelligent Laboratory Systems, 2001, 58(2): 109.
[11] Li J, Huang W, Zhao C, et al. Journal of Food Engineering, 2013, 116(2): 324.
[12] HUANG Wen-qian, LI Jiang-bo, CHEN Li-ping, et al(黃文倩, 李江波, 陳立平, 等). Spectroscopy and Spectral Analysis(光譜學與光譜分析), 2013, 33(10): 2843.
[13] Li H, Liang Y, Xu Q, et al. Analytica Chimica Acta, 2009, 648(1): 77.
[14] FAN Shu-xiang, HUANG Wen-qian, GUO Zhi-ming, et al(樊書祥, 黃文倩, 郭志明, 等). Analytical Chemistry(分析化學), 2015, 2: 016.
*Corresponding author
(Received Apr. 17, 2015; accepted Aug. 20, 2015)
Assessment of Influence Detective Position Variability on Precision of Near Infrared Models for Soluble Solid Content of Watermelon QIAN Man1, 2, 3, 4, HUANG Wen-qian2, 3, 4, WANG Qing-yan2, 3, 4, FAN Shu-xiang1, 2, 3, 4, ZHANG Bao-hua2, 3, 4,
CHEN Li-ping1, 2, 3, 4*
1. College of Mechanical and Electronic Engineering, Northwest Agricultural and Forestry University, Yangling 712100, China 2. National Research Center of Intelligent Equipment for Agriculture, Beijing 100097,China 3. Key Laboratory of Agri-informatics, Ministry of Agriculture, Beijing 100097, China 4. Beijing Key Laboratory of Intelligent Equipment Technology for Agriculture, Beijing 100097, China
Non-destructive detection for soluble solids content (SSC) is important to improve watermelon’s internal quality, which attracts more and more attention from consumers. In order to realize the precise detection for SSC of mini watermelon’s whole surface by using Near-infrared (NIR) spectroscopy and reduce the influence of detective position variability on the accuracy of NIR prediction model for SSC, the diffused transmission spectra and soluble solids content were collected from three different detective positions of ‘jingxiu’ watermelon, including the equator, calyx and stem. The prediction models of single detective position and mixed three detective positions for SSC were established with Partial least square (PLS). Successive projections algorithm (SPA) and competitive adaptive reweighted sampling (CARS) were adopted to select effective variables of NIR spectroscopy for SSC of watermelon as well. The results showed that the prediction model of mixed three detective positions was better than the model of single detective position. Meanwhile, 42 characteristic variables of NIR spectroscopy selected with CARS were used to establish PLS prediction model for SSC. The prediction model was simplified significantly and the prediction accuracy for SSC was improved greatly. The correlation coefficient of prediction (RP) and root mean square error of prediction (RMSEP) by CARS-PLS were 0.892, 0.684 °Brix for the equator, 0.905, 0.621 °Brix for the calyx, 0.899, 0.721 °Brix for the stem, respectively. However, the prediction result of SPA-PLS established by 19 characteristic wavelength variables of NIR spectroscopy was bad for the equator, calyx and stem detective positions. The correlation coefficient of prediction (RP) is less than 0.752 and root mean square error of prediction (RMSEP) is relatively high. It was proposed that the PLS prediction model established by mixed three different detective positions with effective characteristic wavelength variables selected by CARS can improve the prediction accuracy for SSC. And the CARS-PLS prediction model can achieve fast and precise detection for SSC of mini watermelon’s whole surface. The influence of detective position variability on the accuracy of NIR prediction model could be reduced simultaneously. Thispaper could provide theoretical basis for calibrating NIR prediction model for SSC of mini watermelon. It also could provide reference for developing the portable and non-destructive detection equipment for soluble solids content of mini watermelon’s whole surface.
Mini watermelon; Detective position; Near-infrared spectroscopy; Soluble solids content
2015-04-17,
2015-08-20
北京市自然科學基金青年基金項目(6144024)和北京市農(nóng)林科學院青年基金項目(QNJJ201423)資助
錢 曼,女,1991年生,西北農(nóng)林科技大學碩士研究生 e-mail: qianman101504@163.com *通訊聯(lián)系人 e-mail: chenlp@nercita.org.cn
O657.3
A
10.3964/j.issn.1000-0593(2016)06-1700-06