劉蕊 張軍 范海闊
(1中國(guó)熱帶農(nóng)業(yè)科學(xué)院椰子研究所海南文昌571339;2農(nóng)業(yè)農(nóng)村部文昌椰子種質(zhì)資源圃海南文昌571339)
椰子樹(shù)是熱帶地區(qū)重要的木本油料作物[1],椰子油是從新鮮成熟椰肉中制得的一種油脂[2]。具備藥用、抗氧化活性、減肥美容等[3-5]功效,受到消費(fèi)者青睞。作為一種功能性油脂,椰子油可用于食品加工、護(hù)膚品和生物燃料生產(chǎn)等[6-8],應(yīng)用十分廣泛。椰子油是椰子的重要加工產(chǎn)品,根據(jù)USDA數(shù)據(jù),2016年世界椰子油消費(fèi)總量達(dá)到321萬(wàn)噸。鑒于椰子油的重要性,選育含油量高的品種是椰子的重要育種方向,篩選高含油量的優(yōu)良種質(zhì)是椰子育種的重要內(nèi)容。傳統(tǒng)的油料作物含油量檢測(cè)主要通過(guò)索氏抽提等方法,檢測(cè)步驟繁瑣,所需時(shí)間較長(zhǎng),不能實(shí)現(xiàn)高通量快速檢測(cè)。在科研與實(shí)際生產(chǎn)中,需要建立一種椰子肉含油量的快速檢測(cè)方法,這對(duì)于椰子種質(zhì)的高效鑒定評(píng)價(jià)以及椰子油產(chǎn)量的預(yù)測(cè)十分必要。近紅外光譜是一種高效、無(wú)損、易操作、可實(shí)時(shí)在線檢測(cè)的技術(shù),已經(jīng)被廣泛應(yīng)用于醫(yī)藥、食品、農(nóng)產(chǎn)品[9-12]等檢測(cè)中。有關(guān)近紅外光譜技術(shù)在油脂檢測(cè)方面的報(bào)道較多,主要應(yīng)用于油料作物含油量檢測(cè)等方面。奚如春等[13]依據(jù)油茶種子吸收光譜與化學(xué)特征分析數(shù)據(jù),建立了油茶種仁含油率定標(biāo)模型。金華麗等[14]結(jié)合近紅外光譜掃描和索氏抽提法建立了花生種質(zhì)含油量的近紅外測(cè)定模型。林艷等[15]采用近紅外光譜技術(shù)建立了沉香含油量近紅外光譜預(yù)測(cè)模型。Novianty等[16]同樣采用近紅外光譜技術(shù)建立了油棕鮮果的含油量檢測(cè)模型,并比較了偏最小二乘法(PLS)和多元線性回歸(MLR)法預(yù)測(cè)含油量的準(zhǔn)確性。由于近紅外光譜分析技術(shù)是一種間接測(cè)量手段,是依賴復(fù)雜的化學(xué)計(jì)量學(xué)校準(zhǔn)算法的間接定性定量分析技術(shù),因此分析過(guò)程受到許多因素的影響[17],主要包括樣品因素、儀器參數(shù)、實(shí)驗(yàn)操作等。有關(guān)學(xué)者在此方面進(jìn)行了大量研究,如李軍會(huì)等[18]研究發(fā)現(xiàn),提高儀器信噪比、樣品重復(fù)測(cè)量取平均次數(shù)等方法可以提高測(cè)試精度。王斌等[19]分析了掃描次數(shù)對(duì)鮮棗近紅外光譜響應(yīng)特性的影響;趙怡錕等[20]發(fā)現(xiàn)儲(chǔ)存時(shí)間對(duì)玉米單籽粒近紅外光譜檢測(cè)結(jié)果有著重要的影響。在椰子油研究方面,尚未見(jiàn)采用近紅外光譜技術(shù)的報(bào)道,也并未開(kāi)展掃描條件對(duì)相關(guān)模型建立的影響研究。本研究以成熟椰肉為試驗(yàn)材料,分析不同掃描次數(shù)對(duì)椰肉含油量建模的影響,擬篩選適合椰肉含油量近紅外定量模型建立的最佳掃描次數(shù),為將來(lái)建立實(shí)際應(yīng)用模型時(shí)選擇最佳的檢測(cè)條件提供參考。
1.1.1 儀器設(shè)備
S400型近紅外農(nóng)產(chǎn)品品質(zhì)測(cè)定儀(上海棱光技術(shù)有限公司),F(xiàn)A1204B電子天平(上海天美天平儀器有限公司),DHG-9140A電熱恒溫鼓風(fēng)干燥箱(上海精宏實(shí)驗(yàn)設(shè)備有限公司),JK-CFD-6粗脂肪測(cè)定儀(上海精學(xué)科學(xué)儀器有限公司)。
1.1.2 試驗(yàn)材料
所有試驗(yàn)樣品采自海南省文昌市中國(guó)熱帶農(nóng)業(yè)科學(xué)院椰子研究所試驗(yàn)基地。
1.2.1 樣品處理
選取已經(jīng)響水、健康無(wú)損的椰子果樣本38個(gè);剖開(kāi)椰果,剝?nèi)⌒迈r椰肉并將椰肉切成6 mm×6 mm大小置于70℃鼓風(fēng)干燥箱中烘干至恒重;烘干后的樣品用粉碎機(jī)粉碎成粉末狀備用。
1.2.2 光譜數(shù)據(jù)采集
用S400型近紅外農(nóng)產(chǎn)品品質(zhì)測(cè)定儀對(duì)38份椰肉粉末進(jìn)行光譜采集,光譜采集的參數(shù)如下:數(shù)據(jù)模式為吸光度(A),采樣波段范圍為1 000~2 500 nm,光譜采樣間隔為1 nm,掃描次數(shù)分為3、8、16、32、64次。光源采用與光譜儀配套的歐司朗12 V、20 W鎢燈。為了減少樣品不均勻性帶來(lái)的誤差,試驗(yàn)過(guò)程中每個(gè)樣品都重裝樣2次并分別采集光譜。
1.2.3 含油量測(cè)定
用索氏抽提法測(cè)定38份椰肉粉末含油量。
1.2.4 光譜數(shù)據(jù)預(yù)處理與建模分析
分別將每個(gè)掃描條件下采集到的76光譜數(shù)據(jù)導(dǎo)入CAUNIR分析軟件,并輸入每一條光譜所對(duì)應(yīng)的含油量值,利用CAUNIR軟件所提供的定量偏最小二乘分析方法(Quantitative partial least squares,QPLS)建模。建模的波段1 000~2 000 nm,波長(zhǎng)間隔1 nm,試驗(yàn)樣本按光譜數(shù)量1∶1的比例分成建模集和檢驗(yàn)集。數(shù)據(jù)處理過(guò)程中,為了消除光譜采集過(guò)程中來(lái)自隨機(jī)噪音、基線漂移、樣本不均勻等的影響,采用軟件提供的一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、散射校正、矢量校正、極差歸一、中心化法等6種預(yù)處理方法對(duì)光譜進(jìn)行預(yù)處理。根據(jù)預(yù)處理方法的不同,每個(gè)掃描條件下建立6個(gè)定量模型,從中篩選1個(gè)最佳模型,5個(gè)掃描條件共篩選5個(gè)最佳定量模型。
利用相關(guān)系數(shù)r、校正樣本均方根誤差(RMSEC)、預(yù)測(cè)樣本均方根誤差(RMSEP)來(lái)評(píng)價(jià)所建模型的精確性。相關(guān)系數(shù)越接近1和均方根誤差越接近于0,并且建模樣本均方根誤差和檢驗(yàn)樣本均方根誤差越接近時(shí),表明所建模型較優(yōu)。
1.2.5 模型預(yù)測(cè)能力檢驗(yàn)
利用1.2.4中篩選的5個(gè)模型對(duì)外部驗(yàn)證集的樣品含油量進(jìn)行預(yù)測(cè),通過(guò)成對(duì)t檢驗(yàn),比較實(shí)際值與預(yù)測(cè)值的差異。
38份樣品含油量最小值為27.50%,最大值為60.00%,平均值為50.21%,符合建模要求。每個(gè)樣品重裝2次,因此3、8、16、32和64次每個(gè)掃描條件下均獲得76條光譜(圖1-a~e)。不同掃描次數(shù)下的近紅外光譜吸收峰基本一致。
圖1 椰肉近紅外掃描光譜
依次將3、8、16、32、64次掃描條件下采集的光譜及其對(duì)應(yīng)的含油量數(shù)值添加入CAUNIR軟件,設(shè)置波長(zhǎng)范圍(1 000~2 000 nm)和間隔(1 nm)后,選用經(jīng)預(yù)處理的光譜進(jìn)行模型建立,檢驗(yàn)集的設(shè)置采用隨機(jī)選擇檢驗(yàn)樣品的方法,以光譜數(shù)量1∶1的比例劃分建模集和檢驗(yàn)集,模型采用的推薦主成分?jǐn)?shù)由內(nèi)部留一交叉確定。在上述參數(shù)條件下試建并保存模型。5種掃描條件下椰肉含油量QPLS定量模型的最優(yōu)結(jié)果,見(jiàn)表1。
表1 椰肉含油量檢測(cè)QPLS模型結(jié)果
理論上檢測(cè)模型校正均方根誤差(RMSEC)和預(yù)測(cè)均方根誤差(RMSEP)越小越好,兩者的值應(yīng)非常接近,且有較高的相關(guān)系數(shù),這樣才能說(shuō)明該模型穩(wěn)定性較好。由表1可知,3次掃描條件下,采用中心化法預(yù)處理后的光譜建模效果最好;8次掃描條件下,采用極差歸一法預(yù)處理后的光譜建模效果最好;而16次掃描條件下采用二階導(dǎo)數(shù)預(yù)處理法,32次掃描條件下采用矢量校正預(yù)處理法,64次掃描條件下采用散射校正預(yù)處理法,建模效果最好。不同掃描次數(shù)相比,掃描3次的相關(guān)系數(shù)(0.838 3)最低,均方根誤差最大;掃描64次的相關(guān)系數(shù)(0.877 6)為最高,均方根誤差相對(duì)較小。
續(xù)圖1椰肉近紅外掃描光譜
應(yīng)用2.2所建的5個(gè)預(yù)測(cè)模型,對(duì)其外部驗(yàn)證集的38條光譜對(duì)應(yīng)的樣品含油量進(jìn)行預(yù)測(cè),并對(duì)模型預(yù)測(cè)值與實(shí)際含油量值進(jìn)行統(tǒng)計(jì)分析;將外部驗(yàn)證集樣品所對(duì)應(yīng)的椰肉含油量與模型的預(yù)測(cè)值進(jìn)行配對(duì)t檢驗(yàn)。結(jié)果證明,掃描3、8、16、32、64次所建立的預(yù)測(cè)模型的p值(Sig.)均大于0.05(表2),說(shuō)明其含油量預(yù)測(cè)值與真實(shí)值間無(wú)顯著差異。
表2 椰肉含油量實(shí)際值與預(yù)測(cè)值t檢驗(yàn)
綜合表1~2的結(jié)果,在掃描64次條件下,采用散射校正預(yù)處理光譜所建立的模型性能較好,其實(shí)際值與預(yù)測(cè)值的相關(guān)系數(shù)可達(dá)0.877 6。
文章探討了掃描次數(shù)對(duì)椰肉含油率定量模型構(gòu)建的影響,并分析了不同掃描條件下所建立的模型對(duì)樣本含油量的預(yù)測(cè)能力。結(jié)果表明,從相關(guān)系數(shù)和均方根誤差的角度看,掃描64次所建立的模型性能比較穩(wěn)定;所建的5個(gè)預(yù)測(cè)模型,其含油量真實(shí)值與預(yù)測(cè)值均無(wú)顯著差異。由上述結(jié)果可知,相比而言,64次掃描條件最優(yōu),但考慮到試驗(yàn)效率,在后續(xù)的大規(guī)模樣本量建模時(shí),建議采用掃描3次的參數(shù)條件,可以節(jié)省試驗(yàn)時(shí)間,同時(shí)也可以保證較高的預(yù)測(cè)能力。本研究同時(shí)分析了不用預(yù)處理方法對(duì)模型構(gòu)建的影響,結(jié)果表明,不同預(yù)處理方法對(duì)模型的性能影響存在一定差異,需要根據(jù)實(shí)際情況篩選最佳預(yù)處理方法。
對(duì)近紅外光譜定量模型構(gòu)建有影響的因素包括很多,除了掃描次數(shù)和預(yù)處理方法,譜區(qū)范圍[21]、環(huán)境溫度[18]等都會(huì)對(duì)結(jié)果造成影響,在后續(xù)椰肉含油量的近紅外光譜建模研究中需要進(jìn)一步分析,為建立穩(wěn)定性好、實(shí)用性高的穩(wěn)健性模型提供參考。