亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        BiPLS結合SPA對蘋果可溶性固形物含量的近紅外檢測方法

        2022-01-14 05:14:16張立欣楊翠芳陳杰王亞明張曉
        塔里木大學學報 2021年4期
        關鍵詞:方根波長可溶性

        張立欣,楊翠芳,陳杰,王亞明 ,張曉*

        (1塔里木大學信息工程學院,新疆 阿拉爾 843300)(2南京理工大學理學院,江蘇 南京 210094)

        中醫(yī)認為蘋果具有生津止渴、潤肺除煩、健脾益胃、養(yǎng)心益氣等功效,并且味道酸甜適口,營養(yǎng)豐富,因此,深受人們的喜愛。但是由于環(huán)境因素、土壤特征等條件的不同,導致各地蘋果的品質存在差異。消費者在購買水果時,除了注重顏色、大小、形狀等外部品質外,對內部品質口感也是極為看重,其中可溶性固形物含量直接影響其口感[1]。傳統可溶性固形物含量的檢測方法是破壞性或侵入性測量,不僅費時、費力,而且破壞了水果的完整性。近些年,NIR分析技術因具有快速、便捷、無損的優(yōu)點逐漸被用于農產品的檢測中,如水蜜桃[2]、紅提[3]、滑皮金桔[4]、靈武長棗[5]等。魏康麗等[6]采用單積分球技術定量分析蘋果低溫貯存(0℃,150 d)期間可溶性固形物、總可溶性糖、果糖、葡萄糖及蔗糖與吸收和散射性質的關系,該研究為光學技術檢測果實品質提供了理論參考。王浩云等[7]提出了一種基于高光譜圖像與三維卷積神經網絡(3D-CNN)的蘋果高光譜多品質參數同時檢測方法,建立的糖度模型相關系數高達0.827。劉燕德等[8]為了實現不同產地蘋果糖度的快速在線無損檢測,減少產地差異對近紅外光譜檢測模型的影響,建立了蘋果糖度的UVEPLS通用模型,提高其他產地樣本糖度的預測穩(wěn)健性。徐永浩等[9]驗證了微型近紅外光譜儀(NIRscan)用于蘋果糖度的現場快速和高精度無損檢測具有可行性。譚保華等[10]設計了水果含糖量的近紅外檢測實驗系統。喬鑫等[11]設計了手機聯用的蘋果糖度便攜式檢測裝置,通過優(yōu)選特征波段確定適合蘋果糖度檢測的波段范圍及光學傳感器,完成蘋果糖度的高效、便攜及低成本的無損檢測。在這些光譜分析中,全譜中不可避免地含有大量噪聲、無信息甚至是干擾的變量,這些變量的存在不僅增加了多元校正模型的復雜程度,還有可能影響模型的預測性能,因此在建立模型前,需要提取特征變量,變量選擇已成為近紅外光譜分析中的一個重要步驟。特征波段的提取主要有SPA[12-13],競爭性自適應重加權算法(CARS)[14]、主成分分析(PCA)[15]等,或者幾種方法同時使用[16],選擇的對象一般是單一光譜變量,選擇光譜區(qū)間對蘋果可溶性固形物含量的檢測鮮有報道。

        朱紹農等[17]采用偏最小二乘法結合區(qū)間以及后向區(qū)間法對全譜進行變量篩選,構建形成iPLS和Bi-PLS定量分析土壤樣品中銅、鎳元素含量的模型。張丙芳等[18]結合近紅外光譜分析技術,利用間隔偏最小二乘-連續(xù)投影算法進行特征波段選擇,建立一個適于檢測油脂中酸值和羰基價變化,且精確度較高的模型。饒利波等[19]用后向區(qū)間法選出177個特征波長,結合競爭性自適應重加權算法再進一步篩選,提取出7個特征波長,利用偏最小er乘法建立基于特征波長的可溶性固形物含量檢測模型,證明了后區(qū)間法結合競爭性自適應重加權算法在提高蘋果可溶性固體物含量檢測精度方面的有效性。

        由于不同樣品內部結構不同,特征光譜區(qū)間也不同。本試驗以阿克蘇‘紅富士’蘋果為研究對象,基于近紅外光譜技術對蘋果中的可溶性固形物含量進行分析,建立PLS模型,研究區(qū)間變量選擇方法和單一變量選擇方法相結合,對定量分析性能提升的影響。

        1 材料與方法

        1.1 供試材料

        以阿克蘇的‘紅富士’蘋果為實驗對象,在實驗中所使用的蘋果均產自紅旗坡農場,挑選的蘋果表面沒有缺陷、直徑范圍為65~85 mm、大小均勻,去除表面的污垢,放置在冰箱內保存,溫度控制在4℃,實驗前分批拿出,待其恢復到室溫(20~25℃)環(huán)境后開始實驗。

        實驗中所用的高光譜系統為北京卓立漢光公司的Hyperspectral Sorting System推掃式高光譜分選系統,光譜測定的范圍為900~1700 nm(實際可測量到1750 nm),采用鹵鎢燈為光源,光譜分辨率5 nm,光譜采樣點4 nm,對樣品進行掃描,獲取影像和光譜信息,通過自帶的ENVI 4.7軟件獲取每個樣品的光譜值,導出為Excel文件。

        1.2 實驗方法

        1.2.1 可溶性固形物含量的檢測

        選用糖度鹽度兩用儀(MASTER-BX/S28M),對采集過高光譜圖像的蘋果部位挖取適量果肉,深度為皮下0.5 cm左右,壓榨出汁水,對可溶性固形物含量進行測量,測量3次取平均值,以此來作為蘋果可溶性固形物含量的標準值。

        1.2.2 建模方法

        PLS算法的建模思想主要是從自變量和因變量矩陣中提取第一主成分,并求得協方差,再提取第二主成分,求得協方差,依次類推,最后根據交叉驗證的結果,建立最終的偏最小二乘定量回歸預測分析模型。它集多元線性回歸分析、典型相關分析和主成分分析的基本功能為一體,特別適合變量之間有多重共線性的場合[19]。

        1.2.3 特征變量選擇方法

        iPLS是將數據集均分成同等寬度的小區(qū)間,建立每個子區(qū)間的PLS模型,再根據各個模型的交叉驗證結果優(yōu)選出最佳的光譜波段[19]。與全光譜變量建模相比,可以減少建模所用變量,但是由于只選一個區(qū)間建模,有可能會丟掉其他區(qū)間的有效信息。

        BiPLS是在iPLS的基礎上進行多次計算,并依次減少交叉驗證表現最差的區(qū)間,直到剩下一個數據區(qū)間,進而得出交叉驗證結果最小,即預測效果最好的波段集合[20]。可以克服單一區(qū)間建模的缺點,選取更多區(qū)間的有效信息。

        SPA通過計算光譜矩陣中某一波長對其他波長的投影,在該波長序列中選取投影量最大的波長作為下一個波長,序列中的每個波長都與前一個波長相關性最小,能最大程度消除共線性對模型的干擾,降低建模過程的復雜度[20]。該算法簡要步驟如下:

        記初始迭代向量為xk(0),需要提取的變量個數為N,光譜矩陣為J列。

        1)任選光譜矩陣的1列(第j列),把建模集的第j列賦值給xj,記為xk(0)。

        2)將未選入的列向量位置的集記為s,即:

        3)分別計算xj對剩余列向量的投影:

        4)提取最大投影向量的光譜波長:

        6)n=n+1,若n<N,則按步驟1)~6)循環(huán)計算。

        1.2.4 模型驗證

        將數據分為訓練集和測試集,依靠訓練集建立模型,測試集將通過已經建立好的模型進行驗證,以測試集的均方根誤差、相關系數作為標準來評判模型的優(yōu)劣,均方根誤差越小,相關系數越大,模型的預測效果越好。其計算公式為:

        式(1)、式(2)中,RMSE:均方根誤差;r:相關系數;n:樣本個數;yi:第i個樣本的觀測值第i個樣本的預測值(i=1,2,3,…,n);yˉ:觀測值的平均值。

        2 結果與分析

        采集的‘紅富士’蘋果高光譜數據中,剔除異常值后,共得到160個樣本,其原始光譜曲線如圖1所示。近紅外光主要是對含氫基團X—H(X為C、N、O)振動的倍頻和合頻吸收,其中包含了大多數類型有機化合物的組成和分子結構的信息。選用連續(xù)改變頻率的近紅外光照射某樣品時,由于試樣對不同頻率近紅外光的選擇性吸收,通過試樣后的近紅外光線在某些波長范圍內會變弱,透射出來的紅外光線就攜帶有機物組分和結構的信息。由圖1分析可知,950 nm波段附近處有一個明顯的峰,這是O—H基團的3倍頻吸收帶,1060 nm波段處的峰是N—H基團的3倍頻帶,1180 nm處的波谷位于C—H的3倍頻帶,1440 nm處的波谷是H2O的2倍頻吸收帶等,這些化學鍵又是組成水分、可溶性糖等物質的基礎形式,如果樣品的組成相同,則其光譜也相同,反之亦然。因此,近紅外光譜分析法是一種間接的分析技術,如果建立了光譜與可溶性固形物含量的對應關系,那么只要測得樣品的光譜,就能很快預測其可溶性固形物含量。

        圖1 原始光譜圖

        從圖1可以看出,光譜曲線比較分散,采用多元散射校正(multivariate scatter correction,MSC)對光譜數據進行預處理,預處理之后的光譜曲線如圖2所示,分析可知,預處理之后,光譜的重合度變高,減弱了散射對原始光譜的影響。

        圖2 預處理之后的光譜圖

        采用Kennard-Stone算法將數據集以3∶1的比例劃分為訓練集和測試集,訓練集和測試集的劃分結果如表1所示。測試集的數據都落在訓練集數據范圍之內,說明數據的劃分是合理的。

        表1 訓練集和測試集中的可溶性固形物含量

        2.1 PLS模型

        在PLS建模過程中,潛變量數目(LV)的選擇尤其重要,若LV過小,會導致光譜中較多信息的丟失,造成欠擬合;若LV過大,造成過擬合,影響模型的泛化能力。本研究以交叉驗證的均方根誤差最小來確定模型的最佳潛變量個數。采用全光譜波段建模,交叉驗證的均方根誤差和潛變量的關系如圖3所示,分析可知,交叉驗證均方根誤差(RMSECV)的值隨著LV的增加而減小,當LV增加到4時,RMSECV值基本趨于平緩,以后再增加LV值,RMSECV并無明顯增加的趨勢,為避免出現過擬合,因此LV可以取4。選擇潛變量個數為4,建立蘋果中可溶性固形物含量的全光譜PLS模型。訓練集和測試集的建模結果如圖4所示,訓練集的r=0.8304,RMSE=1.1177,測試集的r=0.7694,RMSE=1.3483。

        圖3 不同潛變量數對應的交叉驗證均方根誤差

        圖4 PLS模型的預測結果

        2.2 iPLS模型

        由于光譜能夠體現物質所含成分及含量,但同時包含大量的冗余信息,因此,需要提取特征波長。利用iPLS方法,將全光譜波段依次按10~25個區(qū)間進行等分(若不能等分,則最多相差一個波段),并在每一個區(qū)間建立PLS回歸模型。將每次等分獲得的最小RMSECV作為衡量標準,來確定建模的光譜子區(qū)間。結果如表2所示,在區(qū)間劃分過程中,當劃分為20個小區(qū)間時,對應的第2個子區(qū)間的RMSECV最小,故選擇第2個子區(qū)間的光譜波段作為iPLS模型的輸入自變量。

        表2 不同區(qū)間個數的iPLS模型的RMSECV

        建立可溶性固形物含量的iPLS模型,模型的預測結果如圖5所示,訓練集的預測結果r=0.8478,RMSE=1.0640,測試集的預測結果r=0.8189,RMSE=1.5053。

        圖5 iPLS模型的預測結果

        2.3 BiPLS模型

        雖然iPLS模型對數據進行了篩選,但是由于只取了一個子區(qū)間,忽略了多區(qū)間建模效果更優(yōu)的可能性,所以可能會丟掉一些其他區(qū)間的有效信息,因此,采用BiPLS模型選取子區(qū)間的組合來建模。

        由于在采用BiPLS模型選取子區(qū)間時,間隔大小能夠影響波長范圍的選取,間隔過小,會使得到的結果太過復雜,間隔過大,會喪失一部分有用信息。由于從理論上無法確定最佳的間隔數,所以嘗試采用10~25個間隔數,將全光譜分成等寬度的子區(qū)間(若不能等分,則最多相差一個光譜波段),并挑選出RMSECV值最小的子區(qū)間組合作為建模的光譜區(qū)間,表3為不同間隔數的BiPLS模型選取的結果。由表3分析可知,以均方根誤差最小為標準,當劃分為14個小區(qū)間,并選取其中的3個小子區(qū)間組合時,所建模型的RMSECV值最小。這3個子區(qū)間分別為第9、11、12子區(qū)間,選取在這3個子區(qū)間上的54個波長變量建模。

        表3 不同間隔數下BiPLS模型的RMSECV

        BiPLS訓練集和測試集的預測結果如下圖6所示,訓練集的預測結果r=0.9167,RMSE=0.8015,測試集的預測結果r=0.8978,RMSE=1.0119。相比較于PLS和iPLS模型,BiPLS模型的預測性能明顯提升。

        圖6 BiPLS模型的預測結果

        2.4 SPA-PLS模型

        若對全光譜波段直接采用SPA算法提取特征波長變量,以均方根誤差最小來確定最終選取的變量,指定波長變量數為2~20。選取過程如圖7所示,分析可知,隨著所選變量個數的增加,均方根誤差呈現先減少后增加的趨勢,當所選變量個數為8時,均方根誤差最小為1.0648。因此,最終選取8個波段變量,波長分別為917.29 nm、939.16 nm、961.12 nm、1110.91 nm、1334.81 nm、1697.27 nm、1732.84 nm、1743.55 nm,即為圖8中小方框所對應的橫坐標。

        圖7 SPA選取變量

        圖8 SPA選取的變量

        以此8個波長變量作為輸入自變量,建立PLS模型,訓練集和預測集的預測效果如圖9所示,訓練集的預測結果顯示r=0.7556,RMSE=1.3141,測試集的預測結果顯示r=0.6753,RMSE=1.5490。

        圖9 SPA-PLS模型的預測結果

        2.5 SPA-iPLS模型

        iPLS模型將全光譜區(qū)間劃分為20個小區(qū)間,對應的第2個子區(qū)間建模輸入自變量,但是沒有考慮輸入變量之間的共線性。對第2個小子區(qū)間采用SPA算法提取特征波長變量,以均方根誤差最小來確定最終選取的變量。最終選取3個波段變量,波長分別為951.7 nm、964.27 nm、976.86 nm,以此3個波長變量作為輸入自變量,建立PLS模型,訓練集和預測集的預測效果如圖10所示,訓練集的預測結果顯示r=0.7561,RMSE=2.4159,測試集的預測結果顯示r=0.7248,RMSE=1.8354。

        2.6 SPA-BiPLS模型

        BiPLS模型選取子區(qū)間的組合作為建模輸入自變量,但是沒有考慮輸入變量之間的共線性。為提高模型的穩(wěn)健性,避免共線性的影響,對BiPLS選出的變量采用SPA算法提取特征變量,指定波長變量數為2~10,采用均方根誤差最小來確定最終變量個數,變量選取過程和結果如圖11所示,分析可知,剛開始,隨著所選變量個數的增加,均方根誤差呈現遞減的趨勢,當選取變量個數為6時,均方根誤差為0.4652,之后隨著所選變量個數的增加,均方根誤差并無明顯減少的趨勢,因此,選取6個波長變量參與建模,對應的波長分別為:1381.97 nm、1402.29 nm、1522.14 nm、1556.80 nm、1584.66 nm、1626.66 nm。以這6個波長變量為輸入自變量來建立模型,訓練集和測試集的預測結果如圖12所示,訓練集的預測結果顯示r=0.8919,RMSE=0.9073,測試集的預測結果顯示r=0.8981,RMSE=0.9371。與BiPLS模型相比,參與建模的變量個數從54個減少到6個,提高了運行效率。

        圖12 SPA-BiPLS模型的預測結果

        所建立的6種模型的總結果如表4所示。

        表4 模型對比

        由表4可知,分別采用整個的波長區(qū)間、一個子區(qū)間、組合的子區(qū)間所建立的PLS、iPLS、BiPLS模型,選取的變量個數在13~254之間,預測效果最好的是BiPLS模型。分別對這3種區(qū)間采用SPA算法選取特征變量,所選取的變量個數在3~8之間,建模變量個數的減少有益于提高運行效率,但是所建立的SPA-PLS、SPA-iPLS模型預測精度降低了,僅有SPABiPLS模型預測精度稍有提高。

        3 討論與結論

        全光譜波段建立PLS模型,254個變量參與建模,由于摻雜了過多的干擾信息,導致模型的泛化能力較差。iPLS模型中,當區(qū)間劃分為20個小區(qū)間,以第2個子區(qū)間的波長變量參與建模時,雖然訓練集表現優(yōu)于PLS,但是測試集的RMSE卻變大了,這是由于iPLS模型剔除了部分有用信息,造成模型的欠擬合。BiPLS模型在iPLS的基礎上選取了更多的子區(qū)間來建模,訓練集和測試集的預測效果優(yōu)于PLS和iPLS模型。對全光譜波段,采用SPA算法,去除了共線性的影響,但是有效變量之間的距離不一定最大,因此,篩選出的變量子集中可能包含一些無用信息,甚至是干擾信息,降低模型的泛化能力。由于iPLS模型剔除了部分有用信息,故SPA-iPLS模型欠擬合。在BiPLS模型所選組合的光譜子區(qū)間的基礎上,采用SPA算法,選取6個特征波段變量,建立SPA-BiPLS模型,去除了共線性的影響,提高了運行效率。

        采用GUO Z M等[13]的CARS方法提取12個特征變量建模,訓練集的預測結果顯示r=0.9332,RMSE=0.7210,測試集的預測結果顯示r=0.8932,RMSE=1.0158。采用WU Y等[14]的PCA方法提取5個主成分建立模型,訓練集的預測結果顯示r=0.4371,RMSE=2.5560,測試集的預測結果顯示r=0.2166,RMSE=2.3483。采 用 ZHANG D Y 等[15]的 CARS-SPA方法提取7個特征變量建模,訓練集的預測結果顯示r=0.8957,RMSE=0.7954,測試集的預測結果顯示r=0.8608,RMSE=1.2404。采用饒利波等[19]的CARS-BiPLS方法提取13個特征變量建模,訓練集的預測結果顯示r=0.9360,RMSE=0.4985,測試集的預測結果顯示r=0.8750,RMSE=1.0511。效果均不及SPA-BiPLS模型的,這是因為PCA方法只是對自變量做了重新組合,并沒有考慮因變量的影響,因此,建模的精度最低。CARS、CARS-BiPLS方法無法克服變量之間共線性的影響,這都將會影響模型的泛化能力。CARS-SPA雖然去除了共線性的影響,但也剔除了部分有用信息,導致欠擬合。

        總之,采用BiPLS算法選出組合的光譜子區(qū)間,保留了更多的光譜信息,在此基礎上與SPA相結合,一定程度上實現了算法之間的優(yōu)勢互補,提高模型的預測效果。

        猜你喜歡
        方根波長可溶性
        方根拓展探究
        HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
        特產研究(2022年6期)2023-01-17 05:06:16
        鮮地龍可溶性蛋白不同提取方法的比較
        中成藥(2018年8期)2018-08-29 01:28:34
        雙波長激光治療慢性牙周炎的療效觀察
        均方根嵌入式容積粒子PHD 多目標跟蹤方法
        自動化學報(2017年2期)2017-04-04 05:14:28
        揭開心算方根之謎
        日本研發(fā)出可完全覆蓋可見光波長的LED光源
        中國照明(2016年4期)2016-05-17 06:16:15
        可溶性Jagged1對大鼠靜脈橋狹窄的抑制作用
        可溶性ST2及NT-proBNP在心力衰竭中的變化和臨床意義
        便攜式多用途光波波長測量儀
        物理實驗(2015年9期)2015-02-28 17:36:46
        极品粉嫩嫩模大尺度无码视频| 特级毛片a级毛片100免费播放| 久久久亚洲精品无码| 精品国产一区二区三区av片 | 少妇夜夜春夜夜爽试看视频| av香港经典三级级 在线| 国产精品亚洲午夜不卡| 亚洲免费av第一区第二区| 国产91精品高潮白浆喷水 | 爽爽午夜影视窝窝看片| 人妻无码人妻有码不卡| 日本中文字幕一区二区在线观看| 一区二区三区国产内射| 亚洲 中文 欧美 日韩 在线| 国产AV无码专区亚洲AⅤ| 米奇亚洲国产精品思久久| 国产三级黄色大片在线免费看| 狠狠躁天天躁中文字幕| 亚洲综合色一区二区三区另类| 色青青女同性恋视频日本熟女 | 精品深夜av无码一区二区| 无码久久流水呻吟| 饥渴少妇一区二区三区| 北条麻妃在线中文字幕| 女的扒开尿口让男人桶30分钟| 亚洲成av人最新无码| 日韩av在线不卡观看| 人妻少妇被猛烈进入中文字幕 | 国产精品高清网站| 免费无码毛片一区二区三区a片| 国内精品福利在线视频| 白白色最新福利视频二| 狠狠人妻久久久久久综合蜜桃| 亚洲91av| 无码成人AV在线一区二区 | 国产精品久久久久久av| 骚片av蜜桃精品一区| 久久无码一一区| 亚洲综合精品一区二区 | 亚洲女人的天堂网av| 精品无码久久久久久国产|