喬正明 詹 成
(1. 常州紡織服裝職業(yè)技術學院,江蘇 常州 213164;2. 蘇州科技大學,江蘇 蘇州 215000)
隨著近紅外光譜技術與化學計量方法的快速發(fā)展,近紅外光譜技術被廣泛地應用于農產品品質分析領域[1]。蘋果糖度是蘋果質量的重要評價指標,運用預測相關系數(shù)(correlation of prediction,CP)Rp預測均方根誤差(root mean square error of prediction,RMSEP)σp作為蘋果糖度預測結果的性能評價指標,很多學者利用近紅外光譜技術進行了蘋果糖度預測研究。趙杰文等[2]提出運用傅里葉變換近紅外光譜儀采集蘋果光譜,建立了基于偏最小二乘(partial least squares,PLS)的蘋果糖度預測模型,其中Rp和σp分別為0.938 7和0.505 4。Zhang等[3]運用Nexus FT-IR光譜儀為蘋果光譜采集儀器,建立了基于PLS的蘋果糖度預測模型,Rp和σp分別為0.906和0.272,該方法主要用于測試套袋評估的精度,且要求蘋果顏色均勻,因此整體預測精度不高。劉燕德等[4]運用Antaris FT-IR光譜儀采集蘋果光譜,建立了基于遺傳—偏最小二乘的蘋果糖度預測模型,Rp和σp分別為0.954和0.797,該方法可以有效解決蘋果顏色對于預測精度的影響,但是光譜冗余信息造成的誤差過大。夏阿林等[5]建立了基于遺傳—區(qū)間偏最小二乘的蘋果糖度預測模型,運用Nexus 670 FT-IR光譜儀采集蘋果光譜,Rp和σp分別為0.932和0.384,該方法雖然對比以往研究整體的預測精度有大幅提升,且算法的執(zhí)行效率較高,但對于光譜冗余信息的處理仍然是個難題,整體收斂性差,復雜度較高。
為了進一步改善蘋果糖度預測模型的精度,研究擬提出一種基于小波包變換的特征波長篩選和樽海鞘算法(salp swarm algorithm,SSA)改進極限學習機(extreme learning machine,ELM)的蘋果糖度預測模型,以期為蘋果糖度預測提供新的方法。
試驗儀器采用美國Thermo Fisher公司的型號為Antaris II的近紅外檢測儀。該儀器集成了透射、反射、漫透射以及漫反射等不同檢測模塊,采用了Nicolet專利的高光通量、高速動態(tài)準直電磁式干涉儀,可以實現(xiàn)不同狀態(tài)下的樣品高效的、精準的檢測與分析。
基于近紅外光譜的SSA-ELM的蘋果糖度預測模型的建模思路如圖1所示。
圖1 蘋果糖度預測建模流程Figure 1 Apple sugar content predictive modelingprocess
2.2.1 種群初始化 在標準SSA算法中,樽海鞘算法的種群規(guī)模為N,搜索空間維數(shù)為D,樽海鞘的位置為X=[Xn1,Xn2,…,XnD]T,n=1,2,…,N,食物位置為F=[F1,F2,…,FD]T,搜索空間上限為ub=[ub1,ub2,…,ubD]T、搜索空間下限為lb=[lb1,lb2,…,lbD]T,樽海鞘算法的種群隨機初始化公式為[6]:
XN×D=R(N,D)×(ub-lb)+lb,
(1)
式中:
XN×D——樽海鞘位置向量(向量維數(shù)為N×D);
R(N,D)——N×D維的隨機向量。
2.2.2 更新領導者位置 在標準SSA算法中,領導者引領整個樽海鞘群體的移動,用來搜索食物,這一操作的主要目的是使得領導者位置更新方式具有很強的隨機性,領導者更新策略按式(2)計算:
(2)
式中:
ubd,lbd——引領者個體在d維上的搜索上限和搜索下限;
c1、c2——隨機數(shù),處于[0,1];
c3——搜索平衡因子(主要用于平衡全局搜索和局部搜索能力,增強引領者的隨機性和多樣性)。
收斂因子按式(3)計算:
c1=2e(-4t/T)2,
(3)
式中:
c1——收斂因子;
t——樽海鞘算法的當前迭代次數(shù);
T——樽海鞘算法的最大迭代次數(shù)。
2.2.3 更新追隨者位置 根據(jù)文獻[7]可知,初始位置、速度和加速度直接關系到追隨者的位置,跟隨者根據(jù)牛頓運動方程更新位置:
(4)
(5)
(6)
式中:
a——加速度;
v0——初始速度;
ta——迭代步長;
R——運動距離;
2.3.1 極限學習機 與傳統(tǒng)的神經網絡相比,ELM模型結構如圖2所示[8]。
圖2 ELM模型結構示意圖Figure 2 ELM model structure diagram
對于N個訓練樣本(Xi,Ti),ELM模型的輸入向量Xi=[xi1,xi2,…,xin]T∈Rn,ELM模型的目標向量Ti=[ti1,ti2,…,tin]T∈Rm,X為n×Q的矩陣,T為m×Q的
矩陣,Q為訓練樣本數(shù)量。因此,L個隱含層神經元的ELM模型輸出為[9]:
(7)
式中:
Wi——ELM模型的輸入權重,Wi=[wi1,wi2,…,win]T;
Wi·Xj——Wi和Xj的內積;
βi——ELM模型的輸出權重;
g(x)——激勵函數(shù);
bi——ELM模型的第i個隱含層神經元的偏置。
ELM模型訓練目的就是使式(8)的誤差最小[10]。
(8)
由式(7)和式(8)可知,存在一組參數(shù)βi、Wi和bi使得式(9)成立。
(9)
式(9)的矩陣形式為[11]:
Hβ=T,
(10)
式中:
H——ELM模型的隱含層神經元的輸出;
β——ELM模型的輸出權重矩陣。
例2Alice在社交應用上發(fā)布了一條消息,消息中有“教師”這個詞匯,她的朋友Bob(在Alice的社交應用中屬于“朋友”這一訪問者類型)要訪問這條消息。首先,社交應用中的訪問控制模塊會對Bob的請求進行攔截,然后檢查分配給“朋友”這一訪問者類型的隱私規(guī)則,以確定Bob的訪問水平(教育工作者),然后調出含有“教育工作者”的這一支(圖3),“教師”節(jié)點在“教育工作者”節(jié)點下面,最終,訪問控制模塊將消息中的“教師”替換成“教育工作者”(Bob的訪問水平)發(fā)送給Bob。
(11)
(12)
2.3.2 適應度函數(shù) ELM模型的性能直接取決于初始輸入權值Wi和隱含層偏置bi的選擇。為提高ELM模型的性能,運用SSA算法優(yōu)化選擇ELM模型的初始輸入權值Wi和隱含層偏置bi,將均方差作為適應度函數(shù),即當均方差誤差最小時,所對應的初始輸入權值Wi和隱含層偏置bi作為ELM模型的最優(yōu)參數(shù):
(13)
式中:
n——訓練樣本數(shù)量;
x(i)和xp(i)——第i個樣本的實際值和預測值;
[Wimin,Wimax]與[bimin,bimax]——ELM模型第i個初始輸出權值W和第i個隱含層偏置b的上下限值,且W∈[-1,1]和b∈[-1,1]。
2.3.3 算法步驟
Step1:讀取蘋果光譜數(shù)據(jù)和含量數(shù)據(jù),預處理并進行特征波長篩選,將數(shù)據(jù)劃分為訓練集和測試集,并進行歸一化處理;
Step3:計算適應度。針對訓練集,將訓練集代入ELM模型,按適應度函數(shù)式(12)計算每個樽海鞘個體的適應度;
Step4:選定領導者、追隨者和食物。計算適應度大小,將適應度最優(yōu)的樽海鞘位置設定為當前食物位置;剩下的N-1個樽海鞘,將排在前一半的樽海鞘作為領導者,剩下的作為追隨者;
Step5:更新領導者位置和追隨者位置;
Step6:計算更新之后的樽海鞘個體適應度fs。比較fs與當前食物的適應度ffood,如果fs>ffood,則將fs所對應的樽海鞘位置作為新的食物位置;
Step7:重復Step3~Step6,如果t>T,輸出最優(yōu)食物位置,最優(yōu)食物位置所對應的結果即為ELM模型的最優(yōu)初始輸入權值和隱含層偏置。將最優(yōu)初始權值和隱含層偏置代入ELM模型進行蘋果糖度預測?;诩t外光譜的SSA-ELM的蘋果糖度預測流程如圖3所示。
圖3 基于紅外光譜的SSA-ELM的蘋果糖度預測流程Figure 3 SSA-ELM apple sugar content predictionprocess based on infrared spectroscopy
光譜的預處理方法有:一階導數(shù)算法(FD)預處理、二階導數(shù)算法(SD)預處理、標準正態(tài)變量變換算法預處理(SNV)和多元散射校正(MSC)預處理[12-13],不同預處理結果如表1所示。蘋果原始光譜圖像如圖4所示。由表1可知,多元散射校正(MSC)處理結果最好。其預處理結果如圖5所示。
圖4 蘋果原始光譜Figure 4 Apple’s original spectrum
圖5 MSC預處理結果Figure 5 MSC preprocessing result graph
表1 不同預處理建模效果對比Table 1 Comparison of different preprocessing modeling effects
選擇均方根誤差(ERMSE)和相關系數(shù)C2評價蘋果糖度預測模型的性能[14-15]:
(14)
(15)
式中:
xk——第k個樣本的蘋果糖度實際值;
pk——第k個樣本的蘋果糖度預測值;
n——樣本數(shù)量;
ERMSE——均方根誤差;
C2——相關系數(shù)。
由于蘋果光譜數(shù)據(jù)具有維度高而復雜的特點,蘋果糖度預測模型建立之前先對光譜數(shù)據(jù)進行降維處理,文中分別對比全波段和偏最小二乘法、連續(xù)投影法和小波包變換等篩選特征波長的結果,最終確定蘋果光譜特征波長篩選方法。特征波長篩選后建模效果對比如表2和圖6所示。
表2 特征波長篩選后建模效果對比
由表2和圖6可知,基于小波包變換特征波長篩選之后的建模效果最好,相關系數(shù)和均方根誤差分別為0.924 2和0.672 6,優(yōu)于全波段和偏最小二乘法、連續(xù)投影法的建模效果。因此選擇小波包變換特征波長篩選法進行蘋果光譜特征波長篩選。
圖6 特征波長篩選后建模效果Figure 6 Modeling effect diagram after characteristic wavelength selecting
為驗證SSA-ELM進行蘋果糖度預測的有效性和可靠性,將SSA-ELM與GA-ELM、PSO-ELM和ELM進行比較,參數(shù)設定:① SSA算法:樽海鞘種群規(guī)模N=10,最大迭代次數(shù)T=100;② 遺傳算法[16](genetic algorithm,GA)算法:最大迭代次數(shù)T=100,種群規(guī)模N=10,變異概率pm=0.1,交叉概率pc=0.7;③ 粒子群算法[17](particle swarm optimization algorithm,PSO):學習因子c1=c2=2,最大迭代次數(shù)T=100,種群規(guī)模N=10,慣性權重w=0.8;④ ELM模型[18-19]:輸入層神經元數(shù)量N1=2 740、隱含層神經元數(shù)量N2=10以及輸出層神經元數(shù)量為N3=1,一共采集到光譜數(shù)據(jù)34組,將前25組作為訓練集,剩下9組作為測試集,蘋果糖度預測結果如圖7和表3所示。
圖7 蘋果糖度預測對比Figure 7 Apple sugar content predictioncomparison chart
表3 蘋果糖度預測結果對比Table 3 Comparison of apple sugar content prediction results
對比圖7與表3可知:① 在訓練集和測試集上,SSA-ELM模型的蘋果糖度預測結果優(yōu)于GA-ELM、PSO-ELM和ELM模型的蘋果糖度預測結果,SSA-ELM模型的蘋果糖度預測評價指標RMSE最小且相關系數(shù)R2最大,由此證明SSA-ELM模型的蘋果糖度預測值和蘋果糖度實際值關聯(lián)程度最高,蘋果糖度預測效果最好;② 通過SSA、GA和PSO等算法對ELM模型的初始輸入權值和隱含層偏置的優(yōu)化選擇,SSA-ELM、GA-ELM和PSO-ELM模型的蘋果糖度預測精度優(yōu)于ELM模型,說明通過智能算法優(yōu)化ELM模型的參數(shù)可以有效提高ELM模型的蘋果糖度預測精度。
為提高蘋果糖度預測的精度,提出了一種基于紅外光譜的樽海鞘算法改進極限學習機的蘋果糖度預測算法。針對極限學習機模型預測性能受其初始權值和閾值的影響,運用樽海鞘算法對極限學習機模型的初始權值和閾值進行優(yōu)化選擇。將蘋果的紅外光譜吸光度作為極限學習機的輸入,蘋果糖度作為極限學習機的輸出,建立紅外光譜的蘋果糖度預測模型,其對蘋果糖度預測的精度高于遺傳算法改進極限學習機、粒子群算法改進極限學習機和極限學習機。通過智能算法優(yōu)化極限學習機模型的參數(shù)可以有效提高極限學習機模型的蘋果糖度預測精度。