梁振偉,李耀明,周 全,馬 征,魏純才,王建鵬
(江蘇大學(xué) 現(xiàn)代農(nóng)業(yè)裝備與技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 鎮(zhèn)江 212013)
收獲機(jī)械的清選性能評(píng)價(jià)是多目標(biāo)、多層次、多因素的,評(píng)價(jià)關(guān)系是模糊非線性的,至今沒(méi)有一種統(tǒng)一的確定預(yù)測(cè)模型。以往建立的關(guān)于清選預(yù)測(cè)模型主要運(yùn)用回歸分析法[1]及人工神經(jīng)網(wǎng)絡(luò)法[2]等,都是基于傳統(tǒng)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則(ERM),對(duì)于大樣本能給出較好的結(jié)果;但傳統(tǒng)的試驗(yàn)研究需要耗費(fèi)相當(dāng)多的人力物力,同時(shí)在具有小樣本的清選性能預(yù)測(cè)中,ERM原則并不能保證期望預(yù)測(cè)風(fēng)險(xiǎn)最小化。為此,擬借助在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展的分支支持向量機(jī)(Support Vector Machine,SVM)建立精度高、泛化能力強(qiáng)、隨機(jī)波動(dòng)性小的清選性能預(yù)測(cè)模型。
支持向量機(jī)方法屬于機(jī)器學(xué)習(xí)理論發(fā)展的最新階段,首先是著眼于解決分類(模式識(shí)別)問(wèn)題,通過(guò)引入不敏感損失函數(shù)ε的概念,也可以解決線性與非線性函數(shù)的回歸問(wèn)題[3]。SVM的核心是基于VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原則,優(yōu)點(diǎn)是可專門針對(duì)有限樣本,其目標(biāo)是得到現(xiàn)有信息下的最優(yōu)解,算法最終轉(zhuǎn)化為一個(gè)對(duì)偶尋優(yōu)問(wèn)題,得到的將是全局最優(yōu)解。它避免了人工神經(jīng)網(wǎng)絡(luò)等方法的網(wǎng)絡(luò)樣本需求大、結(jié)構(gòu)選擇、過(guò)學(xué)習(xí)和欠學(xué)習(xí)、局部極小等問(wèn)題。
以油菜聯(lián)合收獲機(jī)的清選裝置為研究對(duì)象,運(yùn)用支持向量模型,描述其清選性能輸出與多個(gè)清選參數(shù)輸入之間的關(guān)系,具有算法復(fù)雜度與樣本維數(shù)無(wú)關(guān)等優(yōu)點(diǎn)[4]。因此,探討將支持向量機(jī)理論引入清選裝置的清選性能研究中具有重要意義。
支持向量機(jī)訓(xùn)練的實(shí)質(zhì)為求解一個(gè)帶有界約束和線性等式約束的凸二次規(guī)劃問(wèn)題。首先,通過(guò)非線性變換將輸入空間變換到一個(gè)高維空間,甚至是一個(gè)無(wú)限維空間;然后,在這個(gè)高維空間求解。其中,非線性變換是通過(guò)核函數(shù)K的方法來(lái)實(shí)現(xiàn)的。選取SVM模型ε-Support Vector Regression (ε-SVR),給出一系列樣本數(shù)據(jù)點(diǎn),即{(x1,z1),…,(xi,zi)}。其中,xi∈Rn為n維的輸入向量,而zi∈R1為輸出向量。標(biāo)準(zhǔn)的支持向量機(jī)的回歸模型由Vapnik于1995年提出[5],即
其中
Qij=K(xi,xj)≡φ(xi)Τφ(xj)
式中ω—函數(shù)系數(shù);
C—懲罰參數(shù);
ε—不敏感損失函數(shù);
該模型等價(jià)于
近似的回歸模型可以表示為
2.1試驗(yàn)裝置
油菜脫出物清選試驗(yàn)是在DF-1.5型物料清選仿真與控制裝置上進(jìn)行的,試驗(yàn)裝置的結(jié)構(gòu)簡(jiǎn)圖如圖1所示。
清選裝置采用風(fēng)篩式的結(jié)構(gòu),主要由離心風(fēng)機(jī)、振動(dòng)篩、機(jī)架、傳動(dòng)系統(tǒng)和傳感器等組成。離心風(fēng)機(jī)、振動(dòng)篩分別由調(diào)速電機(jī)驅(qū)動(dòng),轉(zhuǎn)速可以無(wú)級(jí)調(diào)節(jié)。試驗(yàn)臺(tái)由曲柄連桿機(jī)構(gòu)帶動(dòng)篩箱運(yùn)動(dòng),曲柄為偏心輪型,通過(guò)曲柄半徑的調(diào)節(jié)來(lái)實(shí)現(xiàn)篩箱振幅的變化。
2.2試驗(yàn)材料
清選試驗(yàn)使用的物料是油菜脫出混合物,主要成分為果莢殼、籽粒、短莖稈及輕雜質(zhì)。為盡可能接近田間收獲狀態(tài),所用物料都是剛從田間收割后經(jīng)脫粒的脫出物,各成分所占比例為:果莢殼50%~53%,籽粒32%~34%,短莖稈8%~10%,輕雜質(zhì)6%~8%。
2.3試驗(yàn)方案與結(jié)果
通過(guò)對(duì)風(fēng)篩式清選裝置清選機(jī)構(gòu)及試驗(yàn)條件的分析,選擇曲柄半徑、曲柄轉(zhuǎn)速、風(fēng)機(jī)轉(zhuǎn)速、出風(fēng)口傾角、篩孔直徑作為試驗(yàn)因素,分別用A、B、C、D、E表示。試驗(yàn)主要考察清選參數(shù)對(duì)清選效果H(包括清選含雜率F和清選損失率G)的影響,結(jié)合清選參數(shù)的最優(yōu)值,每個(gè)參數(shù)設(shè)定3個(gè)水平數(shù)值,按照正交表L27(313)開(kāi)展正交試驗(yàn),試驗(yàn)方案及結(jié)果如表1所示。
為了研究樣本容量大小對(duì)ε-SVR預(yù)測(cè)模型的影響并與BP模型進(jìn)行比較,試驗(yàn)次數(shù)較多。在保證模型有意義的前提下,并不需要測(cè)定27組,可適當(dāng)減小樣本容量。
1.抖動(dòng)板 2.罩殼3.振動(dòng)篩 4.后滑板 5.集糧箱 6.前滑板 7.離心風(fēng)機(jī)
序號(hào)因素A/mmB/r·min-1C/r·min-1D/(°)E/mm結(jié)果F/%G/%H/%1222608202062.24.483.1122222858602561.95.303.3603223109003061.457.533.8824262608603062.655.653.8145262859002061.754.852.9906263108202562.25.313.4507302609002562.56.644.1568302858203062.055.523.4389303108602061.67.063.78410222608202081.751.471.68311222858602581.752.341.986
續(xù)表1
3.1模型的建立
由表1可知:試驗(yàn)有2個(gè)因變量F和G。采用權(quán)重系數(shù)法可將兩個(gè)因變量轉(zhuǎn)化為單個(gè)因變量H=t1F+t2G。根據(jù)經(jīng)驗(yàn)以及經(jīng)濟(jì)效益,取權(quán)重系數(shù)t1=0.6,t2=0.4。在ε-SVR模型中,將總樣本分為訓(xùn)練樣本和測(cè)試樣本兩類。訓(xùn)練時(shí)以A、B、C、D、E作為輸入,期望輸出是對(duì)應(yīng)H值。
采用支持向量機(jī)建立預(yù)測(cè)模型必須先選擇合適的核函數(shù)。采用RBF(Radial Basic Function)核函數(shù)往往能夠得到較好的擬合結(jié)果,且收斂速度較快,核參數(shù)g主要影響樣本數(shù)據(jù)在高維特征空間中分布的復(fù)雜程度[6-7]。在訓(xùn)練數(shù)據(jù)前,先對(duì)原始樣本進(jìn)行數(shù)據(jù)規(guī)格化,并記錄在相應(yīng)的映射關(guān)系中,縮放范圍為[0,1];在訓(xùn)練完畢后,對(duì)需要預(yù)測(cè)的數(shù)據(jù)再進(jìn)行反歸一化??s放的目的主要是在核計(jì)算中,會(huì)用到內(nèi)積運(yùn)算或exp運(yùn)算,不平衡的數(shù)據(jù)可能造成計(jì)算困難。
3.2回歸預(yù)測(cè)ε-SVR參數(shù)ε、c、g的選擇
ε-SVR算法的參數(shù)是指在求解對(duì)偶問(wèn)題時(shí)需要預(yù)先設(shè)定的參數(shù),包括懲罰參數(shù)c、不敏感損失函數(shù)ε及核參數(shù)g。ε-SVR模型中的參數(shù)基于交叉驗(yàn)證(Cross Validation,CV)的意義下尋參,常見(jiàn)的CV的方法有Hold-Out Method、 LOO-CV和K-CV等。第1種方法將原始數(shù)據(jù)隨機(jī)分成兩組,不能交叉驗(yàn)證;第2種方法集合所有樣本用于訓(xùn)練模型,計(jì)算成本較高;第3種方法能避免“過(guò)學(xué)習(xí)”以及“欠學(xué)習(xí)”狀態(tài),K均分的組數(shù)一般大于等于2(標(biāo)準(zhǔn)K=10)。
采用CV方法進(jìn)行參數(shù)優(yōu)化的整體思路是:讓c和g在一定范圍內(nèi)取值,對(duì)于取定的參數(shù)值,將訓(xùn)練集作為原始數(shù)據(jù)集,利用K-CV方法得到此組c和g下訓(xùn)練集驗(yàn)證均方誤差MSE(Mean Squared Error),最終取使得訓(xùn)練集驗(yàn)證MSE低的一組c和g的取值作為最佳參數(shù)。
在CV意義下,用非啟發(fā)式的網(wǎng)格劃分(GridSearch Method)尋找最佳c和g值能搜索到全局最優(yōu)解;但在參數(shù)較多或取值范圍較大時(shí),采用GA或PSO等啟發(fā)式算法,CV意義下的MSE作為適應(yīng)度函數(shù)。啟發(fā)式算法不要求目標(biāo)函數(shù)的凸性和目標(biāo)的可微性,可以不必遍歷格內(nèi)的所有參數(shù)點(diǎn),也能找到全局最優(yōu)解。GA和PSO優(yōu)化和初始值選取有關(guān),每次優(yōu)化的數(shù)值是上下浮動(dòng)的,結(jié)果取其平均值。
不同模型清選性能比較如表2所示,清選性能預(yù)測(cè)對(duì)比如表3所示。表2和表3采用表1中1~25組的試驗(yàn)數(shù)據(jù)為訓(xùn)練集,其余26~27組為測(cè)試集,分別采用了BP神經(jīng)網(wǎng)絡(luò)、grid(cg)、ga(cg)和pso(cg)方法進(jìn)行清選性能預(yù)測(cè)模型對(duì)比。利用GridSearch方法時(shí),設(shè)定ε為定值,粗略估計(jì)c和g參數(shù)的范圍分別為2-20~220,粗略選擇的bestc=602 248.763 1,bestg=0.001 286,得到粗略選擇的等高線圖如圖2所示。
表2 不同模型清選性能比較
表3 清選性能預(yù)測(cè)結(jié)果對(duì)比
圖2 粗略選擇對(duì)應(yīng)的等高線圖
MSE取值范圍約為0.48~1e-007,1e-007對(duì)應(yīng)的c和g值較佳,可以縮小參數(shù)的選擇范圍。1e-007主要集中在兩個(gè)區(qū)域:c為2-2~210,g為22~210,c為2-2~210,g為2-5~23。其中,預(yù)測(cè)性能較好的為第1組,取其精細(xì)選擇的參數(shù)建立相應(yīng)的模型bestc=0.770 711,bestg=4,ε=0.01。
采用ga(cg)方法的參數(shù)為:bestc=1.842 2,bestg=546.867 9,ε=0.01;采用pso(cg)方法的參數(shù)為bestc=2.094 6,bestg=650.330 1,ε=0.01。其中,終止代數(shù)為200,種群數(shù)量為20。
3.3BP和ε-SVR對(duì)應(yīng)預(yù)測(cè)性能比較
BP神經(jīng)網(wǎng)絡(luò)主體模型采用多層前饋網(wǎng)絡(luò),其中隱藏層和輸出層的神經(jīng)元數(shù)分別取為8和1,隱藏層和輸出層的激發(fā)函數(shù)分別設(shè)為tansig、purelin,訓(xùn)練算法設(shè)為trainlm。
由表2可知:ga(cg)、pso(cg)訓(xùn)練集模型的均方誤差比BP模型降低了2個(gè)數(shù)量級(jí),比grid(cg)降低了接近2個(gè)數(shù)量級(jí)。與BP模型相比,ε-SVR模型的相關(guān)系數(shù)較高。其中,pso(cg)模型的相關(guān)系數(shù)最高,接近1。
表3給出了4種方法構(gòu)造測(cè)試集的預(yù)測(cè)結(jié)果,將實(shí)際得到的清選性能值與模型輸出值進(jìn)行對(duì)比,結(jié)果表明:ε-SVR預(yù)測(cè)性能優(yōu)于BP預(yù)測(cè)。其中,ga(cg)和pso(cg)方法預(yù)測(cè)值的相對(duì)誤差比BP預(yù)測(cè)低1個(gè)數(shù)量級(jí)。
3.4樣本容量對(duì)ga(cg)預(yù)測(cè)性能的影響
一般認(rèn)為,對(duì)于普通多元回歸,雖然在n≥k+1時(shí)就可以得到參數(shù)估計(jì)值(n為樣本容量,k為自變量的個(gè)數(shù)),但為了提高參數(shù)估計(jì)量的有效性,應(yīng)使n≥30或n≥2k(部分文獻(xiàn)要求n≥3k),因此將不滿足這3個(gè)條件的一組樣本界定為小樣本[8]。以上述ga(cg)方法為例,建立相應(yīng)的模型,選用RBF核函數(shù)來(lái)研究樣本容量大小對(duì)回歸預(yù)測(cè)精度的影響。圖3、圖4和圖5中選用第27組作為測(cè)試集,1-26組為訓(xùn)練集。樣本容量n依次取8,10,…,24,26。對(duì)應(yīng)的測(cè)試集的MSE值如圖3所示,不同樣本容量對(duì)應(yīng)的BP和ga(cg)訓(xùn)練模型MSE值如圖4所示,不同樣本容量大小對(duì)應(yīng)的BP和ga(cg)預(yù)測(cè)值如圖5所示。
圖3 不同樣本容量大小對(duì)應(yīng)的ga(cg)測(cè)試模型MSE值Fig.3 Test Set Regression MSE of samples in different by ga(cg)
圖4 不同樣本容量對(duì)應(yīng)的BP和ga(cg)訓(xùn)練模型MSE值Fig.4 Train Set Regression MSE of samples in different by ga(cg) and BP
圖5 不同樣本容量大小對(duì)應(yīng)的BP和ga(cg)預(yù)測(cè)值
由圖3可知:MSE值隨著樣本容量的增加而遞減并逐漸向0逼近;在控制MSE值時(shí),可根據(jù)實(shí)際適當(dāng)減少試驗(yàn)的次數(shù),在試驗(yàn)數(shù)據(jù)缺失較多時(shí)可采用ε-SVR的方法進(jìn)行回歸預(yù)測(cè)。
由圖4可知:不同樣本容量大小對(duì)應(yīng)ga(cg)方法訓(xùn)練集模型的MSE值均顯著低于BP模型,訓(xùn)練集模型對(duì)應(yīng)的MSE值能維持在10-5,BP訓(xùn)練集模型對(duì)應(yīng)的MSE值隨樣本容量的增加波動(dòng)較大。
由圖5可知:隨著樣本容量的增加,用ga(cg)方法得到的預(yù)測(cè)值能逐漸逼近真實(shí)值,且預(yù)測(cè)值較穩(wěn)定;用BP方法得到的預(yù)測(cè)值并不穩(wěn)定,且隨機(jī)性較強(qiáng)。
1)基于非啟發(fā)式GridSearch 方法尋求SVR模型最佳參數(shù)c和g時(shí),采用等高線圖的方式表達(dá),更具直觀性;啟發(fā)式GA和PSO尋優(yōu)預(yù)測(cè)精度更高,能有效避免憑經(jīng)驗(yàn)選取參數(shù)的隨機(jī)性和BP的結(jié)構(gòu)性選擇。
2)采用支持向量機(jī)能較好地描述多個(gè)參數(shù)對(duì)清選性能的影響,所得預(yù)測(cè)數(shù)值穩(wěn)定性更強(qiáng),預(yù)測(cè)精度更高,能適應(yīng)“小樣本、貧信息”的數(shù)據(jù)分析,具有良好的工程應(yīng)用價(jià)值。
參考文獻(xiàn):
[1]夏利利,李耀明,徐立章.二次響應(yīng)曲面模型在聯(lián)合收割機(jī)清選氣流場(chǎng)預(yù)測(cè)中的應(yīng)用[J].農(nóng)機(jī)化研究,2009,31(2) :125-127.
[2]李耀明,林恒善,陳進(jìn),等.基于神經(jīng)網(wǎng)絡(luò)的風(fēng)篩式清選氣流場(chǎng)研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2006,37(7) :197-198.
[3]Gunn S R. Support vector machine for classification and regression[R]. Southampton, UK:ISIS-1-18, University of Southampton,1998.
[4]陳永義,俞小鼎,高學(xué)浩,等.處理非線性分類和回歸問(wèn)題的一種新方法(I)—支持向量機(jī)簡(jiǎn)介[J].應(yīng)用氣象學(xué)報(bào),2004,15(3):345-354.
[5]Vapnik V N. The nature of statistical learning theory[M]. New York: Springer-Verlag,1995.
[6]張曉東,毛罕平,陳秀花.基于PCA-SVR的油菜氮素光譜特征定量分析模型[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(4):161-165.
[7]李盼池,許少華.支持向量機(jī)在模式識(shí)別中的核函數(shù)特性分析[J].計(jì)算機(jī)工程與設(shè)計(jì),2005,26(2):302-304.
ID:1003-188X(2018)04-0026-EA