武海巍,于海業(yè),田彥濤, 王慶鈺
1. 北華大學(xué)電氣信息工程學(xué)院,吉林省 吉林市 132013 2. 吉林大學(xué)工程仿生教育部重點實驗室,吉林 長春 130022 3. 吉林大學(xué)植物科學(xué)學(xué)院,吉林 長春 130062
基于核函數(shù)與可見光光譜的大豆植株群體凈光合速率預(yù)測模型
武海巍1,于海業(yè)2,田彥濤2, 王慶鈺3*
1. 北華大學(xué)電氣信息工程學(xué)院,吉林省 吉林市 132013 2. 吉林大學(xué)工程仿生教育部重點實驗室,吉林 長春 130022 3. 吉林大學(xué)植物科學(xué)學(xué)院,吉林 長春 130062
采用美國MSR-16便攜式多光譜輻射儀,通過推導(dǎo)的輻射儀有效觀測面積公式,計算出測試單元數(shù)量,有效解決了測量區(qū)域可見光各波段光譜輻射配比關(guān)系M_D所需測量次數(shù)不確定的難題。采用美國CID公司生產(chǎn)型號為CI-310便攜式光合作用測定系統(tǒng),測量大豆植株群體凈光合速率C_D。通過[0, 1]歸一化方法對M_D和C_D進行歸一化處理,分別得到歸一化數(shù)據(jù)M_D1和C_D1。按不同測試時間劃分,將M_D1分成兩部分?jǐn)?shù)據(jù)M_D11和M_D12,將C_D1分成兩部分?jǐn)?shù)據(jù)C_D11和C_D12。使用polynomial核函數(shù)、gauss核函數(shù)、sigmoid核函數(shù)和自主研發(fā)的bio-selfadaption核函數(shù),利用grid-search,Genetic Algorithm,Particle Swarm Optimization對支持向量機懲罰參數(shù)c和參數(shù)g尋優(yōu),在支持向量機epsilon-SVR公式、nu-SVR公式條件下,通過四種核函數(shù)、三種優(yōu)化方法、兩種公式的交叉組合、M_D11、C_D11,建立大豆植株群體凈光合速率預(yù)測模型。試驗結(jié)果表明,在大豆植株試驗區(qū)域面積S=17 m2和MSR-16便攜式多光譜輻射儀放置于大豆植株冠層上方高度H=2 m條件下,epsilon-SVR-bio-selfadaption-grid-search模型對預(yù)測集1C_D12的預(yù)測精度達到85%以上,對預(yù)測集2C_D12的預(yù)測精度達到82%以上。在S和H其他組合條件下,epsilon-SVR-bio-selfadaption-grid-search模型對預(yù)測集2C_D12的預(yù)測精度達到81%以上。epsilon-SVR-bio-selfadaption-grid-search模型表明了bio-selfadaption核函數(shù)有效性、測量區(qū)域可見光光譜數(shù)據(jù)方法合理性、利用可見光光譜預(yù)測大豆植株群體凈光合速率可行性。
可見光各波段光譜輻射; 支持向量機; 核函數(shù); 大豆植株; 預(yù)測模型
光是大豆所必需的生態(tài)因子之一,影響大豆植株的形態(tài)、功能和大豆品質(zhì)[1]。大豆植株個體凈光合速率體現(xiàn)了單株大豆有機物積累,大豆植株群體凈光合速率則為一個區(qū)域內(nèi)大豆植株個體凈光合速率總和,反映該區(qū)域內(nèi)大豆植株群在一段時間內(nèi)總光合作用合成有機物積累情況,對于分析區(qū)域大豆植株整體形態(tài)、功能和大豆品質(zhì)有重要參考價值,因此有效預(yù)測大豆植株群體凈光合速率在指導(dǎo)大豆植株種植生產(chǎn)中具有重要現(xiàn)實意義。
單植株葉面積反映其個體凈光合速率大小[2],建立葉面積與個體凈光合速率之間回歸方程,可以實現(xiàn)對個體凈光合速率預(yù)測[3],但實現(xiàn)對區(qū)域大豆植株群體凈光合速率預(yù)測,則需要大量樣本數(shù)據(jù),工作量繁重,不易實現(xiàn)。本研究詳細(xì)介紹獲得區(qū)域可見光各波段光譜輻射配比關(guān)系數(shù)據(jù)和獲得群體凈光合速率數(shù)據(jù)方法,利用支持向量機(support vector machine, SVM),得到不同公式、不同核函數(shù)下大豆植株群體凈光合速率預(yù)測模型,并詳細(xì)討論參數(shù)優(yōu)化、模型組合過程以及不同預(yù)測模型對不同預(yù)測集的預(yù)測準(zhǔn)確率問題。
1.1 區(qū)域可見光各波段光譜輻射配比關(guān)系數(shù)據(jù)
大豆植株試驗基地為吉林大學(xué)植物科學(xué)學(xué)院位于吉林省梅河口市大豆種植基地。采用美國MSR-16便攜式多光譜輻射儀,分析、采集輻射儀上方入射的可見光在460~710 nm波段間光譜輻射成分、各成分比例關(guān)系[4],測試方式如圖1所示。
圖1 獲得區(qū)域可見光各波段光譜輻射配比關(guān)系方法示意圖
設(shè)大豆植株試驗區(qū)域面積為S和MSR-16便攜式多光譜輻射儀放置于大豆植株冠層上方,高度為H,根據(jù)MSR-16便攜式多光譜輻射儀工作手冊,輻射儀在其正下方地面有效測量直徑為H/2,則輻射儀有效觀測面積S1=[π×(H/4)2],其中:π為圓周率,故試驗區(qū)域劃分的測試單元個數(shù)M=[S/S1]。取S=17 m2,H=2 m,則可得到有效觀測直徑H/2=1 m,有效觀測面積S1=0.785 m2,故S/S1=21.656,測試單元數(shù)量M=21。
圖2 歸一化后的可見光各波段光譜輻射配比關(guān)系數(shù)據(jù)
測量時間跨度為2014年7月1日至8月31日,試驗當(dāng)日測量時間為9:00—16:00,每個時間段隨機選取N個測試單元,其中N 1.2 大豆植株群體凈光合速率數(shù)據(jù) 采用美國CID公司CI-310便攜式光合作用測定系統(tǒng)測量大豆植株個體凈光合速率[4]。在選定的每個測試單元內(nèi)隨機挑選3株大豆,若該測試單元內(nèi)大豆植株數(shù)量低于3株,則按實際植株數(shù)量進行測量。每株大豆隨機挑選5片葉片,若葉片數(shù)量低于5片,則按實際葉片數(shù)量進行測量。每片葉片采用CI-310便攜式光合作用測定系統(tǒng)測量一次凈光合速率,取平均值作為大豆植株個體凈光合速率,3個測驗單元平均值作為該時段試驗區(qū)域內(nèi)大豆植株群體凈光合速率。與獲得區(qū)域可見光各波段光譜輻射配比關(guān)系時間段相一致,獲得測量時間跨度內(nèi)大豆植株群體凈光合速率C_D,進行[0, 1]歸一化處理,得到歸一化后的數(shù)據(jù)C_D1,如圖3所示。 圖3 歸一化后的群體凈光合速率數(shù)據(jù) 2.1 影響群體凈光合速率因素分析與數(shù)據(jù)處理 大豆植株群體凈光合速率受多種生態(tài)因子影響,且各生態(tài)因子之間有互相影響、制約關(guān)系,難以確定群體凈光合速率與各生態(tài)因子之間精確數(shù)學(xué)模型。經(jīng)試驗研究表明,植株個體凈光合速率與M_D、葉溫、光合有效輻射、散射輻射、氣溫、空氣相對濕度、空氣中CO2濃度、直射輻射、氣孔導(dǎo)度、蒸騰速率、胞間CO2濃度等具有一定的關(guān)系。本研究主要分析區(qū)域可見光各波段光譜輻射配比關(guān)系與大豆植株群體凈光合速率之間關(guān)系模型,故將葉溫、光合有效輻射、散射輻射、氣溫、空氣相對濕度、空氣中CO2濃度、直射輻射、氣孔導(dǎo)度、蒸騰速率、胞間CO2濃度等影響因子歸為一個粒子,稱為ε粒子。ε中各測試數(shù)據(jù)單位不相同,為將不同數(shù)量級數(shù)據(jù)統(tǒng)一到一個參考系下,對ε采取[0, 1]歸一化方法。不同測試階段、不同測試單元ε中各生態(tài)因子變化規(guī)律難以確定,故對ε中數(shù)據(jù)采取在[0, 1]區(qū)間隨機賦值的數(shù)據(jù)處理方法。 2.2 建立支持向量機訓(xùn)練集和預(yù)測集 取M_D1在2014年7月1日至8月15日期間數(shù)據(jù)M_D11,取C_D1同一期間數(shù)據(jù)C_D11,將M_D11和C_D11作為SVM訓(xùn)練集。取M_D1在2014年8月16日至8月31日期間數(shù)據(jù)M_D12,取C_D1同一期間數(shù)據(jù)C_D12,將M_D12和C_D12作為SVM預(yù)測集1。將M_D12,C_D12,ε作為SVM預(yù)測集2。 2.3 參數(shù)尋優(yōu) 采用訓(xùn)練集分為10組的K-fold交叉驗證方法,利用grid-search[3],Genetic Algorithm(GA)[4-5],particle swarm optimization(PSO)[6],對SVM懲罰參數(shù)c、核函數(shù)參數(shù)g值進行參數(shù)尋優(yōu)。 2.4 試驗結(jié)果分析 采用epsilon-SVR公式、nu-SVR公式、polynomial核函數(shù)、gauss核函數(shù)、sigmoid核函數(shù)[7-8]、bio-selfadaption核函數(shù)[9],通過libsvm中model = svmtrain(C_D11,M_D11, cmd),其中cmd=[’-c’, num2str(bestc), ’ -g’, num2str(bestg) , ’-s3 -p0.01 -t2’],s代表采用的公式類型,p代表設(shè)置公式 中損失函數(shù)的值,t代表SVM中采用核函數(shù)類型,即通過訓(xùn)練集訓(xùn)練,得到不同公式、不同核函數(shù)下的大豆植株群體凈光合速率預(yù)測模型,不同預(yù)測模型下對訓(xùn)練集C_D11擬合精度如表1、表2所示。 表1 Epsilon-SVR公式下訓(xùn)練集C_D11擬合精度 由表1可見,epsilon-SVR-bio-selfadaption-grid-search模型,稱為EBSGS模型, 對訓(xùn)練集C_D11擬合精度最高,為86.757%。EBSGS模型參數(shù)優(yōu)化選擇結(jié)果如圖4所示,對訓(xùn)練集C_D11擬合效果如圖5所示。 圖4 EBSGS模型下參數(shù)c和g優(yōu)化結(jié)果圖 圖5 EBSGS模型對訓(xùn)練集C_D11擬合結(jié)果 表2 Nu-SVR公式下訓(xùn)練集C_D11擬合精度 Table 2 Fitting accuracy on training setC_D11based on nu-SVR formula PolynomialGaussSigmoidBio-selfadaptionGrid-search72.89783.44669.79285.204GA73.00283.84569.99885.734PSO74.99285.67370.28187.069 由表2可見,nu-SVR-bio-selfadaption-PSO模型,稱為NBSPS模型, 對訓(xùn)練集C_D11擬合精度最高,為87.069%。NBSPS模型參數(shù)優(yōu)化選擇結(jié)果如圖6所示, 對訓(xùn)練集C_D11擬合效果如圖7所示。 圖6 NBSPS模型下的適應(yīng)度曲線 EBSGS模型、NBSPS模型對訓(xùn)練集C_D11擬合精度相差0.312%。針對大豆植株群體凈光合速率問題,EBSGS模型、NBSPS模型對訓(xùn)練集C_D11擬合精度水平相當(dāng)。但由圖4、圖6可見,EBSGS模型懲罰參數(shù)c值為0.5,NBSPS模型懲罰參數(shù)c值為19.608,由于懲罰參數(shù)c值越小,表明該模型泛化能力越強,故EBSGS模型優(yōu)于NBSPS模型。采用EBSGS模型對預(yù)測集1C_D12進行預(yù)測,預(yù)測效果如圖8所示。 圖7 NBSPS模型對訓(xùn)練集C_D11擬合結(jié)果 圖8 EBSGS模型對預(yù)測集1 C_D12預(yù)測結(jié)果 由圖8可見,EBSGS模型對預(yù)測集1C_D12預(yù)測精度達到85.518%。 采取[0, 1]歸一化處理以及ε中各生態(tài)因子變化規(guī)律的不確定性,ε數(shù)據(jù)以步長0.1在[0, 1]間變化,經(jīng)K-fold交叉試驗,EBSGS模型對預(yù)測集2C_D12最差預(yù)測精度、對預(yù)測準(zhǔn)確性影響最大的ε數(shù)據(jù),如表3所示。 表3 加入ε后最差的相關(guān)系數(shù)r EBSGS模型對預(yù)測集2C_D12預(yù)測效果如圖9所示。 圖9 EBSGS模型對預(yù)測集2 C_D12預(yù)測曲線 引入ε后,EBSGS模型對C_D12預(yù)測精度由85.518%下降到82.391%,但是高于80%,對于預(yù)測區(qū)域內(nèi)大豆植株群體凈光合速率問題而言,利用M_D,EBSGS模型對大豆植株群體凈光合速率具備預(yù)測能力。 表4 H=2 m情況下EBSGS模型對預(yù)測集2 C_D12預(yù)測精度 表5 H=1.2 m情況下EBSGS模型對預(yù)測集2 C_D12預(yù)測精度 在H=2 m、S1=[π×(H/4)2]=0.785 m2、不同S條件下,EBSGS模型對預(yù)測集2C_D12預(yù)測精度,如表4所示。 在H=1.2 m、S1=[π×(H/4)2]=0.283 m2、不同S條件下,EBSGS模型對預(yù)測集2C_D12預(yù)測精度,如表5所示。 由表4、表5可見,不同S和H條件下,EBSGS模型對預(yù)測集2C_D12預(yù)測精度最低為81.654%。 依據(jù)區(qū)域可見光各波段光譜輻射配比關(guān)系數(shù)據(jù),采用兩種支持向量機公式、四種核函數(shù)、三種參數(shù)優(yōu)化算法,建立大豆植株群體凈光合速率預(yù)測模型,經(jīng)K-fold交叉驗證,EBSGS模型預(yù)測效果最佳。將影響大豆植株群體凈光合速率的其他各生態(tài)因子歸為一個粒子,并對粒子中各數(shù)據(jù)進行歸一化處理,為有效檢驗區(qū)域可見光各波段光譜輻射配比關(guān)系與大豆植株群體凈光合速率之間相關(guān)性提供了必要前提條件。利用EBSGS模型,在加入干擾因子ε條件下,對大豆植株群體凈光合速率進行了有效預(yù)測,擬合程度達到80%以上,為有效分析區(qū)域大豆植株生長狀態(tài)、大豆產(chǎn)量、大豆品質(zhì)等提供了技術(shù)支持和試驗方法。 [1] WANG Ying, CHENG Li-rui, LENG Jian-tian, et al(王 英, 程立銳, 冷建田, 等). Acta Agronomica Sinica(作物學(xué)報), 2010, 36(7): 1092. [2] YU Hai-ye,ZHANG Lei,ZHOU Li-na,et al(于海業(yè), 張 蕾, 周麗娜, 等). Journal of Jilin Agricultural University(吉林農(nóng)業(yè)大學(xué)學(xué)報), 2007, 29(3): 237. [3] WU Hai-wei(武海巍). Research on Support Vector Machine and Bionic Intelligent Algorithm to Light Environment Evaluation System of Planting Ginseng(支持向量機與優(yōu)化算法在林下參光環(huán)境評價系統(tǒng)中的研究). Shengyang: Northeastern University Press(沈陽: 東北大學(xué)出版社), 2013. [4] XU Bing, WANG Xing, Dhaene Tom, et al(徐 冰, 王 星, Dhaene Tom, 等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2014, 34(3): 638. [5] YIN Yao-tian, WEI Wen-bo, YE Gao-feng, et al(尹曜田, 魏文博, 葉高峰, 等). Chinese Journal of Geophysics(地球物理學(xué)報), 2012, 55(2): 671. [6] LIU Rui-lan, WANG Xu-liang, TANG Chao(劉瑞蘭, 王徐亮, 唐 超). Acta Physica Sinica(物理學(xué)報), 2014, 63(2): 28105. [7] Ramathilagam S, Huang Yueh-Min. Expert System with Applications, 2011, 38(2): 3793. [8] Vapnik V N. The Nature of Statistical Learning Theory. New York: Sprinr Press, NY, 1995. [9] YU Hai-ye, WU Hai-wei, TIAN Yan-tao, et al(于海業(yè),武海巍,田彥濤,等). Chinese Patent(中國專利),CN103234916B,2015. (Received Mar. 31, 2015; accepted Jul. 25, 2015) *Corresponding author Prediction Model on Net Photosynthetic Rate of Soybean Plant Groups Based on Kernel Function and Visible Light Spectrum WU Hai-wei1, YU Hai-ye2,TIAN Yan-tao2, WANG Qing-yu3* 1. College of Electrical and Information Engineering, Beihua University, Jilin 132013, China 2. Key Laboratory of Bionic Engineering, Ministry of Education, Jilin University, Changchun 130022, China 3. College of Plant Science, Jilin University, Changchun 130062, China The paper uses MSR-16 portable multispectral radiometer made in the USA and computes the numbers of the test units by pulling the formula on the radiometer effective observation area, which solves the problem on the uncertain numbers of computing the times on region visible light band spectral radiation ratioM_D. The paper uses CI-310 portable photosynthesis measurement system made by American CID Company and measures the net photosynthetic rate of a group of soybean plant.M_DandC_Dare normalized by the normalization method [0,1]. Then, the normalization dataM_D1andC_D1are gained . Based on the different test time,M_D1is divided ofM_D11andM_D12.C_D1is divided ofC_D11andC_D12. The paper uses polynomial kernel function, gauss kernel function, sigmoid kernel function and bio-selfadaption kernel function constructed by us with Support Vector Machine. Penalty parameter c and parameter g separately are optimized with optimization algorithms such as grid-search,genetic algorithm and particle swarm optimization. Based on the formula epsilon-SVR and the formula nu-SVR with Support Vector Machine, the paper constructs the prediction model on the net photosynthetic rate of a group of soybean plant by using of the cross combination with four kernel functions, three optimization methods and two formulas. The test results are as follows: in the condition ofS=17 m2which is the test plan area of soybean plant and theH=2 m which is the high on MSR-16 portable multispectral radiometer above the canopy of soybean plant, the prediction accuracy is up to 85% on the No.1 prediction setC_D12and the prediction accuracy is up to 82% on the No.2 prediction setC_D12based on the model epsilon-SVR-bio-selfadaption-grid-search. In the condition of other combinations withSandH, the prediction accuracy is up to 81% on the No.2 prediction setC_D12based on the model epsilon-SVR-bio-selfadaption-grid-search. The model epsilon-SVR-bio-selfadaption-grid-search indicates the validity of bio-selfadaption kernel functions which is constructed by our previous research with support vector machine. The model epsilon-SVR-bio-selfadaption-grid-search indicates the rationality of the measure method on visible spectral data in the test area. The model epsilon-SVR-bio-selfadaption-grid-search indicates the feasibility of the prediction method on net photosynthetic rate of soybean plant groups by using of visible spectrum. Different bands of visible light spectrum; Support vector machine; Kernel function; Soybean plantl; Prediction model 2015-03-31, 2015-07-25 國家留學(xué)基金項目(201408220077),國家自然科學(xué)基金項目(31371641),“十二五”農(nóng)村領(lǐng)域國家科技計劃課題子課題項目(2011BAD35B06-2-)和國家轉(zhuǎn)基因生物新品種培育科技重大專項分題項目(2014ZX08004-003)資助 武海巍,1978年生,北華大學(xué)電氣信息工程學(xué)院副教授 e-mail: wuhwjlu08@mails.jlu.edu.cn *通訊聯(lián)系人 e-mail: wangqy_jlu@yahoo.com S132 A 10.3964/j.issn.1000-0593(2016)06-1831-062 建立大豆植株群體凈光合速率預(yù)測模型
3 結(jié) 論