樊 平,鄭偉波,崔 釗
(中國(guó)科學(xué)院 上海技術(shù)物理研究所,上海 200083)
?
基于熒光光譜的空間高等植物葉綠素含量測(cè)量技術(shù)
樊 平,鄭偉波,崔 釗
(中國(guó)科學(xué)院 上海技術(shù)物理研究所,上海 200083)
開展高等植物光合作用過(guò)程參數(shù)的實(shí)時(shí)檢測(cè)技術(shù)研究,對(duì)于深入開展空間生物學(xué)效應(yīng)具有重要意義。作為光合作用重要參數(shù)的高等植物葉綠素含量與其熒光光譜具有較好的相關(guān)性,為此,可以通過(guò)探測(cè)分析植物熒光光譜,建立其與葉綠素的相關(guān)性模型,間接表征其中的葉綠素含量。介紹一種新的建模方法即支持向量機(jī)(SVM),通過(guò)實(shí)驗(yàn)驗(yàn)證,方法預(yù)測(cè)葉綠素含量是可行的,相對(duì)于一般采用的線性回歸法具有更好的預(yù)測(cè)效果和更高的測(cè)量精度。
熒光光譜; 標(biāo)定; 支持向量機(jī); 線性回歸
人類空間活動(dòng)不斷增多,宇航員食物的獲取,氧氣的獲取和廢氣的凈化離不開高等綠色植物的培育生長(zhǎng)。綠色高等植物既能進(jìn)行光合作用,又是氧氣和二氧化碳最重要的交換中心。綠色高等植物在空間微重力、高輻射環(huán)境下的生長(zhǎng)發(fā)育情況與地面有所不同。為了收集高等綠色植物在空間環(huán)境下的生長(zhǎng)數(shù)據(jù),需要開展一系列的空間生命科學(xué)研究??臻g生命科學(xué)實(shí)驗(yàn)儀器是空間生物學(xué)實(shí)驗(yàn)的載體,完成空間生命科學(xué)實(shí)驗(yàn)的實(shí)施、監(jiān)控和觀測(cè),其回收的樣品和收集的實(shí)驗(yàn)過(guò)程數(shù)據(jù)是科學(xué)家進(jìn)行生物學(xué)機(jī)理研究的主要依據(jù)[1]。
地面上,多光譜成像技術(shù)憑借其二維圖像信息與光譜信息融合的特點(diǎn),已成為植物生理化學(xué)研究的一種重要手段,得到廣泛應(yīng)用。將熒光光譜[2]運(yùn)用于高等植物的觀測(cè)中具有快速實(shí)時(shí)無(wú)損等優(yōu)點(diǎn)。用熒光光譜圖像準(zhǔn)確地表示葉片葉綠素含量的分布取決于單點(diǎn)標(biāo)定的準(zhǔn)確性。一般采用線性回歸法建模對(duì)單點(diǎn)的熒光光譜和葉綠素含量之間建立模型,需要采集大量樣本的熒光光譜和用標(biāo)準(zhǔn)方法測(cè)定的葉綠素含量。
本文提出一種以統(tǒng)計(jì)學(xué)理論為基礎(chǔ)的支持向量機(jī)算法[3]進(jìn)行葉綠素含量的標(biāo)定,在處理小數(shù)量樣本時(shí)表現(xiàn)出良好的準(zhǔn)確性。
1.1 葉綠素含量測(cè)量原理
葉片中的葉綠體是進(jìn)行光合作用的主要場(chǎng)所。當(dāng)光照射到葉片上時(shí),有反射、透射以及吸收這三種形式。葉綠素分子吸收光能后大部分用來(lái)進(jìn)行化學(xué)反應(yīng),極少部分以熱輻射和熒光發(fā)射的形式釋放。在觀察植物的熒光光譜光譜時(shí),要通過(guò)藍(lán)光或者紫外光對(duì)葉片進(jìn)行激發(fā)。
紫外光雖然可以激發(fā)熒光,但紫外光會(huì)對(duì)葉片內(nèi)的組織產(chǎn)生損傷,植物在生長(zhǎng)過(guò)程中為了抵擋紫外光就在葉片表面生成紫外遮擋物,所以紫外光很難穿透葉片,激發(fā)出的熒光較弱。葉綠素在藍(lán)光波段有明顯吸收峰,且藍(lán)光比紫外光更易穿透葉片到達(dá)葉綠素分子,所以,藍(lán)光比紫外光更能激發(fā)出熒光。
熒光光譜在470~480 nm,680~685 nm 以及 730~740 nm三個(gè)波段附近各有一個(gè)強(qiáng)度峰值。470~480 nm波段的峰值主要是由阿魏酸產(chǎn)生的,而680~685 nm和730~740 nm波段的峰值是由葉綠素產(chǎn)生的。因而研究葉綠素的含量只需從后兩個(gè)波段的強(qiáng)度峰值入手即可,大量研究表明:這兩個(gè)峰值下熒光強(qiáng)度的比值與葉綠素的含量存在線性關(guān)系。
1.2 測(cè)量系統(tǒng)
基于熒光光譜的葉綠素含量測(cè)量系統(tǒng)(如圖1所示)主要由激發(fā)光源、分光組件、成像控制組件及上位機(jī)構(gòu)成。激發(fā)光源為藍(lán)光LED(<500 nm),用于激發(fā)葉綠素?zé)晒?;分光組件采用濾光輪的形式濾光片;成像組件的圖像傳感器選用的芯片為IBIS5A—1300,像素大小為1024×1280,現(xiàn)場(chǎng)可編程門陣列(FPGA)控制成像采集輸出的同時(shí)控制電機(jī)運(yùn)動(dòng),用于切換濾光片,以便獲取不同通道的光譜圖像數(shù)據(jù);上位機(jī)實(shí)現(xiàn)數(shù)據(jù)接收和數(shù)據(jù)反演分析。數(shù)據(jù)反演分析主要要建立相關(guān)性模型,并且通過(guò)標(biāo)定試驗(yàn)進(jìn)行參數(shù)標(biāo)定。
圖1 光譜成像系統(tǒng)Fig 1 Spectral imaging system
1.3 標(biāo)定原理
葉綠素含量的標(biāo)定包含兩個(gè)步驟:一是獲得葉片某點(diǎn)熒光光譜;二是獲得該點(diǎn)標(biāo)準(zhǔn)葉綠素含量值。對(duì)熒光光譜用Matlab處理數(shù)據(jù),提取特征量,然后將特征量和標(biāo)準(zhǔn)葉綠素含量值建模。步驟一可以采用如圖2所示的系統(tǒng)測(cè)量而得。
圖2 熒光光譜采集系統(tǒng)示意圖Fig 2 Collection system diagram for fluorescence spectra
該系統(tǒng)使用海洋光學(xué)公司的HR4000光譜儀,光纖探頭400 μm,軟件為SpectraSuite;激發(fā)光源為激光二極管泵浦激光器,型號(hào)為MBL—III—473;使用圓形漸變密度濾光片NDFC5020調(diào)節(jié)激光強(qiáng)度。將葉片用夾具固定,激光器發(fā)出的光經(jīng)過(guò)衰減計(jì)照射到葉片上并與葉片成45°,將光纖探頭與葉片也成45°固定,采集到得信號(hào)經(jīng)過(guò)光譜儀連接到計(jì)算機(jī)上。整個(gè)實(shí)驗(yàn)需要在暗室中進(jìn)行。將采集到的30幅熒光光譜用Matlab顯示在一幅圖中,如圖3所示。從圖3中可以看出:這30條曲線的特征大抵相同都有兩個(gè)峰,將左鋒值比上右峰值得到特征量。此特征量將用于建模。
圖3 采集到的熒光光譜Fig 3 Collected fluorescence spectra
標(biāo)準(zhǔn)葉綠素含量值這部分由中國(guó)科學(xué)院上海生命科學(xué)研究院植物生理生態(tài)研究所協(xié)助完成,具體步驟:1)將葉片上標(biāo)記的點(diǎn)打孔取下,放在研缽中,加入 95 %的乙醇,過(guò)濾,制成實(shí)驗(yàn)原液;2)由公式c=6.63A665-18.08A649測(cè)量溶液在 665 nm和649 nm的吸光度帶入公式即得葉綠素含量,見表1。
表1 樣品葉綠素含量
葉綠素含量的標(biāo)定原理是先提取熒光光譜中的特征量,然后對(duì)特征量和標(biāo)準(zhǔn)的葉綠素含量值進(jìn)行建模得到關(guān)系式。對(duì)于待測(cè)的葉子,只要測(cè)得熒光光譜提取特征量帶入關(guān)系式即可求得葉片的葉綠素含量。因此,建模過(guò)程中選擇什么樣的回歸方式顯得尤為重要。
2.1 支持向量機(jī)回歸理論
支持向量機(jī)(support vector machine,SVM),SVM最初被用來(lái)解決分類問(wèn)題,后來(lái)被推廣到函數(shù)逼近和信息融合領(lǐng)域。已知擬合點(diǎn)(xi,yi),i=1,2,…,n,xi∈Rn為輸入量,yi∈R為輸出量。
SVM線性回歸其本質(zhì)就是在線性回歸中在特征到結(jié)果中加入了一層映射,模型[4,5]為
(1)
鑒于只有葉綠素?zé)晒夤庾V和葉綠素含量只有兩個(gè)變量,用線性回歸函數(shù)式(2)擬合樣本數(shù)據(jù)
f(x)=〈w,x〉+b
(2)
式中 w,b分別為式(1)中的α,θ0。
假設(shè)樣本數(shù)據(jù)可以在精度ε滿足不敏感損失函數(shù)
(3)
這時(shí)SVM的回歸擬合就是轉(zhuǎn)化為求優(yōu)化目標(biāo)函數(shù)最小化問(wèn)題
(4)
2.2 SVM具體操作
非線性SVM回歸的具體操作是將輸入量xi通過(guò)核函數(shù)映射到高維,則目標(biāo)函數(shù)為
(5)
(6)
1)支持向量機(jī)的性能取決于懲罰系數(shù)C,核函數(shù)的函數(shù)設(shè)置γ,不敏感損失函數(shù)ε及核函數(shù)類型。懲罰系數(shù)C是對(duì)模型復(fù)雜度和泛化能力的折中,它決定了損失大于ε的懲罰程度,當(dāng)C太小時(shí),模型結(jié)構(gòu)復(fù)雜度下降,訓(xùn)練誤差可能超出接收范圍;當(dāng)C→∞ 時(shí),模型優(yōu)化目標(biāo)誤差退化至風(fēng)險(xiǎn)最小化,出現(xiàn)“過(guò)學(xué)習(xí)”現(xiàn)象。ε是SVM回歸的重要特征,它決定了支持向量的數(shù)目TotalSV。通過(guò)對(duì)LibSVM3.11軟件包中核函數(shù)類型對(duì)比,結(jié)果采用RBF核函數(shù)的e-SVR[6,7]。SVM中相關(guān)參數(shù)C=2.2,γ=2.8,ε=0.01;標(biāo)準(zhǔn)線性回歸R2=0.845 6。
2)目前沒(méi)有一個(gè)完備的方法來(lái)確定SVM回歸參數(shù),常用的SVM參數(shù)的方法主要有:遺傳法(genetic algorithm,GA)、粒子群優(yōu)化(PSO)算法、網(wǎng)絡(luò)優(yōu)化選擇法。
遺傳算法的主要特點(diǎn)是直接對(duì)結(jié)構(gòu)對(duì)象進(jìn)行操作,不存在求導(dǎo)和函數(shù)連續(xù)性的限定;具有內(nèi)在的隱并行性和更好的全局尋優(yōu)能力。粒子群優(yōu)化算法是一種新的全局優(yōu)化進(jìn)化算法。系統(tǒng)初始化為一組隨機(jī)解,通過(guò)疊代搜尋最優(yōu)值,在解空間追隨最優(yōu)的粒子進(jìn)行搜索。網(wǎng)格優(yōu)化算法是一種大范圍點(diǎn)集搜索方法。搜索范圍的確定仍需建模者設(shè)定。該方法簡(jiǎn)單易行,但是訓(xùn)練時(shí)間較長(zhǎng)。
各尋優(yōu)參數(shù)結(jié)果見表2,對(duì)比相關(guān)系數(shù)可知遺傳算法較好,但是網(wǎng)格優(yōu)化算法所需支持向量數(shù)較少,SVM回歸模型較簡(jiǎn)單。
表2 相應(yīng)尋優(yōu)算法所得參數(shù)及計(jì)算出的相關(guān)系數(shù)
將遺傳算法所求參數(shù)SVM回歸模型結(jié)果列于表3并同線性回歸結(jié)果進(jìn)行比較,發(fā)現(xiàn)SVM回歸比線性回歸相關(guān)性好,平均絕對(duì)誤差比線性回歸小,因此,SVM回歸有較好的分析效果。
表3 SVM與線性回歸對(duì)比
本文分析了葉綠素?zé)晒猱a(chǎn)生機(jī)制,以及基于熒光光譜的葉綠素含量測(cè)量原理,建立了基于熒光光譜的空間高等植物葉綠素含量測(cè)量系統(tǒng),并采用SVM算法在標(biāo)定部分進(jìn)行建模。經(jīng)過(guò)原理上的驗(yàn)證,可見SVM在回歸的相關(guān)性和誤差上比標(biāo)準(zhǔn)線性回歸效果要好許多。
[1] 鄭偉波.空間高等植物培養(yǎng)觀察裝置及其空間飛行實(shí)驗(yàn)[J].科學(xué)技術(shù)與工程,2007,17(7):4403-4407.
[2] 楊昊諭.基于葉綠素?zé)晒夤庾V分析的植物生理信息檢測(cè)技術(shù)研究[D].長(zhǎng)春:吉林大學(xué),2010.
[3] 李海生.支持向量機(jī)回歸算法與應(yīng)用研究[D].廣州:華南理工大學(xué),2005:1-18.[4] Vapnik V N.The nature of statistical learning theory[M].New York:Springer Verlag,1995.
[5] Vapnik V N,Levin E,Le Cun-Y.Measuring the VC dimension of a lerning machine[J].Neural Computation,1994,6:851-876.
[6] Mendes R,Kenney J.The full informed particle swarm:Simpler,maybe better[J].IEEE Transaction on Evolutionary Computation,2004,8(3):204-210.
[7] 朱 波,劉 飛,李順江.基于優(yōu)化有向無(wú)環(huán)圖支持向量機(jī)的多變量過(guò)程均值異常識(shí)別[J].計(jì)算機(jī)集成制造系統(tǒng),2013,19(3):549-568.
Measurement technology for chlorophyll content in space higher plants based on fluorescence spectrum
FAN Ping,ZHENG Wei-bo,CUI Zhao
(Shanghai Institute of Technical Physics,Chinese Academy of Sciences, Shanghai 200083,China)
Doing research on technology for real-time detection of process parame-ters of photosynthesis in higher plants have great significance for deeply studying biological effects of space.Chlorophyll content which is an important parameter of photosynthesis in higher plants shows a very good correlation with fluorescence spectra.Therefore,establish correlation model between fluorescence spectra and chlorophyll to indirectly represent the chlorophyll content by detecting and analyzing fluorescence spectra of plants.Describe a new method of modeling which is support vector machine(SVM).Through experimental verification,the method is feasible to predict the chlorophyll content,which has better prediction performance and higher precision than linear regression method.
fluorescence spectrum;calibration;support vector machine(SVM);linear regression
10.13873/J.1000—9787(2016)11—0140—03
2016—01—20
V 556
A
1000—9787(2016)11—0140—03
樊 平(1990-),女,江蘇揚(yáng)州人,碩士研究生,主要從事熒光光譜成像方面的研究工作。