摘 要 利用水平衰減全反射-傅里葉變換紅外光譜法測定了3種藥用鱗毛蕨科植物貫眾、闊鱗鱗毛蕨和變異鱗毛蕨根部的FT-IR。運用基于離散小波多分辨率分析法對FT-IR吸收較為相似的3種藥用蕨類植物根的FT-IR進行特征提取。選擇第4、5分解層數(shù)的特征向量,進行人工神經(jīng)網(wǎng)絡(Artificial neural network,ANN)訓練;再用訓練出來的網(wǎng)絡對不同產(chǎn)地的3種藥用蕨類植物根所得FT-IR小波提取的特征向量進行分類。通過對240個不同樣本的預測,說明能夠采用基于FT-IR-離散小波特征提取及人工神經(jīng)網(wǎng)絡分類法對同科3種藥用蕨類植物根的FT-IR進行識別。
關鍵詞 水平衰減全反射傅里葉變換紅外光譜; 離散小波特征提??; 人工神經(jīng)網(wǎng)絡; 鱗毛蕨科植物; 識別分析
2011-05-15收稿;2011-09-09接受
* E-mail: ccg@zjnu.cn
1 引 言
隨著現(xiàn)代科學技術的發(fā)展,學科之間的聯(lián)系越來越密切,出現(xiàn)了許多相互交叉、相互滲透的邊緣科學。20世紀60年代前后,在植物分類學與植物化學這兩門科學之間出現(xiàn)了一門新的邊緣科學——植物化學分類學[1]。植物化學分類學亦稱植物化學系統(tǒng)學,是利用化學的特征,來研究植物各類群間的親緣關系,探討植物界的演化規(guī)律。對于一個植物體而言,其化學成分不是單一的,如何利用其復雜的化學成分來進行物種間的鑒別成為一個植物化學分類學的焦點問題[2]。傅里葉變換紅外光譜由于能給出復雜體系的所有物質的化學結構信息,不同植物體具有不同的化學成分或相同的化學成分所占比例的不同,都可以產(chǎn)生不同的傅里葉變換紅外光譜,因而將傅里葉變換紅外光譜技術作為一種分析工具應用于植物的識別具有重要的理論意義和現(xiàn)實依據(jù)[3]。借助于化學計量學,能夠更為準確和快速地利用傅里葉變換紅外光譜法進行植物的分類與識別[4~9]。
蕨類植物早在4億年前便已遍布地球表面,它同時兼具原始維管束植物與高等隱花植物雙重演化的地位。大多數(shù)蕨類植物均有藥用價值,藥用蕨類植物含有黃酮、甾類、生物堿等活性物質,對多種疾病有明顯療效[10]。本研究選擇形態(tài)較為相似的3種鱗毛蕨科的中型草本植物貫眾、闊鱗鱗毛蕨及變異鱗毛蕨為分析對象,采用水平衰減全反射傅里葉變換紅外光譜法測定FT-IR后運用離散小波進行特征提取,得到特征向量值后進行人工神經(jīng)網(wǎng)絡訓練及檢驗,得到了較高的識別率。
2 實驗部分
2.1 儀器與樣品
NEXUS 670型傅里葉變換紅外光譜儀(美國Thermo公司),配DTGS 檢測器,OMNIC E.S.P. 5.1智能操作軟件,水平衰減全反射(HATR)附件,光譜范圍為4000~650 cm
Symbolm@@ 1,分辨率2 cm
Symbolm@@ 1, 掃描累加次數(shù)64次。
貫眾為鱗毛蕨科植物貫眾(Cyrtomium fortunei J. Sm)的干燥全草;闊鱗鱗毛蕨為鱗毛蕨科植物闊鱗鱗毛蕨(Dryopteris championii (Bench) C. Chr. apud Ching)的干燥全草;變異鱗毛蕨為鱗毛蕨科植物變異鱗毛蕨(Dryopteris varia (L.) O. Ktze.)的干燥全草。所有樣品均于2008年3月分別采自于浙江金華北山及四川峨眉山,并經(jīng)過浙江師范大學植物學教研室及上海師范大學植物學教研室鑒定。將采得的樣品洗凈,不經(jīng)過任何化學處理,于避光處晾干。然后分別裁取樣品的根部作為分析的對象,放入粉碎機中粉碎,再置于瑪瑙研缽上研磨成約75
SymbolmA@ m的細小均勻粉末。準確稱取每種樣品8 mg,待測。
2.2 測定方法
在采集數(shù)據(jù)前,按要求將HATR附件水平放置于傅里葉變換紅外光譜儀的樣品倉中,分別將樣品粉末置于鍺晶片與校正壓力裝置之間,轉緊壓力裝置后直接測定樣品的FT-IR。為了降低測定誤差,每次測定接觸面積均固定為0.314 mm.2,圖譜基線采用自動校正法進行校正。
2.3 數(shù)據(jù)處理
通過測定,得到樣品的FT-IR。采用Matlab 6.1軟件,對拷貝自實驗中所給定的樣品的FT-IR進行一維離散小波變換,在各個分辨率下觀察樣品的FT-IR差異程度,從中選擇兩個具有代表性的分辨率進行提取特征向量值。進行人工神經(jīng)網(wǎng)絡識別時,以3種蕨類根部的FT-IR作為實驗樣本。樣本的訓練集和測試集各選取240個,每種植物不同產(chǎn)地的訓練數(shù)及預測樣本數(shù)各選擇40個,樣本經(jīng)過FT-IR測定后進行一維離散小波特征提取,其所選擇的特征向量值作為特征信息進行ANN的訓練與預測。
3 結果與討論
3.1 鱗毛蕨科3種植物根的HATR-FTIR譜圖比較
貫眾、闊鱗鱗毛蕨和變異鱗毛蕨3種植物根部典型的FT-IR如圖1所示。
圖1 3種蕨類植物根部的FT-IR
Fig.1 FT-IR spectra of the root of three kinds of pteridophyte plants
a. 貫眾; b. 闊鱗鱗毛蕨; c. 變異鱗毛蕨。a. Cyrtomium fortunei J. Sm; b. Dryopteris championii (Bench) C. Chr. apud Ching; c. Dryopteris varia (L.) O. Ktze.
從圖1可見,由于黃酮、甾類、生物堿、三萜類化合物、鞣質、甾醇、內(nèi)酯、氨基酸等是蕨類植物中主要的活性物質,故在3300 cm
Symbolm@@ 1均有羥基伸縮振動吸收峰,并在1030~1200 cm
Symbolm@@ 1間出現(xiàn)不同的CO鍵伸縮振動吸收峰。在3378 cm
Symbolm@@ 1處的吸收峰為三萜類、多糖類和甾醇類化合物的羥基吸收峰。3328,1612和1434 cm
Symbolm@@ 1處的吸收峰為氨基酸的氨基和酸根吸收峰。1031 cm
Symbolm@@ 1處為糖類的CO吸收峰,由于1031 cm
Symbolm@@ 1處的吸收峰為第一強峰,可推斷屬多糖類化合物。在2921和1373 cm
Symbolm@@ 1處的吸收峰為CH2和CH3的吸收峰。
由于3種蕨類植物為同科植物,所含化學成分比較相近,所以從所得FT-IR圖譜很難直接獲得更多分類識別的信息。小波變換是繼傅里葉變換后所出現(xiàn)的一種更為有效的信號處理及特征提取方法,素有“數(shù)學顯微鏡”之稱。為了更為直觀地識別3種鱗毛蕨科植物,采用離散小波變換進行提取特征向量值。它能將圖譜變換為一系列小波系數(shù),這些系數(shù)可以被高效壓縮和存儲。提取特征向量后進一步采用人工神經(jīng)網(wǎng)絡進行分類識別。
3.2 3種蕨類植物的離散小波特征提取
在進行離散小波分解時,應該根據(jù)信號的光譜特性選擇適當?shù)男〔ɑ瘮?shù)和分解層數(shù)。在小波多分辨率分解過程中,根據(jù)HATR-FT-IR信號的特性并比較不同分辨率下信號分解的效果, 確定合適的小波基及小波尺度。其標準是突出原始光譜中的若干個特征峰,并選取平滑性好的小波基。常用的小波基有Mexicon hat,Meyer,Morlet,Daubechies,Coiflet及Symlets等(圖2)。以小波基形狀與待分析信號形狀是否更接近及衰減信號是否更快作為選擇的前提,經(jīng)比較分析,選取了Daubechies小波作為“分析小波”。本研究提取小波域中原始信號FT-IR中的兩個特征峰,以提取其特征值。對3種蕨類植物的FT-IR分別進行了一維離散小波變換,分解的層數(shù)為5。經(jīng)過比較分析,選擇其中兩層(4和5)提取特征值。
圖3為利用離散小波變換分別對貫眾、闊鱗鱗毛蕨及變異鱗毛蕨的FT-IR進行多分辨率離散小波變換分解的結果。由圖3可見,當離散小波變換的分辨率比較低時,從小波域上無法分辨其光譜的主要特征,因為其中有較多的細節(jié)干擾信號。而細節(jié)信號對光譜變化比較敏感,對原始光譜中各個特征峰反應過于強烈,不利于特征提取。因此,取第4層和第5層這2個分辨率的離散小波細節(jié)信號作為特征變
圖2 小波基函數(shù)的曲線
Fig.2 Wavelet basis function curves in time domain
(a) Mexicon hat wavelet;(b) Meyer wavelet;(c) Morlet wavelet;(d) Daubechies wavelet;(e) Coiflet wavelet;(f) Symlets wavelet.
圖3 離散小波分解3種蕨類根部FT-IR的結果
Fig.3 Result of pre-processed spectra of FTIR spectra of the root of three kinds of pteridophyte plants with multiresolution discrite wavelet transform (DWT)
量提取空間。特征變量定義為離散小波域內(nèi)第4層和第5層這2個分辨率下光譜的能量。為了有效提取離散小波域內(nèi)兩個分辨率下的具有代表性的特征值,對每個分辨率下的光譜分別劃分特征區(qū)間??紤]到植物FT-IR譜的復雜性,本研究從區(qū)別比較大的兩個區(qū)域劃分了特征區(qū)間(圖4)。由圖4可見,第4層和第5層每層劃分為兩個區(qū)域,每種植物共獲得4個特征值,作為人工神經(jīng)網(wǎng)絡的輸入與輸出值。
圖4 3種蕨類植物特征區(qū)間劃分示意圖
Fig.4 Division of two feature regions of detail signal in DWT domain
a. 貫眾; b. 闊鱗鱗毛蕨; c. 變異鱗毛蕨。a. Cyrtomium fortunei J. Sm; b. Dryopteris championii (Bench) C. Chr. apud Ching; c. Dryopteris varia (L.) O. Ktze.
3.3 反向傳播(Back-propagation,BP)算法
由于本研究主要用于植物的分類和識別,故采用人工神經(jīng)網(wǎng)絡的反向傳播(BP)網(wǎng)絡模型。對于反向傳播神經(jīng)元網(wǎng)絡,當各節(jié)點均采用Sigmoid 型函數(shù)時,一個隱含層就足以實現(xiàn)任意的判決分類問題。采用本研究組已建立的算法[11],并采用隨機輸入方式。
3.4 網(wǎng)絡確定與應用結果
經(jīng)實驗確定BP網(wǎng)絡結構為4個輸入節(jié)點、6個隱層節(jié)點和3個輸出節(jié)點,誤差0.05, α為0.8,η為0.02。考察訓練成功的網(wǎng)絡對3種蕨類植物如何進行識別。所用的BP網(wǎng)絡結構中4個輸入節(jié)點依次為歸一化為0~1之間的4個特征向量,輸出節(jié)點按作為教師信號的蕨類植物種類分為:1類(貫眾);2類(闊鱗鱗毛蕨);3類(變異鱗毛蕨)。訓練后的網(wǎng)絡對240個不同產(chǎn)地樣品的FT-IR經(jīng)過離散小波變換后的特征向量數(shù)據(jù)的預測結果見表1。
從預測結果可見,貫眾、闊鱗鱗毛蕨及變異鱗毛蕨這3種蕨類植物均基本上被正確判別,只有采自四川峨眉山的闊鱗鱗毛蕨和變異鱗毛蕨各有一個樣本被錯誤分類,兩產(chǎn)地的預測準確率平均值分別達100.00%, 98.75%和98.75%。
3.5 結論
(1)蕨類植物作為藥用多使用根部,考慮到根部受環(huán)境的影響相對比較小,所以研究時采用蕨類根部作為實驗對象;(2)與壓片法及液膜法不同,利用HATR-FT-IR法測定蕨類植物,能進行直接測定獲得譜圖,從而使所得FT-IR有較好的可比性。采用離散小波變換進行數(shù)據(jù)壓縮可以對紅外吸收較為相似的貫眾、闊鱗鱗毛蕨及變異鱗毛蕨3種蕨類植物的FT-IR進行特征提取。選擇第4層和第5層分辨率下的特征值作為分析的基礎,從所得特征值進行人工神經(jīng)網(wǎng)絡分類能夠較為有效地進行分類。此方法在形態(tài)較為相似的同科植物貫眾、闊鱗鱗毛蕨及變異鱗毛蕨3種蕨類植物的分類上具有較高的可行性,從而為光譜學與計算機科學技術相結合在植物分類學中的更為廣泛的應用提供了較為科學的研究基礎。
References
1 LIU Shu-Qian, ZHENG Jun-Hua, GUO De-An, XU Bing-Jiu. Northwest Pharmaceutical J., 1999, 14(5): 222~225
劉叔倩, 鄭俊華, 果德安, 徐秉玖. 西北藥學雜志, 1999, 14(5): 222~225
2 HUANG Hao, SUN Su-Qin, XU Jin-wen, WANG Zhao. Spectrosc. Spec. Anal., 2003, 23(2): 253~257
黃 昊, 孫素琴, 許錦文, 王 釗. 光譜學與光譜分析, 2003, 23(2): 253~257
3 Lv H F, Cheng C G, Tang X, Hu Z H. Acta Bot. Sinica, 2004, 46(4): 401~406
4 CHENG Cun-Gui, TIAN Yu-Mei, ZHANG Chang-Jiang. Chinese J. Anal. Chem., 2008,36(8): 1051~1055
程存歸, 田玉梅, 張長江. 分析化學, 2008,36(8): 1051~1055
5 CHENG Cun-Gui, XIONG Wei, JIN Wen-Ying. Chinese J. Anal. Chem., 2009, 37(5): 676~680
程存歸, 雄 瑋, 金文英. 分析化學, 2009, 37(5): 676~680
6 Cheng C G, Liu J, Zhang C J, Cai M Z, Xiong W. Appl. Spectros. Rev., 2010, 45(2): 148~164
7 Cheng C G, L J, Wang H, Xiong W. Appl. Spectros. Rev., 2010, 45(3): 165~178
8 CHENG C G, Liu J, Cao W Q, Zheng R W, Wang H, Zhang C J. Vib. Spectrosc., 2010, 54(1): 50~55
9 CHEN Zhi-Cheng, LIU Jun-Xian, HUANG Shu-Shi, TAO Zhan-Hua, WANG Yi-Bing. Com. Appl. Chem., 2009, 26(4): 482~486
陳植成, 劉軍賢, 黃庶識, 陶站華, 王一兵. 計算機與應用化學, 2009, 26(4): 482~486
10 CHENG Cun-Gui, MAO Jiao-Yan. Chem. Indu. Forest Prod., 2005, 25(2): 107~110
程存歸, 毛姣艷. 林產(chǎn)化學與工業(yè), 2005, 25(2): 107~110
11 CHENG Cun-Gui, Tian Yu-Mei, Zhang Chang-Jiang. Acta Chim. Sinica, 2008,66(7): 793~798
程存歸, 田玉梅, 張長江. 化學學報, 2008, 66(7): 793~798
Recognition Among Three Kinds of Pteridophyte Plants Based on
Fourier Transform Infrared-Discrete Wavelet Feature Extraction
and Artificial Neural Network Classification Method
YU Peng.1, XU Rui.2, CHENG Cun-Gui*1
.1(College of Chemistry and Life Science, Zhejiang Normal University, Jinhua 321004, China)
.2(College of Chemical and Pharmaceutical Engineering,
Henan University of Science and Technology, Luoyang 471003, China)
Abstract Fourier transform infrared (FT-IR) and horizontal attenuated total reflectance (HATR) techniques were used to obtain the FT-IR of three kinds of pteridophyte plants (the root of Cyrtomium fortunei J. Sm, Dryopteris championii (Bench) C. Chr. apud Ching and Dryopteris varia (L.) O. Ktze.). The similar features of FT-IR among the root of Cyrtomium fortunei J. Sm, Dryopteris championii (Bench) C. Chr. apud Ching and Dryopteris varia (L.) O. Ktze. were extracted by discrete wavelet transform. The scale 4 and 5 were used to extract the feature vectors, which were used to train the artificial neural network(ANN). The trained neural network was used to classify the root of Cyrtomium fortunei J. Sm, Dryopteris championii (Bench) C. Chr. apud Ching and Dryopteris varia (L.) O. Ktze., which were collected from different places. According to 240 prediction samples, we could effectively identify the root of Cyrtomium fortunei J. Sm, Dryopteris championii (Bench) C. Chr. apud Ching and Dryopteris varia (L.) O. Ktze. by FT-IR with discrete wavelet feature extraction and artificial neural network classification.
Keywords Horizontal attenuated total reflectance-Fourier transform infrared spectroscopy; Discrete wavelet feature extraction; Artificial neural network; Dryopteridaceae plants; Identification analysis
(Received 15 May 2011; accepted 9 September 2011)