李 仲, 劉明地, 吉守祥
1. 青海民族大學(xué)物理與電子信息工程學(xué)院, 青海 西寧 810007
2. 青海民族大學(xué)化學(xué)與生命科學(xué)學(xué)院, 青海 西寧 810007
基于枸杞紅外光譜人工神經(jīng)網(wǎng)絡(luò)的產(chǎn)地鑒別
李 仲1, 劉明地2, 吉守祥2
1. 青海民族大學(xué)物理與電子信息工程學(xué)院, 青海 西寧 810007
2. 青海民族大學(xué)化學(xué)與生命科學(xué)學(xué)院, 青海 西寧 810007
應(yīng)用紅外光譜技術(shù), 快速鑒別枸杞藥材產(chǎn)地。 利用傅里葉變換紅外光譜, 測(cè)定了45個(gè)來自青海省不同產(chǎn)地的枸杞樣品的紅外光譜。 以常規(guī)預(yù)處理方法和小波變換對(duì)紅外光譜原始數(shù)據(jù)進(jìn)行了預(yù)處理。 對(duì)比常用的窗口移動(dòng)平滑預(yù)處理、 標(biāo)準(zhǔn)正態(tài)變換以及多元散射校正, 小波變換是一種有效實(shí)用的光譜預(yù)處理方法。 為了提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度, 在利用人工神經(jīng)網(wǎng)絡(luò)建立模型之前, 通過小波變換的方法對(duì)光譜變量進(jìn)行了壓縮, 同時(shí)對(duì)建立的模型的相關(guān)參數(shù)進(jìn)行了詳細(xì)的討論。 結(jié)果表明, 紅外光譜數(shù)據(jù)壓縮到原來的1/8, 其分析精度與原始光譜數(shù)據(jù)基本相當(dāng)。 以壓縮了的光譜數(shù)據(jù)作為反向傳播(BP)網(wǎng)絡(luò)的輸入變量, 產(chǎn)地類別作為神經(jīng)網(wǎng)絡(luò)的輸出變量, 建立3層人工神經(jīng)網(wǎng)絡(luò)。 其中隱含層神經(jīng)元個(gè)數(shù)為5個(gè), 輸出層神經(jīng)元個(gè)數(shù)為1個(gè)。 隱層的傳遞函數(shù)是tansig, 輸出層傳遞函數(shù)是purelin, 網(wǎng)絡(luò)訓(xùn)練函數(shù)trainlm, 權(quán)閾值的學(xué)習(xí)函數(shù)是learngdm。 net.trainParam.epochs=1 000, net.trainParam.goal=0.001。 對(duì)10個(gè)未知枸杞產(chǎn)地類別進(jìn)行了預(yù)測(cè), 預(yù)測(cè)結(jié)果準(zhǔn)確率達(dá)100%。 實(shí)驗(yàn)表明, 建立的模型能夠正確地對(duì)枸杞樣品快速地進(jìn)行產(chǎn)地鑒別。 紅外光譜法結(jié)合人工神經(jīng)網(wǎng)絡(luò)可作為中藥材產(chǎn)地分類鑒別的一種新的現(xiàn)代化方法。
枸杞; 傅里葉變換紅外光譜; 小波變換; 人工神經(jīng)網(wǎng)絡(luò)
青海枸杞主產(chǎn)地柴達(dá)木盆地的產(chǎn)品, 因獨(dú)特的生態(tài)環(huán)境, 具有微量元素種類多以及富含多糖和黃酮等特點(diǎn)[1], 目前市場(chǎng)十分廣闊[2]。 文獻(xiàn)上有采用新的光譜學(xué)方法鑒別寧夏、 新疆等非青海出產(chǎn)的枸杞質(zhì)量的報(bào)道[3-4]。 考慮到青海柴達(dá)木盆地幅員遼闊, 面積達(dá)25.78萬km2, 各枸杞產(chǎn)地生態(tài)環(huán)境等方面存在差異, 必然導(dǎo)致其化學(xué)組分的種類和含量存在細(xì)小差別。 據(jù)此前期工作曾采用紅外光譜結(jié)合聚類方法鑒別青海柴達(dá)木盆地枸杞產(chǎn)地[5-6]。 但聚類方法產(chǎn)地鑒別比較粗糙, 不能細(xì)分產(chǎn)地。 本研究提出在小波變換紅外光譜數(shù)據(jù)的基礎(chǔ)上, 采用神經(jīng)網(wǎng)絡(luò)建模, 通過神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的優(yōu)化, 可實(shí)現(xiàn)對(duì)青海柴達(dá)木盆地枸杞產(chǎn)地的細(xì)分鑒別。
1.1 試樣采集
為了使試樣更具有代表性, 增加結(jié)果的可信度, 研究中選用的枸杞試樣在原有18個(gè)樣品的基礎(chǔ)上增加至45個(gè)[6], 分別采自青海省柴達(dá)木盆地各枸杞產(chǎn)地。 為方便品質(zhì)比較, 也包括青海省外枸杞質(zhì)量?jī)?yōu)良的寧夏回族自治區(qū)中寧產(chǎn)品。 全部試樣由植物分類學(xué)家王占林研究員鑒定, 符合中華人民共和國藥典有關(guān)枸杞成熟果實(shí)性狀之規(guī)定[7]。 詳細(xì)產(chǎn)地列于表1。
Table 1 Origin of the samples
1.2 試樣預(yù)處理
由于青海柴達(dá)木盆地出產(chǎn)的枸杞糖類成分高, 枸杞試樣預(yù)處理時(shí), 若環(huán)境濕度較高, 則不利于晾曬。 試樣晾曬后要盡快移至干燥箱內(nèi), 于(60±2) ℃干燥至恒重, 取出粉碎至粒徑應(yīng)小于0.05 mm裝袋密封備用。
1.3 儀器與藥品
儀器與藥品同文獻(xiàn)[5]。
1.4 試樣紅外譜測(cè)定
根據(jù)精密度、 重現(xiàn)性及穩(wěn)定性試驗(yàn), 選定光譜測(cè)定條件。 待儀器工作穩(wěn)定后, 將混勻有少量枸杞試樣的溴化鉀壓片置于紅外儀樣品池中掃描即可獲取紅外光譜(參見圖1)[6]。 一般試樣至少重復(fù)測(cè)定3次, 以平均值記錄譜圖數(shù)據(jù)。
Fig.1 Infrared spectroscopy of the samples
2.1 普通方法預(yù)處理紅外光譜
直接采用帶噪聲的紅外光譜數(shù)據(jù)建模通常會(huì)帶來偏差。 從研究實(shí)際預(yù)處理效果看, 采用普通光譜預(yù)處理Derivation, Standard Normal Variation, Multi-scatter Calibration等方法[8], 消噪效果不理想, 更達(dá)不到壓縮紅外數(shù)據(jù)的目的。
2.2 小波變換預(yù)處理紅外光譜
新近興起的小波變換預(yù)處理紅外光譜包括光譜信號(hào)的降噪和壓縮。 利用MATLAB中的Wavelet箱函數(shù)編程可以實(shí)現(xiàn)[9]。 在建立評(píng)價(jià)小波信號(hào)降噪和壓縮性能指標(biāo)的基礎(chǔ)上[10], 通過篩選小波母函數(shù)、 優(yōu)化得出合適的分解層次和確定具體的消噪閾值等變換步驟, 可成功地實(shí)現(xiàn)光譜數(shù)據(jù)降噪和壓縮, 其近2 000個(gè)數(shù)據(jù)可以被壓縮至241。
2.3 神經(jīng)網(wǎng)絡(luò)建模
2.3.1 枸杞試樣產(chǎn)地的聚類分析鑒別
采用聚類方法對(duì)青海枸杞試樣進(jìn)行產(chǎn)地鑒別。 試樣的紅外光譜數(shù)據(jù)矩陣為X35×241, 表示35個(gè)試樣和241個(gè)紅外光譜數(shù)據(jù)。 選擇標(biāo)準(zhǔn)歐氏距離測(cè)度和沃特法聚類, 結(jié)果35個(gè)試樣明顯分成3類。 但8和23號(hào)諾木洪試樣出現(xiàn)分類錯(cuò)誤, 落入到青海德令哈產(chǎn)區(qū)類別。 因此擬采用準(zhǔn)確度高的神經(jīng)網(wǎng)絡(luò)建立鑒別模型。
2.3.2 神經(jīng)網(wǎng)絡(luò)建模
工作中曾采用概率神經(jīng)網(wǎng)絡(luò)應(yīng)用于藏藥訶子產(chǎn)地鑒別[11]。 但這里考慮到試樣輸入數(shù)據(jù)個(gè)數(shù)較多, 仍使用分類見長的概率神經(jīng)網(wǎng)絡(luò)不適合。 因此使用常見的誤差反向傳播算法的神經(jīng)網(wǎng)絡(luò)(BP-ANN)來建立鑒別模型[12-13]。 為了盡可能減少隱含層神經(jīng)元, 提高網(wǎng)絡(luò)訓(xùn)練速度, 經(jīng)試算, 建立一個(gè)前向級(jí)聯(lián)BP網(wǎng)絡(luò), 可以滿意地完成枸杞產(chǎn)地的鑒別。 MATLAB中的Neural Network箱中newcf函數(shù)可以方便地創(chuàng)建前向級(jí)聯(lián)BP網(wǎng)絡(luò)。 網(wǎng)絡(luò)的主要參數(shù)如下: 網(wǎng)絡(luò)結(jié)構(gòu)241-5-1, 即輸入神經(jīng)元241個(gè), 對(duì)應(yīng)每個(gè)枸杞試樣小波壓縮后的數(shù)據(jù)長度, 隱層5個(gè)神經(jīng)元, 輸出層神經(jīng)元1個(gè), 對(duì)應(yīng)枸杞試樣類別, 以1.0代表青海枸杞粉制品(含化學(xué)品處理過的枸杞樣品), 2.0代表諾木洪農(nóng)場(chǎng)、 格市大格勒鄉(xiāng)(含寧夏中寧)的枸杞試樣, 以3.0代表德令哈市和烏蘭縣與都蘭縣的枸杞試樣。 隱層傳遞函數(shù)tansig, 輸出層傳遞函數(shù)purelin, 網(wǎng)絡(luò)訓(xùn)練函數(shù)trainlm, 權(quán)閾值學(xué)習(xí)函數(shù)learngdm。 net.trainParam.epochs=1 000, net.trainParam.goal=0.001。 網(wǎng)絡(luò)訓(xùn)練誤差圖見圖2。 由圖2可以看出, 僅9步網(wǎng)絡(luò)訓(xùn)練誤差即達(dá)標(biāo)。
Fig.2 Training errors of the network
作為本研究的延續(xù), 還嘗試?yán)脭?shù)據(jù)挖掘軟件Clementine12中的C5.0算法, 以變量對(duì)分類的重要性(Importance)為依據(jù), 從輸入的241個(gè)紅外數(shù)據(jù)(以X1,X2, …,X241共計(jì)241個(gè)光譜數(shù)據(jù)作為變量)篩選出11個(gè)特征數(shù)據(jù)(X35,X42,X59,X64,X77,X84,X162,X184,X192,X201,X232)。 以此11個(gè)特征數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)輸入, 網(wǎng)絡(luò)輸入節(jié)點(diǎn)大為減少, 其余網(wǎng)絡(luò)參數(shù)不變, 訓(xùn)練、 預(yù)測(cè)精度均達(dá)標(biāo)。
2.4 結(jié)果分析
通過網(wǎng)絡(luò)性能仿真測(cè)試, 可以對(duì)模型的預(yù)測(cè)能力作出估計(jì)。 35個(gè)試樣回判的細(xì)分結(jié)果即3類產(chǎn)地鑒別正確率達(dá)100%。 用未參加建模訓(xùn)練的10個(gè)已知產(chǎn)地類別的檢測(cè)集對(duì)網(wǎng)絡(luò)預(yù)測(cè)能力進(jìn)行檢驗(yàn), 細(xì)分3類結(jié)果即產(chǎn)地鑒別正確率也達(dá)100%, 結(jié)果令人滿意。 總體來看, 枸杞產(chǎn)地上述分類結(jié)果與當(dāng)前實(shí)際情況一致。 諾木洪農(nóng)場(chǎng)與格市大格勒鄉(xiāng)位于盆地南緣, 兩地靠近, 生態(tài)環(huán)境等相似, 因而枸杞品質(zhì)相似, 以質(zhì)量?jī)?yōu)良著稱[14-15]。
諾木洪農(nóng)場(chǎng)種植的枸杞有相當(dāng)一部分產(chǎn)地引種了中寧枸杞品種寧杞1—7號(hào), 因而寧夏中寧枸杞與諾木洪農(nóng)場(chǎng)和格市大格勒鄉(xiāng)枸杞判別屬于同一類就容易理解了。 而其他產(chǎn)地如德令哈市、 烏蘭縣和都蘭縣等, 位于柴達(dá)木盆地東北緣, 與盆地南緣的諾木洪農(nóng)場(chǎng)、 格市大格勒鄉(xiāng)自然生態(tài)環(huán)境存在較大的不同, 品質(zhì)也就不同, 自然歸于另一類。
值得指出的是, 市場(chǎng)出現(xiàn)了不良商販用化學(xué)品(例如Na2SO3等)處理的偽劣枸杞或枸杞粉(制粉時(shí)使用化學(xué)添加劑), 顯然化學(xué)組成更為復(fù)雜, 已與純天然綠色枸杞有較大的不同, 自然歸于另類。
采用小波消噪和壓縮技術(shù)對(duì)紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理, 既保留了樣品全光譜(4 000~400 cm-1)的特征, 又有效地減少了光譜變量, 用于紅外光譜數(shù)據(jù)處理是合適的。 據(jù)此結(jié)合BP神經(jīng)網(wǎng)絡(luò)建立了青海枸杞產(chǎn)地鑒別模型。 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)優(yōu)化后的模型對(duì)柴達(dá)木盆地產(chǎn)地鑒別預(yù)測(cè)效果很好, 還能鑒別偽劣枸杞或枸杞制成品, 正確識(shí)別率達(dá)到100%, 因而有較大的實(shí)用性, 適合無損快速鑒別應(yīng)用。
[1] RUKEYA·Jiapaer, SUN Yu-jing, ZHONG Lie-zhou, et al(如克亞·加帕爾, 孫玉敬, 鐘烈州, 等). Journal of Chinese Institute of Food Science and Technology(中國食品學(xué)報(bào)), 2013, 8: 161.
[2] MA De-cun, MA Li-ya, WANG Yan-ming(馬得存, 馬麗雅, 汪延明). Economist(經(jīng)濟(jì)師), 2012, 12: 69.
[3] LIU Nan, YANG Zong-xue, LIN Hai-ming, et al(林 楠, 楊宗學(xué), 藺海明, 等). Journal of Gansu Agricultural University(甘肅農(nóng)業(yè)大學(xué)學(xué)報(bào)), 2013, 48(2): 34.
[4] XU Chun-jin, ZHANG Rui, YU Xiu-zhu, et al(徐春瑾, 張 睿, 于修燭, 等). Food Science(食品科學(xué)), 2014, 35(22): 164.
[5] DUOJIE Zha-xi, LI Zhong, LIU Ming-de(多杰扎西, 李 仲, 劉明地). Journal of Anhui Agri. Sci.(安徽農(nóng)業(yè)科學(xué)), 2014, 42(12): 3704.
[6] LIU Ming-de, LI Zhong, WU Qi-xun , et al(劉明地, 李 仲, 吳啟勛, 等). Journal of Huazhong Normal University·Nat. Sci.(華中師范大學(xué)學(xué)報(bào)·自然版), 2014, 48(6): 857.
[7] XU Chang-qing, LIU Sai, XU Rong, et al(徐常青, 劉 賽, 徐 榮, 等). China Journal of Chinese Materia Medica(中國中藥雜志), 2014, 39(11): 1979.
[8] WEI Xue-min, WU Qian, LIU Qiang, et al(魏學(xué)敏, 吳 倩, 劉 強(qiáng), 等). Chinese Journal of Pharmaceutical Analysis(藥物分析雜志), 2013, 33(8): 1447.
[9] LI Su-yi, JI Yan-ju, LIU Wei-yu, et al(李肅義, 嵇艷鞠, 劉偉宇, 等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2013, 33(4): 968.
[10] ZHU Jian-jun, ZHANG Zhe-tao, KUANG Cui-lin, et al(朱建軍, 章浙濤, 匡翠林, 等). Geomatics and Information Science of Wuhan University(武漢大學(xué)學(xué)報(bào)·信息科學(xué)版), 2015, 40(5): 699.
[11] AN Sheng-mei, WU Qi-xun, JI Shou-xiang(安生梅, 吳啟勛, 吉守祥). Hubei Agricultural Sciences(湖北農(nóng)業(yè)科學(xué)), 2014, 53(20): 4977.
[12] LUAN Guo-hong, HE Kai-xun, CHENG Hui, et al(欒郭宏, 賀凱迅, 程 輝, 等). Computers and Applied Chemistry(計(jì)算機(jī)與應(yīng)用化學(xué)), 2014, 31(1): 63.
[13] GUO Zhi-ming, HUANG Wen-qian, PENG Yan-kun, et al(郭志明, 黃文倩, 彭彥昆, 等). Chinese Journal of Analytical Chemistry(分析化學(xué)), 2014, 42(4): 513.
[14] LI Mei-lan(李梅蘭). Journal of Anhui Agri. Sci.(安徽農(nóng)業(yè)科學(xué)), 2012, 40(8): 4521.
[15] LIU Ming-de, LI Zhong, WU Qi-xun, et al(劉明地, 李 仲, 吳啟勛, 等). Computers and Applied Chemistry(計(jì)算機(jī)與應(yīng)用化學(xué)), 2014, 31(12): 1553.
The Identification of the Origin of Chinese Wolfberry Based on Infrared Spectral Technology and the Artificial Neural Network
LI Zhong1, LIU Ming-de2, JI Shou-xiang2
1. College of Physics and Electronic Information Engineering, Qinghai University for Nationalities, Xining 810007, China
2. College of Chemistry and Life Sciences, Qinghai University for Nationalities, Xining 810007, China
The Fourier Transform Infrared Spectroscopy (FTIR) is established to find the geographic origins of Chinese wolfberry quickly. In the paper, the 45 samples of Chinese wolfberry from different places of Qinghai Province are to be surveyed by FTIR. The original data matrix of FTIR is pretreated with common preprocessing and wavelet transform. Compared with common windows shifting smoothing preprocessing, standard normal variation correction and multiplicative scatter correction, wavelet transform is an effective spectrum data preprocessing method. Before establishing model through the artificial neural networks, the spectra variables are compressed by means of the wavelet transformation so as to enhance the training speed of the artificial neural networks,, and at the same time the related parameters of the artificial neural networks model are also discussed in detail. The survey shows even if the infrared spectroscopy data is compressed to 1/8 of its original data, the spectral information and analytical accuracy are not deteriorated. The compressed spectra variables are used for modeling parameters of the back-propagation artificial neural network (BP-ANN) model and the geographic origins of Chinese wolfberry are used for parameters of export. Three layers of neural network model are built to predict the 10 unknown samples by using the MATLAB neural network toolbox design error back propagation network. The number of hidden layer neurons is 5, and the number of output layer neuron is 1. The transfer function of hidden layer is tansig, while the transfer function of output layer is purelin. Network training function is trainl and the learning function of weights and thresholds is learngdm. net.trainParam.epochs=1 000, while net.trainParam.goal=0.001.The recognition rate of 100% is to be achieved. It can be concluded that the method is quite suitable for the quick discrimination of producing areas of Chinese wolfberry. The infrared spectral analysis technology combined with the artificial neural networks is proved to be a reliable and new method for the identification of the original place of Traditional Chinese Medicine.
Chinese wolfberry (LyciumbarbarumL.); FTIR(Fourier transform infrared spectroscopy); Wavelet transform; Artificial neural networks
Apr. 23, 2014; accepted Aug. 18, 2014)
2014-04-23,
2014-08-18
國家自然科學(xué)基金項(xiàng)目(81160554), 國家教育部春暉計(jì)劃(Z2012108)資助
李 仲, 女, 1964年生, 青海民族大學(xué)物理與電子信息工程學(xué)院教授 e-mail: 13709736484@163.com
O641
A
10.3964/j.issn.1000-0593(2016)03-0720-04