安淑靜,王婷,牛豆,韓彬凱,畢淮龍,康杰芳
(陜西師范大學 教育部藥用資源與天然藥物化學重點實驗室,西北瀕危藥材資源開發(fā)國家工程實驗室,陜西 西安 710119)
山茱萸(CornusofficinalisSieb.et Zucc.)是山茱萸科(Cornaceae)山茱萸屬(Cornus.Linn)多年生落葉小喬木或灌木,其干燥成熟果肉,始載于《神農本草經》[1],具有補益肝腎和內熱消渴等療效,是中醫(yī)臨床常用于治療消渴癥(糖尿病)的傳統(tǒng)良藥[2-3]。山茱萸的藥用和食用價值已有1 500多年的歷史,現(xiàn)代研究表明山茱萸具有抗氧化、抑制腫瘤、神經保護、抗炎和肝臟保護等作用,發(fā)揮作用的主要活性成分有獐牙菜苷、馬錢苷、山茱萸新苷、原兒茶苷、莫諾苷、沒食子酸和5-HMF等[4-7]。植物的次生代謝產物的品質與產地的地理因子是長期相互作用的結果,是一種連續(xù)的、動態(tài)的綜合作用[8-9]。孫玲等[10]發(fā)現(xiàn)19批不同產地山茱萸中5種環(huán)烯醚萜苷類成分含量受地域影響,在山茱萸的質量評價時應當考慮產地因素。焦媛等[11]通過ICP-MS方法對5個產地山茱萸中無機元素的含量發(fā)現(xiàn),河南西峽的Sr元素含量最高。采用HPLC方法測定不同產地山茱萸果核中莫諾苷、沒食子酸、5-HMF和原兒茶酸,陜西寶雞和漢中的化學成分含量較高[12]。山茱萸的三大主產區(qū)為浙江淳安、陜西佛坪和河南西峽,在四川、安徽、山西和甘肅等地也有分布[13],道地性藥材的品質是中藥現(xiàn)代化的基石。所以,對山茱萸進行產地溯源具有一定的必要性。傳統(tǒng)中藥材的鑒別主要依靠“辨狀論質”“看貨評級、分檔議價”,這種傳統(tǒng)的方法經驗性強、活性成分與性狀特征相關性研究困難[14-15]。因此,建立一種省時、科學的產地鑒別和質量評價體系意義重大。
中紅外(mid-infrared reflectance,MIR)光譜反映的是分子中的原子的伸縮和變形振動運動,波數(shù)范圍在4 000~400 cm-1之間[16]。中紅外光譜結合化學計量學作為一種新興技術手段,每一種化合物都有特定的吸收光譜,廣泛應用于產地溯源、品質檢測和真假鑒別等[17-19]。近年來,中紅外結合化學計量學廣泛應用于中藥材產地鑒別與質量評價,為中藥現(xiàn)代化提供新思路[20-22]。本研究采用MIR光譜結合LR、BP-ANN和SVM對29批山茱萸建立產地鑒別和藥材活性成分含量測定模型,為山茱萸藥材產地鑒別和有效成分含量的快速測定提供科學、便捷、準確的方法。
Nicolet IS50 傅立葉交換紅外光譜儀(美國Thermo Fisher Scientific);LG-04C微型植物粉碎機(瑞安市百信藥機器械廠);ISO9001電子天平(北京賽多利斯科學儀器有限公司);HY-12壓片機(北京凱迪萊特儀器設備有限公司);U-3000高效液相色譜儀(美國Thermo Fisher Scientific);HY-12 壓片機(北京凱迪萊特儀器設備有限公司)。
KBr光譜純 (北京市津同樂泰化工產品有限公司);乙腈、甲醇、甲酸為色譜純(天津益仁達化工有限公司);沒食子酸對照品、5-HMF對照品、原兒茶酸對照品、莫諾苷對照品、獐牙菜苷對照品、馬錢苷對照品、山茱萸新苷對照品(上海源葉生物科技有限公司)。
2018年10月—2018年12月采自7個省份(四川、甘肅、陜西、山西、河南、安徽、浙江)的29批次山茱萸藥材,經陜西師范大學植物學教研室鑒定為山茱萸科植物山茱萸(CornusofficinalisSieb.et Zucc.),樣本采集信息見表1。
表1 29批次山茱萸樣品采集地點信息
1.4.1 樣品處理
將不同產地的29批山茱萸樣品在40 ℃下烘干至恒重,經微型植物粉碎機粉碎后過200目篩,備用。
1.4.2 中紅外光譜采集
將KBr在烘干器中102 ℃干燥24 h后備用。實驗時稱取2 mg山茱萸樣品粉末,按大約1∶60的質量比與干燥后的KBr晶體均勻混合于瑪瑙研缽中,研磨充分后用壓片機壓制成薄片,立即置于Nicolet IS 50傅立葉交換紅外光譜儀中進行測定。
儀器條件:掃描范圍為4 000~400 cm-1,光譜分辨率為4 cm-1,掃描次數(shù)為64次,采集背景和樣品光譜前排除水和二氧化碳的干擾。依次將制備好的樣品薄片放于光譜儀中進行測定,采集數(shù)據。
1.4.3 方法學考察
精密度試驗:取1號山茱萸樣品,按照上述所示采集方法制成薄片進行光譜采集,將同一個薄片采集5次,采用SPSS軟件計算其RSD值。
重現(xiàn)性試驗:取1號山茱萸樣品,按照上述所示采集方法制成薄片進行光譜采集,將同一個薄片采集5次,采用SPSS軟件計算其RSD值。
穩(wěn)定性試驗:將1號山茱萸樣品置于干燥器中保存,每隔0.5 h按上述所示采集方法制備并測定1次,共測定5次,得到2.5 h內同一山茱萸樣品的多個紅外光譜圖,采用SPSS軟件計算其 RSD值。
1.4.4 模型建立
采用Essential FTIR軟件讀取光譜數(shù)據,并將光譜數(shù)據轉換為XLS格式,采用MATLAB 2014a軟件對光譜數(shù)據進行歸一化處理,歸一化方法為:在-1到1之間歸一,[y,PS]=map minmax(X,ymin,ymax)將X歸一化到y(tǒng)min到y(tǒng)max范圍,公式為:
其中,X是原始數(shù)據,y是歸一化后的數(shù)據,xmax為X的最大值,xmin為X的最小值。
篩選出29批山茱萸中紅外光譜的特征數(shù)據,分別采用LR、BP-ANN和SVM建立基于NIR光譜的山茱萸藥材產地的鑒別模型。為了比較不同的分類模型的效果,首先按照3∶1的比例將光譜數(shù)據分成訓練集和測試集,本研究將陜西和河南樣品分別記為“1”類和“2”類對訓練集和測試集的分類正確率分別用識別率表示。
篩選出29批山茱萸紅外光譜的特征數(shù)據,設置訓練集與驗證集,利用LR、BP-ANN和SVM三種數(shù)學建模方法,建立基于MIR光譜的山茱萸中7種成分含量預測模型,計算各模型的相關系數(shù)(R2)、均方誤差(MSE)和平均絕對誤差(MAD)作為模型性能的指標。其中,R2表示可根據自變量的變異來解釋因變量的變異部分,該值的絕對值越接近1,表示模型擬合度越高;MSE表示預測值與實際值之間的差異程度,該值越大,誤差越大;MAD表示所有單個預測值與算數(shù)平均值的偏差的絕對值的平均,該值越大,誤差越大。
由于實驗儀器環(huán)境、操作等原因,原始光譜開始有噪聲,最終保留4 000~500 cm-1之間的光譜數(shù)據。29批山茱萸樣品光譜數(shù)據,見圖1。
圖1 29批次山茱萸藥材中紅外光譜
精密度試驗:經計算,采集得到的5個光譜的最大共有峰波數(shù)的RSD值小于0.2%(置信區(qū)間95%),說明儀器精密度良好,所得數(shù)據真實可靠。
重現(xiàn)性試驗:經計算,采集得到的5個光譜的最大共有峰波數(shù)的RSD值小于3%,說明實驗重現(xiàn)性良好。
穩(wěn)定性試驗:經計算,在2.5 h內同一山茱萸樣品的5個紅外光譜圖的最大共有峰波數(shù)的RSD值小于0.3%,說明處理后的山茱萸樣品在2.5 h內基本穩(wěn)定,實驗所得結果可靠。
陜西省和河南省兩個主產區(qū)的產地鑒別模型結果,見表2。結果表明,采用SVM結合MIR光譜建立的產地鑒別模型對產地的識別率最高,識別率為86.21%。
表2 基于MIR光譜的山茱萸藥材產地鑒別模型
為了進一步驗證各模型的預測效果,將29批次山茱萸MIR光譜數(shù)據導入采用LR、BP-ANN和SVM擬合的預測模型中,對陜西和河南的山茱萸藥材進行產地預測,將得出的分類正確率均以識別率表示,見表3。結果表明,采用SVM結合MIR光譜建立的產地鑒別模型對陜西、河南兩地山茱萸藥材的識別率最高,分別為92.31%和87.50%。
表3 基于MIR光譜的山茱萸藥材產地鑒別模型驗證結果
篩選出29批山茱萸紅外光譜的特征數(shù)據,利用LR、BP-ANN和SVM三種數(shù)學建模方法,建立基于中紅外光譜的山茱萸藥材中7種成分含量預測模型,計算各模型的決定系數(shù)(R2)、均方誤差(MSE)和平均絕對誤差(MAD)作為模型性能的指標。在表4所示模型評價結果中,除原兒茶酸外,山茱萸藥材中其他6種成分用SVM法建立模型的R2均大于用LR和BP-ANN建立模型的R2,且用SVM法建立模型的MSE和MAD均大于用LR和BP-ANN建立模型的MSE和MAD,表明用SVM建立的模型所預測的山茱萸藥材中6種成分的含量最接近其實際含量。
參照本課題組前期建立的山茱萸液相指紋圖譜方法測定山茱萸藥材中7種活性成分的含量[23],得到山茱萸中7種對照品HPLC峰值圖,如圖2。按照各標準品的線性關系及樣品圖譜中各成分相對保留時間的峰面積,求得29批山茱萸樣品中7種活性成分的實際含量。為了進一步驗證各模型的預測效果,將29批次山茱萸MIR光譜數(shù)據導入采用LR、BP-ANN和SVM擬合的預測模型中,對山茱萸中的7種化學成分進行含量預測,將預測含量與采用HPLC法測得的實際含量進行比較。HPLC通過表5和圖3~9的結果發(fā)現(xiàn),除原兒茶酸外,山茱萸藥材中其他6種成分用SVM法建立模型的R2均大于用LR和BP-ANN建立模型的R2,說明SVM建立的模型擬合度更高,采用SVM法建立的基于MIR光譜的山茱萸藥材含量預測模型更適合山茱萸藥材中多種成分含量的同時測定。
表4 基于MIR光譜的山茱萸藥材中7種成分含量預測模型
注:1.沒食子酸,2.5-羥甲基糠醛,3.原兒茶酸,4.莫諾苷,5.獐牙菜苷,6.馬錢苷,7.山茱萸新苷。圖2 山茱萸中7種有效成分對照品HPLC圖譜
表5 29批次山茱萸中7種成分實際值與基于MIR光譜預測值比較結果(n=29)
山茱萸為世界三大名貴木本藥材之一[24],是我國40種用量較大的重點藥材品種之一,是國家新增9種按照傳統(tǒng)既是食品又是中藥材物質之一(國衛(wèi)食品函〔2019〕311號)。山茱萸在醫(yī)藥和保健品等方面應用的需求量巨大,在國內中藥材市場上占據著舉足輕重的地位。山茱萸種植范圍廣泛、種植基地環(huán)境差異大、采收加工工藝不統(tǒng)一,導致市場上山茱萸的質量參差不齊。本實驗采用MIR結合SVM建立的產地鑒別模型識別率高,可用于山茱萸產地來源鑒別,進而控制山茱萸藥材質量。山茱萸藥材傳統(tǒng)的定量方法通常采用高效液相色譜法(HPLC),在常用的含量測定方法中,HPLC法分析一個山茱萸藥材樣品需要 85 min,且對山茱萸藥材提取液前處理過程復雜、耗時長、提取過程有損耗。而建立中紅外光譜模型后,掃描一個樣本約30 s,極大地縮短了分析時間,采用中紅外光譜結合化學計量學方法對樣品的預處理簡單、破壞性小、省時,快捷。用MIR結合SVM建立含量預測模型能夠快速對山茱萸藥材中的活性成分進行批量檢測,提高了檢測效率和精確度。
本實驗建立了一種簡便、快速、準確的產地鑒別和質量評價的模型,并對該模型進行驗證,結果表明該模型識別率和擬合度高,適用于山茱萸藥材的產地鑒別和質量評價。