高衛(wèi)紅 石 磊 呂莉莉 賴(lài)小波
(浙江中醫(yī)藥大學(xué)醫(yī)學(xué)技術(shù)學(xué)院,浙江 杭州 310053)
川芎是一味常用的活血化瘀中藥,為傘形科植物川芎Ligusticum chuanxiong Hort的干燥根莖,記載于《神農(nóng)本草經(jīng)》中,并被列為上品[1-3]。 其微苦、性溫、味辛,因此常用于治療脹痛、脅痛及頭痛中,臨床上也用于治療心腦血管類(lèi)疾病和風(fēng)濕痹痛。其主要有理氣止痛、活血化瘀、擴(kuò)張血管、抗血栓、鎮(zhèn)靜、解痙及降壓等作用[4]。川芎因其獨(dú)特而廣泛的藥用價(jià)值越來(lái)越多地引起了眾多中藥學(xué)科研人員的注意,成為中草藥研究中的一大熱點(diǎn)中藥[5]。據(jù)文獻(xiàn)記載,川芎主要包含3類(lèi)活性有效成分,分別為揮發(fā)油類(lèi)物質(zhì)(以藁本內(nèi)酯為代表)、酚酸類(lèi)化合物(以阿魏酸為代表)和生物堿(以川芎嗪為代表)[6]。這3類(lèi)成分在鎮(zhèn)靜、鎮(zhèn)痛、解痙平喘等方面均顯示出很好的生理活性[7]。其中,阿魏酸在堿性環(huán)境下非常不穩(wěn)定,見(jiàn)光易分解,在酸性環(huán)境下能抑制其不穩(wěn)定性的發(fā)生[8]。純品的藁本內(nèi)酯在室溫下極其不穩(wěn)定,易揮發(fā),并伴隨水解、脫氫、降解、氧化等多種化學(xué)反應(yīng)[9]。綜上所述,川芎中含有的阿魏酸及藁本內(nèi)酯穩(wěn)定性均較差,為后續(xù)的進(jìn)一步提取帶來(lái)了諸多困難,因此選用合適的提取條件盡可能提高川芎中有效成分的含量從而提高其穩(wěn)定性顯得極為重要。
研究人員在對(duì)藥物中的有效成分含量進(jìn)行最佳條件的優(yōu)化選擇時(shí),大多會(huì)安排如正交[10]、均勻[11]或者響應(yīng)面試驗(yàn)設(shè)計(jì)[12],一般采用某個(gè)成分的含量作為對(duì)試驗(yàn)效果的總體評(píng)價(jià)指標(biāo)。但當(dāng)需要考察評(píng)價(jià)的指標(biāo)不止一個(gè)時(shí),則屬于對(duì)多個(gè)目標(biāo)同時(shí)進(jìn)行優(yōu)化的多目標(biāo)問(wèn)題。以往在優(yōu)化過(guò)程中都會(huì)將多個(gè)目標(biāo)進(jìn)行相加或者加權(quán)獲得一個(gè)綜合性的評(píng)價(jià)指標(biāo),而在這些處理方法上人為主觀因素較強(qiáng),因?yàn)閷⒍嗄繕?biāo)轉(zhuǎn)換為單目標(biāo),最后可能在一個(gè)目標(biāo)上達(dá)到了最優(yōu),而其他一個(gè)或幾個(gè)卻達(dá)到了最差。其實(shí)在多目標(biāo)優(yōu)化過(guò)程中,是將各個(gè)子目標(biāo)的值進(jìn)行折中處理,對(duì)每個(gè)目標(biāo)都進(jìn)行了平衡,使每個(gè)目標(biāo)都盡可能地達(dá)到最優(yōu)[13]。帶有精英策略的快速非支配排序遺傳算法(NSGA-Ⅱ)作為目前最為流行的多目標(biāo)優(yōu)化算法之一,不僅運(yùn)行速度快,而且解集的收斂性較好。
本文采用甲醇回流法對(duì)川芎進(jìn)行提取,以阿魏酸以及藁本內(nèi)酯的得率作為考察評(píng)價(jià)指標(biāo),首先選用均勻設(shè)計(jì)試驗(yàn)探究影響含量的甲醇體積分?jǐn)?shù)、物料比、提取時(shí)間3個(gè)因素,然后利用均勻設(shè)計(jì)獲得的數(shù)據(jù)擬合BP神經(jīng)網(wǎng)絡(luò)模型參數(shù),并結(jié)合NSGA-Ⅱ算法多目標(biāo)尋優(yōu)川芎提取工藝,以期提高川芎有效組分的得率。
均勻設(shè)計(jì)又被稱(chēng)之為均勻設(shè)計(jì)試驗(yàn)法,它考慮了所需試驗(yàn)點(diǎn)在整個(gè)實(shí)驗(yàn)范圍之內(nèi)的均勻分散,是一種在試驗(yàn)范圍內(nèi)挑選出具有代表性的點(diǎn)的方法 。本研究采用U10(108)均勻設(shè)計(jì)法,以提取溶劑甲醇的濃度(A)、物料比(B)及提取所需時(shí)間(C)為影響因素,考察其對(duì)阿魏酸及藁本內(nèi)酯含量的影響。共3個(gè)因素,每個(gè)因素5個(gè)水平,甲醇濃度水平分別為20%、40%、60%、80%、100%, 物料比水平分別為 20、45、70、95、120 倍,提取時(shí)間水平分別為 3、11、19、27、35 min。 采用高效液相測(cè)定均勻設(shè)計(jì)各試驗(yàn)組的阿魏酸及藁本內(nèi)酯得率,色譜條件:色譜柱Kromasil 100-5 C18(250 mm×4.6 mm,5 μm);洗脫相:乙腈(A)-水(B)梯度洗脫(0~5 min,10%~40%A;5~10 min,40%A;10~15 min,40%~100%A;15~20 min,100%A);檢測(cè)波長(zhǎng):320 nm,柱溫:30 ℃,流速:1.0 mL/min,進(jìn)樣量 5 μL[14]。 結(jié)果見(jiàn)表1。
表1 均勻設(shè)計(jì)試驗(yàn)的阿魏酸及藁本內(nèi)酯得率
2.1 非線性模型擬合 阿魏酸及藁本內(nèi)酯的非線性逐步回歸結(jié)果如表2~表5所示。阿魏酸的非線性相關(guān)系數(shù)為 R=0.964,測(cè)定系數(shù) R=0.929,F(xiàn)=45.553>顯著水平下臨界值 F(Significance F),線性可信;通過(guò)表可知,阿魏酸得率非線性回歸方程為:得率y1=2.813-2.271X12+0.041 X1X2。藁本內(nèi)酯線性相關(guān)系數(shù)為R=0.946,測(cè)定系數(shù)R=0.895,F(xiàn)=29.825>顯著水平下臨界值F(Significance F),線性可信;通過(guò)表可知,藁本內(nèi)酯得率線性回歸方程為:得率y2=10.785-3.297E-4X32+0.14 X1X3。
表2 阿魏酸得率回歸統(tǒng)計(jì)
表3 阿魏酸得率方差分析
表4 藁本內(nèi)酯得率回歸統(tǒng)計(jì)
表5 藁本內(nèi)酯得率方差分析
2.2 BP神經(jīng)網(wǎng)絡(luò)擬合 BP(back propagation)神經(jīng)網(wǎng)絡(luò)作為一種誤差反向傳播的神經(jīng)網(wǎng)絡(luò),是一種應(yīng)用較為廣泛的神經(jīng)網(wǎng)絡(luò)模型。多用于模型識(shí)別與分類(lèi)、時(shí)間序列預(yù)測(cè)、函數(shù)逼近及數(shù)據(jù)壓縮當(dāng)中,通過(guò)對(duì)樣本數(shù)據(jù)進(jìn)行訓(xùn)練,網(wǎng)絡(luò)的權(quán)值和閾值不斷被修正,從而使誤差函數(shù)沿著負(fù)梯度的方向下降,逐步往期望輸出逼近。BP神經(jīng)網(wǎng)絡(luò)是由輸入層、隱含層以及輸出層組成,隱含層可以有一層或多層,使用最多的為3層的BP網(wǎng)絡(luò),其結(jié)構(gòu)也最為簡(jiǎn)單,如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
2.3 BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建 根據(jù)考察因素分別建立阿魏酸及藁本內(nèi)酯相應(yīng)的BP神經(jīng)網(wǎng)絡(luò)模型,設(shè)置網(wǎng)絡(luò)系統(tǒng)的輸入層為3個(gè),即甲醇的體積分?jǐn)?shù)、提取時(shí)間及物料比,輸出層節(jié)點(diǎn)設(shè)為1個(gè),即阿魏酸或藁本內(nèi)酯的含量作為輸出指標(biāo),采用試湊法設(shè)置阿魏酸隱藏層節(jié)點(diǎn)數(shù)為5個(gè),藁本內(nèi)酯隱藏層節(jié)點(diǎn)數(shù)為2個(gè)。通過(guò)設(shè)定如下參數(shù)對(duì)均勻設(shè)計(jì)的10組數(shù)據(jù)進(jìn)行訓(xùn)練,隱藏層及輸出層的傳遞函數(shù)分別為tansig(雙曲正切傳遞函數(shù))及purelin(線性傳遞函數(shù)),訓(xùn)練函數(shù)選用trainlm,即Levenberg-Marquardt法;該方法梯度下降法與牛頓法的結(jié)合,相對(duì)于其他的訓(xùn)練函數(shù),其優(yōu)點(diǎn)為當(dāng)網(wǎng)絡(luò)的權(quán)值比較少的時(shí)候,顯示其精度高,迭代步數(shù)少、收斂速度快的優(yōu)點(diǎn)。在訓(xùn)練過(guò)程中,達(dá)到收斂的目標(biāo)精度設(shè)為0.01,最大迭代步數(shù)設(shè)為200步,用MSE均方誤差來(lái)評(píng)估BP神經(jīng)網(wǎng)絡(luò)模型最終性能。程序編寫(xiě)選用的MATLAB版本為MATLAB2009a,其自帶BP神經(jīng)網(wǎng)絡(luò)工具箱,其他的參數(shù)全部使用工具箱默認(rèn)的缺省值。通過(guò)將數(shù)據(jù)進(jìn)行測(cè)試分析之后,阿魏酸及藁本內(nèi)酯擬合的相關(guān)系數(shù)分別為0.99899和0.99544,訓(xùn)練曲線分別如圖2、圖3所示。
圖2 阿魏酸訓(xùn)練曲線圖
圖3 藁本內(nèi)酯訓(xùn)練曲線圖
因此通過(guò)訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型均能達(dá)到較好的擬合效果及預(yù)測(cè)能力,適用于阿魏酸及藁本內(nèi)酯得率的預(yù)測(cè),將通過(guò)網(wǎng)絡(luò)模型預(yù)測(cè)得到的數(shù)據(jù)反歸一化之后得到的結(jié)果與線性回歸所得結(jié)果相比較,如表6~表7所示。
表6 阿魏酸得率人工神經(jīng)網(wǎng)絡(luò)和多元回歸的擬合結(jié)果
表7 藁本內(nèi)酯得率人工神經(jīng)網(wǎng)絡(luò)和多元回歸的擬合結(jié)果
在數(shù)學(xué)描述上要對(duì)一個(gè)問(wèn)題進(jìn)行多目標(biāo)優(yōu)化,由3部分組成,分別為優(yōu)化的約束條件、目標(biāo)函數(shù)(因變量)以及使用到的決策變量(自變量)。即當(dāng)所求的目標(biāo)函數(shù)相互沖突時(shí),在一定的可行域范圍之內(nèi),確定一組由決策變量所組成的向量,使其對(duì)應(yīng)的一系列目標(biāo)函數(shù)值盡可能同時(shí)達(dá)到最大或者最小。優(yōu)化概念的數(shù)學(xué)表達(dá)式如式(14)到式(18)所示,用 x表示決策變量,D表示其維度,簡(jiǎn)單可以理解為變量個(gè)數(shù),f(x)為目標(biāo)函數(shù),N為需要優(yōu)化目標(biāo)的總個(gè)數(shù),fn(x)為第n個(gè)需要優(yōu)化的目標(biāo)函數(shù);g(x)和 h(x)為不等式的約束條件,K和M為約束項(xiàng)數(shù),xd_min和xd_max分別為決策變量的上下限值[15]。
3.1 NSGA-Ⅱ算法 NSGA-Ⅱ是當(dāng)前大多數(shù)多目標(biāo)優(yōu)化算法之中比較優(yōu)秀的算法之一,被廣泛應(yīng)用于多目標(biāo)優(yōu)化領(lǐng)域之中。它是Deb等在2002年提出的一種對(duì)NSGA算法進(jìn)行優(yōu)化改進(jìn)后的算法。具體的算法流程原理圖如圖4所示。
圖4 NSGA-Ⅱ算法流程圖
3.2 采用NSGA-Ⅱ算法對(duì)已經(jīng)建立的BP人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行多目標(biāo)尋優(yōu) 本文采用MATLAB自帶的函數(shù)Gamultiobj,它是基于NSGA-Ⅱ算法的一種多目標(biāo)優(yōu)化函數(shù),每個(gè)個(gè)體的擁擠度距離值及非劣級(jí)別根據(jù)擁擠度比較算子進(jìn)行計(jì)算,然后產(chǎn)生相應(yīng)的偏序排序的結(jié)果,其中,錦標(biāo)賽法被用來(lái)對(duì)個(gè)體進(jìn)行選擇,使用了精英策略中的保留機(jī)制對(duì)采樣的空間進(jìn)行擴(kuò)大[15-16]。
本文設(shè)置ParetoFraction即最優(yōu)前端個(gè)體的系數(shù)為 0.3,PopulationSize 即種群大小為 100,Generations即最大進(jìn)化代數(shù)為200,StallGenLimit即停止代數(shù)為200,TolFun即適應(yīng)度函數(shù)的偏差為1e-10。運(yùn)行程序后得到的川芎最佳提取條件為甲醇濃度68.4090%,液料比為119.6076倍,提取時(shí)間為34.9116 min,阿魏酸及藁本內(nèi)酯的預(yù)測(cè)值分別為2.8347、17.0428 mg/g。通過(guò)綜合分析并且根據(jù)實(shí)際情況考慮,采用液料比為120倍的體積分?jǐn)?shù)為70%的甲醇回流提取35 min。根據(jù)得到的最優(yōu)提取條件進(jìn)行驗(yàn)證試驗(yàn),實(shí)際川芎提取中阿魏酸及藁本內(nèi)酯的得率分別為2.7340、17.3774 mg/g(n=3),實(shí)際值與預(yù)測(cè)的偏差分別為3.68%、1.93%。
川芎中阿魏酸及藁本內(nèi)酯常用的提取方法為水蒸氣蒸餾法、超臨界流體萃取法、大孔樹(shù)脂分離法、醇提法及超聲輔助提取法。水蒸氣蒸餾法由于對(duì)提取物的長(zhǎng)時(shí)間加熱操作,在提取過(guò)程中一些熱敏性物質(zhì)容易因發(fā)生聚合或氧化反應(yīng)導(dǎo)致變性。超臨界萃取法因其提取溫度低,過(guò)程溫和,能夠最大限度地保留極易氧化及對(duì)熱不穩(wěn)定的揮發(fā)性物質(zhì)成分,已逐漸開(kāi)始應(yīng)用于中藥有效成分的提取,但因其操作壓力較高,設(shè)備成本投資較大等問(wèn)題,還尚未應(yīng)用于川芎有效成分的提?。?]。不同的提取方法存在不同利弊,本實(shí)驗(yàn)通過(guò)選用阿魏酸及藁本內(nèi)酯含量作為測(cè)定指標(biāo),為保證各成分提取含量達(dá)到最大,因此最終選用甲醇進(jìn)行回流提取。
眾所周知,中藥的成分一般來(lái)說(shuō)都較為復(fù)雜,因此,在提取過(guò)程中往往是多指標(biāo)的,由于影響提取含量的因素不止一個(gè),因此一般都采用多因素多水平的試驗(yàn)設(shè)計(jì),使用較多的設(shè)計(jì)方案有均勻設(shè)計(jì)、正交設(shè)計(jì)、因子設(shè)計(jì)及層次分析聯(lián)合Box Behnken效應(yīng)面設(shè)計(jì),均為經(jīng)濟(jì)、快速且效率高的實(shí)驗(yàn)設(shè)計(jì)方法,主要原理均為在全面的試驗(yàn)過(guò)程中,選取出一些代表性較強(qiáng)的試驗(yàn)點(diǎn)進(jìn)行實(shí)驗(yàn),通過(guò)算法對(duì)這些點(diǎn)進(jìn)行組合后,利用多項(xiàng)式或者均值模型對(duì)得到的結(jié)果進(jìn)行分析,通常都是采用線性擬合或者非線性擬合規(guī)劃的方法進(jìn)行優(yōu)化,但個(gè)別試驗(yàn)設(shè)計(jì)采用多項(xiàng)式進(jìn)行模型擬合后效果較差或者均值模型并不適用。由于需要考察的指標(biāo)不再為單個(gè),因此如何建立各個(gè)指標(biāo)間的相互關(guān)系成為一大難題。目前來(lái)看,在多目標(biāo)優(yōu)化的過(guò)程中,通常是將各個(gè)需要考察的指標(biāo)進(jìn)行加權(quán),即為每個(gè)指標(biāo)分配一個(gè)權(quán)重,通過(guò)權(quán)值的相加從而將多目標(biāo)優(yōu)化問(wèn)題轉(zhuǎn)換為單目標(biāo)優(yōu)化,綜合評(píng)分法是在中藥提取中常用到的方法,但是其每個(gè)指標(biāo)的權(quán)重系數(shù)往往較難確定,一般都是專(zhuān)家根據(jù)各個(gè)成分的重要性進(jìn)行評(píng)分,因此人為的主觀因素較強(qiáng),存在不合理性,不同專(zhuān)家給出的權(quán)重系數(shù)差別較大,綜合評(píng)分后的指標(biāo)也并不相同,隨機(jī)性大。本實(shí)驗(yàn)為川芎成分的多目標(biāo)優(yōu)化,并未對(duì)阿魏酸及藁本內(nèi)酯賦予權(quán)重系數(shù),因此和單目標(biāo)優(yōu)化相比,其更具有效、準(zhǔn)確及全面性,也對(duì)應(yīng)了中藥具有多成分、多作用的特點(diǎn)[17]。而NSGA-Ⅱ算法根據(jù)種群的進(jìn)化得出Pareto最優(yōu)解,該方法較為客觀,并且排除了人為因素對(duì)整個(gè)實(shí)驗(yàn)的干擾。與NSGA相比較來(lái)說(shuō),NSGA-Ⅱ具有以下3大優(yōu)點(diǎn):第一,原NSGA算法的計(jì)算量為量級(jí),而NSGA-Ⅱ通過(guò)一種基于新的快速非支配排序(基于分級(jí)處理)的方法,成功將計(jì)算量降低為量級(jí),其中,M代表了優(yōu)化過(guò)程中需要優(yōu)化的目標(biāo)的數(shù)量,即目標(biāo)函數(shù)的個(gè)數(shù),Np表示在整個(gè)種群中個(gè)體的數(shù)目。第二,NSGA算法中采用了適應(yīng)度共享的方法 ,而在NSGA-Ⅱ算法中則替換了此方法,提出種群個(gè)體之前擁擠距離的概念,不僅能保證得到的Pareto最優(yōu)解在前端具有良好的分布性,且通過(guò)計(jì)算種群內(nèi)部個(gè)體之間的擁擠距離來(lái)比較經(jīng)快速非支配排序的操作以后的處于同序值的個(gè)體之間的好壞優(yōu)劣。第三,NSGA-Ⅱ算法引入了競(jìng)爭(zhēng)的概念,它會(huì)將父代個(gè)體與子代個(gè)體進(jìn)行合并操作,生成一個(gè)全新的種群,再經(jīng)快速非支配排序操作及計(jì)算出擁擠距離,并對(duì)新生成的種群進(jìn)行修剪,使子父代個(gè)體在同一個(gè)種群中進(jìn)行競(jìng)爭(zhēng),從而產(chǎn)生下一代的新個(gè)體及種群,是一種較為新型的精英保留策略,通過(guò)這種策略,可保證種群中的優(yōu)秀個(gè)體能一直延續(xù)下去,且加快了種群進(jìn)化的速度。
BP神經(jīng)網(wǎng)絡(luò)作為一種智能系統(tǒng),能夠有效地模擬人腦中各個(gè)組織之間的結(jié)構(gòu),實(shí)現(xiàn)人腦的運(yùn)轉(zhuǎn)機(jī)制,其具有自適應(yīng)、自組織的特點(diǎn),因其具有自學(xué)習(xí)的能力,可進(jìn)行函數(shù)逼近,在復(fù)雜的非線性研究領(lǐng)域中已被廣泛使用,是一種在復(fù)雜問(wèn)題中較為有效、簡(jiǎn)便的方法。其較為強(qiáng)大的擬合以及預(yù)測(cè)能力,相對(duì)于使用回歸擬合的正交試驗(yàn)及中心復(fù)合試驗(yàn),它能夠在一定范圍內(nèi)找出所需的最優(yōu)值,大大減少實(shí)驗(yàn)次數(shù)且獲取的條件更加準(zhǔn)確可行[18]。目前,大多數(shù)研究者仍然使用傳統(tǒng)的優(yōu)化方法優(yōu)化中藥提取工藝,而利用BP神經(jīng)網(wǎng)絡(luò)結(jié)合NSGA-Ⅱ算法優(yōu)化提取工藝還有待于進(jìn)一步深入研究。
本文為研究NSGA-Ⅱ算法應(yīng)用于川芎提取優(yōu)化是否可行的探究性實(shí)驗(yàn),為簡(jiǎn)化實(shí)驗(yàn)操作,僅取0.5 g川芎細(xì)粉,因此溶劑倍數(shù)較大,若用于工業(yè)放大,從經(jīng)濟(jì)角度考慮物料比一般不超過(guò)15倍。本文所采用的方法能對(duì)所有的影響因素進(jìn)行尋優(yōu)操作,可以獲得較為滿(mǎn)意的Pareto非劣解方案,且免去了數(shù)學(xué)建模的操作,但是仍然存在一些不足之處。首先是對(duì)神經(jīng)網(wǎng)絡(luò)模型其參數(shù)的選擇,因并沒(méi)有較為成熟的理論方法能夠?qū)W(wǎng)絡(luò)模型進(jìn)行構(gòu)造,因此只能采用的學(xué)習(xí)的方法來(lái)獲得令人較為滿(mǎn)意的模型。本文選用的方法為試錯(cuò)法,隱藏層選擇為一層,剛開(kāi)始采用較少的隱藏層節(jié)點(diǎn)數(shù),然后逐步增加節(jié)點(diǎn)數(shù),本文之前采用的是十折交叉驗(yàn)證的方式選取隱藏層的節(jié)點(diǎn)個(gè)數(shù)以防止過(guò)擬合的情況出現(xiàn),然而根據(jù)十折交叉驗(yàn)證選取的隱藏層節(jié)點(diǎn)個(gè)數(shù)因?yàn)樘?,使得遺產(chǎn)算法無(wú)法收斂,因此只能通過(guò)試錯(cuò)法調(diào)試至令人滿(mǎn)意的性能為止。其次,均勻設(shè)計(jì)試驗(yàn)次數(shù)較少,因此樣本數(shù)并不多,且實(shí)驗(yàn)過(guò)程中試劑的量取,溶劑的配制等必然存在誤差,也使最后驗(yàn)證值與理論值有一定差異,理論上來(lái)說(shuō),如果用于訓(xùn)練的樣本數(shù)據(jù)較多,其擬合的效果越好,模型的建立更加準(zhǔn)確,因此本實(shí)驗(yàn)中仍出現(xiàn)了過(guò)擬合的現(xiàn)象,隨機(jī)生成的個(gè)別樣本預(yù)測(cè)并不準(zhǔn)確,當(dāng)然,樣本數(shù)量如果越多,擬合過(guò)程中產(chǎn)生的噪音也越大,反而不會(huì)取得較為滿(mǎn)意的效果。因此,本文結(jié)合BP神經(jīng)網(wǎng)絡(luò)和NSGA-Ⅱ算法多目標(biāo)優(yōu)化川芎提取的最佳條件,提高川芎有效組分的得率,可為中藥提取多成分多目標(biāo)的工藝研究提供一定理論指導(dǎo)和借鑒。