馮瑞梅王 婷戴 帥陳 益仇麗霞△
中心復(fù)合設(shè)計(jì)最優(yōu)條件選取時(shí)四種方法的比較*
馮瑞梅1王 婷1戴 帥1陳 益2仇麗霞1△
目的比較三種傳統(tǒng)優(yōu)化方法和遺傳算法基于中心復(fù)合設(shè)計(jì)的單目標(biāo)優(yōu)化時(shí)的特點(diǎn)。方法利用提高木聚糖酶產(chǎn)量的結(jié)果,分別用直接法、等高線法、最速上升法、遺傳算法尋找最優(yōu)結(jié)果,比較后得出結(jié)論。結(jié)果直接法、最速上升法、等高線法、遺傳算法尋優(yōu)的木聚糖酶含量分別為27.77UA/m l、23.93UA/m l、47.07UA/m l、51.04UA/m l。結(jié)論直接法可在其設(shè)計(jì)水平上較快找出結(jié)果,但不能保證局部或是全局達(dá)最優(yōu);在星點(diǎn)設(shè)計(jì)基礎(chǔ)上的單目標(biāo)尋優(yōu)時(shí)等高線法的結(jié)果和遺傳算法相當(dāng),等高線法可觀察到部分因素對(duì)響應(yīng)的影響大小,但存在局部最優(yōu)和主觀性較強(qiáng)的不足;最速上升法易陷入局部最優(yōu)而忽略其他可能最優(yōu)解。
中心復(fù)合設(shè)計(jì) 傳統(tǒng)優(yōu)化方法 遺傳算法 最優(yōu)試驗(yàn)條件
多因素、多水平的試驗(yàn)在實(shí)際應(yīng)用中很常見,而常用的設(shè)計(jì)有析因設(shè)計(jì)、正交設(shè)計(jì)、均勻設(shè)計(jì)等,析因設(shè)計(jì)相對(duì)耗時(shí)、耗力,正交設(shè)計(jì)以犧牲高階交互作用為代價(jià)降低了試驗(yàn)次數(shù),均勻設(shè)計(jì)犧牲了整齊可比且在因子和水平多時(shí)效率高,而中心復(fù)合設(shè)計(jì)(central composite design,CCD),亦稱為星點(diǎn)設(shè)計(jì),是一種新型的試驗(yàn)設(shè)計(jì)方法,它具有試驗(yàn)次數(shù)少,試驗(yàn)精度高等特點(diǎn),可以解決均勻設(shè)計(jì)和正交試驗(yàn)設(shè)計(jì)優(yōu)化法的不足[1]。基于一定設(shè)計(jì)尋找最優(yōu)試驗(yàn)條件是我們?cè)囼?yàn)的目的,而采用的尋優(yōu)方法包括傳統(tǒng)尋優(yōu)法(直接法、等高圖法、最速上升或下降法等)和新近的解決全局優(yōu)化問題的遺傳算法等。本文將利用Design-Expert V8.0.6.1輸出等高線圖、SAS9.1RSREG過程及MATLAB2009a外掛SGSLAB工具箱單目標(biāo)遺傳算法程序?qū)ふ易顑?yōu)解,基于結(jié)果將對(duì)三種傳統(tǒng)優(yōu)化方法和遺傳算法的效果及特點(diǎn)比較。
1.CCD設(shè)計(jì)
中心復(fù)合設(shè)計(jì),多因素五水平的試驗(yàn)設(shè)計(jì),有完全中心復(fù)合設(shè)計(jì)和小規(guī)模中心復(fù)合設(shè)計(jì)[2],由2k析因設(shè)計(jì)或部分因子設(shè)計(jì)(規(guī)范化后通常用±l表示)加上2k個(gè)(k為因子數(shù))坐標(biāo)軸點(diǎn)(±α,0,0,…,0),(0,±α,0,…,0),……,(0,0,0,…,±α),和相應(yīng)的nc個(gè)中心點(diǎn)(0,0,…0)組成。小規(guī)模CCD設(shè)計(jì)采用的是非對(duì)稱的最小試驗(yàn)次數(shù)優(yōu)化法,因子數(shù)與完全CCD設(shè)計(jì)不同;α的適當(dāng)選擇可以滿足旋轉(zhuǎn)性和實(shí)現(xiàn)試驗(yàn)的序貫性,改善預(yù)測(cè)精度,上述兩種情況的α也是不同的,例如k=3時(shí)完全CCD設(shè)計(jì)α=1.682或1.732,小規(guī)模CCD設(shè)計(jì)α=1.41;而中心點(diǎn)個(gè)數(shù)依因子數(shù)不同而不同,一般nc取4個(gè)以上。此設(shè)計(jì)的析因部分(圖1中立方體的頂點(diǎn)),用于估計(jì)一階項(xiàng)和交互作用項(xiàng);軸向點(diǎn)(圖1的星點(diǎn))用于估計(jì)二階響應(yīng)曲面模型的純平方項(xiàng);中心點(diǎn)(圖1立方體的中心)用于提供對(duì)一致精度和純誤差項(xiàng)的估計(jì)[3]。
2.模型的建立
基于CCD設(shè)計(jì)本身的特點(diǎn),擬合二次響應(yīng)面回歸模型是合理的,通常采用的二階模型表達(dá)式為:
i<j,m為因素個(gè)數(shù)。
圖1 CCD設(shè)計(jì)(k=3)
3.四種優(yōu)化方法
(1)直接法
根據(jù)實(shí)驗(yàn)設(shè)計(jì)獲得的試驗(yàn)數(shù)據(jù)和響應(yīng)指標(biāo)值限制條件,在設(shè)計(jì)的試驗(yàn)范圍內(nèi)直接尋找相對(duì)符合條件的最優(yōu)解,即根據(jù)試驗(yàn)數(shù)據(jù)及分析結(jié)果,計(jì)算各因素不同水平下響應(yīng)指標(biāo)的平均值或合計(jì),在因素間無交互作用時(shí),選擇各因素不同水平下響應(yīng)指標(biāo)的平均值或合計(jì)最大或最小時(shí)的因素水平為最優(yōu)條件;在某些因素之間的交互作用有統(tǒng)計(jì)學(xué)意義時(shí),首先要計(jì)算存在交互作用的因素各水平在試驗(yàn)中的各種組合條件下響應(yīng)指標(biāo)的平均值或合計(jì),無交互作用因素最優(yōu)條件選擇同前,綜合兩類因素的結(jié)果,就可確定含有交互現(xiàn)象時(shí)各因素的最優(yōu)條件[4]。
(2)最速上升(下降)法
沿著響應(yīng)值有最大增量的方向逐步移動(dòng),直到響應(yīng)不再增加(減少)為止,通常分析方法包括典型分析和嶺脊分析:進(jìn)行典型分析后,如果特征值有正有負(fù),則進(jìn)行嶺脊分析,其原理是以原始設(shè)計(jì)中心點(diǎn)為球心、r為半徑的超球面與響應(yīng)面的交點(diǎn)形成的軌跡范圍內(nèi)找出最佳響應(yīng)值,即最佳工藝條件[5],此過程可通過SAS9.1 PROC RSREG完成。
(3)等高線法
通過繪制等高線圖和響應(yīng)曲面,結(jié)合優(yōu)化條件,在系列圖中找尋最優(yōu)解,此過程在本文是通過Design-Expert V8.0.6.1完成。
(4)遺傳算法
模仿自然界生物進(jìn)化機(jī)制的隨機(jī)全局搜索的優(yōu)化方法,通過設(shè)置MATLAB單目標(biāo)遺傳算法程序的參數(shù)后搜索最優(yōu)解。本文參數(shù)設(shè)置為初始種群=30、單點(diǎn)交叉概率=0.75、最大進(jìn)化代數(shù)=100時(shí),隨機(jī)進(jìn)行20次搜索。
1.數(shù)據(jù)資料
木糖降解需要木聚糖酶,經(jīng)研究發(fā)現(xiàn)木聚糖酶在經(jīng)鏈霉菌屬P12-137發(fā)酵獲得時(shí)其活性受木糖底物、硝酸鉀含量、麥麩含量的影響,故試驗(yàn)的影響因素為麥麩、硝酸鉀、木糖含量,而其響應(yīng)指標(biāo)為木聚糖酶含量。本項(xiàng)研究的試驗(yàn)設(shè)計(jì)是小規(guī)模CCD設(shè)計(jì),其因素編碼水平表和試驗(yàn)結(jié)果分別見表1、表2。
表1 因素編碼水平
表2 CCD設(shè)計(jì)試驗(yàn)過程及結(jié)果
2.模型的建立及評(píng)價(jià)
利用Design-Expert V8.0.6.1軟件,采用逐步篩選法(α入=0.10,α出=0.15)建立二階響應(yīng)模型為經(jīng)方差分析得:所建的二次模型是有統(tǒng)計(jì)學(xué)意義的(F=4.95,P=0.0210),且擬合不足部分無統(tǒng)計(jì)學(xué)差別(F=2.87,P=0.1656),說明模型擬合是良好的。
3.試驗(yàn)條件的優(yōu)化
最速上升法、等高線圖法及遺傳算法的尋優(yōu)均是建立在上述所建模型基礎(chǔ)上進(jìn)行的,這是方法本身所決定的。
(1)直接法
X1與X2、X2與X3之間的交互作用項(xiàng)具有統(tǒng)計(jì)學(xué)意義,根據(jù)現(xiàn)有的設(shè)計(jì)水平組合,X1與X2分別在-1和1水平時(shí),木聚糖酶含量較高為27.77 UA/m l,而X2與X3都為1水平時(shí)木聚糖酶含量較高,恰好為第七次試驗(yàn)方案,故直接法尋優(yōu)結(jié)果:麥麩量為1%,硝酸鉀為1%,木糖含量為0.5%時(shí)獲得最大的木聚糖酶含量,為27.77 UA/m l。
(2)最速上升法
典型分析的特征值有正有負(fù),所以需要進(jìn)行嶺脊分析,結(jié)果見表3,得出的木聚糖酶提取的最優(yōu)條件為:麥麩量為1.88%,硝酸鉀為0.16%,木糖含量為0.20%時(shí)獲得最大的木聚糖酶含量23.93 UA/m l。
(3)等高線圖
搜索的24次結(jié)果中1號(hào)相對(duì)最優(yōu),結(jié)果見圖2,最優(yōu)條件為麥麩、硝酸鉀、木糖含量分別為0.80%、1.16%、0.80%時(shí)獲得相對(duì)最大木聚糖酶含量47.07 UA/m l;另外由系列響應(yīng)曲面圖(圖2右側(cè))可知X1與X2存在交互作用,且KNO3對(duì)響應(yīng)影響較大。
圖2 X3=0.80,X1、X2變動(dòng)時(shí)Y的等高線圖與響應(yīng)曲面圖
表3 嶺脊分析表
(4)遺傳算法
由MATLAB2009a的單目標(biāo)遺傳算法程序搜索20次(僅列出8次,見表4),較理想的結(jié)果為麥麩、硝酸鉀、木糖含量分別為0.83%、1.13%、0.72%時(shí)獲得相對(duì)最大木聚糖酶含量51.04 UA/m l。
表4 遺傳算法部分搜索結(jié)果
4.四種優(yōu)化結(jié)果的比較
對(duì)于本試驗(yàn)數(shù)據(jù)尋優(yōu)結(jié)果可知,遺傳算法尋優(yōu)的木聚糖酶含量比直接法、最速上升法、等高線法分別增加23.27 UA/m l、27.11 UA/m l、3.97UA/m l,提高了83.8%、113.3%、8.43%;在傳統(tǒng)優(yōu)化方法尋優(yōu)結(jié)果中,等高線法、直接法比最速上升法增加了23.14 UA/ m l、3.84 UA/m l,提高了96.7%、16.0%。
從優(yōu)化方法的特點(diǎn)而言,直接法是在一定實(shí)驗(yàn)設(shè)計(jì)范圍內(nèi)通過求平均值尋找優(yōu)化結(jié)果,可較快找出相對(duì)的最優(yōu)解,不能保證局部或全局最優(yōu),但基于試驗(yàn)設(shè)計(jì)的優(yōu)化,可為預(yù)試驗(yàn)或試驗(yàn)提供較理想的結(jié)果;等高線法亦基于試驗(yàn)結(jié)果基礎(chǔ)上,通過軟件繪制等高線時(shí),僅兩個(gè)因素可以在試驗(yàn)范圍內(nèi)變化,其他的因素保持在某個(gè)水平,而導(dǎo)致找出最優(yōu)解過程相對(duì)于前者復(fù)雜和主觀性強(qiáng),但結(jié)果比較直觀,可得出局部相對(duì)最優(yōu)解和哪個(gè)因素影響大或是小,但不能保證在更大的空間范圍內(nèi)為最優(yōu),而且在試驗(yàn)為多因素多水平(因素在三或三個(gè)以上,在繪圖時(shí),需固定兩個(gè)因素以外的其他因素,有時(shí)繪不出等高線)、多個(gè)響應(yīng)指標(biāo)時(shí)比較復(fù)雜,不易給出最優(yōu)解;最速上升(下降)法通過求各因素偏導(dǎo)數(shù)基礎(chǔ)上典型分析確定穩(wěn)定點(diǎn),若穩(wěn)定點(diǎn)遠(yuǎn)離二次響應(yīng)面模型的探測(cè)區(qū)域時(shí),還需進(jìn)行嶺脊分析,隨著因素增多,求解過程難度變大或不易求出,而且存在多目標(biāo)優(yōu)化時(shí)不能直接使用,最優(yōu)解也只能是局部最優(yōu);本試驗(yàn)中遺傳算法的結(jié)果和最速上升法相當(dāng),是由于本試驗(yàn)采用星點(diǎn)設(shè)計(jì),擬合效果較好,已經(jīng)接近最優(yōu)點(diǎn)所在區(qū)域,所以最速上升法的效果才比較好,并不是最速上升法所有情況下優(yōu)化效果都好。
從優(yōu)化方法的效果而言,在這四種優(yōu)化方法中等高線法及遺傳算法優(yōu)化效果最好,最速上升法次之,直接法處于相對(duì)劣勢(shì)。造成這四種方法優(yōu)化效果差別的原因:(1)四種優(yōu)化方法本身的優(yōu)化特點(diǎn)是不同的,而遺傳算法始終是在全局范圍內(nèi)尋找最優(yōu)解;(2)試驗(yàn)所選擇設(shè)計(jì)類型及因素水平數(shù)不同,擬合的方程也將不同,所以建立在模型基礎(chǔ)上的優(yōu)化效果也是不同的。本項(xiàng)研究所采用的中心復(fù)合設(shè)計(jì),擬合二次響應(yīng)曲面方程,基于設(shè)計(jì)和模型的優(yōu)化所確定的最優(yōu)區(qū)域沒有偏離真實(shí)的最優(yōu)區(qū)域很遠(yuǎn),所以傳統(tǒng)優(yōu)化方法尤其是等高圖法與遺傳算法的效果相差不大。
在選擇優(yōu)化方法時(shí),因素較少、條件簡(jiǎn)單時(shí)可以使用傳統(tǒng)的優(yōu)化方法,直接法適用于粗略尋找最優(yōu)解,如若要求較嚴(yán)格,可選用等高線法或是最速上升(下降)法;因素較多、條件復(fù)雜時(shí)應(yīng)采用遺傳算法。
1.劉艷杰,項(xiàng)榮武.星點(diǎn)設(shè)計(jì)效應(yīng)面法在藥學(xué)試驗(yàn)設(shè)計(jì)中的應(yīng)用.中國(guó)現(xiàn)代應(yīng)用藥學(xué)雜志,2007,24(6):455-457.
2.Draper NR,Lin DKJ.Small Response-Surface Designs.Technometrics,1990,32(2):187-194.
3.胡雅琴,何楨.響應(yīng)曲面二階設(shè)計(jì)方法比較研究.天津大學(xué),2005.
4.仇麗霞,劉桂芬.多因素試驗(yàn)優(yōu)化算法及醫(yī)學(xué)應(yīng)用.山西醫(yī)科大學(xué),2003.
5.王黎明,夏文水.水法提取茶多糖工藝條件優(yōu)化.食品科學(xué),2005,26(5):171-174.
(責(zé)任編輯:郭海強(qiáng))
Com parison of Four M ethods on Optim izing Conditions by Using the Central Com posite Design
Feng Ruimei,Wang Ting,Dai Shuai,et al(ShanxiMedicalUniversity(030001),Taiyuan)
ObjectiveThe characteristics of the optimalmethods can be learned after carrying outa single objective optim ization bymeans of them.MethodsThe optimal parameter status of the production of xylanasesw ill be optim ized using the directmethod,the contoursmethod,the steepest rising or falling method and genetic algorithm.Based on the optimal results,we can come to some conclusions.ResultsThe production of xylanases after optim izing through the above four methods are 27.77UA/m l,23.93UA/m l,47.07UA/m l and 51.04UA/m l,respectively.ConclusionThe directmethod can find solutions in a short time,which may not be best in a local or a global area.In an optim izing example of a single objective designed by central composite design,the optimal effect of contoursmethod was closer to genetic algorithm;thatwhich factor wasmore influential can be observed in the contoursmethod,which can notavoid the defaults of the local optim ization and subjectivity.The steepest rising method was prone to giving the disadvantage solution while ignoring other advantage results.
Central composite design;Traditional optimalmethods;Genetic algorithm;Optimal parameter status
*:國(guó)家自然科學(xué)基金項(xiàng)目(30872183)
1.山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室(030001)
2.Glasgow Caledonian University
△通信作者:仇麗霞,E-mail:qlx-1126@163.com