蘇 晴, 張崇岐
(廣州大學(xué) 經(jīng)濟(jì)與統(tǒng)計(jì)學(xué)院, 廣東 廣州 510006)
混料試驗(yàn)設(shè)計(jì)具有特殊的研究意義:?jiǎn)为?dú)使用某種要素的效果不如(或優(yōu)于)幾個(gè)要素一起使用產(chǎn)生的效果[1].這幾種要素可以被認(rèn)為是幾種特性指標(biāo),根據(jù)它們的作用效果不同稱(chēng)幾種要素間有對(duì)抗(或協(xié)同)作用,而這些特性指標(biāo)與混料試驗(yàn)中的混料占比息息相關(guān)[2].在混料試驗(yàn)中響應(yīng)指標(biāo)只與各成分在配方中所占比例有關(guān)而與總量無(wú)關(guān).混料試驗(yàn)的目的是考察各成分所占比例對(duì)響應(yīng)指標(biāo)的影響,從而找到最優(yōu)的配方比例.
混料試驗(yàn)在實(shí)際生活和工業(yè)領(lǐng)域應(yīng)用廣泛,在農(nóng)業(yè)上,李紅偉等[3]在磷酸鹽對(duì)肉制品持水力影響的研究中通過(guò)混料試驗(yàn)設(shè)計(jì)進(jìn)行研究,王鑫系[4]運(yùn)用混料模型研究西瓜包膜控釋尿素配比的問(wèn)題,王晨光等[5]在做超微粉碎預(yù)處理沙柳原料酶解條件優(yōu)化中同樣運(yùn)用了混料試驗(yàn).在工業(yè)上,黃壘等[6]進(jìn)行了鐵基金剛石鉆頭胎體配方的混料試驗(yàn)研究,賈春林等[7]研究了基于混料試驗(yàn)優(yōu)化煤氣化復(fù)配助熔劑的問(wèn)題,王大成等[8]基于混料的理論建立了混合垃圾燃燒試驗(yàn)及活化能回歸方程的建立.在理論研究中,張崇岐等[9]對(duì)混料試驗(yàn)的變量選擇AIC準(zhǔn)則進(jìn)行了研究,李光輝等[10]研究了具有復(fù)雜約束混料試驗(yàn)的漸進(jìn)D-最優(yōu)設(shè)計(jì),燕飛[11]將混料模型結(jié)合組合投資進(jìn)行了研究.
混料試驗(yàn)設(shè)計(jì)在傳統(tǒng)的求最優(yōu)的過(guò)程中有不足之處,或是優(yōu)化的效率較低,或是獲得的最優(yōu)解為局部最優(yōu)解等現(xiàn)象.按照最優(yōu)化的結(jié)果,可把最優(yōu)化方法分為局部最優(yōu)和全局最優(yōu).在實(shí)際問(wèn)題中,所要求得的最優(yōu)解常為全局最優(yōu)解.為了彌補(bǔ)這一類(lèi)的情況發(fā)生,從20世紀(jì)50年代起進(jìn)化算法得到了發(fā)展.通常情況下,進(jìn)化算法被認(rèn)為是由遺傳算法、進(jìn)化規(guī)劃和進(jìn)化策略組成的[12].本文主要研究遺傳算法,首先介紹了混料模型的基礎(chǔ)知識(shí)并說(shuō)明混料模型使用遺傳算法求解的基本原理,然后通過(guò)實(shí)例分析說(shuō)明運(yùn)用遺傳算法求解混料的最優(yōu)設(shè)計(jì)的過(guò)程,并驗(yàn)證運(yùn)用遺傳算法求解混料試驗(yàn)?zāi)P褪蔷哂锌尚行郧耀@得的結(jié)果是較優(yōu)的,最后進(jìn)行了總結(jié)與展望.
一般混料模型為
y=βTf(x)+ε,x∈,
其中,y為響應(yīng)變量,x=(x1,x2,…,xq),β為未知參數(shù)組成的d維列向量,f(x)為x∈χ上給定的d維函數(shù)列向量,χ為一個(gè)封閉緊集,ε是均值為0方差為常數(shù)的隨機(jī)誤差.每個(gè)分量都必須表示成混料的百分比.對(duì)于q分量的混料試驗(yàn)設(shè)計(jì),各分量比例x1,x2,…,xq需要滿(mǎn)足基本約束條件
從而由各分量構(gòu)成了(q-1)維正規(guī)單純形
在實(shí)際應(yīng)用中,混料試驗(yàn)往往還受其他約束條件的限制,此時(shí)混料試驗(yàn)域可表示為
其中,C′s為附加的約束條件.常見(jiàn)的附加約束條件主要有三種形式[13]:
(1)兼有上、下界約束的條件
SCCs:0≤ai≤xi≤bi≤1,j=1,2,…,q;
(2)線(xiàn)性約束條件
(3)非線(xiàn)性約束條件
NCCs:aj≤φj(x1,x2,…,xq)≤bj≤1,j=1,2,…,l,
其中,aj,bj都為已知的常數(shù),φj(x1,x2,…,xq)是各變量的非線(xiàn)性函數(shù).
混料模型因其特殊的試驗(yàn)域,若使用常規(guī)的完全多項(xiàng)式模型,無(wú)論試驗(yàn)設(shè)計(jì)如何,其信息矩陣總是退化的.因此,在一般混料試驗(yàn)設(shè)計(jì)中常選擇Scheffé規(guī)范多項(xiàng)式模型,常用的q分量m階混料規(guī)范多項(xiàng)式形式如下:
當(dāng)m=1時(shí),
當(dāng)m=2時(shí),
當(dāng)m=3時(shí),
由上可知,模型參數(shù)個(gè)數(shù)會(huì)隨著分量q和模型階數(shù)m的增加而快速增加.
遺傳算法是一種模擬生物界的自然選擇機(jī)制和仿照自然界的遺傳機(jī)制的隨機(jī)搜索算法,其本質(zhì)特征在于群體搜索的策略和簡(jiǎn)單的遺傳算子[14].群體搜索策略可以實(shí)現(xiàn)整個(gè)解空間上的分布式信息采集和探索,遺傳算子可以降低一般啟發(fā)式算法在搜索過(guò)程中對(duì)人機(jī)交互的依賴(lài)性[14].
基于遺傳算法求混料模型最優(yōu)的基本步驟如下:
(1)編碼.將一個(gè)混料試驗(yàn)設(shè)計(jì)的試驗(yàn)域轉(zhuǎn)換到遺傳算法所能處理的搜索空間;
(2)選擇.在混料試驗(yàn)域轉(zhuǎn)換到的搜索空間中選擇適應(yīng)度較強(qiáng)的個(gè)體,從而產(chǎn)生新的群體;
(3)交叉.在混料試驗(yàn)域轉(zhuǎn)換的搜索空間中,進(jìn)行兩組試驗(yàn)點(diǎn)的選擇,然后交換選擇出來(lái)的兩組試驗(yàn)點(diǎn)的某個(gè)或某些混料分量.其中,交叉算子的設(shè)計(jì)需要考慮兩方面:如何確定交叉點(diǎn)位置和如何進(jìn)行部分基因的交換;
(4)變異.以較小的概率對(duì)混料試驗(yàn)點(diǎn)的某個(gè)或部分混料分量值進(jìn)行改變.變異可以避免混料模型得到的最優(yōu)解為局部最優(yōu)解,并防止早熟現(xiàn)象的出現(xiàn);
(5)適應(yīng)度函數(shù).是度量在混料試驗(yàn)域轉(zhuǎn)換的搜索空間中個(gè)體適應(yīng)度的函數(shù).該函數(shù)基于實(shí)例情況中的目標(biāo)函數(shù)所確定,主要作用是區(qū)分群體中個(gè)體的好壞;
(6)結(jié)合混料模型和實(shí)際情況選擇控制的參數(shù).該參數(shù)的選擇會(huì)影響算法的收斂性,混料模型中的群體規(guī)模大小會(huì)對(duì)收斂性和計(jì)算效率兩個(gè)方面有所影響;
(7)根據(jù)模型需求分析出滿(mǎn)足實(shí)際的約束條件并加以處理.
在實(shí)際運(yùn)用的過(guò)程中,通過(guò)遺傳算法求混料模型最優(yōu)的工作流程[12]如下:
迭代開(kāi)始:
t=0,
初始化:
P(0)={a1(0),a2(0),…,an(0)},
適應(yīng)性評(píng)價(jià):
P(0)={f(a1(0)),f(a2(0)),…,f(an(0))},
循環(huán)條件:
T(P(t))≠truedo,
選擇:
P′(t)=s(P(t),ps),
交叉:
P″(t)=c(P′(t),pc),
變異:
P?(t)=m(P″(t),pm),
新一代群體:
P(t+1)=P?(t),t=t+1,
適應(yīng)性評(píng)價(jià):
P(t+1)={f(a1(t+1)),f(a2(t+1)),…,f(an(t+1))},
結(jié)束.
由混料試驗(yàn)設(shè)計(jì)的基本約束條件可知,其中的各個(gè)分量最小值為0,即在單純形格子設(shè)計(jì)中,絕大多數(shù)的試驗(yàn)點(diǎn)混料的分量都有一個(gè)或者多個(gè)的分量為0.但在實(shí)際應(yīng)用和試驗(yàn)中,很多情況下是不允許大多數(shù)的分量為0的,否則就會(huì)失去該模型的意義[15].為更清晰地說(shuō)明運(yùn)用遺傳算法獲得混料模型最優(yōu)設(shè)計(jì)的方法,結(jié)合實(shí)例加以分析.
數(shù)據(jù)來(lái)源于文獻(xiàn)[16],摘取該文獻(xiàn)中研究煤矸石與不同基質(zhì)不同配比下小白菜生長(zhǎng)的研究的部分?jǐn)?shù)據(jù).原數(shù)據(jù)作者旨在研究煤矸石與壤土、煤矸石與沙土的混合基質(zhì),分別對(duì)小白菜生長(zhǎng)的平均株高的影響.為了優(yōu)化試驗(yàn),本次試驗(yàn)的目的是研究同時(shí)含有煤矸石、壤土和沙石三種成分的混合基質(zhì)對(duì)小白菜生長(zhǎng)的平均株高的影響,并且尋求達(dá)到小白菜最優(yōu)生長(zhǎng)的平均株高時(shí)煤矸石、壤土和沙石的比例.原始數(shù)據(jù)來(lái)源于三個(gè)表格:供試基質(zhì)及其配比比例、煤矸石與壤土不同比例對(duì)小白菜種子出苗率的影響和煤矸石與沙土不同比例對(duì)小白菜種子出苗率的影響.
本例共有20組數(shù)據(jù).由于實(shí)例問(wèn)題為研究三種不同物質(zhì)的共同作用,所以該混料試驗(yàn)?zāi)P瓦x定為3分量規(guī)范混料模型,x1、x2和x3分別對(duì)應(yīng)煤矸石、壤土和沙土的混料分量,小白菜的平均株高為響應(yīng)值y.經(jīng)過(guò)處理后的數(shù)據(jù)表1滿(mǎn)足混料試驗(yàn)?zāi)P偷囊?
表1 混料模型試驗(yàn)點(diǎn)坐標(biāo)值與對(duì)應(yīng)的響應(yīng)值
結(jié)合數(shù)據(jù)來(lái)源的實(shí)際應(yīng)用情況以及本次試驗(yàn)的目的,該模型的混料分量需滿(mǎn)足以下的約束條件:
在此前提下進(jìn)行模型擬合,尋找其最優(yōu)設(shè)計(jì).
使用表1的數(shù)據(jù),選擇3分量3階混料規(guī)范多項(xiàng)式擬合得到如下:
y=8.258 52x1+4.511 83x2+4.361 07x3-
3.497 32x1x2-3.617 26x1x3-
1.437 71x1x2(x1-x2)-1.549 70x1x3(x1-x3)
(1)
并繪制該混料規(guī)范多項(xiàng)式的三維響應(yīng)曲面圖(左)和預(yù)測(cè)響應(yīng)(右)等值線(xiàn)圖如圖1.
圖1 三維響應(yīng)曲面圖(左)和預(yù)測(cè)響應(yīng)等值線(xiàn)圖(右)
為驗(yàn)證該模型的擬合程度,通過(guò)方差分析表進(jìn)行檢驗(yàn)(表2).
表2 方差分析表
觀察表2可知,該模型的P<0.000 1,說(shuō)明該混料試驗(yàn)?zāi)P捅硎咀兞块g的關(guān)系是顯著的,通過(guò)了F檢驗(yàn),認(rèn)為式(1)能夠合理地描述此混料試驗(yàn).
使用遺傳算法求得本例模型的最優(yōu)設(shè)計(jì).由于最優(yōu)設(shè)計(jì)的試驗(yàn)?zāi)康氖乔蟮媚繕?biāo)函數(shù)的最大值,且Matlab中函數(shù)優(yōu)化是使適應(yīng)度函數(shù)最小化,需設(shè)適應(yīng)度函數(shù)為f=-y,并對(duì)遺傳算法中所要用到的參數(shù)進(jìn)行初始設(shè)定如表3所示.
表3 算法參數(shù)的初始值
運(yùn)行程序,遺傳算法的輸出結(jié)果停留在第163代,此時(shí)x1=0.600、x2=0.298和x3=0.102時(shí),適應(yīng)度函數(shù)為最小值f=-5.780.最佳適應(yīng)度值隨著遺傳算法的代數(shù)不斷增加而趨于一個(gè)穩(wěn)定情況.每代原始得分對(duì)應(yīng)的期望值隨著每代原始得分的不斷增加而不斷降低,并且從集中分布趨于分散分布.每代個(gè)體的范圍由初始范圍[-10,10]開(kāi)始一直逐漸減小并趨于穩(wěn)定,除了70代到90代區(qū)間有明顯的波動(dòng)趨勢(shì),90代以后穩(wěn)定于-5.790左右.遺傳個(gè)體的譜系圖(圖2)展現(xiàn)了其中父輩的個(gè)體數(shù)和子代的個(gè)體數(shù)比例差異,并且可以發(fā)現(xiàn),該比例是較為穩(wěn)定的.
圖2 算法的輸出結(jié)果
因此,在混合基質(zhì)同時(shí)含有三種成分的前提下,當(dāng)煤矸石、壤土和沙石三種成分所占比例分別為60.00%,29.80%和10.20%時(shí),小白菜達(dá)到最優(yōu)生長(zhǎng)的平均株高5.78 cm.
本文給出使用遺傳算法求混料模型最優(yōu)設(shè)計(jì)的實(shí)證分析.混料試驗(yàn)?zāi)P妥顐鹘y(tǒng)獲取其最優(yōu)解的方式是通過(guò)觀測(cè)等值線(xiàn)圖獲取,但由于人為觀測(cè)的不準(zhǔn)確性,容易造成較大誤差.在理論研究和工農(nóng)業(yè)應(yīng)用中,混料模型的試驗(yàn)域通常情況下不是標(biāo)準(zhǔn)的單純形,而是不規(guī)則的試驗(yàn)域,這使得通過(guò)觀測(cè)等值線(xiàn)圖獲取最優(yōu)解的方法更困難.該情況下,凸顯了遺傳算法的優(yōu)勢(shì)所在,遺傳算法在保證混料試驗(yàn)?zāi)P蜐M(mǎn)足已知的約束條件情況下,通過(guò)群體搜索與遺傳算子的交叉變異和不斷的迭代,獲取混料試驗(yàn)?zāi)P偷淖顑?yōu)設(shè)計(jì),且該算法計(jì)算速度較快,獲得的結(jié)果較為準(zhǔn)確,說(shuō)明使用遺傳算法獲得混料模型最優(yōu)設(shè)計(jì)的方法值得推廣.