陳斌,劉西軍,張曉悅,陳曉東,劉國華
(1. 浙江水利水電??茖W(xué)校,杭州,310018;2. 中國水電顧問集團(tuán)華東勘測設(shè)計研究院,杭州,310014;3. 浙江大學(xué)建筑工程學(xué)院,杭州,310058)
在給定原材料品種、質(zhì)量及配合比的情況下,混凝土性能(包括強度、工作性和耐久性)具有唯一對應(yīng)值,因此必然是可預(yù)測的。通過建立各種線性或非線性數(shù)學(xué)模型,使預(yù)測精度得到一定保證,則可用于混凝土配合比設(shè)計和生產(chǎn)質(zhì)量控制等各個方面,是混凝土工程的基礎(chǔ)性工作之一。傳統(tǒng)的混凝土性能預(yù)測方法以水灰比定則(保羅米公式)為代表,其認(rèn)為可塑性混凝土的抗壓強度完全受水灰比的控制,而與其他因素?zé)o關(guān)。近年來,由于混凝土不斷向高強、高性能化發(fā)展,成分不斷復(fù)雜,水灰比定則已不完全適用[1]。因而發(fā)展出各種調(diào)整方法。然而,最直接的混凝土性能預(yù)測,仍在于以原材料用量及質(zhì)量為自變量,通過合適的數(shù)學(xué)模型,直接推求混凝土性能,已被證明比以各種比率指標(biāo)(如水膠比、砂率、漿骨比等)為自變量推求混凝土性能更為有效[2]。筆者基于國內(nèi)文獻(xiàn)公開發(fā)表的613組配合比,采用逐步線性回歸和支持向量機等方法,建立混凝土性能預(yù)測模型;繼而采用線性規(guī)劃的單純形法、粒子群算法建立配合比優(yōu)化模型,最終集成為Compos混凝土性能預(yù)測及配合比優(yōu)化專家系統(tǒng)。系統(tǒng)同時提供了按《規(guī)范》(JGJ55-2000)設(shè)計配合比和大體積混凝土溫度場分析功能。
預(yù)測、優(yōu)化變量的選取見表1、表2。
多元線性回歸是最簡單、最直接的變量相關(guān)性統(tǒng)計分析方法,具有物理意義明確、確定性強等優(yōu)點。由于混凝土性能預(yù)測模型的自變量數(shù)量較多,可能并非所有的自變量都與因變量有顯著關(guān)系,換言之,部分自變量的作用可以忽略,其加入甚至可能降低模型的預(yù)測準(zhǔn)確性。因而產(chǎn)生了如何從大量可能相關(guān)的自變量中挑選出對因變量有顯著影響的部分自變量的問題。逐步回歸分析方法應(yīng)運而生,其基本思想是:將變量逐個引入,引入變量的條件為偏回歸平方和經(jīng)檢驗是顯著的,同時每引入一個新變量后,對已選入的變量逐個檢驗,將不顯著變量剔除。這樣保證最后所得的變量子集中的所有變量都是顯著的,經(jīng)若干步后,可得“最優(yōu)”變量子集。有關(guān)逐步線性回歸方法的具體算法可參考相關(guān)文獻(xiàn)[3],本文不贅述。Compos系統(tǒng)的多元逐步線性回歸界面,如圖1所示。
表1 預(yù)測、優(yōu)化模型的可選自變量
表2 預(yù)測、優(yōu)化模型的可選因變量
2.2 BP人工神經(jīng)網(wǎng)絡(luò)
線性回歸模型雖然具有簡單、直接的優(yōu)點,但擬合能力有限。若混凝土性能與各自變量間存在非線性關(guān)系,則需采用非線性預(yù)測模型。最常規(guī)的非線性模型當(dāng)屬多項式擬合。根據(jù)泰勒定理,當(dāng)泰勒級數(shù)的項次趨向無窮時,可以任意精度擬合任何函數(shù)。但是經(jīng)驗表明,多項式擬合計算效率較低,但自變量數(shù)量較多時,耗時量相當(dāng)大,且實際選用的項次不可能過多。近年來,人工神經(jīng)網(wǎng)絡(luò)模型(主要為BP人工神經(jīng)網(wǎng)絡(luò))受到較多關(guān)注。所謂BP人工神經(jīng)網(wǎng)絡(luò),就是以輸入單元為自變量,輸出單元為因變量、網(wǎng)絡(luò)單元間的連接權(quán)值和閾值為調(diào)整參量,按最小誤差原則逐步反饋修正而使網(wǎng)絡(luò)達(dá)到最佳模擬狀態(tài)的一種數(shù)學(xué)算法。其拓?fù)浣Y(jié)構(gòu)如圖2所示[4]。
圖1 Compos系統(tǒng)的混凝土性能線性回歸分析界面
圖2 BP神經(jīng)網(wǎng)絡(luò)示意
BP神經(jīng)網(wǎng)絡(luò)的主要參數(shù)為隱含層(中間層)單元數(shù)。合適的隱層單元數(shù)選擇是一個比較復(fù)雜的問題,最佳的隱層單元數(shù)與輸入、輸出單元數(shù),訓(xùn)練集樣本數(shù)均有關(guān)系,目前尚無成熟的理論方法,基本上依賴經(jīng)驗選定。隱層單元數(shù)過少,訓(xùn)練達(dá)不到應(yīng)有精度,容易出現(xiàn)“欠擬合”;隱層單元數(shù)過多,則易出現(xiàn)“過擬合”。筆者經(jīng)過大量試驗,發(fā)現(xiàn)隱層單元數(shù)輸入樣本數(shù)的1/2(9個),預(yù)測精度基本已達(dá)到最優(yōu)??紤]輸入、輸出層單元數(shù)的變化,基本認(rèn)為隱層單元數(shù)取10,通常情況下均能適用。
為了控制過擬合,筆者進(jìn)一步提出了一種“誤差跟蹤策略”,即:首先進(jìn)行第一次網(wǎng)絡(luò)訓(xùn)練和預(yù)測,以其預(yù)測誤差作為最優(yōu)誤差的初始值。而后網(wǎng)絡(luò)每訓(xùn)練一次,立即對預(yù)測樣本組進(jìn)行預(yù)測,若預(yù)測誤差小于初始值,則取其為最優(yōu)值并記錄發(fā)生位置,如此不斷重復(fù)計算,直至網(wǎng)絡(luò)訓(xùn)練誤差或訓(xùn)練次數(shù)達(dá)到預(yù)定值為止,見圖3。從圖上看,預(yù)測相對誤差過程線開始上揚的A點,即為訓(xùn)練截止點,超過該點,網(wǎng)絡(luò)訓(xùn)練即進(jìn)入過擬合狀態(tài)。
BP人工神經(jīng)網(wǎng)絡(luò)具有較強的非線性擬合能力,但實踐表明,其過擬合控制能力較差。所謂“過擬合”,即指模型過度擬合樣本的個別甚至錯誤信息,而偏離了對整體規(guī)律的把握。支持向量機模型(SVMs)是一種基于統(tǒng)計學(xué)習(xí)理論的新型算法,其建立在統(tǒng)計學(xué)習(xí)理論的VC 維理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上,能有效抑制過擬合,被普遍認(rèn)為優(yōu)于人工神經(jīng)網(wǎng)絡(luò)[5,6]。
圖3 過擬合狀態(tài)示意
根據(jù)大數(shù)定律,式(2)只有當(dāng)樣本數(shù)n趨于無窮大且函數(shù)集足夠小時才成立。這實際上是假定最小二乘意義的擬合誤差最小作為建模的最佳判據(jù),結(jié)果導(dǎo)致擬合能力過強的算法的預(yù)報能力反而降低。為此,SLT用結(jié)構(gòu)風(fēng)險函數(shù) ][fRh代替 ][fRemp,并證明了 ][fRh可用下列函數(shù)求極小而得:
此處n為訓(xùn)練樣本數(shù)目,Sh為VC維空間結(jié)構(gòu),h為VC 維數(shù),即對函數(shù)集復(fù)雜性或者學(xué)習(xí)能力的度量。1-δ為表征計算的可靠程度的參數(shù)。
SLT要求在控制以VC維為標(biāo)志的擬合能力上界(以限制過擬合)的前提下追求擬合精度??刂芕C維的方法有三大類:1)拉大兩類樣本點集在特征空間中的間隔;2)縮小兩類樣本點各自在特征空間中的分布范圍;3)降低特征空間維數(shù)。一般認(rèn)為特征空間維數(shù)是控制過擬合的唯一手段,而新理論強調(diào)靠前兩種手段可以保證在高維特征空間的運算仍有低的VC維,從而保證限制過擬合。
對于分類學(xué)習(xí)問題,傳統(tǒng)的模式識別方法強調(diào)降維,而SVM與此相反。對于特征空間中兩類點不能靠超平面分開的非線性問題,SVM采用映照方法將其映照到更高維的空間,并求得最佳區(qū)分二類樣本點的超平面方程,作為判別未知樣本的判據(jù)。這樣,空間維數(shù)雖較高,但VC維仍可壓低,從而限制了過擬合。即使已知樣本較少,仍能有效地作統(tǒng)計預(yù)報。
對于回歸建模問題,傳統(tǒng)的算法在擬合訓(xùn)練樣本時,將有限樣本數(shù)據(jù)中的誤差也擬合進(jìn)數(shù)學(xué)模型了。針對傳統(tǒng)方法這一缺點,SVR采用“ε 不敏感函數(shù)”,即對于用f (x)擬合目標(biāo)值y時時,即認(rèn)為進(jìn)一步擬合是無意義的。這樣擬合得到的不是唯一解,而是一組無限多個解。SVR方法是在一定約束條件下,以取極小的標(biāo)準(zhǔn)來選取數(shù)學(xué)模型的唯一解。這一求解策略使過擬合受到限制,顯著提高了模型的預(yù)報能力。
當(dāng)混凝土性能預(yù)測模型為線性方程,則可采用線性規(guī)劃的單純形法進(jìn)行配合比優(yōu)化。以1m3混凝土的成本最低為優(yōu)化目標(biāo),以混凝土的設(shè)計強度、工作性或耐久性指標(biāo)為約束條件,優(yōu)化的數(shù)學(xué)模型表示如下:
式中, A = [ aij]m×n為線性約束方程組的系數(shù)矩陣;為線性約束方程組的右端項矩陣;x = [x ,x...x]T12n為原材料的用量;C =[c1,c2...cn]T為不同原材料的價格;m為約束條件數(shù)量,n為自變量數(shù)量。
單純形法通過從可行域的一個極點出發(fā),先判斷該點是否是極小點,如是,則運算結(jié)束;否則沿能使目標(biāo)函數(shù)下降的方向搜索,抵達(dá)下一個極點;繼續(xù)執(zhí)行這一過程,直到獲得最優(yōu)點為止。其基本過程包括求基本可行解,換基、轉(zhuǎn)軸運算等。有關(guān)單純形法的原理和計算過程可參見文獻(xiàn)[7]。圖4和圖5為采用單純形法優(yōu)化混凝土配合比的參數(shù)設(shè)定及計算結(jié)果界面。
圖4 Compos系統(tǒng)優(yōu)化配合比的參數(shù)選擇界面
圖5 Compos系統(tǒng)優(yōu)化混凝土配合比的結(jié)果輸出界面
粒子群優(yōu)化算法或稱微粒群算法(PSO)是1995年Russell Eberhart和James Kennedy提出的[8],PSO源于人工生命理論和鳥類和魚類的群集行為,是一種基于群體智能的優(yōu)化技巧。與其他進(jìn)化類算法相似,PSO也采用“群體”與“進(jìn)化”的概念,同樣也是依據(jù)個體(粒子)對環(huán)境的適應(yīng)度大小進(jìn)行操作,所不同的是粒子群算法不像其他進(jìn)化算法那樣對于個體使用進(jìn)化算子,而是將每個個體看作是在多維搜索空間中沒有體積和重量的粒子,以一定的速度飛行搜索,并按照個體的飛行經(jīng)驗和群體飛行經(jīng)驗動態(tài)地調(diào)整飛行的速度,經(jīng)若干代的并行搜索趨近最優(yōu)解?,F(xiàn)考慮如下的優(yōu)化模型:
其中,f ( X)為定義在D維歐氏空間 ED的區(qū)域S上的實函數(shù),設(shè) N為群體規(guī)模,為粒子i的當(dāng)前位置,為粒子i的當(dāng)前飛行速度,fitnessi= f (Xi)為粒子i的適應(yīng)度值,其中 i = 1 , 2 ,L,N.記pbesti和分別為粒子i曾經(jīng)達(dá)到的最佳適應(yīng)度值及其對應(yīng)于D維空間中的位置,gbest和 Pg=(pg1, pg2,L,pgD)T分別為群體中所有粒子曾經(jīng)達(dá)到的最佳適應(yīng)度值及其對應(yīng)位置?;玖W尤核惴ú捎玫倪M(jìn)化方程(動態(tài)調(diào)整規(guī)則)是:
式中,下標(biāo)i表示第i個粒子,d表示粒子的第d維,t表示第t代,C1,C2為學(xué)習(xí)常數(shù),分別稱為認(rèn)知參數(shù)和社會參數(shù),通常在0~2間取值, r1~∪(0,1)和r2~∪(0,1)為兩個相互獨立的隨機數(shù)。
為了改善算法的收斂性能,1998年Y.Shi和R.C. Eberhart在速度進(jìn)化方程中引入慣性權(quán)重w[9],即:
采用(6)(7)式的稱基本粒子群算法,采用(8)(7)式的稱標(biāo)準(zhǔn)粒子群算法。
取混凝土各種原材料的用量為“粒子”,可建立上述的PSO優(yōu)化模型。優(yōu)化模型中,需考慮強度、工作性、耐久性等約束條件??刹捎眠m應(yīng)度與違反度雙值控制法。將約束條件與目標(biāo)函數(shù)分離,讓每個粒子都具有兩個函數(shù)值,一個對應(yīng)于目標(biāo)函數(shù)的適應(yīng)度值,一個對應(yīng)問題的約束條件,反映粒子關(guān)于約束的違反程度。
粒子的優(yōu)劣將由上述二個函數(shù)按一定規(guī)則決定:
a.當(dāng)二個粒子i和j都可行時,比較它們的適應(yīng)度值fitness i和fitness j,適應(yīng)度值小者為優(yōu);
b.當(dāng)二個粒子i和j都不可行時,比較它們違反度值voilationi和 vo ilationj ,違反度值小者為優(yōu);
c.當(dāng)粒子i可行,粒子j不可行,如果voilalionj>e則粒子i為優(yōu);若voilalionj<e則比較它們的適應(yīng)度值fitness i和fitness j,小的粒子為優(yōu)。有關(guān)PSO算法的具體過程可參見有關(guān)文獻(xiàn)[10]。圖6是PSO算法優(yōu)化混凝土配合比的過程。
以配合比數(shù)據(jù)庫為平臺,筆者集成了混凝土性能預(yù)測與配合比優(yōu)化系統(tǒng)。系統(tǒng)同時包含了按《普通混凝土配合比設(shè)計規(guī)程》(JGJ55-2011)和《水工混凝土試驗規(guī)程》(SL 352-2006)設(shè)計配合比,以及基于有限元法的大體積混凝土溫度場分析的模塊。系統(tǒng)框架如圖7所示。
圖6 PSO算法的優(yōu)化過程
圖7 Compos系統(tǒng)框架
系統(tǒng)同時具有Excel數(shù)據(jù)導(dǎo)入與導(dǎo)出、試驗調(diào)整等功能,方便用戶的整個配合比設(shè)計、試驗流程。
[1]陳斌,李富強,劉國華,等. 混凝土配合比的非線性多目標(biāo)優(yōu)化研究[J]. 浙江大學(xué)學(xué)報,2005, 39(1): 16-19.
[2]Dias W P S, Pooliyadda S P. Neural networks for predicting properties of concretes with admixtures[J]. Construction and Building Materials, 2001(15): 371-379.
[3]徐世良主編. C常用算法程序集(第二版)[M]. 北京:清華大學(xué)出版社,1996.
[4]劉國華,陳斌等,基于人工神經(jīng)網(wǎng)絡(luò)和Monte-Carlo法的混凝土配合比優(yōu)化設(shè)計研究,水力發(fā)電學(xué)報[J],2003(4):45-53.
[5]S. M. Gupta. Support Vector Machines based Modeling of Concrete Strength[J]. International Journal of Electrical and Computer Engineering, 2008,3(5): 312-318.
[6]崔海霞. 高強混凝土強度預(yù)測的支持向量機模型及應(yīng)用[J]. 混凝土, 2010(5): 49-51.
[7]汪樹玉,劉國華. 系統(tǒng)分析[M]. 杭州:浙江大學(xué)出版社,2002.
[8]Kennedy J., Eberhart R.C . Particle swarm optimization [C].In: Proc. IEEE Int. conf. on neutral network,1995,1942-1948
[9]Shi Y., Eberhart R.C. A modified particle swarm optimizer[C]. In: IEEE world congress on computational intellegence,1998, 69-73.
[10]劉華瑩,林玉娥,王淑云. 粒子群算法的改進(jìn)及其在求解約束優(yōu)化問題中的應(yīng)用[J]. 吉林大學(xué)學(xué)報(理學(xué)版),2005(4):