王 響, 邵應(yīng)峰, 沈 霞, 張 燚, 張子陽(yáng)
(1.河海大學(xué)巖土力學(xué)與堤壩工程教育部重點(diǎn)實(shí)驗(yàn)室,南京 210098; 2.河海大學(xué)巖土工程科學(xué)研究所,南京 210098)
隨著經(jīng)濟(jì)的發(fā)展和社會(huì)的進(jìn)步,我國(guó)城市化發(fā)展進(jìn)程加快. 在進(jìn)行城市排水管網(wǎng)建設(shè)過(guò)程中,由于施工條件復(fù)雜,經(jīng)常出現(xiàn)溝槽部?jī)蛇叺目v向裂縫及溝槽部位的明顯凹槽現(xiàn)象. 出現(xiàn)這些現(xiàn)象,是因?yàn)闇喜蹖挾冗^(guò)小,難以使用重型壓實(shí)機(jī)械壓實(shí),導(dǎo)致溝槽回填土壓實(shí)度達(dá)不到設(shè)計(jì)要求[1]. 另外,在進(jìn)行溝槽開(kāi)挖過(guò)程中,會(huì)產(chǎn)生大量廢棄土,這些棄土由于缺乏有效監(jiān)管,容易造成占用土地、破環(huán)城市市容并惡化城市環(huán)境衛(wèi)生等方面的危害[2];自密實(shí)水泥土是為解決上述難題而研究出來(lái)的一種新技術(shù),充分利用開(kāi)挖的廢棄土,用水泥改良后,可以形成具有自密實(shí)性質(zhì)且強(qiáng)度可調(diào)的一種新型填筑材料[3],不僅可以解決溝槽回填壓實(shí)度問(wèn)題,還可以減少棄土的運(yùn)輸費(fèi)用[4].
管道溝槽回填土的設(shè)計(jì)主要有強(qiáng)度[5]和滲透性[6],水泥土作為一種復(fù)合材料,其強(qiáng)度主要受配合比的影響,在配合比設(shè)計(jì)中通??紤]的影響因素有含水率、水泥摻入比、外摻劑等[7]. 賈堅(jiān)[8]通過(guò)室內(nèi)試驗(yàn)發(fā)現(xiàn),綜合含水量和水泥摻入比是影響水泥土強(qiáng)度的關(guān)鍵因素,因此,本文選用水泥摻入比和含水量這兩個(gè)影響因素預(yù)測(cè)水泥土強(qiáng)度. 當(dāng)水泥土強(qiáng)度和影響因素之間的關(guān)系為線(xiàn)性[9]、指數(shù)[10]、和對(duì)數(shù)[11]等簡(jiǎn)單情況下,可以通過(guò)函數(shù)擬合得到水泥土和影響因素之間的函數(shù)表達(dá)式. 由于水泥土和水泥摻入比、含水量之間存在復(fù)雜關(guān)系,同時(shí)機(jī)器學(xué)習(xí)在處理復(fù)雜關(guān)系時(shí)具有較大優(yōu)勢(shì)[12],因此,可以用這種方法預(yù)測(cè)水泥土的強(qiáng)度.
利用機(jī)器學(xué)習(xí)進(jìn)行預(yù)測(cè),本質(zhì)是對(duì)數(shù)據(jù)的回歸分析,常用的具有回歸分析功能的機(jī)器學(xué)習(xí)方法主要包括神經(jīng)網(wǎng)絡(luò)[13]和支持向量機(jī)[14](Support Vector Machine,SVM)等. 神經(jīng)網(wǎng)絡(luò)雖然可以處理非線(xiàn)性問(wèn)題,但也存在收斂速度慢、過(guò)學(xué)習(xí)和局部極值等問(wèn)題,而且需要的樣本數(shù)量大[15];由于支持向量機(jī)的訓(xùn)練模式采用優(yōu)化技術(shù)及數(shù)學(xué)方式,因此在小樣本、高維、非線(xiàn)性預(yù)測(cè)領(lǐng)域具有很好的應(yīng)用效果[16],尤其適合水泥土的小樣本、非線(xiàn)性問(wèn)題. 目前,吳張中等[17]利用支持向量機(jī)建立鉆孔后注漿水泥土強(qiáng)度的SVM回歸模型,該模型描述了泥漿、水泥土比重參數(shù)與水泥土強(qiáng)度之間的映射關(guān)系;魏良針等[18]把均方誤差作為預(yù)測(cè)模型的適應(yīng)度函數(shù),并通過(guò)網(wǎng)格搜索法、粒子群算法優(yōu)化SVM模型參數(shù),建立了地表沉降預(yù)測(cè)模型. 因此,本文利用支持向量機(jī)的方法得到水泥土強(qiáng)度和影響因素的關(guān)系,并預(yù)測(cè)特定配合比下的水泥土強(qiáng)度.
試驗(yàn)采用的原料土為南通現(xiàn)場(chǎng)開(kāi)挖棄土,土的物理力學(xué)指標(biāo)如表1,固化劑為P·O 42.5 普通硅酸鹽水泥,水為自來(lái)水.
將土樣風(fēng)干碾碎,過(guò)2 mm篩,密封保存?zhèn)溆? 試樣制作時(shí),先將水泥和水混合,形成水泥漿液,再將干土加入,放入攪拌機(jī)中充分?jǐn)嚢瑁瑪嚢杈鶆蚝?,在?biāo)準(zhǔn)圓柱試模中制作直徑50 mm,高度100 mm 的試樣,成型1 d 后放入標(biāo)準(zhǔn)養(yǎng)護(hù)箱中養(yǎng)護(hù),養(yǎng)護(hù)溫度為(20±2)℃,相對(duì)濕度為95%,在齡期28 d 時(shí)進(jìn)行無(wú)側(cè)限抗壓強(qiáng)度試驗(yàn),取3個(gè)平行試樣的算術(shù)平均值作為該組的無(wú)側(cè)限抗壓強(qiáng)度值,當(dāng)試樣的測(cè)值與平均值之差超過(guò)平均值的±15%時(shí),剔除該數(shù)據(jù),余下試樣的測(cè)值計(jì)算平均值. 如一組試樣不足兩個(gè),需重做[11].
為了研究并驗(yàn)證自密實(shí)水泥土強(qiáng)度、和水泥摻入比(水泥質(zhì)量/干土質(zhì)量×100%)、含水量(所有水質(zhì)量/干土質(zhì)量)的非線(xiàn)性關(guān)系,本文按不同水泥摻入比(5%、7.5%、10%、12.5%、15%)和不同含水量(0.52、0.55、0.58、0.61、0.64)采取正交試驗(yàn),共制作水泥土試塊25組,試塊壓試速率為1 mm/min,試驗(yàn)結(jié)果如表2所示.
表2 自密實(shí)水泥土28 d無(wú)側(cè)限抗壓強(qiáng)度結(jié)果Tab.2 Results of unconfined compressive strength of self-compacting cement soil for 28 d
SVM一般分為分類(lèi)和回歸兩大問(wèn)題. 其中SVM回歸基本思路:對(duì)于給定訓(xùn)練樣本集Y={ }(xi,yi) ,通過(guò)非線(xiàn)性映射?(x),將輸入量x映射到高維空間,然后用函數(shù)f(x)=ω??(x)+b對(duì)數(shù)據(jù)進(jìn)行擬合. 擬合的本質(zhì)是尋找最優(yōu)參數(shù)ω和b使f(x)逼近y. 考慮到允許擬合誤差問(wèn)題,引入松弛因子ξ和ξ*,由此得到待優(yōu)化函數(shù):
式中:ω為權(quán)重;C為懲罰因子,其作用可以控制擬合誤差;ξ和ξ*是松弛因子,當(dāng)預(yù)測(cè)存在誤差時(shí)都大于0,否則等于0;x為自變量;y為因變量;b為常數(shù);ε為一個(gè)大于0且很小的數(shù). 再引用Lagrange方程,解決對(duì)偶優(yōu)化問(wèn)題:
其中:α、α*、η、η*≥0,為L(zhǎng)agrange乘子,且L對(duì)α、α*、η、η*的偏導(dǎo)等于零,再引入徑向基核函數(shù):
式中:g為核函數(shù)參數(shù),可以影響樣本空間到特征空間的映射;xi和xj都為自變量. 該函數(shù)將高維空間轉(zhuǎn)為低維空間,就可以得到非線(xiàn)性擬合函數(shù)f(x)的表達(dá)式:
在利用SVM 建立預(yù)測(cè)模型時(shí),通常會(huì)將樣本按2∶1 的比例劃分訓(xùn)練集和測(cè)試集,故將含水量為0.52、0.61、0.64的15組數(shù)據(jù)劃分為訓(xùn)練集,通過(guò)這15組數(shù)據(jù),利用SVM建立yi={28 d無(wú)側(cè)限抗壓強(qiáng)度}與xi={水泥摻入比,含水量}之間的回歸模型,分析水泥摻入比、含水量和28 d抗壓強(qiáng)度的關(guān)系,并用SVM建立強(qiáng)度預(yù)測(cè)模型,最后將剩下的10組數(shù)據(jù)劃分為測(cè)試集,然后用該模型輸出這10組配合比的預(yù)測(cè)強(qiáng)度,并和真實(shí)強(qiáng)度進(jìn)行比對(duì).
根據(jù)式(1)和式(4)可以看出,參數(shù)g和C是SVM 中重要參數(shù),g的取值影響樣本空間到特征空間的映射,C可以控制擬合誤差.因此,可以通過(guò)特定的算法調(diào)整參數(shù)的值,從而獲得更優(yōu)的預(yù)測(cè)模型. 本文通過(guò)網(wǎng)格尋優(yōu)算法、粒子群算法和模擬退火算法尋找該模型參數(shù)的最優(yōu)值.
首先,將15組訓(xùn)練集中的數(shù)據(jù)歸一化并代入支持向量機(jī)預(yù)測(cè)模型中訓(xùn)練,將g和C兩個(gè)參數(shù)范圍設(shè)置在[0,10]內(nèi),為了準(zhǔn)確評(píng)估參數(shù)變化時(shí)模型的預(yù)測(cè)性能,提出了均方誤差(Mean Squared Error,MSE),當(dāng)MSE越小時(shí),表示預(yù)測(cè)模型的誤差越小,如式(6)所示:
式中:yi為預(yù)測(cè)數(shù)據(jù)實(shí)際值;y為預(yù)測(cè)值;N為樣本數(shù).
網(wǎng)格尋優(yōu)算法的本質(zhì)是將所有情況遍歷一遍[19],因此設(shè)置每個(gè)參數(shù)的步長(zhǎng)為0.01,將式(6)作為適應(yīng)度函數(shù),計(jì)算每一種情況的適應(yīng)度值(MSE),優(yōu)化結(jié)果如圖1所示,當(dāng)g=6.6、C=8.6 時(shí),適應(yīng)度值最小,對(duì)應(yīng)的MSE 為0.003 8 MPa.
圖1 網(wǎng)格尋優(yōu)算法結(jié)果Fig.1 Results of grid optimization algorithm
粒子群優(yōu)化算法通過(guò)隨機(jī)生成粒子群,將每一個(gè)粒子抽象為一只鳥(niǎo),待優(yōu)化參數(shù)的個(gè)數(shù)代表粒子的維度空間的層數(shù),它可以在d維空間中以一定的速度飛行,通過(guò)設(shè)計(jì)的適應(yīng)度函數(shù)判斷所得到的位置是否合適,每次迭代,粒子會(huì)根據(jù)前期飛行經(jīng)驗(yàn),動(dòng)態(tài)調(diào)整速度并更新位置,直至找到最佳位置,即問(wèn)題的最優(yōu)解[20]. 粒子群的規(guī)模不宜太大,設(shè)置為20;加速常數(shù)c1、c2通常取0~2 之間的數(shù),均設(shè)置為2;最大迭代次數(shù)為100;將式(6)作為適應(yīng)度函數(shù). 每次迭代,計(jì)算每個(gè)粒子的適應(yīng)度值(MSE).優(yōu)化結(jié)果見(jiàn)圖2,當(dāng)?shù)螖?shù)超過(guò)40次時(shí),計(jì)算結(jié)果收斂于0.005 5附近,計(jì)算速度較快. 最終,當(dāng)g=3.76、C=8.6時(shí),適應(yīng)度值最小,對(duì)應(yīng)的MSE為0.005 3 MPa.
圖2 粒子群算法結(jié)果Fig.2 Results of particle swarm algorithm
模擬退火算法是一種通用概率算法,用來(lái)在一個(gè)大的搜尋空間內(nèi)尋找命題的最優(yōu)解. 由于引入了隨機(jī)因素,它能以一定的概率接受一個(gè)比當(dāng)前解要差的解,因此,有可能跳出局部的最優(yōu)解以致達(dá)到全局的最優(yōu)解[21]. 它來(lái)源于固體退火原理,本質(zhì)上是將待優(yōu)化問(wèn)題類(lèi)比為退火過(guò)程中能量的最低狀態(tài),也就是溫度達(dá)到最低點(diǎn)時(shí),概率分布中具有最大概率的狀態(tài). 假設(shè)初始溫度T0=10 ℃,迭代次數(shù)為100,按Tf=0.01 ℃更新溫度,溫度設(shè)定的閾值為0.99,最終優(yōu)化結(jié)果見(jiàn)圖3. 當(dāng)?shù)谝淮蔚?,適應(yīng)度值就接近最小值,但并沒(méi)有一直收斂于該值附近,而是跳出這個(gè)范圍,繼續(xù)搜尋全局最優(yōu)值,保證了結(jié)果的可靠性. 當(dāng)g=10.27、C=7.16 時(shí),適應(yīng)度值最小,對(duì)應(yīng)的MSE為0.003 8 MPa.
圖3 模擬退火算法結(jié)果Fig.3 Results of simulated annealing algorithm
為了選擇最優(yōu)的預(yù)測(cè)模型,首先,利用三種不同算法改進(jìn)的SVM 預(yù)測(cè)模型輸出測(cè)試集中的10 組預(yù)測(cè)值,然后將真實(shí)值和預(yù)測(cè)值表示在同一坐標(biāo)軸上,如圖4. 可以看出,這三種預(yù)測(cè)模型輸出的預(yù)測(cè)值和真實(shí)值誤差都很小,且增長(zhǎng)趨勢(shì)一致,可以模擬試樣的無(wú)側(cè)限抗壓強(qiáng)度隨水泥摻入比和含水量的非線(xiàn)性變化過(guò)程.
由于三種預(yù)測(cè)模型的預(yù)測(cè)值和真實(shí)值的誤差都很小,所以,不能直接從圖4 中直接選擇最優(yōu)的預(yù)測(cè)模型. 分別計(jì)算三種預(yù)測(cè)模型在測(cè)試集中的預(yù)測(cè)值和真實(shí)值的平方損失(MSE)及絕對(duì)損失(MAE),當(dāng)這兩個(gè)值越小時(shí),模型的預(yù)測(cè)效果越好,計(jì)算結(jié)果見(jiàn)表3.
圖4 測(cè)試集中預(yù)測(cè)值和真實(shí)值對(duì)比圖Fig.4 Comparison chart of predicted values and true values in the test set
從表3 可以看出,GS_SVM 預(yù)測(cè)模型和SA_SVM 預(yù)測(cè)模型結(jié)果一樣,但GS_SVM 計(jì)算時(shí),需要把所有的結(jié)果都遍歷一遍,計(jì)算量大,所以SA_SVM 預(yù)測(cè)模型的計(jì)算速度更快;PSO_SVM預(yù)測(cè)模型相較于SA_SVM預(yù)測(cè)模型,少了一次內(nèi)部的迭代循環(huán),計(jì)算更快,但容易得到局部最優(yōu)解. 結(jié)果表明,SA_SVM 預(yù)測(cè)模型為最優(yōu)預(yù)測(cè)模型,計(jì)算速度更快,結(jié)果更準(zhǔn)確.
表3 測(cè)試集中不同預(yù)測(cè)模型的預(yù)測(cè)結(jié)果Tab.3 Prediction results of different forecast models in the test set
本文將機(jī)器學(xué)習(xí)中SVM應(yīng)用到自密實(shí)水泥土最佳配合比預(yù)測(cè)中,可以根據(jù)水泥摻入比和含水量預(yù)測(cè)特定的強(qiáng)度,從而確定最佳配合比,顯著降低了試驗(yàn)的成本,為配合設(shè)計(jì)提供重要參考意義,并得到以下結(jié)論:1)自密實(shí)水泥土28 d無(wú)側(cè)限抗壓強(qiáng)度隨灰土比增大而增大,隨水土比增大而減小.2)自密實(shí)水泥土SVM預(yù)測(cè)模型能夠根據(jù)小樣本進(jìn)行非線(xiàn)性建模并預(yù)測(cè).