劉凱華 ,鄭佳凱 ,謝維力 ,董書雄 ,段珍華
(1.廣東工業(yè)大學(xué) 土木與交通工程學(xué)院,廣東 廣州 510006;2.同濟(jì)大學(xué) 土木工程學(xué)院,上海 200092)
再生骨料具有吸水率高、表觀密度低和壓碎指標(biāo)值大等特點(diǎn).殘余漿體的存在使得再生混凝土內(nèi)部存在多重界面過渡區(qū)[1],導(dǎo)致其耐久性能較普通混凝土有所降低[2].再生混凝土材料耐久性能直接影響再生混凝土結(jié)構(gòu)的長(zhǎng)期服役性能[3].一般認(rèn)為,再生混凝土抗氯離子滲透性能[4-5]和抗碳化性能[6]較普通混凝土要低,且隨著再生骨料取代率的提高逐漸下降.已有學(xué)者基于試驗(yàn)結(jié)果發(fā)展了再生混凝土耐久性的預(yù)測(cè)模型[7-8],但此類“機(jī)理驅(qū)動(dòng)”的半經(jīng)驗(yàn)半理論模型精度尚有較大提升空間.近年來人工智能發(fā)展迅速,機(jī)器學(xué)習(xí)等技術(shù)的快速發(fā)展為再生混凝土耐久性預(yù)測(cè)問題的建模提供了新的思路.不同于“機(jī)理驅(qū)動(dòng)”的傳統(tǒng)建模方法,“數(shù)據(jù)驅(qū)動(dòng)”的機(jī)器學(xué)習(xí)建模方法能夠充分挖掘試驗(yàn)數(shù)據(jù)中輸入和輸出的映射關(guān)系,建立精確的預(yù)測(cè)模型[9].國(guó)內(nèi)外學(xué)者已嘗試將機(jī)器學(xué)習(xí)應(yīng)用于混凝土材料的研究之中,針對(duì)其抗壓強(qiáng)度[10-11]、彈性模量[12]和早期收縮[13]等性能預(yù)測(cè)開展研究,均取得了較為滿意的預(yù)測(cè)效果.
目前針對(duì)再生混凝土的配合比設(shè)計(jì)主要從強(qiáng)度角度出發(fā),對(duì)其耐久性能要求則是以控制強(qiáng)度等級(jí)、水灰比等指標(biāo)進(jìn)行概念設(shè)計(jì).為實(shí)現(xiàn)再生混凝土的性能可控,發(fā)展耦合強(qiáng)度和耐久性的配合比設(shè)計(jì)方法具有重要的工程意義.基于此,本文將機(jī)器學(xué)習(xí)方法引入再生混凝土的耐久性能研究,建立再生混凝土抗氯離子侵蝕性能和抗碳化性能預(yù)測(cè)的機(jī)器學(xué)習(xí)模型.將提出的再生混凝土耐久性預(yù)測(cè)模型和生產(chǎn)成本作為目標(biāo)函數(shù),利用設(shè)計(jì)強(qiáng)度確定配合比約束條件,結(jié)合多目標(biāo)優(yōu)化算法發(fā)展再生混凝土配合比優(yōu)化設(shè)計(jì)方法.
機(jī)器學(xué)習(xí)算法可分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)兩大類.有監(jiān)督學(xué)習(xí)是對(duì)具有標(biāo)簽的訓(xùn)練樣本進(jìn)行學(xué)習(xí),以盡可能對(duì)訓(xùn)練樣本集外的數(shù)據(jù)進(jìn)行分類和回歸;無監(jiān)督學(xué)習(xí)則是對(duì)沒有標(biāo)簽的訓(xùn)練樣本進(jìn)行學(xué)習(xí),主要為數(shù)據(jù)聚類和數(shù)據(jù)降維.本文采用了4 種有監(jiān)督機(jī)器學(xué)習(xí)方法,包括2種單一學(xué)習(xí)方法和2種集成學(xué)習(xí)方法.
1)反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Artificial neural Network,BPANN).BPANN 是一類基于誤差反向傳播算法的多層前饋神經(jīng)網(wǎng)絡(luò)[14],包含輸入層、隱藏層和輸出層.輸入層、隱藏層和輸出層中神經(jīng)元通過權(quán)重和偏差依次連接.權(quán)重和偏差最初是隨機(jī)分配的,然后根據(jù)訓(xùn)練過程的結(jié)果進(jìn)行不斷優(yōu)化.
2)高斯過程回歸(Gaussian Progress Regression,GPR).GRP 是對(duì)輸入變量與輸出變量間的概率分布進(jìn)行推斷,即給定輸入變量后確定輸出變量的條件分布[15].與其他機(jī)器學(xué)習(xí)模型相比,GPR 結(jié)合了統(tǒng)計(jì)學(xué)習(xí)和貝葉斯理論,可以有原則地量化預(yù)測(cè)不確定性,適用于處理高維度和強(qiáng)非線性問題.
1)隨機(jī)森林(Random Forest,RF)模型.RF 模型由多棵獨(dú)立的決策樹組合而成,每棵決策樹都是通過隨機(jī)方法生成的[16].模型預(yù)測(cè)通過投票或平均每個(gè)決策樹的結(jié)果來確定.對(duì)回歸問題,RF 模型輸出結(jié)果F(x)可表示為:
式中:fi(x)代表第i棵決策樹的預(yù)測(cè)結(jié)果;T代表決策樹的數(shù)量.
2)梯度提升樹(Gradient Boosting Decision Tree,GBDT)模型.GBDT 模型以單一決策樹模型作為基學(xué)習(xí)器,模型的訓(xùn)練過程即是可導(dǎo)出目標(biāo)函數(shù)的優(yōu)化過程[17].GBDT 模型采用平方誤差作為損失函數(shù),利用損失函數(shù)的負(fù)梯度作為擬合的目標(biāo)值.對(duì)回歸問題,GBDT算法的計(jì)算過程如下:式中:G0代表初始基學(xué)習(xí)器;Gr代表輸出的強(qiáng)學(xué)習(xí)器;L代表?yè)p失函數(shù);hr代表弱學(xué)習(xí)器;?Loss 代表?yè)p失函數(shù)的負(fù)梯度.
分別采用電通量和碳化深度作為再生混凝土抗氯離子滲透和抗碳化性能量化指標(biāo).模型輸入變量考慮再生混凝土配合比、再生骨料品質(zhì)、養(yǎng)護(hù)條件和侵蝕環(huán)境等層面的影響確定.針對(duì)氯離子侵蝕環(huán)境,考慮到電通量法試驗(yàn)環(huán)境一致,因此將水泥用量(ρc)、水用量(ρw)、砂用量(ρs)、粉煤灰用量(ρfa)、骨料取代率(R)、骨料吸水率(Rwa)和齡期(A)等作為輸入變量.針對(duì)碳化環(huán)境,選取水泥用量(ρc)、水用量(ρw)、骨料取代率(R)、骨料吸水率(Rwa)、齡期(A)、二氧化碳體積分?jǐn)?shù)(φCO2)、環(huán)境溫度(T)、環(huán)境濕度(RH)和碳化時(shí)長(zhǎng)(tc)等作為輸入變量.骨料吸水率以再生骨料和天然骨料的吸水率根據(jù)骨料質(zhì)量取代率加權(quán)后計(jì)算得到.
收集了200 組再生混凝土氯離子侵蝕試驗(yàn)樣本[18-26]和502 組碳化試驗(yàn)樣本[27-37].樣本中再生混凝土制備工藝均為傳統(tǒng)工藝,粉煤灰類別均為低鈣型Ⅰ級(jí)粉煤灰.模型變量的統(tǒng)計(jì)特征值見表1.為避免輸入變量潛在共線性造成信息重復(fù),采用方差膨脹因子(Variance Inflation Factor,VIF)法進(jìn)行多重共線性分析.VIF 是自變量回歸系數(shù)估計(jì)量的方差與假設(shè)各自變量之間線性無關(guān)時(shí)方差的比值.VIF 值越大,則代表該自變量與其他自變量之間共線性越明顯,一般以10 作為判斷邊界.本文利用SPSS 軟件計(jì)算得到各輸入變量的VIF 值.從表1 可知,各自變量VIF 值均小于10,排除多重共線性,數(shù)據(jù)集可用于機(jī)器學(xué)習(xí)模型訓(xùn)練.
表1 模型變量的統(tǒng)計(jì)特征值Tab.1 Statistical indicators of model variables
將數(shù)據(jù)庫(kù)劃分為訓(xùn)練集(80%)和測(cè)試集(20%),在MATLAB 平臺(tái)采用5 折交叉驗(yàn)證訓(xùn)練模型.訓(xùn)練過程中需要針對(duì)模型超參數(shù)進(jìn)行優(yōu)化以提升模型性能.常見調(diào)參算法有網(wǎng)格搜索、隨機(jī)搜索和貝葉斯優(yōu)化等[38].網(wǎng)格搜索和隨機(jī)搜索不需要人力,但是優(yōu)化效率低、耗時(shí)長(zhǎng).貝葉斯優(yōu)化是基于目標(biāo)函數(shù)過去評(píng)估結(jié)果建立概率模型,優(yōu)化效率相對(duì)高,適用于參數(shù)維度不超過20 的機(jī)器學(xué)習(xí)模型.本文采用貝葉斯優(yōu)化分別針對(duì)BPANN模型、GPR模型、RF模型和GBDT 模型的部分超參數(shù)進(jìn)行優(yōu)化,結(jié)果見表2.針對(duì)RF 和GBDT 模型,考慮到樣本特征數(shù)均在10 以內(nèi),因此將單個(gè)基學(xué)習(xí)器最大特征數(shù)和最大深度設(shè)置為自動(dòng)獲取.
表2 機(jī)器學(xué)習(xí)模型超參數(shù)優(yōu)化結(jié)果Tab.2 Optimization results of hyperparameters for machine learning models
采用決定系數(shù)(R2)和均方根誤差(RMSE)評(píng)估機(jī)器學(xué)習(xí)模型的預(yù)測(cè)性能,計(jì)算公式如式(5)(6):
式中:ft和fp分別代表試驗(yàn)結(jié)果和預(yù)測(cè)結(jié)果和分別代表試驗(yàn)結(jié)果平均值和預(yù)測(cè)結(jié)果平均值;N代表數(shù)據(jù)點(diǎn)的個(gè)數(shù).
根據(jù)優(yōu)化后的超參數(shù)可以分別建立再生混凝土電通量和碳化深度的機(jī)器學(xué)習(xí)預(yù)測(cè)模型.
圖1 給出了再生混凝土電通量預(yù)測(cè)值和試驗(yàn)值的對(duì)比結(jié)果.從圖1(a)~(d)可看出,本文機(jī)器學(xué)習(xí)模型訓(xùn)練集和測(cè)試集的R2都在0.95 以上、RMSE都在350 以下,表現(xiàn)出很高的預(yù)測(cè)精度.輸入變量各模型在測(cè)試集的表現(xiàn)較訓(xùn)練集有所下降,但與試驗(yàn)結(jié)果擬合良好,展現(xiàn)出良好的泛化能力.其中,GBDT 模型性能表現(xiàn)最好,R2在0.98 以上且RMSE在150 左右,其訓(xùn)練集和測(cè)試集預(yù)測(cè)性能均高于其他模型;BPANN 模型和RF 模型性能比較接近,略低于GPR模型.為進(jìn)一步驗(yàn)證本文模型性能,根據(jù)陳正等[39]提出的電通量非線性回歸預(yù)測(cè)模型對(duì)數(shù)據(jù)集進(jìn)行了預(yù)測(cè).從圖1(e)可看出,非線性回歸模型精度相對(duì)偏低.其原因是一方面算法本身對(duì)數(shù)據(jù)特征的識(shí)別能力有區(qū)別,另一方面本文模型輸入變量除考慮配合比設(shè)計(jì)參數(shù)外,也考慮了再生骨料品質(zhì),提升了模型性能.
圖1 再生混凝土電通量預(yù)測(cè)值與試驗(yàn)值的對(duì)比Fig.1 Comparison between the predicted and experimental electric flux of RAC
圖2 給出了各模型針對(duì)再生混凝土碳化深度預(yù)測(cè)值和試驗(yàn)值的對(duì)比結(jié)果.圖2(a)~(d)表明,各機(jī)器學(xué)習(xí)模型在訓(xùn)練集和測(cè)試集的R2都在0.93 以上、RMSE都在2.0 以下.其中,GPR 模型的預(yù)測(cè)性能最好,GBDT 模型次之但略高于RF 模型,BPANN 模型的預(yù)測(cè)性能則要低于其他模型.從圖2(e)可以看出,Zhang 等[7]提出的再生混凝土碳化深度預(yù)測(cè)模型在訓(xùn)練集和測(cè)試集的R2分別為0.797和0.776,RMSE分別為3.9 和4.3,較本文采用的機(jī)器學(xué)習(xí)模型預(yù)測(cè)精度有所降低,進(jìn)一步驗(yàn)證了本文碳化深度機(jī)器學(xué)習(xí)預(yù)測(cè)模型的性能.
圖2 再生混凝土碳化深度預(yù)測(cè)值與試驗(yàn)值的對(duì)比Fig.2 Comparison between the predicted and experimental carbonation depth of RAC
在建立再生混凝土耐久性預(yù)測(cè)機(jī)器學(xué)習(xí)模型后,利用參數(shù)分析考察模型針對(duì)關(guān)鍵變量波動(dòng)的變化趨勢(shì),提高模型可解釋性.為獲得影響再生混凝土抗氯離子侵蝕和抗碳化性能關(guān)鍵參數(shù),采用標(biāo)準(zhǔn)化回歸系數(shù)(Standardized Regression Coefficient,SRC)量化各輸入?yún)?shù)貢獻(xiàn).SRC 是對(duì)輸入?yún)?shù)和輸出參數(shù)同時(shí)進(jìn)行標(biāo)準(zhǔn)化處理后所得的回歸系數(shù),其絕對(duì)值直接反映輸入?yún)?shù)對(duì)輸出參數(shù)的影響程度.圖3給出了各自變量SRC 計(jì)算結(jié)果.從圖3 可知,用水量是影響再生混凝土抗氯離子侵蝕的關(guān)鍵參數(shù),其次是齡期;二氧化碳體積分?jǐn)?shù)是影響再生混凝土抗碳化性能的最主要參數(shù),其次為水泥用量.
圖3 SRC計(jì)算結(jié)果Fig.3 Calculation results of the SRC
以預(yù)測(cè)再生混凝土抗氯離子侵蝕和抗碳化性能表現(xiàn)最佳的GBDT 模型和GPR 模型開展關(guān)鍵參數(shù)分析.針對(duì)GBDT 模型,改變用水量和齡期,同時(shí)將其他變量取為數(shù)據(jù)集平均值;針對(duì)GPR模型,以水泥用量和二氧化碳體積分?jǐn)?shù)為自變量,同時(shí)保持其他變量為數(shù)據(jù)集平均值,觀察模型輸出結(jié)果.從圖4(a)可以看出,隨著用水量增加,電通量逐漸增大,在用水量超過160 kg/m3后快速增加.用水量增加會(huì)增大再生混凝土水灰比,降低漿體密實(shí)度,對(duì)抗氯離子侵蝕不利.隨著齡期增加,電通量逐漸降低,在齡期超過70 d 后,電通量降幅很小,基本不變.齡期增加會(huì)使得水泥水化更加充分,增強(qiáng)再生混凝土密實(shí)性,提高抗氯離子滲透性[5].當(dāng)齡期達(dá)到一定時(shí)間后,水化過程已比較充分,此時(shí)繼續(xù)延長(zhǎng)齡期帶來的性能提升也有所放緩.從圖4(b)可知,提高水泥用量可以降低碳化深度,當(dāng)水泥用量超過400 kg/m3時(shí),繼續(xù)增加水泥用量對(duì)再生混凝土抗碳化性能的提升效果已不再顯著.增加環(huán)境中二氧化碳體積分?jǐn)?shù)則會(huì)逐漸增大再生混凝土的碳化深度,這與已有研究結(jié)果是一致的[6].
圖4 參數(shù)分析結(jié)果Fig.4 Results of the parameter analysis
本文將提出的再生混凝土耐久性預(yù)測(cè)模型作為目標(biāo)函數(shù),結(jié)合設(shè)計(jì)強(qiáng)度要求確定配合比各項(xiàng)因素約束條件,利用 NSGA-Ⅱ算法進(jìn)行多目標(biāo)尋優(yōu)獲得Pareto最優(yōu)解集合,然后對(duì)最優(yōu)解集合進(jìn)行綜合評(píng)價(jià)排序,獲得最佳配合比組合.
以廣州市某高速鐵路建設(shè)項(xiàng)目再生混凝土配合比設(shè)計(jì)為例.本項(xiàng)目要求再生混凝土配置強(qiáng)度為35 MPa,標(biāo)準(zhǔn)養(yǎng)護(hù)28 d 試件電通量和28 d 碳化深度(依規(guī)范試驗(yàn)方法[40])分別不超過1 500 C 和5 mm,成本在500 元/m3以下.選用P.O 42.5 水泥(28 d 膠砂抗壓強(qiáng)度49.5 MPa),I 級(jí)粉煤灰(摻量10%),再生粗骨料吸水率5.0%,天然碎石吸水率0.5%,再生粗骨料取代率為50%.各原材料的選用符合規(guī)范要求[41],各組分的表觀密度和價(jià)格見表3.
表3 材料信息Tab.3 Information of materials
本工程再生混凝土配合比優(yōu)化設(shè)計(jì)過程如下:
1)確定目標(biāo)函數(shù).將建立的再生混凝土電通量預(yù)測(cè)模型和碳化深度預(yù)測(cè)模型及每立方米再生混凝土成本作為目標(biāo)函數(shù),設(shè)定各目標(biāo)函數(shù)數(shù)值:
式中:x1、x2、x3、x4、x5分別為水泥用量、凈水用量、砂用量、再生粗骨料用量、天然粗骨料用量等變量;con1、con2分別為養(yǎng)護(hù)齡期、骨料吸水率;con3、con4、con5、con6分別代表標(biāo)準(zhǔn)加速碳化試驗(yàn)參數(shù)中的二氧化碳體積分?jǐn)?shù)、環(huán)境溫度、環(huán)境濕度和碳化時(shí)長(zhǎng)等已知量.
2)構(gòu)建約束條件.采用郭遠(yuǎn)新等[42]提出的再生粗骨料混凝土抗壓強(qiáng)度計(jì)算公式,換算得到再生混凝土的設(shè)計(jì)水膠比rW/C不超過0.55.根據(jù)規(guī)范[41]要求并結(jié)合工程實(shí)際,將砂率控制在35%~40%,膠凝材料總量不低于300 kg/m3,各變量具體約束范圍如下:300 ≤x1≤450,0.35 ≤x2/()1.1x1≤0.55,1 000 ≤x4+x5≤1 300,0.35 ≤x3/()x3+x4+x5≤0.40,各材料體積之和為1 m3(含氣量設(shè)定為1%).
3)尋找配合比最優(yōu)解.在確定目標(biāo)函數(shù)和約束條件后,采用NSGA-Ⅱ算法進(jìn)行多目標(biāo)尋優(yōu).NSGA-II 算法主要參數(shù)設(shè)置為:種群數(shù)量100,迭代次數(shù)500,交叉概率0.9,變異概率0.1.利用熵權(quán)法確定優(yōu)化指標(biāo)電通量、碳化深度和成本的權(quán)值系數(shù)依次為0.422、0.415 和0.162.采用優(yōu)劣解距離法(Technique for Order Preference by Similarity to Ideal Solution,TOPSIS)作為綜合評(píng)價(jià)方法計(jì)算每個(gè)指標(biāo)與理想解和負(fù)理想解的距離,對(duì)最優(yōu)解集進(jìn)行排序.再生混凝土電通量、碳化深度和成本等優(yōu)化目標(biāo)越小越好,其理想解和負(fù)理想解可表示為:
Pareto 解集中的每組解與理想解和負(fù)理想解之間的距離可采用歐氏距離進(jìn)行計(jì)算:
每組解與相對(duì)理想解的接近程度可定義為:
式中:Ci為第i組解的相對(duì)接近度系數(shù),其數(shù)值越大,表明該組解越優(yōu).
根據(jù)Ci對(duì)Pareto 解集進(jìn)行排序確定本項(xiàng)目試配配合比:水185 kg/m3(凈用水和附加水之和[41]),水泥410 kg/m3,河砂600 kg/m3,再生粗骨料530 kg/m3,天然粗骨料585 kg/m3,粉煤灰40 kg/m3.
4)試驗(yàn)驗(yàn)證.經(jīng)測(cè)定,該試配配合比制備的標(biāo)準(zhǔn)養(yǎng)護(hù)28 d再生混凝土試件棱柱體抗壓強(qiáng)度平均值為37.2 MPa,電通量和28 d 碳化深度分別為1 215 C 和3.7 mm,滿足設(shè)計(jì)要求且成本可控,可作為本工程項(xiàng)目的施工配合比.
1)本文建立的機(jī)器學(xué)習(xí)模型可以較好地預(yù)測(cè)再生混凝土抗氯離子侵蝕和抗碳化性能.梯度提升樹模型在預(yù)測(cè)再生混凝土電通量時(shí)表現(xiàn)最好,模型決定系數(shù)0.989,均方根誤差147.3;高斯過程回歸模型對(duì)再生混凝土碳化深度預(yù)測(cè)性能要優(yōu)于其他模型,模型決定系數(shù)0.987,均方根誤差1.0.
2)變量標(biāo)準(zhǔn)化回歸系數(shù)分析表明,用水量是影響再生混凝土抗氯離子侵蝕的關(guān)鍵參數(shù),其次是齡期;二氧化碳體積分?jǐn)?shù)則是影響再生混凝土抗碳化性能的最主要參數(shù),其次為水泥用量.梯度提升樹模型和高斯過程回歸模型針對(duì)關(guān)鍵變量波動(dòng)的變化趨勢(shì)與已有試驗(yàn)結(jié)果是一致的,驗(yàn)證了本文再生混凝土耐久性預(yù)測(cè)機(jī)器學(xué)習(xí)模型的魯棒性.
3)結(jié)合再生混凝土耐久性預(yù)測(cè)機(jī)器學(xué)習(xí)模型和NSGA-Ⅱ多目標(biāo)優(yōu)化算法提出了再生混凝土配合比優(yōu)化設(shè)計(jì)方法.該設(shè)計(jì)方法優(yōu)化結(jié)果符合工程實(shí)際要求,顯示出良好的工程應(yīng)用潛力,可用于指導(dǎo)再生混凝土的施工配合比設(shè)計(jì).