劉圣超 左永越
(1.山東省建筑設(shè)計(jì)研究院有限公司,山東 濟(jì)南 250001;2.山東建筑大學(xué)設(shè)計(jì)集團(tuán)有限公司,山東 濟(jì)南 250013)
鋼纖維混凝土因其出色的抗拉能力、良好的穩(wěn)定性等優(yōu)點(diǎn),成為應(yīng)用廣泛的纖維混凝土之一[1]。由于鋼纖維和混凝土之間復(fù)雜的非線性作用,傳統(tǒng)的理論模型難以很好地預(yù)測其抗壓強(qiáng)度,導(dǎo)致理論模型預(yù)測結(jié)果具有較大的離散性,如果通過大量實(shí)驗(yàn)來確定鋼纖維混凝土強(qiáng)度,實(shí)驗(yàn)過程繁瑣且需要大量的成本開支。
現(xiàn)今機(jī)器學(xué)習(xí)領(lǐng)域取得了很大的進(jìn)展,機(jī)器學(xué)習(xí)的興起為這一難題提供了新的解決思路。尤其是集成機(jī)器學(xué)習(xí)算法,該方法基于大量的實(shí)驗(yàn)樣本,可以直接挖掘鋼纖維混凝土數(shù)據(jù)樣本中輸入(鋼纖維混凝土基本設(shè)計(jì)變量)與輸出(鋼纖維混凝土力學(xué)基本性能)間的映射關(guān)系,從而建立精確、穩(wěn)定的預(yù)測模型。在各種集成學(xué)習(xí)算法中,極端提升樹[2]和隨機(jī)森林[3]在各類預(yù)測任務(wù)中都表現(xiàn)出極其出色的優(yōu)勢。因此,本文提出采用機(jī)器學(xué)習(xí)算法來預(yù)測鋼纖維混凝土的抗壓強(qiáng)度。
決策樹[4]是一種單一的機(jī)器學(xué)習(xí)預(yù)測模型,其本質(zhì)是將特征空間劃分為幾個(gè)單元,每個(gè)單元均有對應(yīng)的輸出結(jié)果,對每個(gè)節(jié)點(diǎn)進(jìn)行是與否的判斷。任何測試集中的數(shù)據(jù)都可以根據(jù)其特性歸于一個(gè)單元,從而得到相應(yīng)輸入結(jié)果。決策樹算法優(yōu)點(diǎn)是易于理解和實(shí)現(xiàn),并且對于決策樹而言,算法對數(shù)據(jù)的要求比較簡單,尤其是可以同時(shí)處理任何的數(shù)據(jù)型。
隨機(jī)森林是一種集成了多棵決策樹的機(jī)器學(xué)習(xí)算法。隨機(jī)森林由三個(gè)部分組成:決策節(jié)點(diǎn)、葉節(jié)點(diǎn)和根節(jié)點(diǎn)。決策樹算法將訓(xùn)練數(shù)據(jù)集劃分為分支,這些分支進(jìn)一步劃分為其他分支,此序列會(huì)一直持續(xù)到獲得葉節(jié)點(diǎn)為止。當(dāng)呈現(xiàn)一組輸入變量值時(shí),每個(gè)決策樹預(yù)測因子都能夠產(chǎn)生響應(yīng),通過訓(xùn)練算法引導(dǎo)聚合使這些決策樹便生成了隨機(jī)森林。
RF模型的流程圖如圖1所示,RF將所有結(jié)果集成到一起并投票,最終將票選最多的類別作為結(jié)果輸出。若是解決回歸問題,則可以對RF模型訓(xùn)練后通過對所有單個(gè)回歸樹的預(yù)測結(jié)果求平均值來實(shí)現(xiàn)基于向量對的最終預(yù)測結(jié)果輸出。
圖1 RF模型流程圖
XGBoost 屬于提升學(xué)習(xí)算法(Boosting)。Boosting指的是一種通用的集成方法,通過從一個(gè)模型到下一個(gè)模型的順序擬合,實(shí)現(xiàn)從多個(gè)基礎(chǔ)弱學(xué)習(xí)器生成一個(gè)強(qiáng)大的學(xué)習(xí)器,從而提高算法的性能。該集成方法與Bagging 方法的主要區(qū)別在于,基礎(chǔ)弱學(xué)習(xí)器都是以順序的方式進(jìn)行構(gòu)建,而每個(gè)后續(xù)的模型均會(huì)通過嘗試糾正先前模型中的誤差進(jìn)行構(gòu)建。圖2給出了Boosting樹集合的示意圖。從圖中可知,該集成模型中涉及一個(gè)迭代過程,在該過程中,每個(gè)學(xué)習(xí)器都被擬合到前一個(gè)學(xué)習(xí)器的負(fù)梯度(殘差),以此來優(yōu)化目標(biāo)函數(shù),實(shí)現(xiàn)輸出結(jié)果的預(yù)測。
圖2 Boosting算法示意圖
為進(jìn)一步確定各參數(shù)對纖維混凝土力學(xué)性能影響,本研究旨在通過機(jī)器學(xué)習(xí)對收集到的實(shí)驗(yàn)數(shù)據(jù)庫中的混雜纖維進(jìn)行建模分析,該數(shù)據(jù)庫包含Kobayashi[5]、馬愷澤[6]、丁一寧[7]、劉朝正[8]、徐佳興[9]、張紫鍵[10]等人99組不同纖維含量的實(shí)驗(yàn)數(shù)據(jù)。選擇6個(gè)參數(shù)作為模型輸入:水泥含量(kg/m3)、水含量(kg/m3)、粗骨料含量(kg/m3)、細(xì)骨料含量(kg/m3)、截面尺寸(cm)、鋼纖維摻量百分比(%)。
機(jī)器學(xué)習(xí)模型預(yù)測鋼纖維混凝土抗壓強(qiáng)度主要包括三個(gè)方面:數(shù)據(jù)收集、機(jī)器學(xué)習(xí)模型訓(xùn)練和優(yōu)化計(jì)算,具體流程如圖3所示。需要指出的是,為了保證對比模型效果的公平性,在本研究中,使用網(wǎng)格搜索法進(jìn)行超參數(shù)優(yōu)化,確定最佳超參數(shù)。其中網(wǎng)格搜索優(yōu)化技術(shù)是考慮用戶定義的超參數(shù)的所有組合,遍歷搜索確定最優(yōu)超參數(shù)組合。此外,開發(fā)可靠的模型需要通過外部數(shù)據(jù)對模型進(jìn)行驗(yàn)證,以解決過擬合問題。
圖3 機(jī)器學(xué)習(xí)模型的建立流程
根據(jù)R2(決定系數(shù))、MAE(平均絕對誤差)以及RMSE(均方根誤差)對所開發(fā)的模型性能進(jìn)行評估。MAE通過取實(shí)際值與預(yù)測值之間絕對差值的平均值來評估性能指標(biāo),按照以下公式(1-3)進(jìn)行計(jì)算:
根據(jù)上述定義可見,RMSE、MAE值越小,R2值越大,代表模型的預(yù)測精度越高。
將獲得的機(jī)器學(xué)習(xí)最優(yōu)超參數(shù)和訓(xùn)練樣本,分別代入隨機(jī)森林、決策樹、極端提升樹三個(gè)機(jī)器學(xué)習(xí)模型,基于訓(xùn)練好的三個(gè)機(jī)器學(xué)習(xí)模型代入測試數(shù)據(jù)集驗(yàn)證模型表現(xiàn)。機(jī)器學(xué)習(xí)模型結(jié)果對比見圖4。
圖4 機(jī)器學(xué)習(xí)模型結(jié)果對比
模型預(yù)測結(jié)果分別如表1所示,可以看到,對于驗(yàn)證實(shí)驗(yàn)數(shù)據(jù)集極端提升樹模型的MAPE(平均絕對百分比誤差)和RMSE較其他模型均更小,具有更加精確的預(yù)測結(jié)果。表明在抗壓強(qiáng)度預(yù)測問題上,極端提升樹模型相比于其他機(jī)器學(xué)習(xí)模型預(yù)測效果更好,更加適用于預(yù)測該類問題。如圖4所示,機(jī)器學(xué)習(xí)預(yù)測結(jié)果均位于10%誤差線之內(nèi),說明模型預(yù)測結(jié)果具有魯棒性。觀察到訓(xùn)練集和測試集的精度差異微小,可以認(rèn)為過擬合的程度有限,模型預(yù)測結(jié)果是可靠且準(zhǔn)確的。同時(shí)可以看出,極端提升樹和隨機(jī)森林具有相似的預(yù)測精度,并且明顯高于決策樹模型。說明集成機(jī)器學(xué)習(xí)算法在預(yù)測鋼纖維混凝土抗壓強(qiáng)度方面具有優(yōu)越性。
表1 機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果
通過機(jī)器學(xué)習(xí)算法建立鋼纖維混凝土抗壓強(qiáng)度預(yù)測模型。采用集成機(jī)器學(xué)習(xí)算法,通過集成多個(gè)弱學(xué)習(xí)器來構(gòu)造一個(gè)強(qiáng)學(xué)習(xí)器,從而找到鋼纖維混凝土設(shè)計(jì)參數(shù)和其抗壓強(qiáng)度之間的映射關(guān)系。預(yù)測誤差較小的弱學(xué)習(xí)器權(quán)重較大,可提高機(jī)器學(xué)習(xí)模型的整體精度。從現(xiàn)有文獻(xiàn)中共收集99組鋼纖維混凝土抗壓強(qiáng)度實(shí)驗(yàn)數(shù)據(jù),用來訓(xùn)練集成機(jī)器學(xué)習(xí)模型,其中以鋼纖維混凝土成分(例如粗/細(xì)集料、水泥、水、鋼纖維摻量等)作為輸入數(shù)據(jù),以抗壓強(qiáng)度值作為輸出數(shù)據(jù)。模型驗(yàn)證測試數(shù)據(jù)集的結(jié)果表明,所采用的集成機(jī)器學(xué)習(xí)模型對預(yù)測鋼纖維混凝土抗壓強(qiáng)度的預(yù)測精度很高(MAPE=1.16%),并且高于傳統(tǒng)的單一機(jī)器學(xué)習(xí)預(yù)測模型(MAPE=1.76%)。
本課題的研究說明:
(1)根據(jù)已有的鋼纖維混凝土抗壓強(qiáng)度預(yù)測的集成機(jī)器學(xué)習(xí)模型數(shù)據(jù),證實(shí)了集成機(jī)器學(xué)習(xí)模型用于鋼纖維混凝土強(qiáng)度預(yù)測的準(zhǔn)確性和魯棒性。
(2)當(dāng)鋼纖維混凝土的設(shè)計(jì)參數(shù)發(fā)生變化時(shí),本文所建立的機(jī)器學(xué)習(xí)預(yù)測模型可以快速預(yù)測其抗壓強(qiáng)度,并且預(yù)測結(jié)果具有很高的精度,能夠滿足工程需要。
(3)本文所提出的集成機(jī)器學(xué)習(xí)模型,相比于單一機(jī)器學(xué)習(xí)模型,預(yù)測精度進(jìn)一步提高,表明該方法的有效性。