馬財龍,王文虎,侯憲龍,謝晨曦,魯成鳳
(1.新疆大學建筑工程學院,新疆 烏魯木齊 830017;2.新疆大學新疆建筑結構與抗震重點實驗室,新疆 烏魯木齊 830017)
我國規(guī)范將跨高比小于5的鋼筋混凝土梁定義為深受彎構件[1].RC深受彎構件廣泛應用于土木工程結構中,如高層建筑中的厚板轉換層、地鐵隧道里的厚頂板和地基基礎中的厚條基等[2].RC深受彎構件在地震作用下的損傷特性將直接影響鋼筋混凝土結構的抗震性能.RC深受彎構件以受剪為主,受剪破壞過程伴隨斜裂縫產(chǎn)生發(fā)展至最終脆性破壞,準確預測開裂荷載及剪力對RC深受彎構件設計及安全性具有重要意義.
開裂荷載是深受彎構件受剪開裂性能的重要指標.國內(nèi)外學者對于開裂荷載的認識不統(tǒng)一.Tan等[3]將出現(xiàn)首條斜裂縫或剪跨區(qū)斜裂縫高度超過梁高一半時的荷載稱為開裂荷載.Birrcher等[4]將所測得箍筋應變突然增加時對應的荷載定義為開裂荷載.有學者將出現(xiàn)首條斜裂縫定義為開裂荷載[5-8].開裂荷載所對應的剪力為開裂剪力.已有研究表明開裂剪力與混凝土抗壓強度、剪跨比、截面尺寸、縱向配筋率有關,并基于試驗數(shù)據(jù)提出了眾多半經(jīng)驗半理論計算模型[9-17].但由于回歸公式形式和關鍵參數(shù)的差異,導致開裂剪力計算模型各不相同且預測精度低、離散性大.進一步探索RC深受彎構件的開裂剪力精準預測模型是十分必要的.
隨著大數(shù)據(jù)時代的到來和人工智能的興起,以“數(shù)據(jù)驅動”建模的機器學習方法擅長挖掘數(shù)據(jù),可消除半經(jīng)驗半理論公式由于依賴數(shù)據(jù)回歸帶來的差異性.各種機器學習方法已廣泛應用于混凝土構件基本性能的預測[18-24].Solhmirzaei等[18]采用機器學習單一算法預測了高性能混凝土梁的破壞模式和受剪承載力.Olalusi等[19]采用隨機森林算法預測了鋼纖維梁的受剪承載力.馮德成等[20,24]采用集成算法預測了不同構件的基本性能,如RC柱塑性鉸長度等.于曉輝等[21]基于機器學習方法提出了RC柱的破壞模式兩階段判別方法.上述研究表明,機器學習方法預測RC結構的基本性能具有特有的優(yōu)勢.尤其是Lundberg和Lee[22]提出了機器學習模型的可解釋方法:SHAP(SHapley Additive exPlanations).SHAP方法可得到各特征的重要性排序以及分析各特征對模型預測結果的貢獻,克服了無法對機器學習模型的預測結果進行解釋的問題,即“黑匣子”問題.近年來,SHAP方法也得到廣泛應用.Mangalathu等[23]采用SHAP方法解釋了剪力墻的破壞模式預測結果.馮德成等[24]采用SHAP方法解釋了混凝土矮墻的受剪承載力預測結果.綜上,關于鋼筋混凝土深受彎構件開裂荷載及剪力相關的研究未見報道.
鑒于此,本文建立了RC深受彎構件開裂剪力的可解釋機器學習模型.采用SHAP方法對機器學習模型預測結果進行解釋.給出了預測RC深受彎構件開裂剪力的基本步驟,然后利用276條試驗數(shù)據(jù)建立機器學習模型,利用統(tǒng)計指標將所建立模型與半經(jīng)驗半理論計算方法進行對比分析,最后采用SHAP方法對預測結果進行全局解釋和局部解釋.
通過對比學者們對開裂荷載的定義[3-8],本文采用Tan等[3]定義的開裂荷載.開裂荷載所對應的剪力為開裂剪力.下一章節(jié)介紹的所搜集的試驗開裂荷載均是此含義.
RC深受彎構件的斜向開裂剪力受多種因素影響.剪跨比和跨高比決定了RC深受彎構件的開裂剪力.混凝土抗拉強度與骨料的最大粒徑影響混凝土壓桿的強度.加載板寬度是試件受力時與外荷載接觸的關鍵組件,其影響了剪力的傳遞路徑.另外,RC深受彎構件在正常服役期間,當彎曲裂縫出現(xiàn)后、斜裂縫出現(xiàn)前,底部縱筋起到抗剪及抗彎的作用.底部縱筋配筋率越大、縱筋的直徑越小,裂縫擴展得越慢,開裂剪力隨之增加.隨著外荷載的增加,支座處垂直于梁長方向的彎曲裂縫迅速向加載點延伸,此時剪跨區(qū)出現(xiàn)斜向裂縫,與斜裂縫相交的腹筋應力顯著增大,腹筋配筋率越大、腹筋的直徑越小、腹筋間距越小,斜向裂縫擴展得越慢.
已有開裂剪力計算方法大多是基于試驗數(shù)據(jù)回歸的半經(jīng)驗半理論公式[9-17],計算方法如下.
1)南京工學院所提計算模型[13]:
2)鄭州工學院所提計算模型[14]:
3)徐積善團隊所提計算模型[15]:
4)彭天明所提計算模型[16]:
5)李朋團隊所提計算模型[17]:
式中:λ為剪跨比,ft為混凝土抗拉強度,b為截面寬度,h0為截面有效高度,a為剪跨,ρl為縱筋配筋率.已有的計算方法與剪跨比、混凝土抗拉強度、截面寬度、截面有效高度和縱筋配筋率有關,尚未考慮混凝土骨料的最大粒徑、跨高比、底部縱筋的直徑、腹筋的影響.
綜合上述討論與分析,明確了建立機器學習模型時的擬輸入?yún)?shù):加載板寬度、截面寬度、有效高度、剪跨比、跨高比、混凝土抗壓強度、底部縱筋配筋率、水平腹筋配筋率、豎向腹筋配筋率、混凝土的最大粒徑、腹筋的最大間距和最小直徑.
為建立機器學習模型,從27篇文獻[5,25-50]中收集了276條含開裂荷載信息的受剪破壞的RC深受彎構件.試驗數(shù)據(jù)庫中共有109根無腹筋試件、167根雙向腹筋試件.所收集的試驗數(shù)據(jù)庫包含的變量有開裂剪力(Vcr)、截面寬度(b)、加載板寬度(lp)、有效高度(h0)、剪跨比(a/h0)、跨高比(l0/h)、混凝土抗壓強度(f′c)、底部縱筋配筋率(ρl)、水平腹筋配筋率(ρsh)、豎向腹筋配筋率(ρsv)、混凝土的最大粒徑(ag)、腹筋的最大間距(smax)和最小直徑(rmin).數(shù)據(jù)分布如圖1所示,其中y軸為頻數(shù),表示參數(shù)的每個范圍在數(shù)據(jù)集中出現(xiàn)的次數(shù),詳細的試驗信息見原始文獻.需要說明的是,圖1(l)為機器學習目標預測值,其余均是模型特征輸入?yún)?shù).
圖1 模型特征輸入?yún)?shù)及目標預測值(標簽)的分布
RC深受彎構件開裂剪力的預測,主要屬于機器學習中的回歸類問題.目前,常用于解決回歸類問題的機器學習算法主要包括回歸算法、決策樹[51]、支持向量機[52]、集成學習算法bagging[53]、集成學習算法boosting[54-55]和人工神經(jīng)網(wǎng)絡[56]等.集成學習算法boosting中的極端梯度提升樹(XGBoost)[57]性能優(yōu)勢突出,增加了正則化項,控制了模型的復雜度,在保證預測結果準確性的同時避免了過擬合問題[24].Feng等[20]的研究結果表明XGBoost預測混凝土構件的基本性能時在眾多常見集成算法中具有較好的性能,因此,本文選用XGBoost對RC深受彎構件的開裂剪力進行預測.
SHAP[22]是基于博弈論的用于解釋機器學習模型的方法,其是將預測目標定義為輸入特征線性相加的加性特征歸因方法,描述各個特征對模型預測結果的貢獻,可表示為:
式中:X=(x1,x2,···,xM)為輸入特征,X′=h(X)=(x′1,x′2,···,)為X映射后的簡化輸入(x′i∈[0,1]),M為輸入特征個數(shù),f(X)為原始機器學習模型,g(X′)為解釋模型,φ0為f(X)在數(shù)據(jù)集上的平均預測結果,φi為第i個特征的SHAP值(表示貢獻).以5個輸入特征為例,SHAP示意圖如圖2所示;其中:特征1、2、3對于g(X′)為正值貢獻,特征4、5對于g(X′)為負值貢獻.
圖2 多特征SHAP示意圖[22]
SHAP方法主要分為Kernel SHAP、Deep SHAP和Tree SHAP.其中Tree SHAP是基于樹模型的解釋方法,適用于決策樹、集成學習算法bagging的代表隨機森林、集成學習算法boosting的代表XGBoost等多種性能較好的算法.本文也將采用Tree SHAP方法對機器學習模型進行解釋.
RC深受彎構件開裂剪力的可解釋機器學習預測模型建立流程如圖3所示.先將數(shù)據(jù)庫中所有數(shù)據(jù)進行標準化處理.然后按照總數(shù)據(jù)70%和30%的比例隨機劃分成訓練集和測試集.最后將數(shù)據(jù)帶入XGBoost算法生成模型,為了提高模型的性能,采用網(wǎng)格搜索技術和十折交叉驗證(CV)的方法確定最優(yōu)參數(shù).本文確定的最優(yōu)關鍵參數(shù)為:n_estimators=150、max_depth=3、learning_rate=0.3.對于回歸類模型,主要評價指標包括可決系數(shù)(R2)、均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE),詳見式(7~10).式中:Ti表示試驗值,Pi表示模型的預測值(i=1,2,···),n表示樣本的數(shù)量.
圖3 可解釋機器學習模型建模過程
XGBoost模型與第1節(jié)提到的5個開裂剪力計算方法的預測結果如圖4所示.RC深受彎構件分為無腹筋構件和雙向腹筋構件以比較已有計算方法預測效果.圖4(a)為XGBoost模型的預測結果,圖4(b~f)為已有計算方法的預測結果.圖4(a)中紅色方塊為訓練集數(shù)據(jù),藍色圓點為測試集數(shù)據(jù);圖4(b~f)中藍色圓點為雙向腹筋深受彎構件,橙色方塊為無腹筋深受彎構件.表1列出了已有計算模型和XGBoost模型預測值/真實值的相關統(tǒng)計數(shù)據(jù).
表1 已有計算模型與XGBoost模型預測結果的統(tǒng)計指標
圖4 半經(jīng)驗半理論公式與XGBoost模型的開裂剪力預測結果
1)已有計算模型僅考慮了剪跨比、混凝土抗拉強度、有效高度、截面寬度4個參數(shù),而XGBoost模型考慮了11個輸入?yún)?shù)的影響;2)XGBoost模型采用276條試件數(shù)據(jù)進行建模,避免了模型過擬合;3)XGBoost模型在損失函數(shù)中增加了正則化項,提高了模型精度;綜上,XGBoost模型性能優(yōu)于已有計算模型.結合圖4和表1可知,已有計算模型的預測結果離散性較大,且散點大多落于y=x斜直線的上方區(qū)域,特別是預測配有雙向腹筋的深受彎構件時.說明已有計算模型普遍高估了開裂剪力.已有計算模型預測效果最好的是徐積善團隊所提的公式[15],預測結果的R2為0.64,預測值與試驗值比值的均值為1.06,標準差為0.53.由XGBoost模型預測結果的散點圖可知,散點大多落于y=x斜直線上,且較為集中,說明XGBoost模型的預測結果更為接近試驗值.XGBoost模型的統(tǒng)計指標也表明預測效果遠優(yōu)于已有計算模型,其預測值與試驗值比值的均值為0.99,標準差為0.27.
本節(jié)將在前一節(jié)預測結果的基礎上,采用SHAP方法對模型的預測結果進行解釋.首先對數(shù)據(jù)庫內(nèi)所有試件進行全局解釋,依次分析了關鍵特征重要性排序和關鍵特性依賴關系.然后對數(shù)據(jù)庫的單一樣本進行局部解釋,分解了每個輸入變量對RC深受彎構件開裂剪力的貢獻值,量化了每個輸入變量對開裂剪力的貢獻程度.需要說明的是,先獲得了特征重要性排序及SHAP值分布,然后是特征依賴圖,最后是單一樣本模型的預測結果.
4.1.1 特征重要性分析
特征重要性分析是解釋模型預測結果最常用的方法,它直接顯示了每個特征對最終預測的影響程度,特征對模型預測的影響程度越大,該特征就越重要.圖5(a)給出了XGBoost模型對開裂剪力的相對特征重要性結果,可知加載板寬度是最重要的特征,因為加載板寬度的平均絕對SHAP值最大.截面高度是第二重要特征,其重要性僅次于加載板寬度.而混凝土抗壓強度、縱筋配筋率和腹筋最小直徑是第三重要特征,其平均絕對SHAP值約是加載板寬度的1/3.腹筋最大間距、截面寬度和剪跨比對結果的影響約為加載板寬度的1/5.腹板和縱筋的配筋與鋼筋強度的重要性僅占混凝土抗壓強度的1/10左右.其余特征對結果的影響相對較?。畧D5(b)展示了每個特征變量對預測結果的影響趨勢,按照SHAP的平均絕對值進行特征排序.
圖5 SHAP值全局模型解釋
圖5中的x軸表示SHAP值大小,SHAP值藍色代表該特征對預測有負向影響(箭頭向左,SHAP值減少),紅色代表該特征對預測有正向影響(箭頭向右,SHAP值增加).左側y軸表示輸入的特征變量;右側y軸的顏色條表示特征值的大小,紅色表示特征值高,藍色表示特征值低.每個散點表示數(shù)據(jù)庫中的一個樣本.因此可展現(xiàn)每個特征變量對預測結果是如何影響的,以及特征的重要性.比如,對于加載板寬度,其樣本大量聚集shap value為負的區(qū)域.加載板寬度的值越高,可能使模型的輸出值越大(shap value為正);加載板寬度的值越低,可能使模型的輸出值越?。╯hap value為負).故加載板寬度與模型的輸出值成正相關;同理,截面高度、混凝土抗壓強度、截面寬度均與模型的輸出值成正相關,剪跨比與模型的輸出值成負相關.
4.1.2 特征依賴性分析
SHAP特征依賴圖可以用來反映SHAP值隨著輸入特征的變化而變化,在數(shù)學上包括x軸上的特征值和y軸上相應的SHAP值.它可以揭示輸入特性如何影響預測值,以及這種影響是積極的還是消極的.開裂剪力的SHAP值隨輸入變量的變化如圖6所示.可知有效高度和混凝土抗壓強度的SHAP值會隨著特征值的增長而降低,當跨高比小于4.0時,其SHAP值幾乎沒有變化,水平腹筋配筋率的SHAP值變化無明顯規(guī)律.另外,當剪跨比大于1.0、有效高度大于750 mm、混凝土抗壓強度小于30 MPa、底部縱筋配筋率小于2.0%、水平腹筋配筋率小于0.50%時,它們的SHAP值為負值.也就是說,當各特征落于上述范圍時,所預測的開裂剪力減?。€可觀察到特征之間的交互關系,如圖6(c)顯示了水平腹筋配筋率從0到0.7%的變化對剪跨比的影響.紅色的值代表變量水平腹筋配筋率的高值,而藍色的值代表低值.由圖6(c)可以發(fā)現(xiàn),當剪跨比較大、水平腹筋配筋率較低時,SHAP值極低;可推斷出有效高度與豎向腹筋配筋率之間的關系對特征的SHAP值的共同影響,當有效高度越小、豎向腹筋配筋率越低時,SHAP值越小.混凝土抗壓強度和水平腹筋配筋率、底部縱筋配筋率和跨高比也呈現(xiàn)同樣的上述規(guī)律.
圖6 特征依賴圖
本文對Smith[25]和Walraven[27]等的試驗結果進行單一樣本模型解釋,圖7展示了SHAP值將開裂剪力的預測分解為每個輸入變量的貢獻之和.圖7的“base value”表示基準值,即XGBoost模型對數(shù)據(jù)庫內(nèi)所有變量預測值的平均值(202.2 kN).紅色箭頭表示對基準開裂剪力有正向貢獻的變量,藍色箭頭則表示導致基準開裂剪力降低的變量;箭頭的長短表示增量和減量.對試件DB50/1.86-C1來說,截面寬度、加載板寬度、豎向腹筋屈服強度、截面有效高度、水平腹筋配筋率、水平腹筋屈服強度和跨高比是對基準開裂剪力有正向貢獻的關鍵變量,它們的增量依次減?。溆嘧兞浚ǜ菇钭畲箝g距、縱筋屈服強度、腹筋的直徑、底部縱筋配筋率和混凝土抗壓強度)是導致基準開裂剪力降低的關鍵變量,它們的降低程度依次減?。畬⑺凶兞康脑隽炕驕p量與基準開裂剪力進行代數(shù)相加,即為圖中的模型預測值228.51 kN,與試驗值240 kN接近.對試件A1.5-0.75-1.33來說,豎向腹筋屈服強度是對基準開裂剪力有正向貢獻的量.其余變量如加載板寬度、截面寬度、混凝土抗壓強度等是導致基準開裂剪力降低的變量,它們的減量依次降低.將所有變量的增量或減量與基準開裂剪力進行代數(shù)相加,即為模型預測值81.74 kN,接近試驗值83.30 kN,且預測結果比試驗值低,說明最終預測結果是精確且安全的.
圖7 SHAP值單一樣本模型解釋
本文提出了一個可解釋機器學習模型來預測RC梁的開裂剪力.詳細介紹了研究思路和方法.收集了包含276條試件的數(shù)據(jù)庫來訓練和測試XGBoost模型,然后與半經(jīng)驗半理論公式進行比較.最后利用特征重要性、特征依賴性分析、單一樣本來解釋和驗證XGBoost模型.得出以下結論:
1)與5個半經(jīng)驗半理論公式相比,本文的XGBoost模型在預測精度和泛化能力方面有明顯的優(yōu)勢.模型的R2為91%,預測值與試驗值比值的均值為0.99,標準差為0.27.
2)通過特征重要性和特征依賴性分析,可以進一步了解輸入?yún)?shù)對開裂剪力的作用.其中:加載板寬度是影響RC深受彎構件開裂剪力最重要的特征,截面高度是第二重要特征,混凝土抗壓強度是第三重要特征.
3)通過對單一樣本進行分析,表明了XGBoost模型預測結果是符合機理的.
本文詳細介紹了建立ML預測模型的每一步,可以幫助讀者使用ML解決自己在結構工程中的問題.然而,在該領域仍有進一步改進的空間,例如,使用主動學習來提高計算效率,開發(fā)基于ML的力學引導抗剪強度模型以更好地應用等.