何定橋,楊 軍
(清華大學(xué) 土木工程安全與耐久教育部重點實驗室,北京 100084)
近年來,隨著計算機技術(shù)、傳感器技術(shù)的快速發(fā)展,結(jié)構(gòu)健康監(jiān)測逐漸成為研究熱點,結(jié)構(gòu)健康監(jiān)測的一個重要目的是結(jié)構(gòu)損傷識別與定位[1-2]。結(jié)構(gòu)損傷識別與定位由以下部分構(gòu)成:(1) 判別結(jié)構(gòu)是否存在損傷;(2) 判別結(jié)構(gòu)損傷發(fā)生的位置;(3) 判定結(jié)構(gòu)的破壞程度;(4) 對結(jié)構(gòu)健康狀況進行評估。其中,對結(jié)構(gòu)損傷位置及損傷程度的判斷是難點?;谏鲜?2)、(3)部分可以實現(xiàn)結(jié)構(gòu)狀況的整體評價。通過無線智能傳感器配合云平臺可以實現(xiàn)建筑結(jié)構(gòu)的全天候不間斷監(jiān)測。在地震荷載、風(fēng)荷載等作用下結(jié)構(gòu)出現(xiàn)損傷時,監(jiān)測數(shù)據(jù)可以有效反映結(jié)構(gòu)的損傷信息[3-4]。
基于監(jiān)測數(shù)據(jù)的結(jié)構(gòu)損傷識別與定位可分為模態(tài)參數(shù)方法和非模態(tài)參數(shù)方法。模態(tài)參數(shù)法是根據(jù)結(jié)構(gòu)模態(tài)參數(shù)在損傷前后的變化反映結(jié)構(gòu)損傷的信息。常見的模態(tài)參數(shù)包括固有頻率[5]、模態(tài)振型[6]、振型曲率[7]及應(yīng)變曲率模態(tài)曲率[8]等?;谀B(tài)參數(shù)的方法因?qū)p傷不敏感、模態(tài)振型測量復(fù)雜、容易受外界干擾等問題,在實際工程應(yīng)用中受到很大的限制,實用性還需進一步的研究[9]。非模態(tài)參數(shù)法原理是對結(jié)構(gòu)振動響應(yīng)進行變換后得到可以反映結(jié)構(gòu)損傷的參數(shù)來進行損傷識別與定位。非模態(tài)參數(shù)法包括基于小波變換[10-12]、希爾伯特黃變換[13]、時間序列等模型方法。時間序列模型最初應(yīng)用于經(jīng)濟學(xué)和電氣工程領(lǐng)域,后在結(jié)構(gòu)監(jiān)測領(lǐng)域被大量應(yīng)用。Fugate 等[14]建立了結(jié)構(gòu)的自回歸模型,提取模型殘差作為損傷特征量,采用質(zhì)量控制圖法監(jiān)測結(jié)構(gòu)狀態(tài)。H.Sohn等[15]建立了自回歸-外加輸入自回歸模型(AR-ARX),以模型殘差作為特征量,采用統(tǒng)計模式識別方法進行損傷識別與定位。劉毅等[12]建立了自回歸滑動平均模型(ARMA),基于自回歸部分參數(shù),采用主成分分析法提出結(jié)構(gòu)損傷特征指標(biāo)。然后采用t-檢驗考察該指標(biāo)在損傷前后的變化進行損傷定位。王真等[16]建立了自回歸系數(shù)的損傷靈敏度矩陣,通過該矩陣反映的自回歸系數(shù)變化與損傷系數(shù)變化之間的關(guān)系進行損傷識別與定位。
盧宏彬[17]基于ARMA模型構(gòu)造了殘差指標(biāo)、前三階指標(biāo)和馬氏距離指標(biāo)在內(nèi)的損傷指標(biāo)體系對結(jié)構(gòu)損傷進行了識別,并將該方法應(yīng)用于主跨428 m的廣州新光大橋健康監(jiān)測系統(tǒng)上。杜永峰等[18]建立了AR模型,將待識別工況的殘差與AR預(yù)測參考模型的殘差的方差之比作為損傷指標(biāo)。張凱瑋等[19]基于ARMA模型和馬氏距離定義了損傷指標(biāo),根據(jù)各工況下隧道結(jié)構(gòu)的加速度響應(yīng)進行了損傷識別分析,實現(xiàn)對盾構(gòu)隧道結(jié)構(gòu)損傷的檢測和定位。
可見,當(dāng)前基于ARMA模型的結(jié)構(gòu)損傷識別研究普遍利用自回歸系數(shù)的統(tǒng)計學(xué)特征,理論意義不明確,主觀性較強。而核嶺回歸算法具有非線性、擬合性能強、泛化能力強等特點。本文結(jié)合ARMA時間序列模型與核嶺回歸提出了一種結(jié)構(gòu)損傷識別與定位的新方法,并用算例驗證了其有效性。
結(jié)構(gòu)損傷會改變結(jié)構(gòu)的動力特性,也會改變結(jié)構(gòu)在時域響應(yīng)的統(tǒng)計特性[20]。時間序列模型可以將大量結(jié)構(gòu)響應(yīng)數(shù)據(jù)所蘊含的信息凝聚為少量的模型參數(shù),例如自回歸系數(shù)、滑動平均系數(shù)和模型殘差方差等,其中的自回歸系數(shù)內(nèi)含了結(jié)構(gòu)的固有動力特性,可以通過機器學(xué)習(xí)算法建立結(jié)構(gòu)自回歸系數(shù)變化與損傷的聯(lián)系,進行損傷識別與定位。
對于一個平穩(wěn)、正態(tài)、零均值的時間序列{Xt},若xt與前p步取值xt-1,xt-2,…xt-p,前q步輸入激勵at-1,at-2,…at-q有關(guān),則時間序列模型可以表示為:
(1)
式中:p是自回歸模型的階數(shù);q是滑動平均模型的階數(shù),模型記為ARMA(p,q),φ和θ分別是時間序列和輸入激勵的各階特定系數(shù)。對式(1)引入后移算子B,使得Bixt=xt-i,模型可以表示為:
(2)
(3)
上式反映了系統(tǒng)的脈沖響應(yīng)函數(shù),分子θ(B)包含了結(jié)構(gòu)與外部之間的交換關(guān)系,分母φ(B)包含了結(jié)構(gòu)的固有特性信息。利用結(jié)構(gòu)在外界激勵下的位移/加速度時程建立ARMA模型,模型的自回歸系數(shù)包含了結(jié)構(gòu)固有特性信息。
對于發(fā)生損傷的結(jié)構(gòu),其總體剛度矩陣為:
(4)
式中:ki為第i個構(gòu)件未發(fā)生損傷時的剛度矩陣;M為構(gòu)件的數(shù)量;定義αi為第i個構(gòu)件的損傷系數(shù),αi∈[0,1],未發(fā)生損傷時αi=0,完全損傷時αi=1。
結(jié)構(gòu)發(fā)生損傷后,模態(tài)參數(shù)會發(fā)生變化,反映結(jié)構(gòu)固有特性信息的自回歸系數(shù)會發(fā)生變化,但是自回歸系數(shù)的變化與結(jié)構(gòu)損傷系數(shù)αi不一定是線性變化的。假設(shè)結(jié)構(gòu)有p個測點,對每個測點信號可以提取前q階自回歸系數(shù),共可獲得s=p×q個自回歸系數(shù)。定義自回歸系數(shù)向量為:
{φ}=[φ1,φ2…φs]T
(5)
對自回歸系數(shù)φi(i∈[1,s])做一階變分:
(6)
自回歸系數(shù)向量的一階變分可以表示為:
{δφ}=[δφ1,δφ2,…δφs]T=
(7)
式中:P為s行、M列矩陣;Pij反映了損傷系數(shù)αj的單位變化引起第i個自回歸系數(shù)的變化量(i∈[1,s],j∈[1,M])。
自回歸系數(shù)的一階變分反映了損傷結(jié)構(gòu)自回歸系數(shù)與未損傷結(jié)構(gòu)的自回歸系數(shù)之差:
(8)
(9)
可以得到:
{δφ}={φ}-{φ0}=P{δα}=P{α}
(10)
進而求出結(jié)構(gòu)損傷系數(shù)向量{α}:
{α}=P+[{φ}-{φ0}]
(11)
式中:P+為P的偽逆矩陣,定義為損傷識別矩陣。該矩陣只與結(jié)構(gòu)自身的動力特性有關(guān),若能求出P+矩陣,便可以乘上損傷結(jié)構(gòu)與未損傷結(jié)構(gòu)的自回歸系數(shù)向量之差求出結(jié)構(gòu)的損傷系數(shù)向量,從而識別損傷的位置與大小。
有大量的損傷樣本與對應(yīng)的自回歸系數(shù)時,可以通過機器學(xué)習(xí)(Machine Learning)對損傷識別矩陣進行估計。自1950年圖靈提出機器學(xué)習(xí)的概念以來,其理論和方法發(fā)展迅速,在土木工程的多個細(xì)分領(lǐng)域已被廣泛應(yīng)用[21-22],對損傷程度的預(yù)測適用于連續(xù)型有監(jiān)督的回歸算法(Regression),首先考慮使用普通的線性回歸對結(jié)構(gòu)損傷系數(shù)進行回歸預(yù)測:
(12)
(13)
式中:N是訓(xùn)練集中的樣本數(shù)量。其使用最小二乘法求得的解為:
(14)
求解線性回歸的前提條件是對給定數(shù)據(jù)集X,XTX可逆。結(jié)構(gòu)監(jiān)測系統(tǒng)存在多個測點,每個測點獲得的自回歸系數(shù)階數(shù)較高,樣本的特征數(shù)量s較高,部分特征之間可能高度相關(guān),則XTX接近于奇異的病態(tài)矩陣。上述問題變?yōu)椴贿m定問題,計算誤差很大,在最小化目標(biāo)中加一個懲罰項,使得目標(biāo)函數(shù)變?yōu)?
(15)
這種回歸稱為嶺回歸(Ridge Regression)。嶺回歸可以限制模型的復(fù)雜度,防止過擬合(Overfitting),使得模型在復(fù)雜度和性能間達到平衡,可以有效應(yīng)用于結(jié)構(gòu)損傷定位。λ是待定的參數(shù),嶺回歸的關(guān)鍵是找到合理的λ來平衡模型的損失函數(shù)和偏差。使用嶺回歸求得系數(shù)的解為:
(16)
(17)
這種回歸稱為核嶺回歸,目標(biāo)函數(shù)可以表示為:
(18)
K(x(i),x(j))=Φ(x(i))·Φ(x(j))=
(19)
利用時間序列與核嶺回歸進行結(jié)構(gòu)損傷識別與定位,需建立有限元模型,在模型中模擬結(jié)構(gòu)的損傷。假設(shè)結(jié)構(gòu)有p層,識別精度僅限于損傷發(fā)生的樓層,損傷模式記為{α}=[α1,α2,…,αp],共隨機生成m種破壞模式。
對m個損傷模型分別輸入環(huán)境激勵,每個模型輸出p條響應(yīng)。對每條輸出響應(yīng)均建立ARMA模型,每個ARMA模型提取前q個自回歸系數(shù),得到s=p×q個自回歸系數(shù)作為后續(xù)核嶺回歸輸入特征,自回歸系數(shù)記為{φ}=[φ1,φ2…φs]T。
將每種損傷模式的s個自回歸系數(shù)作為核嶺回歸的輸入特征,損傷系數(shù)作為輸出變量,對模型進行訓(xùn)練。完成訓(xùn)練的模型可以接受結(jié)構(gòu)發(fā)生未知損傷后提取的自回歸系數(shù),輸出預(yù)測的損傷系數(shù)。
本文采用4層鋼筋混凝土框架結(jié)構(gòu)作為數(shù)值算例,該結(jié)構(gòu)長3.0 m、寬2.0 m、層高2.6 m,梁均為高0.66 m、寬0.25 m的矩形梁,柱為0.4 m×0.6 m矩形截面柱,采用開源有限元軟件OpenSees建立結(jié)構(gòu)有限元模型。該模型采用線彈性模型,樓面荷載3 kN/m2,混凝土采用C30,彈性模量為3×104MPa。模型如圖1所示。
圖1 混凝土框架OpenSees有限元模型Fig.1 OpenSees FEM model of the concrete frame
沿結(jié)構(gòu)短邊方向(Y向)在底部輸入白噪聲激勵,激勵時長30 s,采樣間隔為0.01 s,采樣頻率為100 Hz。未損傷結(jié)構(gòu)在白噪聲激勵下一層(圖1中A點)及4層(圖1中D點)加速度時程如圖2所示。
圖2 混凝土框架白噪聲激勵下加速度時程Fig.2 Acceleration time history of concrete frame under white noise excitation
對受損傷的結(jié)構(gòu)輸入白噪聲后得到4層加速度時程(圖1中A,B,C,D點),分別建立ARMA模型,該模型要求輸入的時間序列是平穩(wěn)的,且首先對時間序列的穩(wěn)定性進行單位根檢驗(ADF),然后對模型進行定階。
選擇合適的模型階數(shù)非常重要,模型的階數(shù)越大擬合性越強,但階數(shù)過高誤差會加大,造成過擬合[23]。常用的定階方法包括自相關(guān)系數(shù)法、偏相關(guān)系數(shù)法、赤池信息量準(zhǔn)則法(AIC)及貝葉斯信息準(zhǔn)則(BIC)等。本文對模型采用AIC熱力圖定階,根據(jù)經(jīng)驗取AR階數(shù)1~30,MA階數(shù)1~5,分別計算對應(yīng)的ARMA模型的AIC,選取使得AIC最小的AR與MA階數(shù)組合。
如圖3所示為未損傷結(jié)構(gòu)4層加速度時程ARMA模型的AIC熱力圖。隨著AR與MA階數(shù)的增大,AIC基本穩(wěn)定于2.6。模型的AR與MA階數(shù)可選擇(19,1)、(14,2)、(12,3)、(12,4)、(9,5)等組合,實際計算過程中優(yōu)先選擇MA階數(shù)較小的模型(19,1)。
圖3 ARMA模型AIC定階熱力圖Fig.3 AIC heatmap of ARMA model
為保證輸入信息的完整性,核嶺回歸模型取每條信號ARMA模型的前10階自回歸系數(shù),損傷系數(shù)為柱剛度折減系數(shù)。對于第三層柱剛度折減30%的損傷模型(α1= 0,α2=0,α3=30%,α4=0)自回歸系數(shù)分布如圖4所示。圖5中可以看到結(jié)構(gòu)受到損傷后自回歸系數(shù)系數(shù)發(fā)生了顯著改變,且不同層自回歸系數(shù)變化不同。
圖4 損傷結(jié)構(gòu)前10階自回歸系數(shù)Fig.4 Top 10 autoregressive coefficients of damaged structure
圖5 損傷結(jié)構(gòu)與未損傷結(jié)構(gòu)前10階自回歸系數(shù)之差Fig.5 Difference between the top 10 autoregressive coeffici- ents of damaged and undamaged structures
本文通過對上述有限元模型進行隨機構(gòu)造損傷,共生成損傷模型1 200個,分別輸入白噪聲激勵后得到4 800條加速度時程數(shù)據(jù),對每條加速度時程分別建立ARMA模型,每個ARMA模型提取前10階自回歸系數(shù),每個損傷模型對應(yīng)40個自回歸系數(shù)以及4個輸出變量(1層、2層、3層、4層的結(jié)構(gòu)損傷系數(shù))。將數(shù)據(jù)集進行分割,隨機選取1 000個損傷模型作為訓(xùn)練集,其余200個模型作為驗證集。
機器學(xué)習(xí)中超參數(shù)選擇對模型的預(yù)測精度至關(guān)重要。核嶺回歸中需要確定的超參數(shù)包括:(1)正則化系數(shù)λ,表征正則化的強弱,λ過小可能出現(xiàn)過擬合,λ過大可能使得模型回歸系數(shù)太小,出現(xiàn)欠擬合;(2)核函數(shù)(Kernel),不同核函數(shù)泛化能力不同,平滑程度不同,適用的樣本也不同,本文依據(jù)經(jīng)驗選取最為常見的核函數(shù)徑向基函數(shù);(3)徑向基函數(shù)參數(shù)γ代表RBF的幅寬,會影響模型的泛化性能。需要確定的超參數(shù)只有λ和γ,且超參數(shù)范圍已知,可以利用窮舉搜索找出使得模型表現(xiàn)最好的超參數(shù)。
本文中對4個輸出變量的預(yù)測分為4個模型,確定超參數(shù)后對模型進行訓(xùn)練,如圖6所示,單個模型訓(xùn)練時長約為4~5 s,模型整體訓(xùn)練總時長約16~20 s。
圖6 模型訓(xùn)練樣本量與訓(xùn)練時間Fig.6 Model training sample size and training time
如圖7所示,單層的核嶺回歸模型R2在訓(xùn)練集上可以達到一層95%、二層84%、三層81%、四層88%,在驗證集上可以達到一層81%、二層67%、三層68%、四層66%。訓(xùn)練樣本數(shù)量超過400后模型表現(xiàn)趨于穩(wěn)定。
圖7 模型R2學(xué)習(xí)曲線(R2小于0時,圖中體現(xiàn)為0)Fig.7 Model R2 learning curves
為了驗證核嶺回歸的優(yōu)勢,使用無正則化無核函數(shù)的線性回歸(Liner Regression)、有正則化無核函數(shù)的嶺回歸(Ridge Regression)、無正則化有核函數(shù)的支持向量回歸(Support Vector Regression)三種算法與其進行對比。
如圖8、圖9所示,在訓(xùn)練集上,線性回歸表現(xiàn)最好,R2在訓(xùn)練過程中維持在95%以上,均方誤差(MSE)維持在0.001以上,但在驗證集上線性回歸表現(xiàn)很差,R2維持在0及0以下,模型出現(xiàn)過擬合。
圖8 不同回歸算法模型R2學(xué)習(xí)曲線 (R2小于0時,圖中體現(xiàn)為0)Fig.8 Model R2 learning curves with different regression methods
圖9 不同回歸算法模型MSE曲線Fig.9 Model MSE curves with different regression methods
表1為最終幾種回歸模型的表現(xiàn),嶺回歸、支持向量回歸的表現(xiàn)介于線性回歸與核嶺回歸之間,結(jié)果說明添加正則化與核函數(shù)后可以顯著提升模型的擬合性能與泛化性能。
表1 不同回歸模型訓(xùn)練時間及表現(xiàn)對比Table 1 Training time and performance of different regression models
為驗證模型損傷識別與定位的準(zhǔn)確性,選取5種工況進行驗證,分別為未受損工況、兩種單損傷工況(結(jié)構(gòu)僅一處發(fā)生損傷)及兩種多損傷工況(結(jié)構(gòu)多處發(fā)生損傷)。損傷情況如表2所列。
表2 模型損傷工況Table 2 Damage conditions for model
對未受損的原結(jié)構(gòu),核嶺回歸模型識別一至四層的損傷系數(shù)分別為4.6%、0.4%、3.2%、4.2%,平均誤差為3.1%;對于單損傷工況1,一層損傷10%,模型識別一層的損傷為8.9%,一至四層平均識別誤差為2.7%;對于單損傷工況2,一層損傷30%,模型識別一層的損傷為29.0%,一至四層平均識別誤差2.7%;對于多損傷工況1,模型一層、二層、三層發(fā)生10%、30%、30%損傷,模型識別結(jié)果為10.1%、28.9%、24.3%,一至四層平均識別誤差2.7%;對于多損傷模型2,模型二層、三層、四層發(fā)生10%、30%、50%損傷,模型識別結(jié)果為9.3%、30.6%、55.2%,一至四層平均識別誤差3.3%。由表2可看出,模型在多種工況下均表現(xiàn)出較高的識別準(zhǔn)確率。損傷識別完整結(jié)果列于表3。
表3 損傷識別結(jié)果Table 3 Damage identification results
本文通過理論分析并結(jié)合數(shù)值模擬,建立了核嶺回歸模型,利用結(jié)構(gòu)時間序列模型中自回歸系數(shù)實現(xiàn)了結(jié)構(gòu)損傷識別與定位:
(1) 提出結(jié)構(gòu)的損傷識別矩陣P+,該矩陣只與結(jié)構(gòu)自身的動力特性有關(guān),若能求出該矩陣便可以通過損傷結(jié)構(gòu)與未損傷結(jié)構(gòu)的自回歸系數(shù)向量之差識別結(jié)構(gòu)的損傷位置與大小。
(2) 通過4層框架結(jié)構(gòu)數(shù)值模型對理論進行驗證,模型R2在訓(xùn)練集上可以達到80%,在驗證集上可以達到65%。對多個單損傷和多損傷工況進行驗證,模型識別平均誤差不超過3.7%。
(3) 相比無正則化無核函數(shù)的線性回歸、有正則化無核函數(shù)的嶺回歸、無正則化有核函數(shù)的支持向量回歸三種算法,核嶺回歸準(zhǔn)確率最高,說明核函數(shù)和正則化可以有效提高模型的擬合性能與泛化性能,更好地應(yīng)用于結(jié)構(gòu)損傷識別。
本文不足之處在于需要建立結(jié)構(gòu)較為精確的有限元模型,且需對結(jié)構(gòu)各種損傷下的情況進行數(shù)值模擬,建立ARMA模型,需要較高的計算成本。