楊旭鋒 劉澤清 張懿
(西南交通大學 機械工程學院,四川 成都 610031)
獲取材料的疲勞壽命與外加應力或應變之間的關系是結構疲勞壽命分析的基礎和關鍵。1910 年,由國外學者提出的方程lgN=β0+β1lgS,給出了對數(shù)疲勞壽命(N)與對數(shù)應力水平(S)之間的線性關系。為了描述當應力水平低于疲勞極限S0時,疲勞壽命趨于無窮大的現(xiàn)象,1914年Stromeyer[1]提出了非線性S-N模型。根據(jù)疲勞試驗數(shù)據(jù),擬合出S-N曲線,一直是工程領域開展疲勞壽命分析所廣泛使用的手段。近年來,神經(jīng)網(wǎng)絡模型被廣泛用于建立疲勞壽命模型。Mathur等[2]證明了神經(jīng)網(wǎng)絡預測疲勞壽命的能力。Troudet等[3]提出了一種前饋神經(jīng)網(wǎng)絡,用以實時評估機械應力作用下構件的退化情況并預測構件最終失效循環(huán)次數(shù)。Artymiak 等[4]訓練了4個多層前饋神經(jīng)網(wǎng)絡,用以構建S-N曲線。Vassilopoulos 等[5]利用前饋神經(jīng)網(wǎng)絡構建恒定壽命圖,用以預測疲勞壽命。溫海駿等[6]采用粒子群算法優(yōu)化的神經(jīng)網(wǎng)絡對再制造工件進行疲勞壽命預測,為實現(xiàn)再制造工件的疲勞壽命預測提供了一種新的方法。胡贇等[7]提出了一種疲勞壽命服從對數(shù)正態(tài)分布的疲勞強度概率分布數(shù)值模擬方法,該方法能夠精確地估計材料的P-S-N(失效概率-應力-循環(huán)次數(shù))曲線。由于疲勞失效機理復雜,疲勞試驗數(shù)據(jù)往往呈現(xiàn)出較大的分散性,因此,采用P-S-N曲線描述應力與疲勞壽命之間的關系更為恰當。長期以來,眾多研究人員一直致力于疲勞試驗技術與擬合方法的研究。但由于疲勞試驗所需成本高且耗時,疲勞試驗數(shù)據(jù)往往較少,因此如何通過少量的試驗數(shù)據(jù)獲得可靠的P-S-N曲線,成為人們主要關注的問題。
迄今,人們提出了多種方法用以估計材料的P-S-N曲線??傮w而言,可將其歸為兩大類:傳統(tǒng)方法和機器學習方法。在傳統(tǒng)方法方面,Ling 等[8]建立了估計P-S-N曲線的最大似然方法(MLE);趙永翔等[9]將經(jīng)典極大似然法拓展到Langer 模型,提出了估計三參數(shù)、Langer 和Basquin 常用的疲勞應力-壽命模型P-S-N曲線及其置信區(qū)間的統(tǒng)一方法;Klemenc 等[10]采用蟻群算法估計三參數(shù),提出了一種快速估計S-N曲線及其分散性的方法;Xie 等[11]基于失效軌跡概念和向后統(tǒng)計推斷技術,提出了一種用少量試驗數(shù)據(jù)擬合P-S-N曲線的方法;劉瀟然等[12]基于非嵌入式多項式混沌展開及貝葉斯更新方法,提出了一種中等壽命區(qū)的P-S-N曲線小子樣預測方法。在機器學習方法方面,文獻[13-14]提出了基于貝葉斯模型的疲勞數(shù)據(jù)分析方法;Liu 等[15]提出了用于P-S-N曲線估計的分層貝葉斯模型;Chen等[16]基于貝葉斯數(shù)據(jù)擴展與分層貝葉斯模型,提出了一種用于稀疏樣本的P-S-N曲線擬合方法;Chen等[17]提出了一種基于概率的物理驅動神經(jīng)網(wǎng)絡(PPgNN)模型,用于疲勞數(shù)據(jù)的分析。盡管估計P-S-N曲線的方法眾多,但由于疲勞失效機制復雜,材料疲勞試驗數(shù)據(jù)較少,這使得至今為止P-S-N曲線的確定仍是一個尚未解決的問題。
20 世紀90 年代,基于不確定性預測理論的貝葉斯神經(jīng)網(wǎng)絡(BNN)模型被提出。文獻[18-19]詳細介紹了BNN 的基本原理,其中心思想在于:根據(jù)給定的先驗分布,利用貝葉斯定理描述神經(jīng)網(wǎng)絡權重參數(shù)的不確定性,再從樣本數(shù)據(jù)中獲得后驗概率分布。相較于傳統(tǒng)神經(jīng)網(wǎng)絡,BNN 不僅可以對結果進行預測,還可以對預測結果進行不確定性量化,從而有效地解決神經(jīng)網(wǎng)絡模型的過擬合問題。目前,BNN 模型已經(jīng)在流體力學中的流場預測[20]、勻質化復合材料參數(shù)預測[21]、多孔介質中多相流預測[22]、鐵路客流量預測[23]等領域得到了應用,但其在材料疲勞性能不確定性量化領域中的應用尚未開始。
為此,文中提出了基于BNN 模型的金屬材料P-S-N曲線估計方法。目前,在BNN 模型中,大多采用基于Kullback-Leibler(KL)散度的變分推理方法(BBP算法)對權重參數(shù)的后驗分布進行求解,但BBP算法在處理復雜后驗分布時,容易低估參數(shù)的分散性,從而導致BNN 模型給出不合理的疲勞數(shù)據(jù)預測結果。為此,文中引入基于α散度的黑盒(BB-α)算法[24]對權重參數(shù)進行后驗估計,以提高P-S-N曲線的預測精度。最后,基于已有的試驗數(shù)據(jù),使用提出的方法對2524-T3鋁合金、2024-T4鋁合金和S420MC 鋼的P-S-N曲線進行了擬合,以驗證所提方法的可行性。
給定一個觀測數(shù)據(jù)集D(x,y),x=(x1,x2,…,xn)為輸入樣本集,y=(y1,y2,…,yn)為輸出樣本集。神經(jīng)網(wǎng)絡的權重參數(shù)用ω=(ω1,ω2,…,ωd)表示,可以將神經(jīng)網(wǎng)絡模型表示為f ω,該模型通過最小化損失函數(shù)L(f ω(x),y)來找到合適的權重參數(shù)ω,這里的ω為定值,如圖1(a)所示。不同于傳統(tǒng)神經(jīng)網(wǎng)絡模型,BNN 模型的權重參數(shù)不再是一個確定的值,而是一個概率分布,如圖1(b)所示。它將貝葉斯方法與神經(jīng)網(wǎng)絡結合起來,既能給出預測結果,也能給出預測結果的誤差。
圖1 傳統(tǒng)神經(jīng)網(wǎng)絡模型與BNN模型的結構Fig.1 Structures of traditional neural network model and BNN model
BNN采用高斯隨機過程來描述輸入與輸出之間的關系,即
式中,p(·)為概率密度函數(shù),f ω(x)為均值,為方差。
假定觀測樣本D相互獨立,則整個數(shù)據(jù)集的似然函數(shù)可以表示為
BNN的訓練目標是找到ω的后驗分布p(ω|D)。根據(jù)貝葉斯定理,權重參數(shù)的后驗分布可以表示為
式中,p(ω)為參數(shù)的先驗分布,p(D|ω)為觀測數(shù)據(jù)的似然函數(shù)。
給定一個新的輸入x*時,可以得到輸出y*的預測分布:
假設后驗分布p(ω|D)已得到,則可以根據(jù)蒙特卡洛法的思想對ω進行多次采樣,計算確定性的f ω(x*),然后多次計算取平均,可以得到預測結果的期望值[21]:
同理,還可以得到預測結果的方差:
由式(4)可知,求解后驗分布p(ω|D)是BNN開展預測的關鍵。然而,由于神經(jīng)網(wǎng)絡模型的權重參數(shù)較多(俗稱“維數(shù)災難”),通過直接積分或馬爾可夫鏈(MCMC)采樣來求解p(ω|D)是難以實現(xiàn)的。因此,在BNN 模型中,通常采用變分推理的策略,如BBP算法和BB-α算法。
1.2.1 BBP算法
BBP 算法的基本思想是用一個新的分布q(θ;ω)去逼近后驗分布p(ω|D),把求解后驗分布的問題轉化為關于參數(shù)θ的優(yōu)化問題。選擇q(θ;ω)為一個d項連乘的高斯分布:
式中,θ=(μi,σi),i=1,2,…,d。然后將式(4)中的后驗分布p(ω|D)替換為q(θ;ω),可得
接下來,如何使新的分布q(θ;ω)盡可能地接近真實的后驗分布p(ω|D),則成為了關鍵問題。通常用KL散度[25]來衡量兩個分布之間的差異。KL散度值越小,說明兩個分布之間的差異越小,反之則越大。因此,要使兩個分布接近,優(yōu)化目標即變成了尋找最優(yōu)的使得KL散度值最小,即
式中,Eq(·)表示關于分布q(θ;ω)的期望。
1.2.2 BB-α算法
BBP 算法通過參數(shù)化的連乘高斯分布來近似p(ω|D),并通過最小化KL散度獲取最優(yōu)的參數(shù)θ。研究表明[24],當后驗分布為多峰分布或權重之間存在相關性時,BBP 算法容易低估參數(shù)的分散性,從而導致神經(jīng)網(wǎng)絡給出不合理的預測。為此,文獻[24]提出了BB-α算法。
BB-α算法是一種基于α散度最小化的近似推理方法。與KL 散度類似,α散度也可用來衡量兩個分布之間的差異,其定義為
KL 散度可以看作α散度的特殊形式。通過改變α值可以得到不同的KL 散度值,進而產(chǎn)生分散程度不同的后驗分布預測結果。與BBP 算法不同,BB-α算法采用指數(shù)族分布對后驗分布進行近似。
由于后驗分布p(ω|D) ∝故BB-α算法將q(θ;ω)構造為與p(ω|D)類似的連乘積形式,即
式中:θ=(θ0,θ1,…,θn);g(θi;ω)與g(0θ0;ω)從指數(shù)分布族選取,
θ0和θi為指數(shù)分布的自然參數(shù),s(ω)為充分統(tǒng)計量,Z(θ0)為正則化常數(shù)。則BB-α算法的優(yōu)化目標為
文中采用3 個算例對BNN 模型預測P-S-N曲線的有效性進行驗證。每個算例中,均將基于BBP算法的BNN(BNN-BBP)模型和基于BB-α算法的BNN(BNN-BB-α)模型的估計結果進行對比,以驗證BB-α算法的優(yōu)勢。同時,為了體現(xiàn)BNN-BB-α的優(yōu)勢,每個算例中均將其與傳統(tǒng)MLE方法[8]以及當前較為先進的PPgNN方法[17]進行對比。
MLE構造了一個包含4個參數(shù)的疲勞壽命概率密度函數(shù),而后根據(jù)疲勞數(shù)據(jù),采用最大似然估計方法對未知參數(shù)進行求解。PPgNN與傳統(tǒng)神經(jīng)網(wǎng)絡的不同之處在于:傳統(tǒng)的神經(jīng)網(wǎng)絡以某一應力水平下的壽命為預測目標;PPgNN假定對數(shù)空間中的疲勞壽命服從正態(tài)分布,以正態(tài)分布的分布參數(shù)作為神經(jīng)網(wǎng)絡的輸出,從而使神經(jīng)網(wǎng)絡能夠對S-N曲線的概率特性進行預測。此外,PPgNN在損失函數(shù)中引入了材料P-S-N曲線變化的物理規(guī)律(①疲勞壽命的標準差一般隨應力的減小而增大;②疲勞曲線的曲率隨著應力的減小而減小,且如果材料沒有明顯的疲勞極限,則在疲勞極限附近表現(xiàn)出非常長的壽命),從而使預測結果更加符合人們的物理認知。
算例1 是在4 個應力水平下對2524-T3 鋁合金的標準試樣進行疲勞試驗,每個應力水平進行約15次試驗,共計59個試驗數(shù)據(jù)[11],詳見表1。
表1 2524-T3鋁合金的疲勞壽命試驗數(shù)據(jù)Table 1 Fatigue life test data of 2524-T3 aluminum alloy
算例2 是在9 個應力水平下對2024-T4 鋁合金的標準試樣進行疲勞試驗,每個應力水平進行約30次試驗,共計252個試驗數(shù)據(jù)[26],詳見表2。
表2 2024-T4鋁合金的疲勞壽命試驗數(shù)據(jù)Table 2 Fatigue life test data of 2024-T4 aluminum alloy
算例3 是對S420MC 鋼板切割的扁平試樣進行疲勞試驗,試驗結束后,統(tǒng)計共有65 個試樣發(fā)生斷裂,剩余的15個試樣在200萬次載荷循環(huán)中未發(fā)生破壞[10]。僅使用斷裂試樣的試驗數(shù)據(jù)來估計S-N曲線及其疲勞壽命分布特性,試驗數(shù)據(jù)詳見表3。
在建立疲勞壽命預測模型前,需要對疲勞數(shù)據(jù)進行處理。首先,文中采用MaxAbsScaler 函數(shù)對3 個算例的數(shù)據(jù)集進行歸一化,訓練完成后再將數(shù)據(jù)進行反歸一化,得到實際值。MaxAbsScaler 是根據(jù)數(shù)據(jù)集中的最大絕對值來縮放和平移每個特征,不會移動數(shù)據(jù)的中心,因此不會影響數(shù)據(jù)的疏密性,其在文獻[27-29]中表現(xiàn)出了較好的性能。文中模型的輸入樣本集X為應力,對其進行歸一化,得到
式中,X'為歸一化后的值,|Xmax|為X的最大絕對值。
輸出樣本集Y為疲勞壽命。由于文中疲勞壽命的數(shù)量級在104~108之間,差距較大,因此在對疲勞壽命進行歸一化前先取對數(shù),即
式中,Y0為疲勞壽命取對數(shù)的值,|Y0,max|為Y0的最大絕對值,Y'0為歸一化后的值。
接著,對數(shù)據(jù)集進行劃分。通常情況下,選取數(shù)據(jù)集總量的80%作為訓練集,剩余的作為測試集[30-32]。
BNN模型由輸入層、隱含層和輸出層構成,隱含層的層數(shù)和層中神經(jīng)元的數(shù)量是可以調(diào)整的,每個隱含層的神經(jīng)元數(shù)量在5~100之間[33]。文中隱含層神經(jīng)元采用雙曲正切(tanh)激活函數(shù)。BNN-BBP和BNN-BB-α模型有著相同的參數(shù)設置:學習率為0.000 5;迭代次數(shù)(epoch)為10 萬;對于隱含層及神經(jīng)元數(shù),2524-T3 鋁合金的為5-5,2024-T4 鋁合金、S420MC 鋼的則為5-5-5。對于BB-α算法,α的取值在0~1之間,文中將α設置為0.5。
圖2 給出了BNN-BB-α模型對3 種材料的P-S-N估計曲線及概率密度曲面。從圖中可以看出不同應力水平下疲勞壽命的概率密度函數(shù)變化情況,也可以求出每個位置處對應的概率密度函數(shù)值。同時,為了說明基于BB-α的BNN 訓練過程的收斂性及采用其預測的可靠度,圖3給出了3個算例的損失函數(shù)(見式(15))收斂曲線。從圖中可以看出,采用該損失函數(shù)訓練的BNN 具有良好的收斂性。圖4 為BNN-BB-α模型對測試集的預測結果,黑色虛線間表示兩倍誤差帶??梢钥闯觯瑢τ?524-T3鋁合金、2024-T4鋁合金和S420MC鋼,其預測結果落入兩倍誤差帶的占比分別為100%、92%、92%,這表明
圖2 BNN-BB-α模型的疲勞壽命概率分布曲線Fig.2 Fatigue life probability distribution curves of BNN-BB-α model
圖3 BNN-BB-α模型的損失函數(shù)收斂曲線Fig.3 Loss function converging curves of BNN-BB-α model
圖4 BNN-BB-α模型對測試集的預測結果Fig.4 Prediction results of BNN-BB-α model for test set
BNN-BB-α模型在預測S-N曲線時具有較高的精度。
BNN-BB-α與BNN-BBP模型對3種材料的P-S-N估計性能比較如圖5所示。從圖中可以發(fā)現(xiàn):在網(wǎng)絡參數(shù)設定相同的情況下,采用BNN-BB-α模型得到的估計結果比采用BNN-BBP模型得到的估計結果要好,尤其是在對分散性較大的數(shù)據(jù)進行估計時,BNN-BB-α模型的優(yōu)勢更加明顯。對于算例2,從圖5(b)可知,當應力小于370 MPa時,使用BBP算法的預測效果較差。對于算例3,從圖5(c)可以看出,使用BNN-BBP 模型進行估計時,各個應力水平下壽命的分散性均被低估。另外,算例2 中,對2024-T4鋁合金在多個應力水平下開展了疲勞試驗,得到了各個應力水平下的疲勞試驗數(shù)據(jù),這些數(shù)據(jù)較為完整地描述了2024-T4 鋁合金的疲勞性能演化過程:隨著應力水平的降低,疲勞壽命逐漸變長,其分散性也逐漸變大。文中提出的方法依據(jù)試驗數(shù)據(jù),能較好地預測出這一變化趨勢。
圖5 BNN-BB-α與BNN-BBP模型對3種材料的P-S-N估計性能比較Fig.5 Comparison of P-S-N estimation performance between BNN-BB-α and BNN-BBP models for three materials
為進一步驗證所提方法的有效性,文中將BNN-BB-α與MLE 和PPgNN 模型對3 種材料的P-S-N估計性能進行了比較,結果如圖6、圖7 所示。從圖6 可以發(fā)現(xiàn),采用BNN-BB-α模型估計疲勞數(shù)據(jù)的P-S-N曲線具有更大的優(yōu)勢:MLE 模型可能會受局部統(tǒng)計參量的影響而給出非安全估計,較多的試驗數(shù)據(jù)落在了95%置信區(qū)間外;BNN-BB-α模型則能給出相對保守的估計結果,在疲勞試驗數(shù)據(jù)較少時仍可獲得較為保守的95%置信區(qū)間(見圖6(a))。
圖6 BNN-BB-α與MLE模型對3種材料的P-S-N估計性能比較Fig.6 Comparison of P-S-N estimation performance between BNN-BB-α and MLE models for three materials
圖7 BNN-BB-α與PPgNN模型對3種材料的P-S-N估計性能比較Fig.7 Comparison of P-S-N estimation performance between BNN-BB-α and PPgNN models for three materials
從圖7 可以發(fā)現(xiàn),相比于PPgNN 模型,BNNBB-α模型顯示了更好的包絡性。對于算例1,在應力水平為200 MPa 和400 MPa 時,BNN-BB-α模型的疲勞壽命不確定性要稍大于PPgNN模型。對于算例2,PPgNN 模型的疲勞壽命不確定性比BNN-BB-α模型稍低,其中252 個疲勞數(shù)據(jù)中,有12 個落于包絡線外。采用4 種方法對3 種材料的疲勞壽命進行預測時,3個算例的預測值落入95%置信區(qū)間的占比和訓練時間如表4 所示。從表中可以看出:采用BNN-BB-α模型得到的P-S-N曲線包絡性最佳,即絕大部分數(shù)據(jù)點都落入估計曲線內(nèi);BNN-BB-α 模型的用時比BNN-BBP 模型短,比MLE 和PPgNN 模型長,但在可接受的范圍內(nèi)。
表4 3個算例的預測值落入95%置信區(qū)間的占比和訓練時間Table 4 Proportions of predictive values falling into 95% confidence interval and training time of three examples
為了展現(xiàn)參數(shù)α對BNN-BB-α模型預測結果的影響,文中對不同α值的預測結果進行了對比,不同α值下BNN-BB-α模型預測的95%置信區(qū)間如圖8 所示,不同α值和不同應力下BNN-BB-α模型的預測均值和標準差如圖9 所示。從圖中可以發(fā)現(xiàn),α值對預測均值的影響較小,但對預測標準差的影響明顯??傮w來看,當α值增大時,各個應力水平下的預測標準差增大,即估計不確定性增加。過小的標準差,意味著預測太過激進;過大的標準差,意味著預測結果太過保守??偟膩碚f,當α取0.5 時估計效果最好,此時BNN-BB-α模型的95%置信區(qū)間能夠恰好包絡足夠多的疲勞數(shù)據(jù)。
圖8 α取不同值時BNN-BB-α模型的95%置信區(qū)間估計Fig.8 Estimation of 95% confidence interval of BNN-BB-α with different values of α
圖9 不同α值和不同應力下BNN-BB-α模型的預測結果Fig.9 Prediction results of BNN-BB-α model at different values of α and different stress levels
材料的疲勞-壽命曲線具有較大的分散性,獲取材料的P-S-N曲線具有重要的意義。文中提出了一種基于BNN 模型的金屬材料疲勞試驗數(shù)據(jù)分析方法。該方法將傳統(tǒng)神經(jīng)網(wǎng)絡模型的權重參數(shù)視為隨機變量,采用貝葉斯參數(shù)估計方法對其后驗分布規(guī)律進行求解。考慮到已有基于KL 散度的變分推理方法容易低估權重參數(shù)的不確定性,文中引入了基于α散度的BB-α算法,并通過3 個算例對基于BNN模型的P-S-N曲線擬合方法的性能進行了驗證,得到以下結論:
(1)BNN-BB-α模型的估計效果優(yōu)于BNN-BBP模型,尤其是對分散性較大的數(shù)據(jù)集進行估計時,優(yōu)勢更為明顯。BNN-BBP 模型容易低估數(shù)據(jù)的分散性,而BNN-BB-α模型則能給出較為保守的估計結果。采用α散度度量代替KL 散度度量后,對疲勞數(shù)據(jù)的估計效果得到提升。當α=0.5 時,BNNBB-α模型的估計效果最佳。
(2)相比于MLE 和PPgNN 模型,BNN-BB-α模型的包絡性更好,疲勞數(shù)據(jù)能夠更多地落于95%置信區(qū)間內(nèi);BNN-BB-α可以獲得更加保守、準確的P-S-N曲線估計結果,這在工程實際中具有重要的意義。
(3)BNN-BB-α模型的計算速度比MLE 和PPgNN 模型慢,所需要時間相差100 s 左右,這在實際工程中是完全可以接受的。