趙 隆 韓小稚 王景人 寇 威
(陜西省特種設(shè)備檢驗檢測研究院 西安 710048)
目前,12Cr1MoV 鋼被大量廣泛地用于國內(nèi)電站鍋爐蒸汽管道、受熱面等主要部件。隨著12Cr1MoV鋼長期在高溫高壓惡劣環(huán)境下使用,顯微組織會逐漸出現(xiàn)球化現(xiàn)象,使材料的強度、硬度等主要抗疲勞力學(xué)性能指標下降,最終會導(dǎo)致脹管、爆管等威脅鍋爐運行安全的危險事故。因此,對12Cr1MoV 鋼顯微組織球化現(xiàn)象的研究分析,是評判部件材料老化和使用期限的重要依據(jù)。傳統(tǒng)的金相分析方法,主要依靠經(jīng)驗豐富的檢驗人員進行試樣選取、試樣制備、顯微鏡下觀察組織特征,并與標準圖譜進行對比分析評定。這種方法的優(yōu)勢在于檢驗人員可以根據(jù)自己的經(jīng)驗和知識進行細致的觀察和分析。但是,傳統(tǒng)方法也存在主觀性誤差大、費時費力、效率低等劣勢。因此,國內(nèi)外的研究機構(gòu)和學(xué)者也紛紛利用人工智能技術(shù),對金相組織智能分析進行研究。
國外Gola 等人[1]將支持向量機與基于像素和形態(tài)的參數(shù)相結(jié)合,對3 種不同鋼材的微觀組織進行分類識別,準確率達97%。國內(nèi)張紅旗[2]先用小波分析方法對12Cr1MoV 金相組織圖像進行預(yù)處理,再用改進的自適應(yīng)遺傳算法與FCM(模糊C 均值)算法相結(jié)合完成金相圖像的分割,并通過計算珠光體區(qū)域面積百分數(shù)、平均形狀因子、平均離心率3 個特征參數(shù)作為評級參數(shù)實現(xiàn)珠光體球化評級。曹卓等人[3]采用卷積神經(jīng)網(wǎng)絡(luò)對材料特征矩陣的梯度進行分析,發(fā)現(xiàn)了梯度與材料性能間有一定關(guān)系,進一步驗證了卷積神經(jīng)網(wǎng)絡(luò)具有較好的材料性能預(yù)測能力。張佳寧[4]采用改進的U-Net 卷積神經(jīng)網(wǎng)絡(luò)對金相圖像中的晶粒度進行像素級分割,基于八鄰域跟蹤和擴散生長方法實現(xiàn)了晶界缺失區(qū)域的補全,最后基于Client-Server(客戶端-服務(wù)器)架構(gòu)開發(fā)了一套晶粒度自動評級系統(tǒng)。
然而,很多研究機構(gòu)和學(xué)者主要針對鋼材金相組織晶粒度的定量分析方向研究較多,但是對火力發(fā)電廠12Cr1MoV 鋼金相組織球化級別分析方面研究甚少,也缺乏相關(guān)的分析軟件。因此,本文針對上述難點問題,開展火電廠12Cr1MoV 鋼金相組織球化級別智能分析研究,采用4 種不同的卷積神經(jīng)網(wǎng)絡(luò)模型對金相組織圖像進行分類識別,并設(shè)計專用的分析軟件。
將收集的685 張12Cr1MoV 鋼金相組織圖像整理成數(shù)據(jù)集,與DL/T 773—2016《火電廠用12Cr1MoV鋼球化評級標準》[5]的圖譜進行對比分類,見表1。
表1 12Cr1MoV 鋼金相組織圖像類別
因檢驗現(xiàn)場打磨和顯微組織觀察拍照等原因,金相圖像的清晰度存在差異。首先用MATLAB 軟件對數(shù)據(jù)集進行預(yù)處理,即RGB 圖—灰度圖—去噪(采用中值濾波)—尺寸歸一化—數(shù)據(jù)增強(擴充數(shù)據(jù)集),從而獲得1 370 張高質(zhì)量的金相圖像[6]。原始圖像預(yù)處理結(jié)果如圖1 所示。將1 370 張高質(zhì)量的數(shù)據(jù)集劃分,80%數(shù)據(jù)分為訓(xùn)練集,20%數(shù)據(jù)分為測試集。
圖1 RGB 圖預(yù)處理后的圖像
卷積神經(jīng)網(wǎng)絡(luò)[7]是一種多層的監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),隱含層的卷積層和池采樣層是實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)特征提取功能的核心模塊。該網(wǎng)絡(luò)模型通過采用梯度下降法最小化損失函數(shù)對網(wǎng)絡(luò)中的權(quán)重參數(shù)逐層反向調(diào)節(jié),通過頻繁的迭代訓(xùn)練提高網(wǎng)絡(luò)的精度。因此,本實驗選擇以下4 種卷積神經(jīng)網(wǎng)絡(luò)模型對金相組織圖像進行遷移學(xué)習(xí)訓(xùn)練:
1)VGG16[8]是由牛津大學(xué)的Visual Geometry Group 開發(fā)的深度卷積神經(jīng)網(wǎng)絡(luò)模型。它由16 層卷積層和全連接層組成,使用了小尺寸的3×3 卷積核和池化層,具有非常深的網(wǎng)絡(luò)結(jié)構(gòu)。VGG16 模型在圖像分類任務(wù)中表現(xiàn)出色,其特點是簡單而直觀,具有高度可擴展性。
2)GoogleNet[9]是由Google 團隊開發(fā)的深度卷積神經(jīng)網(wǎng)絡(luò)模型。它采用了Inception 模塊,使用多個不同大小的卷積核進行特征提取,并通過1×1 卷積層降低計算量。GoogleNet 模型具有較低的參數(shù)量,能夠在相對較少的參數(shù)下實現(xiàn)較高的準確度。
3)ResNet18[10]是由微軟研究院提出的深度殘差網(wǎng)絡(luò)模型。它通過引入殘差連接(Residual Connection)來解決深度神經(jīng)網(wǎng)絡(luò)中的梯度消失和梯度爆炸問題。ResNet18 模型具有18 層,包括卷積層、批量歸一化層和全連接層。該模型在訓(xùn)練過程中能夠更好地傳遞梯度,使更深的網(wǎng)絡(luò)結(jié)構(gòu)能夠更容易地訓(xùn)練和優(yōu)化。
4)Inception-v3[11]是Google 團隊在Inception 系列中的第三個版本。它采用了更復(fù)雜的Inception 模塊,包括多個并行的卷積和池化操作,以及通過1×1 卷積層進行降維和擴展。Inception-v3 模型在圖像分類和目標檢測等任務(wù)中表現(xiàn)出色,具有較高的準確度和較低的計算復(fù)雜度。
1)采用小批量梯度下降法:每一次迭代中,使用一小部分的隨機樣本來計算梯度。梯度下降的目的就是求函數(shù)的極小值點。
2)L2正則化:通過向損失函數(shù)添加權(quán)重的L2范數(shù)懲罰項,可以控制模型的復(fù)雜度,減少過擬合的風(fēng)險,提高模型的泛化能力。還可以防止模型中的權(quán)重過大,從而減少梯度爆炸問題。L2正則化公式見式(1):
式中:
λ——正則化系數(shù);
W——模型的權(quán)重參數(shù)。
L2范數(shù)也稱為歐幾里得范數(shù),表示為,計算方式是將每個權(quán)重的平方相加再開平方。
3)動量法:因梯度下降法在收斂過程會產(chǎn)生震蕩,動量不僅能解決收斂震動問題,還能加速優(yōu)化收斂。具體在梯度下降法基礎(chǔ)上引入一階動量,見式(2):
式中:
mt——當(dāng)前一階動量;
mt-1——上一步的一階動量;
gt——當(dāng)前梯度;
β1——超參數(shù),經(jīng)驗值為0.9。β1越大,說明當(dāng)前動量主要由以前累計的方向決定。β1越小,說明當(dāng)前動量更多由前梯度決定。
本實驗采用MATLAB 作為深度學(xué)習(xí)開發(fā)框架,使用速石科技(fastone)超算平臺的RTX 4090GPU 對訓(xùn)練過程進行加速處理。分別采用VGG16、GoogleNet、ResNet18、Inception-v3 模型進行訓(xùn)練。
隨著訓(xùn)練次數(shù)及迭代次數(shù)增多,模型收斂速度加快,損失函數(shù)逐漸降低,準確率逐漸增高,VGG16模型可達到約90%,GoogleNet 模型可達到約84%,ResNet18 模型可達到約79%,Inception-v3 模型可達到約93%。因此,Inception-v3 模型為最優(yōu)模型,見圖2。
圖2 采用Inception-v3 模型訓(xùn)練圖
泛化能力反映的是模型對未知數(shù)據(jù)的判斷能力。為了驗證模型的泛化能力的強弱,用測試集數(shù)據(jù)在訓(xùn)練后的Inception-v3 模型上進行準確率測試,并與訓(xùn)練集的訓(xùn)練數(shù)據(jù)做對比,見表2。
表2 Inception-v3 識別準確率比較
從表2 可以看出,訓(xùn)練后Inception-v3 模型在測試集數(shù)據(jù)上識別準確率達到89%,證明了模型的泛化能力較強,可以在實際金相分析中應(yīng)用。
金相圖像通過卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),卷積層負責(zé)提取特征,池化層負責(zé)減少特征圖的尺寸和保留重要特征,全連接層負責(zé)將特征進行線性組合,最終得到分類輸出。這些層的組合和堆疊構(gòu)成了深度神經(jīng)網(wǎng)絡(luò),能夠?qū)W習(xí)復(fù)雜的特征表示并解決各種分類任務(wù)。
為了理解Inception-v3 模型如何識別金相組織圖像,本實驗使用Grad-CAM 算法,挑選4 張金相圖像對Inception-v3 模型進行可解釋性分析,并以熱力圖的形式展現(xiàn)該模型在分類圖像時關(guān)注的區(qū)域,如圖3 所示。
圖3 金相圖像的Grad-CAM 熱力圖
對Inception-v3 模型及其權(quán)重參數(shù)進行封裝,用MATLAB 開發(fā)設(shè)計一套評定12Cr1MoV 鋼金相組織球化級別的專用軟件。
打開軟件,點擊“開始識別”,選擇1 張金相圖像,可自動分析金相類型、球化程度、球化級別、檢測精度、檢測時間等信息,見圖4。點擊“清空界面”,各個窗口數(shù)據(jù)清零。點擊“退出系統(tǒng)”,軟件自動關(guān)閉退出。該軟件可以自動、準確和高效地評定12Cr1MoV 鋼球化級別,為火電廠鍋爐材料檢驗提供了更可靠的金相分析工具。
圖4 軟件主界面
本實驗利用卷積神經(jīng)網(wǎng)絡(luò)模型進行金相組織分析研究,開發(fā)了12Cr1MoV 鋼金相組織球化級別智能評定的專用軟件,可實現(xiàn)自動、準確和高效的金相分析,推動了特種設(shè)備金屬材料檢驗智能化的發(fā)展。