呂天樂(lè),齊苗苗,閆德俊,黎書(shū)華,夏裕俊,李永兵
(1.上海交通大學(xué),上海市復(fù)雜薄板結(jié)構(gòu)數(shù)字化制造重點(diǎn)實(shí)驗(yàn)室,上海,200240;2.上海交通大學(xué),機(jī)械系統(tǒng)與振動(dòng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海,200240;3.上海航天設(shè)備制造總廠有限公司,上海,200245;4.中船黃埔文沖船舶有限公司,廣東省艦船先進(jìn)焊接技術(shù)企業(yè)重點(diǎn)實(shí)驗(yàn)室,廣州,510715)
由于成本低、效率高、易自動(dòng)化,電阻點(diǎn)焊技術(shù)成為薄壁結(jié)構(gòu)制造的主要連接工藝.以汽車(chē)制造為例,一輛鋼制轎車(chē)車(chē)身通常有3 000~ 7 000 個(gè)焊點(diǎn),占其焊接總量的80%以上[1],因此,焊點(diǎn)質(zhì)量直接決定著車(chē)身的使用壽命和安全性.出于車(chē)身減重和節(jié)能減排的需要,輕質(zhì)高強(qiáng)材料已得到廣泛應(yīng)用.但是,高強(qiáng)材料沖壓后大回彈帶來(lái)的裝配偏差,會(huì)導(dǎo)致板間間隙、電極工件不垂直、邊緣焊等異常工況波動(dòng),改變焊點(diǎn)接觸狀態(tài)并引發(fā)虛焊、飛濺等一系列焊接質(zhì)量問(wèn)題,影響焊點(diǎn)質(zhì)量一致性[2].為此,亟需實(shí)現(xiàn)焊點(diǎn)質(zhì)量在線檢測(cè)與實(shí)時(shí)控制,保障產(chǎn)品可靠性.
目前,國(guó)內(nèi)外學(xué)者已基于焊接過(guò)程多傳感信號(hào)的點(diǎn)焊質(zhì)量在線檢測(cè)技術(shù)方面開(kāi)展了大量研究.其中,動(dòng)態(tài)電阻、電極位移和電極力是最常用的表征熔核生長(zhǎng)過(guò)程的傳感信號(hào)[3-4].Dickinson 等人[5]發(fā)現(xiàn)動(dòng)態(tài)電阻信號(hào)可以有效反映點(diǎn)焊熔核在焊接各階段的形成和生長(zhǎng)過(guò)程;Chang 等人[6]則證明焊接工件受熱膨脹導(dǎo)致的電極位移信號(hào)與熔核生長(zhǎng)具有更強(qiáng)關(guān)聯(lián)性,但由于位移量級(jí)較小,測(cè)量存在一定難度;電極力也受工件膨脹影響,且測(cè)量方便、不易干涉焊接過(guò)程,Zhang 等人[7]認(rèn)為電極力可以替代位移信號(hào).
機(jī)器學(xué)習(xí)模型被用于建立過(guò)程信號(hào)與關(guān)鍵質(zhì)量指標(biāo)的關(guān)聯(lián)關(guān)系.Chen 等人[8]使用主成分分析對(duì)過(guò)程信號(hào)特征進(jìn)行降維,發(fā)現(xiàn)板材種類(lèi)顯著影響特征分布,因此使用k 均值聚類(lèi)對(duì)數(shù)據(jù)集進(jìn)行預(yù)分類(lèi),再訓(xùn)練反向傳播(BP)神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)精度提高.Gavidel 等人[9]對(duì)比了人工神經(jīng)網(wǎng)絡(luò)、回歸樹(shù)、k 近鄰、深度神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、支持向量機(jī)等常用模型在點(diǎn)焊數(shù)據(jù)集上的性能,發(fā)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度和穩(wěn)健性最高.Zhao 等人[10]使用不同的數(shù)據(jù)降維方法提取動(dòng)態(tài)電阻信號(hào)特征,預(yù)測(cè)模型得到比人工特征更好的性能.El-Sari 等人[11]發(fā)現(xiàn)僅基于工藝參數(shù)訓(xùn)練的多層感知機(jī)回歸模型對(duì)不同板材數(shù)據(jù)集的泛化性很差,而引入電阻信號(hào)訓(xùn)練的模型,其外推能力明顯改善.Zhou 等人[12]研究了數(shù)據(jù)量和信號(hào)特征種類(lèi)對(duì)回歸模型性能的影響,認(rèn)為超過(guò)250 組數(shù)據(jù)、電信號(hào)特征輸入即可獲得較好預(yù)測(cè)效果.基于過(guò)程信號(hào)的機(jī)器學(xué)習(xí)模型可以較為準(zhǔn)確地預(yù)測(cè)焊點(diǎn)質(zhì)量,但現(xiàn)有研究主要面向待焊工件處于理想匹配狀態(tài)的情況,對(duì)異常工況波動(dòng)的研究較少,其分析結(jié)果可能不具有較好的代表性.
文中圍繞工況波動(dòng)問(wèn)題,通過(guò)試驗(yàn)獲得包含四種焊接工況下焊點(diǎn)質(zhì)量與動(dòng)態(tài)電阻、電極力、位移信號(hào)的數(shù)據(jù)集,分析了焊點(diǎn)質(zhì)量在波動(dòng)工況下的分布差異并提取過(guò)程信號(hào)特征,對(duì)比了多元線性回歸、高斯過(guò)程回歸、支持向量回歸、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)模型在波動(dòng)工況數(shù)據(jù)集上的預(yù)測(cè)性能,并研究了輸入特征量、信號(hào)和工況波動(dòng)對(duì)模型性能的影響.
試驗(yàn)使用的電阻點(diǎn)焊設(shè)備平臺(tái)由FANUC R2000iB 電阻點(diǎn)焊機(jī)器人、OBARA C 型焊槍和中頻直流(MFDC)控制器組成.電極選用端面直徑為6 mm 的CuZr 電極,冷卻水流量為11.3 L/min.
焊接監(jiān)測(cè)平臺(tái)使用固定在靜電極桿上的羅氏線圈(精度為0.5 %)測(cè)量次級(jí)電流,使用上下電極上安裝的屏蔽雙絞線測(cè)量電壓,利用歐姆定律計(jì)算得到動(dòng)態(tài)電阻信號(hào).通過(guò)安裝在靜電極臂上的表面應(yīng)變片傳感器(精度為2 %)測(cè)量電極力,并根據(jù)力計(jì)算靜電極位移;動(dòng)電極位移由安裝在動(dòng)電極導(dǎo)軌頂端的旋轉(zhuǎn)編碼器(分辨率為0.5 μm)測(cè)量,兩者之和為總電極位移.具體測(cè)量方法和信號(hào)計(jì)算公式見(jiàn)文獻(xiàn)[13].
待焊工件選用汽車(chē)行業(yè)常用的兩種鋼材:雙相高強(qiáng)鋼DP590 和冷軋鋼BUFD,表面無(wú)涂層,板厚為0.8 mm 和1.6 mm.兩種材料的化學(xué)成分和力學(xué)性能見(jiàn)表1 和表2.
表1 DP590 和BUFD 的化學(xué)成分(質(zhì)量分?jǐn)?shù), %)Table 1 The chemical components of DP590 and BUFD
表2 DP590 和BUFD 的力學(xué)性能Table 2 The mechanical properties of DP590 and BUFD
為研究波動(dòng)工況對(duì)焊點(diǎn)質(zhì)量及焊接過(guò)程的影響,試驗(yàn)中設(shè)計(jì)了四種不同的電極與工件匹配狀態(tài),用以模擬實(shí)際生產(chǎn)中零件裝配偏差導(dǎo)致的焊接工況波動(dòng),即:標(biāo)準(zhǔn)工況、傾斜工況、邊距工況和間隙工況.相關(guān)試樣尺寸和試驗(yàn)設(shè)置方法如圖1 所示.
圖1 標(biāo)準(zhǔn)、傾斜、邊距和間隙工況的試樣尺寸及設(shè)置方法示意圖(mm)Fig. 1 Schematics of the specimens and setup methods of standard, electrode angle, edge proximity and initial gap conditions (mm). (a) standard condition; (b) electrode angle condition; (c) edge proximity condition; (d) initial gap condition
將待焊工件按照等強(qiáng)等厚、等強(qiáng)差厚、等厚差強(qiáng)和差強(qiáng)差厚四種方式搭配成不同的板材組合,選用單脈沖恒流焊接規(guī)范,采用不同的焊接電流、電極力和焊接時(shí)間進(jìn)行焊接試驗(yàn).焊接方案設(shè)計(jì)見(jiàn)表3.焊接后,使用剝離熔核直徑作為焊點(diǎn)質(zhì)量的評(píng)價(jià)指標(biāo),測(cè)量每組試驗(yàn)中剝離熔核的最大和最小直徑,取平均值作為最終的熔核直徑[14].
表3 焊接方案設(shè)計(jì)Table 3 Welding schedule design.
文中總計(jì)進(jìn)行了300 組試驗(yàn),各板材組合均有75 組.各組試驗(yàn)均記錄了焊接工藝參數(shù)以及焊接過(guò)程中的動(dòng)態(tài)電阻、電極力、位移信號(hào).試驗(yàn)測(cè)得的剝離熔核直徑的數(shù)據(jù)分布如圖2 和圖3 所示,總體數(shù)據(jù)分布具有典型的正態(tài)分布趨勢(shì),減少了板材匹配變化對(duì)數(shù)據(jù)分布的影響,平均熔核直徑為4.44 mm;工況波動(dòng)對(duì)熔核直徑分布有一定影響,相比于標(biāo)準(zhǔn)工況結(jié)果,傾斜和邊距工況下熔核直徑較小,邊距和間隙工況下熔核直徑分布較集中.
圖2 不同板材組合的熔核直徑Fig. 2 Nugget diameter of different stack-ups
圖3 不同工況的熔核直徑Fig. 3 Nugget diameter of different conditions
文中基于焊接試驗(yàn)工藝參數(shù)和焊接過(guò)程信號(hào)特征,建立了熔核直徑的回歸預(yù)測(cè)模型.回歸預(yù)測(cè)建模流程圖如圖4 所示.首先,提取過(guò)程信號(hào)特征并進(jìn)行0-1 標(biāo)準(zhǔn)化處理,將其作為輸入特征代入四類(lèi)機(jī)器學(xué)習(xí)模型;隨后,以模型的輸出變量為熔核直徑預(yù)測(cè)值,與實(shí)測(cè)熔核直徑進(jìn)行比較,從而對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行參數(shù)優(yōu)化;最后基于熔核直徑的預(yù)測(cè)性能挑選性能最優(yōu)的機(jī)器學(xué)習(xí)模型.
圖4 回歸預(yù)測(cè)建模流程圖Fig. 4 Flowchart of regression prediction modeling
輸入特征共有26 個(gè),其中,焊接工藝參數(shù)共5 個(gè),分別記為總板厚Thk_t、主導(dǎo)板厚Thk_g、設(shè)置電極力SetF、焊接電流SetI和焊接時(shí)間SetT,實(shí)際生產(chǎn)中無(wú)法獲得焊接工況類(lèi)型,因此不將預(yù)設(shè)工況作為特征值.過(guò)程信號(hào)的特征共21 個(gè),其提取方法如圖5 所示.其中,電阻特征共9 個(gè),分別為熱輸入能量E、均值電阻Rav、谷值電阻Rmin、谷值電阻時(shí)刻trmin、峰值電阻Rmax、峰值電阻時(shí)刻trmax、終值電阻Rend、終值電阻時(shí)刻trend和電阻下降量Rdrop;力特征共6 個(gè),分別為均值力Fav、峰值力Fmax、峰值力時(shí)刻tfmax、終值力Fend、終值力時(shí)刻tfend和力下降量Fdrop;位移特征共6 個(gè),分別為位移平均值Sav、峰值位移Smax、峰值位移時(shí)刻tsmax、位移終值Send、位移終值時(shí)刻tsend和位移下降量Sdrop[15].
圖5 過(guò)程信號(hào)特征提取示意圖Fig. 5 Schematics of feature extraction methods of dynamic resistance, electrode force and electrode displacement signals. (a) dynamic resistance features; (b)electrode force features;(c) electrode displacement features
機(jī)器學(xué)習(xí)模型選用多元線性回歸、高斯過(guò)程回歸、支持向量回歸和神經(jīng)網(wǎng)絡(luò)回歸模型,以焊接工藝參數(shù)和過(guò)程特征作為輸入的預(yù)測(cè)特征量,以熔核直徑為預(yù)測(cè)目標(biāo),并在訓(xùn)練中對(duì)各模型的主要超參數(shù)進(jìn)行優(yōu)化,同時(shí)采用5 折交叉驗(yàn)證方法減少預(yù)測(cè)模型過(guò)擬合傾向.預(yù)測(cè)模型的性能評(píng)價(jià)指標(biāo)有2 個(gè),均為5 折交叉驗(yàn)證中測(cè)試集的測(cè)試結(jié)果.其中,第一個(gè)指標(biāo)為預(yù)測(cè)值與實(shí)測(cè)值的均方根誤差(RMSE),計(jì)算公式為
式中,N為訓(xùn)練集樣本總數(shù)量;Xpred為預(yù)測(cè)熔核直徑;Xexp為實(shí)測(cè)熔核直徑.
第二個(gè)指標(biāo)是直徑預(yù)測(cè)誤差小于 ± 1 mm 的數(shù)據(jù)數(shù)量相對(duì)于總預(yù)測(cè)值數(shù)量的比例(記為A±1mm),計(jì)算公式為
文中對(duì)比了四種多元線性回歸模型(記為MLR)的預(yù)測(cè)性能,包括標(biāo)準(zhǔn)MLR、含交互項(xiàng)MLR、穩(wěn)健性MRL 和逐步MLR,并對(duì)輸入特征量、擬合方法和輸入項(xiàng)數(shù)量的優(yōu)化,結(jié)果見(jiàn)表4.含交互項(xiàng)MLR模型的性能最差,A±1mm僅有11.75%,其它三種模型性能較好,預(yù)測(cè)精度均超過(guò)85%.其中,逐步MLR模型的性能最好,A±1mm接近90%,均方根誤差僅有0.665 mm,其次為標(biāo)準(zhǔn)MLR 和穩(wěn)健性MLR.
表4 線性回歸模型的預(yù)測(cè)性能對(duì)比Table 4 Performance comparison of multiple linear regression models.
文中對(duì)比了使用不同核函數(shù)的高斯過(guò)程回歸模型(記為GPR)的預(yù)測(cè)性能,包括二次有理函數(shù)、指數(shù)函數(shù)、平方指數(shù)函數(shù),并使用貝葉斯優(yōu)化器對(duì)所有超參數(shù)進(jìn)行探索尋優(yōu),結(jié)果見(jiàn)表5.四種GPR模型均獲得了較好的預(yù)測(cè)性能,A±1mm均超過(guò)90%.其中,指數(shù)核函數(shù)獲得了最佳性能,A±1mm達(dá)到91.12%,其它超參數(shù)優(yōu)化后的可優(yōu)化GPR 的預(yù)測(cè)性能也未出現(xiàn)明顯提升.
表5 高斯過(guò)程回歸模型的預(yù)測(cè)性能對(duì)比Table 5 Performance comparison of Gaussian process regression models.
文中對(duì)比了具有不同尺度的線性核函數(shù)、多項(xiàng)式核函數(shù)以及高斯核函數(shù)的支持向量回歸模型(記為SVR)的預(yù)測(cè)性能,并使用貝葉斯優(yōu)化器對(duì)超參數(shù)進(jìn)行優(yōu)化,各模型的性能見(jiàn)表6,其中多項(xiàng)式核的階數(shù)分別為2 和3,高斯核中設(shè)置了三種水平的核尺度,混合核為線性核、多項(xiàng)式核以及高斯核的線性組合,優(yōu)化后各項(xiàng)核的權(quán)重依此為0.90、0.05、0.05.SVR 模型具有較好的預(yù)測(cè)性能,A±1mm普遍獲超過(guò)80%.其中,中等高斯SVR 模型獲得最高精度和最低均方根誤差,因此最優(yōu).對(duì)SVR 進(jìn)行超參數(shù)優(yōu)化以及混合核函數(shù)各項(xiàng)的權(quán)重優(yōu)化未能進(jìn)一步提升預(yù)測(cè)性能.
表6 支持向量回歸模型的預(yù)測(cè)性能對(duì)比Table 6 Performance comparison of support vector regression models.
文中對(duì)比了具有不同網(wǎng)絡(luò)結(jié)構(gòu)的全連接神經(jīng)網(wǎng)絡(luò)模型(記為MLP)的預(yù)測(cè)性能,網(wǎng)絡(luò)均使用ReLU 激活函數(shù),其結(jié)果見(jiàn)表7.可以看出,增加網(wǎng)絡(luò)層數(shù)和每層節(jié)點(diǎn)數(shù)可以提升A±1mm和降低RMSE,但效果有限.所有神經(jīng)網(wǎng)絡(luò)模型的精度均在80%左右,三層神經(jīng)網(wǎng)絡(luò)的精度可以超過(guò)85%,每層500 個(gè)節(jié)點(diǎn)數(shù)的三層神經(jīng)網(wǎng)絡(luò)獲得了最高的預(yù)測(cè)精度,A±1mm達(dá)到88.25%,但當(dāng)節(jié)點(diǎn)數(shù)繼續(xù)增加,A±1mm開(kāi)始下降,僅通過(guò)增加節(jié)點(diǎn)無(wú)法繼續(xù)提升精度.使用殘差網(wǎng)絡(luò)結(jié)構(gòu)(ResNet)降低層數(shù)增加產(chǎn)生的退化問(wèn)題,為保證足夠的網(wǎng)絡(luò)復(fù)雜度,在MLP 中疊加50 個(gè)殘差結(jié)構(gòu)(記為ResNet-MLP),總層數(shù)為254,但在相同節(jié)點(diǎn)數(shù)下,預(yù)測(cè)精度均明顯低于MLP,不能滿足預(yù)測(cè)需求.
表7 神經(jīng)網(wǎng)絡(luò)回歸模型的預(yù)測(cè)性能對(duì)比Table 7 Performance comparison of multilayer perceptron regression models.
在四種機(jī)器學(xué)習(xí)回歸模型中,高斯過(guò)程回歸模型獲得的性能最好,A±1mm超過(guò)90%,其次是多元線性回歸和支持向量回歸模型,神經(jīng)網(wǎng)絡(luò)回歸模型性能最差.其中,逐步線性回歸、可優(yōu)化高斯過(guò)程回歸、中等高斯支持向量回歸和三層500 節(jié)點(diǎn)神經(jīng)網(wǎng)絡(luò)分別是各模型中性能最好的模型.
為了更準(zhǔn)確地評(píng)價(jià)這四種模型的性能,對(duì)其進(jìn)行了10 次重復(fù)測(cè)試,對(duì)比平均性能及性能波動(dòng)情況,其結(jié)果見(jiàn)表8.結(jié)果進(jìn)一步證明了GPR 模型具有最佳和最穩(wěn)定的預(yù)測(cè)性能,A±1mm和RMSE 均有較好的可重復(fù)性,前者波動(dòng)小于0.5%,后者小于5%;SVR 模型具有次高精度,性能波動(dòng)略大;而MLR 和MLP 模型的精度和波動(dòng)均較差.
表8 優(yōu)化后回歸模型的預(yù)測(cè)性能及穩(wěn)定性Table 8 Prediction performance and stability of optimized regression models.
各已優(yōu)化模型的預(yù)測(cè)—實(shí)測(cè)值的結(jié)果如圖6所示.MLR 和MLP 模型的預(yù)測(cè)結(jié)果分布范圍較大,雖然大部分在誤差許可范圍內(nèi),但存在部分預(yù)測(cè)點(diǎn)位于距允許范圍較遠(yuǎn)處,導(dǎo)致其精度及均方根誤差波動(dòng)較大;而GPR 和SVR 模型的預(yù)測(cè)結(jié)果分布較為密集,大部分預(yù)測(cè)數(shù)據(jù)點(diǎn)集中在準(zhǔn)確預(yù)測(cè)線附近,超出允許范圍的點(diǎn)也很接近誤差允許界線,因此在保證較高的預(yù)測(cè)精度的同時(shí),其性能穩(wěn)定性也較好.因此,下一節(jié)將針對(duì)性能最佳的GPR 模型開(kāi)展進(jìn)一步研究.
圖6 不同機(jī)器學(xué)習(xí)回歸模型的預(yù)測(cè)—實(shí)測(cè)值Fig. 6 Prediction-response results of different machine learning regression models. (a) multiple linear regression;(b) Gaussian process regression; (c) support vector regression; (d) multilayer perceptron regression
為定量解釋所選輸入特征量的重要程度以及對(duì)異常工況波動(dòng)的適應(yīng)性,分別針對(duì)僅含標(biāo)準(zhǔn)工況的試驗(yàn)數(shù)據(jù)集(記為ST)和含異常工況的完整數(shù)據(jù)集(記為ALL)訓(xùn)練GPR 模型,并使用Shapley加和解釋(SHAP)方法對(duì)26 個(gè)輸入特征量進(jìn)行分析,以衡量其對(duì)熔核直徑預(yù)測(cè)值的貢獻(xiàn).對(duì)GPR 模型預(yù)測(cè)值貢獻(xiàn)較大的前20 個(gè)特征量的Shapley 值分布如圖7 所示.
圖7 輸入特征值對(duì)GPR 模型的Shapley 值分布Fig. 7 Shapley value distribution of input features on GPR models. (a) model trained on ST dataset;(b) model trained on ALL dataset
對(duì)于標(biāo)準(zhǔn)工況數(shù)據(jù)集(ST),最重要的5 個(gè)特征量依次為焊接電流SetI、熱輸入能量E、峰值位移Smax、電阻下降量Rdrop和位移終值Send.這是因?yàn)楹附与娏髟龃髸?huì)增加焊接輸入的總能量,進(jìn)而獲得更大的熔核直徑,存在明顯的正向作用.電極位移主要來(lái)自板材受熱膨脹,其峰值與最大熔核尺寸正相關(guān)[16],因此Smax對(duì)預(yù)測(cè)值具較大正貢獻(xiàn);位移在峰值后的下降與熔核在焊接后期的收縮相關(guān),因此Send對(duì)熔核尺寸預(yù)測(cè)的貢獻(xiàn)為正.電阻在峰值后的下降主要是板材溫度升高引起兩電極間導(dǎo)電面積增加,而后者往往伴隨著熔核直徑的增加,所以Rdrop對(duì)熔核尺寸預(yù)測(cè)的貢獻(xiàn)為正[17].
對(duì)于全部工況數(shù)據(jù)集(ALL),模型預(yù)測(cè)的前三個(gè)重要特征量仍為SetI、E和Smax,說(shuō)明它們?cè)诋惓9r下仍對(duì)熔核直徑的預(yù)測(cè)具有顯著貢獻(xiàn).其它兩個(gè)重要特征量是位移平均值Sav和峰值電阻時(shí)刻trmax.在間隙、傾斜等工況下,電極/板材初期接觸變化會(huì)顯著改變焊接生熱與散熱過(guò)程,導(dǎo)致熱輸入減小[18-19],熔核尺寸和位移信號(hào)均減??;在邊距工況下,邊緣約束的缺失極易引起焊接飛濺,導(dǎo)致熔核尺寸和位移信號(hào)減小[20],因此,Sav在異常工況下存在更大的預(yù)測(cè)正向貢獻(xiàn).采用類(lèi)似分析可知,trmax代表了的焊接前期電阻信號(hào)隨溫度增長(zhǎng)的速率,間接表征了焊接加熱速率,對(duì)熔核尺寸預(yù)測(cè)的貢獻(xiàn)為負(fù).
根據(jù)Shapley 值分析結(jié)果,SetI、E和Smax對(duì)于對(duì)工況波動(dòng)具有較好適應(yīng)性,而Sav和trmax則對(duì)異常工況數(shù)據(jù)具有一定特異性,這對(duì)特征篩選和模型可解釋性提升有幫助.此外,標(biāo)準(zhǔn)數(shù)據(jù)集下貢獻(xiàn)最大的前10 個(gè)輸入特征和完整數(shù)據(jù)集下貢獻(xiàn)最大的前8 個(gè)特征均來(lái)自工藝參數(shù)、電極位移和電阻信號(hào),電極力特征的貢獻(xiàn)度普遍偏小.需要研究各傳感信號(hào)對(duì)熔核直徑預(yù)測(cè)模型的重要性.
前文使用的訓(xùn)練集包括了焊接過(guò)程的電阻、電極力和位移信號(hào)特征,可能存在冗余.文中分別使用僅焊接工藝參數(shù)、來(lái)自單一信號(hào)的輸入特征和來(lái)自2 個(gè)信號(hào)的輸入特征訓(xùn)練GPR 模型,對(duì)比其應(yīng)用于ST 數(shù)據(jù)集和ALL 數(shù)據(jù)集上的性能,結(jié)果見(jiàn)表9.
表9 不同信號(hào)特征輸入下GPR 模型的預(yù)測(cè)性能Table 9 Prediction performance of GPR models with different input signals.
僅有焊接工藝參數(shù)輸入時(shí),模型在2 個(gè)數(shù)據(jù)集上的預(yù)測(cè)精度均降低,在ST 數(shù)據(jù)集上A±1mm出現(xiàn)較大性能波動(dòng),且在ALL 數(shù)據(jù)集上顯著下降至76.68%,不能滿足質(zhì)量預(yù)測(cè)需求.當(dāng)采用單一信號(hào)輸入特征時(shí),位移信號(hào)在ST 數(shù)據(jù)集獲得最佳的模型性能,A±1mm超過(guò)94%,其次是電阻信號(hào),電極力信號(hào)最差;在完整數(shù)據(jù)集上,上述排序保持不變,但A±1mm普遍降低5%~ 7%.采用雙信號(hào)輸入特征時(shí),模型在2 個(gè)數(shù)據(jù)集上均能獲得較高的預(yù)測(cè)性能,且兩數(shù)據(jù)集間的性能差異有所減小,這代表多個(gè)信號(hào)的融合有助于學(xué)習(xí)異常工況引起的差異與特異性;電阻+電極力信號(hào)組合可得到最佳性能,在完整數(shù)據(jù)集上的A±1mm超過(guò)91%,其次是電阻 +位移信號(hào)組合.
使用電阻+電極力信號(hào)作為輸入特征時(shí),在ALL 數(shù)據(jù)集上獲得了比使用全部信號(hào)作為輸入時(shí)更高的A±1mm,意味著去除冗余特征有助于提升模型預(yù)測(cè)性能.由于現(xiàn)有方案的A±1mm仍不足95%,需在未來(lái)對(duì)模型結(jié)構(gòu)和輸入變量進(jìn)行更加深入的優(yōu)化,進(jìn)一步提高熔核直徑的預(yù)測(cè)精度,從而滿足大批量工業(yè)生產(chǎn)的需求.
在輸入特征和信號(hào)的重要性分析中都發(fā)現(xiàn),波動(dòng)工況的引入對(duì)于模型預(yù)測(cè)精度具有較為明顯的影響.為了明確該影響,文中使用ST 數(shù)據(jù)集的26個(gè)輸入特征作為訓(xùn)練集進(jìn)行GPR 模型訓(xùn)練,使用三種異常工況數(shù)據(jù)集(即ALL-ST)對(duì)模型進(jìn)行測(cè)試,分析模型對(duì)異常工況的泛化性能.預(yù)測(cè)—實(shí)測(cè)結(jié)果對(duì)比如圖8 所示,預(yù)測(cè)性能見(jiàn)表10.
表10 GPR 模型對(duì)波動(dòng)工況的泛化性測(cè)試Table 10 Generalization test of GPR model on welding condition fluctuation.
圖8 GPR 模型泛化性測(cè)試的預(yù)測(cè)—實(shí)測(cè)值Fig. 8 Prediction-response results of GPR model generalization test. (a) training result in ST dataset; (b)training result in ALL-ST dataset
可以看出,僅使用標(biāo)準(zhǔn)工況數(shù)據(jù)訓(xùn)練模型時(shí),模型在異常工況下的精度保持性能較差.訓(xùn)練集上的預(yù)測(cè)點(diǎn)基本落在誤差±1 mm 范圍內(nèi),但在測(cè)試集上的預(yù)測(cè)點(diǎn)大量位于誤差±1 mm 允許界線之外,分布模式存在異常,A±1mm由94.10%降至79.18%.說(shuō)明僅使用標(biāo)準(zhǔn)工況數(shù)據(jù)訓(xùn)練的模型的外推性能不足,無(wú)法實(shí)現(xiàn)異常工況下熔核直徑的預(yù)測(cè).
為了提升模型對(duì)異常工況的適應(yīng)性,使用標(biāo)準(zhǔn)工況+兩種異常工況的組合數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練,測(cè)試其在第三種異常工況數(shù)據(jù)集上的預(yù)測(cè)性能,其結(jié)果見(jiàn)表10.對(duì)比發(fā)現(xiàn),在訓(xùn)練集增加傾斜和邊距工況時(shí),模型對(duì)間隙工況的泛化性最好,在預(yù)測(cè)和測(cè)試集上的A±1mm均超過(guò)92%;而在訓(xùn)練集增加間隙和傾斜或邊距工況后,模型在測(cè)試集上性能均顯著降低,邊距工況下的泛化性最差(A±1mm=51.21%),傾斜工況稍好(A±1mm=69.99%).
上述現(xiàn)象主要源于不同工況下數(shù)據(jù)特征的分布差異.圖9 所示為使用t 分布-隨機(jī)近鄰嵌入模型(t-SNE)對(duì)26 個(gè)輸入特征進(jìn)行降維和可視化的結(jié)果.數(shù)據(jù)主要分布在兩個(gè)區(qū)域內(nèi),區(qū)域I 是無(wú)飛濺焊接過(guò)程,區(qū)域II 代表發(fā)生了飛濺.可見(jiàn),間隙和標(biāo)準(zhǔn)工況的輸入特征分布較為接近,部分傾斜工況與標(biāo)準(zhǔn)工況差異明顯,而邊距工況的輸入特征分布則與其它三種工況差異較大.引入異常工況對(duì)模型泛化性的影響取決于其特征分布與訓(xùn)練數(shù)據(jù)集的差異.若測(cè)試集的特征分布與訓(xùn)練集差異過(guò)大,就會(huì)導(dǎo)致模型泛化性顯著降低.在三種異常工況中,間隙工況對(duì)模型性能影響較小,但傾斜和邊距工況影響較為顯著,若訓(xùn)練集缺少此數(shù)據(jù),得到的模型將無(wú)法有效預(yù)測(cè)此工況下的焊點(diǎn)質(zhì)量.
圖9 不同工況下的特征分布Fig. 9 Feature distribution of in different welding conditions
(1)與標(biāo)準(zhǔn)工況相比,傾斜和邊距工況會(huì)減小熔核直徑,對(duì)焊接過(guò)程多傳感信號(hào)的特征分布造成顯著差異;間隙工況的影響并不顯著.
(2)在所用四類(lèi)機(jī)器學(xué)習(xí)回歸模型中,可優(yōu)化高斯過(guò)程回歸模型具有最佳的熔核直徑預(yù)測(cè)性能,可適應(yīng)多種板材組合和多種異常工況的變化.
(3)在所提取的26 種輸入特征中,焊接電流、熱輸入能量和電極位移峰值特征的對(duì)熔核直徑預(yù)測(cè)的貢獻(xiàn)最大.
(4)單信號(hào)輸入預(yù)測(cè)熔核直徑時(shí),信號(hào)重要性:位移 > 電阻 > 電極力;雙信號(hào)輸入時(shí),預(yù)測(cè)性能:電阻+電極力 > 電阻+位移 > 電極力+位移.
(5)工況波動(dòng)引起的信號(hào)特征分布差異會(huì)顯著影響模型的泛化性能,減少訓(xùn)練集與數(shù)據(jù)集差異有助于提高模型的泛化性能.