張向良
摘 要:鈑金件成型的過程中,彎邊處會出現(xiàn)回彈現(xiàn)象,如果在工裝的幾何形狀上補償相應的角度,就可以減少回彈帶來的影響。本文將以歷史數(shù)據(jù)為素材,利用機器學習的方法建立補償角度預測模型。本文將首先對學習任務進行分析,然后使用交叉驗證的方法審察多種模型在訓練數(shù)據(jù)集上的表現(xiàn),根據(jù)相關性能指標選取合適的模型進行訓練,最后在測試數(shù)據(jù)集上驗證模型的性能。最終模型可以通過給定參數(shù)預測回彈補償角度,為后續(xù)的工裝設計提供數(shù)據(jù)依據(jù)。
關鍵詞:鈑金;回彈;機器學習;回歸;模型審查
中圖分類號:V262 文獻標志碼:A
0 引言
鈑金件成型的過程中,由于材料發(fā)生的形變中會殘留一部分彈性形變,卸除壓力后彈性形變會恢復原狀(即回彈)。如果在設計工裝時將彎邊向內(nèi)偏移相應的補償角度,就可以減少甚至消除回彈帶來的影響,進而免去后續(xù)的人工敲修步驟,提高生產(chǎn)效率。
為了預測鈑金件成型的補償角度,需要探索零件的各項參數(shù)與補償角度之間的關系。本文將通過機器學習的方法,利用已有的數(shù)據(jù)訓練回彈補償角度預測模型。本文假定補償角度被且僅被材料厚度、彎曲內(nèi)半徑和彎曲角度確定。由于篇幅所限,本文所用的數(shù)據(jù)集未給出。
1 任務分析
本任務是給定材料厚度、彎曲內(nèi)半徑、彎曲角度,預測回彈補償角度,是一個回歸任務。在使用數(shù)據(jù)訓練模型之前,有必要對數(shù)據(jù)有一個大致的了解。觀察數(shù)據(jù)集(見表1)可知,3個輸入特征均為數(shù)值特征,但所用的尺度不同;另外,特征的一些統(tǒng)計信息見表1。
可以看出3個輸入特征的分布與離散速度都非常均勻,這是因為數(shù)據(jù)集的特征值是正交實驗中人為選定的,而非在某一固定規(guī)律的影響下自然生成。對任務和數(shù)據(jù)有了一定的了解之后,下一步將選取合適的模型,以挖掘數(shù)據(jù)中蘊含的規(guī)律。
2 模型審查
機器學習中有多種回歸模型,應選擇適合本任務的一個進行訓練。根據(jù)上一節(jié)的內(nèi)容,對可能適用的模型作出推測:
(1)數(shù)據(jù)集中的特征都是數(shù)值特征,幾何模型可能會普遍地適用。
(2)由于相似的特征取值會帶來相似的結(jié)果,如δ=1.8、R=4.5、α=90時與δ=2、R=4、α=95時Δα均為2.8,所以基于距離的模型可能會有較好的表現(xiàn)。
(3)由于數(shù)據(jù)的特征值是人為選定的,所以一些邏輯模型(如樹模型)可能會有較好的表現(xiàn)。
(4)某些集成模型可能會有較好的表現(xiàn),但隨之而來的是模型的復雜性。
選擇模型時,除在訓練集上的表現(xiàn)外,還需要關注模型的泛化能力。本文將使用10折交叉驗證對下列5種模型在訓練數(shù)據(jù)集上的均方誤差(MSE)進行審查:線性回歸(LR)、支持向量機(SVM)、K近鄰(KNN)、決策樹(DT)和梯度提升決策樹(GBDT)。在交叉驗證之前,會分離出數(shù)據(jù)集的20%作為測試數(shù)據(jù)集。
通過交叉驗證得到5種模型的均方誤差(取負),并使用線箱圖表示,如圖1所示。
可以看出,支持向量機、K近鄰和梯度提升決策樹的均方誤差較小,分布也比較集中。其中K近鄰的表現(xiàn)最好,但與其余兩者的差距并不大。由此產(chǎn)生的問題是:這種較小的性能差異是否意味著應當選擇K近鄰而拋棄另兩者。由于復雜的學習策略通常意味著較差的泛化能力,本文將優(yōu)先考慮支持向量機和K近鄰這兩個相對簡單的模型。
下面通過配對t檢驗來判定兩模型均方誤差的差異是否顯著。具體評分見表2。
定義零假設為:支持向量機與K近鄰在上述交叉驗證中的均方誤差總體而言沒有差異。取顯著性指標a=0.05。檢驗結(jié)果為t=-0.2845,p=0.7824,不拒絕零假設,即兩模型均方誤差的差異無統(tǒng)計學意義。本文選擇支持向量機進行訓練。
3 性能驗證
為了驗證模型的性能,需要使用它對已知結(jié)果的數(shù)據(jù)進行預測,將預測結(jié)果與已知結(jié)果作比較。使用訓練數(shù)據(jù)集對支持向量機進行訓練后,對測試數(shù)據(jù)集進行預測,結(jié)果見表3。
該次預測的均方誤差為0.0166。這與交叉驗證得到的中位值(約0.02)比較相符。注意第4條記錄的預測結(jié)果與已知結(jié)果偏差較大,實際上這是數(shù)據(jù)集的誤差所致,此處的預測結(jié)果反而更符合常理。這說明了此模型有著一定的健壯性。
結(jié)論
本文使用包括材料厚度、彎曲內(nèi)半徑、彎曲角度和補償角度4個特征的數(shù)據(jù)集,通過交叉驗證的方法,對線性回歸、支持向量機、K近鄰、決策樹和梯度提升決策樹5個模型的均方誤差進行了審查,最終選定了性能理想的支持向量機進行訓練,得到了回彈補償角度的預測模型。該模型在測試數(shù)據(jù)集上擁有符合預期的性能指標,并表現(xiàn)出了一定的健壯性,達到了研究的目的。
參考文獻
[1][英]彼得·弗拉赫. 段菲譯.機器學習[M].北京:人民郵電出版社,2016.
[2][美]彼得·哈林頓. 李銳等譯.機器學習實戰(zhàn)[M].北京:人民郵電出版社,2013.
[3][美]杰克·萬托布拉斯. 陶俊杰等譯.Python數(shù)據(jù)科學手冊[M].北京:人民郵電出版社,2018.