章順虎,車立志,田文皓,李言
塑性成形
基于卷積神經(jīng)網(wǎng)絡(luò)的熱軋薄板力學(xué)性能建模
章順虎,車立志,田文皓,李言
(蘇州大學(xué) 沙鋼鋼鐵學(xué)院,江蘇 蘇州 215021)
為了提高熱軋薄板力學(xué)性能的預(yù)測精度,采用大數(shù)據(jù)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方式建立高精度的預(yù)測模型。建模前,對工業(yè)大數(shù)據(jù)進(jìn)行預(yù)處理,包括去除異常值、聚類、均衡數(shù)據(jù)以及歸一化,以得到高質(zhì)量的數(shù)據(jù)集。同時,采用貢獻(xiàn)權(quán)重法對輸入?yún)?shù)進(jìn)行篩選,去除弱相關(guān)的變量以降低模型的復(fù)雜程度。在此基礎(chǔ)上,采用LeNet-5結(jié)構(gòu)建立卷積神經(jīng)網(wǎng)絡(luò)并優(yōu)化模型的超參數(shù)。最終建立了熱軋薄板力學(xué)性能預(yù)測模型,該模型對屈服強(qiáng)度的預(yù)測誤差基本保持在?7%~8.5%,對抗拉強(qiáng)度的預(yù)測誤差基本保持在?5%~6%,表現(xiàn)出較高的預(yù)測精度。將卷積神經(jīng)網(wǎng)絡(luò)模型與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了預(yù)測對比,發(fā)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)能夠利用其局部連接的優(yōu)勢給出更高的預(yù)測精度。
熱軋;薄板;卷積神經(jīng)網(wǎng)絡(luò);大數(shù)據(jù);力學(xué)性能
熱軋薄板力學(xué)性能包括屈服強(qiáng)度、抗拉強(qiáng)度和伸長率等重要指標(biāo),這些重要指標(biāo)直接決定著板材的質(zhì)量,因此,上述力學(xué)性能的準(zhǔn)確預(yù)測對指導(dǎo)軋制過程的優(yōu)化控制具有重要意義。
關(guān)于熱軋薄板力學(xué)性能的研究一直是材料加工領(lǐng)域關(guān)注的焦點。截至目前,該方面的研究經(jīng)歷了3個重要的階段,分別是基于物理模擬結(jié)果的機(jī)理擬合建模、以BP為代表的傳統(tǒng)樣本數(shù)據(jù)建模與近年來興起的大數(shù)據(jù)建模。Irvine和Pickering最初提出利用數(shù)學(xué)模型預(yù)測鋼材組織演變和最終力學(xué)性能,研究了變形條件、溫度條件對熱軋過程中顯微組織演變、析出的影響[1]。此后,一些專家學(xué)者也陸續(xù)做了大量研究工作,給出了具有代表性的數(shù)學(xué)模型,如Yada模型、Saito模型和Nanba模型[2-4]等。在這些研究基礎(chǔ)上,已開發(fā)出如熱連軋帶鋼質(zhì)量控制系統(tǒng)(VAI-Q strip)、INTEG公司的HSMM以及國內(nèi)的Q-HSM、ROLLAN等商業(yè)軟件[5-8]。上述模型大多是在半經(jīng)驗半理論的基礎(chǔ)上通過擬合的方法所建立,難以全面、準(zhǔn)確地反映力學(xué)性能與工藝參數(shù)之間復(fù)雜的非線性關(guān)系。并且,由于軋鋼過程不確定因素較多,上述方法所得模型的穩(wěn)定性較差,適用范圍也有限。
隨著計算機(jī)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)為充分挖掘各參數(shù)之間復(fù)雜的非線性關(guān)系提供了一種解決途徑。在軋后產(chǎn)品力學(xué)性能預(yù)報上,劉振宇[9]、Mukhopadhyay[10]、Amit[11]等均給出了具有較高精度的神經(jīng)網(wǎng)絡(luò)預(yù)報模型。近年來,Ghaisari等[12]利用Levenberg-Marquardt法優(yōu)化了網(wǎng)絡(luò)模型,并分析了主要工藝參數(shù)對力學(xué)性能的影響。為了去除冗余的輸入變量,Lalam等[13]將冷軋鍍鋅鋼卷的關(guān)鍵工藝參數(shù)作為輸入變量,提出了一種前饋-反向傳播人工神經(jīng)網(wǎng)絡(luò),用于預(yù)測鍍鋅鋼卷的屈服強(qiáng)度、抗拉強(qiáng)度等力學(xué)性能,并應(yīng)用于實際生產(chǎn)。需要指出的是,由于樣本數(shù)據(jù)覆蓋的生產(chǎn)條件有限,上述模型均難以應(yīng)對實際生產(chǎn)中的預(yù)測要求。
由于工業(yè)大數(shù)據(jù)中蘊含著更加真實的參數(shù)關(guān)系,覆蓋的條件更多,因而基于大數(shù)據(jù)建立的模型更適應(yīng)實際生產(chǎn)中環(huán)境的變化。國內(nèi)外陸續(xù)催生了一些大數(shù)據(jù)應(yīng)用于鋼鐵性能預(yù)報的研究報道?;诖髷?shù)據(jù)分析,Brandenburger等[14]基于多尺度數(shù)據(jù)表征技術(shù)提出了冷/熱板材生產(chǎn)大數(shù)據(jù)的獲取技術(shù),并實現(xiàn)了實驗鋼中冷/熱板材力學(xué)性能的準(zhǔn)確預(yù)報;Wu等[15]通過預(yù)先處理異常的C-Mn熱軋板帶大數(shù)據(jù),構(gòu)建出了比傳統(tǒng)物理冶金模型更為精確的預(yù)報模型,為工藝參數(shù)的優(yōu)化提供了可靠依據(jù);通過結(jié)合大數(shù)據(jù)分析技術(shù)與已有冶金物理模型,Spuzic等[16]開發(fā)了基于軋制流程信息的數(shù)學(xué)模型,并深入分析了預(yù)測誤差產(chǎn)生的可能原因。
盡管如此,以上對大數(shù)據(jù)的分析多采用淺層神經(jīng)網(wǎng)絡(luò),屬于全連接網(wǎng)絡(luò),并不能充分反映數(shù)據(jù)之間的參數(shù)關(guān)系。與之不同的是,近幾年發(fā)展出來的卷積神經(jīng)網(wǎng)絡(luò),屬于深度學(xué)習(xí)網(wǎng)絡(luò),其采用局部連接和權(quán)值共享的思想,在降低網(wǎng)絡(luò)模型復(fù)雜度的同時能夠深度挖掘輸入與輸出之間的關(guān)系,因此,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于力學(xué)性能預(yù)報中有望進(jìn)一步提高其預(yù)測精度。
為此,文中提出將大數(shù)據(jù)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,利用卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的數(shù)據(jù)分析能力深度挖掘生產(chǎn)大數(shù)據(jù)中復(fù)雜的非線性關(guān)系,從而實現(xiàn)對熱軋薄板力學(xué)性能的精確預(yù)測。按此思路,首先對生產(chǎn)大數(shù)據(jù)進(jìn)行去除異常值、聚類、均衡數(shù)據(jù)和歸一化等處理,以保證數(shù)據(jù)的有效性。在此基礎(chǔ)上,構(gòu)建并優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)模型,并對模型的預(yù)測效果進(jìn)行測試與討論。
采用國內(nèi)牌號為SAE1006、MRT4與HP295的3000組實際鋼鐵生產(chǎn)大數(shù)據(jù)建立屈服強(qiáng)度與抗拉強(qiáng)度的預(yù)測模型。為解決實際生產(chǎn)數(shù)據(jù)中存在的數(shù)據(jù)異常、數(shù)據(jù)分布不均問題,在建立卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型前需要對數(shù)據(jù)集進(jìn)行處理,以保證數(shù)據(jù)的有效性。
IQR準(zhǔn)則的異常值探測區(qū)間為[17]:
經(jīng)上述計算,共去除異常數(shù)據(jù)9組,最終保留2991組數(shù)據(jù)用于建立熱軋薄板力學(xué)性能預(yù)報模型。
去除異常值之后,不同性能區(qū)間數(shù)據(jù)出現(xiàn)的數(shù)量見圖1。由圖1可知,各區(qū)間內(nèi)的數(shù)據(jù)分布嚴(yán)重不均。此種數(shù)據(jù)分布的不均衡將會嚴(yán)重影響模型的訓(xùn)練,不利于提高神經(jīng)網(wǎng)絡(luò)模型的精度。
進(jìn)一步分析可知,薄板的力學(xué)性能數(shù)據(jù)分布緊密、分類邊界模糊,傳統(tǒng)的依據(jù)薄板牌號進(jìn)行劃分的方法難以充分體現(xiàn)薄板力學(xué)性能的差異性,見圖2。為了使數(shù)據(jù)的劃分更加合理,采用均值聚類法對數(shù)據(jù)進(jìn)行聚類處理,并對聚類后的各區(qū)間數(shù)據(jù)進(jìn)行試錯加倍,使其數(shù)據(jù)量趨于同一水平,以保證數(shù)據(jù)均衡分布。
在均值聚類過程中存在的主要問題是聚點值難以確定。針對這一問題,文中采用吳禮斌等[18]的方法,使用2統(tǒng)計量以及偽統(tǒng)計量對不同值的聚類效果進(jìn)行綜合評估。2統(tǒng)計量以及偽統(tǒng)計量越大,變化越劇烈,則表示聚類數(shù)越合理。2統(tǒng)計量和偽統(tǒng)計量的計算見式(3—4)。
圖1 原始數(shù)據(jù)統(tǒng)計結(jié)果
圖2 熱軋薄板力學(xué)性能分布
將采用薄板牌號分類和聚類的結(jié)果進(jìn)行對比,見圖4a—b。采用聚類所得結(jié)果之間差異明顯,分類邊界更加清晰,更加有利于神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中對于各類別參數(shù)的特征提取。
將圖4中聚類后各類別數(shù)據(jù)導(dǎo)出,并統(tǒng)計各類別數(shù)據(jù)在數(shù)據(jù)集中的占比,統(tǒng)計結(jié)果見表1。由表1可知,聚類后各類別數(shù)據(jù)量在總數(shù)據(jù)中占比嚴(yán)重不均衡,其中占比最小的為第3組,僅占0.77%;占比最大的為第7組,占比為18.82%。
為了降低數(shù)據(jù)類不均衡在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中的影響,將聚類后各組數(shù)據(jù)分別進(jìn)行多次復(fù)制,直至各類數(shù)據(jù)總量接近。均衡化后的各類數(shù)據(jù)總量及其占比見表2。由表2可知,均衡化處理后共有數(shù)據(jù)13 511組,其中占比最大與占比最小的數(shù)據(jù)僅相差2.54%,有效緩解了數(shù)據(jù)中類別不均衡的問題,有利于后期神經(jīng)網(wǎng)絡(luò)的訓(xùn)練與學(xué)習(xí)。
圖3 不同k值聚類效果
圖4 數(shù)據(jù)類別劃分
表1 各類數(shù)據(jù)量及其在數(shù)據(jù)集中的占比
Tab.1 Initial amount of each type of data and its proportion in the data set
表2 數(shù)據(jù)均衡后各類數(shù)據(jù)量及其在數(shù)據(jù)集中的占比
Tab.2 Amount of data and its proportion in the data set after data equalization
為消除不同參數(shù)之間存在明顯的數(shù)量級差異對網(wǎng)絡(luò)權(quán)重的影響,使用數(shù)據(jù)歸一化的方法,將相關(guān)參數(shù)轉(zhuǎn)化為無量綱的數(shù)值進(jìn)行訓(xùn)練。歸一化公式見式(5)。
選取的數(shù)據(jù)共包含18個參數(shù),分別為16個工藝參數(shù)和2個輸出參量,即抗拉強(qiáng)度與屈服強(qiáng)度。為了獲得高精度的預(yù)測模型,采用貢獻(xiàn)權(quán)重法對各輸入?yún)?shù)貢獻(xiàn)權(quán)重C進(jìn)行計算,見式(6)[19]。
表3 輸入?yún)?shù)權(quán)重對比
Tab.3 Weight comparison of input parameters
由表3可知,在收集到的16組影響力學(xué)性能的參數(shù)中,P含量、粗軋溫度和Cu含量的權(quán)重較大,均超過10%;而軋制溫度、出口厚度、Ti含量、Si含量和Al含量的權(quán)重較小,均小于3%。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,參數(shù)權(quán)重越大,說明該參數(shù)對預(yù)測結(jié)果的影響越明顯;權(quán)重越小,對預(yù)測結(jié)果的影響越小,因此,舍棄權(quán)重小于3%的弱相關(guān)參數(shù)。最終確定的輸入?yún)?shù)為11個,包括粗軋溫度、壓下率、軋制速度、軋制力、層流平均冷卻速度、卷曲溫度、C含量、P含量、Cu含量、Mn含量、S含量。
相較于一維數(shù)據(jù),二維數(shù)據(jù)能夠提取到更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),從而充分挖掘局部參數(shù)對薄板力學(xué)性能的影響。同時,二維數(shù)據(jù)更接近圖像的形式,便于卷積神經(jīng)網(wǎng)絡(luò)的卷積處理,因此,文中采用卷積神經(jīng)網(wǎng)絡(luò)建立薄板力學(xué)性能預(yù)測模型,在輸入數(shù)據(jù)時需要將一維的數(shù)據(jù)轉(zhuǎn)變?yōu)槎S圖像數(shù)據(jù),即以32′32的矩陣形式輸入神經(jīng)網(wǎng)絡(luò)。為了使卷積核充分提取不同輸入?yún)?shù)之間的局部交互作用關(guān)系,在轉(zhuǎn)化數(shù)據(jù)格式時,將1組11個輸入?yún)?shù)進(jìn)行復(fù)制,以首尾相接的形式儲存在32′32的二維矩陣中。數(shù)據(jù)格式轉(zhuǎn)化見圖5。
圖5 數(shù)據(jù)格式轉(zhuǎn)換
采用經(jīng)典的Lenet-5結(jié)構(gòu)建立卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。在經(jīng)典Lenet-5網(wǎng)絡(luò)結(jié)構(gòu)中采用Sigmoid函數(shù)(見式(7))作為激活函數(shù),但該激活函數(shù)在訓(xùn)練后期極易出現(xiàn)誤差飽和問題,導(dǎo)致信息丟失。在預(yù)測力學(xué)性能時,這種信息丟失不利于訓(xùn)練過程的順利進(jìn)行。Relu激活函數(shù)(見式(8))在降低計算量的同時能夠保證訓(xùn)練的計算精度,同時,基于該激活函數(shù),訓(xùn)練過程中的0輸出可以有效避免模型的過擬合,因此文中采用Relu激活函數(shù)代替原有的Sigmoid激活函數(shù)。
為了便于評價卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測性能,選取均方根誤差(RMSE)和平均絕對百分誤差(MAPE)作為模型準(zhǔn)確性的評價標(biāo)準(zhǔn),計算見式(9—10)。
設(shè)置單次最小樣本量為32,最大迭代次數(shù)為30,為了確定合適的學(xué)習(xí)率,對比了不同學(xué)習(xí)率對卷積神經(jīng)網(wǎng)絡(luò)性能的影響,見表4。
表4前3列為相同迭代次數(shù)時不同學(xué)習(xí)率對神經(jīng)網(wǎng)絡(luò)性能的影響,而第4列是采用學(xué)習(xí)率衰減的情況,其衰減周期為15,學(xué)習(xí)率衰減因子為0.1。對比結(jié)果表明,學(xué)習(xí)率衰減所得網(wǎng)絡(luò)結(jié)構(gòu)的性能函數(shù)RMSE和MAPE的值最小。這說明在相同的迭代次數(shù)下,學(xué)習(xí)率衰減更有利于網(wǎng)絡(luò)的訓(xùn)練。但根據(jù)訓(xùn)練過程,學(xué)習(xí)率為0.0001時,迭代8850次所得結(jié)果并非最優(yōu),因此,在第5列同時給出了學(xué)習(xí)率為0.0001迭代到最優(yōu)時的結(jié)果。將其與學(xué)習(xí)衰減的結(jié)果對比,二者性能相似(考慮神經(jīng)網(wǎng)絡(luò)具有波動性),但學(xué)習(xí)率衰減迭代次數(shù)較少,耗時較少,更有利于實際應(yīng)用。對比結(jié)果表明,文中所采用的學(xué)習(xí)率衰減方法,在提高訓(xùn)練效率的同時能夠有效保證網(wǎng)絡(luò)的預(yù)測精度。
表4 不同學(xué)習(xí)率下卷積神經(jīng)網(wǎng)絡(luò)性能
Tab.4 Performance of convolutional neural networks at different learning rates
將已有的13 511組數(shù)據(jù)按照7∶3的比例分為訓(xùn)練集與驗證集,并導(dǎo)入建立的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。最終確定的網(wǎng)絡(luò)結(jié)構(gòu)在預(yù)測屈服強(qiáng)度時的網(wǎng)絡(luò)性能函數(shù)值分別為RMSE=11.61 MPa,MAPE=2.54%;預(yù)測抗拉強(qiáng)度時的網(wǎng)絡(luò)性能函數(shù)值分別為RMSE= 9.58 MPa,MAPE=1.63%,所得網(wǎng)絡(luò)結(jié)構(gòu)性能優(yōu)良。
采用上述確定的網(wǎng)絡(luò)結(jié)構(gòu)對驗證集進(jìn)行預(yù)測,并對預(yù)測結(jié)果進(jìn)行統(tǒng)計,結(jié)果見圖6—7。
圖6 屈服強(qiáng)度實測值與預(yù)測值誤差分布
圖7 抗拉強(qiáng)度實測值與預(yù)測值誤差分布
由圖6可知,該模型對于屈服強(qiáng)度的預(yù)測誤差基本能保持在?7%~8.5%。由圖7可知,該模型對于抗拉強(qiáng)度的預(yù)測誤差基本保持在?5%~6%。對模型預(yù)測結(jié)果進(jìn)行統(tǒng)計,結(jié)果顯示,97.98%的屈服強(qiáng)度預(yù)測結(jié)果和99.88%的抗拉強(qiáng)度預(yù)測結(jié)果誤差均小于10%。其中,68.67%的屈服強(qiáng)度預(yù)測結(jié)果和84.60%的抗拉強(qiáng)度預(yù)測結(jié)果誤差均小于3%。結(jié)果表明,建立的網(wǎng)絡(luò)模型能夠?qū)崿F(xiàn)對屈服強(qiáng)度與抗拉強(qiáng)度的穩(wěn)定、精確預(yù)測。
將均衡化前的數(shù)據(jù)集與均衡化后的數(shù)據(jù)集分別代入卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,結(jié)果見表5。
表5 均衡化前后數(shù)據(jù)集對模型性能的影響
Tab.5 Effects of data sets on model performance before and after equalization
表5對比了不同數(shù)據(jù)集對卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型性能的影響。結(jié)果顯示,均衡化的方法能夠有效提高模型的預(yù)測精度和穩(wěn)定性。
為了驗證卷積神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜參數(shù)關(guān)系時的優(yōu)良表現(xiàn),文中采用BP神經(jīng)網(wǎng)絡(luò)建立了相應(yīng)的性能預(yù)報模型,并與卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了對比。
不同神經(jīng)網(wǎng)絡(luò)之間的性能差異見表6。由表6可知,與BP神經(jīng)網(wǎng)絡(luò)相比,卷積神經(jīng)網(wǎng)絡(luò)具有更小的RMSE和MAPE,這說明卷積神經(jīng)網(wǎng)絡(luò)能挖掘到更接近真實的參數(shù)關(guān)系。這是由于卷積神經(jīng)網(wǎng)絡(luò)能夠通過局部連接實現(xiàn)參數(shù)關(guān)系的深度挖掘,而傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)采用的是全連接的思想,因此在面對復(fù)雜的參數(shù)關(guān)系時,卷積神經(jīng)網(wǎng)絡(luò)能夠更加有效地實現(xiàn)對結(jié)果的精確預(yù)測。
表6 不同神經(jīng)網(wǎng)絡(luò)性能對比
Tab.6 Performance comparison of different neural networks
1)文中將實際生產(chǎn)大數(shù)據(jù)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了熱軋薄板力學(xué)性能預(yù)報模型。該模型對于屈服強(qiáng)度的預(yù)測誤差基本保持在?7%~8.5%,對于抗拉強(qiáng)度的預(yù)測誤差基本保持在?5%~6%,實現(xiàn)了對熱軋薄板力學(xué)性能的高精度預(yù)測。
2)對比討論了衰減學(xué)習(xí)率對卷積神經(jīng)網(wǎng)絡(luò)性能的影響。結(jié)果表明,隨著學(xué)習(xí)率的減小,模型精度逐漸提高,同時在較小學(xué)習(xí)率的情況下,模型迭代次數(shù)明顯增大。而衰減學(xué)習(xí)率能夠在保證模型精度的同時顯著減少迭代次數(shù),降低運算時間。
3)對比討論了均衡化數(shù)據(jù)集對卷積神經(jīng)網(wǎng)絡(luò)性能的影響。結(jié)果表明,均衡化后的數(shù)據(jù)集所得網(wǎng)絡(luò)模型的RMSE值降低了3.88 MPa,MAPE值降低了1.01%,所得結(jié)果有力地證明了均衡化數(shù)據(jù)集可以有效提高模型預(yù)測精度。
4)將BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,卷積神經(jīng)網(wǎng)絡(luò)所得模型的RMSE值和MAPE值均小于BP神經(jīng)網(wǎng)絡(luò)所得模型,同時卷積神經(jīng)網(wǎng)絡(luò)所得模型預(yù)測結(jié)果中超過68%的數(shù)據(jù)絕對誤差均小于3%。結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)能夠更加有效地挖掘力學(xué)性能預(yù)測中復(fù)雜的參量關(guān)系,實現(xiàn)了力學(xué)性能的高精度預(yù)測。
[1] IRVINE K J, PICKERING F B. Low Carbon Bainiticsteels[J]. Journal of Iron and Steel Institute, 1957, 184(12): 292-309.
[2] YADA H, SENUMA T. Resistance to Hot Deformation of Steels[J]. Journal of Japanese Social Technology Plasticity, 1986, 27(1): 34-41.
[3] IMAO Tamura. Some Elementary Steps in the Thermomechanical Processing of Steels[J]. Tetsu-To Hagane, 1988, 74(1): 18-34.
[4] NANBA S, KITAMURA M, SHIMADA M, et al. Prediction of Microstructure Distribution in the Through- Thickness Direction during and after Hot Rolling in Carbon Steels[J]. ISIJ International, 1992, 32(3): 377-386.
[5] ANODORFER J, HRIBERNING G, LUGER A, et al. For the First Time Ever: Full Metallurgical Control of the Mechanical Properties of Hot-Rolled Strip with Vai-Q Strip[J]. Iron and Steel, 2001, 36(1): 42-46.
[6] 余萬華, 韓靜濤, 佘廣夫, 等. HSMM軟件在攀枝花鋼鐵公司熱軋板長的應(yīng)用[J]. 鋼鐵研究學(xué)報, 2006, 18(11): 60-62.
YU Wan-hua, HAN Jing-tao, SHE Guang-fu, et al. Application of HSMM Software in Hot Strip Mill of Panzhihua Steel Company[J]. Journal of Iron and Steel Research, 2006, 18(11): 60-62.
[7] 干勇, 劉正東, 王國棟, 等. 組織性能預(yù)報系統(tǒng)在寶鋼2050熱軋生產(chǎn)線的在線應(yīng)用[J]. 鋼鐵, 2006, 31(3): 40-43.
GAN Yong, LIU Zheng-dong, WANG Guo-dong, et al. On-Line Application of Structure and Property Prediction System on Hot Rolling Line on 2050 HSM at Baosteel[J]. Iron and Steel, 2006, 31(3): 40-43.
[8] 李依依, 李殿中, 朱苗勇. 金屬材料制備工藝的計算機(jī)模擬[M]. 北京: 科學(xué)出版社, 2006: 2-8.
LI Yi-yi, LI Dian-zhong, ZHU Miao-yong. Computer Simulation of Metal Processing[M]. Beijing: Science Press, 2006: 2-8.
[9] 劉振宇, 王昭東. 應(yīng)用神經(jīng)網(wǎng)絡(luò)預(yù)測熱軋C-Mn鋼力學(xué)性能[J]. 鋼鐵研究學(xué)報, 1995, 7(4): 61-66.
LIU Zhen-yu, WANG Zhao-dong. Predicting Mechanical Properties of Hot-Rolled Steels by Using Neural Network[J]. Journal of Iron and Steel Research, 1995, 7(4): 61-66.
[10] MUKHOPADHYAY A, IQBAL A. Prediction of Mechanical Properties of Hot Rolled, Low-Carbon Steel Strips Using Artificial Neutral Network[J]. Materials and Manufacturing Processes, 2005, 20(5): 793-812.
[11] AMIT P, PRASHANT D. Modeling of Microstructure and Mechanical Properties of Heat Treated Components by Using Artificial Neural Network[J]. Materials Science and Engineering: A, 2015(628): 89-97.
[12] GHAISARI J, JANNESARI H, VATANI M. Artificial Neural Network Predictors for Mechanical Properties of Cold Rolling Products[J]. Advances in Engineering Software, 2012, 45(1): 91-99.
[13] LALAM S, TIWARI P K, SAHOO S, et al. Online Prediction and Monitoring of Mechanical Properties of Industrial Galvanised Steel Coils Using Neural Networks[J]. Ironmaking & Steelmaking, 2019, 46(1): 89-96.
[14] BRANDENBURGER J, COLLA V, NASTASI G, et al. Big Data Solution for Quality Monitoring and Improvement on Flat Steel Production[J]. IFAC-Papers-OnLine, 2016, 49(20): 55-60.
[15] WU S, CAO G, ZHOU X, et al. High Dimensional Data-Driven Optimal Design for Hot Strip Rolling of C-Mn Steels[J]. ISIJ International, 2017, 57(7): 1213-1220.
[16] SPUZIC S, NARAYANAN R, GUDIMETLA P. Big Data Model-An Application to Design of Rolling Process[C]// International Conference on Innovative Material Science and Technology, 2016: 19-21.
[17] 武曙光. 區(qū)域CORS站坐標(biāo)時間序列特征分析[D]. 武漢: 武漢大學(xué), 2017: 27-28.
WU Shu-guang. Characteristics of Coordinate Time Series from Regional CORS Stations[D]. Wuhan: Wuhan University, 2017: 27-28.
[18] 吳禮斌, 李柏年, 張孔生, 等. MATLAB數(shù)據(jù)分析方法[M]. 北京: 機(jī)械工業(yè)出版社, 2018: 186-211.
WU Li-bin, LI Bai-nian, ZHANG Kong-sheng, et al. MATLAB Data Analysis Methods[M]. Beijing: China Machine Press, 2018: 186-211.
[19] 高仁祥, 張世英, 劉豹. 基于神經(jīng)網(wǎng)絡(luò)的變量選擇方法[J]. 系統(tǒng)工程學(xué)報, 1996, 13(2): 32-37.
GAO Ren-xiang, ZHANG Shi-ying, LIU Bao. Variable Selection Approach Based on Neural Network Analysis[J]. Journal of Systems Engineering, 1996, 13(2): 32-37.
Modeling of Mechanical Properties of Hot Rolled Sheet Based on Convolutional Neural Network
ZHANG Shun-hu, CHE Li-zhi, TIAN Wen-hao, LI Yan
(Shagang School of Iron and Steel, Soochow University, Suzhou 215021, China)
The work aims to combine big data with convolutional neural network to establish a high-precision prediction model to improve the prediction accuracy of mechanical properties of hot rolled sheet. Before modeling, industrial big data was preprocessed, including outlier removal, clustering, data equalization and normalization, to obtain high-quality data sets. At the same time, the contribution weight method was used to filter the input parameters and remove the weakly correlated variables to reduce the complexity of the model. On this basis, the convolutional neural network was established with LeNet-5 structure and the hyperparameters of the model were optimized. At last, a prediction model for mechanical properties of hot rolled sheet was finally established. The prediction error of the model for yield strength was maintained between ?7%~8.5%, and the prediction error of tensile strength was maintained between ?5%~6%. The prediction results showed high prediction accuracy. In addition, the comparison of the results of convolutional neural network and traditional back propagation neural network finds that the convolutional neural network can give higher prediction accuracy by taking advantage of its local connection.
hot rolling; sheet; convolutional neural network; big data; mechanical property
10.3969/j.issn.1674-6457.2022.03.001
TG335
A
1674-6457(2022)03-0001-07
2021-10-11
國家自然科學(xué)基金(52074187,U1960105)
章順虎(1986—),男,博士,副教授,主要研究方向為軋制過程優(yōu)化控制。