亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林的點蝕電位預(yù)測

        2020-09-10 07:22:44邢易李樹枝
        電焊機(jī) 2020年5期
        關(guān)鍵詞:隨機(jī)森林非線性

        邢易 李樹枝

        摘要:點蝕是不銹鋼點焊接頭最常見的失效形式之一。點蝕電位作為衡量點蝕行為的特征量,與焊接電流、焊接時間、電極壓力等參數(shù)有著復(fù)雜的非線性關(guān)系。針對文獻(xiàn)中不銹鋼接頭點蝕行為數(shù)據(jù),建立隨機(jī)森林模型,優(yōu)化的決策樹數(shù)目為1 000,通過“五折交叉驗證”確定節(jié)點備選變量個數(shù)為2。預(yù)測結(jié)果表明:除29號樣本預(yù)測相對誤差較高外(-14.81%),剩余樣本的預(yù)測結(jié)果均優(yōu)于神經(jīng)網(wǎng)絡(luò)和支持向量機(jī),相對誤差的絕對值在10%以下。

        關(guān)鍵詞:點蝕電位;隨機(jī)森林;交叉驗證;非線性

        中圖分類號:TP181文獻(xiàn)標(biāo)志碼:A文章編號:1001-2303(2020)05-0045-05

        DOI:10.7512/j.issn.1001-2303.2020.05.09

        0 前言

        電阻點焊以其高效、低應(yīng)力、小變形以及良好的自動化適應(yīng)性等優(yōu)勢,廣泛應(yīng)用于汽車、鐵路、航空、電子等工業(yè)領(lǐng)域中,可實現(xiàn)低碳鋼、不銹鋼、鋁合金、高溫合金的焊接。

        不銹鋼具有優(yōu)良的機(jī)械性能和耐蝕性能,但在點焊過程中其接頭性能受到較大影響,尤其是耐蝕性。點蝕是一種局部腐蝕現(xiàn)象,點蝕電位作為點焊接頭點蝕行為的評價依據(jù),可通過焊接時間、焊接電流等[1-3]焊接參數(shù)實現(xiàn)預(yù)測和評價。

        隨機(jī)森林是Breiman L.[4]在2001年提出的機(jī)器學(xué)習(xí)算法。該算法以決策樹作為基學(xué)習(xí)器,采用并行化思想,實現(xiàn)模型的訓(xùn)練和預(yù)測。隨機(jī)森林算法優(yōu)點眾多,非常適用于處理復(fù)雜、非線性問題,而且?guī)缀醪粫霈F(xiàn)過擬合,預(yù)測效果好,在農(nóng)業(yè)、林業(yè)、生物醫(yī)藥、信息通訊等[5-9]眾多領(lǐng)域中有著重要應(yīng)用。李欣海[5]利用隨機(jī)森林對昆蟲種類進(jìn)行判別;陳華舟[6]將隨機(jī)森林回歸與基尼系數(shù)優(yōu)選變量方法結(jié)合,實現(xiàn)魚粉蛋白的定量分析預(yù)測;Milad Malekipi-rbazari[9]利用隨機(jī)森林模型進(jìn)行社交借貸風(fēng)險評估。而目前隨機(jī)森林算法在材料學(xué)科中的應(yīng)用研究還非常少見。

        文中借助于R語言平臺,利用randomForest[10](隨機(jī)森林)軟件包對不銹鋼的點蝕行為數(shù)據(jù)進(jìn)行隨機(jī)森林建模,通過模型參數(shù)選擇、優(yōu)化,實現(xiàn)模型訓(xùn)練、預(yù)測和評價過程。

        1 隨機(jī)森林模型

        點蝕電位屬于連續(xù)型變量,探究、預(yù)測其與焊接過程參數(shù)的關(guān)系屬于典型的回歸問題,可采用構(gòu)造以決策樹為基學(xué)習(xí)器的隨機(jī)森林回歸模型來分析和解決此問題。

        1.1 隨機(jī)森林訓(xùn)練

        隨機(jī)森林是一種集成學(xué)習(xí)算法,其采用自助抽樣法,構(gòu)造多棵決策樹組合{h(x,βk),k=1,2...r},x是輸入向量,βk是獨立同分布的隨機(jī)變量,r是決策樹的數(shù)量。隨機(jī)森林訓(xùn)練過程包括以下步驟:

        (1)采用隨機(jī)抽樣從原始數(shù)據(jù)中獲得訓(xùn)練數(shù)據(jù)樣本,并采用自助抽樣法(bootstrap)從訓(xùn)練集樣本中有放回抽樣得到r個不同的集合,分別作為r個決策樹的根節(jié)點樣本集合,每次抽樣剩余的數(shù)據(jù)作為袋外數(shù)據(jù),用于模型誤差的評估。

        (2)對于任意一棵決策樹,每次進(jìn)行節(jié)點裂時從所有的特征中隨機(jī)選取幾個特征進(jìn)行最優(yōu)變量分割,并讓決策樹最大限度地生長。

        (3)重復(fù)步驟(2),當(dāng)所有決策樹生長完畢,隨機(jī)森林訓(xùn)練也隨之完成。

        1.2 隨機(jī)森林預(yù)測

        隨機(jī)森林預(yù)測如圖1所示。

        (1)對一棵訓(xùn)練完成的決策樹,當(dāng)有樣本輸入時,相應(yīng)變量根據(jù)節(jié)點劃分從根節(jié)點沿著滿足條件的劃分路徑走到末節(jié)點,末節(jié)點預(yù)測變量均值即為該決策樹的預(yù)測結(jié)果。

        (2)對所有的決策樹重復(fù)上文中步驟(2),每棵決策樹都會給出變量的預(yù)測結(jié)果,將這些結(jié)果進(jìn)行等權(quán)重平均即可獲得最終的預(yù)測值。

        2 數(shù)據(jù)建模及評價方法

        文獻(xiàn)[10]中不銹鋼焊接參數(shù)如表1所示。自變量為焊接時間(wt)、焊接電流平方(wc2)和電極壓力(ef),E為點蝕電位。焊接過程是一個典型的非線性動力學(xué)過程,不同的參數(shù)組合產(chǎn)生不同的熱循環(huán),導(dǎo)致接頭組織也不盡相同,進(jìn)而影響接頭的點蝕行為。隨機(jī)森林適宜處理這類非線性作用過程的問題,在不顯著提高計算量的前提下,獲得比較理想的預(yù)測結(jié)果。

        基于以上分析,建立以焊接時間、焊接電流平方和電極壓力為輸入變量,以點蝕電位作為輸出變量的隨機(jī)森林模型。隨機(jī)抽取5/6的原始樣本數(shù)據(jù)作為訓(xùn)練集,剩余樣本數(shù)據(jù)作為測試集,實現(xiàn)模型參數(shù)的選擇、模型分析和評價。

        2.1 模型參數(shù)選擇

        根據(jù)隨機(jī)森林算法估計過程可知,隨機(jī)森林的主要參數(shù)有兩個:決策樹數(shù)目和節(jié)點備選變量個數(shù)。一般來說,決策樹數(shù)目不應(yīng)太少,否則會導(dǎo)致選取分割變量時,部分變量被選中次數(shù)過少,該因素對預(yù)測結(jié)果的貢獻(xiàn)不能充分體現(xiàn),導(dǎo)致預(yù)測結(jié)果發(fā)生較大偏差。節(jié)點備選變量個數(shù)則不應(yīng)超過自變量個數(shù)。兩個參數(shù)的確定方法如下:

        (1)根據(jù)訓(xùn)練集樣本進(jìn)行模型訓(xùn)練,獲得不同基學(xué)習(xí)器數(shù)目下訓(xùn)練集的均方誤差,均方誤差表征相對誤差波動程度大小,計算方法如式(1)所示,根據(jù)其結(jié)果選擇合適的決策樹數(shù)目。

        (2)針對訓(xùn)練集數(shù)據(jù),進(jìn)行“五折交叉驗證”獲得最佳的節(jié)點備選變量個數(shù)。即將數(shù)據(jù)隨機(jī)均勻地分為5份,每次利用任意4份作為訓(xùn)練子集樣本,剩余1份作為測試子集樣本。變化節(jié)點備選變量個數(shù),對模型進(jìn)行訓(xùn)練和預(yù)測,得到模型訓(xùn)練子集和測試子集的平均均方誤差大小,綜合分析訓(xùn)練子集和測試子集誤差結(jié)果,確定模型的節(jié)點備選變量個數(shù)。

        2.2 變量重要性評價

        使用精確度的平均減少(節(jié)點不純度)來定量評價變量的重要性。評價方法包括:

        (1)對訓(xùn)練好的隨機(jī)森林模型,獲得袋外數(shù)據(jù)預(yù)測結(jié)果的誤差大小error。

        (2)針對某一決策樹的訓(xùn)練數(shù)據(jù),為訓(xùn)練數(shù)據(jù)中某一變量i的變量值增加隨機(jī)擾動,得到新的預(yù)測結(jié)果誤差為error1,這棵決策樹的變量i的精確度平均減少大小為error1-error。

        (3)重復(fù)步驟(2),獲得所有決策樹的變量i的精確度平均減少值,取其平均值作為該變量在隨機(jī)森林模型中的精確度平均減少值。

        (4)重復(fù)步驟(2)、(3),獲得所有變量的精確度平均減少值大小。

        精確度平均減少數(shù)值越大,說明該變量添加隨機(jī)擾動時,其對預(yù)測結(jié)果影響越大,即該變量的重要性越高;反之,變量的重要性較低。

        2.3 模型結(jié)果評價

        在上述選取的參數(shù)條件下,對測試集數(shù)據(jù)進(jìn)行預(yù)測,獲得預(yù)測值與實際值的相對誤差大小,將結(jié)果與神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的預(yù)測結(jié)果進(jìn)行對比、分析和評價。

        3 結(jié)果分析及討論

        3.1 決策樹數(shù)目選擇

        決策樹數(shù)目在1~2 000范圍內(nèi)變化,獲得訓(xùn)練模型的均方誤差大小,結(jié)果如圖2所示。決策樹個數(shù)小于250時,誤差在局部范圍內(nèi)出現(xiàn)幾次較大波動,而后隨決策樹數(shù)目的增多,波動幅度逐漸減小。這主要是由于待分割的節(jié)點變量和訓(xùn)練樣本是隨機(jī)選取的,決策樹數(shù)目很少時,這兩方面的隨機(jī)性導(dǎo)致誤差出現(xiàn)較大波動;而隨著決策樹數(shù)目的增多,從總體來看分割變量的選擇是均勻的,各個變量對預(yù)測變量的影響能得到全面的體現(xiàn),波動幅度逐步降低。決策樹數(shù)目大于250時,模型均方誤差逐步減小,模型效果也越來越好,當(dāng)決策樹數(shù)目增大至1 000左右時,模型均方誤差趨于最小;繼續(xù)增大決策樹數(shù)目,模型均方誤差未得到更好的改善。因此,將決策樹數(shù)目確定為1 000即可。

        3.2 節(jié)點備選變量個數(shù)優(yōu)化

        利用訓(xùn)練集樣本對模型進(jìn)行訓(xùn)練,使用五折交叉驗證法得到訓(xùn)練子集和測試子集的平均均方誤差值,結(jié)果如圖3所示。訓(xùn)練子集和測試子集的平均均方誤差值均在5e-4以內(nèi)。說明真值與預(yù)測值間誤差的波動程度小,擬合優(yōu)度和推廣優(yōu)度均比較優(yōu)異。在相同條件下,訓(xùn)練子集的平均均方誤差均小于測試子集的平均均方誤差,擬合優(yōu)度結(jié)果優(yōu)于推廣優(yōu)度。分析均方誤差的變化規(guī)律可知:隨著節(jié)點備選變量個數(shù)增多,訓(xùn)練子集的平均均方誤差逐漸減小,變量個數(shù)為3時,平均均方誤差達(dá)到最小值;而測試子集的平均均方誤差先減小后增大,備選變量個數(shù)為2時誤差達(dá)到最小,這兩種條件下訓(xùn)練子集的平均均方誤差相差不大,應(yīng)優(yōu)先選擇測試子集均方誤差較小者,即確定節(jié)點備選變量個數(shù)為2。

        3.3 變量重要性分析

        各個變量精確度的平均減少結(jié)果如圖4所示,對點蝕電位影響最大的變量是焊接電流的平方值,其次是焊接時間,最小的是電極壓力。焊接電流變化時,通過焊接電流平方被放大,接頭熱輸入存在較大差異,造成接頭組織差異明顯,對點蝕行為產(chǎn)生較大影響,其重要性最高。同時,根據(jù)焦耳定律,焊接熱輸入變化對焊接電流的敏感度大于對焊接時間的敏感度,焊接時間對接頭點蝕行為的影響小于焊接電流平方的影響。電極壓力通過改變接觸電阻間接影響熱輸入量及接頭點蝕行為,但電極壓力僅有兩個獨立的取值,變量的隨機(jī)干擾對預(yù)測結(jié)果的影響小于前兩個因素帶來的影響,其精確度的平均減少最小,意味著該變量的重要性最低。

        3.4 模型預(yù)測結(jié)果及評價

        在備選節(jié)點變量個數(shù)為2、決策樹數(shù)目為1 000條件下,利用模型對測試集樣本數(shù)據(jù)進(jìn)行預(yù)測,點蝕電位預(yù)測結(jié)果(pre)和相對誤差大?。╮el_error)如表2所示。可以看出,29號樣本的預(yù)測相對誤差為-14.81%,略微偏高。除29號樣本外,預(yù)測值與真實值的相對誤差的絕對值均在10%以內(nèi),絕大多數(shù)點的預(yù)測誤差絕對值在5%以內(nèi)。分析訓(xùn)練數(shù)據(jù)的點蝕電位可知,訓(xùn)練集自變量和預(yù)測變量的數(shù)據(jù)變化均比較均勻,預(yù)測變量的點蝕電位值在0.381 87~0.485 47 V范圍內(nèi)波動,訓(xùn)練集數(shù)據(jù)經(jīng)模型訓(xùn)練后,對真實結(jié)果位于該范圍內(nèi)的樣本預(yù)測效果會比較優(yōu)良,而對于變量值偏離該范圍較大的樣本而言,相當(dāng)于“離群點”,隨機(jī)森林預(yù)測結(jié)果的相對誤差會有一定程度的提高。對多數(shù)預(yù)測樣本點而言,自變量與預(yù)測變量間的非線性特性關(guān)系已通過訓(xùn)練集獲得,且變量數(shù)值均處于變量均勻變化的范圍內(nèi),預(yù)測效果通常較好。而29號樣本點的點蝕電位數(shù)值為0.512 40 V,偏離訓(xùn)練集中的最大點蝕電位值0.485 47 V,兩值之間偏差較大,該預(yù)測樣本點可看成是“離群點”,預(yù)測效果不太理想。

        對比隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)及支持向量機(jī)預(yù)測結(jié)果誤差的絕對值,如圖5所示。3種方法對29號樣本的預(yù)測結(jié)果均不理想,是所有預(yù)測樣本結(jié)果中最差的。而對于其余樣本點,隨機(jī)森林的預(yù)測結(jié)果幾乎都優(yōu)于另外兩種方法。事實上,絕大多數(shù)方法均對“離群點”比較敏感。當(dāng)樣本中出現(xiàn)“離群點”時,首先應(yīng)從試驗過程中考慮該結(jié)果是否有效,試驗材料是否存在加工、組織缺陷,或是否有隨機(jī)因素對試驗結(jié)果產(chǎn)生影響等等。當(dāng)試驗結(jié)果準(zhǔn)確無誤時,需要探索更優(yōu)化的算法,以提高預(yù)測的準(zhǔn)確度。

        4 結(jié)論

        采用隨機(jī)森林模型,對不銹鋼點焊接頭的點蝕行為數(shù)據(jù)進(jìn)行建模,并選擇、分析及評價模型參數(shù),主要結(jié)論如下:

        (1)通過“五折交叉驗證”獲得訓(xùn)練子集和測試子集的平均均方誤差的變化規(guī)律,得到最佳節(jié)點備選變量個數(shù)為2。

        (2)利用精確度平均減少分析變量重要性,電流平方對點蝕電位的影響最大,其次是焊接時間,電極壓力影響最小。

        (3)對比隨機(jī)森林與神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)算法預(yù)測結(jié)果,29號“離群點”樣本預(yù)測結(jié)果都不理想;對剩余樣本而言,隨機(jī)森林的預(yù)測效果幾乎均優(yōu)于另外兩種方法,預(yù)測相對誤差絕對值均在10%以內(nèi),絕大多數(shù)樣本點預(yù)測誤差絕對值小于5%。

        參考文獻(xiàn):

        [1] Wei P S,Wu T H. Electrical contact resistance effect on resistance spot welding[J]. International Journal of Heat andMass Transfer, 2012(55): 3320-3323.

        [2] Florea R S,Bammann D J,Yeldell A,et al. Welding parameters influence on fatigue life and microstructure in resistance spot welding of 6061-T6 aluminum alloy[J]. Materials & Design,2013,(45):460-462.

        [3] Aslanlar S,Ogur A,Ozsarac U,et al. Welding time effect on mechanical properties of automotive sheets in electrical resistance spot welding[J]. Materials & Design,2008,29(7):1430.

        [4] Breiman L. Random Forests[J].Machine Learning,2001,45(1):5-32.

        [5] 李欣海. 隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J].應(yīng)用昆蟲學(xué)報, 2013,50 (4):1195.

        [6] 陳華舟,陳福,石凱,等. 基于隨機(jī)森林的魚粉蛋白近紅外分析[J]. 農(nóng)業(yè)機(jī)械學(xué)報,2015,46(5):233-238.

        [7] 趙小歡,夏靖波,李明輝. 基于隨機(jī)森林算法的網(wǎng)絡(luò)流量分類方法[J]. 中國電子科學(xué)研究院學(xué)報,2013,8(2):185-189.

        [8] 張華偉,王明文,甘麗新. 基于隨機(jī)森林的文本分類模型研究[J]. 山東大學(xué)學(xué)報(理學(xué)版),2006,41(3):139-143.

        [9] Malekipirbazari M,Aksakalli V. Risk assessment in social lending via random forests[J]. Expert Systems with Applications, 2015(42):4624-4628.

        [10] Martín ó,Tiedra P D,López M. Artifical neural networks for pitting potential prediction of resistance spot welding joints of AISI 304 austenitic stainless steel[J]. Corrosion Science,2010,(52):2400-2401.

        [11] 吳喜之. 復(fù)雜數(shù)據(jù)統(tǒng)計方法-基于R的應(yīng)用(第二版)[M]. 北京:中國人民出版社,2013:37-40.

        [12] 曹正鳳. 隨機(jī)森林算法優(yōu)化研究[D]. ?北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2014:67-71.

        猜你喜歡
        隨機(jī)森林非線性
        隨機(jī)森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
        基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
        軟件(2016年7期)2017-02-07 15:54:01
        拱壩變形監(jiān)測預(yù)報的隨機(jī)森林模型及應(yīng)用
        電子節(jié)氣門非線性控制策略
        汽車科技(2016年5期)2016-11-14 08:03:52
        基于SolidWorksSimulation的O型圈錐面密封非線性分析
        科技視界(2016年23期)2016-11-04 08:14:28
        基于隨機(jī)森林算法的飛機(jī)發(fā)動機(jī)故障診斷方法的研究
        通貨膨脹率周期波動與非線性動態(tài)調(diào)整的研究
        四輪獨立驅(qū)動電動汽車行駛狀態(tài)估計
        工業(yè)機(jī)器人鋁合金大活塞鑄造系統(tǒng)設(shè)計與研究
        科技視界(2016年24期)2016-10-11 12:53:13
        我國金融發(fā)展與居民收入差距非線性關(guān)系研究
        中國市場(2016年29期)2016-07-19 04:01:57
        一本久道久久综合婷婷五月| www夜插内射视频网站| 乱子伦一区二区三区| 每天更新的免费av片在线观看| 亚洲AV秘 无码一区二区三| 成人全部免费的a毛片在线看| 狠狠色狠狠色综合网| 九九99久久精品国产| 一区五码在线| 久久国产精品亚洲我射av大全| 黑人大群体交免费视频| 婷婷午夜天| 亚洲人成网站久久久综合| 人妻少妇偷人精品视频| 亚洲人成网线在线播放va蜜芽| 国产亚洲av手机在线观看| 人人妻人人澡av| 给我看免费播放的视频在线观看| 帮老师解开蕾丝奶罩吸乳网站| 色婷婷七月| 精品女同一区二区三区在线播放器| 99久久婷婷国产亚洲终合精品| 免费看黄色电影| 亚洲精品aⅴ无码精品丝袜足| 久久久亚洲成年中文字幕| 精品国产精品国产偷麻豆| 亚洲AV无码一区二区三区日日强| 亚洲综合原千岁中文字幕| 亚洲人不卡另类日韩精品| 久久和欧洲码一码二码三码| 久久久久久久一线毛片| 亚洲中文中文字幕乱码| 中文字幕日韩三级片| 成人午夜毛片| 蜜桃色av一区二区三区麻豆| 欧美性猛交99久久久久99按摩 | 美女视频永久黄网站免费观看国产| 国产精品成人自拍在线观看| 最新亚洲人成网站在线观看| 亚洲AV无码乱码1区久久| 99视频一区二区日本|