亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Stacking的鋼板表面顏色預(yù)測

        2020-09-15 16:30:34劉媛媛趙希慶
        計算機時代 2020年8期
        關(guān)鍵詞:集成學(xué)習(xí)分類

        劉媛媛 趙希慶

        摘要:鋼板表面顏色是判定鋼板表面耐蝕性能的重要指標(biāo),提前預(yù)測鋼板表面顏色可以為控制鋼板表面耐蝕性能提供指導(dǎo)。針對單一模型預(yù)測精度較低的情況,提出一種基于Stacking的組合模型。該模型采用兩層模式,第一層使用支持向量機、隨機森林、GBDT等七個個體學(xué)習(xí)器作為初級學(xué)習(xí)器,第二層使用XGBoost作為次級學(xué)習(xí)器。使用該方法對鋼板表面顏色進行預(yù)測,結(jié)果表明,基于Stacking的組合模型與單一模型相比,在多個性能指標(biāo)上取得了明顯的提升。

        關(guān)鍵詞:鋼板表面顏色;分類;集成學(xué)習(xí);Stacking方法

        中圖分類號:TP181 文獻標(biāo)識碼:A 文章編號:1006-8228(2020)08-65-04

        0 引言

        鋼板表面顏色是判定鋼板表面耐蝕性能一種重要指標(biāo),普通熱軋鋼板最常見的顏色有紅褐色和青黑色兩種,顏色的不同對鋼板耐銹蝕能力有很大影響,紅褐色主要是結(jié)構(gòu)疏松的Fe2O3,容易吸收水分和鹽分加速銹蝕,而青黑色主要是結(jié)構(gòu)致密的Fe3O4,可以有效延緩鋼板的銹蝕,對于鋼板下線后的保存、運輸、加工和使用等過程比較有利[1-2],因此生產(chǎn)中更希望獲得青黑色的表面,避免紅褐色的表面。在這種情況下,如果能提前預(yù)測鋼板顏色,將能夠為鋼板工藝參數(shù)的調(diào)整提供指導(dǎo),達到獲得青黑色表面的目的。機器學(xué)習(xí)為分類預(yù)測提供了大量的模型,本文嘗試了一系列單一模型后,發(fā)現(xiàn)效果并不理想,在此基礎(chǔ)上,提出了一種基于Stacking的鋼板表面顏色分類算法,以兩層堆疊的方式組合多種分類模型,借助多種模型的優(yōu)勢進一步提高預(yù)測精度,并使用交叉驗證防止過擬合,以達到更好的預(yù)測效果[3-5]。

        1 stacking算法原理

        集成學(xué)習(xí)通過構(gòu)建和結(jié)合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù),通常采用一定的策略將多個弱學(xué)習(xí)器組合到一起,從而獲得比單一學(xué)習(xí)器更好的性能和泛化能力。集成學(xué)習(xí)的常用算法有bagging,boosting和stacking等。本文在模型的集成算法選擇上,選取了stacking算法,這種算法通常用于異質(zhì)集成。Stacking算法是由Wolpert[6]于1992年提出的,也稱之為stacked generalization,是一種用于異質(zhì)模型的組合策略。Stacking算法通常采用兩層結(jié)構(gòu),本文使用周志華n,在《機器學(xué)習(xí)》中的叫法,將第一層學(xué)習(xí)器稱為初級學(xué)習(xí)器,將第二層學(xué)習(xí)器稱為次級學(xué)習(xí)器。首先,第一層訓(xùn)練出多個不同的初級學(xué)習(xí)器,然后,將初級學(xué)習(xí)器的預(yù)測結(jié)果作為次級學(xué)習(xí)器的輸入特征,并在此基礎(chǔ)上進行訓(xùn)練。在這個過程中,為了防止過擬合現(xiàn)象,通常采用K折交叉驗證的方法,這里以五折交叉驗證為例,介紹stacking的基本步驟[8-10]。

        (1)首先將原始樣本分為訓(xùn)練集train和測試集test。

        (2)假設(shè)我們有n個初級學(xué)習(xí)器,對任一個初級學(xué)習(xí)器Ci在訓(xùn)練集train上進行訓(xùn)練,訓(xùn)練集采用五折交叉驗證,每次選擇其中四份進行訓(xùn)練,在第五份上進行預(yù)測,并得到預(yù)測結(jié)果Ai。同時,將訓(xùn)練得到的模型在測試集上進行測試,得到結(jié)果E。這一輪n個初級學(xué)習(xí)器訓(xùn)練完,將得到n個預(yù)測結(jié)果和n個測試結(jié)果。

        (3)把n個預(yù)測結(jié)果合并成新的訓(xùn)練集train2,把n個測試結(jié)果合并成新的測試集test2。

        (4)在新的訓(xùn)練集train2上訓(xùn)練次級學(xué)習(xí)器,并將預(yù)測結(jié)果在測試集test2上進行驗證,測試模型的性能。

        2 stacking模型構(gòu)建

        2.1數(shù)據(jù)標(biāo)準(zhǔn)化

        本文所選用的數(shù)據(jù)由于具有不同的量綱和量綱單位,在計算過程中會導(dǎo)致模型精度下降,為了避免數(shù)據(jù)之間的量綱影響,需要在訓(xùn)練前對自變量做標(biāo)準(zhǔn)化處理。本文選用Z-score標(biāo)準(zhǔn)化方法,其公式如下所示:其中,x*為標(biāo)準(zhǔn)化后的自變量,x.為標(biāo)準(zhǔn)化前的自變量,μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。

        2.2 stacking模型構(gòu)建

        本文模型使用stacking的方式,建立兩層架構(gòu),第一層組合不同的初級學(xué)習(xí)器,包括邏輯回歸(IR)、K近鄰(KNN)、支持向量機(SVM)、決策樹(DecisionTree)、隨機森林(RandomForest)、AdaBoost、GBDT七個基學(xué)習(xí)器,第二層使用XGBoost作為次級學(xué)習(xí)器,使用第一層預(yù)測的結(jié)果作為特征并對最終的結(jié)果進行預(yù)測,模型構(gòu)建過程中,為了減少過擬合,使用了五折交叉驗證,模型的總體架構(gòu)如圖1所示。

        將數(shù)據(jù)集按照7:3的比例劃分為訓(xùn)練集和測試集,按照圖1的框架,構(gòu)建七個不同的初級學(xué)習(xí)器,對每一個初級學(xué)習(xí)器使用五折交叉驗證,其中四份用于訓(xùn)練,剩余的一份用于預(yù)測,五次計算完畢后,根據(jù)索引重新聚合預(yù)測結(jié)果,得到與原訓(xùn)練集相同樣本數(shù)的新訓(xùn)練集,即為次級學(xué)習(xí)器的新訓(xùn)練集;而原始數(shù)據(jù)集的測試集,在每次初級學(xué)習(xí)器完成訓(xùn)練后都需要在該測試集上進行測試,由于使用五折交叉驗證,每個初級學(xué)習(xí)器完成訓(xùn)練都會進行五次預(yù)測,將這五次預(yù)測的結(jié)果進行平均,就得到了與原測試集相同樣本數(shù)的新測試集,即為次級學(xué)習(xí)器的新測試集。完成第一層建模后,第二層使用XGBoost模型,在上一層生成的新訓(xùn)練集上進行訓(xùn)練,并在新測試集上測試,以得到組合模型的性能參數(shù)。

        3 基于stacking的鋼板顏色預(yù)測

        本文使用數(shù)據(jù)集為鋼廠的真實數(shù)據(jù)集,該數(shù)據(jù)集共647條數(shù)據(jù),包含了20個與鋼板表面顏色相關(guān)的工藝參數(shù),如待溫厚度比,軋制道次數(shù),在爐時間,二階段溫度,終軋溫度,返紅溫度,軋制方式等,預(yù)測的目標(biāo)顏色為青黑色和紅褐色,為典型的分類問題。本文使用python語言進行數(shù)據(jù)處理、模型搭建及模型評估。

        3.1 模型評價指標(biāo)

        本文使用準(zhǔn)確率(Accuracy),精確率(Precision)、召回率(RecaI)及Fl值來衡量模型的性能。其中,TP為青黑色樣本分類正確的數(shù)量,TN為紅褐色樣本分類正確的數(shù)量,F(xiàn)N為青黑色樣本分類錯誤的數(shù)量,F(xiàn)P為紅褐色樣本分類錯誤的數(shù)量。則準(zhǔn)確率公式描述為:

        3.2 單一模型和stacking組合模型性能比較

        本文的Stacking模型使用了兩層的架構(gòu),其中,初級學(xué)習(xí)器使用了lr、KNN、SVM、DecisionTree、Ran-domForest、AdaBoost、GBDT,次級學(xué)習(xí)器使用了XG-Boost。下面將單一模型和組合模型就準(zhǔn)確率、精確率、召回率和Fl值四種指標(biāo)進行了對比,結(jié)果如表l和圖2所示。

        從表l和圖2可以看到,單一模型分類準(zhǔn)確率大部分在70%-80%.Fl值也集中在0.7-0.8,模型精度比較低,無法滿足模型在實際生產(chǎn)中應(yīng)用的需求。使用Stacking的方法進行模型集成后,各項指標(biāo)較單一模型均有了一定程度的提升,主要的判定標(biāo)準(zhǔn)準(zhǔn)確率和Fl值分別提高到了89.15%和0.8919,模型精度提高明顯??梢钥吹?,對于鋼板表面顏色分類模型,基于Stacking的集成模型達到了更好的模型性能,為模型在實際生產(chǎn)中的應(yīng)用打下了良好的基礎(chǔ)。

        4 結(jié)束語

        本文研究了鋼板表面顏色預(yù)測的問題,針對普通分類模型精度較低的情況,提出了一種基于Stacking的鋼板表面顏色分類算法,以兩層堆疊的方式組合多種分類模型,借助多種模型的優(yōu)勢進一步提高預(yù)測精度,并使用五折交叉驗證防止過擬合。使用python進行數(shù)據(jù)處理及建模分析后,發(fā)現(xiàn)stacking組合模型相較于單一分類模型在準(zhǔn)確率、Fl值等重要指標(biāo)上都取得了明顯的提升。但由于樣本數(shù)量偏少,模型的精度還有待提高,后續(xù)工作將增加樣本及特征數(shù)量,進一步優(yōu)化模型,提高模型的各項性能。

        參考文獻(References):

        [1]劉振宇,于洋,郭曉波,關(guān)菊,王國棟.板帶熱連軋中氧化鐵皮的控制技術(shù)[J].軋鋼,2009.26(1):5-9

        [2]王健.熱軋鋼板表面紅色氧化鐵皮缺陷成因分析[J].河南冶金,2017.25(4):22-23

        [3]盧光躍,閏真光,呂少卿,吳洋.基于混合采樣和Stacking集成的電信用戶網(wǎng)別預(yù)測[J].西安郵電大學(xué)學(xué)報,2019.24(4):1-5

        [4]李強,翟亮.基于Stacking算法的員工離職預(yù)測分析與研究[J].重慶工商大學(xué)學(xué)報:自然科學(xué)版,2019.36(1):117-123

        [5]梁超.基于Stacking模型融合的工程機械核心部件壽命預(yù)測研究[J].毅件工程,2019.22(12):1-4

        [6]Wolpert D H. Stacked generaliation[J]. Neural Networks,1992.5(2):241-259

        [7]周志華.機器學(xué)習(xí)[M].清華大學(xué)出版社,2016.

        [8]羅智青,莫漢培,王汝輝,胡順東,方紹懷,陳世濤.基于Stacking模型融合的失壓故障識別算法[J].能源與環(huán)保,2019.41(2):41-45

        [9]樸楊鶴然,任俊玲.基于Stacking的惡意網(wǎng)頁集成檢測方法[J].計算機應(yīng)用,2019.39:1018-1088

        [10]董克源,徐建.基于Stacking的Android惡意檢測方法研究[J]計算機與數(shù)字工程,2019.47(5):1184-1188

        *基金項目:運城學(xué)院博士科研啟動項目(YQ-2019003)

        作者簡介:劉媛媛(1985-),女,河北保定人,碩士,工程師/助教,主要研究方向:機器學(xué)習(xí)。

        猜你喜歡
        集成學(xué)習(xí)分類
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        基于局部有效性的選擇性決策樹集成
        基于集成學(xué)習(xí)的高送轉(zhuǎn)股票研究
        時代金融(2016年36期)2017-03-31 05:44:10
        基于稀疏編碼器與集成學(xué)習(xí)的文本分類
        基于屬性權(quán)重的Bagging回歸算法研究
        基于改進的LogitBoost算法的垃圾網(wǎng)頁檢測研究
        科技視界(2015年27期)2015-10-08 11:01:28
        美女把尿囗扒开让男人添| 日韩日本国产一区二区| 日本av不卡一区二区三区| 精品国产亚洲亚洲国产| 欧美熟妇性xxx交潮喷| 久久久久亚洲av无码专区体验| 国产在线拍偷自拍偷精品| 精品国产乱码久久免费看| 亚洲AV激情一区二区二三区| 久久久久久一本大道无码| 日韩av天堂综合网久久| 高级会所技师自拍视频在线| 怡红院av一区二区三区| 伊人色综合九久久天天蜜桃| 国内精品91久久久久| 色婷婷久久综合中文久久一本| 国产成人精品一区二区20p| 免费看av在线网站网址| 亚洲国产美女精品久久久久| 波多吉野一区二区三区av| 中文字幕成人精品久久不卡91| 日本不卡高字幕在线2019| 大又大粗又爽又黄少妇毛片| 国产美女在线精品亚洲二区| 国产精品午夜波多野结衣性色| 日韩人妻有码中文字幕| 日本成人精品在线播放| 放荡的少妇2欧美版| 男人边吻奶边挵进去视频| 亚洲日本国产乱码va在线观看 | 东京热东京道日韩av| 2020国产在视频线自在拍| 国产白嫩护士被弄高潮| 国产欧美日韩网站| 亚洲一区二区三区久久久| 国产麻豆久久av入口| 亚洲伊人一本大道中文字幕| 伊人网综合| 国产精品av网站在线| 一本色道久久88加勒比一| 无码精品久久久久久人妻中字|