亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于決策樹和模型樹的作業(yè)工時(shí)估計(jì)方法

        2018-03-19 03:34:59李奇倚
        關(guān)鍵詞:工時(shí)決策樹預(yù)估

        李奇倚,王 磊

        (上海交通大學(xué) 工業(yè)工程系,上海 200240)

        0 引言

        流程工業(yè)包括化工、煉油、冶金和制藥等行業(yè),具有較高的自動(dòng)化程度,并且隨著計(jì)算機(jī)技術(shù)、傳感器技術(shù)和通信技術(shù)的發(fā)展,流程工業(yè)在生產(chǎn)過程中積累了大量的數(shù)據(jù),這些數(shù)據(jù)中隱含著大量的有用信息,然而由于缺少有效的分析工具和高效的計(jì)算技術(shù)提取有用信息,其數(shù)據(jù)的價(jià)值未被充分利用[1-2]。目前采取的手段是將數(shù)據(jù)壓縮,將短時(shí)間段的數(shù)據(jù)存檔,僅在特殊運(yùn)行狀況下進(jìn)行數(shù)據(jù)恢復(fù)與分析[3]。近年來一些相關(guān)研究,如基于數(shù)據(jù)的調(diào)度模型[4-5]和基于數(shù)據(jù)的關(guān)鍵參數(shù)預(yù)測方法[6-8]等,證明了從底層數(shù)據(jù)中挖掘相關(guān)的信息和知識(shí)并應(yīng)用于生產(chǎn)決策,可減少?zèng)Q策的不確定性,實(shí)現(xiàn)快速分析并減少錯(cuò)誤決策的次數(shù)[9]。在制造生產(chǎn)中,工時(shí)參數(shù)是進(jìn)行生產(chǎn)計(jì)劃和生產(chǎn)調(diào)度的重要依據(jù)[6],被用來確定作業(yè)任務(wù)量和各個(gè)任務(wù)的作業(yè)時(shí)間區(qū)間,是計(jì)劃生產(chǎn)中的關(guān)鍵參數(shù)。目前企業(yè)主要采用人工粗略估計(jì)的方式制定工時(shí),存在費(fèi)時(shí)和準(zhǔn)確率低等問題,而基于不準(zhǔn)確的工時(shí)參數(shù)估計(jì)生產(chǎn)任務(wù)量和作業(yè)時(shí)間等,會(huì)使計(jì)劃與實(shí)際生產(chǎn)有較大偏差,易導(dǎo)致執(zhí)行脫節(jié)[10-11]。基于底層數(shù)據(jù)的關(guān)鍵參數(shù)預(yù)測方法是解決該問題的有效手段,因此本文研究基于歷史生產(chǎn)數(shù)據(jù)預(yù)估工時(shí)參數(shù)的方法具有實(shí)際意義。

        近年來,有關(guān)工時(shí)預(yù)測問題國內(nèi)外有較多的研究成果:文獻(xiàn)[12]采用程序仿真法預(yù)測數(shù)控加工時(shí)間;文獻(xiàn)[1,7,13]針對船舶裝配工時(shí)與航空零件機(jī)械加工工時(shí)預(yù)估問題,采用反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPNN)方法,即根據(jù)零部件的特征,對相似的零部件分別建立神經(jīng)網(wǎng)絡(luò)工時(shí)預(yù)估模型;文獻(xiàn)[14]針對多工位和多夾具加工中心的工時(shí)預(yù)估問題,采用BPNN方法預(yù)測加工工時(shí);文獻(xiàn)[8]針對BPNN方法預(yù)估精度低的問題,利用基于遺傳算法優(yōu)化的BPNN方法解決化工設(shè)備設(shè)計(jì)工時(shí)定量預(yù)測問題,并與BPNN及支持向量回歸進(jìn)行了預(yù)測效果對比;文獻(xiàn)[15]針對船舶生產(chǎn)流程中的工時(shí)預(yù)估問題,利用分類與回歸樹(Classification and Regression Tree, CART)方法建立工時(shí)預(yù)估模型,獲得了較好的效果;文獻(xiàn)[16]采用CART算法解決制造企業(yè)提前期預(yù)估問題。然而,大多數(shù)研究面向的領(lǐng)域是離散制造業(yè),流程工業(yè)因?yàn)榫哂猩a(chǎn)連續(xù)性的特點(diǎn),原料和成品多為液體或氣體,其加工時(shí)間與生產(chǎn)批量之間并非簡單的線性關(guān)系,而且加工時(shí)間還受產(chǎn)品種類、加工者技能熟練程度和作業(yè)環(huán)境等多種因素影響,所以當(dāng)前常用的工時(shí)預(yù)估方法不適用于流程工業(yè)中的工時(shí)預(yù)估問題。

        為實(shí)現(xiàn)流程工業(yè)中生產(chǎn)工時(shí)的預(yù)測,本文在調(diào)研潤滑油企業(yè)的基礎(chǔ)上,首先分析了生產(chǎn)任務(wù)分派過程和生產(chǎn)數(shù)據(jù)的特點(diǎn),然后針對多品種小批量生產(chǎn)模式且工時(shí)受多種因素影響的特點(diǎn),提出基于決策樹[17]和模型樹[18]構(gòu)建工時(shí)預(yù)估模型的方法。

        1 問題描述

        因潤滑油煉制行業(yè)具備流程工業(yè)的典型特征,故分析了潤滑油企業(yè)的生產(chǎn)過程和歷史數(shù)據(jù)的特征,并依此提出需要解決的工時(shí)預(yù)估問題。

        1.1 任務(wù)分派中的工時(shí)參數(shù)

        潤滑油煉制是將按比例調(diào)配好的基礎(chǔ)油及催化劑混合在反應(yīng)釜中進(jìn)行物化反應(yīng)的過程,生產(chǎn)過程受操作員熟練程度、天氣因素和工藝條件等多因素的影響。

        圖1所示為任務(wù)分派過程,用于解決各生產(chǎn)任務(wù)在何時(shí)由何種設(shè)備、何人操作的問題,其輸出結(jié)果為短期計(jì)劃。在該過程中,工時(shí)參數(shù)用于計(jì)算生產(chǎn)負(fù)荷,選派合適的設(shè)備、人資源,最終確定各個(gè)任務(wù)的作業(yè)時(shí)間區(qū)間。計(jì)劃員根據(jù)歷史生產(chǎn)數(shù)據(jù)和自身經(jīng)驗(yàn)制定各產(chǎn)品經(jīng)濟(jì)生產(chǎn)批量(Economic Production Quantity, EPQ)下的標(biāo)準(zhǔn)加工時(shí)間(Standard Operation Time, SOT),作為各產(chǎn)品加工工時(shí)的標(biāo)準(zhǔn)。在實(shí)際生產(chǎn)中,少數(shù)產(chǎn)品因批量改變而人工調(diào)整煉制時(shí)間,其余任務(wù)都以SOT作為煉制時(shí)間預(yù)估值,而這些生產(chǎn)任務(wù)中大部分任務(wù)的生產(chǎn)批量與EPQ相異,即使某產(chǎn)品以EPQ生產(chǎn),其實(shí)際煉制時(shí)間也因生產(chǎn)設(shè)備、操作員技能和操作員操作習(xí)慣的不同而與SOT相異。因此,當(dāng)前問題是如何基于現(xiàn)有數(shù)據(jù),提供使預(yù)估工時(shí)能更準(zhǔn)確地估算實(shí)際任務(wù)量的方法。

        1.2 數(shù)據(jù)描述

        由數(shù)據(jù)庫中獲取的生產(chǎn)數(shù)據(jù)記錄包含6個(gè)屬性維度,分別為:產(chǎn)品編號(hào)(Product No,標(biāo)稱屬性)、操作者(Operator,標(biāo)稱屬性)、生產(chǎn)批量(Batch,離散數(shù)值屬性)、反應(yīng)釜(Kettle,標(biāo)稱屬性)、日期(Date,數(shù)值屬性)、煉制時(shí)間(Time,數(shù)值屬性)。

        原始數(shù)據(jù)中存在噪聲數(shù)據(jù)和不一致數(shù)據(jù)。噪聲最終會(huì)導(dǎo)致模型出現(xiàn)偏差,因此在建模前有必要處理掉噪聲數(shù)據(jù),本文在2.3節(jié)利用離群點(diǎn)分析的方法解決該問題;不一致表現(xiàn)為數(shù)據(jù)記錄中的格式不統(tǒng)一,數(shù)據(jù)經(jīng)一致化處理后,如表1所示。

        表1 預(yù)處理后的數(shù)據(jù)示意

        1.3 問題定義

        目前需要解決的問題是基于歷史數(shù)據(jù)對煉制時(shí)間給出更為精確的估計(jì)。煉制時(shí)間的直接影響因素有產(chǎn)品種類、生產(chǎn)批量、生產(chǎn)設(shè)備、操作者,間接影響因素為日期。因技術(shù)提高、工藝改進(jìn)和環(huán)境溫濕度變化等潛在因素的影響,煉制時(shí)間隨著日期的變化呈增長或下降的趨勢。

        問題的特點(diǎn)有:①產(chǎn)品種類多,不同產(chǎn)品之間存在不同的工時(shí)映射關(guān)系,而且各產(chǎn)品的歷史記錄數(shù)不均衡(如圖2);②數(shù)據(jù)集采用混合類型屬性描述,輸入變量包括標(biāo)稱和數(shù)值屬性,預(yù)測變量為數(shù)值屬性;③產(chǎn)品煉制時(shí)間與生產(chǎn)批量和生產(chǎn)日期之間存在復(fù)雜的映射關(guān)系,如分段線性關(guān)系或不存在顯著的線性關(guān)系。

        記煉制工時(shí)為Rt,其與影響因素的關(guān)系表示為

        Rt=f(Sc(A1,A2,…,Ai),Sn(Ai+1,…,Ak))

        =f(A1,A2,…,Ai,…,Ak)。

        (1)

        式中:Sc表示標(biāo)稱型影響因素的集合,Sn表示數(shù)值型影響因素的集合。

        研究中,求解模型f的難點(diǎn)在于:①因?yàn)楫a(chǎn)品種類多,且各產(chǎn)品歷史記錄數(shù)不均衡(如圖2),所以人工神經(jīng)網(wǎng)絡(luò)方法、多元回歸法難以適用;②數(shù)據(jù)集由混合類型屬性描述,因?yàn)镃ART方法使用前需將標(biāo)稱型數(shù)據(jù)轉(zhuǎn)換為二值型數(shù)據(jù),所以無法直接用于解決本問題;③模型f是由多個(gè)線性組合構(gòu)成的映射關(guān)系,因其值域非連續(xù)的特性而難以直接進(jìn)行線性擬合;④如何針對各產(chǎn)品建立自身的子模型。在本文背景中,因某些產(chǎn)品的煉制時(shí)間與生產(chǎn)批量和生產(chǎn)日期之間并不存在顯著的線性關(guān)系,若不加處理地將不顯著的解釋變量加入線性模型,則會(huì)導(dǎo)致預(yù)測偏差。

        在實(shí)際問題中需求出兩種工時(shí)(如表2),分別記為Rt1和Rt2:

        Rt1=f1(p,m,b,d);

        (2)

        Rt2=f2(p,m,o,b,d)。

        (3)

        式中p,m,o,b,d分別為產(chǎn)品種類、作業(yè)設(shè)備、操作員、生產(chǎn)批量和生產(chǎn)日期。

        表2 兩種工時(shí)及考慮因素

        3 工時(shí)估算方法

        因?yàn)闈櫥彤a(chǎn)品品種多,生產(chǎn)工時(shí)受生產(chǎn)批量、機(jī)器、操作員等多種因素影響,不同種類產(chǎn)品存在不同的工時(shí)映射關(guān)系,所以本文的處理思想為利用眾多局部逼近的組合隱含地表示全局目標(biāo)函數(shù),即首先用決策樹構(gòu)建出各產(chǎn)品所有操作狀態(tài)的組合,然后用模型樹法對各組合依次建立工時(shí)映射關(guān)系。

        工時(shí)預(yù)估包括模型訓(xùn)練和模型預(yù)測兩個(gè)階段,如圖3所示。

        2.1 決策樹和模型樹

        決策樹學(xué)習(xí)采用自頂向下的遞歸方式構(gòu)造決策樹,以實(shí)例為依據(jù),從一組無序、無規(guī)則的實(shí)例數(shù)據(jù)中推理出用于決策樹形成的分類規(guī)則,并根據(jù)分類結(jié)果進(jìn)行預(yù)測[17]。特征選擇是構(gòu)建決策樹的關(guān)鍵步驟,目前的特征選擇方法有窮舉法、啟發(fā)式方法和隨機(jī)法。在使用決策樹模型對樣本進(jìn)行分類時(shí),從根節(jié)點(diǎn)開始逐步對該樣本的屬性進(jìn)行測試,并沿相應(yīng)的分枝向下行走,直至到達(dá)某個(gè)葉節(jié)點(diǎn),此時(shí)葉節(jié)點(diǎn)所代表的類型即為該樣本的類型[19]。

        模型樹是經(jīng)典CART算法的變體,其訓(xùn)練集需由連續(xù)型屬性或連續(xù)型及二值型屬性描述,用于預(yù)測連續(xù)型的目標(biāo)變量。針對CART方法,將葉節(jié)點(diǎn)設(shè)定為常數(shù)值的問題,模型樹在葉節(jié)點(diǎn)處給出某個(gè)線性模型,其優(yōu)勢是通過自動(dòng)優(yōu)選分段數(shù)來擬合非連續(xù)、分段線性等問題[20]。模型樹算法自提出以來,在眾多數(shù)值型變量預(yù)測問題中證明了其有理想的預(yù)測性能,如基于高光譜遙感預(yù)測地表生物物理化學(xué)參量問題[21]、汽輪機(jī)汽耗性預(yù)測[22]、有效浪高預(yù)測[23-24]、河流污染物縱向分散系數(shù)預(yù)測[25]、閘下沖刷預(yù)測[26]和洪澇災(zāi)害預(yù)測[27]等。

        2.2 模型框架

        本文采用決策樹和模型樹相結(jié)合的方法,解決問題的思路是將數(shù)據(jù)集中的類別型變量和數(shù)值型變量分開處理。處理類別型變量問題是一個(gè)分類問題,可用決策樹方法給出每類的數(shù)據(jù)集,然后對各類數(shù)據(jù)集基于模型樹法分別給出各類的工時(shí)映射關(guān)系,最終整個(gè)樹結(jié)構(gòu)就是整體的工時(shí)映射關(guān)系,如圖4所示。大致過程為:對于混合屬性描述的數(shù)據(jù)集,首先對標(biāo)稱屬性用窮舉法構(gòu)建部分樹,然后在各分枝上對數(shù)值屬性用模型樹法構(gòu)建子樹,在葉節(jié)點(diǎn)處給出線性模型,使該樹模型能夠用混合屬性的數(shù)據(jù)預(yù)測數(shù)值型的工時(shí)參數(shù)。

        樹結(jié)構(gòu)構(gòu)建分為決策樹建樹和模型樹建樹兩個(gè)階段。圖4中用A1~A5依次表示屬性p,m,o,b和d。

        2.3 訓(xùn)練算法

        獲得模型f的關(guān)鍵在于模型訓(xùn)練方法,圖5所示為訓(xùn)練算法流程,分為決策樹建樹階段(步驟7~8)、回溯操作階段(步驟10~12)、模型樹建樹階段(步驟13)和訓(xùn)練參數(shù)選取階段(步驟3~4,步驟14~16)4個(gè)階段。在訓(xùn)練過程中,只有決策樹法和模型樹法用于構(gòu)建樹結(jié)構(gòu)模型,回溯操作階段和訓(xùn)練參數(shù)選取階段用來提升模型的預(yù)測精度、提高模型泛化性。

        算法中的相關(guān)符號(hào)說明如下:N為樣本量,?為回溯閾值,θ為切分最少樣本數(shù),γ為使用盒圖法最少樣本數(shù),Bl為內(nèi)限范圍系數(shù),Pis為原始數(shù)據(jù)集用決策樹法劃分后所得的所有無節(jié)點(diǎn)分枝的集合。

        主算法如下:

        主算法:main_algorithm。

        輸入:數(shù)據(jù)集Dt。

        輸出:樹結(jié)構(gòu)模型。

        (1)初始化模型訓(xùn)練參數(shù)N,?,θ,γ和Bl,各自取其最小值。

        (2)while訓(xùn)練參數(shù)組未遍歷完解空間{//遍歷所有可選參數(shù)值組合

        (3)將訓(xùn)練集分成10折,記為FD={Fd1,Fd2,…,Fd10}

        (4)for FD中第i折{

        (5)train_set={Fd1,…,Fdi-1}∪{Fdi+1,…,Fd10}

        (6)test_set={Fdi}

        (7)for 屬性Aj在序列(A1,A2,A3)中{

        (8)用Aj建立節(jié)點(diǎn),并用Aj在train_set所有可能的取值建立分枝}

        (9)for 集合Pis中分枝pik{

        (10)while pik對應(yīng)數(shù)據(jù)集Dik的樣本量

        (11)回溯操作,并用所處節(jié)點(diǎn)的數(shù)據(jù)集對Dik進(jìn)行更新

        (12)if Dik樣本量

        (13)else{子樹sub_tree=model_tree(Dik,θ,γ,Bl);在分枝pik下添加子樹sub_tree}

        (14)計(jì)算模型在第i折上的擬合優(yōu)度(R2)}//R2計(jì)算方法參照式(6)

        (15)將10次結(jié)果(R2)的均值作為本次訓(xùn)練效果指標(biāo)并記錄}

        (17)用得出的較優(yōu)訓(xùn)練參數(shù)組訓(xùn)練模型。

        在主算法中,為解決在不同屬性描述的數(shù)據(jù)集上建立模型的問題,采用先對標(biāo)稱屬性(A1,A2和A3)基于決策樹實(shí)現(xiàn)數(shù)據(jù)集的切分,然后對數(shù)值屬性(A4和A5)給出用基于模型樹構(gòu)建各段線性關(guān)系的方法。對于歷史記錄不均的問題,在算法中設(shè)定了回溯閾值?,當(dāng)某類別的數(shù)據(jù)記錄較少時(shí),其能通過回溯操作獲得更多相關(guān)的數(shù)據(jù)記錄。

        (1)決策樹建樹階段

        決策樹建樹階段解決標(biāo)稱屬性的劃分問題,該階段依據(jù)標(biāo)稱屬性的值將數(shù)據(jù)集劃分為多個(gè)子集,其過程為:首先在根節(jié)點(diǎn)劃分屬性A1,將各產(chǎn)品類型生成一個(gè)分枝;然后在各分枝下生成屬性A2節(jié)點(diǎn),在A2上進(jìn)一步切分各數(shù)據(jù)子集,再在A3上對各分枝進(jìn)行更細(xì)的切分。在決策樹建樹階段指定各層級(jí)劃分的屬性基于以下兩點(diǎn)思考:①常用的屬性選擇度量方法(ID3,C4.5和信息增益等)要求決策目標(biāo)為類別變量,而文中決策變量為連續(xù)型變量,因此這些方法不適用;②本文在決策樹階段屬性劃分的順序并不會(huì)對模型的預(yù)測結(jié)果造成影響,而且為便于在各葉節(jié)點(diǎn)給出擬合模型,需在決策樹階段完成標(biāo)稱屬性的劃分。

        (2)回溯操作階段

        原有數(shù)據(jù)集經(jīng)過多次切分后,某些數(shù)據(jù)子集的樣本量較少,而少量樣本無法有效反映某產(chǎn)品煉制工時(shí)的規(guī)律,容易因過擬合導(dǎo)致模型預(yù)測偏差。因此,在算法中設(shè)定最少樣本數(shù)閾值?,記為回溯閾值。假設(shè)當(dāng)前掃描到分枝pik,則首先判斷該分枝對應(yīng)的數(shù)據(jù)集包含的樣本數(shù),若大于?,則用pik對應(yīng)的數(shù)據(jù)集作為建模數(shù)據(jù)集;否則向根節(jié)點(diǎn)方向逐步回溯,直至當(dāng)前節(jié)點(diǎn)對應(yīng)數(shù)據(jù)集的樣本量大于?或到達(dá)根節(jié)點(diǎn),并將當(dāng)前節(jié)點(diǎn)對應(yīng)的數(shù)據(jù)集作為建模數(shù)據(jù)集。若回溯步驟因到達(dá)根節(jié)點(diǎn)而停止,則直接在分枝pik下添加葉節(jié)點(diǎn),并賦予當(dāng)前數(shù)據(jù)集的均值。閾值參數(shù)的設(shè)置在本節(jié)訓(xùn)練參數(shù)選取階段中進(jìn)行詳述。

        (3)模型樹建樹階段

        利用A4和A5對各數(shù)據(jù)子集進(jìn)行進(jìn)一步切分,并最終在葉節(jié)點(diǎn)處給出某個(gè)工時(shí)映射關(guān)系,用于描述煉制時(shí)間與生產(chǎn)批量及生產(chǎn)日期之間的關(guān)系。在此過程中需要建立回歸模型,然而某些數(shù)據(jù)子集中自變量與因變量的線性關(guān)系不顯著,目前常用的解決方法有向前選擇法、向后選擇法和逐步回歸法[28]。因變量個(gè)數(shù)不多,本文采用向后選擇法,設(shè)定顯著性系數(shù)為0.1,通過逐步建模并進(jìn)行顯著性分析選取合適的自變量,對于被剔除的不顯著變量,設(shè)其回歸系數(shù)為0。顯然,兩個(gè)自變量都被剔除時(shí),葉節(jié)點(diǎn)的值與CART方法中給出的均值相同。

        模型樹建樹方法對應(yīng)模塊model_tree,其為main_algorithm的子模塊。model_tree中包含的模塊best_split_point用于尋找在A4或A5上的最佳切分點(diǎn),其中包含regression模塊,regression用于線性回歸和顯著性分析。

        模塊:model_tree(Dik,θ,γ,Bl)//給出依據(jù)數(shù)據(jù)集Dik得出的子樹。

        輸入:數(shù)據(jù)集Dik,切分最少樣本數(shù)θ,盒圖法最少樣本數(shù)γ,內(nèi)限范圍系數(shù)Bl。

        輸出:Dik生成的子樹。

        (1)集合Set={Dik},temp_set=Set

        (2)while(Set非空){

        (3)for Set中每個(gè)子集Dc{

        (4)值v,fik=best_split_point(Dc,θ,γ,Bl)

        (5)if 值v非等于None//判斷是否存在切分點(diǎn)

        (6)用值v切分Dc并將切分后的子集添加到temp_set

        (7)else:生成葉節(jié)點(diǎn)用fik標(biāo)記}

        (8)從temp_set刪除Dc;令Set=temp_set}

        (9)Return依據(jù)Dik生成的子樹

        在模塊model_tree中有3個(gè)關(guān)鍵輸入?yún)?shù),θ用于防止過度切分,γ和Bl為盒圖法中的兩個(gè)參數(shù),它們影響離群點(diǎn)的識(shí)別效果。

        模型樹基于二元切分法,以誤差平方和(式(4))作為誤差準(zhǔn)則,用最大化誤差減小(式(5))作為切分點(diǎn)選擇方法。

        (4)

        maxz=SSE(Dc)-SSE(Dpil)-SSE(Dpir)。

        (5)

        式中:n為樣本量,yi為真實(shí)值,yi′為預(yù)測值,Dc為當(dāng)前數(shù)據(jù)集,Dpil和Dpir為在點(diǎn)pi對Dc切分后且用盒圖法剔除過噪聲對象的兩個(gè)數(shù)據(jù)子集,SSE(Dc)表示在Dc上的SSE。當(dāng)某一節(jié)點(diǎn)上的樣本集分裂后,目標(biāo)值變化很小或無法使切分后的數(shù)據(jù)子集都大于θ時(shí),停止切分并在分枝上添加葉節(jié)點(diǎn),用對應(yīng)的線性模型標(biāo)記。

        模塊:best_split_point(Dc,θ,γ,Bl)//尋找最佳切分點(diǎn),返回:1 切分點(diǎn)或None;2 regression(Dc,0.1)。

        輸入:數(shù)據(jù)集Dc,切分最少樣本數(shù)θ,盒圖法最少樣本數(shù)γ,內(nèi)限范圍系數(shù)Bl。

        輸出:1 切分點(diǎn)或None,2 regression(Dc,0.1)。

        (1)回歸參數(shù)=regression(Dc,0.1),可得到y(tǒng)′=fik(A4,A5),計(jì)算SSE

        (2)屬性A4,A5在Dc中所有可能取值的集合Va4i,Va5i,有值集合Vti=Va4i∪Va5i

        (3)for 值pi∈Vti{

        (4)用pi劃分Dc,劃分后利用參數(shù)配置為γ和Bl的盒圖法剔除噪聲點(diǎn),得到Dpil和Dpir

        (5)if Dpil且Dpir的樣本數(shù)都≥θ{

        (6)求得fil(A4,A5),fir(A4,A5),并計(jì)算err=SSE-SSE(Dpil)-SSE(Dpir)

        (7)if err>1:記錄err在序列err_list中}

        (8)else continue}

        (9)if err_list中最大值>1:return該值對應(yīng)的切分點(diǎn),fik

        (10)Else:return None,fik

        對于某產(chǎn)品煉制工時(shí)映射關(guān)系可能由分段線性關(guān)系組合而成的問題,best_split_point模塊中通過切分操作來判斷是否需用分段線性進(jìn)行擬合,其中切分最少樣本數(shù)(θ)用于防止數(shù)據(jù)集被過度切分。此外,每次切分后,都利用參數(shù)配置為γ和Bl的盒圖法剔除離群點(diǎn)后再進(jìn)行擬合(步驟(4)),避免噪聲點(diǎn)對擬合造成干擾。

        模塊:regression(Dc,s_v)//線性回歸,返回常數(shù)項(xiàng)和回歸系數(shù)。

        輸入:數(shù)據(jù)集Dc,顯著系數(shù)s_v=0.1。

        輸出:const,a,b //y=const+ax1+bx2。

        (1)自變量集Xs={x1,x2}

        (2)While Xs不為空{(diào)

        (3)用集合Xs中的變量與煉制時(shí)間建立線性模型

        (4)計(jì)算Xs中各變量回歸系數(shù)的顯著性,集合s_t中記錄了各變量的顯著性系數(shù)

        (5)If s_t中的最大值>=s_v:剔除對應(yīng)解釋變量

        (6)Else{獲得const值和回歸系數(shù),被剔除自變量回歸系數(shù)設(shè)定為0;break}

        (7)If Xs為空{(diào)const=Dc中煉制時(shí)間均值,且a=b=0}}

        (8)Return const,a,b

        對于某些產(chǎn)品,生產(chǎn)批量或生產(chǎn)日期與煉制時(shí)間并不存在顯著的線性關(guān)系,模塊regression通過向后選擇法逐步進(jìn)行建模,并通過顯著性分析選取合適的自變量(步驟(3)~(6))。若在Dc中變量與煉制時(shí)間不存在顯著關(guān)系,則計(jì)算Dc中煉制時(shí)間的均值(步驟(7))。

        (4)訓(xùn)練參數(shù)選取階段

        算法中訓(xùn)練的參數(shù)有N,?,θ,γ和Bl,模型對這些參數(shù)很敏感。為解決模型參數(shù)設(shè)置問題,本文采用的方法為:利用全局搜索法,依次用各可行參數(shù)組建立模型,并用10折交叉驗(yàn)證法作為模型訓(xùn)練效果的測試方法,以確定性系數(shù)R2(式(6))作為評(píng)價(jià)指標(biāo),可得用各參數(shù)組建模的評(píng)價(jià)值集合,最后選出較優(yōu)參數(shù)組用于訓(xùn)練模型。本文設(shè)定各參數(shù)的取值范圍分別為N∈[300,788],?∈[5,15],θ∈[5,30],γ∈[5,30],Bl∈[0.5,1.5],其取值范圍的確定是基于以下考慮:①通過縮短計(jì)算時(shí)間來減少算法計(jì)算量。②基于經(jīng)驗(yàn)設(shè)定各參數(shù)的取值范圍,使模型達(dá)到較好的預(yù)測精度。③擬合時(shí)所需的樣本量一般為變量數(shù)的3~10倍,因此設(shè)定最小樣本數(shù)?的取值在5~15之間;最小切分?jǐn)?shù)是為保證切分后子集的樣本量,因此設(shè)定θ在5~30之間;盒圖法的內(nèi)限范圍系數(shù)Bl常設(shè)定為1.5,因?yàn)槲墨I(xiàn)[29]論證了該參數(shù)的不同取值會(huì)直接影響離群點(diǎn)的識(shí)別效果,所以本文設(shè)定Bl為0.5~1.5,而使用盒圖法需滿足的最小樣本量γ在相關(guān)研究中并未有統(tǒng)一的規(guī)定,文中給出較為寬松的取值范圍,在5~30之間。

        (6)

        3 方法效果評(píng)估

        為驗(yàn)證本文所提方法的效果,將某煉油企業(yè)獲得的828條數(shù)據(jù)記錄隨機(jī)劃分為測試集和訓(xùn)練集兩個(gè)相互獨(dú)立的子集,分別包括40條和788條數(shù)據(jù)記錄。因?yàn)樵趯?shí)際任務(wù)分派中需給出兩種工時(shí)(Rt1和Rt2),所以利用訓(xùn)練集依次訓(xùn)練出模型f1和f2,然后在測試集上驗(yàn)證模型效果,本文采用兩種方法評(píng)估方法效果:①在測試集上對比預(yù)估時(shí)間和實(shí)際時(shí)間,計(jì)算兩者的偏差;②從任務(wù)分派層面考慮,將各方法對每日的預(yù)估任務(wù)負(fù)荷量與實(shí)際任務(wù)負(fù)荷量進(jìn)行比對。

        3.1 預(yù)估偏差分析

        本文采用平均絕對偏差MAD和平均絕對百分比誤差MAPE評(píng)估方法的預(yù)測效果。平均絕對偏差用于評(píng)價(jià)方法的預(yù)估精度,注重反映個(gè)體樣本上的預(yù)測偏差量,其值越小越好;平均絕對百分比誤差剔除了單位的影響,是一個(gè)無量綱的值,能夠反映平均偏離的程度,其值越小越好。

        (7)

        (8)

        式中:n為測試樣本數(shù),yi為實(shí)際值,yi′為預(yù)測值。

        表3所示為f1,f2的較優(yōu)參數(shù)在測試集上的預(yù)估偏差評(píng)價(jià)結(jié)果。在當(dāng)前測試集,f1,f2及SOT的MAD分別為0.774,0.752和1.830,MAPE分別為11.94,12.84和32.16,從兩個(gè)評(píng)估指標(biāo)上來看,本文方法的預(yù)估偏差明顯低于當(dāng)前方法,因此在預(yù)估精度上,f1和f2均優(yōu)于SOT。從指標(biāo)MAD來看,f2相對于f1的預(yù)測精度有所提升,但提升幅度不大。

        表3 較優(yōu)訓(xùn)練參數(shù)及各自的MAD,MAPE值

        圖6所示為分別用f1,f2及SOT預(yù)測時(shí)的偏差折線圖,偏差值為預(yù)估時(shí)間與實(shí)際時(shí)間之差的絕對值。結(jié)合圖6,在絕大多數(shù)測試樣例上,f1和f2的預(yù)估偏差都比直接使用SOT要低,而在少數(shù)測試樣例上出現(xiàn)SOT優(yōu)于f1,f2的情況,是因?yàn)閷?shí)際生產(chǎn)的偶然性使得在某些時(shí)候SOT反而更接近實(shí)際煉制時(shí)間。而對比f1和f2發(fā)現(xiàn),兩模型的預(yù)估效果并無顯著差異,f2在f1基礎(chǔ)上的預(yù)估精度提升得并不明顯。其原因是:只有部分產(chǎn)品常由不同操作員生產(chǎn),而在這部分產(chǎn)品中,有些又因生產(chǎn)記錄數(shù)低于?進(jìn)行回溯操作而得到與f1一樣的結(jié)果。另外,在指標(biāo)MAPE上,f2的精度低于f1的原因是MAPE容易受到極值的影響。

        3.2 預(yù)測值與實(shí)際值對比分析

        圖7所示為預(yù)測值和實(shí)際值的對比圖,圖中若預(yù)測值與實(shí)際值完全一樣,則點(diǎn)應(yīng)位于對角線y=x上。這里可用R2評(píng)價(jià)預(yù)測結(jié)果的優(yōu)劣,R2值越接近1,預(yù)測效果越好。f1,f2及SOT的R2分別為0.970,0.969和0.957,說明本文方法優(yōu)于當(dāng)前方法。

        當(dāng)煉制時(shí)間較長時(shí),f2的預(yù)測值大多出現(xiàn)在對角線下方,表明其值偏小。而對于絕大部分測試樣例,SOT值均位于對角線上方,表明SOT總體偏大。

        3.3 日生產(chǎn)負(fù)荷量預(yù)測分析

        在任務(wù)分派過程中,會(huì)依據(jù)工時(shí)估算各反應(yīng)釜每日的任務(wù)量,因此本節(jié)通過分析對各每日生產(chǎn)負(fù)荷量的預(yù)測效果來驗(yàn)證所提方法的有效性。

        圖8所示為各反應(yīng)釜上每日的實(shí)際負(fù)荷量以及分別用SOT,Rt1和Rt2預(yù)測的結(jié)果??梢奟t1及Rt2較為接近實(shí)際值,能較好地預(yù)估實(shí)際任務(wù)量,而基于SOT的預(yù)估量偏差較大。表4所示為各方法的平均預(yù)估偏差率z(式(9)),其值越小表明對日負(fù)荷量的預(yù)估越精確。

        (9)

        式中:li為實(shí)際負(fù)荷量,li′為預(yù)測負(fù)荷量,wd為該設(shè)備的實(shí)際生產(chǎn)天數(shù)。

        表4 各反應(yīng)釜日作業(yè)任務(wù)平均預(yù)估偏差率

        反應(yīng)釜K01K02K03K04f19562136867789f2956597870886SOT2724314625622785

        在各反應(yīng)釜上,本文方法在日任務(wù)平均預(yù)估偏差率上均優(yōu)于當(dāng)前方法,且基本都在10%的偏差范圍內(nèi),因此在任務(wù)量預(yù)估精度上,本文方法優(yōu)于當(dāng)前的預(yù)估方法。此外,在K02上發(fā)現(xiàn)SOT預(yù)估效果較差,原因是某些產(chǎn)品類型的煉制時(shí)間變化較大,SOT因更新不及時(shí)而無法有效反映當(dāng)前生產(chǎn)狀態(tài)。

        4 分析討論

        為了探究訓(xùn)練參數(shù)對預(yù)測精度的影響程度,以及訓(xùn)練參數(shù)選取階段的必要性和有效性,本章通過敏感度分析給出各參數(shù)的影響程度,然后給定不同訓(xùn)練集討論訓(xùn)練參數(shù)選取的效果。

        4.1 敏感度分析

        算法中有訓(xùn)練參數(shù)N,?,θ,γ和Bl,模型對這些參數(shù)很敏感。下面分析各個(gè)參數(shù)取值的變化對預(yù)測精度的影響,以及各參數(shù)對預(yù)測精度的影響程度。

        4.1.1 訓(xùn)練參數(shù)變化對預(yù)測精度的影響

        圖9b中當(dāng)最少切分?jǐn)?shù)從5變化到7時(shí),預(yù)測精度出現(xiàn)了明顯的下降,可能是因較多產(chǎn)品的歷史記錄數(shù)在10~13范圍內(nèi),取值為5可進(jìn)一步切分而有更好的擬合效果。之后,隨著最少切分?jǐn)?shù)的增加,f1和f2預(yù)測精度的變化不是很明顯。

        圖9c和圖9d給出了盒圖法中兩個(gè)參數(shù)變化對預(yù)測精度的影響。圖9c中內(nèi)限范圍系數(shù)只有3個(gè)取值,可能因取值少而使不同內(nèi)限范圍系數(shù)的預(yù)測精度區(qū)別不大。圖9d顯示,隨著γ的增加,預(yù)測精度先提高,然后呈現(xiàn)下降的趨勢,原因是當(dāng)前各類產(chǎn)品的樣本量并不多,γ越大,因樣本量不夠而未進(jìn)行去噪操作的子集越多,因此直接擬合會(huì)導(dǎo)致預(yù)測精度降低。

        4.1.2 訓(xùn)練參數(shù)方差分析

        為探究各參數(shù)與預(yù)測精度的相互關(guān)系,并量化各參數(shù)對結(jié)果的影響程度,目前常用的方法為方差分析法[30-32],本文設(shè)定顯著性水平為0.05。由于包含5個(gè)參數(shù),且各參數(shù)的水平數(shù)不等(如Bl有3種水平,分別是0.5,1.0和1.5),這里采用方差分析中的一般線性模型,結(jié)合Minitab軟件進(jìn)行計(jì)算分析。

        表5和表6所示為各參數(shù)的連續(xù)平方和(Seq SS)、調(diào)整的平方和(Adj SS)、調(diào)整均方(Adj MS)、F統(tǒng)計(jì)量及其P值。

        表5 f1訓(xùn)練參數(shù)方差分析表

        表6 f2訓(xùn)練參數(shù)方差分析表

        在表5和表6中,各參數(shù)對應(yīng)的P值都小于給定的顯著性水平0.05,表明每個(gè)訓(xùn)練參數(shù)都對f1和f2的預(yù)測精度有顯著影響,但影響程度不同。對于f1,參數(shù)樣本量(N)的F統(tǒng)計(jì)量最大,為主要影響因素,其次為回溯閾值(?),然后為最少切分?jǐn)?shù)(θ),再次為最少樣本量(γ),最后為內(nèi)限范圍系數(shù)(Bl),各參數(shù)按影響程度高至低排列依次為N—?—θ—γ—Bl;對于f2,各參數(shù)按主次順序排列為N—θ—?—γ—Bl。在f2中,影響程度有所增強(qiáng)的有?,θ。因?yàn)樵趂2中比f1多考慮了工人因素,所以決策樹劃分后,各子集所包含的樣本數(shù)更少,在回溯操作階段常需進(jìn)一步判斷處理,而回溯閾值作為是否回溯操作的判斷標(biāo)準(zhǔn),更易影響f2的預(yù)測精度。類似地,若最少切分?jǐn)?shù)較大,則部分較小子集還未切分就直接給出了葉節(jié)點(diǎn),因此樣本數(shù)偏小的子集的θ取值更難權(quán)衡,從而使θ對f2的影響更為顯著。

        綜上可知,訓(xùn)練參數(shù)對模型的預(yù)測精度都有顯著的影響,對于f1和f2而言,樣本量均為影響最為顯著的訓(xùn)練參數(shù)。f2相對于f1,因多考慮了操作員因素,其預(yù)測精度更易受到參數(shù)取值的影響。因此在實(shí)際中,若有模型f3考慮了更多影響因素,則可能使模型的效果更加不穩(wěn)定,但在訓(xùn)練參數(shù)取值合適時(shí),其效果優(yōu)于考慮因素較少的模型,而當(dāng)參數(shù)變動(dòng)時(shí),其預(yù)測精度將出現(xiàn)較大波動(dòng)。

        4.2 訓(xùn)練集規(guī)模約束下訓(xùn)練參數(shù)的優(yōu)化

        本文收集的數(shù)據(jù)是一個(gè)時(shí)段的數(shù)據(jù)記錄,而實(shí)際中的數(shù)據(jù)是變化的,且隨生產(chǎn)不斷積累。為了解訓(xùn)練集規(guī)模不一致時(shí)本文方法的效果,以及參數(shù)選取階段對預(yù)測精度所起的作用,給出兩組訓(xùn)練集,訓(xùn)練集1包括788條數(shù)據(jù)記錄,訓(xùn)練集2包括540條數(shù)據(jù)記錄,兩者的測試集相同。同樣以MAD和MAPE作為效果評(píng)價(jià)指標(biāo)。

        兩組訓(xùn)練集分別用于訓(xùn)練,給出的較優(yōu)參數(shù)如表7所示。對于訓(xùn)練集1,基于較優(yōu)訓(xùn)練參數(shù)建立的f1和f2在測試集上的MAD分別為0.774和0.752,MAPE分別為11.94和12.84,而對于該測試集,若訓(xùn)練樣本量相同,則其能達(dá)到的最優(yōu)效果分別為MAD=0.628,0.600,MAPE=10.66,11.37,當(dāng)參數(shù)取值N=330,?=12,Bl=1.5,γ=9,θ=5時(shí),求出的f1預(yù)估精度最低,為MAD=1.741;當(dāng)參數(shù)取值N=360,?=5,Bl:1.5,γ=23,θ=5時(shí),求出的f2預(yù)估精度最低,為MAD=1.715。將本文方法的預(yù)估精度與在各種訓(xùn)練參數(shù)下所得模型的預(yù)測精度進(jìn)行對比,本文方法的預(yù)估精度所處的分位值為f1=13.77%,f2=1.54%,即f1的預(yù)估精度超過了所有可取參數(shù)組中86.33%的對象,f2的預(yù)估精度超過了所有可取參數(shù)組中98.46%的對象。對于訓(xùn)練集2,本文方法的預(yù)估精度所處的分位值為f1=4.25%,f2=9.62%。因此,本文方法能夠有效找出較優(yōu)訓(xùn)練參數(shù)。

        表7 在不同訓(xùn)練集上的訓(xùn)練參數(shù)和方法效果

        續(xù)表7

        當(dāng)給定的數(shù)據(jù)集不同時(shí),本文方法給出的訓(xùn)練參數(shù)也有差異。在訓(xùn)練集1上,給出的需求訓(xùn)練樣本量小于全部樣本量,而在訓(xùn)練集2上,給出的需求訓(xùn)練樣本量等于全部樣本量,且樣本量較多時(shí)的模型效果明顯優(yōu)于樣本量較少時(shí)模型的效果,表明要獲得更高的預(yù)測精度需要保證足夠量的樣本量用于訓(xùn)練。此外,將f1和f2建立模型時(shí)所需的樣本量和預(yù)測精度進(jìn)行對比發(fā)現(xiàn),若樣本足夠,則f2可達(dá)到比f1更高的預(yù)測精度,且所需的樣本量多于f1,樣本量對f2預(yù)測精度的影響更加顯著。因此在實(shí)際中,若樣本數(shù)據(jù)較少,則可嘗試選用模型f1,以期得到更好的效果。

        綜上,本文方法能夠找出較優(yōu)訓(xùn)練參數(shù),其給出的參數(shù)有一定的參考價(jià)值,當(dāng)數(shù)據(jù)量變化時(shí),本文方法有一定的適應(yīng)能力。因條件限制,當(dāng)前方法并未在大樣本集上進(jìn)行測試分析,當(dāng)數(shù)據(jù)量較多時(shí),該方法的效果還需進(jìn)一步驗(yàn)證。

        文中采取十折交叉驗(yàn)證的方法來避免過擬合,提高模型的泛化性,雖然在十個(gè)不同的折上驗(yàn)證了模型的效果,但仍不可避免地存在抽樣誤差。因此,在實(shí)際中為獲得更加穩(wěn)定的效果,可在給定數(shù)據(jù)集上多次運(yùn)行該算法,并人工對訓(xùn)練參數(shù)進(jìn)行挑選。

        5 結(jié)束語

        本文針對流程工業(yè)任務(wù)分派過程中存在的問題,提出基于決策樹和模型樹的工時(shí)估算方法,該方法適用于較小的訓(xùn)練樣本集,能夠結(jié)合標(biāo)稱值和數(shù)值變量來預(yù)估作業(yè)時(shí)間。在實(shí)例分析中,采用某潤滑油煉制企業(yè)的實(shí)際數(shù)據(jù)建立了兩種工時(shí)估算模型,相對于用SOT預(yù)估時(shí)32.2%的誤差,本文模型可使實(shí)做工時(shí)與預(yù)估工時(shí)的誤差保持在12.8%以內(nèi),預(yù)估工時(shí)在任務(wù)分派過程中能夠更準(zhǔn)確地預(yù)估實(shí)際任務(wù)量,用于進(jìn)一步優(yōu)化設(shè)備和操作員資源配置。

        目前方法中并未考慮離群點(diǎn)的產(chǎn)生機(jī)制及可能的含義,且在低維空間剔除離群點(diǎn)時(shí)因忽略了某些情境屬性,可能導(dǎo)致錯(cuò)誤識(shí)別和部分離群點(diǎn)被正常對象掩蓋。本文在參數(shù)選取階段用所有可能的參數(shù)組建模,然后挑選出較優(yōu)的訓(xùn)練參數(shù),存在訓(xùn)練時(shí)間過長的問題。未來將針對這兩點(diǎn)作進(jìn)一步研究,以提高預(yù)估模型的進(jìn)度并減少模型訓(xùn)練時(shí)間。

        [1] WU Xindong, ZHU Xinquan, WU Gongqiong, et al. Data mining with big data[J]. IEEE Transactions on Knowledge & Data Engineering,2014,26(1):97-107.

        [2] SYED A R, GILLELA K, VENUGOPAL C. The future revolution on big data[J]. Future,2013,2(6):2446-2451.

        [3] LIU Qiang, QIN Sizhao. Perspectives on big data modeling of process industries[J]. Acta Automatica Sinica,2016,42(2):161-171(in Chinese).[劉 強(qiáng),秦泗釗.過程工業(yè)大數(shù)據(jù)建模研究展望[J].自動(dòng)化學(xué)報(bào),2016,42(2):161-171.]

        [4] LIU Min, HAO Jinghua, WU Cheng. A prediction based iterative decomposition algorithm for scheduling large-scale job shops[J]. Mathematical & Computer Modelling,2008,47(3):411-421.

        [5] GRADISAR D, MUSIC G. Production-process modelling bas-ed on production-management data:a Petri-net approach[J]. International Journal of Computer Integrated Manufacturing,2007,20(8):794-810.

        [6] LIU Bin, JIANG Zuhua. The intelligent man-hour estimate technique of assembly for shipbuilding[J]. Journal of Shanghai Jiaotong University,2005,39(12):1979-1983(in Chinese).[劉 濱,蔣祖華.船舶裝配作業(yè)工時(shí)智能估算技術(shù)[J].上海交通大學(xué)學(xué)報(bào),2005,39(12):1979-1983.]

        [7] SHEN Ling, ZHANG Zhiying. Research on the work quota estimation method for ship iron outfitting pieces[J]. Industrial Engineering & Management,2011,16(4):96-102(in Chinese).[沈 玲,張志英.船舶鐵舾件工時(shí)定額估算方法研究[J].工業(yè)工程與管理,2011,16(4):96-102.]

        [8] DAI Jianwei, JI Hua, YANG Gang, et al. Man-hour forecast model based on GA_BP for chemical equipment design[J]. Computer Integrated Manufacturing Systems,2013,19(7):1665-1675(in Chinese).[戴健偉,吉 華,楊 崗,等.基于GA_BP算法的化工設(shè)備設(shè)計(jì)人工時(shí)預(yù)測[J].計(jì)算機(jī)集成制造系統(tǒng),2013,19(7):1665-1675.]

        [9] OBITKO M, JIRKOVSKY V, BEZDICEK J. Big data challenges in industrial automation[C]//Proceedings of International Conference on Industrial Applications of Holonic and Multi-Agent Systems. Berlin, Germany:Springer-Verlag,2013:305-316.

        [10] LI Li, SUN Zijin, NI Jiacheng, et al. Data-based scheduling framework and adaptive dispatching rule of complex manufacturing systems[J]. The International Journal of Advanced Manufacturing Technology,2013,66(9/10/11/12):1891-1905.

        [11] LI Qiyi, WANG Lei, XU Jingjing. Production data analytics for production scheduling[C]//Proceedings of the 2015 IEEE International Conference on Industrial Engineering and Engineering Management. Washington, D.C.,USA:IEEE,2015:1203-1207.

        [12] COELHO R T, DE SOUZA A F, ROGER A R, et al. Mechanistic approach to predict real machining time for milling free-form geometries applying high feed rate[J]. The International Journal of Advanced Manufacturing Technology,2010,46(9/10/11/12):1103-1111.

        [13] LI Yajie, HE Weiping, DONG Rong, et al. Man-hour forecasting and evolution based on MES data collection[J]. Computer Integrated Manufacturing Systems,2013,19(11):2810-2818(in Chinese).[李亞杰,何衛(wèi)平,董 蓉,等.基于制造執(zhí)行系統(tǒng)數(shù)據(jù)采集的工時(shí)預(yù)測與進(jìn)化[J].計(jì)算機(jī)集成制造系統(tǒng),2013,19(11):2810-2818.]

        [14] DONG Qiaoying, LU Jianshan, KAN Shulin. A study on man-hour calculation model for multi-station and multi-fixture machining center[J]. Advances in Intelligent and Soft Computing,2012,149:403-411.

        [15] HUR M, LEE S K, KIM B, et al. A study on the man-hour prediction system for shipbuilding[J]. Journal of Intelligent Manufacturing,2015,26(6):1267-1279.

        [16] OZTRK A, KAYALGIL S, OZDEMIREL N E. Manufacturing lead time estimation using data mining[J]. European Journal of Operational Research,2006,173(2):683-700.

        [17] QUILAN J R. Induction of decision trees[J]. Machine Learning,1986,1(1):81-106.

        [18] QUILAN J R. Learning with continuous classes[C]//Proceedings of Australian Joint Conference on Artificial Intelligence. Singapore:World Scientific,1992:343-348.

        [19] GUAN Xiaoqiang. Research on the classifying Algorithm based on decision tree[D].Taiyuan: Shanxi University,2006(in Chinese).[關(guān)曉薔.基于決策樹的分類算法研究[D].太原:山西大學(xué),2006.]

        [20] WANG Yong, WITTEN L. Induction of model trees for predicting continuous classes[M]. Prague, Czechoslovakia: Faculty of Informatics and Statistics,1996.

        [21] WANG Yuanyuan, CHEN Yunhao, LI Jing. Application of model tree and support vector regression in the hyperspectral remote sensing[J]. Journal of China University of Mining & Technology,2006,35(6):818-823(in Chinese).[王圓圓,陳云浩,李 京.模型樹和支持向量回歸在高光譜遙感中的應(yīng)用[J].中國礦業(yè)大學(xué)學(xué)報(bào),2006,35(6):818-823.]

        [22] ZHANG Jianmin, LIU Dengtao, WU Guangzhong, et al. Working condition characteristics identification for extraction unit by using M5’ model tree and measured data[J]. Proceedings of the CSEE,2011,31(23):21-26(in Chinese).[章堅(jiān)民,劉登濤,吳光中,等.采用M5’模型樹和測量數(shù)據(jù)識(shí)別抽汽式機(jī)組汽耗量特性[J].中國電機(jī)工程學(xué)報(bào),2011,31(23):21-26.]

        [23] ETEMAD SHAHIDI A. Predicting longitudinal dispersion coefficient in natural streams using M5’ model tree[J]. Journal of Hydraulic Engineering,2012,138(6):542-554.

        [24] BONAKDAR L, ETEMAD SHAHIDI A. Predicting wave run-up on rubble-mound structures using M5 model tree[J]. Ocean Engineering,2011,38(1):111-118.

        [25] ETEMAD SHAHIDI A, MAHJOOBI J. Comparison between M5′ model tree and neural networks for prediction of significant wave height in lake superior[J]. Ocean Engineering,2009,36(15):1175-1181.

        [26] GOYAL M K, OJHA C S P. Estimation of scour downstream of a ski-jump bucket using support vector and M5 model tree[J]. Water Resources Management,2011,25(9):2177-2195.

        [27] SINGH K K, PAL M, SINGH V P. Estimation of mean annual flood in Indian catchments using backpropagation neural network and M5 model tree[J]. Water Resources Management,2010,24(10):2007-2019.

        [28] MONTGOMERY D C, PECK E A, VINING G G. Introduction to linear regression analysis[M]. New York, N.Y.,USA:John Wiley & Sons,2015.

        [29] FRIGGE M, IGLEWICZ B. Some implementations of the boxplot[J]. American Statistician,1989,43(1):50-54.

        [30] GUAN Wenjiang, CHEN Xinjun. Fishing efficiency for mac-

        kerel and scad in the large light purse seine fishery estimated by generalized linear model[J]. Journal of Fisheries of China,2009,33(2):220-228(in Chinese).[官文江,陳新軍.應(yīng)用一般線性模型估算鮐、鲹大型燈光圍網(wǎng)漁業(yè)的捕撈效率[J].水產(chǎn)學(xué)報(bào),2009,33(2):220-228.]

        [31] HU Xiaosu, HONG K S, GE S S, et al. Kalman estimator-and general linear model-based on-line brain activation mapping by near-infrared spectroscopy[J]. Biomedical Engineering Online,2010,9(1):82.

        [32] THORNTON R C, RODIONOV R, LAUFS H, et al. Imaging haemodynamic changes related to seizures:comparison of EEG-based general linear model, independent component analysis of fMRI and intracranial EEG[J]. Neuroimage,2010,53(1):196-205.

        猜你喜歡
        工時(shí)決策樹預(yù)估
        美國銀行下調(diào)今明兩年基本金屬價(jià)格預(yù)估
        淺析國有企業(yè)如何推行標(biāo)準(zhǔn)工時(shí)管理
        特殊工時(shí)制不能成為企業(yè)“變相剝削”的工具
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于決策樹的出租車乘客出行目的識(shí)別
        史密斯預(yù)估控制在排焦控制中的應(yīng)用
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        亚洲视频高清一区二区| 女人高潮内射99精品| 无码av天堂一区二区三区| 亚洲天堂2017无码中文| 伊人久久大香线蕉免费视频| 欧美洲精品亚洲精品中文字幕| 最新日本久久中文字幕| 亚洲成熟女人毛毛耸耸多 | 日韩精品久久无码中文字幕| 精品无码一区二区三区亚洲桃色| 日本一区二区三区激情视频| 日本一道本加勒比东京热| 成熟妇女毛茸茸性视频| 国产精品美女久久久久av超清| 中文字幕一区二区三区人妻少妇| 国产成人无码A区在线观| 中文字幕一区二区在线| av网页免费在线观看| 久久99精品久久久久麻豆| 米奇影音777第四色| 97在线视频免费| 国产91九色免费视频| 国产黑丝美腿在线观看| 久久婷婷人人澡人人喊人人爽| 亚洲av无码专区在线电影| 色婷婷狠狠97成为人免费| 亚洲综合在不卡在线国产另类 | 久久久熟女一区二区三区| 欧美成人猛交69| 国产成人午夜福利在线观看者| 久久国产亚洲av高清色| 东京热加勒比久久精品| 久久亚洲av无码西西人体| 激情欧美日韩一区二区| 亚洲女同系列高清在线观看| 视频一区精品中文字幕| 精品国偷自产在线视频九色| 亚洲一区爱区精品无码| 日本岛国一区二区三区| 激情人妻另类人妻伦| 免费人成无码大片在线观看|