高龍
摘? 要:在多品種小批量的物料生產(chǎn)中,企業(yè)往往無(wú)法事先確定物料的生產(chǎn)需求,導(dǎo)致出現(xiàn)過(guò)度生產(chǎn)或供應(yīng)不足的局面。文中以某電子企業(yè)小批量物料需求歷史數(shù)據(jù)為基礎(chǔ),采用優(yōu)劣解距離法(TOPSIS)從中選擇一種值得重點(diǎn)關(guān)注的物料作為研究對(duì)象,通過(guò)建立ARIMA時(shí)間序列模型對(duì)未來(lái)短期內(nèi)該物料的生產(chǎn)需求量進(jìn)行預(yù)測(cè)。經(jīng)驗(yàn)證,該模型對(duì)預(yù)測(cè)短期內(nèi)企業(yè)物料生產(chǎn)需求具有一定的指導(dǎo)性和參考價(jià)值,可以為企業(yè)物料生產(chǎn)計(jì)劃的制定提供決策依據(jù)。
關(guān)鍵詞:需求預(yù)測(cè);小批量物料;TOPSIS;ARIMA
中圖分類號(hào):TP311;TP39 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2023)15-0097-05
Research on the Small Batch Material Production Demand Prediction Model Based on ARIMA
GAO Long
(Lanzhou Petrochemical University of Vocational Technology, Lanzhou? 730060, China)
Abstract: In the production of multiple-variety and small-batch materials, enterprises often cannot determine the production demand of materials in advance, leading to overproduction or insufficient supply. Based on the historical data of small batch material demand in a certain electronic enterprise, the TOPSIS method is used to select a material that deserves special attention as the research object. By establishing an ARIMA time series model, the production demand for this material in the short term in the future is predicted. After verification, this model has certain guidance and reference value for predicting the short-term material production demand of enterprises, and can provide decision-making basis for the formulation of enterprise material production plans.
Keywords: demand prediction; small-batch material; TOPSIS; ARIMA
0? 引? 言
隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,企業(yè)競(jìng)爭(zhēng)越來(lái)越強(qiáng)調(diào)基于客戶需求的競(jìng)爭(zhēng),生產(chǎn)類型也從大量流水生產(chǎn)轉(zhuǎn)為多品種小批量的模式。而多品種小批量的生產(chǎn)方式強(qiáng)調(diào)根據(jù)客戶需求進(jìn)行生產(chǎn),避免過(guò)度生產(chǎn)和庫(kù)存積壓,從而降低庫(kù)存成本,提高產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)力。但在多品種小批量的物料生產(chǎn)中,由于物料實(shí)際需求變化多樣,企業(yè)往往無(wú)法事先確定物料的實(shí)際需求量,導(dǎo)致不能合理地安排物料生產(chǎn)[1]。因此通過(guò)分析企業(yè)已有的小批量物料生產(chǎn)需求歷史時(shí)序數(shù)據(jù),建立需求預(yù)測(cè)模型,幫助企業(yè)有效掌控物料生產(chǎn)規(guī)模,合理制定生產(chǎn)計(jì)劃就顯得十分必要了。目前國(guó)內(nèi)外對(duì)于基于時(shí)間序列數(shù)據(jù)的需求預(yù)測(cè)研究已經(jīng)有了較為詳細(xì)的理論體系,但圍繞企業(yè)小批量物料生產(chǎn)需求預(yù)測(cè)的研究偏少,本文以某電子企業(yè)小批量物料需求歷史數(shù)據(jù)為研究數(shù)據(jù),應(yīng)用優(yōu)劣解距離法(Technique for Order Preference by Similarity to an Ideal Solution, TOPSIS)從中選擇一種物料作為研究對(duì)象,利用時(shí)間序列的特點(diǎn),建立基于時(shí)間序列的差分整合移動(dòng)平均自回歸模型(Autoregressive Integrated Moving Average Model, ARIMA),以周為單位對(duì)小批量物料生產(chǎn)的需求進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,利用ARIMA模型預(yù)測(cè)短期內(nèi)企業(yè)小批量物料生產(chǎn)需求具有一定的指導(dǎo)性和參考價(jià)值。
1? 研究物料的選擇
1.1? 數(shù)據(jù)處理與特征構(gòu)建
原始數(shù)據(jù)集包含22 453條時(shí)間為2019年1月2日到2022年5月21日期間的物料需求信息數(shù)據(jù),共有284種物料,數(shù)據(jù)集中每種物料的基本信息格式及示例如表1所示。
分析原始數(shù)據(jù)可以發(fā)現(xiàn),小批量物料的生產(chǎn)需求往往具有周期性、變動(dòng)性和復(fù)雜性,同一周期內(nèi),不同品種的物料需求不一樣,不同周期間,相同品種的物料需求也不一樣。在生產(chǎn)實(shí)際中,很多物料需求的發(fā)生頻次只有一兩次,如果工廠對(duì)每個(gè)物料都做一遍需求分析預(yù)測(cè),不僅會(huì)浪費(fèi)很多時(shí)間而且也不現(xiàn)實(shí)。因此,通過(guò)對(duì)原始數(shù)據(jù)提供的284種物料需求的歷史數(shù)據(jù)進(jìn)行分析,本文從中選擇1種應(yīng)當(dāng)重點(diǎn)關(guān)注的物料作為研究對(duì)象,并以周為基本時(shí)間單位,預(yù)測(cè)物料的周需求量。將原始數(shù)據(jù)中第1次出現(xiàn)的時(shí)間(2019年1月2日)所在的周設(shè)定為第1周,以后的每周從周一開始至周日結(jié)束,例如,2019年1月7日至13日為第2周,以此類推,共計(jì)177周次。以編碼為6004020918的物料為例,處理后的數(shù)據(jù)如表2所示。
要從284種物料中選出最值得重點(diǎn)關(guān)注的1種,就需要考慮每種物料的需求周數(shù)、需求發(fā)生頻次、需求量、銷售單價(jià)、銷售總價(jià)等因素進(jìn)行綜合評(píng)價(jià)選擇。因此需要進(jìn)一步做數(shù)據(jù)處理,構(gòu)建上述5種特征并聚合數(shù)據(jù),結(jié)果如表3所示。
原始數(shù)據(jù)中的284種物料的需求周數(shù),在需求周內(nèi)的需求發(fā)生總頻次、總需求量、銷售單價(jià)均值和銷售總價(jià)均值如上表所示,此數(shù)據(jù)表構(gòu)成了一個(gè)284×5的矩陣X,基于X構(gòu)建TOPSIS綜合評(píng)價(jià)模型,對(duì)284種物料進(jìn)行綜合得分指數(shù)排序,選擇得分指數(shù)最高的物料。
1.2? TOPSIS模型
TOPSIS法是一種組內(nèi)綜合評(píng)價(jià)方法,基本過(guò)程為基于歸一化后的原始數(shù)據(jù)矩陣X,度量各評(píng)價(jià)對(duì)象與正理想解和負(fù)理想解間的距離,獲得各評(píng)價(jià)對(duì)象與正理想解的相對(duì)接近程度,以此作為評(píng)價(jià)優(yōu)劣的依據(jù)[2]。TOPSIS算法流程[3]如算法1所示。
算法1:
輸入:原始數(shù)據(jù)集X = {x1,x2,…,xn};各指標(biāo)權(quán)重w = {w1,w2,…,wn}
輸出:各數(shù)據(jù)樣本的TOPSIS評(píng)價(jià)結(jié)果
1)對(duì)原始數(shù)據(jù)集X中的指標(biāo)屬性同向化,得到X′
2)構(gòu)造向量歸一化后的標(biāo)準(zhǔn)化矩陣Z = {z1,z2,…,zn}
3)for Z的每一列Zi do
4)負(fù)理想解Z -的第i維度←Zi元素最小值
5)正理想解Z +的第i維度←Zi元素最大值
6)end for
7)for zi ∈ Z do
8)zi與正理想解的接近程度
11)end for
12)根據(jù)Ci大小排序
按照TOPSIS模型建立步驟,首先對(duì)284種物料按照需求周數(shù)、需求發(fā)生總頻次、總需求量、銷售單價(jià)均值和銷售總價(jià)均值5個(gè)指標(biāo)組成的原始矩陣X284×5做同向化處理,由于構(gòu)建的5個(gè)指標(biāo)均為極大型指標(biāo),所以此步驟可省略。對(duì)矩陣X284×5進(jìn)行標(biāo)準(zhǔn)化處理以消除不同量綱之間的影響,將標(biāo)準(zhǔn)化后的矩陣記為Z,標(biāo)準(zhǔn)化處理按式(1)進(jìn)行:
式(1)中,Zij為第i種物料的第j個(gè)指標(biāo)歸一化后的值。
正理想解Z +和負(fù)理想解Z -分別由Z中每列元素的最大值和最小值構(gòu)成,經(jīng)過(guò)算法1中的步驟2)~6)的求解,得到284種物料中正理想解和負(fù)理想解,如表4所示。
算法1中,TOPSIS在計(jì)算各評(píng)價(jià)對(duì)象與Z +和Z -的接近程度時(shí),需要確定每個(gè)指標(biāo)的權(quán)重wj,wj的確定往往由決策者給出或基于信息論的熵值法,本文采用后者。熵值法通過(guò)各指標(biāo)值的變異程度來(lái)確定指標(biāo)權(quán)數(shù),僅依賴于數(shù)據(jù)本身的離散程度。指標(biāo)的離散程度越大則熵值越大,表明指標(biāo)值提供的信息量越多,則該指標(biāo)的權(quán)重也應(yīng)越大[4]。計(jì)算過(guò)程如算法2所示。
算法2:
輸入:原始數(shù)據(jù)集X = {x1,x2,…,xn}
輸出:各指標(biāo)的熵權(quán)系數(shù)
1)對(duì)原始數(shù)據(jù)矩陣X同向化,得到X′
2)通過(guò)正向化矩陣X′計(jì)算概率矩陣P,
按照算法2求得物料的周數(shù)、需求發(fā)生總頻次、總需求量、銷售單價(jià)均值及銷售總價(jià)均值的熵權(quán)系數(shù),如表5所示。
計(jì)算出正負(fù)理想解和物料各指標(biāo)的熵權(quán)系數(shù)后,按照算法1步驟8)~12)計(jì)算可得284種物料的綜合得分指數(shù),排序后選出的物料編碼為6004020503。
2? ARIMA算法原理
ARIMA模型,即差分整合移動(dòng)平均自回歸模型,其分為自回歸模型(Autoregressive model, AR)、移動(dòng)平均模型(Moving Average model, MA)和自回歸移動(dòng)平均模型(Autoregressive Moving Average model, ARMA)。
AR模型表現(xiàn)為觀測(cè)值Xt與其滯后p階觀測(cè)值的線性組合加上隨機(jī)誤差項(xiàng),即:
Xt = φ1 Xt-1 + φ2 Xt-2 + … + φp Xt-p + αt? ? ? ?(2)
式(2)中,Xt為零均值平穩(wěn)序列,αt為隨機(jī)誤差項(xiàng),φ為模型回歸系數(shù)。AR模型通常簡(jiǎn)記為AR( p)。
MA模型表現(xiàn)為觀測(cè)值Xt與先前t-1、t-2、…、t-q個(gè)時(shí)刻進(jìn)入系統(tǒng)的q個(gè)隨機(jī)誤差項(xiàng)αt、αt-1、…、αt-q的線性組合,即:
Xt = αt - θ1αt-1 - θ2αt-2 - … - θqαt-q? ? ? ? ?(3)
式(3)中,θ為模型回歸系數(shù)。MA模型簡(jiǎn)記為MA(q)。
ARMA模型觀測(cè)值Xt不僅與其以前p個(gè)時(shí)刻的自身觀測(cè)值有關(guān),而且還與其以前時(shí)刻進(jìn)入系統(tǒng)的q個(gè)隨機(jī)誤差存在一定的依存關(guān)系[5],即:
Xt = φ1Xt-1 + φ2Xt-2 +…+ φp Xt-p + αt - θ1αt-1 - θ2αt-2 -…- θqαt-q? (4)
由式(4)可知,ARMA (p,q)模型其實(shí)就是AR( p)模型與MA (q)模型的組合。
時(shí)間序列的平穩(wěn)性是合理進(jìn)行時(shí)間序列分析和預(yù)測(cè)的重要保證,因此在進(jìn)行ARMA建模之前,待分析的時(shí)間序列必須滿足平穩(wěn)性條件,非平穩(wěn)時(shí)間序列可通過(guò)差分法使之平穩(wěn)化并進(jìn)行平穩(wěn)性檢驗(yàn)。時(shí)間序列通過(guò)d階差分平穩(wěn)化后,建立ARMA模型進(jìn)行分析,待模型進(jìn)行參數(shù)估計(jì)之后,再通過(guò)數(shù)據(jù)變換的可逆性使得模型參數(shù)估計(jì)結(jié)果適應(yīng)平穩(wěn)化之前的數(shù)據(jù)[5]。通過(guò)此過(guò)程建立的模型稱為整合的ARMA模型,即ARIMA( p,d,q)模型。
3? 模型構(gòu)建及應(yīng)用
3.1? 時(shí)間序列的平穩(wěn)化檢驗(yàn)
對(duì)選出的編碼為6004020503物料的周需求時(shí)間序列數(shù)據(jù)進(jìn)行訓(xùn)練集測(cè)試集劃分,將1~170周的數(shù)據(jù)作為訓(xùn)練集,171~177周的數(shù)據(jù)作為測(cè)試集。對(duì)訓(xùn)練集原始時(shí)間序列進(jìn)行可視化描述,如圖1所示。
從圖1可以看出,序列不是在某個(gè)均值上下波動(dòng),呈現(xiàn)出非平穩(wěn)性。但僅從圖形描述來(lái)判斷時(shí)間序列平穩(wěn)性的準(zhǔn)確性往往有限,因此本文使用單位根檢驗(yàn)的方法對(duì)6004020503物料的時(shí)序數(shù)據(jù)的平穩(wěn)性進(jìn)行檢驗(yàn)。一個(gè)時(shí)間序列如果能通過(guò)差分的方式平穩(wěn)化,則稱其具有單位根,即當(dāng)一個(gè)時(shí)間序列具有單位根是非平穩(wěn)的。原假設(shè)H0和備擇假設(shè)H1:
H0:時(shí)間序列具有單位根
H1:時(shí)間序列沒有單位根(即是平穩(wěn)序列)
本文采用Python第三方的統(tǒng)計(jì)分析庫(kù)statsmodels中提供的adfuller函數(shù)對(duì)原始數(shù)據(jù)和原始數(shù)據(jù)的一階差分?jǐn)?shù)據(jù)分別進(jìn)行Dickey-Fuller[6]單位根檢驗(yàn),結(jié)果如表6所示。
從表6可以看出原始數(shù)據(jù)單位根檢驗(yàn)并不顯著,沒有充分的理由拒絕H0,即原始序列具有單位根,是非平穩(wěn)序列。一階差分序列的單位根檢驗(yàn)的P值非常顯著,因此拒絕H0,接受H1,即一階差分序列是平穩(wěn)序列。
3.2? ARIMA模型識(shí)別
ARIMA( p,d,q)模型的識(shí)別即確定參數(shù)p,d,q具體數(shù)值的過(guò)程,該過(guò)程也稱為ARIMA模型的定階。由于在前文所述的時(shí)間序列的平穩(wěn)化中,非平穩(wěn)的原始時(shí)間序列經(jīng)過(guò)一階差分后就平穩(wěn)化了,因此參數(shù)d = 1。ARIMA模型p、q參數(shù)的定階可通過(guò)自相關(guān)系數(shù)(Autocorrelation Function, ACF)圖和偏自相關(guān)系數(shù)(Partial Autocorrelation Function, PACF)圖來(lái)進(jìn)行,圖2為原始時(shí)間序列數(shù)據(jù)一階差分后得到的ACF和PACF圖。
圖2中的ACF圖在滯后期q = 4之后截尾,而PACF圖在滯后期p = 4之后截尾,因此可以把模型初步設(shè)定為ARIMA(4,1,4)。但利用圖形定階只是一種模型識(shí)別的輔助手段,因此本文通過(guò)網(wǎng)格搜索計(jì)算ARIMA所有可能模型的貝葉斯信息準(zhǔn)則BIC[7](Bayesian Information Criterion),根據(jù)計(jì)算出的BIC指數(shù)最小的模型作為識(shí)別依據(jù)。根據(jù)BIC準(zhǔn)則繪制如圖3所示的熱力圖,從圖中可以看到BIC最小值對(duì)應(yīng)的參數(shù)分別為p = 1,q = 4,因此最終將模型設(shè)定為ARIMA(1,1,4)。
3.3? 模型參數(shù)估計(jì)及檢驗(yàn)
確定ARIMA模型的具體形式后,利用樣本數(shù)據(jù)進(jìn)行模型參數(shù)估計(jì)及檢驗(yàn)。對(duì)于一個(gè)適當(dāng)?shù)腁RIMA模型,其殘差項(xiàng)無(wú)自相關(guān)性,模型殘差項(xiàng)應(yīng)為白噪聲。表7為模型參數(shù)估計(jì)及參數(shù)顯著性檢驗(yàn)結(jié)果。
對(duì)模型的殘差項(xiàng)進(jìn)行白噪聲檢驗(yàn),將殘差項(xiàng)的ACF圖繪制出來(lái),如圖4所示。
觀察圖4中各滯后期的殘差自相關(guān)系數(shù),可以看出它們?cè)谥眯艆^(qū)間內(nèi)0附近波動(dòng),是一白噪聲序列,因此本文中所建立的ARIMA(1,1,4)模型是比較合適的。圖5是殘差序列的直方密度圖,從圖中可以看出模型殘差項(xiàng)基本服從正態(tài)分布,再次驗(yàn)證本文ARIMA(1,1,4)模型是合理的。
3.4? 模型的預(yù)測(cè)
確定好模型的超參并進(jìn)行模型參數(shù)估計(jì)和檢驗(yàn)后,使用模型對(duì)后續(xù)一定時(shí)期的時(shí)序數(shù)據(jù)進(jìn)行預(yù)測(cè)。利用現(xiàn)有樣本數(shù)據(jù)和模型參數(shù)估計(jì)結(jié)果,將差分處理后的數(shù)據(jù)還原成原始數(shù)據(jù)并對(duì)后續(xù)時(shí)間的時(shí)序數(shù)據(jù)進(jìn)行預(yù)測(cè),本文對(duì)物料6004020503在171~177周的需求量進(jìn)行預(yù)測(cè)的結(jié)果如表8所示。
將需求量觀測(cè)值的一階差分?jǐn)?shù)據(jù)和擬合得到的差分?jǐn)?shù)據(jù)繪制在如圖6所示的時(shí)間序列圖中,從圖中可看到預(yù)測(cè)值與真實(shí)值之間相對(duì)是吻合的,二者的波動(dòng)方向和幅度基本一致。
4? 結(jié)? 論
針對(duì)電子產(chǎn)品制造企業(yè)在多品種小批量的物料生產(chǎn)中面臨的生產(chǎn)需求不穩(wěn)定、生產(chǎn)周期不確定導(dǎo)致無(wú)法合理安排物料生產(chǎn)的問(wèn)題,本文提出了一種基于ARIMA算法的短期物料生產(chǎn)需求預(yù)測(cè)模型。首先將以天為單位的物料生產(chǎn)需求歷史數(shù)據(jù)轉(zhuǎn)換成以周為單位的時(shí)序數(shù)據(jù),使用TOPSIS法選出值得關(guān)注的一種物料作為研究對(duì)象,然后基于ARIMA算法構(gòu)建該物料生產(chǎn)的周需求預(yù)測(cè)模型,并對(duì)未來(lái)短期內(nèi)的生產(chǎn)需求進(jìn)行預(yù)測(cè),為企業(yè)的物料生產(chǎn)計(jì)劃提供決策依據(jù)。本文建立的小批量物料生產(chǎn)周需求預(yù)測(cè)模型原理簡(jiǎn)單,易于解釋,最終擬合結(jié)果顯示良好,模型預(yù)測(cè)結(jié)果在短期內(nèi)有一定的參考價(jià)值。但也存在以下不足:一是由于所研究物料的時(shí)序數(shù)據(jù)較少,模型的預(yù)測(cè)精度不足。二是ARIMA模型本身只適用于短期預(yù)測(cè),長(zhǎng)期預(yù)測(cè)準(zhǔn)確度較低。下一步研究中將對(duì)上述存在的缺陷進(jìn)行優(yōu)化升級(jí),探索針對(duì)企業(yè)小批量物料生產(chǎn)需求預(yù)測(cè)的最佳方法。
參考文獻(xiàn):
[1] 張浩.多品種小批量生產(chǎn)系統(tǒng)的排產(chǎn)優(yōu)化研究 [D].上海:上海交通大學(xué),2011.
[2] 閆海.我國(guó)智慧城市建設(shè)水平評(píng)價(jià)研究 [D].太原:太原科技大學(xué),2013.
[3] Suranyi.TOPSIS法(優(yōu)劣解距離法)介紹及python3 實(shí)現(xiàn) [EB/OL].(2021-02-01)[2023-03-26].https://zhuanlan.zhihu.com/p/37738503.
[4] 王亞俊.考慮屬性交互的氣象災(zāi)害治理能力評(píng)價(jià)建模研究 [D].南京:南京信息工程大學(xué),2021.
[5] 李婧.“陸態(tài)網(wǎng)絡(luò)”基準(zhǔn)站坐標(biāo)時(shí)間序列變化特性分析 [D].鄭州:解放軍信息工程大學(xué),2013.
[6] Dickey D A,F(xiàn)uller W A. Distribution of the Estimators for Autoregressive Time Series With a Unit Root [J].American Statistical Association,1979,74(366):427-431.
[7] 宋勇林. 拓展的貝葉斯信息準(zhǔn)則的一些性質(zhì) [D].武漢:華中師范大學(xué),2014.