■ 庫都孜·庫娜吉 黃文妤
(1.新疆交投科技有限責(zé)任公司, 烏魯木齊 830000;2.新疆公路橋梁試驗檢測中心有限責(zé)任公司, 烏魯木齊 830000)
公路建設(shè)成本指數(shù)(HCCI) 是一種綜合價格指數(shù),反映了一段時間內(nèi)該行業(yè)價格的平均變化。 它是由公路建設(shè)項目中主要行項目的價格信息(即材料、勞動力、設(shè)備)組成的無單位指標[1-2]。 HCCI 的作用主要有4 個:(1) 作為成本通貨膨脹的參考因素;(2)作為一般建筑市場價格指標;(3)作為建設(shè)單位和施工單位進行工程成本計算的依據(jù);(4)比較各省市之間的市場狀況。HCCI 的一個主要問題是,隨著時間的推移,HCCI 表現(xiàn)出顯著的變化,這主要是由復(fù)雜的交互效應(yīng)造成的,如市場因素和工程項目特定因素。 這種變化阻礙了用戶把握市場趨勢的能力,從而對公路工程建設(shè)單位和施工單位等業(yè)主在正確預(yù)算和成本估算方面帶來了不便[3]。為了解決這一問題,本研究集中在預(yù)測HCCI 并用定量模型解釋其變化。
目前預(yù)測HCCI 的兩種常用定量方法:(1) 時間序列分析;(2)統(tǒng)計學(xué)習(xí)方法(即回歸和其他更復(fù)雜的機器學(xué)習(xí)算法)[4-5]。時間序列建模仍然是這一研究領(lǐng)域中最常用的定量方法之一。 以往的研究除了無法預(yù)測趨勢變化和變化外,還在指數(shù)的建模和預(yù)測過程中暴露出3 大問題:一是對某些模型中要預(yù)測的數(shù)據(jù)有不同的要求,例如平穩(wěn)時間序列模型的假設(shè)和回歸方法中的高斯分布誤差,建模假設(shè)限制了模型在不同數(shù)據(jù)源情況下的應(yīng)用[6];二是現(xiàn)有研究中的許多模型只適用于低波動性數(shù)據(jù)[7]。 當(dāng)研究人員完全專注于分析誤差指標以評估模型,對低錯誤率感到滿意時,很少有人考慮兩個重要問題:數(shù)據(jù)(或問題)是否需要復(fù)雜的算法,以及該算法是否對預(yù)測數(shù)據(jù)有重要貢獻;三是一個好的預(yù)測模型應(yīng)該能夠?qū)Σ煌臅r間范圍進行未來的預(yù)測。
本研究包括3 個主要步驟:數(shù)據(jù)收集、模型開發(fā)和模型驗證,研究程序圖如圖1 所示。 本研究的主要目的是探索一種適用于高波動性數(shù)據(jù)的方法,對長期預(yù)測(8 年)、中期預(yù)測(2 年)和短期預(yù)測(1 年)3 種不同的預(yù)測情景進行模擬, 在預(yù)測HCCI 指數(shù)上具有較高的精度和有效的實現(xiàn),提出了一種關(guān)于公路工程建設(shè)成本指數(shù)的先進的人工智能算法,為公路工程建設(shè)成本計算提供依據(jù)。
圖1 LSTM 模型研究程序圖
長短期記憶網(wǎng)絡(luò) (LSTM,Long Short-Term Memory)是一種時間循環(huán)神經(jīng)網(wǎng)絡(luò),LSTM 適合于處理和預(yù)測時間序列中間隔和延遲非常長的重要事件[8-10]。先進的深度學(xué)習(xí)算法LSTM 以其強大的結(jié)構(gòu)和不同時間范圍的滾動預(yù)測過程成功地克服了這些挑戰(zhàn)。更具體地說,LSTM 提供了一種序列到序列(seq2seq)體系結(jié)構(gòu)。 LSTM 在短時記憶和長時記憶中都有顯著的表現(xiàn), 它是一種特殊的遞歸神經(jīng)網(wǎng)絡(luò),它比普通神經(jīng)網(wǎng)絡(luò)具有更復(fù)雜的單元結(jié)構(gòu)。
LSTM 建模有3 個步驟:數(shù)據(jù)預(yù)處理、超參數(shù)調(diào)整、預(yù)測和預(yù)測評估。LSTM 不需要數(shù)據(jù)具有平穩(wěn)性等要求,但建議將數(shù)據(jù)歸一化或標準化作為預(yù)處理的一部分,以加快收斂速度。 在本研究中,通過最小-最大標度標準化可以快速收集小范圍內(nèi)的所有數(shù)據(jù), 這有助于產(chǎn)生一個更規(guī)則的數(shù)據(jù)搜索空間,從而加速權(quán)值的收斂。 第二步是確定模型中超參數(shù)的設(shè)置,研究中考慮了六個超參數(shù):神經(jīng)元數(shù)目、批量大小、時間步長、時期、調(diào)整系數(shù)、丟失率,模型超參數(shù)設(shè)置見表1。 第三步是seq2seq 體系結(jié)構(gòu)的LSTM 模型預(yù)測功能的實現(xiàn)。通過將數(shù)據(jù)輸入LSTM模型,預(yù)估出預(yù)測周期內(nèi)的HCCI 指數(shù)。
表1 LSTM 預(yù)測模型超參數(shù)的默認設(shè)置
本研究通過采集江蘇省1998-2016 年實際工程建設(shè)成本指數(shù)為LSTM 模型提供真實數(shù)據(jù)基礎(chǔ),分別預(yù)測長期、中期和短期結(jié)果,并與真實數(shù)據(jù)曲線進行對比,觀察LSTM 模型預(yù)測的準確性,并使用平均誤差百分比作為誤差度量。
長期預(yù)測通過將1998-2008 年間的HCCI 指數(shù)輸入LSTM 模型, 預(yù)測出2008-2016 年的HCCI 指數(shù), 模型輸出結(jié)果見圖2。 從圖2 可以看出,LSTM模型的預(yù)測的結(jié)果大致能夠捕獲到數(shù)據(jù)的未來趨勢,但未能發(fā)現(xiàn)2016 年附近的下降趨勢。 LSTM 在2008 年附近預(yù)測的下降趨勢做得很好, 從而使得LSTM 的整體預(yù)測平行向下移動, 更加貼近實際水平。 就準確度而言,結(jié)果并不樂觀,LSTM 長期預(yù)測結(jié)果僅表達出大致的上升趨勢。 在實際情況中,該模型不需要預(yù)測如此長的周期,中、短期預(yù)測結(jié)果更具實用性。
圖2 LSTM 模型預(yù)測的HCCI 長期預(yù)測結(jié)果
LSTM 模型中期預(yù)測縮小了時間范圍, 增加了模型預(yù)測的頻率。 通過以下方式依次對兩年的指數(shù)進行預(yù)測:(1) 輸入1998-2008 年的HCCI 數(shù)據(jù),預(yù)測2008-2010 年的HCCI 指數(shù);(2) 輸入1998-2010年的HCCI 數(shù)據(jù), 預(yù)測2010-2012 年的指數(shù);(3)輸入1998-2012 年的HCCI 數(shù)據(jù),預(yù)測2012-2014 年的HCCI 指數(shù);(4)輸入1998-2014 年的HCCI 數(shù)據(jù),預(yù)測2014-2016 年的HCCI 指數(shù)。 由于輸入的HCCI 數(shù)據(jù)趨勢突變,導(dǎo)致對2008-2010 年HCCI 指數(shù)預(yù)測產(chǎn)生較大困難,但從圖3 可以看出,LSTM 模型仍表現(xiàn)出良好的能力來察覺這種變化。 其他三種預(yù)測周期的結(jié)果較為貼近實際HCCI 數(shù)據(jù)變化,二者之間的平均絕對百分比誤差見表2。 從表2 可以發(fā)現(xiàn), 當(dāng)數(shù)據(jù)較為平穩(wěn)時,LSTM 模型預(yù)測的HCCI指數(shù)的準確性在6.38%~11.39%。
圖3 LSTM 模型預(yù)測的HCCI 中期預(yù)測結(jié)果
表2 LSTM 模型中期預(yù)測結(jié)果的平均絕對百分比誤差
LSTM 模型短期預(yù)測結(jié)果通過設(shè)置輸出時間為一年, 分別輸入1998-2015 年的真實HCCI 數(shù)據(jù),從而得到輸入年份的后續(xù)一年的HCCI 指數(shù)的預(yù)測數(shù)據(jù), 預(yù)測結(jié)果見圖4。 由圖4 可以看出,LSTM 模型預(yù)測的結(jié)果與HCCI 指數(shù)的實際情況吻合程度較高, 只有在數(shù)據(jù)波動較大的年份(2008-2009、2015-2016)才會出現(xiàn)較小的偏差。 短期預(yù)測結(jié)果的平均百分比誤差見表3,從表3 可以看出,在數(shù)據(jù)波動性較小的情況下,誤差可以控制在5.521%~8.71%。相比較于長期、中期預(yù)測結(jié)果,短期預(yù)測結(jié)果已經(jīng)能夠做到較高程度的貼近實際HCCI 指數(shù)變化曲線。
圖4 LSTM 模型預(yù)測的HCCI 短期預(yù)測結(jié)果
表3 LSTM 模型短期預(yù)測結(jié)果的平均絕對百分比誤差
本研究通過LSTM 模型預(yù)測HCCI 指數(shù)在長期、中期和短期三種場景下的變化趨勢,可以發(fā)現(xiàn),隨著預(yù)測周期的逐漸縮短,LSTM 模型的預(yù)測精度顯著提高。 公路工程成本指數(shù)的微小改進對于工程預(yù)算估算的準確性有著極大的提高, 更準確的HCCI 指數(shù)有助于避免工程造價的低估和高估問題。 低估會導(dǎo)致成本超支、投資決策中出現(xiàn)財務(wù)問題、項目延期或取消;高估會導(dǎo)致公共資金預(yù)算分配效率低下。 通過LSTM 模型加強對HCCI 指數(shù)的預(yù)測,提高工程成本的估算和預(yù)算的準確性至關(guān)重要。 本研究中所提出的LSTM 方法的獨特性使其能夠有效地滿足公路建設(shè)行業(yè)成本估算師的實際需求,該方法能夠同時滿足高預(yù)測精度和低開發(fā)工作量的雙重目標。