胡剛 李潔瓊
摘 要:文章是對(duì)2018年美國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽中提出的能源發(fā)展問題進(jìn)行了分析和預(yù)測(cè)。根據(jù)題目所給出的數(shù)據(jù)對(duì)所給數(shù)據(jù),利用聚類分析對(duì)數(shù)據(jù)進(jìn)行篩選,建立模型來描述各州的能源概括問題,通過建立綜合評(píng)價(jià)體系,使用熵權(quán)法來確定指標(biāo)權(quán)重,得出評(píng)估結(jié)果;最后,利用灰色預(yù)測(cè)模型DGM(1,1)對(duì)2025年和2050年美國(guó)的能源消耗情況進(jìn)行了預(yù)測(cè)。
關(guān)鍵詞:聚類分析;熵權(quán)法;灰色預(yù)測(cè)模型
中圖分類號(hào):F426.2 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)30-0008-03
Abstract: This paper analyzes and predicts the energy development problems raised in the 2018 MCM/ICM (The Mathematical Contest in Modeling/The Interdisciplinary Contest in Modeling). According to the data given in the problem, the cluster analysis is used to screen the data, and the model is established to describe the energy generalization problem of each state. Through the establishment of the comprehensive evaluation system, the entropy weight method is used to determine the index weight. Finally, the gray prediction model DGM (1, 1) is used to predict the energy consumption of the United States in 2025 and 2050.
Keywords: cluster analysis; entropy weight method; gray prediction model
1 背景
如今能源生產(chǎn)和使用是任何經(jīng)濟(jì)結(jié)構(gòu)的主要部分,已成為了國(guó)家、地區(qū)和人們關(guān)注的熱點(diǎn)問題。隨著各個(gè)國(guó)家經(jīng)濟(jì)規(guī)模的不斷發(fā)展和擴(kuò)大,伴隨而來的是能源消耗與污染問題的日益惡化。世界各個(gè)國(guó)家意識(shí)節(jié)約能源、提高能源利用效率、使用潔凈能源替代高含碳量的礦物燃料,才是作為一個(gè)國(guó)家能夠持續(xù)發(fā)展的根本。
在美國(guó),不同地區(qū)的行業(yè)影響著能源的使用和生產(chǎn)。本文根據(jù)2018美國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽試題,對(duì)美國(guó)四個(gè)州(加利福尼亞州,亞利桑那州,新墨西哥州,得克薩斯州)的近幾十年間所生產(chǎn)和消耗的能源進(jìn)行了分類及分析,結(jié)合綜合評(píng)價(jià)方法對(duì)能源分布的合理性進(jìn)行評(píng)估。最后對(duì)未來20年的能源發(fā)展情況進(jìn)行預(yù)測(cè)。
2 數(shù)據(jù)預(yù)處理
首先根據(jù)試題附件中給出的數(shù)據(jù)利用Excel進(jìn)行預(yù)處理。從數(shù)據(jù)中獲取不同能源的總消耗量,作為分析4個(gè)州能源消耗的數(shù)據(jù)。我們選取了PATCBA、CLTCBA、TEACB、New energy.其中新能源指:Nuclear、Biological、Ethanol、The wind、Geothermal.
下面為4個(gè)州的主要經(jīng)濟(jì)結(jié)構(gòu)。
加利福尼亞(CA):主體是農(nóng)業(yè),其他重要的產(chǎn)業(yè)包括航空、娛樂和輕工業(yè),包括計(jì)算機(jī)硬件和軟件,以及硼砂開采。
亞利桑那州(AZ):制造業(yè)占重要地位,以高科技業(yè)為主,金屬冶煉業(yè)相當(dāng)發(fā)達(dá),主要部門有航空、電力、電訊、鋁制品等。
新墨西哥(NM):主要產(chǎn)業(yè)為電子與電機(jī)設(shè)備、食品與相關(guān)產(chǎn)品、交通運(yùn)輸工具、木材與木制產(chǎn)品及機(jī)械類制品 (不含電子類) 等,并是全美乳酪業(yè)成長(zhǎng)最快的地區(qū)。
得克薩斯州(TX): 20世紀(jì)80年代開始,得州推行經(jīng)濟(jì)多元化政策,雖然石油和天然氣仍是得州的主要工業(yè),但所占比重已經(jīng)下降,高科技產(chǎn)業(yè)發(fā)展迅猛。
圖1分別表述4個(gè)州1960-2009年能源的變化趨勢(shì)圖,橫坐標(biāo)表示:year,縱坐標(biāo)表示:Energy consumption。
由圖1我們可以了解到從1960-2009年新墨西州、亞利桑那州、加利福尼亞州、德克薩斯州四個(gè)州能源消耗變化趨勢(shì)。太陽(yáng)能、新能源的使用逐年增長(zhǎng),煤和石油的使用趨于平緩,但仍緩慢增長(zhǎng)。根據(jù)4個(gè)州的主要經(jīng)濟(jì)結(jié)構(gòu)來看,經(jīng)濟(jì)領(lǐng)先的州新能源應(yīng)用相對(duì)比較多,經(jīng)濟(jì)相對(duì)落后的州還在使用大量的煤和石油,新能源應(yīng)用還比較少。
我們又做了各州50年能源消耗和新能源的總和。首先繪制了各州50年能源消耗總和所占的百分比,然后繪制了各州50年新能源使用消耗總和各自所占的百分比,最后繪制了各州新能源占總能源消耗的百分比,如圖2所示橫坐標(biāo)表示各州,縱坐標(biāo)表示百分比,NE表示新能源消耗總量,50TC表示50年能源總消耗量。
綜上所述,根據(jù)提供的數(shù)據(jù),我們清楚地了解4個(gè)州的能源使用問題。以及各能源使用的情況和各能源所占的比例。即:經(jīng)濟(jì)相對(duì)發(fā)達(dá)的州消耗的能源相對(duì)比較多,新能源的使用也相對(duì)比較多。新能源所占的比也相對(duì)比較多。
3 綜合評(píng)價(jià)模型建立
綜合評(píng)價(jià)法指的是運(yùn)用多個(gè)指標(biāo)對(duì)多個(gè)參評(píng)單位進(jìn)行評(píng)價(jià)的方法,通過多元化評(píng)價(jià)對(duì)每個(gè)州的能源發(fā)展進(jìn)行一個(gè)綜合的統(tǒng)計(jì)評(píng)價(jià),從而來判斷能源走向和目標(biāo),我們初步建立了評(píng)價(jià)指標(biāo)體系,如圖3所示。
對(duì)評(píng)價(jià)指標(biāo)權(quán)重系數(shù)的確定,利用德爾菲法和熵權(quán)法[1]進(jìn)行主客觀綜合賦權(quán)。在信息論中熵是對(duì)不確定性的一種度量,信息量越大,不確定就越小,熵也越小。反之亦然。熵權(quán)法是一種客觀賦權(quán)法。通過計(jì)算指標(biāo)的信息熵相對(duì)變化程度大的指標(biāo)具有較大權(quán)重。
具體計(jì)算過程如下:
(1)指標(biāo)標(biāo)準(zhǔn)化。
式中,Sij為標(biāo)準(zhǔn)化后所得值,Aij為指標(biāo)實(shí)際值,i=1,2,…,n,j=1,2,…,m。其中,m為參評(píng)指標(biāo)個(gè)數(shù),n為參評(píng)對(duì)象個(gè)數(shù)。
(2)計(jì)算參評(píng)指標(biāo)熵值。
對(duì)于某項(xiàng)指標(biāo),指標(biāo)值差距越大,則該指標(biāo)在綜合評(píng)價(jià)中所起作用越大;如果某指標(biāo)全部相等,則該指標(biāo)在綜合評(píng)價(jià)中不起作用。
(3)計(jì)算指標(biāo)差異系數(shù)dj和確定參評(píng)指標(biāo)權(quán)數(shù)wj分別為
對(duì)指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化處理,由于各個(gè)指標(biāo)具有不同的量綱和數(shù)量級(jí),因而不具有可比性,無法進(jìn)行直接運(yùn)算。因此,在使用指標(biāo)體系進(jìn)行綜合評(píng)價(jià)前,必須將各具體指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理。
對(duì)指標(biāo)采取以下公式:
其中,Iij(k)為指標(biāo)標(biāo)準(zhǔn)數(shù)值,Aij(k)為指標(biāo)原始值,Aij(k)max為指標(biāo)的最大值,Aij(k)min為指標(biāo)的最小值。
最后,用每一個(gè)指標(biāo)的標(biāo)準(zhǔn)值乘其權(quán)重并相加的方法,得到最終的工業(yè)惡化程度的綜合指數(shù):
指標(biāo)數(shù)據(jù)處理與計(jì)算采用德爾菲法和熵權(quán)法計(jì)算指標(biāo)權(quán)重。根據(jù)上述熵值計(jì)算步驟,對(duì)原始數(shù)據(jù)經(jīng)行處理,計(jì)算出各項(xiàng)指標(biāo)的客觀權(quán)重,再根據(jù)主客觀綜合賦權(quán)法,得到各項(xiàng)指標(biāo)的綜合權(quán)重。最終獲得了四個(gè)州的綜合評(píng)價(jià)結(jié)果,如表1。
從綜合評(píng)價(jià)結(jié)果看,加利福尼亞州綜合指數(shù)高,綜合水平高,在清潔能源的使用時(shí)表現(xiàn)了最佳形象。
4 能源發(fā)展預(yù)測(cè)
根據(jù)四個(gè)州能源使用的歷史演變。我們將采用灰色預(yù)測(cè)模型來預(yù)測(cè)2025年和2050年能源使用情況。
一般灰色預(yù)測(cè)模型有灰色預(yù)測(cè)GM(1,1)模型、離散灰色預(yù)測(cè)DGM(1,1)模型和灰色Verhulst模型等[2-3]。我們選取離散灰色預(yù)測(cè)DGM(1,1)模型,離散DGM(1,1)模型也是基于灰色預(yù)測(cè)模型的建模機(jī)理的灰色預(yù)測(cè)模型,也稱為離散灰色系統(tǒng)模型。利用DGM(1,1)做純指數(shù)增長(zhǎng)序列預(yù)測(cè)模擬,結(jié)果比較符合增長(zhǎng)規(guī)律,解決了灰色預(yù)測(cè)中的穩(wěn)定性問題。
則灰色微分方程x(1)(k+1)=?茁1x(1)(k)+?茁2的最小二乘估計(jì)參數(shù)列滿足:=(BTB)-1BTY,則x(1)(k+1)=?茁1x(1)(k)+?茁2稱為DGM(1,1)模型。
利用DGM(1,1)模型對(duì)4個(gè)州化石燃料和清潔能源消耗量進(jìn)行模擬和預(yù)測(cè)。模擬1960-2009年各州能源消耗的情況,預(yù)測(cè)2025年和2050年化石燃料和清潔能源的消耗量,并比較分析,利用MATLAB軟件,我們得到預(yù)測(cè)結(jié)果。
同時(shí)為了檢驗(yàn)預(yù)測(cè)模型的準(zhǔn)確性,我們隨即抽取一組數(shù)據(jù)進(jìn)行誤差分析,利用折線圖來描述實(shí)際值與預(yù)測(cè)值進(jìn)行比較。結(jié)果如圖4所示
由結(jié)果可知:加利福尼亞州的清潔能源在2025年和2050年都比化石燃料消耗得多,其他三個(gè)州清潔能源的使用雖然也逐年遞增,但主要能源的消耗還是化石燃料。實(shí)際值和預(yù)測(cè)值的偏差誤差較小,說明模型預(yù)測(cè)能力強(qiáng),模型預(yù)測(cè)準(zhǔn)確,可信度高。
5 改進(jìn)和建議
模型缺點(diǎn):(1)沒有考慮題目以外的因素。(2)模型本身存在一定的誤差,答案不夠精確,具有一定的局限性。
模型改進(jìn):(1)在條件允許的情況下,加入更多的現(xiàn)實(shí)因素。(2)利用誤差分析的結(jié)果對(duì)模型進(jìn)行修改。(3)可加入靈敏度分析,提高準(zhǔn)確性。
參考文獻(xiàn):
[1]王兵.可再生能源系統(tǒng)風(fēng)險(xiǎn)評(píng)估方法及其應(yīng)用研究[D].北京理工大學(xué),2016.
[2]劉思峰,蔡華,楊英杰,等.灰色關(guān)聯(lián)分析模型研究進(jìn)展[J].系統(tǒng)工程理論與實(shí)踐,2013(08).
[3]劉思峰,鄧聚龍.GM(1,1)模型的適用范圍[J].系統(tǒng)工程理論與實(shí)踐,2000(05).