付 沙 周航軍 楊 波 肖葉枝
(湖南財(cái)政經(jīng)濟(jì)學(xué)院,湖南長沙410205)
基于信息熵多屬性決策的統(tǒng)計(jì)信息綜合評(píng)價(jià)研究
付 沙 周航軍 楊 波 肖葉枝
(湖南財(cái)政經(jīng)濟(jì)學(xué)院,湖南長沙410205)
〔摘 要〕針對(duì)當(dāng)前權(quán)重確定方法單一、傳統(tǒng)熵權(quán)計(jì)算方式不足等問題,構(gòu)建一種基于信息熵多屬性決策的綜合評(píng)價(jià)模型。該模型運(yùn)用改進(jìn)層次分析法確定全體決策者對(duì)各指標(biāo)的主觀權(quán)重,以信息熵理論確定各指標(biāo)的客觀權(quán)重,并結(jié)合主觀與客觀權(quán)重作為最終評(píng)價(jià)的綜合權(quán)重。在此基礎(chǔ)上依據(jù)多屬性決策模型提出多屬性決策評(píng)價(jià)方法,該方法將主、客觀分析相結(jié)合,既考慮權(quán)重的現(xiàn)實(shí)性,又以數(shù)據(jù)作為評(píng)價(jià)基礎(chǔ),能有效解決選擇評(píng)價(jià)中的不確定多屬性決策問題。論文通過對(duì)湖南統(tǒng)計(jì)年鑒中數(shù)據(jù)的分析,驗(yàn)證了所提方法的可行性與有效性。
〔關(guān)鍵詞〕信息熵;多屬性決策;統(tǒng)計(jì)信息;綜合權(quán)重
多屬性決策(Multiple Attribute Decision Making,MADM)是現(xiàn)代決策科學(xué)的一個(gè)重要組成部分,主要用于解決多個(gè)屬性情況下的有限方案決策問題,其實(shí)質(zhì)是利用已有決策信息,通過一定方式對(duì)有限個(gè)備選方案進(jìn)行排序擇優(yōu)。其理論和方法已廣泛應(yīng)用到社會(huì)生活、工程設(shè)計(jì)、系統(tǒng)工程以及管理科學(xué)等領(lǐng)域?,F(xiàn)實(shí)生活中,由于人類思維的模糊性以及客觀事物的復(fù)雜性與不確定性,人們?cè)跊Q策過程中對(duì)評(píng)價(jià)事物往往難以給出確切的數(shù)值,而是以模糊數(shù)等形式的不確定信息來評(píng)定[1]。此類決策問題目前在國內(nèi)外專家學(xué)者中有著較高的關(guān)注度,如文獻(xiàn)[2]利用信息熵理論對(duì)多屬性決策指標(biāo)進(jìn)行規(guī)范化處理的方法,得到了待決策方案的優(yōu)化屬性值,從而達(dá)到更為精確地判斷決策方法優(yōu)劣的效果。文獻(xiàn)[3]通過將信息熵引入到不確定多屬性評(píng)價(jià)決策模型中,建立了我國商業(yè)銀行操作風(fēng)險(xiǎn)的多屬性評(píng)價(jià)方法。文獻(xiàn)[4]針對(duì)多屬性決策過程中同時(shí)存在多種特征的定性與定量不確定信息,且屬性權(quán)重未知的情況,提出基于不確定信息熵和證據(jù)推理的不確定多屬性決策方法。文獻(xiàn)[5]運(yùn)用信息熵和結(jié)構(gòu)元理論,探討了權(quán)重完全未知情況下的模糊多屬性決策方法,構(gòu)建了模糊多屬性決策模型,并將該方法運(yùn)用到干部考核、評(píng)估等問題中。
湖南幅員遼闊,物產(chǎn)富饒,俗有“湖廣熟,天下足”之謂,是著名的“漁米之鄉(xiāng)”。全省轄13個(gè)市、1個(gè)自治州、122個(gè)縣(市、區(qū)),在這片三湘大地上,生活著漢、土家、苗、侗、回等56個(gè)民族7 090萬湖湘兒女。全省實(shí)有耕地總資源378.9萬公頃,至2010年底,全省有林地面積1.51億畝,森林覆蓋率為57.01%。主要農(nóng)副產(chǎn)品產(chǎn)量如糧食、棉花、油料、苧麻、烤煙及豬肉等均位居全國前列。湖南礦產(chǎn)豐富,礦種齊全,是馳名中外的“有色金屬之鄉(xiāng)”和“非金屬礦之鄉(xiāng)”。基于上述描述,以湖南統(tǒng)計(jì)信息網(wǎng)發(fā)布的2008-2012年《湖南統(tǒng)計(jì)年鑒》中“湖南的一天”數(shù)據(jù)為例,根據(jù)信息熵多屬性決策的綜合評(píng)價(jià)模型對(duì)其進(jìn)行分析與評(píng)價(jià)。
熵的概念最早由Clausius于1865年提出,之后信息論之父C.E.Shannon在1948年將熵的概念引入信息領(lǐng)域,利用“信息熵”作為衡量信息紊亂程度的測度[6]。熵的概念從宏觀上反映了系統(tǒng)在微觀狀態(tài)下的不確定性程度。
信息熵(Shannon熵)在隨機(jī)事件發(fā)生之前,它是對(duì)于結(jié)果不確定性的量度;在隨機(jī)事件發(fā)生之后,它是從該事件中所獲信息的量度(信息量)。信息熵是系統(tǒng)無序程度的度量,其某項(xiàng)指標(biāo)的指標(biāo)值變異程度越大,信息熵越小,該指標(biāo)所提供的信息量越大,其權(quán)重也應(yīng)越大。信息熵的運(yùn)用可減少確定指標(biāo)權(quán)重的主觀性與隨意性。在信息論中,信息熵用于表示系統(tǒng)的不確定性。它是多屬性系統(tǒng)的一個(gè)狀態(tài)函數(shù),熵值越大,表明系統(tǒng)越不確定,越無序;熵值越小,則該系統(tǒng)越高效有序,且經(jīng)濟(jì)效益越高。
假設(shè)系統(tǒng)可能處于n種不同狀態(tài):{S1,S2,…,Sn},Pi表示系統(tǒng)處于狀態(tài)Si下的概率,其中i=1,2,…,n,0≤Pi,則系統(tǒng)X的熵為:
熵具有極值性,當(dāng)系統(tǒng)狀態(tài)為等概率,即Pi=1/n時(shí),熵取最大值Hmax=lnm,利用Hmax對(duì)式(4)進(jìn)行歸一化處理得到衡量各指標(biāo)的相對(duì)重要性熵值為:
當(dāng)pij(j=1,2,…,m)取等值時(shí),熵ei為最大值1,即ei滿足0≤ei≤1。
2.1問題描述
對(duì)于某一多屬性決策問題,假設(shè)方案集為A={A1,A2,…,Am},屬性集為C={C1,C2,…,Cn},屬性的權(quán)重向量為w={w1,w2,…,wn},且。本文依據(jù)各方案屬性值的表達(dá),分析探討如何構(gòu)建基于信息熵多屬性決策的綜合評(píng)價(jià)模型。
2.2算法步驟
針對(duì)文中探討的基于信息熵多屬性決策的綜合評(píng)價(jià)模型構(gòu)建,其具體步驟如下:
Step 1依據(jù)給定各方案在各指標(biāo)下的評(píng)價(jià)值,構(gòu)造m個(gè)方案n個(gè)評(píng)價(jià)指標(biāo)的判斷矩陣A=(xij)m×n,xij表示第i個(gè)方案的第j個(gè)指標(biāo)值。
Step 2判斷矩陣的規(guī)范化處理。為消除指標(biāo)間由于量綱不同而影響決策結(jié)果,可對(duì)指標(biāo)值的判斷矩陣進(jìn)行規(guī)范化處理,由此得到規(guī)范化決策矩陣Y=(yij)m×n。
在多屬性決策問題中常見屬性類型為效益型與成本型,效益型指標(biāo)的值越大越好;而成本型指標(biāo)的值則越小越好。
效益型指標(biāo):
成本型指標(biāo):
其中,i=1,2,…,m;j=1,2,…,n。
Step 3依據(jù)熵的定義確定第j個(gè)指標(biāo)的信息熵值。
Step 4計(jì)算第j項(xiàng)指標(biāo)的熵權(quán)[8]。
Step 5計(jì)算每個(gè)屬性的客觀權(quán)重比重與綜合權(quán)重。
設(shè)每個(gè)屬性的客觀權(quán)重所占比重為qj,則主觀權(quán)重所占比重為pj,且qj+pj=1,j=1,2,…,n。
運(yùn)用模糊層次分析法確定全體決策者對(duì)各屬性的權(quán)重z,計(jì)算屬性的綜合權(quán)重wj。
Step 6從方案集A中定義相對(duì)的理想方案與負(fù)理想方案:
將方案i與理想方案的距離記為
方案i與負(fù)理想方案的距離為
其中,i=1,2,…,m。
最后,依據(jù)Ui的大小進(jìn)行排序,即可獲得最優(yōu)方案。
《湖南統(tǒng)計(jì)年鑒》系統(tǒng)收錄了全省及各市、州、縣連續(xù)若干年經(jīng)濟(jì)與社會(huì)發(fā)展方面的大量統(tǒng)計(jì)數(shù)據(jù),以及重要?dú)v史年份的全省主要統(tǒng)計(jì)數(shù)據(jù),是一部全面反映湖南省經(jīng)濟(jì)和社會(huì)發(fā)展情況的資料性年刊。為了更直觀地闡述基于信息熵多屬性決策的綜合評(píng)價(jià)模型作用機(jī)理,本文以湖南省政府統(tǒng)計(jì)門戶網(wǎng)站“湖南統(tǒng)計(jì)信息網(wǎng)”發(fā)布的2008-2012年《湖南統(tǒng)計(jì)年鑒》中“湖南的一天”子欄目為例[9],其統(tǒng)計(jì)信息評(píng)價(jià)如表1所示。
表1 湖南省統(tǒng)計(jì)信息評(píng)價(jià)指標(biāo)
表1?。ɡm(xù))
(1)依據(jù)式(3)~(4)將表1的指標(biāo)數(shù)據(jù)進(jìn)行規(guī)范化處理,利用式(5)~(6)計(jì)算熵值Hj和熵權(quán)ej。
Hj=(0.76271,0.79490,0.71345,0.79467,0.80970,0.72782,0.67340,0.67941,0.67058,0.64919,0.75950,0.84205,0.82370,0.76668,0.77474,0.67759,0.69317,0.71475,0.61359,0.83747,0.67491,0.68729,0.79573,0.76275,0.82028,0.72323,0.79530,0.17744,0.79338,0.78766,0.82901,0.80689,0.84317,0.71037)
ej=(0.02871,0.02790,0.02995,0.02790,0.02753,0.02959,0.03096,0.03081,0.03103,0.03157,0.02879,0.02671,0.02717,0.02861,0.02841,0.03086,0.03046,0.02992,0.03247,0.02683,0.03092,0.03061,0.02788,0.02871,0.02726,0.02971,0.02789,0.04347,0.02794,0.02808,0.02704,0.02760,0.02668,0.03003)
(2)根據(jù)式(7)可得qj:
qj=(0.44193,0.45913,0.38293,0.53114,0.54025,0.48909,0.43260,0.32925,0.44510,0.42627,0.50594,0.60010,0.57692,0.47660,0.44806,0.41736,0.40144,0.40914,0.39237,0.67918,0.37917,0.37792,0.49119,0.48161,0.50894,0.53858,0.57441,0.21444,0.53297,0.52690,0.55366,0.49133,0.66328,0.46238)
(3)運(yùn)用文獻(xiàn)[10]提出的模糊層次分析法確定各屬性權(quán)重z,然后依據(jù)式(8)計(jì)算屬性的綜合權(quán)重wj。
wj=(0.02999,0.02958,0.03060,0.02795,0.02774,0.02929,0.02985,0.02893,0.02935,0.03010,0.02840,0.02723,0.02752,0.02829,0.02708,0.02919,0.02899,0.02879,0.02975,0.02720,0.03097,0.03085,0.02947,0.02782,0.02811,0.02938,0.02836,0.03132,0.03030,0.03041,0.02970,0.02984,0.02881,0.03109)
(4)從方案集中定義相對(duì)的理想方案f和負(fù)理想方案v。
f=(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,0,1,0)
v=(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,0,1,0,1)
(5)運(yùn)用式(9)~(10)得到:
S+=(0.72798,0.61109,0.39578,0.23426,0.14572)
S-=(0.17399,0.17148,0.27381,0.43897,0.78846)
(6)根據(jù)式(11)可得:
Ui=(0.19290,0.21912,0.40893,0.65204,0.84402)
由此,“湖南的一天”統(tǒng)計(jì)信息評(píng)價(jià)得分的結(jié)果如圖1所示。
圖1 “湖南的一天”統(tǒng)計(jì)信息評(píng)價(jià)得分情況
經(jīng)湖南省統(tǒng)計(jì)局核算,曾以“魚米之鄉(xiāng)”著稱的湖南,農(nóng)業(yè)生產(chǎn)已先后被工業(yè)及服務(wù)業(yè)趕超。2011年湖南省經(jīng)濟(jì)發(fā)展保持平穩(wěn)較快增長,工業(yè)領(lǐng)域增長顯著:全省規(guī)模工業(yè)實(shí)現(xiàn)增加值8 122.76億元,增長20.1%。主要工業(yè)產(chǎn)品中,74.1%的產(chǎn)品產(chǎn)量增幅較大,產(chǎn)銷率達(dá)98.71%,同比提高0.11個(gè)百分點(diǎn)。根據(jù)圖表統(tǒng)計(jì)信息整理及分析,得出:原油加工量增長28.6%,鋼材增長7.5%,原煤增長6.5%,水泥增長6.3%。2011年原煤較2007年增長68.3%,水泥較2007年增長66.5%,原油加工量較2007年增長24.6%。
與之相比,經(jīng)濟(jì)總量位列第三的第一產(chǎn)業(yè)中,糧食總產(chǎn)量增長3.2%,豬牛羊肉減少1.5%,水產(chǎn)品增長0.57%,油料增長10.3%,增幅表現(xiàn)平穩(wěn)。在消費(fèi)方面,2011年城鄉(xiāng)居民消費(fèi)總額、平均每人消費(fèi)額分別增長11.3、12.3,較2007年分別增長68.1、78.2。值得關(guān)注的二級(jí)指標(biāo)有:2011年郵電業(yè)務(wù)總量較2007年減少30.7%,苧麻較2007年減少68.8%。
從2008-2012年,我省GDP由11 156.64億元增長到22 154.23億元,連續(xù)5年列全國前十,增長近2倍。一系列的數(shù)據(jù)印證了湖南在多方面實(shí)力逐步提升:(1)工業(yè)生產(chǎn)平穩(wěn)增長;(2)農(nóng)業(yè)基礎(chǔ)地位得到鞏固;(3)基礎(chǔ)設(shè)施不斷完善;(4)居民消費(fèi)保持旺勢;(5)外引內(nèi)聯(lián)成效明顯。從多項(xiàng)數(shù)據(jù)分析亦可看出,湖南人民同心協(xié)力、開拓進(jìn)取,全省經(jīng)濟(jì)建設(shè)不斷發(fā)展,社會(huì)事業(yè)突飛猛進(jìn),綜合實(shí)力顯著增強(qiáng),人民生活水平穩(wěn)步提高。
本文首先運(yùn)用改進(jìn)層次分析法確定全體決策者對(duì)各指標(biāo)的主觀權(quán)重,然后應(yīng)用信息熵理論確定指標(biāo)的客觀權(quán)重,再通過建立綜合權(quán)重模型將決策者的主觀權(quán)重與樣本自身產(chǎn)生的熵權(quán)相結(jié)合,采取一定的方式混合加權(quán)計(jì)算綜合權(quán)重。在此基礎(chǔ)上結(jié)合多屬性決策模型提出多屬性決策評(píng)價(jià)方法,將主、客觀分析相結(jié)合,既減少?zèng)Q策問題的主觀性,又能量化整個(gè)評(píng)價(jià)過程,有效解決了選擇評(píng)價(jià)中的不確定多屬性決策問題,具有良好的應(yīng)用推廣與實(shí)際決策價(jià)值,可廣泛應(yīng)用于供應(yīng)鏈選擇、項(xiàng)目評(píng)估、投資決策以及經(jīng)濟(jì)效益綜合評(píng)價(jià)等相關(guān)決策問題中。
參考文獻(xiàn)
[1]張市芳,劉三陽,翟任何.動(dòng)態(tài)直覺模糊多屬性決策的VIKOR擴(kuò)展方法[J].計(jì)算機(jī)科學(xué),2012,39(2):240-243.
[2]余勝春.基于信息熵的多屬性參數(shù)系統(tǒng)決策方法[J].數(shù)學(xué)雜志,2012,32(6):1111-1114.
[3]張晨,朱衛(wèi)東,楊善林.基于信息熵的商業(yè)銀行操作風(fēng)險(xiǎn)多屬性評(píng)價(jià)方法研究[J].預(yù)測,2007,26(5):55-58,63.
[4]尹德進(jìn),王宏力.基于信息熵與證據(jù)推理的不確定多屬性決策方法[J].計(jì)算機(jī)應(yīng)用,2011,31(5):1308-1310,1412.
[5]劉海濤,郭嗣琮.基于結(jié)構(gòu)元理論及信息熵的模糊多屬性決策方法[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2009,39(17):1-5.
[6]梁吉業(yè),錢宇華.信息系統(tǒng)中的信息粒與熵理論[J].中國科學(xué)E輯:信息科學(xué),2008,38(12):2048-2065.
[7]張近東,任杰.熵理論中熵及熵權(quán)計(jì)算式的不足與修正[J].統(tǒng)計(jì)與信息論壇,2011,26(1):3-5.
[8]何滿輝,逯林.基于信息熵多屬性決策的物流供應(yīng)商選擇評(píng)價(jià)[J].工程設(shè)計(jì)學(xué)報(bào),2013,20(1):6-10.
[9]湖南統(tǒng)計(jì)信息網(wǎng).湖南統(tǒng)計(jì)年鑒[EB/OL].http:∥www.hntj. gov.cn/sjfb/tjnj/,2013-07-17.
[10]付沙,廖明華,肖葉枝.模糊層次分析法在信息安全領(lǐng)域中的研究探索[J].情報(bào)學(xué)報(bào),2012,31(10):1105-1109.
(本文責(zé)任編輯:孫國雷)
The Statistics Comprehensive Evaluation Research Based on Entropy Multi-attribute Decision Making
Fu Sha Zhou Hangjun Yang Bo Xiao Yezhi
(Hunan University of Finance and Economics,Changsha 410205,China)
〔Abstract〕The paper construct a multi-attribute decision making comprehensive evaluation model based on information entropy,for the single method of weight determining and less calculation methods of traditional entropy weight and other issues.The model uses improved AHP to determine the subjective weighting of each index of all decision-makers,to determine the objective weight of each index based on the information entropy theory,and combined with subjective and objective weight as the comprehensive weight of final evaluation.Then proposed multi-attribute decision evaluation method based on multi-attribute decision model,this method combined the subjective and objective analysis,consider the reality of weight and uses data as the evaluation,it can effectively solve the uncertain multi-attribute decision making problems in selection and evaluation process.The paper verified the feasibility and effectiveness of the proposed method by the analysis of the data in Hunan Statistical Yearbook.
〔Key words〕entropy;multi-attribute decision making;statistics;comprehensive weight
作者簡介:付 沙(1980-),男,副教授,碩士,研究方向:決策分析、信息系統(tǒng)安全。
基金項(xiàng)目:湖南省社科基金項(xiàng)目(項(xiàng)目編號(hào):No.14YBA065);湖南省教育廳科學(xué)研究項(xiàng)目(項(xiàng)目編號(hào):No.14C0184)。
收稿日期:2015-06-29
〔中圖分類號(hào)〕G254.92
〔文獻(xiàn)標(biāo)識(shí)碼〕A
〔文章編號(hào)〕1008-0821(2015)08-0126-05
DOI:10.3969/j.issn.1008-0821.2015.08.024