蘇術(shù)鋒
(鹽城工學院 經(jīng)濟與管理學院,江蘇 鹽城 224051)
綜合評價(comprehensive evaluation,CE)是指對被評價對象所進行的客觀、公正、合理的全面評價。在綜合評價中,按主客觀賦權(quán),將其方法分為兩類:主觀賦權(quán)法和客觀賦權(quán)法。主觀賦權(quán)需要客觀根據(jù)指標之間相對重要程度確定權(quán)重??陀^賦權(quán)法是根據(jù)評價指標數(shù)據(jù)差異程度確定權(quán)數(shù);差異越大,賦權(quán)越大??陀^賦權(quán)法有拉開檔次法、均方差法、極差法、熵值法、秩和比法、變異系數(shù)法、復(fù)相關(guān)系數(shù)法、標準差法、人工神經(jīng)網(wǎng)絡(luò)法等[1~6]。
通過梳理國內(nèi)外文獻,發(fā)現(xiàn)對客觀賦權(quán)綜合研究法的有效性未進行深入的研究,缺乏相應(yīng)的文獻。因此,本文專門研究客觀賦權(quán)綜合評價方法的有效性問題。
權(quán)重是某一指標對評價指標相對重要程度。用若干個指標x1,x2,…,xp進行綜合評價時,各指標并非同等重要,故要給其賦權(quán)重。權(quán)重越大,指標越重要;反之亦然[7]。
有效性是指某一評價方法在綜合評價中,達到大家公認評價方法的效果。
公理1:方法A得到大家一致認可。利用方法A對事物S評價,得評價結(jié)果C,大家同樣也一致認可;如果方法B對事物S評價,得評價結(jié)果D。若D=C,則方法B有效;若D≠C,則方法B無效。
表1為某一項目10個評價對象,x1和x2表示兩個評價指標。用式(1)對各評價對象進行評價。
其中,wj為指標xj的權(quán)重;xij是指標值。
表1 某一評價項目值
對表1項目進行評價,主觀賦權(quán),大家一致認為x1和x2同等重要,故賦相等權(quán)重,得:
由式(1),式(2)和表1,得每個評價對象總分,見表1總分和排名。表1中的總分Z和名次P是公認評價結(jié)果。
由于客觀賦權(quán)法有多種方法,在此,只驗算熵權(quán)法,均方差法和拉開檔次法三種方法。
2.3.1 熵權(quán)法
(1)熵權(quán)法模型[1]
①計算第j項指標下,第i個被評對象的特征比重
②計算第j項指標的熵值
③確定權(quán)數(shù)
(2)熵權(quán)法模型求解
由熵權(quán)法,對表1數(shù)據(jù)計算可得:ws1=(0.30795,0.69205)
ws1權(quán)重總和為1,而w1權(quán)重總和為2,為了二者可比性,將ws1乘2可得ws2。
ws2與w1平均累計誤差:
根據(jù)式(1),計算可得表2熵權(quán)總分S和排名S
通過上面分析可知,平均權(quán)重誤差為0.2716,平均總分誤差1.6848,平均排名誤差0.3461202。
2.3.2 拉開檔次法
(1)拉開檔次法模型[1]
(2)拉開檔次法求解
由拉開檔次法,用MATLAB7.0求H=ATA,得H的值。用MATLAB7.0,求H的特征向量矩陣V及特征值矩陣D。[V,D]=eig(H),其中:V為特征向量矩陣;D特征值矩陣。取D中最大特征值:λmax=6.5255;其對應(yīng)特征向量Vmax權(quán)重:
wl0=(0.62931,0.77716)T。對wl0歸一化得:
wl1=(0.44744,0.55256)T
為了與w1對比,將wl1乘2得wl2:
計算wl2w1與,平均累計誤差
使用wl2和表1中指標,按式(1)式計算,可得表2拉開檔次總分L,拉開檔次名次L。
通過上面分析可知,拉開檔次法平均權(quán)重誤差0.074331,平均總分誤差0.46109,平均排名誤差0.2828427。
2.3.3 均方差法
(1)均方差法模型[1]
(2)均方差法求解
由均方差法,對表1數(shù)據(jù)計算可得權(quán)重:
為了與w1對比,將wf1乘2得wf2:
計算wf2與w1平均累計誤差:
使用wf2和表1中指標,按式(1)式計算,可得表2均方差總分F,均方差名次F。
通過上面分析可知,平均權(quán)重誤差0.25911,平均總分誤差1.5977,平均排名誤差0.2828427。
表2 三種評價方法與主觀賦權(quán)法比較
雖然客觀賦權(quán)法與主觀賦權(quán)法存在不一致,但各種客觀賦權(quán)法與主觀賦權(quán)法還可以比較相對有效性。比較原則:名次誤差最小為優(yōu);名次誤差相同,總分誤差小,為最優(yōu);如果名次和總分誤差相同,則權(quán)數(shù)誤差小,為最優(yōu)。由表2中的三種方法名次,比較可得表3。
表3 三種方法相對有效性排名
三種方法相對有效性:拉開檔次法>均方差法>熵權(quán)法。
表1中排名P,是主觀賦權(quán)評價的結(jié)果,是大家一致公認的。但用熵權(quán)法拉開檔次法和均方差法對表1中的學生成績進行評價,其結(jié)果均與大家公認的排名P不一致。根據(jù)公理1,熵權(quán)法、拉開檔次法和均方差三種評價法均無效。
這里只對熵權(quán)法進行分析,其它方法類似。
用熵權(quán)法,x1權(quán)重0.6159,x2權(quán)重1.384。就表4中S4與S5而言,S5的x2的100與S4的x1的100分是不等價的;S5的x2的100計算到總分中的分值是100×1.384=138.4,而S4的x1的100計算到總分中的分值是100×0.6159=61.59,從而造成了S5(總分177)排到S4(總分178)前面的不合理結(jié)果。這樣的評價結(jié)果與評價者主觀愿望不一致,從而使評價者不能接受[1]。其它的評價對象S6、S7、S8、S9排名問題基本上與S4和S5一樣。所以客觀賦權(quán)法與主觀評價法名次不一致的原因是客觀賦權(quán)數(shù)據(jù)差異賦權(quán)造成的。
表4 熵權(quán)法名次差異情況
客觀賦權(quán)法是根據(jù)數(shù)據(jù)差異確定指標權(quán)重的。數(shù)據(jù)差異越大,指標權(quán)數(shù)就越大。但數(shù)據(jù)差異程度大小并不能反映指標的重要程度。二者不是一個概念,強行將數(shù)據(jù)差異程度等同于指標的重要程度是不正確的,所以客觀賦權(quán)通過數(shù)據(jù)差異程度來確定指標的權(quán)重,從理論上講,是不正確的。
第一,權(quán)重是指標的重要程度的表述,確定權(quán)重的基本方法就是比較指標之間的重要程度,它與樣本數(shù)據(jù)無關(guān)。沒有評價樣本數(shù)據(jù)之前,只要確定好各指標,就可以確定出各指標的權(quán)重。而數(shù)據(jù)差異的客觀賦權(quán),即使有了各指標體系,在沒有樣本的情況下,無法確定指標的權(quán)重。第二,數(shù)據(jù)差異的客觀賦權(quán),相同的指標體系,換了一組數(shù)據(jù)樣本,其指標權(quán)重就會發(fā)生變化,這是非常不合理的。第三,數(shù)據(jù)差異來確定權(quán)重,與權(quán)重的定義相悖。數(shù)據(jù)差異說明不了指標是否重要。第四,通過主觀賦權(quán)一個簡單實例,就會發(fā)現(xiàn)數(shù)據(jù)差異的客觀賦權(quán)法存在問題。第五,客觀賦權(quán)缺乏理論支持,故它不是學術(shù)界以后的研究方向。總之,數(shù)據(jù)差異的客觀賦權(quán)缺乏理論根據(jù),是一種存在瑕疵、有效性不穩(wěn)定的方法。
[1]郭亞軍.綜合評價理論、方法及拓展[M].北京:科學出版社,2012.
[2]胡斌,章仁俊.基于秩和比法的區(qū)域科技發(fā)展水平比較研究[J].工業(yè)技術(shù)經(jīng)濟,2004,(12).
[3]孫凱,鞠曉峰.基于變異系數(shù)法的企業(yè)孵化器運行績效評價[J].哈爾濱理工大學學報,2007,(6).
[4]梅國平.基于復(fù)相關(guān)系數(shù)法的公司績效評價實證研究[J].黑龍江水利科技,2004,(1).
[5]張詠祀.標準差法在森林立地質(zhì)量評價中的應(yīng)用[J].西華師范大學學報,2008,(12).
[6]朱大奇.人工神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀及其展望[J].江南大學學報,2004,(2).
[7]胡永宏,賀思輝.綜合評價方法[M].北京:科學出版社,2000.