姜寶勝,吳 飛,張靜怡,龔佃選
(1. 華北理工大學(xué) 數(shù)學(xué)建模創(chuàng)新實(shí)驗(yàn)室,河北 唐山 063000;2. 華北理工大學(xué) 理學(xué)院,河北 唐山 063000)
基于熵值法的Goodgrant基金最優(yōu)分配策略
姜寶勝1,吳飛1,張靜怡1,龔佃選2*
(1. 華北理工大學(xué) 數(shù)學(xué)建模創(chuàng)新實(shí)驗(yàn)室,河北 唐山063000;2. 華北理工大學(xué) 理學(xué)院,河北 唐山063000)
Goodgrant基金會是美國的一個慈善組織,它希望通過慈善捐助來提高本科生教育績效。為了更好的利用這筆資金,需要進(jìn)行投資策略的研究。首先將所有候選學(xué)校用SPSS進(jìn)行K -均值聚類分析,依據(jù)聚類結(jié)果分為6類。在相同類別中的學(xué)校,用MATLAB中的三角形線性插補(bǔ)法進(jìn)行缺失數(shù)據(jù)的填補(bǔ)。然后將13個績效影響因素歸納為生源質(zhì)量、學(xué)校發(fā)展情況、學(xué)校及學(xué)生財務(wù)狀況三個一級指標(biāo)。通過熵值法客觀地確定學(xué)??冃гu價的權(quán)重系數(shù)。利用熵值法計算出一級二級指標(biāo)的權(quán)重,進(jìn)行綜合評價。按照評價標(biāo)準(zhǔn)計算出每個學(xué)校當(dāng)前的績效值,并以此對所有學(xué)校進(jìn)行初步排名。選取排名前十的學(xué)校,依據(jù)每個學(xué)校的績效值及辦學(xué)規(guī)模確定獎學(xué)金金額。
K-均值聚類;熵值法;性插補(bǔ)法;績效值
本文著錄格式:姜寶勝,吳飛,張靜怡,等. 基于熵值法的Goodgrant基金最優(yōu)分配策略[J]. 軟件,2016,37(9):24-26
高等教育捐贈是一種常見的慈善捐贈,是美國高校尤其是民辦高校的重要收入來源。Goodgrant基金會是一個新的慈善組織,該組織計劃每年給符合條件的學(xué)校捐贈2億美元[1]。在對學(xué)校進(jìn)行主觀評價時,從整體性能上往往難以進(jìn)行評價。所以,一般先根據(jù)評價系統(tǒng)中的整體特性判斷評價指標(biāo),而確定各指標(biāo)權(quán)重則結(jié)合相應(yīng)的數(shù)學(xué)方法,評價指標(biāo)的最終得分由指標(biāo)得分和權(quán)重確定[2]。在評價方法的選取上常用層次分析法和模糊層次分析法,但這些方法都包含了主觀賦值的過程,評價結(jié)果受評價者主觀意愿影響較大[3]。熵值法是基于信息熵的原理,通過各指標(biāo)值所提供信息量的大小來確定指標(biāo)權(quán)重,屬于客觀賦權(quán)法。熵值法有效地彌補(bǔ)了層次分析法等方法主觀隨意性較大的缺陷[4]。因此,本文提出了基于熵值法的學(xué)??冃гu價方法,通過熵值法對權(quán)重指標(biāo)進(jìn)行計算,制定科學(xué)的評價標(biāo)準(zhǔn)。
在收集學(xué)校指標(biāo)數(shù)據(jù)的過程中,不可避免回出現(xiàn)數(shù)據(jù)缺失的現(xiàn)象,需要進(jìn)行缺失數(shù)據(jù)的填補(bǔ)。由于不同學(xué)校的差別很大,根據(jù)整體樣本數(shù)據(jù)進(jìn)行填補(bǔ)的話誤差較大,所以要對學(xué)校進(jìn)行分類。本文采用K-均值聚類進(jìn)行分類[5]。
1.1K-均值算法
1)假設(shè)數(shù)據(jù)樣本集的大小為n,設(shè)1I=,選取K個初始聚類中心:;如果滿足則
2)計算聚類中心到每一個數(shù)據(jù)樣本的距離:
3)進(jìn)行誤差平方和準(zhǔn)則函數(shù)JC計算:
1.2聚類結(jié)果
將樣本數(shù)據(jù)進(jìn)行聚類,分為6類。由于數(shù)據(jù)量過大只展示部分結(jié)果。聚類的結(jié)果如圖1:
圖1 聚類結(jié)果
根據(jù)聚類結(jié)果,在相同類別中的學(xué)校,用MATLAB中的三角形線性插補(bǔ)法進(jìn)行缺失數(shù)據(jù)的填補(bǔ)。
2.1熵值法進(jìn)行綜合評價的步驟
1)無量綱化處理
將各指標(biāo)值ijx轉(zhuǎn)化為無單位的相對數(shù)ijx'。計算方法為:對于正向指標(biāo)對于逆向指標(biāo):
第j項指標(biāo)的信息熵值為:式中常數(shù)K和系統(tǒng)樣本數(shù)m相關(guān)。在一個信息完全無序的系統(tǒng)中,其有序度為零,熵值最大,1e=,m個樣本處于完全無序分布狀態(tài)時,,這時
3)指標(biāo)信息熵值e和信息效用值d的計算[6]。某項指標(biāo)的信息效用價值取決于該指標(biāo)的信息熵je與1之間的差值:
2.2評價指標(biāo)權(quán)重的計算
利用熵值法估算各指標(biāo)的權(quán)重,本質(zhì)上是利用指標(biāo)信息的價值系數(shù)來計算,其價值系數(shù)與評價的重要性成正比。最后能夠得到第j項指標(biāo)的權(quán)重,為:
權(quán)重結(jié)果如表1:
表1 績效指標(biāo)權(quán)重
2.3績效指數(shù)的計算
績效值的高低直接反映了一個學(xué)校的綜合實(shí)力及學(xué)生的培養(yǎng)質(zhì)量。據(jù)學(xué)校的績效指標(biāo)選取排名前10的學(xué)校,然后用績效指標(biāo)乘以學(xué)校的人數(shù),并將結(jié)果進(jìn)行歸一化處理來確定分配比。分配比乘以獲得獎學(xué)金總數(shù)就是每個學(xué)校獎學(xué)金的分配金額。結(jié)果如下表2:
表2 績效指標(biāo)
本文收集了522所學(xué)校的數(shù)據(jù),樣本很大,并且評價與決策都是基于數(shù)據(jù)的,結(jié)果具有一定的合理性。而且在填補(bǔ)缺失數(shù)據(jù)方面,采用聚類思想,利用同一類相似性較高的數(shù)據(jù)來填補(bǔ)并采用客觀賦權(quán)法的熵值法確定權(quán)重,最大限度上的少了誤差。
[1] 蒙有華, 徐輝. 美國高等教育捐贈制度探析[J]. 高等教育探索, 2006(6): 41-43.
[2] 王生昌, 付迪, 陳娟娟, 蔡鳳田, 張學(xué)文. 基于熵值法的汽車動力性能主觀評價指標(biāo)權(quán)重確定方法[J]. 路交通科技, 2015, 07: 153-158.
[3] 黃國慶, 王明緒, 王國良. 效能評估中的改進(jìn)熵值法賦權(quán)研究[J]. 計算機(jī)工程與應(yīng)用, 2012, 28: 245-248.
[4] 王化吉, 宗長富, 管欣, 邢如飛, 劉立國. 基于模糊層次分析法的汽車操縱穩(wěn)定性主觀評價指標(biāo)權(quán)重確定方法[J].機(jī)械工程學(xué)報, 2011, 24: 83-90.
[5] 胡偉. 改進(jìn)的層次K均值聚類算法[J]. 計算機(jī)工程與應(yīng)用, 2013, 02: 157-159.
[6] 江岸, 黃復(fù)剛. 基于熵值法的經(jīng)濟(jì)增長質(zhì)量探析——以甘肅省為例[J]. 財會研究, 2013, 11: 72-75.
Based on the Entropy Method Optimal Allocation Strategy of Goodgrant Fund
JIANG Bao-sheng1, WU Fei1, ZHANG Jing-yi1, GONG Dian-xuan2※
(1. North China University of science and technology, Mathematical modeling innovation laboratory, Tangshan, Hebei, 063000; 2. North China University of science and technology, CollegeofScience, Tangshan, Hebei, 063000)
Goodgrant foundation is a charitable organization in America, It hopes to improve attended universities undergraduate education performance by Charitable donations. In order to use of the funds better, it is necessary to research investment strategy. First of all, all candidate school should be classified by k-means clustering from SPSS. According to the clustering results, these schools are divided into 6 categories. In the same category, filling the missing data by linear in matlab. then classify 13 performance influence factors as the quality of students, the development situation of school and the financial status three first grade indexes. In order to determine objectively the school performance evaluation weight coefficient, Using entropy method to study it. Using Entropy method to calculate the weights of first grade indexes and second grade indexes to make comprehensive evaluation. Use the current performance evaluation standard to calculate each school performance and Ranke all of the schools. Select the top ten schools. Based on the performance of each school performances and the scale of higher education to determine the amount of scholarship allocation.
K-means clustering; Entropy method; Linear; Performance
O29
A
10.3969/j.issn.1003-6970.2016.09.006
國家自然科學(xué)基金項目(No.11301120,No.11601151),河北省自然基金項目(No.A2015209189),河北省青年拔尖人才支持項目。
通訊聯(lián)系人: 龔佃選(1981-),副教授,北京大學(xué)訪問學(xué)者,主要研究方向?yàn)橛嬎銕缀巍?/p>