郭銳敏 常宗平 孫瑞華△ 李 歡 徐 凱 虞康達 肖 暢 吳婉玲
?
運用主成分聚類分析法評估醫(yī)院科室科研績效
郭銳敏1常宗平2孫瑞華2△李 歡1徐 凱1虞康達1肖 暢1吳婉玲1
主成分聚類分析法是將主成分分析與聚類分析有機結(jié)合的一種新方法,該方法克服了眾多指標(biāo)之間的共線性,提取出能夠代表大部分信息的綜合指標(biāo),利用綜合得分聚類后,能夠合理準(zhǔn)確地突出各個類別的能力和優(yōu)勢。目前在采礦業(yè)[1]、農(nóng)業(yè)[2]、經(jīng)濟學(xué)[3]等領(lǐng)域有應(yīng)用。本文將以北京市某綜合醫(yī)院2015年度的學(xué)科評估數(shù)據(jù)為例,運用主成分聚類分析法對各業(yè)務(wù)科室的科研績效進行分析評價,以期為科研績效評估提供一種新的研究方法和思路。
1.資料來源
本文資料來源于北京市某三級甲等綜合醫(yī)院2015年度學(xué)科評估數(shù)據(jù),評估數(shù)據(jù)內(nèi)容包括65個業(yè)務(wù)科室的八項評估指標(biāo),各項評估指標(biāo)分數(shù)不設(shè)上限。其中,65個業(yè)務(wù)科室中,外科占20個,內(nèi)科占23個,中醫(yī)類科室占15個,醫(yī)技類科室占12個。八項評估指標(biāo)包括:課題(x1)、論文教材/專著(x2)、獎勵(x3)、專利(x4)、兼職(x5)、平臺(x6)、團隊榮譽(x7)、標(biāo)準(zhǔn)制定(x8)。
2.方法
主成分聚類分析法是應(yīng)用主成分提取少數(shù)主成分,代替原始指標(biāo),計算綜合得分并對綜合得分排序,最后進行聚類的一種方法[4]。由于主成分分析能在基本不損失原始指標(biāo)信息的基礎(chǔ)上,提取出彼此信息不重疊的主成分,因此可以先對原始指標(biāo)體系進行主成分分析,然后將主成分代替原始指標(biāo)進行聚類[5]。聚類分析又稱集群分析,它首先使各個業(yè)務(wù)科室各自成一類,然后將距離最近的2個科室合并成一個新類,重新計算新類與其他類的距離,再按最小距離歸類,這樣每次縮小一類,直至所有業(yè)務(wù)科室成為一類為止[6]。利用綜合得分進行聚類分析,可以突出各類業(yè)務(wù)科室的突出能力和優(yōu)勢產(chǎn)出,主成分聚類分析法能從整體上準(zhǔn)確反映醫(yī)院科室科研績效產(chǎn)出情況。
主成分聚類分析法的過程分為以下幾個步驟:(1)評估指標(biāo)的標(biāo)準(zhǔn)化處理;(2)建立相關(guān)系數(shù)矩陣,得到相關(guān)系數(shù)矩陣的特征向量、特征值、貢獻率和累計貢獻率;(3)確定主成分個數(shù)并解釋各主成分;(4)計算綜合評價得分;(5)利用綜合評價得分將評估對象聚類。
1.評估指標(biāo)的標(biāo)準(zhǔn)化
2.建立相關(guān)系數(shù)矩陣
在標(biāo)準(zhǔn)化數(shù)據(jù)的基礎(chǔ)上,借助SAS 9.1.3軟件計算原始指標(biāo)的相關(guān)系數(shù)矩陣,得到相關(guān)系數(shù)矩陣的特征向量、特征值、貢獻率和累計貢獻率,見表1~2。其中,特征向量是主成分Zj的線性表達式中原始指標(biāo)(已標(biāo)準(zhǔn)化)的組合系數(shù),特征值則是主成分Zj的方差,方差越大,則對總變異的貢獻越大。
表1 相關(guān)系數(shù)矩陣的特征向量
3.確定主成分個數(shù)
在實際應(yīng)用中,為了達到數(shù)據(jù)簡化的目的,通常按累計貢獻率大于或等于70%的原則提取前m個主成分[7]。上述數(shù)據(jù)中,前六個主成分的累計貢獻率為90.4%,遠大于70%,說明采用六個主成分已經(jīng)能夠反映原始數(shù)據(jù)包含的大部分信息,故考慮取前六個主成分。即利用主成分分析法把原來的八個指標(biāo)綜合成六個主成分,能夠反映原始指標(biāo)的總體特征。
表2 各項指標(biāo)的特征值和累計貢獻率
第一主成分在課題這一指標(biāo)上有較高正載荷,其余各指標(biāo)上載荷均大于零,但是科研項目水平明顯較強,可認為主要是反映綜合實力的因素。
第二主成分在課題和獎勵兩個指標(biāo)上有較高的負載荷,在兼職上有較高正載荷,可認為這一主成分主要是反映學(xué)術(shù)兼職貢獻的因素。
第三主成分在專利上有較高的正載荷,說明這一主成分主要反映的是成果方面的因素,可作為制造成果的因子。
第四主成分在標(biāo)準(zhǔn)制定上有較高的正載荷,可認為主要是反映參與標(biāo)準(zhǔn)制定的因素,作為引領(lǐng)行業(yè)發(fā)展態(tài)勢的因子。
第五主成分在團隊榮譽這一指標(biāo)上有較高正載荷,可認為這一主成分主要是反映人才團隊榮譽建設(shè)的因素。
第六主成分在論文專著這一指標(biāo)上有較高負載荷,在平臺這一指標(biāo)上有較高的正載荷,可認為該主成分主要是反映平臺建設(shè)的因素,發(fā)表論文專著的水平較弱。
4.計算綜合評價得分
由表1的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘可以計算得到主成分的得分Fj(j=1、2、3、4、5、6),以每個主成分的貢獻率作為權(quán)數(shù),計算各科室的綜合評價得分(f),并以綜合評價得分進行排序。
5.將65個業(yè)務(wù)科室分類
表3 科室聚類一覽表
優(yōu)秀類,綜合評價得分均值為1.634,各主成分得分均值都大于零,這類學(xué)科第一主成分均分較高,即科研項目水平較高。該類別屬于綜合實力較強的類別,與實際數(shù)據(jù)相符。
良好類,綜合評價得分均值為0.544,該類學(xué)科的第二主成分均分較高,在學(xué)術(shù)兼職方面有較大優(yōu)勢。第一主成分均分雖不及第一類,但也較高,科研課題水平略低于第一類科室,較第三類、第四類相對較高,與實際相符。
表4 四類業(yè)務(wù)科室綜合得分均值一覽表
中等類,綜合評價得分均值為0.076,相比于第一類科室,該類科室各主成分得分均值都相對較低,第四主成分均分相對較高,即在引領(lǐng)行業(yè)標(biāo)準(zhǔn)方面這類科室有較大貢獻。第五主成分均分較低,團隊榮譽和人才建設(shè)這方面還有待加強。
較差類,綜合評價得分均值為-0.386,這類科室各方面得分均較低,因此在科研項目、學(xué)術(shù)兼職等各項科研績效產(chǎn)出方面均較弱,該類別科室整體實力較弱。
運用主成分聚類分析法評估科研績效,實際是把主成分分析與聚類分析有機結(jié)合的一種應(yīng)用方法。主成分分析法可以對評估指標(biāo)進行降維,把多維的指標(biāo)信息歸納為可以反映大部分信息的少數(shù)幾個主成分,既有利于歸納分析科研績效的主要貢獻成分,也可以滿足有效的聚類分析信息要求,同時可以根據(jù)各主成分,分析各科室科研績效的主要貢獻內(nèi)容。本文中,我們通過主成分分析,發(fā)現(xiàn)科研績效得分最主要的貢獻在于課題指標(biāo),其次是獎勵、專利、標(biāo)準(zhǔn)制定等,為科研績效的提高指明了方向。
本文通過聚類分析法將65個科室分成四個等級,從優(yōu)秀類科室到較差類科室的科室數(shù)量逐漸增多,并不符合績效管理的“強制正態(tài)分布法”,即分數(shù)“中間大、兩頭小”的分布規(guī)律[8]。但從65個科室的績效分數(shù)分布看,可見等級劃分是符合實際的。
[1]陳建宏,蔣權(quán),鄭海力,等.基于主成分聚類分析的采礦方法優(yōu)選.科技導(dǎo)報,2011,29(27):36-41.
[2]李國鋒,王莉,肖遠淑,等.基于主成分聚類分析評價棉花品質(zhì)的研究.現(xiàn)代紡織技術(shù),2016,1(1):5-7.
[3]呂巖威,孫慧,周好杰,等.基于主成分聚類分析的西部地區(qū)經(jīng)濟實力評價.科技管理研究,2009,29(12):157-160.
[4]李秀樓,程霓虹,陳英,等.運用主成分聚類方法評估綜合醫(yī)院臨床科主任能力.中國衛(wèi)生統(tǒng)計,2012,29(2):249-250+253.
[5]王德青,朱建平,謝邦昌,等.主成分聚類分析有效性的思考.統(tǒng)計研究,2012,29(11):86-87.
[6]胡春娥.聚類分析在醫(yī)院管理中的應(yīng)用.中國衛(wèi)生統(tǒng)計,2007,24(1):92-93.
[7]孫振球.醫(yī)學(xué)統(tǒng)計學(xué).人民衛(wèi)生出版社,2010,8:358.
[8]李玉萍,蘭社云.績效管理中的“強制正態(tài)分布法”.經(jīng)濟研究導(dǎo)刊,2011,12(122):128-129.
(責(zé)任編輯:劉 壯)
1.北京中醫(yī)藥大學(xué)(100029)
2.中日友好醫(yī)院
△通信作者:孫瑞華,E-mail:sunruihua@263.net