鄭富豪 沈金波
科研工作是三級甲等醫(yī)院發(fā)展和建設的重要內容之一,可提升醫(yī)院核心競爭力,促進學術發(fā)展、人才培養(yǎng)及提高醫(yī)療技術和管理水平[1-3]。近年來,人工智能作為一種新的評價方法為科研績效評價問題提供了一種新的研究思路[4-5]。本研究選取近5年來我院開展科研工作的客觀數據,采用聚類分析法和關聯分析法,對醫(yī)院科研績效評價進行研究分析,總結特點規(guī)律,發(fā)現不足,以便采取有針對性的措施以提升整體科研水平,為醫(yī)院科研管理工作提供參考。
收集我院2014年~2018年度科研管理部門收集的臨床、醫(yī)技、護理和行政后勤等相關部門的443名科研人員的科研工作成果及學歷、職稱、工齡等基本信息。
采用文獻分析法,根據相關研究成果,結合醫(yī)院科研績效評價的實際情況,遵循可操作、可比性等原則,參考醫(yī)院年度科研獎勵情況,在醫(yī)院科研績效評價指標體系中共設置5個一級評價指標,分別為課題項目、學術論文、科技成果、授權專利、著作[6-8]??蒲腥藛T每個一級指標的評價分值,是由其二級指標的科研成果數量乘以對應權重計算得到。
1.2.1 課題項目的權重設置:課題項目包括院校級、廳局級、省部級、國家級和橫向課題5個二級指標,根據實際情況,為了方便評價,把課題項目權重設置分為4種,國家級0.45,省部級0.28,廳局級0.17,院校級和橫向課題0.10。
1.2.2 學術論文的權重設置:學術論文包括SCI、核心期刊(CSCD、北大核心、中華系列)、其他等3個二級指標,權重設置分別為SCI 0.45、核心期刊0.38、其他0.17。
1.2.3 科技成果的權重設置:科技成果包括國家級科技獎、省部級科技獎、廳局級科技獎、國家級學會獎、省級學會獎等一、二、三等獎和院校級、其他共17個二級指標,根據實際情況,為了方便評價,把科研成果權重設置分為3種,國家級0.54,省部級、國家級學會獎0.34,廳局級、省級學會獎、院校級、其他0.12。其中,一、二、三等獎分別按100%、80%、60%分別計算,院校級及其他按60%計算。
1.2.4 授權專利的權重設置:授權專利包括外觀設計、實用新型、國家發(fā)明等3個二級指標,權重設置分別為外觀設計0.12、實用新型0.33、發(fā)明專利0.55。
1.2.5 著作的權重設置:著作包括教材、編著等2個二級指標,權重設置分別為專著0.61、教材0.39。
基于Python語言的開源機器學習工具scikitlearn庫,采用K-means聚類法對科研人員的5個一級指標的科研績效分值進行聚類分析,劃分科研人員評價等級;在此基礎上,采用開源關聯規(guī)則分析的apyori庫,進一步分析各評價等級科研人員的評價等級與科室類別、學歷、職稱、工齡等特征間關聯規(guī)則,總結特點和規(guī)律,發(fā)現共性問題并找出薄弱點。
1.3.1 聚類分析法:聚類分析是根據相似性原則,把相似度較高的訓練數據劃分為同一個類簇,而把相異度較高的訓練數據劃分為不同類簇[9]。K-means聚類算法是無監(jiān)督學習,是一種聚類分析法中經典算法。K-means算法以距離作為訓練數據間相似性度量的標準,即訓練數據間距離越小則相似性越高,則訓練數據越有可能劃分在同一個類簇。K-means算法通常采用歐氏距離計算訓練數據間的距離。
1.3.2 關聯分析法:關聯分析,用于發(fā)現隱藏在大型事務數據集中隱藏的有意義關聯,用關聯規(guī)則形式表示,描述一個事務中事件之間同時出現的規(guī)律的知識模式[9-10]。利用關聯規(guī)則對新事務或未知問題進行推測判斷。關聯規(guī)則是形如X?Y的蘊涵表達式,X為規(guī)則前項,Y為規(guī)則后項,關聯規(guī)則用支持度Support、置信度Confidence和提升度Lift來度量[11]。
關聯規(guī)則X?Y的支持度定義為事務集T中包含X∪Y的事務在全部事務中占的百分比,即support(X?Y)=P(X∪Y)。關聯規(guī)則X?Y的置信度定義為事務集T中包含X事務中同時也包含Y事務的百分比,即confidence(X?Y)=P(X∪Y)/P(X) 。提升度評估X事務的出現使得Y事務出現的程度,定義為 lift(X?Y)=P(X∪Y)/P(X)P(Y) =confidence(X?Y)/support(Y)。提升度是一種相關性度量,小于1表示X的出現和Y的出現是負相關的,等于1表示X和Y是獨立的,大于1表示X和Y是正相關的。
表1 科研人員基本信息情況
表2 整體科研人員科研績效一級指標評價分值統(tǒng)計情況
科研人員基本情況如表1所示,科研人員中約70%為臨床醫(yī)生,碩士研究生以上學歷占61.20%,高級職稱占65.90%,將近一半工齡超過20年。在科研工作成果方面,超過半數以上的科研人員未有著作、專利、科技成果等科研工作成果,其中有98.0%人員其著作項得分為0,有95.0%人員專利項得分為0,有82.8%人員科技成果項得分為0,說明論文和課題項目在科研績效評價上發(fā)揮主要作用??蒲腥藛T科研績效一級指標評價情況見表2。
采用K-means算法對醫(yī)院科研數據進行聚類分析,結合實際情況把科研人員分為合格、良好和優(yōu)秀等3個等級,3個等級之間具有較好的區(qū)分度,科研人員評價等級聚類分析結果如表3所示。3個等級科研人員一級指標分值統(tǒng)計情況見表4。比較論文分值,優(yōu)秀顯著高于良好和合格(P<0.05),良好顯著高于合格(P<0.05);比較課題項目分值,優(yōu)秀顯著高于良好和合格(P<0.05),良好顯著高于合格(P<0.05);比較科技成果分值,優(yōu)秀、良好顯著高于合格(P<0.05)。
表3 科研人員評價等級聚類分析結果
表4 各等級科研人員科研績效一級指標分值統(tǒng)計情況
表5 單特征關聯規(guī)則分析結果
表6 多特征關聯規(guī)則分析結果
為了總結分析科研人員的評價等級與科室類別、學歷、職稱、工齡等特征間規(guī)律,采用Apriori算法,分析單個特征對科研績效評價等級的支持度、置信度、提升度,結果如表5所示,學歷為博士研究生和評價等級優(yōu)秀的提升度大于3,職稱為正高和評價等級優(yōu)秀的提升度大于2,學歷為博士研究生和職稱為正高分別與評價等級優(yōu)秀具有明顯的相關性。同時,在評價等級為合格時,規(guī)則提升度大于1,置信度超過80%,說明工齡不超過10年、學歷為大學本科或???、職稱為初級或中級、科室類別為護理或行政的科研人員評價等級較高概率為合格,而且有一定程度的相關性。用Apriori算法分析多個特征與科研績效評價等級間規(guī)律,結果如表6所示,以規(guī)則前項['臨床','(20,+ ∞)','正高','博士研究生']為例,同時具備工齡超過20年、學歷為博士研究生、職稱為正高、科室類別為臨床等特征的科研人員,其評價等級為優(yōu)秀的概率為21.74%、提升度為5.35,評價等級為良好的概率為52.38%、提升度為2.42,說明不同評價等級的科研人員可能具備相同特征,但他們之間的概率、關聯性不一樣,即一般高評價等級的規(guī)則具備較強關聯性、較低概率,低評價等級的規(guī)則具備較弱關聯性、較高概率。評價等級為優(yōu)秀和良好的科研人員,一般是高學歷、高職稱的臨床醫(yī)生。
在科研人員的學科分布方面,科研人員中約70%為臨床醫(yī)生,評價等級優(yōu)秀中臨床醫(yī)生占比為83.33%,評價等級良好中臨床醫(yī)生占比為72.92%。臨床醫(yī)生是醫(yī)院主要科研主力,而行政、護理、醫(yī)技等科室人員的科研能力整體較弱,說明醫(yī)院科研情況在學科方面分布不均衡,應加強行政、護理、醫(yī)技等科室人員的科研能力提升。
在科研人員的學歷、職稱和工齡等分布方面,碩士研究生以上學歷占61.20%,高級職稱占65.90%,工齡超過20年占45.60%。但是,博士研究生學歷只占20.10%,工齡為(0,10]只占18.50%,說明醫(yī)院科研人員中高學歷和低工齡者比例偏低,在招聘時和人才引進方面應傾向高學歷、年輕化方面的優(yōu)秀人才。
在科研工作成果方面,有98.0%人員著作項得分為0,有95.0%人員專利項得分為0,著作、專利的偏度、峰度值比較大,說明絕大部分科研人員對著作、專利等方面重視程度不夠。同時,有82.84%人員科技成果項得分為0,偏度值為4.94,峰度值為28.62,說明科研成果得分方面主要分布在特定的部分科研人員,醫(yī)院應加強對科技成果申報等支持。
評價等級為優(yōu)秀的人數為18名,占比為4.06%,其中大部分科研人員是工齡超過20年、正高職稱的臨床醫(yī)生,學歷以博士研究生為主,擔任一定管理職務,參與學術組織的積極性高,論文、課題項目和科技成果等方面優(yōu)勢明顯,這部分人員主要是資深型的科研人才,科研工作比較全面,但在專利、著作等方面都有一定的提升空間。
評價等級為良好的人數為96名,占比為21.67%,這部分科研人員在論文、課題項目等方面能力較好,其中只有約30%有科技成果評分,以工齡超過10年、正高或副高職稱、博士或碩士研究生學歷等特征為主,少量人員是工齡低于10年、中級職稱,這部分人員主要是骨干型的科研人才,應加強這部分人才的科研能力,使其積極參與相關學術活動。
評價等級為合格的人數為329名,占比為74.27%,這部分科研人員科研工作不均衡,其中約11.25%人員有科技成果評分,約49.85%人員有課題項目評分。而且,這部分科研人員中,工齡(0,10]占比為20.67%,初級或中級職稱占比為39.21%,博士或碩士研究生學歷占比為57.14%。其中,同時具有工齡(0,10]、初級或中級職稱、博士或碩士研究生學歷等特征的人員占比為16.41%,這些科研人員科研工作處于起步階段,工齡小、職稱低,是潛力型的科研人才,應加強對這部分科研人群的引導和幫助。
在評價等級為優(yōu)秀和良好的關聯規(guī)則中,其提升度基本上都超過2,說明評價等級為優(yōu)秀和良好的與高學歷、高職稱、臨床等特征具有明顯的相關性。但是,這些關聯規(guī)則中,支持度、置信度都較低,說明還有不少比例的高學歷、高職稱等特征的科研人員在科研能力上有待提升。醫(yī)院應跟蹤分析這些評價等級為合格、具有高學歷、高職稱等特征的科研人員,從中挖掘具有潛力的、科研基礎較好的科研人員予以支持引導,進一步提高評價等級為優(yōu)秀和良好的科研人員占比。
不同類型科研人員的科研能力差異化明顯,相關評價指標也存在差異,需要制定有針對性的科研能力提升措施和方法。在醫(yī)院科研績效聚類分析、關聯分析結果的基礎上,結合醫(yī)院實際情況,進一步細化和制定相關科研管理措施,以提升醫(yī)院整體科研能力。一是要加強對行政、護理、醫(yī)技等科室人員的引導激勵,這些人員的科研能力整體較弱,應加強對其進行科研引導,積極宣傳科研政策和課題、論文、成果等申報方面的技巧,可以探索建立“師帶徒”制度,循序漸進開展科研工作,引導鼓勵行政、護理、醫(yī)技、臨床等科研人員之間的科研合作,鼓勵其加入醫(yī)院內部優(yōu)秀科研團隊。二是要創(chuàng)造良好的醫(yī)院科研工作的軟、硬件環(huán)境。醫(yī)院可通過設置醫(yī)院青年課題基金,解決科研經費問題,支持其科研工作的可持續(xù)發(fā)展;為他們提供各種參與學術會議交流、進修機會,拓展學術視野,加強與外部優(yōu)秀科研人才交流機會;積極選送他們去參加科研相關培訓和學習,對有獲得科研成果的科室、個人給予特別表揚和宣傳。針對評價等級良好的科研人員,醫(yī)院應進一步加強在人員設施配備、實驗平臺建設等方面的支撐,在高級別課題項目、科技成果獎勵等申報方面提供支持;同時,鼓勵與優(yōu)秀科研人員加強科研合作,充分利用其學術影響力,進一步爭取參與更多高級別課題項目、科技成果申報以及提升科研能力等,將具有良好素質的科研人員逐步向優(yōu)秀科研人員轉化。針對評價等級優(yōu)秀的科研人員,醫(yī)院應激勵其努力爭取國家級課題、省部級課題以及相應科研成果獎勵申報,醫(yī)院應該有意識組建優(yōu)秀科研團隊,充分鼓勵該類科研人員發(fā)揮自身價值,加強與名校、全國知名醫(yī)院的科研交流和協(xié)作,加強與臨床緊密相關問題的研究和攻關。同時發(fā)揮醫(yī)院優(yōu)秀科研人員的功能,幫助其他科研人員進一步提升科研能力,協(xié)助培養(yǎng)和指導更多入門科研人員。
在科研績效評價中,聚類算法根據各科研指標評價數據對科研人員進行劃分,操作簡單,聚類效果較好,和實際科研績效評價結果比較吻合,可以較為準確地評價醫(yī)院所有科研人員的科研績效。在此基礎上,通過關聯分析發(fā)掘評價等級與特征之間有意義的關聯規(guī)則,尋找可能影響科研績效評價的主要特征,總結出不同科研人員群體的特點規(guī)律,提高醫(yī)院科研管理的工作效率,為醫(yī)院科研管理者制定、完善科研管理和評價考核制度提供依據。下一步,將不斷完善、優(yōu)化聚類算法、關聯規(guī)則算法,在實際工作中不斷提高科研績效評價的科學性、準確率,以更好地提升醫(yī)院科研管理能力。