摘 要本文分析傳統(tǒng)科技項目評審專家遴選過程存在不足等問題,提出了利用數(shù)據(jù)挖掘技術(shù)的聚類、關(guān)聯(lián)、推薦等方法來輔助系統(tǒng),實現(xiàn)科技項目評審的客觀、公正、公平、公開為目的。系統(tǒng)主要圍繞“政策-項目-專家-評估”全過程的模式,一方面提高了系統(tǒng)的科學(xué)性,另一方面降低了科技管理人員的工作難度。未來系統(tǒng)的模型研究將通過程序?qū)崿F(xiàn),應(yīng)用到科技服務(wù)平臺系統(tǒng)。
【關(guān)鍵詞】遴選系統(tǒng) 數(shù)據(jù)挖掘 智能推薦
1 科技項目評審系統(tǒng)的研究背景及意義
1.1 研究背景
隨著科學(xué)技術(shù)的持續(xù)發(fā)展和社會的不斷進步, 各類科學(xué)技術(shù)研究項目的申報數(shù)量也越來越多,某省科技計劃項目的申報書從2007年的7344項,上升到2013年的13477項。 科技項目公平評審是科技計劃管理工作的重要環(huán)節(jié)之一,如何實現(xiàn)科技項目評審的客觀、公正、公平、公開,對于這些項目評審的主體——評審專家的遴選及其評審行為的科學(xué)性就顯得尤為重要。既要適應(yīng)眾多科技申報項目又要保證公平評審是目前科技管理部門遇到的管理難點。
傳統(tǒng)的科技項目評審體系無法滿足當前科技評審的需求,主要表現(xiàn)在:項目評審體系制度陳舊、科技評審項目的數(shù)量多、時間短、專家遴選的不科學(xué)性、系統(tǒng)無法識別評審專家與評審項目之間的關(guān)系等現(xiàn)象。這些現(xiàn)象嚴重影響了政府管理科技工作的健康、可持續(xù)發(fā)展。
1.2 系統(tǒng)研究的意義
(1)大力促進政府管理科技工作的健康可持續(xù)發(fā)展;
(2)保障科技項目評審專家的遴選工作的客觀、公正、公平、公開;
(3)節(jié)省評審專家遴選環(huán)節(jié)的人力物力,為公平評審提供快速指引;
(4)以公平手段促使科技人員積極申報有價值的課題,為國家的政治、經(jīng)濟、科技、社會發(fā)展提供更好的理論和技術(shù)支撐。
2 專家遴選系統(tǒng)的方案設(shè)計
2.1 平臺環(huán)境的總體情況
本項目的主要運行環(huán)境如下:
(1)操作系統(tǒng):Windows Server 2012;
(2)編譯語言:Java7.0;
(3)Web服務(wù)器:Tomcat7.0;
(4)數(shù)據(jù)庫:MySQL5.5;
(5)數(shù)據(jù)挖掘工具:Mahout 開源工具。-
2.2 模型過程的描述
2.2.1 基礎(chǔ)數(shù)據(jù)
(1)科技項目基礎(chǔ)信息:包括科技項目的名稱、關(guān)鍵字、專項資金類別、申報單位、項目成員、內(nèi)容摘要……等信息;
(2)專家基礎(chǔ)信息:姓名、職稱、職務(wù)、所屬領(lǐng)域、所在單位、身份證號碼、畢業(yè)學(xué)校、畢業(yè)專業(yè)、研究項目……等信息;
(3)項目評審全過程日志信息:評審開始時間、評審結(jié)束時間、子項評審時長
(4)項目評審得分明細表:子項評審開始時間、子項評審結(jié)束時間、子項得分情況
(5)科技項目政策權(quán)重信息:重點支持領(lǐng)域、支持區(qū)域、支持數(shù)量、支持資金、支持人員……等信息。
2.2.2 挖掘模型
(1)專家信息知識表示圖:提取專家的畢業(yè)專業(yè)、研究項目和從事領(lǐng)域,結(jié)合專業(yè)領(lǐng)域知識庫,通過聚類算法架構(gòu)出專家信息知識表示圖。
(2)申報項目信息知識表示圖:提取項目申報名稱、關(guān)鍵字、內(nèi)容摘要等信息,結(jié)合專業(yè)領(lǐng)域知識庫,通過知識發(fā)現(xiàn)算法架構(gòu)出申報項目信息知識表示圖。
(3)項目-專家信息知識關(guān)聯(lián)圖:提取項目名稱、關(guān)鍵字、摘要結(jié)合專家的畢業(yè)專業(yè)、研究項目和從事領(lǐng)域等信息,通過關(guān)聯(lián)規(guī)則和相似度計算算法架構(gòu)出政策權(quán)重圖。
(4)專家-申報人科技社交網(wǎng)絡(luò)圖:提取科技專家信息知識表示圖,對評審專家及申報項目成員進行關(guān)聯(lián)規(guī)則算法挖掘,深度構(gòu)建專家-申報人科技社交網(wǎng)絡(luò)圖。
(5)項目評審全過程日志-得分評價圖:提取項目評審日志,結(jié)合得分明細表和專家-申報人科技社交網(wǎng)絡(luò)圖,通過異常評分補償修正算法得出評價模型。
2.2.3 管理過程
(1)獲取項目信息功能:從系統(tǒng)中獲取本次需要評審的項目,項目按照領(lǐng)域方向分類。
(2)智能推薦專家功能:基于專家信息知識表示圖、申報項目信息知識表示圖、專家-申報人科技社交網(wǎng)絡(luò)圖、項目-專家信息知識關(guān)聯(lián)圖,通過內(nèi)容推薦算法和關(guān)聯(lián)規(guī)則算法,推薦相應(yīng)的專業(yè)領(lǐng)域?qū)<以u審項目。
(3)專家評審質(zhì)量評價庫功能:基于項目評審全過程日志-得分評價圖、專家信息知識表示圖、專家-申報人科技社交網(wǎng)絡(luò)圖,實時登記評審評價結(jié)果,把評價的結(jié)果存入數(shù)據(jù)庫,為以后的項目評審專家遴選提供數(shù)據(jù)參考。
2.3 模型總體設(shè)計圖
本項目在傳統(tǒng)的評審專家遴選系統(tǒng)基礎(chǔ)上,利用新興的數(shù)據(jù)挖掘算法關(guān)鍵技術(shù),結(jié)合科技評審管理方法,提出了基于數(shù)據(jù)挖掘技術(shù)的科技項目評審專家遴選系統(tǒng)。它包括基礎(chǔ)數(shù)據(jù)、數(shù)據(jù)存儲、挖掘模型、管理過程四個階段,如圖1所示。形成了“政策—項目—專家—評估”全過程的智能化專家評審遴選體系。
3 總結(jié)
本文提出了數(shù)據(jù)挖掘技術(shù)在科技項目評審專家遴選系統(tǒng)中的應(yīng)用模型,通過分析科技評審項目全過程的需求分析,融合了眾多數(shù)據(jù)挖掘的算法,提煉并整合出適合系統(tǒng)的算法模型。模型重點四個環(huán)節(jié):基礎(chǔ)數(shù)據(jù)層搭建了數(shù)據(jù)的基本機構(gòu);數(shù)據(jù)存儲是基于HDFS的大數(shù)據(jù)云存儲;挖掘模型把專家、申報人、項目之間的關(guān)聯(lián)起來;管理過程最終給出智能處理的結(jié)果供系統(tǒng)管理參考。在今后的工作中,將算法模型通過程序?qū)崿F(xiàn)出來,在實際項目中應(yīng)用,多方位測試,保證項目符合管理者的要求。
參考文獻
[1]陳平華,陳傳瑜,洪英漢.一種結(jié)合關(guān)聯(lián)規(guī)則的協(xié)同過濾推薦算法[J].小型微型計算機系統(tǒng),2016(02).
[2]黃敏.科技項目專家推薦系統(tǒng)研究[D].浙江:杭州電子科技大學(xué),2012.
作者簡介
洪英漢(1984-),男,廣東省潮州市人。碩士研究生學(xué)歷?,F(xiàn)供職于韓山師范學(xué)院。研究方向為云計算、因果關(guān)系發(fā)現(xiàn)、推薦系統(tǒng)。
作者單位
韓山師范學(xué)院 廣東省潮州市 521041