摘要:搭建基于web的領(lǐng)域?qū)<以u(píng)價(jià)信息服務(wù)平臺(tái),實(shí)現(xiàn)基于國(guó)內(nèi)外學(xué)術(shù)數(shù)據(jù)庫(kù)的信息采集、整理、分析與挖掘的自動(dòng)化處理,能夠按照多種指定條件篩選指定領(lǐng)域?qū)<?,基于文獻(xiàn)計(jì)量、統(tǒng)計(jì)分析、社會(huì)網(wǎng)絡(luò)分析等方法,通過(guò)分析專家的各項(xiàng)評(píng)價(jià)指標(biāo)數(shù)據(jù),構(gòu)建各領(lǐng)域的專家?guī)?,形成社?huì)化的專家網(wǎng)絡(luò),并提供分析結(jié)果的多途徑導(dǎo)出和可視化展示,能夠?yàn)榭蒲泄ぷ髡吆涂蒲泄芾聿块T提供相應(yīng)的信息服務(wù)和決策支持。
關(guān)鍵詞:專家評(píng)價(jià);網(wǎng)絡(luò)信息服務(wù);文獻(xiàn)分析與挖掘;專家?guī)?;專家地圖;社會(huì)網(wǎng)絡(luò)
中圖分類號(hào):C861 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):
10085831(2014)02009906
一、引言
國(guó)務(wù)院2010年6月頒布的《國(guó)家中長(zhǎng)期人才發(fā)展規(guī)劃綱要(2010-2010年)》(以下簡(jiǎn)稱綱要)中明確提出,為了加強(qiáng)人才工作基礎(chǔ)性建設(shè),推進(jìn)人才工作信息化建設(shè),建立人才信息網(wǎng)絡(luò)和數(shù)據(jù)庫(kù),為此政府需要積極支持社會(huì)各方力量建設(shè)完善面向市場(chǎng)的各類專業(yè)人才數(shù)據(jù)庫(kù)和人才管理系統(tǒng)。同時(shí)綱要還提出,在體制機(jī)制創(chuàng)新中必須創(chuàng)新人才工作機(jī)制,特別是人才評(píng)價(jià)發(fā)現(xiàn)機(jī)制,要求完善人才評(píng)價(jià)標(biāo)準(zhǔn),注重靠實(shí)踐和貢獻(xiàn)評(píng)價(jià)人才,把評(píng)價(jià)人才和發(fā)現(xiàn)人才結(jié)合起來(lái),堅(jiān)持在實(shí)踐和群眾中識(shí)別人才、發(fā)現(xiàn)人才[1]。
本文將構(gòu)建一個(gè)可操作性強(qiáng)的實(shí)際人才評(píng)價(jià)的應(yīng)用平臺(tái),該平臺(tái)可以依托各期刊數(shù)據(jù)庫(kù),自動(dòng)化處理和分析文獻(xiàn)信息,構(gòu)建各領(lǐng)域的專題文獻(xiàn)庫(kù),基于該庫(kù)通過(guò)識(shí)別、篩選出各個(gè)研究領(lǐng)域的杰出專家及相互聯(lián)系,解釋其合作模式與規(guī)律,并對(duì)其進(jìn)行科學(xué)評(píng)價(jià)。專家?guī)斓慕⒅饕峭ㄟ^(guò)采用包括h指數(shù)評(píng)價(jià)法、引文分析在內(nèi)的多種文獻(xiàn)計(jì)量方法和“中心性分析”等社會(huì)網(wǎng)絡(luò)分析方法,利用專題文獻(xiàn)庫(kù)從各領(lǐng)域的核心作者中篩選出各領(lǐng)域?qū)<叶鴮?shí)現(xiàn)。各領(lǐng)域?qū)<規(guī)斓慕ǔ刹粌H有助于領(lǐng)域研究者加深對(duì)同行的了解,而且有助于科研管理部門和社會(huì)大眾把握各領(lǐng)域研究人員分布情況和遴選相關(guān)專家。目前,我們開(kāi)發(fā)的專家評(píng)價(jià)網(wǎng)絡(luò)信息服務(wù)平臺(tái)已經(jīng)在武漢大學(xué)研究中心各項(xiàng)目組都投入了實(shí)際使用,大大提高了科研中的數(shù)據(jù)獲取、處理、分析與評(píng)價(jià)的效率,并能導(dǎo)出各種統(tǒng)計(jì)圖表、專家地圖和專門格式的數(shù)據(jù)文件,以供更為深入分析之用,本網(wǎng)絡(luò)平臺(tái)也為一些高校的高端人才引進(jìn)與評(píng)價(jià)提供了咨詢服務(wù)。
二、平臺(tái)構(gòu)建意義
(一)對(duì)科研管理部門科技管理的決策支持
通過(guò)對(duì)專題文獻(xiàn)庫(kù)進(jìn)行科研合作網(wǎng)絡(luò)和引文網(wǎng)絡(luò)的分析,可以發(fā)現(xiàn)某學(xué)科領(lǐng)域的核心專家群體,發(fā)現(xiàn)國(guó)家或機(jī)構(gòu)研究人員的合作模式及規(guī)律,綜合運(yùn)用文獻(xiàn)計(jì)量學(xué)、社會(huì)網(wǎng)絡(luò)分析等指標(biāo)對(duì)科學(xué)家個(gè)人,甚至擴(kuò)展應(yīng)用到對(duì)科研機(jī)構(gòu)、學(xué)術(shù)期刊、科研項(xiàng)目進(jìn)行學(xué)術(shù)水平的評(píng)價(jià),從而為科研管理部門的人才引進(jìn)、項(xiàng)目論證、科研團(tuán)隊(duì)組建、科技資源配置等決策提供定量依據(jù)。
(二)創(chuàng)新人才評(píng)價(jià)方法論體系
評(píng)價(jià)理論框架本身具有跨學(xué)科特征,所涉及的學(xué)科領(lǐng)域主要有決策學(xué)、管理學(xué)、政策學(xué)、行為學(xué)、經(jīng)濟(jì)學(xué)、計(jì)量學(xué)、工程學(xué)、社會(huì)學(xué)、心理學(xué)和邏輯學(xué)等,設(shè)計(jì)和實(shí)施科學(xué)的評(píng)價(jià)活動(dòng)需要跨學(xué)科的方法,需要不同專業(yè)領(lǐng)域理論的整合和綜合應(yīng)用[2]。我們?cè)谠u(píng)價(jià)過(guò)程中采取了多學(xué)科方法的融合,綜合運(yùn)用了以下各種方法:綜合評(píng)價(jià)方法(如層次分析法、模糊綜合評(píng)判法)、統(tǒng)計(jì)學(xué)方法、文獻(xiàn)計(jì)量學(xué)方法(如引文分析)、社會(huì)網(wǎng)絡(luò)分析方法(如中心性分析等)、心理測(cè)量方法等。
(三)人才評(píng)價(jià)活動(dòng)的科學(xué)化、智能化
在評(píng)價(jià)過(guò)程中充分利用先進(jìn)的信息技術(shù)是提高評(píng)價(jià)活動(dòng)效率和準(zhǔn)確性的必然要求,受到科學(xué)評(píng)價(jià)界的廣泛關(guān)注。本網(wǎng)絡(luò)平臺(tái)要解決海量數(shù)據(jù)的獲取途徑和處理、分析方法的創(chuàng)新以及過(guò)程的自動(dòng)化問(wèn)題,實(shí)現(xiàn)各類數(shù)據(jù)庫(kù)的數(shù)據(jù)自動(dòng)采集、整理和目標(biāo)關(guān)系矩陣的生成與運(yùn)算,從而實(shí)現(xiàn)數(shù)據(jù)處理完全自動(dòng)化,大大提高研究效率和結(jié)果的準(zhǔn)確性,為科學(xué)研究的深入開(kāi)展創(chuàng)造條件。
(四)開(kāi)放化的網(wǎng)絡(luò)服務(wù)平臺(tái)創(chuàng)造社會(huì)價(jià)值
搭建基于web的評(píng)價(jià)信息服務(wù)平臺(tái)能夠充分利用互聯(lián)網(wǎng)的開(kāi)放性和社會(huì)性,充分整合各種類型的信息資源,更好地實(shí)現(xiàn)個(gè)性化信息服務(wù)(如本平臺(tái)后面的專家地圖功能,就是利用了谷歌公司的地圖開(kāi)放應(yīng)用編程接口,實(shí)現(xiàn)了專家評(píng)價(jià)信息和地理信息的有效整合,提供了直觀的評(píng)價(jià)結(jié)果可視化方案);開(kāi)放化的網(wǎng)絡(luò)服務(wù)平臺(tái),能滿足廣大科研工作者、科研管理部門各種信息需求,全面實(shí)現(xiàn)評(píng)價(jià)信息資源的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值。
三、專家評(píng)價(jià)概述
科學(xué)評(píng)價(jià)(廣義)是指用科學(xué)的方法對(duì)一切對(duì)象進(jìn)行評(píng)價(jià),意指“科學(xué)地評(píng)價(jià)”、“評(píng)價(jià)科學(xué)化”,覆蓋的范圍非常廣泛,囊括了各行各業(yè)、各學(xué)科領(lǐng)域、各層次、各種類型的評(píng)價(jià)。評(píng)價(jià)就是根據(jù)評(píng)價(jià)的綜合標(biāo)準(zhǔn)和指標(biāo)體系確定被評(píng)價(jià)對(duì)象有無(wú)價(jià)值及價(jià)值的大小,價(jià)值是評(píng)價(jià)的基礎(chǔ)[2]。本文研究的專家評(píng)價(jià)屬于科研領(lǐng)域人才的評(píng)價(jià),建立在心理測(cè)量學(xué)、文獻(xiàn)計(jì)量學(xué)、社會(huì)學(xué)等基礎(chǔ)上,對(duì)人才的人格、態(tài)度、能力、道德等內(nèi)在(隱性)特質(zhì)、工作成果與績(jī)效等外部(顯性)素質(zhì)以及在同一社會(huì)群體的地位和影響力共三個(gè)方面進(jìn)行測(cè)量,并按照評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行評(píng)價(jià)的一種活動(dòng)??蒲腥瞬诺脑u(píng)價(jià)可以全面了解一個(gè)人各方面的內(nèi)在素質(zhì)、能力、業(yè)績(jī)和社會(huì)影響力,對(duì)于科研管理部門的招聘、錄用與選撥都有一定的參考價(jià)值。表1是我們提出的一個(gè)針對(duì)科研領(lǐng)域?qū)<业囊粋€(gè)通用人才評(píng)價(jià)體系,能根據(jù)不同的應(yīng)用領(lǐng)域和目的對(duì)這三個(gè)方面的內(nèi)部進(jìn)行適當(dāng)?shù)奈⒄{(diào)。
本文將搭建一個(gè)基于文獻(xiàn)信息的分析挖掘和專家評(píng)價(jià)系統(tǒng),研究的目的是構(gòu)建一個(gè)操作性強(qiáng)的應(yīng)用平臺(tái),篩選出各個(gè)學(xué)科領(lǐng)域的杰出專家并進(jìn)行評(píng)價(jià)和展示。哲學(xué)關(guān)于物質(zhì)決定精神的觀點(diǎn),是心理測(cè)量的理論基礎(chǔ),一個(gè)人的心理特質(zhì)可通過(guò)外在的行為樣本進(jìn)行間接測(cè)量和評(píng)價(jià),很多都是通過(guò)與常模(群體中的相對(duì)水平,如人格特質(zhì)測(cè)評(píng))對(duì)比或者自比(個(gè)人在各種職業(yè)興趣類型上得分的對(duì)比,如職業(yè)興趣測(cè)評(píng))的方式判定一個(gè)人的某種心理特質(zhì)水平,無(wú)法進(jìn)行直接比較[6],因此沒(méi)有納入綜合排名的計(jì)算,而是另外單獨(dú)提供心理測(cè)評(píng)服務(wù),而學(xué)術(shù)道德誠(chéng)信方面的評(píng)價(jià)更是難以標(biāo)準(zhǔn)化處理。因此,評(píng)價(jià)指標(biāo)側(cè)重于科研績(jī)效(文獻(xiàn)計(jì)量學(xué)定量指標(biāo))的評(píng)價(jià)和學(xué)術(shù)水平與地位(社會(huì)網(wǎng)絡(luò)分析定量指標(biāo))的評(píng)價(jià),突出可操作性,評(píng)價(jià)的指標(biāo)權(quán)重確定采用了層次分析法。由于很難獲得科研人員在具體某一學(xué)科的專利、自然基金項(xiàng)目、科技獎(jiǎng)勵(lì)等數(shù)據(jù),因此專家評(píng)價(jià)主要采用期刊論文數(shù)據(jù)。本系統(tǒng)的國(guó)內(nèi)數(shù)據(jù)源主要來(lái)自CNKI中國(guó)學(xué)術(shù)期刊出版總庫(kù),國(guó)外數(shù)據(jù)源主要來(lái)自美國(guó)ISI的Web of Science,而沒(méi)有涉及博士、碩士學(xué)位論文、會(huì)議論文、專利、標(biāo)準(zhǔn)和其他科技成果數(shù)據(jù)庫(kù)以及科技獎(jiǎng)勵(lì)和科研項(xiàng)目信息,這個(gè)需要以后再加以擴(kuò)展。
四、系統(tǒng)分析與設(shè)計(jì)
(一)系統(tǒng)體系結(jié)構(gòu)
本系統(tǒng)選擇的開(kāi)發(fā)平臺(tái)是:LAMP(Linux/Apache/MYSQL/PHP) 。此開(kāi)發(fā)平臺(tái)具有開(kāi)源、免費(fèi)、跨平臺(tái)、低成本的優(yōu)勢(shì)。這是一組常用來(lái)搭建動(dòng)態(tài)網(wǎng)站或者服務(wù)器的開(kāi)源軟件,四個(gè)部分具有很高的兼容度,共同組成了一個(gè)強(qiáng)大的Web應(yīng)用程序開(kāi)發(fā)平臺(tái)[7]。從使用的廣泛性看,互聯(lián)網(wǎng)信息服務(wù)提供者大量采用了LAMP的開(kāi)發(fā)平臺(tái),比如著名的Google、FaceBook、維基百科以及大量的開(kāi)放社區(qū)系統(tǒng)等。
表1 專家評(píng)價(jià)指標(biāo)體系
(二)系統(tǒng)模型
整個(gè)系統(tǒng)主要包括從期刊數(shù)據(jù)源采集、整理、入庫(kù),到文獻(xiàn)分析挖掘、專家篩選與管理、專家評(píng)價(jià)、專家關(guān)系挖掘與展示等各種分析結(jié)果導(dǎo)出,流程非常復(fù)雜,中間還涉及到大量系統(tǒng)與用戶的交互環(huán)節(jié),因此系統(tǒng)的流程設(shè)計(jì)必須充分考慮用戶體驗(yàn),部分交互環(huán)節(jié)采用了AJAX技術(shù)實(shí)現(xiàn),做到按需加載數(shù)據(jù),簡(jiǎn)潔高效,同時(shí)基于web信息構(gòu)建原則,系統(tǒng)還具備了清晰的導(dǎo)航、標(biāo)識(shí)和檢索系統(tǒng)。系統(tǒng)流程模型如圖2所示。
圖2 系統(tǒng)模型
(三)數(shù)據(jù)庫(kù)設(shè)計(jì)
本項(xiàng)目數(shù)據(jù)庫(kù)的設(shè)計(jì)綜合考慮了數(shù)據(jù)庫(kù)存儲(chǔ)優(yōu)化和查詢效率優(yōu)化兩方面的需求,對(duì)數(shù)據(jù)庫(kù)的關(guān)系表結(jié)構(gòu)進(jìn)行了相應(yīng)的優(yōu)化處理。比如優(yōu)化查詢語(yǔ)句、試驗(yàn)聯(lián)接、并、子查詢等尋找最佳查詢語(yǔ)句,文本檢索時(shí)為了性能考慮少用LIKE關(guān)鍵詞通配符匹配,而考慮采用全文本搜索(FULLTEXT)。為經(jīng)常檢索的表字段建立合適的索引,表結(jié)構(gòu)設(shè)計(jì)選擇正確的數(shù)據(jù)類型等[9]。后臺(tái)數(shù)據(jù)庫(kù)的設(shè)計(jì)采用免費(fèi)、開(kāi)源數(shù)據(jù)庫(kù)管理系統(tǒng)MYSQL,并采用可視化的管理工具Navicat for MySQL實(shí)現(xiàn)數(shù)據(jù)庫(kù)的開(kāi)發(fā)與管理。系統(tǒng)包括以下核心關(guān)系表:管理賬戶表、評(píng)價(jià)指標(biāo)表、期刊表、論文表、主題詞表、關(guān)鍵詞表、共詞表、專家表、作者對(duì)表等。
(四)系統(tǒng)功能設(shè)計(jì)與實(shí)現(xiàn)
本系統(tǒng)主要包括信息采集、文獻(xiàn)信息分析與挖掘、專家?guī)烊竽K。首先通過(guò)信息采集功能完成專題文獻(xiàn)庫(kù)的自動(dòng)化建立,然后利用文獻(xiàn)分析與挖掘模塊從專題文獻(xiàn)庫(kù)分析、抽取出該領(lǐng)域的專家信息,并構(gòu)建專家?guī)?。專家?guī)觳捎昧藢<揖W(wǎng)絡(luò)(將專家?guī)熘械膶<野凑掌浜献骰驖撛诤献麝P(guān)系組成一個(gè)相互鏈接的專家網(wǎng)絡(luò),就是一個(gè)相互鏈接的專家頁(yè)面集合)、專家地圖(以Google地圖作為媒介的方式可視化呈現(xiàn)專家信息、區(qū)域分布與相互聯(lián)系)和專家排行榜(綜合排行榜和各單項(xiàng)指標(biāo)排行榜)三種形式展示豐富的專家信息。為了便于闡述系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)原理,本文采用測(cè)試數(shù)據(jù)集演示系統(tǒng)功能界面。
1.信息采集
信息采集功能主要完成以各文獻(xiàn)數(shù)據(jù)庫(kù)(目前,本系統(tǒng)的數(shù)據(jù)源主要來(lái)自CNKI中國(guó)學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫(kù)、ISI Web Of Knowledge,以后將逐步擴(kuò)展)為數(shù)據(jù)源的自動(dòng)采集、入庫(kù),并完成數(shù)據(jù)的標(biāo)準(zhǔn)化處理,自動(dòng)建立各領(lǐng)域的專題文獻(xiàn)庫(kù),以符合深入分析與評(píng)價(jià)的需要。首先選定特定的研究領(lǐng)域,構(gòu)造檢索式完成信息檢索,通過(guò)期刊系統(tǒng)的數(shù)據(jù)接口將檢索結(jié)果導(dǎo)出為txt格式的文本文件,然后按照分析需求解析并截取題錄信息各字段內(nèi)容存入數(shù)據(jù)庫(kù)(專題文獻(xiàn)庫(kù))。有些數(shù)據(jù)則通過(guò)web采集,識(shí)別指定數(shù)據(jù)庫(kù)網(wǎng)址URL特征和頁(yè)面文本特征,分別編制相應(yīng)正則表達(dá)式集合,通過(guò)字符串截取、正則匹配抓取指定數(shù)據(jù)(各種引文、下載信息等)完成采集入庫(kù)。
2.文獻(xiàn)信息分析與挖掘
主要包括基本文獻(xiàn)分析和高級(jí)文獻(xiàn)分析。基本分析功能實(shí)現(xiàn)對(duì)某領(lǐng)域文獻(xiàn)庫(kù)的基本分析,讓科學(xué)研究人員能從整體上把握研究領(lǐng)域的基本狀況。主要完成基于傳統(tǒng)的文獻(xiàn)計(jì)量學(xué)的一些基本統(tǒng)計(jì),比如論文總數(shù)、合著論文數(shù)、作者總數(shù)、合著作者人數(shù)、合作度、合作率、詞頻統(tǒng)計(jì)與分析、作者發(fā)文數(shù)分布、期刊發(fā)文分布、機(jī)構(gòu)發(fā)文分布、發(fā)文時(shí)序分布等,還包括一些基本的社會(huì)網(wǎng)絡(luò)指標(biāo)(包括網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)、邊數(shù)、平均度、網(wǎng)絡(luò)密度、節(jié)點(diǎn)度分布)的統(tǒng)計(jì)。這些基本統(tǒng)計(jì)運(yùn)算邏輯通過(guò)本系統(tǒng)的統(tǒng)計(jì)業(yè)務(wù)類實(shí)現(xiàn)了封裝。統(tǒng)計(jì)分析結(jié)果的可視化則采用第三方繪圖組件包JPGraph實(shí)現(xiàn)。高級(jí)文獻(xiàn)分析模塊主要是發(fā)現(xiàn)科研工作者的相互聯(lián)系,解釋其合作模式與規(guī)律。主要包括基本功能:(1)作者關(guān)鍵詞耦合分析(潛在關(guān)系網(wǎng)絡(luò)挖掘);(2)作者合著關(guān)系分析(外在合作關(guān)系網(wǎng)絡(luò)挖掘);(3)作者共被引分析,用于挖掘?qū)W科共同體及其共同約定,進(jìn)而分析其學(xué)術(shù)觀點(diǎn)歸納出該學(xué)科領(lǐng)域的學(xué)科范式;(4)共詞分析(挖掘研究熱點(diǎn)、學(xué)科前沿領(lǐng)域)。幾個(gè)模塊的實(shí)現(xiàn)有很多相似之處,都是通過(guò)調(diào)用基本統(tǒng)計(jì)分析后生成的數(shù)據(jù)(如詞頻統(tǒng)計(jì)生成的核心關(guān)鍵詞表、關(guān)鍵詞、作者的共現(xiàn)分析生成的共詞表和作者對(duì)表)生成相應(yīng)的矩陣,然后調(diào)用本系統(tǒng)的分析業(yè)務(wù)類所封裝的矩陣算法進(jìn)行分析處理,得出有意義的社會(huì)變量。本模塊可以將生成的各種矩陣數(shù)據(jù)(專家合作矩陣、專家潛在合作矩陣等)導(dǎo)出為excel格式、UCINET專用的數(shù)據(jù)語(yǔ)言文件(DL file)格式,可以方便地導(dǎo)入SPSS或UCINET,從而進(jìn)行更深入的數(shù)據(jù)分析與挖掘。
3.專家?guī)?/p>
主要實(shí)現(xiàn)識(shí)別并篩選指定研究領(lǐng)域的專家,構(gòu)建各領(lǐng)域的人才庫(kù),并進(jìn)行評(píng)價(jià)和各種分析。各領(lǐng)域人才庫(kù)的建成有助于各領(lǐng)域研究者加深對(duì)同行的了解,也有助于科研管理部門和社會(huì)大眾把握各領(lǐng)域研究人員分布情況和遴選相關(guān)領(lǐng)域的專家,能為各科研機(jī)構(gòu)和高校的人才選撥、招聘以及項(xiàng)目團(tuán)隊(duì)組建提供定量依據(jù)。專家?guī)煨枰鎯?chǔ)以下四類信息:第一類是專家基本信息(如姓名、單位、聯(lián)系方式、科研簡(jiǎn)介等);第二類是該專家的專長(zhǎng)研究領(lǐng)域信息(通過(guò)系統(tǒng)內(nèi)置主題詞表結(jié)合專題文獻(xiàn)庫(kù)的詞頻統(tǒng)計(jì)分析進(jìn)行抽?。?;第三類是該專家的合作網(wǎng)絡(luò)揭示及其可視化呈現(xiàn)(科研合作網(wǎng)絡(luò)、潛在合作關(guān)系揭示);第四類是該專家各單項(xiàng)指標(biāo)和綜合指標(biāo)的得分及其排名信息。包括專家識(shí)別與篩選、專家地圖、專家檢索和專家評(píng)價(jià)輸出4個(gè)子模塊。
之一,專家識(shí)別與篩選。通過(guò)分析專題文獻(xiàn)庫(kù)(作為專家數(shù)據(jù)源),提供各種組合篩選條件(發(fā)文數(shù)、期刊級(jí)別及影響因子、被引用頻次、H指數(shù)、社會(huì)網(wǎng)絡(luò)中心性指標(biāo)等)由用戶定制,然后根據(jù)用戶定制條件從專題文獻(xiàn)庫(kù)提取專家基本信息(如姓名、單位、研究專長(zhǎng)領(lǐng)域等),并計(jì)算該專家的相關(guān)特征數(shù)據(jù),包括發(fā)文指標(biāo)(發(fā)文數(shù)、第一作者發(fā)文數(shù)、個(gè)人獨(dú)著發(fā)文數(shù))、引文指標(biāo)(被引用頻次、高被引論文數(shù)、H指數(shù))、社會(huì)網(wǎng)絡(luò)指標(biāo)(度中心度、中間中心度、結(jié)構(gòu)洞約束系數(shù))等,經(jīng)過(guò)評(píng)價(jià)模型運(yùn)算后將和評(píng)價(jià)數(shù)據(jù)一起存入該領(lǐng)域?qū)<規(guī)?。專家?guī)鞎?huì)按照綜合排名進(jìn)行列表輸出,點(diǎn)擊每一個(gè)專家條目則進(jìn)入該專家主頁(yè)。后期通過(guò)后臺(tái)管理界面實(shí)現(xiàn)專家個(gè)人信息的人工添加,主要包括個(gè)人各種聯(lián)系方式、成果簡(jiǎn)介等補(bǔ)充信息。
之二,專家地圖。專家地圖是專家?guī)煜到y(tǒng)的一個(gè)用于可視化展示的功能,其基于專家?guī)斓母鞣N數(shù)據(jù),通過(guò)Google Maps API實(shí)現(xiàn)地理信息和專家信息的有效整合,實(shí)現(xiàn)專家相關(guān)信息的可視化展示。專家地圖是通過(guò)google地圖加載專家基本信息(姓名、所在機(jī)構(gòu)、研究領(lǐng)域等)和評(píng)價(jià)信息(發(fā)文數(shù)、引用次數(shù)、度中心度等指標(biāo)的原始數(shù)據(jù)及其排名),通過(guò)google地圖這個(gè)媒介直觀呈現(xiàn)本學(xué)科領(lǐng)域?qū)<业牡赜蚍植迹沟脤<业南嚓P(guān)信息得以可視化展示。
基于專家數(shù)據(jù)庫(kù)的基本信息和各項(xiàng)指標(biāo)原始數(shù)據(jù),進(jìn)行各項(xiàng)排名生成處理,然后按照預(yù)置的模板將這些信息動(dòng)態(tài)生成XML文檔,然后利用XMLDOM解析
相應(yīng)專家各項(xiàng)數(shù)據(jù),并利用循環(huán)語(yǔ)句在地圖上添加GMarker地標(biāo)即可。由于專家數(shù)目比較多,所以采用了GMarkerManager地標(biāo)管理器通過(guò)導(dǎo)入地標(biāo)數(shù)組實(shí)現(xiàn)批量地標(biāo)數(shù)據(jù)的加載[10]。
之三,專家檢索。主要包括兩部分:第一部分是專家?guī)斓亩嗤緩疥P(guān)鍵字(包括按題名、作者、機(jī)構(gòu)、關(guān)鍵詞、摘要、全文等)檢索,通過(guò)關(guān)鍵字匹配實(shí)現(xiàn)精確或模糊檢索,輸出該專家基本信息和相關(guān)文獻(xiàn)列表;第二部分是作者合作關(guān)系網(wǎng)絡(luò)檢索與可視化呈現(xiàn)(作者間的合作關(guān)系和潛在關(guān)系的揭示),可以任意指定一對(duì)作者,系統(tǒng)可以輸出他們之間的所有最短路徑,包括聯(lián)系他們的作者及其文獻(xiàn)信息,這是基于圖論的Dijkstra算法并作出改進(jìn)后實(shí)現(xiàn)的[11]。專家個(gè)人主頁(yè)實(shí)現(xiàn)了專家相關(guān)信息的深度聚合,今后將向科研社會(huì)化網(wǎng)絡(luò)服務(wù)方向發(fā)展,包括:個(gè)人基本信息、研究主題及時(shí)間分布、在線溝通(嵌入及時(shí)通訊和電子郵件工具)、各單項(xiàng)指標(biāo)數(shù)據(jù)及其排名、二度合作人脈網(wǎng)絡(luò)(每一個(gè)專家姓名鏈接到其個(gè)人主頁(yè),形成一個(gè)相互鏈接的合作社會(huì)網(wǎng)絡(luò))、潛在合作關(guān)系挖掘與展示(通過(guò)對(duì)因時(shí)空障礙而無(wú)直接聯(lián)系的專家之間進(jìn)行關(guān)鍵詞耦合分析[12],發(fā)現(xiàn)共同的研究興趣及耦合度,以及相互之間共同的合作者)、相關(guān)文獻(xiàn)列表(通過(guò)機(jī)構(gòu)、關(guān)鍵詞、期刊、標(biāo)題等字段鏈接到對(duì)應(yīng)專題文獻(xiàn)庫(kù)的詳細(xì)信息)。
之四,專家評(píng)價(jià)輸出?;跇?gòu)建的各領(lǐng)域?qū)<規(guī)鞂?shí)現(xiàn)專家的綜合評(píng)價(jià)與單項(xiàng)指標(biāo)評(píng)價(jià),各種評(píng)價(jià)結(jié)果便于科研管理部門和相關(guān)領(lǐng)域研究者全面了解和把握本領(lǐng)域的專家績(jī)效、學(xué)術(shù)水平和影響力。本模塊包括指標(biāo)庫(kù)管理、評(píng)價(jià)模型運(yùn)算等功能。指標(biāo)庫(kù)管理包括專家評(píng)價(jià)指標(biāo)庫(kù)的增、刪、改、查等基本功能。其中評(píng)價(jià)指標(biāo)庫(kù)的權(quán)重生成采用了層次分析法(AHP)實(shí)現(xiàn),層次分析法的算法封裝在了系統(tǒng)的評(píng)價(jià)業(yè)務(wù)類中。評(píng)價(jià)模型運(yùn)算通過(guò)調(diào)用評(píng)價(jià)指標(biāo)庫(kù)的指標(biāo)及其權(quán)重?cái)?shù)據(jù),同時(shí)調(diào)用評(píng)價(jià)業(yè)務(wù)類的評(píng)價(jià)算法實(shí)現(xiàn)各一級(jí)指標(biāo)排序和綜合排序,并自動(dòng)生成各種評(píng)價(jià)報(bào)表,包括了各個(gè)二級(jí)指標(biāo)的單項(xiàng)排名和綜合排名。
五、結(jié)論
本文搭建了一個(gè)基于科學(xué)文獻(xiàn)的信息分析與專家評(píng)價(jià)網(wǎng)絡(luò)信息服務(wù)平臺(tái),目的是通過(guò)該平臺(tái)滿足科研工作者和科研管理部門關(guān)于領(lǐng)域?qū)<业母鞣N信息需求。平臺(tái)依托各期刊數(shù)據(jù)庫(kù),實(shí)現(xiàn)了自動(dòng)化的文獻(xiàn)信息處理和智能化的分析挖掘,能對(duì)目標(biāo)研究領(lǐng)域的學(xué)科知識(shí)結(jié)構(gòu)進(jìn)行一定程度的揭示,并運(yùn)用社會(huì)網(wǎng)絡(luò)分析方法對(duì)科研工作者的(潛在)合作關(guān)系的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行挖掘,以發(fā)現(xiàn)核心作者群體及其相互聯(lián)系。同時(shí),本文提出了一個(gè)實(shí)用的科研人才評(píng)價(jià)體系,綜合運(yùn)用文獻(xiàn)計(jì)量學(xué)、社會(huì)網(wǎng)絡(luò)分析的指標(biāo)進(jìn)行專家評(píng)價(jià)及排名,并通過(guò)Google Maps API實(shí)現(xiàn)了專家的地域分布及相關(guān)評(píng)價(jià)信息的可視化展示。本平臺(tái)現(xiàn)已得到部分科研領(lǐng)域用戶的使用及反饋,目前在支持的數(shù)據(jù)源(由于數(shù)據(jù)源的原因尚無(wú)法進(jìn)行引文網(wǎng)絡(luò)的分析挖掘)及其采集的自動(dòng)化和準(zhǔn)確性方面尚有待提高,對(duì)專家績(jī)效指標(biāo)僅僅支持其科研論文數(shù)據(jù)的采集和分析,今后將對(duì)專利、標(biāo)準(zhǔn)、報(bào)告等績(jī)效指標(biāo)的采集處理進(jìn)行擴(kuò)展。而關(guān)于專家個(gè)體內(nèi)在特質(zhì)的各種心理特質(zhì)、道德水準(zhǔn)的衡量,因?yàn)椴捎玫臏y(cè)量及評(píng)價(jià)方法屬于間接測(cè)量和心理映射,我們并沒(méi)有納入綜合排名計(jì)算中,而是作為單獨(dú)的模塊提供,作為用戶單位在擇人、用人方面測(cè)試評(píng)價(jià)使用。參考文獻(xiàn):
[1]中央人才工作協(xié)調(diào)小組辦公室,中共中央組織部人才工作局.國(guó)家中長(zhǎng)期人才發(fā)展規(guī)劃綱要(2010-2020年)學(xué)習(xí)輔導(dǎo)百問(wèn)[M].北京:黨建讀物出版社,2010:8.
[2]邱均平,文庭孝.評(píng)價(jià)學(xué)理論·方法·實(shí)踐[M].北京:科學(xué)出版社,2010:5.
[3]趙基明,邱均平.一種新的科學(xué)計(jì)量指標(biāo)——h指數(shù)及其應(yīng)用述評(píng)[J].中國(guó)科學(xué)基金,2008(1):23-32.
[4]宋歌.社會(huì)網(wǎng)絡(luò)分析在引文評(píng)價(jià)中的應(yīng)用研究[J].圖書(shū)情報(bào)工作,2010,54(14):16-19.
[5]朱天,吳斌,王柏.科研合作網(wǎng)絡(luò)的重要作者發(fā)現(xiàn)[J].數(shù)字圖書(shū)館論壇,2010,75(8):29-35.
[6] 劉遠(yuǎn)我.人才測(cè)評(píng)——方法與應(yīng)用[M].北京:電子工業(yè)出版社,2008.
[7] JASON W, GILMORE W J.Beginning PHP and MySQL(Third Edition)[M].朱濤江,譯.北京:人民郵
電出版社,2009.
[8] 葉新偉.PHP+Ajax Web2.0編程技術(shù)與項(xiàng)目開(kāi)發(fā)大全[M].北京:電子工業(yè)出版社,2008.
[9]BEN FORTA. MySQL Crash Course[M]. Beijing:PostsTelecom,2009.
[10]江寬,龔小鵬.程序天下Google API開(kāi)發(fā)詳解:Google Maps與Google Earth雙劍合璧[M].北京:電子工業(yè)出版社,2008:1.
[11]周益民,孫世新,田玲. 一種實(shí)用的所有點(diǎn)對(duì)之間最短路徑并行算法[J].計(jì)算機(jī)應(yīng)用,2005,25(12):2911-2934.
[12]劉志輝,張志強(qiáng).作者關(guān)鍵詞耦合分析方法及實(shí)證研究[J].情報(bào)學(xué)報(bào),2010,29(2):268-275.
Research on Web-based Information Service Platform of Expert Evaluation
DU Hui
(School of Information Management, Wuhan University, Wuhan 430072, P. R. China)
Abstract:
This paper sets up a web-based intelligent information service platform of scientific research evaluation, achieves a variety of international academic database information collection, collation, analysis and mining automation, screening in accordance with specified conditions specified multiple experts, based on the bibliometrics, statistics, social network analysis and other methods, by analyzing all aspects of experts, to build a library of experts in various fields and provide multi-channel analysis of export and visualization, and can provide information services and decision-making support to the scientific researchers and the department of research and development management.
Key words: expert evaluation; web-based information service; analysis and mining of literature; expert database; expert map; social network
(責(zé)任編輯 彭建國(guó))