魏瑞斌 陳丹丹 琚興
【摘要】
通過文獻綜述和統(tǒng)計分析的方法,分析高校機構(gòu)知識庫的研究現(xiàn)狀;并利用知識圖譜工具研究2006-2011年安徽財經(jīng)大學管理科學與工程學院的學術(shù)資源情況,指出高校機構(gòu)知識庫中的資源在高校構(gòu)建科研團隊和學科建設(shè)等方面的應(yīng)用價值。
【關(guān)鍵詞】
高校 機構(gòu)知識庫 知識圖譜 合作網(wǎng)絡(luò) 共詞分析
2002年,學術(shù)出版與學術(shù)資源聯(lián)盟(Scholarly Publishing and Academic Resources Coalition,簡稱SPARC)高級顧問Raym Crow[1]在其The Case for Institutional Repositories: ASPARC Position Paper一文中,首次提出了機構(gòu)知識庫的概念。之后隨著Dspace等機構(gòu)知識庫的開發(fā)工具的誕生,機構(gòu)知識庫在國內(nèi)外迅速發(fā)展。
2003年5月10日Cornell大學的Paul Ginsparg 在于加利福尼亞Irvine大學的國家科學院貝克曼中心舉辦的“知識圖譜測繪”學術(shù)研討會上,針對數(shù)據(jù)訪問做了演講,主要介紹了Cornell大學的機構(gòu)知識庫的基本狀況。此次演講將知識圖譜的理念和機構(gòu)知識庫相結(jié)合,闡述了知識圖譜在Cornell大學機構(gòu)知識庫中的應(yīng)用情況。
機構(gòu)知識庫的概念
迄今為止,機構(gòu)知識庫沒有一個明確的定義。Raym Crow在2002年提出的機構(gòu)知識庫是收集并保存單個或多個大學、科研機構(gòu)智力成果的數(shù)字化資源集合[1]。加拿大研究圖書館協(xié)會(Canadian Association of Research Libraries,簡稱CARL)認為機構(gòu)知識庫是搜集、存儲學術(shù)機構(gòu)成員的知識資源,并提供檢索的數(shù)字知識庫,同時可作為一個全球知識庫的子庫,為世界范圍內(nèi)的網(wǎng)絡(luò)用戶服務(wù)[2]??缕降热薣3]將機構(gòu)知識庫定義為是利用網(wǎng)絡(luò)及相關(guān)技術(shù),依附于特定機構(gòu)而建立的數(shù)字化學術(shù)數(shù)據(jù)庫,它收集、整理并長期保存該機構(gòu)及其機構(gòu)成員所產(chǎn)生的學術(shù)成果,并將這些資源進行規(guī)范、分類、標引后,按照開放標準與相應(yīng)的互操作協(xié)議,允許機構(gòu)及機構(gòu)內(nèi)外的成員通過互聯(lián)網(wǎng)來免費地獲取使用。
雖然機構(gòu)知識庫沒有統(tǒng)一的定義,但是這些定義具有一些共性。一方面,機構(gòu)知識庫都是為存儲某一個機構(gòu)的資源而建立的;另一方面,機構(gòu)知識庫中的資源是對外開放的。筆者認為,機構(gòu)知識庫是為存儲機構(gòu)中的資源而建立的、能夠保存機構(gòu)中所有形式的資源,為機構(gòu)中的用戶提供信息服務(wù)的系統(tǒng)。
機構(gòu)知識庫的研究現(xiàn)狀
自從機構(gòu)知識庫的開發(fā)工具Dspace產(chǎn)生以后,國內(nèi)外機構(gòu)知識庫迅速發(fā)展。截至2012年5月7日,在Registry of Open Access Repositories(簡稱為ROAR,http://roar.eprints.org/)注冊的全球機構(gòu)知識庫已經(jīng)達到了2 875個,分布于100余個國家,而歐美的機構(gòu)知識庫數(shù)量占絕大優(yōu)勢,其中美國以454個居第一位,英國以235個排名第二。如表1所示:
從表1可以看出,美國的機構(gòu)知識庫數(shù)量遠遠超過了其他國家,這主要有兩方面原因:一方面,美國的數(shù)千所高校將機構(gòu)知識庫作為校園的基礎(chǔ)設(shè)施組件,雖然機構(gòu)知識庫至今還沒有得到完全的普及,但是各高校都將機構(gòu)知識庫看成是對教學材料、教學研究材料等進行管理的數(shù)據(jù)庫;另一方面,美國的大部分機構(gòu)知識庫都是基于Dspace構(gòu)建的,Dspace作為一種開源軟件在很大程度上促進了美國機構(gòu)知識庫的發(fā)展。
從表1還可以看出,中國的機構(gòu)知識庫的數(shù)量并不在少數(shù),但是中國大陸的79個機構(gòu)知識庫里,有65個都是屬于中國科學院的各個研究所的,其余的14個中,由大陸登記的高校機構(gòu)知識庫只有廈門大學(http://dspace.xmu.edu.cn/dspace/)和浙江大學(http://dspace.zju.edu.cn/)。
高校機構(gòu)知識庫是機構(gòu)知識庫的一種主要類型,與科研單位機構(gòu)知識庫一樣,是對高校的智力成果進行收集和保存的知識資源集合。目前國內(nèi)很多高校構(gòu)建了機構(gòu)知識庫,但是這些機構(gòu)知識庫的鏈接很多已經(jīng)失效,更沒有被ROAR收錄,只能夠通過文獻知道這些機構(gòu)知識庫(例如中國農(nóng)業(yè)大學機構(gòu)知識庫[4]、同濟大學機構(gòu)知識庫[5])存在過。
目前機構(gòu)知識庫的構(gòu)建技術(shù)已經(jīng)相當成熟,但是由于高校領(lǐng)導和政府對機構(gòu)知識庫不夠重視,加之機構(gòu)知識庫構(gòu)建后的管理和維護單位不夠明確等,許多機構(gòu)知識庫建立不久即告夭折。本文從機構(gòu)知識庫中資源的應(yīng)用情況出發(fā),研究機構(gòu)知識庫的用途,以提高機構(gòu)知識庫在高校中的知名度。
基于知識圖譜的高校機構(gòu)知識庫的應(yīng)用
高校機構(gòu)知識庫構(gòu)建的最終目的是促進高校內(nèi)部和高校之間的學術(shù)交流和共享,使機構(gòu)知識庫中的資源得到合理利用。本文將機構(gòu)知識庫中存儲的資源作為研究對象,進行社會網(wǎng)絡(luò)分析和共詞分析,全面分析機構(gòu)知識庫中資源的情況,進而把握高校中具體的科研成果情況。
由于本文撰寫時機構(gòu)知識庫尚處于構(gòu)建初期,機構(gòu)知識庫中的數(shù)據(jù)暫時并不完整,考慮到數(shù)據(jù)的完整性和可獲取性,筆者利用CNKI的中國學術(shù)期刊全文數(shù)據(jù)庫,檢索2006年至2011年期間以安徽財經(jīng)大學管理科學與工程學院(原為信息工程學院)為作者單位的期刊論文。具體檢索條件如下,時間范圍:2006年至2011年;單位名稱:安徽財經(jīng)大學信息工程學院或安徽財經(jīng)大學管理科學與工程學院;期刊范圍:所有期刊。共檢索到595篇文章,其中第一作者是安徽財經(jīng)大學信息工程學院或安徽財經(jīng)大學管理科學與工程學院的論文有532篇,非第一作者發(fā)文為63篇。筆者選取安徽財經(jīng)大學管理科學與工程學院(包含更名前的信息工程學院,下同)為第一作者單位公開發(fā)表的論文532篇作為研究對象,這些研究對象都將被存儲到機構(gòu)知識庫中。
3.1 基于高校機構(gòu)知識庫的科研團隊建設(shè)
對機構(gòu)知識庫中的資源所有者進行研究,可以通過研究科研人員論文合著情況來探討科研人員的合作和科研團隊的構(gòu)建。例如,南京大學信息管理系朱慶華[6]教授應(yīng)用社會網(wǎng)絡(luò)分析方法對國內(nèi)情報學領(lǐng)域合著網(wǎng)絡(luò)進行了實證研究,評價了學者在合著網(wǎng)絡(luò)中的地位,發(fā)現(xiàn)了合著網(wǎng)絡(luò)中的聯(lián)系緊密的團體,指出了合著網(wǎng)絡(luò)中核心作者的數(shù)量和所屬機構(gòu)。程齊凱[7]對檔案學領(lǐng)域的合著網(wǎng)絡(luò)進行了研究分析,總結(jié)了檔案學科的科研團體分布情況并對學者合著規(guī)律進行了探討,等等。
3.1.1 合作網(wǎng)絡(luò)的構(gòu)建
筆者檢索到的532篇論文中包括兩個或兩個以上作者的共有250篇,占論文總篇數(shù)的46.99%。將2006年至2011年劃分為兩個時間段:2006-2008年與2009-2011年,在此基礎(chǔ)上繪制機構(gòu)合作網(wǎng)絡(luò),并分析學術(shù)機構(gòu)合作網(wǎng)絡(luò)的變化情況。
根據(jù)筆者編寫的程序?qū)⒄淼淖髡咝畔⒅瞥珊献骶W(wǎng)絡(luò)矩陣(見表2、表3),在矩陣中n(n=1,2,3,…)表示兩位作者之間合著的頻數(shù),0表示兩位作者之間不存在合著關(guān)系。
合著網(wǎng)絡(luò)可以表示為一個無向的連通圖,圖中的節(jié)點表示資源的作者,節(jié)點之間的關(guān)系表示作者之間的合著關(guān)系,線條的粗細表示作者之間的合作次數(shù),次數(shù)越多,線條越粗。筆者采用Pajek軟件,以可視化的圖形來表示個階段的合著狀況,如圖1和圖2所示:
3.1.2 合作網(wǎng)絡(luò)分析
將2006-2008年作為第一階段,2009-2011年作為第二階段,通過圖1與圖2的比較,第一階段的合作數(shù)量沒有第二階段的多,這種現(xiàn)象一方面取決于第一階段的安徽財經(jīng)大學管理科學與工程學院的期刊論文發(fā)表數(shù)沒有第二階段的多;另一方面,隨著時間的推移,本機構(gòu)的發(fā)展逐步成熟,機構(gòu)的團隊相對穩(wěn)定,其中包括許多本科生和研究生都積極地發(fā)表期刊論文。
觀察圖譜,其中的合作類型主要包括三種:①師生合作,老師作為核心人物,這種合作在網(wǎng)絡(luò)中很多,例如圖2中與程剛教授合作的馮丹丹、楊改、唐凱、王影潔、周綺娟等都是程剛教授的學生。夏日教授和他的學生琚興、汪瑋、李文濤也有合著過論文;②機構(gòu)內(nèi)部人員合作,這種合作模式是學者之間學術(shù)交流的一種,例如圖2中程剛教授和李旭暉老師、魏瑞斌教授之間的合作;③與外機構(gòu)人員合作,例如圖1中程剛教授和石秀和教授之間的合作。
3.1.3 機構(gòu)知識庫在科研團隊建設(shè)中的應(yīng)用
科研團隊學術(shù)帶頭人的選擇??蒲袌F隊學術(shù)帶頭人具有較高的學術(shù)造詣和較好的組織協(xié)調(diào)能力,在研究群體中有較強的凝聚作用。節(jié)點中心度通常是用來衡量團隊的核心人物的指標,科研人員的節(jié)點中心度較高,表明他在網(wǎng)絡(luò)中擁有較多的直接聯(lián)系,這個科研人員也就居于本機構(gòu)科研的中心地位。在一個合作網(wǎng)絡(luò)中,如果一個科研人員居于其他兩節(jié)點的網(wǎng)絡(luò)路徑上,也可以認為該科研人員處于重要地位。中間中心度通常用來刻畫行動者對資源的控制程度[8]。表4和表5分別表示2006年至2011年安徽財經(jīng)大學管理科學與工程學院的合作網(wǎng)絡(luò)的網(wǎng)絡(luò)節(jié)點點度中心度和節(jié)點中間中心度。
結(jié)合科研人員在合作網(wǎng)絡(luò)中的地位,筆者認為,點度中心度和中間中心度都較高的科研人員可以作為科研團隊的帶頭人。從表4和表5看,程剛、徐勇、李旭暉、張雪東等人可以作為科研團隊的帶頭人。
科研團隊成員的選擇。一個科研團隊需要具備的條件之一是擁有類似或相同的研究內(nèi)容,故科研團隊的成員可以從與學術(shù)帶頭人有合作經(jīng)歷的人員中選擇。如圖1和圖2中,徐勇、張海、朱其祥、周森鑫等人已經(jīng)長期合作,可以考慮構(gòu)建成一個科研團隊。還可以從合作網(wǎng)絡(luò)中挖掘一些與科研團隊研究方向相近、有潛在合作條件的科研人員。在圖1和圖2中,除了A部分的長期合作并且合作比較廣泛的科研人員外,B部分的科研人員可以作為備選對象。
在機構(gòu)知識庫中構(gòu)建科研團隊。通過以上的分析,機構(gòu)中的科研人員可以直觀地從合作網(wǎng)絡(luò)圖譜中發(fā)現(xiàn)機構(gòu)內(nèi)成員之間的合作情況,了解機構(gòu)內(nèi)成員科研團隊的劃分,決定要加入的科研團隊。本文借助一些輔助軟件繪制出機構(gòu)內(nèi)的合作網(wǎng)絡(luò),并且以圖片的形式保存到高校機構(gòu)知識庫中,機構(gòu)科研人員可以對其進行下載和瀏覽。
結(jié)合機構(gòu)的合作網(wǎng)絡(luò),筆者在已構(gòu)建的高校機構(gòu)知識庫中創(chuàng)建一個群組,本群組的成員可以對這個群組中的內(nèi)容進行下載和瀏覽等。例如創(chuàng)建一個知識圖譜的群組,可以選擇機構(gòu)知識庫中不同的成員加入到這個群組,并且這個群組對某一特定的專題有一定的權(quán)限,如修改、上傳權(quán)限等,群組分配如圖3所示:
圖3 機構(gòu)知識庫中群組的分配
通過構(gòu)建機構(gòu)知識庫中資源的合作網(wǎng)絡(luò)圖,一方面,可以尋找本機構(gòu)的科研團隊的帶頭人,建立相關(guān)領(lǐng)域的科研團隊;另一方面,可以幫助機構(gòu)中的科研人員尋找和自己研究領(lǐng)域相同的團隊。
3.2 基于高校機構(gòu)知識庫的學科建設(shè)
學科是作為知識體系的科目和分支[9],相對于專業(yè)而言更強調(diào)知識體系。一個機構(gòu)中的學科建設(shè)取決于本機構(gòu)過去的“研究熱點”和未來的研究方向?!把芯繜狳c”,無非是引起學者的廣泛關(guān)注、吸引大量研究的學術(shù)主題,值得進一步探索和拓展研究的焦點問題[10]。不同的學者從不同的角度對這些熱點的界定和研究方法進行研究。例如,魏瑞斌[11]利用社會網(wǎng)絡(luò)分析對關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析,歸納了國內(nèi)特色數(shù)據(jù)庫的研究熱點。對研究熱點的分析,除了大量應(yīng)用期刊論文關(guān)鍵詞之外,還有學者以國家自然科學基金項目[12]、國家社會科學基金項目[13]、碩博論文[14]等為研究對象。胡志剛和李志紅[15]研究了我國科學學的研究熱點。
3.2.1 研究熱點圖譜的構(gòu)建
筆者以檢索到的532篇期刊論文的關(guān)鍵詞為研究對象,來研究安徽財經(jīng)大學管理科學與工程學院2006-2011年研究熱點的情況。首先對文獻的關(guān)鍵詞進行清洗,將具有同一含義的關(guān)鍵詞進行統(tǒng)一表達,例如:安徽、安徽省統(tǒng)一用安徽表達,剔除沒有意義的關(guān)鍵詞,例如學科編碼。然后將數(shù)據(jù)轉(zhuǎn)換為Ucinet可以處理的矩陣,利用Ucinet軟件畫出每個關(guān)鍵詞之間的網(wǎng)狀關(guān)系,最后利用Pajek繪制了度數(shù)大于8的共詞網(wǎng)絡(luò)圖,如圖4和圖5所示:
3.2.2機構(gòu)研究熱點分析
從圖4和圖5來看,每張圖都由大小不同的網(wǎng)絡(luò)構(gòu)成。根據(jù)圖中關(guān)鍵詞的信息可以看出,B部分的都是相對較小的網(wǎng)絡(luò),相對而言這些研究的內(nèi)容具有特殊性,例如圖4中對帆船動力、網(wǎng)格計算的研究;圖5中對研究生課程、水印提取技術(shù)的研究。A部分都是相對較大的網(wǎng)絡(luò),是由小的網(wǎng)絡(luò)圖構(gòu)成的。例如圖4中的數(shù)字圖書館和數(shù)據(jù)挖掘的相關(guān)性將三個小網(wǎng)絡(luò)聯(lián)系到一起,圖5中的系統(tǒng)架構(gòu)和工作流管理的相關(guān)性同樣將三個小網(wǎng)絡(luò)聯(lián)系到一起。但也有可能由于關(guān)鍵詞選擇的不同,研究相近的關(guān)鍵詞不能聯(lián)系在一起。例如圖5中的“聚類”、“聚類分析”兩者的相關(guān)性很強,但是由于作者的表達方式不同,兩者之間未能建立聯(lián)系。
基于以上分析,筆者認為安徽財經(jīng)大學管理科學與工程學院2006-2008年的研究熱點主要集中在“知識管理、數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、算法、系統(tǒng)開發(fā)”等領(lǐng)域。2009-2011年的研究熱點主要集中在“信息公開、農(nóng)村信息化、隱私保護、數(shù)據(jù)發(fā)布、評價分析”等領(lǐng)域。
仍將2006-2008年看成第一階段,2009-2011年看成第二階段,從圖4和圖5來看,第一階段和第二階段的研究主題有著一定的聯(lián)系,例如圖4中的關(guān)鍵詞“數(shù)字水印”和圖5中的關(guān)鍵“水印選擇”都是關(guān)乎水印技術(shù)的。有些領(lǐng)域是到了第二階段才興起的,例如圖5中的“新農(nóng)村信息化”。另外,在第一階段,安徽財經(jīng)大學管理科學與工程學院的研究熱點偏向于計算機技術(shù)和應(yīng)用,例如圖4的“算法、C\S、B\S”等;而在第二階段,研究熱點偏向于信息保護和信息管理,例如圖5中的“信息門戶、信息化、隱私保護”等。
3.2.3 機構(gòu)知識庫在學科建設(shè)中的應(yīng)用
通過以上的分析可知,通過知識圖譜可以直觀地了解機構(gòu)的研究動態(tài)、研究熱點。筆者將上述機構(gòu)知識圖譜存儲到高校的機構(gòu)知識庫中,方便高校的科研人員了解本機構(gòu)的研究動態(tài)和研究熱點,從而確定個人未來的研究主題和研究方向。首先,使用一些輔助軟件構(gòu)建出高校中相關(guān)的主題知識圖譜;其次,在機構(gòu)知識庫中構(gòu)建院系中設(shè)置一項“知識圖譜”,將這些借助工具生成的歷年來的知識圖譜以圖片的形式存儲到機構(gòu)知識庫中??蒲腥藛T可以根據(jù)權(quán)限對高校機構(gòu)知識庫中的知識圖譜進行下載和瀏覽。圖6是“知識圖譜”專題的界面。
綜合考慮到目前高校資源保存的特點,機構(gòu)知識庫的出現(xiàn)為各高校的資源建設(shè)和保存提供了一個很好的思路[16]。本文構(gòu)建的機構(gòu)知識庫支持各種數(shù)據(jù)類型,即機構(gòu)知識庫中存儲的內(nèi)容包括正式發(fā)表的文獻和大量的灰色文獻,如一些期刊論文的預(yù)印本、多媒體教學課件、項目的文稿等。這些灰色文獻是科研和教學過程的記錄,也是高校發(fā)展的一個重要憑證??蒲腥藛T可通過知識圖譜了解本機構(gòu)的科研動態(tài)、合作情況,高校方面則可籍此加強科研管理和學術(shù)交流。
結(jié) 語
國內(nèi)外機構(gòu)知識庫的建設(shè)越來越普及,但是機構(gòu)知識庫資源的利用還有待加強。本文利用知識圖譜的方法,研究高校機構(gòu)知識庫中資源的具體應(yīng)用,包括高??蒲袌F隊的建設(shè)和學科建設(shè)兩個領(lǐng)域的研究。研究結(jié)果表明,高校機構(gòu)知識庫的建設(shè)在這兩個領(lǐng)域都具有很大的應(yīng)用價值。