陳和 林靜
摘要:[目的/意義]目前IR發(fā)展到相對成熟階段,對國內(nèi)IR發(fā)展情況進(jìn)行梳理、分析和總結(jié),可為下一階段IR發(fā)展提供參考建議。[方法/過程]利用Excel、VOSviewer、CiteSpace等軟件和編程處理數(shù)據(jù)方法,對2000-2018年CNKI收錄的1 362篇IR期刊論文進(jìn)行可視化分析。[結(jié)果/結(jié)論]國內(nèi)IR發(fā)文經(jīng)歷了迅速增長期、相對平穩(wěn)期以及快速下滑期,預(yù)示目前國內(nèi)IR研究進(jìn)入新階段,出現(xiàn)新的研究點(diǎn);國內(nèi)研究IR的高頻作者(群)以中國科學(xué)院系統(tǒng)群體和高校系統(tǒng)群體為主,前者的研究比后者更為前沿和深入;《圖書情報(bào)工作》《現(xiàn)代情報(bào)》《圖書館學(xué)研究》等是刊載IR研究論文最多的期刊,是國內(nèi)IR研究領(lǐng)域較有影響力的期刊;國內(nèi)IR研究熱點(diǎn)包括系統(tǒng)構(gòu)建、資源建設(shè)、學(xué)術(shù)交流、知識管理與服務(wù)、版權(quán)保護(hù)等;IR未來的可能研究熱點(diǎn)包括科研數(shù)據(jù)、科研服務(wù)、輔助科研決策、數(shù)據(jù)增值服務(wù)等。
關(guān)鍵詞:機(jī)構(gòu)知識庫;IR;數(shù)據(jù)可視化;知識圖譜;文獻(xiàn)計(jì)量;研究熱點(diǎn)
分類號:G251
引用格式:陳和, 林靜. 2000-2018年國內(nèi)機(jī)構(gòu)知識庫研究可視化分析[J/OL]. 知識管理論壇, 2019, 4(5): 276-286[引用日期]. http://www.kmf.ac.cn/p/184/.
20世紀(jì)90年代末,機(jī)構(gòu)知識庫(Institutional Repository,IR)概念在國外開始萌芽。2001年,美國俄亥俄州立大學(xué)圖書館和首席信息官辦公室聯(lián)合推出了知識庫服務(wù)(Knowledge Bank Service),員工、教師和學(xué)生可以將自己的作品上傳到知識庫中,并長期保存,這是實(shí)際意義上IR的早期雛形[1]。2002年,惠普公司與美國麻省理工大學(xué)合作,研發(fā)了IR的構(gòu)建軟件——DSpace[2],并建立麻省理工大學(xué)IR——DSpace@MIT[3],成為第一個(gè)正式建立IR的學(xué)術(shù)機(jī)構(gòu)。2004年,浙江大學(xué)圖書館基于DSpace構(gòu)建了國內(nèi)第一家實(shí)驗(yàn)性的IR。2006年8月,廈門大學(xué)圖書館正式對外公開并發(fā)布基于DSpace構(gòu)建的廈門大學(xué)學(xué)術(shù)典藏庫[4],成為我國大陸地區(qū)第一個(gè)正式運(yùn)行IR的高校。中國科學(xué)院(以下簡稱“中科院”)國家科學(xué)圖書館蘭州分館于2006年基于DSpace進(jìn)行主題學(xué)科的IR平臺建設(shè),并在不斷完善后,在中科院系統(tǒng)內(nèi)推廣運(yùn)用[5]。此后,國內(nèi)越來越多的學(xué)者開始關(guān)注和研究IR,IR也成為各重要圖情學(xué)術(shù)會議的交流討論主題之一[6],并且從2013年開始,中國IR學(xué)術(shù)研討會每年舉辦一次,交流和討論IR最新研究成果,以推進(jìn)IR在中國的發(fā)展[7]。時(shí)至今日,IR在國內(nèi)發(fā)展將近20年,筆者通過對國內(nèi)有關(guān)IR的期刊論文進(jìn)行文獻(xiàn)計(jì)量和數(shù)據(jù)可視化,對IR研究人員、IR研究熱點(diǎn)等相關(guān)主題進(jìn)行梳理和分析,為研究IR的相關(guān)人員提供參考,為今后IR的創(chuàng)新發(fā)展提出建議。
1? 數(shù)據(jù)來源與處理
筆者選用 CNKI(中國知網(wǎng))的期刊論文為數(shù)據(jù)源。在期刊論文檢索頁面,選擇檢索方式為“主題”,檢索詞為“機(jī)構(gòu)知識庫”“機(jī)構(gòu)典藏庫”“機(jī)構(gòu)庫”“機(jī)構(gòu)倉儲”“機(jī)構(gòu)存儲”,檢索詞之間的關(guān)系為邏輯或,檢索期限為2000年到2018年,其他為默認(rèn)選項(xiàng),獲得1 648篇文章(檢索日期為2019年2月15日)。通過人工剔除與本研究無關(guān)的結(jié)果,如物流倉儲、dSPACE仿真系統(tǒng)、IR會議通知、征稿等,最終得到有效文章篇數(shù)為1 362篇。由于受到CNKI單次下載元數(shù)據(jù)條目的限制,以上元數(shù)據(jù)是通過多個(gè)時(shí)間段檢索多次匯總而來。為方便數(shù)據(jù)分析和利用數(shù)據(jù)可視化軟件,數(shù)據(jù)導(dǎo)出格式包括了Refworks、EndNote和自定義格式。
2? 論文發(fā)表時(shí)間分布分析
對檢索獲得的1 362篇文獻(xiàn)的發(fā)表年份元數(shù)據(jù)字段進(jìn)行統(tǒng)計(jì),利用Excel繪制成逐年發(fā)文數(shù)量曲線圖,如圖1所示:
圖1? 逐年發(fā)文數(shù)量曲線圖
國外在2002年左右開始報(bào)導(dǎo)有關(guān)IR研究[8],從圖1可以看出,國內(nèi)從2004年開始第一次出現(xiàn)IR研究的文章[9],反映了我國學(xué)者的研究緊跟國外研究步伐的特點(diǎn),雖然有些時(shí)滯,但很短。從發(fā)文趨勢情況來看,2004年算是中國大陸研究IR的元年,從此國內(nèi)IR進(jìn)入蓬勃發(fā)展的階段。從2004年到2018年,有關(guān)IR的發(fā)文情況大概可以分為三個(gè)階段:
第一階段,從2004年到2009年。該階段是IR發(fā)文的快速增長階段,2009年達(dá)到第一個(gè)高峰,發(fā)文量達(dá)133篇。在該階段,IR作為新的學(xué)術(shù)課題被引入國內(nèi),引起國內(nèi)圖書情報(bào)界學(xué)者極大的關(guān)注和研究熱情,紛紛發(fā)表了大量的關(guān)于IR的學(xué)術(shù)論文??v覽這時(shí)期的論文內(nèi)容,主要是介紹域外IR的研究進(jìn)展或成果,包括IR的出現(xiàn)背景、概念內(nèi)涵、學(xué)術(shù)交流功能意義等,以及IR作為“泊來品”對我國圖書館建設(shè)與學(xué)術(shù)研究的啟示等。
第二階段,從2009年到2017年。該階段是IR發(fā)文相對穩(wěn)定階段。經(jīng)過第一個(gè)階段的學(xué)習(xí)積累,國內(nèi)圖書情報(bào)界對IR有了比較充分的理論認(rèn)識,開始進(jìn)入IR實(shí)踐發(fā)展階段,這階段的發(fā)文涉及IR構(gòu)建實(shí)踐、IR資源建設(shè)探索、文獻(xiàn)計(jì)量分析、開放獲取政策、學(xué)科服務(wù)、科研管理等。該階段是IR在國內(nèi)真正落地生根發(fā)展階段,研究方向多樣化,實(shí)現(xiàn)IR研究百花齊放式的發(fā)展,每年的發(fā)文量幾乎都是百篇以上。
第三階段,2018年。從發(fā)文曲線來看,2018年的總發(fā)文量比往年有比較大的下滑(原文檢索時(shí)間于2月份,由于CNKI上線論文存在時(shí)滯,2019年6月份本文修改時(shí)2018年的發(fā)文量已增至88篇),從趨勢來看,可能還將繼續(xù)下滑。該現(xiàn)象直觀地表明,題名、關(guān)鍵詞、摘要等字段含有“機(jī)構(gòu)知識庫”及相近概念的期刊論文開始減少,但是否意味著國內(nèi)IR研究開始停滯不前或進(jìn)展緩慢?筆者以IR當(dāng)前熱門話題“科研數(shù)據(jù)”為檢索詞在CNKI進(jìn)行檢索,其中篇名含有該詞并且檢索時(shí)間為2018年的檢索結(jié)果是78篇,這些被檢索出的期刊論文在相關(guān)字段中多數(shù)沒有出現(xiàn)“機(jī)構(gòu)知識庫”及相近概念詞語,但是此類論文仍然屬于IR范疇。因此,進(jìn)入2018年,國內(nèi)IR研究并沒有停滯,只是以“機(jī)構(gòu)知識庫”及相近概念作為發(fā)文主題的論文開始減少,預(yù)示國內(nèi)IR的研究開始進(jìn)入新階段,出現(xiàn)新的研究熱點(diǎn),僅用“機(jī)構(gòu)知識庫”及相近概念已不能滿足檢索該領(lǐng)域的全部論文要求,關(guān)于新研究熱點(diǎn)將在下文“研究熱點(diǎn)分析”部分繼續(xù)分析。
3? 主要刊發(fā)期刊分析
經(jīng)統(tǒng)計(jì),1 362篇文獻(xiàn)刊載于224種期刊,依據(jù)發(fā)文量由多到少排序,并根據(jù)“二八定律”,取前20%(45本)期刊進(jìn)行統(tǒng)計(jì)分析,得到如圖2所示的比例示意圖(低于4%的期刊作了歸并處理)。
圖2? 主要刊發(fā)期刊分析
如圖2所示,《圖書情報(bào)工作》《現(xiàn)代情報(bào)》《圖書館學(xué)研究》《情報(bào)理論與實(shí)踐》《情報(bào)探索》《現(xiàn)代圖書情報(bào)技術(shù)》(2017年更名為《數(shù)據(jù)分析與知識發(fā)現(xiàn)》)、《情報(bào)雜志》《科技情報(bào)開發(fā)與經(jīng)濟(jì)》《農(nóng)業(yè)圖書情報(bào)學(xué)刊》《圖書館雜志》10種期刊刊載的有關(guān)IR文章達(dá)到所有IR發(fā)文量的50%,也就是說國內(nèi)研究IR的作者將大部分文章投向了這些期刊。從統(tǒng)計(jì)結(jié)果來看,上述刊物可以視為國內(nèi)IR研究領(lǐng)域的高影響力期刊,若有需要了解國內(nèi)IR具體研究情況的用戶,可以把這些刊物發(fā)表的IR論文作為重點(diǎn)關(guān)注論文。
4? 論文作者分析
4.1? 高頻作者
對1 362篇論文的作者進(jìn)行統(tǒng)計(jì)和排序,其中發(fā)文量大于等于8篇的作者共有21位,可以認(rèn)為這些作者是國內(nèi)IR研究領(lǐng)域的高頻作者,見圖3。其中,發(fā)文頻率最多的作者是祝忠明,以34篇高居榜首,是排在第二位作者發(fā)文量的2倍還多,是國內(nèi)IR研究領(lǐng)域發(fā)文量超高頻作者。從作者對應(yīng)的工作單位來看,中科院系統(tǒng)的作者約占高頻作者數(shù)的一半,而其他的高頻作者主要來自高校系統(tǒng),這從另一側(cè)面反映了中科院系統(tǒng)對IR的研究比高校系統(tǒng)更加活躍,從他們的發(fā)文內(nèi)容來看,中科院系統(tǒng)作者對IR的研究也比較系統(tǒng)、深入和前沿。
圖3? 發(fā)文高頻作者
4.2? 作者合作網(wǎng)絡(luò)
對原始檢索結(jié)果數(shù)據(jù)的作者字段進(jìn)行Python編程轉(zhuǎn)換處理成ris文件,再利用可視化軟件VOSviewer創(chuàng)建作者合作網(wǎng)絡(luò)圖(作者最少發(fā)文量閾值設(shè)定為3篇),如圖4所示。
圖4顯示,合作成員超過5名的研究團(tuán)隊(duì)共有4個(gè):①祝忠明研究團(tuán)隊(duì)。該團(tuán)隊(duì)成員基本來自中科院國家科學(xué)圖書館蘭州分館。通過他們發(fā)表的文章可以發(fā)現(xiàn),該團(tuán)隊(duì)是中科院IR系統(tǒng)的技術(shù)開發(fā)和維護(hù)團(tuán)隊(duì),他們在多個(gè)基金項(xiàng)目的資助下,完成了多項(xiàng)有關(guān)IR的研究。在DSpace作為原型系統(tǒng)的基礎(chǔ)上,開發(fā)了適合中科院實(shí)際需求的新的IR系統(tǒng)——CSpace,并在全院推廣使用。根據(jù)用戶需求,該團(tuán)隊(duì)對系統(tǒng)持續(xù)了進(jìn)行開發(fā)、更新和維護(hù),目前已經(jīng)開始將其推廣到中科院系統(tǒng)外的國內(nèi)高校系統(tǒng)[10]。該團(tuán)隊(duì)對IR研究最深入、最全面、最前沿,是國內(nèi)研究IR領(lǐng)域的權(quán)威團(tuán)隊(duì)。②顧立平研究團(tuán)隊(duì)。團(tuán)隊(duì)成員主要來自中科院國家科學(xué)圖書館。通過他們發(fā)表的文章可以發(fā)現(xiàn),他們和祝忠明團(tuán)隊(duì)同屬于中科院機(jī)構(gòu)知識團(tuán)隊(duì),兩者相輔相成,但前者主要側(cè)重于中科院IR系統(tǒng)的推廣與服務(wù)、開放獲取政策研究、輔助系統(tǒng)支持等。③聶華研究團(tuán)隊(duì)。成員主要來自北京大學(xué)圖書館。通過他們發(fā)表的文章可以發(fā)現(xiàn),北京大學(xué)圖書館很早就已經(jīng)介入IR的建設(shè),作為Calis-IR項(xiàng)目的主要負(fù)責(zé)單位,擔(dān)負(fù)了CALIS成員館的IR建設(shè)與推廣工作,現(xiàn)在正在推動中國高校IR聯(lián)盟建設(shè)[11-12]。④李國俊研究團(tuán)隊(duì)。團(tuán)隊(duì)成員主要來自北京科技大學(xué)圖書館,他們主要以北京科技大學(xué)IR為基礎(chǔ)[13],討論了IR系統(tǒng)構(gòu)建、數(shù)字資源建設(shè)、基于IR的文獻(xiàn)收錄引用及計(jì)量服務(wù)研究等。
圖4? 作者合作網(wǎng)絡(luò)圖
另外,從圖4中還可以看到,孫坦、肖明在作者合作網(wǎng)絡(luò)中起到了聯(lián)結(jié)橋梁作用,聯(lián)結(jié)了中科院、北京師范大學(xué)、北京郵電大學(xué)、北京科技大學(xué)等之間的校際IR研究合作。
5? 研究熱點(diǎn)分析
論文關(guān)鍵詞是作者選用的最能體現(xiàn)論文研究內(nèi)容或主題的簡短詞語,通過對國內(nèi)有關(guān)IR論文的關(guān)鍵詞進(jìn)行計(jì)量分析,可以了解國內(nèi)IR的主要研究熱點(diǎn)。
由于關(guān)鍵詞并不是規(guī)范的主題詞,對關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析前,需要對關(guān)鍵詞進(jìn)行必要的歸并處理,比如“開放存取”統(tǒng)一為“開放獲取”,“機(jī)構(gòu)庫”“機(jī)構(gòu)倉儲”“機(jī)構(gòu)倉儲庫”“機(jī)構(gòu)存儲”“機(jī)構(gòu)存儲庫”“機(jī)構(gòu)典藏庫”“機(jī)構(gòu)知識庫”等統(tǒng)一為“機(jī)構(gòu)知識庫”,“大學(xué)”統(tǒng)一為“高校”。
5.1? 高頻關(guān)鍵詞
通過對規(guī)范后的關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì),獲得高頻關(guān)鍵詞列表,如表1所示(只截取前30個(gè)):
如表1所示,由于本次研究對象是機(jī)構(gòu)知識庫,所以該詞出現(xiàn)頻率最高,而且遠(yuǎn)高于其他關(guān)鍵詞。接著出現(xiàn)的高頻關(guān)鍵詞是“開放獲取”“圖書館”“高校”,這3個(gè)詞的出現(xiàn)頻次也是遠(yuǎn)高于其他高頻關(guān)鍵詞。IR是在開放獲取運(yùn)動迅速發(fā)展的背景下產(chǎn)生,是后者的一種具體實(shí)踐方式。討論開放獲取時(shí)也會討論IR,而討論IR時(shí)也往往會提及開放獲取相關(guān)內(nèi)容和背景。因此,“開放獲取”成為IR之后的次超高頻關(guān)鍵詞?!皥D書館”和“高校”關(guān)鍵詞說明目前國內(nèi)研究IR的主要是圖書館,而且以高校圖書館為主。IR的一個(gè)重要使命是長期保存本機(jī)構(gòu)的知識成果,與圖書館保存人類知識之使命相契合,可以說圖書館積極研究IR、構(gòu)建IR、推廣IR服務(wù)是一項(xiàng)職業(yè)使命,也是歷史使命。構(gòu)建IR系統(tǒng)的開源軟件DSpace,在推動IR在世界范圍內(nèi)廣泛普及與發(fā)展方面貢獻(xiàn)巨大,國內(nèi)學(xué)者研究IR往往是從研究DSpace開始,因此,DSpace也出現(xiàn)在高頻關(guān)鍵詞的前列。
對于其他的高頻關(guān)鍵詞,筆者將結(jié)合下面的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖進(jìn)行分析。
5.2? 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)
參照作者合作網(wǎng)絡(luò),利用VOSviewer創(chuàng)建關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖(見圖5)。由于“機(jī)構(gòu)知識庫”“開放獲取”“圖書館”“高?!痹谠摼W(wǎng)絡(luò)中屬于超高頻關(guān)鍵詞,在共現(xiàn)網(wǎng)絡(luò)圖中覆蓋了其他關(guān)鍵詞的共現(xiàn)關(guān)系,因此未把它們并入共現(xiàn)網(wǎng)絡(luò)圖。在參數(shù)設(shè)置上,關(guān)鍵詞出現(xiàn)的最小頻率(mininum number of occurrences of a keywords)是8。
圖5? 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)
通過表1和圖5,并結(jié)合具體文獻(xiàn)進(jìn)行綜合分析,可以概括出國內(nèi)IR領(lǐng)域研究的幾個(gè)熱點(diǎn)研究領(lǐng)域:
(1)IR系統(tǒng)構(gòu)建研究。該研究熱點(diǎn)主要出現(xiàn)在IR研究早期。構(gòu)建IR有多款軟件系統(tǒng),其中DSpace軟件因其源代碼開放、無償免費(fèi)使用、功能豐富、社區(qū)支持等特點(diǎn)吸引了無數(shù)IR關(guān)注者的興趣,它實(shí)現(xiàn)了IR從理論到落地實(shí)踐的過程。從發(fā)表的文獻(xiàn)來看,內(nèi)容涉及DSpace軟件的功能架構(gòu)介紹、與其他IR構(gòu)建軟件對比研究、DSpace本地化與具體應(yīng)用實(shí)踐等。與之共現(xiàn)的主要關(guān)鍵詞除了之前的超高頻關(guān)鍵詞外,還有數(shù)據(jù)模型、模式、元數(shù)據(jù)、互操作、關(guān)聯(lián)數(shù)據(jù)、開源軟件等。
(2)IR資源建設(shè)研究。開展IR服務(wù),其最根本還是要落實(shí)到具體資源的收集和管理。機(jī)構(gòu)的學(xué)術(shù)成果或?qū)W術(shù)產(chǎn)出形式多樣,包括但不限于期刊論文、會議論文、學(xué)位論文、演示文稿、專利、軟件、影像視頻、科學(xué)數(shù)據(jù)等。如何對這些學(xué)術(shù)成果進(jìn)行有效的收集、組織和整理,是國內(nèi)IR研究一直關(guān)注的熱點(diǎn)問題。IR資源建設(shè)相關(guān)的關(guān)鍵詞有內(nèi)容建設(shè)、質(zhì)量控制、學(xué)術(shù)資源、開放獲取資源、知識產(chǎn)權(quán)、自存儲、服務(wù)模式、策略、文獻(xiàn)計(jì)量學(xué)、建設(shè)模式、可持續(xù)發(fā)展、DSpace等。
(3)IR促進(jìn)學(xué)術(shù)交流功能研究。隨著信息技術(shù)與網(wǎng)絡(luò)技術(shù)的發(fā)展以及人們對學(xué)術(shù)研究活動觀念與方法的改變,傳統(tǒng)的耗時(shí)、耗力與耗錢的學(xué)術(shù)交流模式已經(jīng)不適應(yīng)自由快速學(xué)術(shù)交流的趨勢。開放獲取的理念是讓用戶通過公共網(wǎng)絡(luò)快速無障礙地獲取所需要的學(xué)術(shù)資源,改變了傳統(tǒng)的學(xué)術(shù)交流模式[14],IR作為開放獲取模式下的學(xué)術(shù)產(chǎn)物,實(shí)現(xiàn)了學(xué)術(shù)自由快速交流的作用,受到科研人員和普通用戶極大的關(guān)注和認(rèn)可。與學(xué)術(shù)交流共現(xiàn)的關(guān)鍵詞有知識管理、信息資源、資源共享、IR聯(lián)盟、學(xué)術(shù)IR、DSpace、模式、日本等。
(4)IR知識管理與服務(wù)研究。IR的本質(zhì)是對機(jī)構(gòu)的知識產(chǎn)出進(jìn)行有效的組織和管理,并在網(wǎng)絡(luò)上開放這些知識產(chǎn)品,實(shí)現(xiàn)學(xué)術(shù)自由交流。要開展IR服務(wù),除了對原始學(xué)術(shù)資源進(jìn)行收集和積累,圖書館還需要聯(lián)合機(jī)構(gòu)相關(guān)組織部門,如高??蒲泄芾聿块T、人事管理部門等,對IR的內(nèi)容進(jìn)行有效的組織和管理,以便為不同科研人員或?qū)嶓w提供高效的服務(wù)[15]。這是對IR更高層級的研究。與IR知識管理與服務(wù)相關(guān)的關(guān)鍵詞有知識管理、知識服務(wù)、科研管理、科研成果、數(shù)據(jù)管理、大數(shù)據(jù)、資源共享、學(xué)科館員、關(guān)聯(lián)數(shù)據(jù)、IR聯(lián)盟、可持續(xù)發(fā)展等。
(5)版權(quán)保護(hù)研究。IR是在開放獲取運(yùn)動的背景下產(chǎn)生,旨在提供學(xué)術(shù)自由交流的平臺,為用戶提供學(xué)術(shù)資源的無障礙訪問和獲取服務(wù),但并不意味著學(xué)術(shù)資源可以不受保護(hù)地被任意使用。如何在收集機(jī)構(gòu)學(xué)術(shù)成果和對外提供服務(wù)時(shí),保護(hù)作品和作者的版權(quán)權(quán)益,同時(shí)為用戶提供最大的使用便利,也是國內(nèi)IR研究的一個(gè)研究熱點(diǎn)。與版權(quán)保護(hù)相關(guān)的關(guān)鍵詞有知識產(chǎn)權(quán)、著作權(quán)、自存儲、自存檔、質(zhì)量控制、知識共享、合理使用、數(shù)字圖書館、對策等。
總體上,上述研究熱點(diǎn)之間的區(qū)隔并不太明顯,而是互相滲透和交融,研究熱點(diǎn)整體上比較平均,并沒有特別突出的研究熱點(diǎn)。
5.3? 關(guān)鍵詞時(shí)間線視圖
利用CiteSpace(5.3.R4.8.31.2018)對從CNKI下載的以Refworks格式保存的元數(shù)據(jù)中的關(guān)鍵詞節(jié)點(diǎn)進(jìn)行時(shí)間線視圖(Timeline View)分析,得到圖6。同樣,為避免超高頻關(guān)鍵詞對其他關(guān)鍵詞造成覆蓋,“機(jī)構(gòu)知識庫”“開放獲取”“圖書館”“高?!钡任床⑷敕治?。
如圖6所示,CiteSpace根據(jù)自帶算法,把關(guān)鍵詞自動歸為9個(gè)類別,其中#0機(jī)構(gòu)知識庫類的時(shí)間軸線(實(shí)線部分)起源最早,較完整地展示了IR在國內(nèi)的發(fā)展過程,從2004年介紹引入構(gòu)建IR系統(tǒng)的開源軟件DSpace開始,到對DSpace進(jìn)行本地化處理,以適應(yīng)國內(nèi)的應(yīng)用環(huán)境,再到學(xué)習(xí)參考較早介入IR建設(shè)而且又與大陸同文同種的臺灣地區(qū)高校IR建設(shè)經(jīng)驗(yàn)。隨著IR的推廣普及,IR建設(shè)策略、建設(shè)模式、服務(wù)模式等主題相繼被學(xué)者們探討。在這個(gè)過程中,域外比較先進(jìn)的IR建設(shè)實(shí)踐(如日本、美國等)繼續(xù)被介紹和引入。
圖6? 關(guān)鍵詞時(shí)間線視圖
縱觀9個(gè)類別的時(shí)間軸線,只有#3和#4的時(shí)間軸線(實(shí)線部分)延續(xù)至2018年,說明這兩類屬于當(dāng)前的研究熱點(diǎn)。結(jié)合其他時(shí)間軸上新出現(xiàn)的關(guān)鍵詞,可以概括出國內(nèi)IR研究新出現(xiàn)的研究傾向,這些傾向可能預(yù)示著新的研究熱點(diǎn),主要包括如下幾個(gè)方面:
(1)科研數(shù)據(jù)。新出現(xiàn)的關(guān)鍵詞中“數(shù)據(jù)”出現(xiàn)的頻率最高,說明國內(nèi)IR研究已經(jīng)開始關(guān)注科研數(shù)據(jù)領(lǐng)域??蒲袛?shù)據(jù)屬于IR資源建設(shè)范疇,在過去的有關(guān)IR資源建設(shè)研究中,主要關(guān)注點(diǎn)是期刊論文、會議論文、演示文稿、學(xué)位論文點(diǎn)等比較有“成果”性質(zhì)的顯性學(xué)術(shù)資源。科研數(shù)據(jù)在科研活動中往往只是“中間產(chǎn)品”,或者只是學(xué)術(shù)成果的附屬資料,常常被科研工作者忽略,隨著科研活動的結(jié)束而被放棄。然而隨著科研活動進(jìn)入第四范式,以及計(jì)算科學(xué)領(lǐng)域的進(jìn)步,特別是在大數(shù)據(jù)研究背景下,數(shù)據(jù)重用已經(jīng)被認(rèn)可和重視,促使人們開始注重科研活動中有價(jià)值數(shù)據(jù)的保存與重用[16]。
(2)科研服務(wù)。IR因科研而生,并終將為科研服務(wù)??蒲谢顒邮莿討B(tài)的、持續(xù)的過程,并且隨著開放科學(xué)的進(jìn)步和社會經(jīng)濟(jì)環(huán)境等因素的變化而不斷變化和調(diào)整。同樣地,為科研服務(wù)的IR也將不斷自我調(diào)整和完善,也是今后IR研究中的一個(gè)持續(xù)熱點(diǎn)問題。
(3)輔助科研決策。隨著大數(shù)據(jù)科學(xué)的發(fā)展,以及IR在內(nèi)容和功能上的不斷完善,IR在機(jī)構(gòu)科研決策方面的輔助決策權(quán)重上的占比將越來越高,將扮演重要的“智庫”角色。當(dāng)然,輔助科研決策并不單單基于單個(gè)機(jī)構(gòu)的知識庫,而可能在多個(gè)機(jī)構(gòu)的“IR聯(lián)盟”之上。IR參與輔助決策是國內(nèi)IR研究和建設(shè)者一個(gè)不斷追求的目標(biāo),需要長期的不斷努力與爭取。
(4)數(shù)據(jù)增值服務(wù)。IR經(jīng)過多年發(fā)展,在內(nèi)容上幾乎囊括了本機(jī)構(gòu)的所有公開發(fā)表的學(xué)術(shù)成果以及部分未公開發(fā)表的學(xué)術(shù)成果,并開始涉及科研數(shù)據(jù)。因此,IR將在學(xué)術(shù)數(shù)據(jù)上占有優(yōu)勢,除了提供常規(guī)的基礎(chǔ)服務(wù),還將在高?!半p一流”的建設(shè)熱潮中,發(fā)揮數(shù)據(jù)優(yōu)勢,提供數(shù)據(jù)增值服務(wù)[17]。
另外,CSpace作為中科院圖書館蘭州分館推出的中國本土化的IR構(gòu)建軟件系統(tǒng),在中科院系統(tǒng)內(nèi)得到了很好的推廣和使用。隨著軟件與時(shí)俱進(jìn)的更新與完善,并不斷拓展用戶群體,今后有關(guān)CSpace的發(fā)文可能會保持一定的頻率。
6? 分析與探討
通過前文對1 362篇論文從不同角度可視化分析后,可以基本了解我國目前IR研究的基本態(tài)勢,即我國的IR研究與建設(shè)已經(jīng)取得了不俗的成就,現(xiàn)在正進(jìn)入一個(gè)比較關(guān)鍵的關(guān)口。筆者針對國內(nèi)IR研究與建設(shè)的當(dāng)前現(xiàn)狀,提出4點(diǎn)建議為IR今后發(fā)展提供參考。
6.1? 再接再厲,持續(xù)推進(jìn)機(jī)構(gòu)知識庫建設(shè)
據(jù)統(tǒng)計(jì)[17],大陸地區(qū)高校和科研院所已建與在建IR共有325個(gè),資源類型包括期刊論文、學(xué)位論文、會議論文、圖書、專利、研究報(bào)告、演示課件、實(shí)驗(yàn)數(shù)據(jù)等。換句話說,目前我國很多高校和科研院所正在建設(shè)一個(gè)規(guī)模比較龐大的學(xué)術(shù)成果資源庫,是學(xué)術(shù)“大數(shù)據(jù)”,隨著科技的發(fā)展,國家對數(shù)據(jù)越來越重視,已經(jīng)把大數(shù)據(jù)提升為國家基礎(chǔ)戰(zhàn)略資源,并認(rèn)為大數(shù)據(jù)是信息社會的“石油”[18],在此背景下,繼續(xù)推進(jìn)IR建設(shè)具有重大“戰(zhàn)略”意義,發(fā)展和應(yīng)用前景廣闊。
另一方面,IR作為持續(xù)收集、管理機(jī)構(gòu)教學(xué)科研活動中產(chǎn)生的智力成果平臺,只要教學(xué)科研活動不停止,IR建設(shè)也不應(yīng)該停歇,應(yīng)該從政策、資金等多方面持續(xù)推進(jìn)IR建設(shè)。
6.2? 整合優(yōu)化,定位成為“國家基礎(chǔ)戰(zhàn)略資源”的組成部分
目前國內(nèi)IR建設(shè)成績斐然,構(gòu)建了一大批以機(jī)構(gòu)學(xué)術(shù)成果為主要內(nèi)容的IR系統(tǒng),資源總量也達(dá)到相當(dāng)規(guī)模,并出現(xiàn)了以資源共享為主要目的兩大IR資源聯(lián)盟(“中國科學(xué)院文獻(xiàn)情報(bào)中心知識庫”和“中國高校機(jī)構(gòu)知識庫聯(lián)盟”)。應(yīng)該順應(yīng)國家發(fā)展形勢,將這些數(shù)量規(guī)模可觀并且還在不斷增長的IR資源,定位為“國家基礎(chǔ)戰(zhàn)略資源”的組成部分,從國家的層面和高度來推動IR資源的建設(shè)與開發(fā)。然而,目前這些資源還不能實(shí)現(xiàn)真正的互聯(lián)和共享,仍分散在不同教育機(jī)構(gòu)和科研院所,資源主體還是掌握在各個(gè)實(shí)體機(jī)構(gòu)手中。
資源只有在流動中才能產(chǎn)生其價(jià)值,因此需要對當(dāng)前IR資源進(jìn)行整合與優(yōu)化,使其互聯(lián)共享。然而,對全國性的IR資源進(jìn)行徹底的整合優(yōu)化,必然涉及不同教育科研機(jī)構(gòu)之間的各種機(jī)制沖突和利益調(diào)整,而且這個(gè)過程不可能由某一個(gè)機(jī)構(gòu)來完成,而是需要從國家層面,對現(xiàn)有的IR政策、體制、機(jī)制等方面進(jìn)行改革創(chuàng)新,對多方利益進(jìn)行協(xié)調(diào)與平衡。而IR建設(shè)者需要從大局出發(fā),解放“各自為戰(zhàn)”思想,拓寬目前對IR資源開發(fā)與利用的思路和視域。只有對IR資源進(jìn)行比較徹底的整合與優(yōu)化,才能成為真正的“國家基礎(chǔ)戰(zhàn)略資源”。
6.3? 統(tǒng)籌協(xié)作,促進(jìn)機(jī)構(gòu)知識庫向縱深發(fā)展
從前文的熱點(diǎn)研究分析中可知,相當(dāng)多的來自不同單位的作者進(jìn)行著相同或相似的IR主題研究,兩大IR研究群體(中科院群體和高校群體)也在進(jìn)行相類似的IR研究和IR聯(lián)盟建設(shè)。由于IR研究人員或團(tuán)體相對分散,缺少統(tǒng)一規(guī)劃和統(tǒng)籌,導(dǎo)致IR研究熱點(diǎn)廣泛,但又不能形成真正的“熱點(diǎn)”,同時(shí)造成重復(fù)投入、重復(fù)研究、重復(fù)產(chǎn)出、重復(fù)勞動、重復(fù)構(gòu)建等現(xiàn)象,浪費(fèi)了人員、精力,甚至財(cái)力。這些問題在IR早期自發(fā)的、粗獷式、“無政府主義”發(fā)展模式中,難以避免。
IR發(fā)展到今天,必須對此前的發(fā)展模式進(jìn)行改革,對全國IR研究團(tuán)體和個(gè)人及其研究項(xiàng)目進(jìn)行全面統(tǒng)籌、分工協(xié)作,避免重復(fù)研究。各IR研究團(tuán)體和個(gè)人應(yīng)結(jié)合各自特點(diǎn)和優(yōu)勢有針對性地對IR發(fā)展趨勢中的熱點(diǎn)問題展開研究,例如科研數(shù)據(jù)熱點(diǎn)研究、科研輔助熱點(diǎn)研究等,形成有一定特色的IR熱點(diǎn)研究。同時(shí),從國家層面,組織一批有實(shí)力的IR研究團(tuán)隊(duì)對IR發(fā)展趨勢中的熱點(diǎn)問題進(jìn)行預(yù)研攻關(guān)性研究,例如,IR資源作為“國家基礎(chǔ)戰(zhàn)略資源”,探索如何利用大數(shù)據(jù)的技術(shù)方法對其進(jìn)行深度開發(fā)與利用,從而使我國IR研究具有一定特色,又形成一定梯度的IR研究隊(duì)伍。
通過全面統(tǒng)籌和規(guī)劃協(xié)調(diào),能夠節(jié)約、經(jīng)濟(jì)、高效地實(shí)現(xiàn)IR研究與建設(shè)的突破與創(chuàng)新,促使國內(nèi)IR向縱深發(fā)展。
6.4? 以評促建,提升機(jī)構(gòu)知識庫構(gòu)建質(zhì)量和水平
如前所述,國內(nèi)早期IR建設(shè)較為粗獷,缺少指導(dǎo)和統(tǒng)一規(guī)劃,IR資源種類繁多以及機(jī)構(gòu)對IR建設(shè)投入多寡不一,致使IR普遍存在系統(tǒng)功能較單一、資源種類不一、資源著錄不規(guī)范、不詳細(xì)等問題。這些問題會對后續(xù)的IR系統(tǒng)升級和資源建設(shè)與利用造成影響。
為了使IR更好更快地發(fā)展,使IR資源更好地互聯(lián)共享,建立IR建設(shè)質(zhì)量評價(jià)體系是一種行之有效的手段。從文獻(xiàn)調(diào)研來看,國內(nèi)外已經(jīng)有學(xué)者提出有關(guān)IR質(zhì)量評價(jià)的指標(biāo)體系,R. Serrano-Vicente等提出從技術(shù)、規(guī)程、內(nèi)容、營銷和人員角度對西班牙的IR進(jìn)行評價(jià)[19],郭清蓉提出并建立IR評價(jià)體系的思路和具體指標(biāo)[20],郭翊提出由9項(xiàng)原則及其所包含的績效指標(biāo)構(gòu)成的IR評價(jià)體系[21],唐奇提出基于平衡計(jì)分卡的IR評價(jià)指標(biāo)體系[22]。
然而,IR建設(shè)是一個(gè)動態(tài)過程,對其進(jìn)行評價(jià)也需要靈活的動態(tài)的評價(jià)體系。因此,需要從國家戰(zhàn)略目標(biāo)高度,對IR建設(shè)的不同階段采用不同評價(jià)指標(biāo)體系進(jìn)行及時(shí)評估,確保IR向高質(zhì)量、高水平建設(shè)邁進(jìn)。
7? 結(jié)語
由于本研究數(shù)據(jù)來源僅限于CNKI收錄的期刊論文,檢索用詞是“機(jī)構(gòu)知識庫”及其相近概念詞語,并且未包括博碩士學(xué)位論文在內(nèi)的其他學(xué)術(shù)研究數(shù)據(jù),研究結(jié)果可能會與實(shí)際情況有所偏差。另外,其他具有一定計(jì)量分析意義的元數(shù)據(jù)字段(如基金資助、作者單位、參考文獻(xiàn)等),由于來源數(shù)據(jù)不規(guī)范在本研究中未被納入,希望在后續(xù)研究中將其納入并分析。
筆者對IR未來發(fā)展的建議是立足于宏觀的國家層面而提出,期望國家相關(guān)部門出面引領(lǐng)統(tǒng)籌國內(nèi)IR未來發(fā)展,組織國內(nèi)IR研究專家、IR核心刊物編輯和審稿專家,以及相關(guān)大數(shù)據(jù)應(yīng)用專家等人員,成立IR顧問決策小組,在總結(jié)梳理過去IR建設(shè)經(jīng)驗(yàn)基礎(chǔ)上,對 IR未來發(fā)展作頂層規(guī)劃和設(shè)計(jì),確定發(fā)展戰(zhàn)略,配套出臺相關(guān)政策等。前文所述的IR發(fā)展建議可能帶有一定的理想性,僅借此拋磚引玉,希望引起國內(nèi)IR研究同仁對IR未來發(fā)展作更多討論與探索。
參考文獻(xiàn):
[1] 鐘源. 2004-2013年國外機(jī)構(gòu)知識庫研究的文獻(xiàn)計(jì)量分析[J]. 情報(bào)科學(xué), 2016, 34(6):71-76.
[2] DURASPACE. DSpace - A Turnkey Instutitional Repository Application [EB/OL].[2019-03-30]. https://duraspace.org/dspace/.
[3] MIT Libraries. DSpace@MIT[EB/OL].[2019-03-30]. http://dspace.mit.edu/.
[4] 廈門大學(xué)圖書館. 廈門大學(xué)學(xué)術(shù)典藏庫[EB/OL].[2019-03-30]. https://dspace.xmu.edu.cn/.
[5] 祝忠明, 馬建霞, 常寧, 等. 基于DSpace構(gòu)建學(xué)科知識庫系統(tǒng)的研究與實(shí)踐[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2006(7):10-14.
[6] 上海市圖書館學(xué)會. 歷屆數(shù)字圖書館前沿問題高級研討班[EB/OL].[2019-03-30].http://society.library.sh.cn/node/2827.
[7] 中國機(jī)構(gòu)知識庫推進(jìn)工作組. 歷屆會議[EB/OL].[2019-03-30].http://2018chinair.csp.escience.cn/dct/page/70002.
[8] ROY T. Institutional repositories[J]. Library journal, 2002, 127(15): 28-30.
[9] 吳建中.圖書館VS機(jī)構(gòu)庫——圖書館戰(zhàn)略發(fā)展的再思考[J].中國圖書館學(xué)報(bào), 2004(5):7-10.
[10] 祝忠明, 張旺強(qiáng), 劉巍, 等.我國數(shù)字圖書館軟件開源實(shí)踐的策略和模式:以CSpace為例[EB/OL].[2019-03-30]. http://dlib-oss2014.csp.escience.cn/dct/attach/Y2xiOmNsYjpwZGY6MjU1NzY=.
[11] 聶華, 韋成府, 崔海媛.CALIS機(jī)構(gòu)知識庫:建設(shè)與推廣、反思與展望[J].中國圖書館學(xué)報(bào), 2013, 39(2):46-52.
[12] 韋成府, 聶華, 崔海媛.多館協(xié)作開發(fā)的機(jī)構(gòu)知識庫建設(shè)——以CALIS機(jī)構(gòu)知識庫項(xiàng)目為例[J].大學(xué)圖書館學(xué)報(bào), 2014, 32(3):69-73.
[13] 李國俊, 王瑜, 王李梅, 等.基于元數(shù)據(jù)的高校機(jī)構(gòu)知識庫建設(shè)研究——以北京科技大學(xué)機(jī)構(gòu)知識庫為例[J].大學(xué)圖書館學(xué)報(bào), 2012, 30(4):55-60.
[14] 李春旺. 網(wǎng)絡(luò)環(huán)境下學(xué)術(shù)信息的開放存取[J]. 中國圖書館學(xué)報(bào), 2005(1):33-37.
[15] 衛(wèi)垌圻, 范廣兵, 翁碩, 等.研究型圖書館機(jī)構(gòu)知識庫資源的利用與增值服務(wù)[EB/OL]. [2019-03-30]. http://ir.psych.ac.cn/handle/311026/27283.
[16] 陳和.芻議國內(nèi)高校科學(xué)數(shù)據(jù)知識庫的構(gòu)建[J].數(shù)字圖書館論壇, 2017(12):45-51.
[17] 龔亦農(nóng), 朱茗.我國機(jī)構(gòu)知識庫建設(shè)現(xiàn)狀調(diào)查[J].數(shù)字圖書館論壇, 2018(9):20-28.
[18] 楊波. 大數(shù)據(jù)成國家基礎(chǔ)戰(zhàn)略資源 政府?dāng)?shù)據(jù)互聯(lián)共享促產(chǎn)業(yè)騰飛[EB/OL].[2019-03-30].http://www.gov.cn/zhengce/2015-08/20/content_2916507.htm.
[19] SERRANO-VICENTE R, MELERO R, ABADAL E. Evaluation of Spanish institutional repositories based on criteria related to technology, procedures, content, marketing and personnel[J]. Data technologies and applications, 2018, 52(3): 384-404.
[20] 郭清蓉.機(jī)構(gòu)知識庫自存儲評價(jià)體系的構(gòu)建[J].情報(bào)雜志, 2009, 28(7):74-76, 73.
[21] 郭翊, 吉萍.機(jī)構(gòu)知識庫評價(jià)體系的構(gòu)建[J].圖書館學(xué)刊, 2014, 36(2):10-12.
[22] 唐奇.基于平衡計(jì)分卡的機(jī)構(gòu)知識庫評價(jià)指標(biāo)體系構(gòu)建[J].圖書館工作與研究, 2019(4):53-58.
作者貢獻(xiàn)說明:
陳? 和:提出研究思路,收集與處理數(shù)據(jù),撰寫、修改論文和定稿;
林? 靜:處理數(shù)據(jù)與制圖,撰寫論文。
Visual Analysis of Domestic Institutional Repository in 2000-2018
Chen He? Lin Jing
Library of Xiamen University, Xiamen 361005
Abstract: [Purpose/significance] At present, IR has reached a relatively mature stage. This article combs, analyzes and summaries the development of domestic IR, to provide reference for the next stage of IR development. [Method/process] Using the software of Excel, VOSviewer, CiteSpace and programming, 1 362 articles of IR were collected from CNKI in 2000-2018 year for visual analysis. [Result/conclusion]? The results of this study are as follows: IR articles publishing had experienced rapid development period, the relative stationary period, and downturn period, which means that the current research of domestic IR has reached a new stage, and have new research hotspots; the high-frequency authors (groups) are mainly composed of the authors of the Chinese Academy of Sciences and universities, the formers research is more advanced and deeper than the latter; “Library and Information Service”, “Journal of Modern Information”, “Researches in Library Science”, etc. are the most published journals with IR research papers, and are more influential in the field of IR research in China; research hotspots of domestic IR include system construction, resource construction, academic communication, knowledge management and services, copyright protection, etc.; future research hotspots include research data, scientific research services, auxiliary research decisions, and data value-added services.
Keywords: institutional repository? ?IR? ?data visualization? ? mapping knowledge domain? ? bibliometric? ? ?research hotspots
基金項(xiàng)目:本文系福建省中青年教師教育科研項(xiàng)目“基于本地博碩士學(xué)位論文系統(tǒng)的數(shù)據(jù)挖掘與可視化模式研究”(項(xiàng)目編號:JZ170312)研究成果之一。
作者簡介:陳和(ORCID: 0000-0002-4506-5612),副研究館員,碩士;林靜(ORCID:0000-0002-7886-6109),副研究館員,博士,通訊作者,E-mail: linjingxmulib@xmu.edu.cn。
收稿日期:2019-05-08? ? ? ? 發(fā)表日期:2019-09-04? ? ? ? 本文責(zé)任編輯:劉遠(yuǎn)穎