陳文娟
(河南財經(jīng)政法大學,河南 鄭州 450002)
基于CNKI的關聯(lián)數(shù)據(jù)研究進展計量分析
陳文娟
(河南財經(jīng)政法大學,河南 鄭州 450002)
本文以CNKI中國學術期刊網(wǎng)絡出版總庫為文獻來源,借助CNKI分析功能和Excel軟件,針對2008-2013年我國關聯(lián)數(shù)據(jù)學術研究進展,從年載文量、文獻來源、著者、關鍵詞、引文等多方面進行計量分析,從而揭示我國近年來關聯(lián)數(shù)據(jù)的研究特點。
關聯(lián)數(shù)據(jù);計量分析;CNKI
關聯(lián)數(shù)據(jù)概念的提出最初緣于互聯(lián)網(wǎng)上普遍存在的信息異構、信息孤島等問題,2006年萬維網(wǎng)的發(fā)明者Tim Berners-Lee[1]在語義網(wǎng)的基礎上提出發(fā)展關聯(lián)數(shù)據(jù)之網(wǎng)的構想,并指出其核心和關鍵是關聯(lián)數(shù)據(jù)。此后,關聯(lián)數(shù)據(jù)迅速得到了圖書情報界、信息界、政府機構及相關企業(yè)的廣泛關注和重視,自2008年引入我國以來,國內(nèi)學者對其研究熱情也逐漸高漲。
2.1 數(shù)據(jù)來源與分析方法
本文以中國知網(wǎng)(CNKI)的中國學術期刊網(wǎng)絡出版總庫為來源,借助于CNKI數(shù)據(jù)分析和Excel統(tǒng)計功能,截取2008—2013年6年內(nèi)有關關聯(lián)數(shù)據(jù)的文獻進行計量分析,以期揭示出我國關聯(lián)數(shù)據(jù)研究的演變態(tài)勢。具體檢索策略是在“篇名”為“關聯(lián)數(shù)據(jù)”,時間從2008年到2013年,在CNKI中共檢索到文獻153篇,去除一些會議通知、重復等錯檢項后,得到文獻147篇。
2.2 年代分布與來源期刊分布
通過對一段時期內(nèi)某主題領域的年發(fā)文量的統(tǒng)計分析可以了解該領域的發(fā)展態(tài)勢。通過統(tǒng)計,2008年篇名為關聯(lián)數(shù)據(jù)的文獻僅有4篇,從2010年開始,關聯(lián)數(shù)據(jù)的研究有了較快的發(fā)展,文獻量逐年遞增,到2013年論文達到58篇。我國2008—2013年關聯(lián)數(shù)據(jù)的年代分布如圖1所示。
圖 1 關聯(lián)數(shù)據(jù)文獻年代分布
根據(jù)統(tǒng)計,刊載關聯(lián)數(shù)據(jù)相關文獻的來源期刊分布也相對集中,近75%的文獻分布于圖書情報領域的9種期刊中。其中,刊載量最多的是《現(xiàn)代圖書情報技術》,載文21篇,其次是《圖書情報工作》,載文19篇,隨后依次是《中國圖書館學報》(載文10篇)、《圖書館學研究》(載文10篇)、《圖書與情報》(載文6篇)等,上述幾種期刊均為中文社會科學引文索引CSSCI來源期刊,反映了關聯(lián)數(shù)據(jù)領域高質(zhì)量的研究成果較多。根據(jù)布拉德福定律的描述,《現(xiàn)代圖書情報技術》、《圖書情報工作》是目前我國關聯(lián)數(shù)據(jù)領域的核心期刊。圖2顯示了關聯(lián)數(shù)據(jù)來源期刊的分布情況。
圖 2 關聯(lián)數(shù)據(jù)來源期刊分布
2.3 著者及研究機構、基金分布
伴隨著關聯(lián)數(shù)據(jù)研究領域著者的集中與分散的分布特點,研究機構也呈現(xiàn)出集中與分散的趨勢。根據(jù)CNKI的統(tǒng)計,關聯(lián)數(shù)據(jù)的學科研究隊伍主要分布在中國科學院國家科學圖書館(13篇)、上海圖書館(7篇)、武漢大學(7篇)、中國農(nóng)業(yè)科學院農(nóng)業(yè)信息研究所(5篇)、浙江大學(5篇)。這些也是在信息界、圖書情報界具有較大影響力的學術機構,具有較強的科研實力,足見關聯(lián)數(shù)據(jù)這一新興概念自引入國內(nèi)以來便受到了極大的重視,成為圖書情報研究領域一個新的研究陣地,相關的研究成果具有較高的學術水平和社會影響力。
2.4 關鍵詞分析
通過對關鍵詞及其詞頻的統(tǒng)計分析,能夠揭示該領域現(xiàn)階段的研究熱點和發(fā)展趨勢。根據(jù)CNKI統(tǒng)計,得出147篇關聯(lián)數(shù)據(jù)論文中頻次大于5的關鍵詞共計10個,如表2所示。關聯(lián)數(shù)據(jù)作為一個新興的研究領域,在國內(nèi)尚未形成清晰的脈絡和學術派別。研究主題大致可概括為四個方面:關聯(lián)數(shù)據(jù)的基礎理論、語義網(wǎng)、關聯(lián)數(shù)據(jù)技術、關聯(lián)數(shù)據(jù)應用等。目前,對于關聯(lián)數(shù)據(jù)的概念、研究進展、研究意義等基礎理論所做的研究最多;語義網(wǎng)、數(shù)據(jù)網(wǎng)絡作為關聯(lián)數(shù)據(jù)的發(fā)展環(huán)境和發(fā)展目標,與關聯(lián)數(shù)據(jù)的研究密不可分;關聯(lián)數(shù)據(jù)的發(fā)展又依賴于技術的發(fā)展,RDF、知識組織、知識發(fā)現(xiàn)等關聯(lián)數(shù)據(jù)相關技術逐漸受到關注,將成為未來關聯(lián)數(shù)據(jù)的研究重點;圖書館和網(wǎng)絡是關聯(lián)數(shù)據(jù)應用的主要陣地,也是未來關聯(lián)數(shù)據(jù)研究的前沿和重點。
表 2 關聯(lián)數(shù)據(jù)關鍵詞分布
2.5 引文分析
根據(jù)“H指數(shù)”理論[4],某研究領域文獻中至少有N篇文獻被引頻次不少于N次,該領域文獻的H指數(shù)就是N。通過對147篇文獻進行統(tǒng)計,得知關聯(lián)數(shù)據(jù)文獻的H指數(shù)為14,這個數(shù)值并不高,進一步說明了國內(nèi)關聯(lián)數(shù)據(jù)的研究還處于初級階段,學術產(chǎn)出還不豐富,學術影響力也有待提高。
這14篇文獻中,引用頻次最高的是黃永文的《關聯(lián)數(shù)據(jù)在圖書館中的應用研究綜述》(被引50次),其次是劉煒的《關聯(lián)數(shù)據(jù):概念、技術及應用展望》(被引46次),以及沈志宏的《關聯(lián)數(shù)據(jù)及其應用現(xiàn)狀綜述》(被引42次),其余文獻被引頻率均在30次以下。內(nèi)容主要集中在關聯(lián)數(shù)據(jù)的基礎理論、語義關聯(lián)以及應用展望等方面。這些文獻的作者大都是我國關聯(lián)數(shù)據(jù)領域的核心著者,進一步體現(xiàn)了這些作者在關聯(lián)數(shù)據(jù)領域的影響力和核心地位。
通過借助CNKI分析功能和Excel軟件,對關聯(lián)數(shù)據(jù)相關研究成果的統(tǒng)計和分析,可以看出關聯(lián)數(shù)據(jù)自引入國內(nèi)以來迅速引起了圖書情報學界的重視,目前已經(jīng)取得了一定的學術成果,涌現(xiàn)出了一批核心領軍研究學者,但總體上還處于學科誕生起,尚未形成清晰的研究脈絡和學術派別,研究內(nèi)容主要體現(xiàn)在基礎理論方面,有關技術和應用方面的研究將會是未來的研究熱點和發(fā)展趨勢。
[1]Berners-Lee T.Linked Data-Design Issues[EB/OL].[2014-03-14].http//www.w3c.org/DesignIssues/LinkedData.htm l.
[2]劉煒.關聯(lián)數(shù)據(jù):概念、技術及應用展望[J].大學圖書館學報,2011(2):5-12.
[3]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:191-195.
[4]Hirsch,Jorge E.An index to quantify an individual's scientific research output:PNAS,2005:102(46):16569-1657.
G353.1
A
1671-0037(2014)05-42-1.5
陳文娟(1988.3-),女,碩士,助理館員,研究方向:信息資源管理與服務。