王熙涵 紀(jì)向新
(1.黑龍江大學(xué)信息管理學(xué)院 黑龍江哈爾濱 150080;2.吉林鐵道職業(yè)技術(shù)學(xué)院圖書館 吉林吉林 132002)
隨著信息技術(shù)與人類生產(chǎn)生活的交匯融合,互聯(lián)網(wǎng)快速發(fā)展,引發(fā)了數(shù)據(jù)的爆發(fā)式增長,“大數(shù)據(jù)”“開放數(shù)據(jù)”等相關(guān)內(nèi)容正日益成為人們關(guān)注的焦點。2015年8月31日,國務(wù)院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,提出要加強頂層設(shè)計和統(tǒng)籌協(xié)調(diào),大力推動政府信息系統(tǒng)和公共數(shù)據(jù)互聯(lián)開放共享,完善法規(guī)制度和標(biāo)準(zhǔn)體系,切實保障數(shù)據(jù)安全[1]。2017年12月8日,中共中央政治局就實施國家大數(shù)據(jù)戰(zhàn)略進行第二次集體學(xué)習(xí),習(xí)近平總書記在主持學(xué)習(xí)時強調(diào):“我們應(yīng)該深入了解大數(shù)據(jù)發(fā)展現(xiàn)狀和趨勢及其對經(jīng)濟社會發(fā)展的影響,分析我國大數(shù)據(jù)發(fā)展取得的成績和存在的問題,推動實施國家大數(shù)據(jù)戰(zhàn)略,加快完善數(shù)字基礎(chǔ)設(shè)施,推進數(shù)據(jù)資源整合和開放共享,保障數(shù)據(jù)安全,加快建設(shè)數(shù)字中國?!盵2]
加強對開放數(shù)據(jù)相關(guān)問題的實踐及理論探討,已經(jīng)成為社會各層面關(guān)注的焦點。圖情領(lǐng)域的相關(guān)學(xué)者對開放數(shù)據(jù)相關(guān)內(nèi)容給予了極大的關(guān)注,進行了深入的研究,產(chǎn)生了一系列的成果。本文利用文獻計量的方法,通過中國知網(wǎng)學(xué)術(shù)文獻總庫,從文獻增長規(guī)律、研究熱點、高產(chǎn)作者等角度對我國開放數(shù)據(jù)領(lǐng)域的研究文獻進行分析,試圖探尋出我國開放數(shù)據(jù)領(lǐng)域的研究全貌。
為了更好地反映出國內(nèi)現(xiàn)階段對開放數(shù)據(jù)領(lǐng)域研究的進展情況,本文選用文獻計量學(xué)的研究方法。在中國知網(wǎng)(CNKI)數(shù)據(jù)庫中,以“主題=開放數(shù)據(jù)”或“主題=數(shù)據(jù)開放”為檢索條件,時間范圍為2007年1月1日至2017年12月31日,檢索出的初始文獻一共為1982篇。再將初始文獻從發(fā)布時間、主題詞、機構(gòu)名稱等方面篩選比對,剔除與開放數(shù)據(jù)領(lǐng)域研究無關(guān)的記錄,最后確定我國開放數(shù)據(jù)領(lǐng)域研究文獻1806篇。
(一)文獻增長規(guī)律分析。文獻的數(shù)量變化能夠反映出科學(xué)研究的關(guān)注度高低,能夠體現(xiàn)出科學(xué)研究成果的多少。因此,可以通過研究文獻的時間分布及增長規(guī)律,總結(jié)出某一時間內(nèi)相關(guān)領(lǐng)域的科學(xué)研究發(fā)展?fàn)顩r。
從文獻時間分布的整體情況來看,自2007年以來,我國開放數(shù)據(jù)領(lǐng)域研究文獻量呈逐步增長的趨勢,經(jīng)歷了科學(xué)研究的初始期、成長期和成熟期。2013年是文獻發(fā)布情況的分水嶺,2013年以前發(fā)表論文共67篇,那時國內(nèi)對開放數(shù)據(jù)方面的研究情況還處于初步發(fā)展階段,也即初始期。從2013年開始,隨著數(shù)據(jù)技術(shù)的不斷發(fā)展,大數(shù)據(jù)、開放數(shù)據(jù)成為人們關(guān)注的焦點,文獻量逐年遞增,呈明顯上升趨勢,這個階段即由成長期逐漸過渡至成熟期。自2015年開始,發(fā)文量明顯多于之前年份,說明自2015年起,我國對開放數(shù)據(jù)領(lǐng)域的科學(xué)研究進入到高峰期,并持續(xù)發(fā)展至今日,較為成熟穩(wěn)定。
(二)文獻來源。根據(jù)統(tǒng)計,我國開放數(shù)據(jù)領(lǐng)域文獻來源主要分布在期刊論文、學(xué)位論文、會議及報紙論文之中。在這1806篇文獻中,64.44%的文獻來自于期刊論文,超過了學(xué)位論文、會議、報紙及其它文章的總和,表明了在開放數(shù)據(jù)領(lǐng)域的科學(xué)文獻中,期刊論文處于核心地位。而作為開放數(shù)據(jù)領(lǐng)域研究的有力推動者,各大高校的研究者們所發(fā)表的博碩論文占有將近10%的比重,發(fā)出了來自高校的強有力聲音。除此之外,發(fā)表在國內(nèi)各大會議及報紙的文獻,也反映出學(xué)者們對開放數(shù)據(jù)領(lǐng)域的關(guān)注。
(三)研究熱點。關(guān)鍵詞是一篇文獻主要內(nèi)容的概要,高頻關(guān)鍵詞能夠反映出特定領(lǐng)域的研究熱點。通過對1806篇有效文獻進行深度分析,可以獲得我國開放數(shù)據(jù)領(lǐng)域關(guān)鍵詞分析表,從而分析得出該領(lǐng)域的研究熱點。
開放數(shù)據(jù)領(lǐng)域共涉及15大關(guān)鍵詞,其中,“大數(shù)據(jù)”“開放數(shù)據(jù)”“政府?dāng)?shù)據(jù)開放”等關(guān)鍵詞出現(xiàn)頻率較高。對高頻詞進行分析后,可以歸納出開放數(shù)據(jù)領(lǐng)域的研究熱點,主要分為兩大類。第一類側(cè)重于對“開放數(shù)據(jù)”含義本身進行研究,由理論再向?qū)嵺`過渡,同時強調(diào)信息技術(shù)的重要性,主要涉及大數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、大數(shù)據(jù)思維等內(nèi)容;第二類側(cè)重于對“政府?dāng)?shù)據(jù)開放”方面的研究,通過政府信息公開、電子政務(wù)、開放政府等內(nèi)容對這一重要方面進行了闡釋。此外,近幾年社會熱議的話題,如“共享經(jīng)濟”“智慧城市”等也在開放數(shù)據(jù)領(lǐng)域中被發(fā)現(xiàn),研究者們提出了“數(shù)據(jù)共享”等概念,體現(xiàn)出了該領(lǐng)域研究的與時俱進。
(四)高影響力文獻。我們在中國知網(wǎng)選擇下載某一領(lǐng)域相關(guān)的文章時,除了查看發(fā)文時間、作者、主題詞外,最重要的兩個影響因素就是被引次數(shù)和下載次數(shù),而被引次數(shù)更具權(quán)威性。一般來說,高影響力文獻也可被稱為高被引文獻。分析開放數(shù)據(jù)領(lǐng)域中文獻被引頻次的多少,能夠了解該領(lǐng)域的關(guān)注點。
在我國開放數(shù)據(jù)領(lǐng)域被引頻次排名前十的文章中,排名第一位的是來自復(fù)旦大學(xué)國際關(guān)系與公共事務(wù)學(xué)院的鄭磊教授于2015年發(fā)表在期刊《電子政務(wù)》上的文章《中國開放政府?dāng)?shù)據(jù)平臺研究:框架、現(xiàn)狀與建議》,論文的主要研究方向為電子政務(wù)、開放政府、政府?dāng)?shù)據(jù)開放等內(nèi)容[3],論文是2014年度國家自然科學(xué)基金面上項目“大數(shù)據(jù)背景下開放政府?dāng)?shù)據(jù)的因素與機理研究:系統(tǒng)動力學(xué)建模與政策仿真”的研究成果,共被引114次,受到學(xué)界的廣泛關(guān)注,影響力非常高。
(五)高產(chǎn)作者情況。在某一科學(xué)研究領(lǐng)域發(fā)表的論文數(shù)量,能夠體現(xiàn)出作者在該領(lǐng)域投入的經(jīng)歷、獲得的成果,反映出為相關(guān)學(xué)科貢獻的價值。
武漢大學(xué)信息管理學(xué)院黃如花教授和黑龍江大學(xué)信息管理學(xué)院馬海群教授在國內(nèi)開放數(shù)據(jù)領(lǐng)域研究中屬于領(lǐng)軍人物,發(fā)文量排名前列,為該領(lǐng)域研究做出了突出的貢獻。馬海群教授依托于國家社科基金重點項目“開放數(shù)據(jù)與數(shù)據(jù)安全的政策協(xié)同研究”,在開放數(shù)據(jù)領(lǐng)域進行了深入的研究,代表性成果是2015年發(fā)表在《中國圖書館學(xué)報》上的《國內(nèi)外開放數(shù)據(jù)政策研究現(xiàn)狀分析及我國研究動向研判》一文,文章主要結(jié)合相關(guān)領(lǐng)域的學(xué)術(shù)研究與實踐進展,分析指出我國在開放數(shù)據(jù)政策這一跨學(xué)科研究主題未來可能出現(xiàn)的六大研究動向[4]。
(六)作者機構(gòu)分布情況。對發(fā)文作者的機構(gòu)分布情況進行分析,能夠掌握相關(guān)領(lǐng)域的核心學(xué)術(shù)研究群體。通過分析整理1806篇有效文獻,只對每篇文獻的獨立作者或第一作者所在的機構(gòu)單位進行統(tǒng)計,同時對機構(gòu)發(fā)文量在10篇以上的進行人工排序,可以得出我國開放數(shù)據(jù)領(lǐng)域文獻第一作者機構(gòu)分布情況。
通過分析可知,武漢大學(xué)和黑龍江大學(xué)的發(fā)文量居于絕對領(lǐng)先地位,是國內(nèi)開放數(shù)據(jù)領(lǐng)域研究的主要機構(gòu),取得了許多重要成果。武漢大學(xué)發(fā)文機構(gòu)主要由兩部分構(gòu)成,武漢大學(xué)信息管理學(xué)院和信息資源研究中心,代表人物為黃如花教授和夏義堃研究員,兩位領(lǐng)軍學(xué)者分別依托于國家社會科學(xué)基金重大項目“面向國家大數(shù)據(jù)戰(zhàn)略的政府?dāng)?shù)據(jù)開放共享對策研究”和國家自然科學(xué)基金面上項目“開放數(shù)據(jù)下公共信息資源再利用體系的重構(gòu)研究”開展研究。此外,武漢大學(xué)的兩位優(yōu)秀博士研究生劉龍、周志峰,也在開放數(shù)據(jù)領(lǐng)域進行了科學(xué)研究。
(七)科研基金情況??茖W(xué)研究離不開各項科研經(jīng)費的支持和保障,一個單位機構(gòu)的科研實力也能由申請到的科研項目多少來判斷。
開放數(shù)據(jù)領(lǐng)域近年來受到了各方關(guān)注,國家及省部級基金項目對該領(lǐng)域的資助力度持續(xù)加大,特別是國家社會科學(xué)基金和國家自然科學(xué)基金。開放數(shù)據(jù)領(lǐng)域研究的高產(chǎn)作者,普遍受到了基金項目的支持,他們產(chǎn)出了許多高質(zhì)量的研究成果;而正如上文介紹到的許多有影響力的文獻,也是受到基金項目的大力支持因而結(jié)成的碩果。我國開放數(shù)據(jù)領(lǐng)域的文獻數(shù)量明顯增多,這與各級各類基金項目的資助有著密不可分的關(guān)系。