趙需要 姬祥飛 樊振佳 劉軍峰
隨著大數(shù)據(jù)、云計算、區(qū)塊鏈等數(shù)據(jù)處理技術(shù)的不斷發(fā)展,數(shù)據(jù)儼然已成為重要的生產(chǎn)要素和原料基石,從企業(yè)到政府部門,越來越多的實體開始探尋數(shù)據(jù)背后所蘊含的巨大價值。其中,政府各部門所收集到的數(shù)據(jù)是其掌握的核心資產(chǎn)和治國理政的重要依據(jù)。[1]整合政府?dāng)?shù)據(jù)資源和加大政府?dāng)?shù)據(jù)開放已成為世界各國政府?dāng)?shù)據(jù)管理的基本共識。[2]數(shù)據(jù)開放已成為政府治理水平現(xiàn)代化的重要推動力量,截至2020年底,我國省級、副省級和地市級政府?dāng)?shù)據(jù)開放平臺已有142個,工作重點由2018年以前的建設(shè)與利用兼顧轉(zhuǎn)變?yōu)樵诮ㄔO(shè)的基礎(chǔ)上強調(diào)政府開放數(shù)據(jù)的利用。[3]自2009年數(shù)據(jù)開放運動以來,世界各地對政府?dāng)?shù)據(jù)開放研究的關(guān)注日益增多,該方面的學(xué)術(shù)研究成果也呈現(xiàn)增多的態(tài)勢,我國學(xué)界和業(yè)界也開始探究政府?dāng)?shù)據(jù)開放的價值、模式、利用等。為了鳥瞰我國數(shù)據(jù)開放研究的熱點、主題及趨勢,本文使用CiteSpace5.7軟件對CNKI平臺刊載有關(guān)數(shù)據(jù)開放的文獻(xiàn)進(jìn)行梳理和可視化分析,并對未來研究態(tài)勢予以探析,希冀能夠為數(shù)據(jù)開放的后續(xù)研究提供視角與借鑒。
本研究采用CiteSpace5.7作為研究工具。CiteSpace5.7由美國德雷賽爾大學(xué)的陳超美教授研發(fā)并供學(xué)者免費下載使用,[4]該軟件基于程序語言JAVA編寫,應(yīng)用于分析某一研究領(lǐng)域的研究熱點及趨勢。CiteSpace5.7利用信息可視化方法、文獻(xiàn)計量學(xué)法和數(shù)據(jù)挖掘算法集成的基本原理,繪制可視化圖譜、建立節(jié)點之間的關(guān)聯(lián)來分析研究對象之間的共現(xiàn)關(guān)系與共引關(guān)系等。[5]
本文數(shù)據(jù)來源選自中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(CNKI)文獻(xiàn)全文數(shù)據(jù)。在 CNKI的高級檢索中以“篇名檢索”為檢索入口,檢索詞為“政府?dāng)?shù)據(jù)開放”或含“政府開放數(shù)據(jù)”,時間跨度為2009年至2021年,去除會議報道、廣告等與研究不相關(guān)文獻(xiàn),共獲得有效文獻(xiàn) 521篇(2021年5月7日檢索)。將目標(biāo)文獻(xiàn)按 CiteSpace5.7所需參考文獻(xiàn)格式導(dǎo)出并轉(zhuǎn)碼,得到本文研究的樣本數(shù)據(jù)。
圖1為2009年至今我國政府?dāng)?shù)據(jù)開放有關(guān)的研究性文獻(xiàn)在CNKI發(fā)文量隨年代變化的情況。由圖可得,在 2009—2013年發(fā)文量較少,均在10篇以下;自2014年發(fā)文量逐漸增多,2017年發(fā)文量達(dá)到頂峰,為107篇,中國知網(wǎng)給出預(yù)測2021年度發(fā)文量將回升至107篇。在521篇文獻(xiàn)中,包括核心(北大核心、CSSCI等)期刊265篇,占文章總數(shù)的50.86%,反映出政府?dāng)?shù)據(jù)開放研究整體質(zhì)量較高。
圖1 發(fā)文量隨年代變化圖
文獻(xiàn)在期刊上的分布遵循布拉德福定律,它是定量描述科學(xué)論文在相關(guān)期刊中,集中與離散狀況的一個規(guī)律。[6]經(jīng)計算,此次統(tǒng)計的521篇文獻(xiàn)分布在180種期刊中,繪制布拉德福期刊分區(qū)表(見表1)。分析表明,核心區(qū)、離散區(qū)和相關(guān)區(qū)三個區(qū)域的論文數(shù)量大體相當(dāng)。核心區(qū)的論文來自期刊數(shù)量不多但平均載文密度最高的6種期刊。相關(guān)區(qū)包括期刊數(shù)量較少,平均載文密度一般的28種期刊,而離散區(qū)包括期刊數(shù)量最多而平均載文密度很低的146種期刊。三者的期刊數(shù)量之比為6∶28∶146≈1∶5∶25=1∶a∶a2。本例布拉德福系數(shù):a =5。即: 6∶28∶146≈1∶5∶52。顯然上述表達(dá)式與布拉德福定律相吻合,說明本研究領(lǐng)域的期刊分布規(guī)律符合布拉德福定律。
表1 布拉德福期刊分區(qū)表
表1與表2列出了論文數(shù)量占總文獻(xiàn)1/3的核心區(qū)載文期刊,6種核心期刊只占期刊總數(shù)的3.33%,載文174篇,占總文獻(xiàn)的33.40%。所以,可以認(rèn)定列在核心區(qū)的6種期刊,即為本研究領(lǐng)域的核心期刊。
表2 各區(qū)載文期刊分布
為進(jìn)一步直觀描述期刊的集中與離散現(xiàn)象,根據(jù)上表的相關(guān)數(shù)據(jù),以lgC為橫坐標(biāo),以每種期刊載文量的累計和R(n)為縱坐標(biāo),擬合布拉德福曲線。由圖2可見,首先曲線前半段是一條上升的指數(shù)曲線,它對應(yīng)為核心區(qū);坐標(biāo)為(0.7782,174)的點為核心區(qū)的拐點,拐點之后是一段線性上升的直線,分別為相關(guān)區(qū)、離散區(qū)。充分說明本研究領(lǐng)域的期刊分布規(guī)律存在著較為明顯的集中與離散現(xiàn)象。
圖2 布拉德福曲線
應(yīng)用布拉德福定律,建立了期刊區(qū)域劃分模型和布拉德福曲線,數(shù)據(jù)擬合較為理想。無論是布拉德福期刊分區(qū)表,還是布拉德福曲線圖,均驗證了期刊的集中與離散現(xiàn)象。其次,布拉德福系數(shù)a是反映任一學(xué)科期刊分布情況的重要參數(shù),a的值越大,核心效應(yīng)越強,反之越弱,本領(lǐng)域內(nèi)a≈5,a值相對較大,可以說其核心效應(yīng)是顯著的。
運行CiteSpace5.7,設(shè)置時間跨度為2009-2021年,時間切片為1year,節(jié)點類型為“author”,參數(shù)為默認(rèn)設(shè)置,得到節(jié)點數(shù)N=248,連線數(shù)E=119,密度為Density=0.0039的作者共現(xiàn)網(wǎng)絡(luò)知識圖譜(見圖3)。
從圖3中可以看出節(jié)點數(shù)最大的學(xué)者為黃如花,陳朝兵、周文泓、鄭磊、陳美、馬海群、趙需要、段堯清等人位列其后。由于各個學(xué)者相互交流與合作,在圖譜中形成了幾個作者子網(wǎng)絡(luò)結(jié)構(gòu),較為顯著的是以黃如花為中心的一個網(wǎng)絡(luò)結(jié)構(gòu)、以陳朝兵為中心的網(wǎng)絡(luò)結(jié)構(gòu)。其中,以武漢大學(xué)黃如花為中心的學(xué)者群體研究成果較多,團(tuán)隊內(nèi)其他成員包括劉龍、周志峰等。此團(tuán)隊主要采取國內(nèi)外政府?dāng)?shù)據(jù)開放現(xiàn)狀進(jìn)行對比分析的研究方法,將目光聚焦于政府?dāng)?shù)據(jù)開放的政策制定、價值體系構(gòu)建和個人隱私問題保護(hù)等方面。[7][8][9]以西南財經(jīng)大學(xué)陳朝兵為中心的學(xué)者群體內(nèi)其他成員包括郝文強等。他們主要應(yīng)用理論模式(力場模型、輪流出價博弈模型等),聚焦于我國政府?dāng)?shù)據(jù)開放的路徑選擇及其優(yōu)化等方面。[10][11][12]
圖3 作者共現(xiàn)網(wǎng)絡(luò)知識圖譜
此外,圖中顯示幾位高產(chǎn)作者合作較少,主要表現(xiàn)為學(xué)者黃如花、劉龍、周志峰之間存在學(xué)術(shù)交流與聯(lián)系,但與其他發(fā)文量較大的學(xué)者(如陳朝兵、周文泓等人)合作較少;單獨節(jié)點的學(xué)者較多,如陳美、鄭磊等人,以上表明我國學(xué)者在數(shù)據(jù)開放的研究上溝通合作意識不足,學(xué)者之間并未形成緊密的學(xué)術(shù)團(tuán)隊,學(xué)者們的學(xué)術(shù)交流與合作亟待加強。
運用CiteSpace5.7對文獻(xiàn)發(fā)文機構(gòu)進(jìn)行可視化呈現(xiàn)和分析,匯總得到數(shù)據(jù)開放研究核心機構(gòu)排名(見表3),挑選出國內(nèi)發(fā)文量五篇以上的機構(gòu),可以看到國內(nèi)機構(gòu)主要分布在信息管理綜合實力較強的幾家高校的管理學(xué)院及其研究機構(gòu)。武漢大學(xué)信息資源研究中心和信息管理學(xué)院以發(fā)文22篇位列發(fā)文機構(gòu)第一名,四川大學(xué)公共管理學(xué)院以18篇的發(fā)文量緊隨其后。研究機構(gòu)之間也并未形成較為緊密的合作,從地域上來看較為分散。
表3 數(shù)據(jù)開放研究核心機構(gòu)
研究熱點反映了某一研究領(lǐng)域的研究重點及方向,對于深入了解與分析這一領(lǐng)域的研究內(nèi)容具有十分重要的意義。關(guān)鍵詞作為一篇文獻(xiàn)中內(nèi)容的核心凝練,某一領(lǐng)域關(guān)鍵詞出現(xiàn)頻率較高就反映了這一領(lǐng)域的研究熱點。[13]關(guān)鍵詞聚類分析是以關(guān)鍵詞共現(xiàn)分析為基礎(chǔ),將關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)關(guān)系通過聚類統(tǒng)計學(xué)的方法簡化成數(shù)目相對較少聚類的過程。[14]本文通過關(guān)鍵詞聚類分析的方法對數(shù)據(jù)開放的研究熱點進(jìn)行分析,以探求我國數(shù)據(jù)開放的研究熱點主題。運行CiteSpace5.7,設(shè)置節(jié)點類型為Keywords,其它參數(shù)設(shè)置與作者參數(shù)相同,在關(guān)鍵詞知識網(wǎng)絡(luò)圖譜的基礎(chǔ)上,選取LLR算法,得到如圖4所示關(guān)鍵詞聚類網(wǎng)絡(luò)圖譜,反映了我國數(shù)據(jù)開放領(lǐng)域的研究重點和熱點。
圖4 關(guān)鍵詞聚類網(wǎng)絡(luò)圖譜
在關(guān)鍵詞聚類知識圖譜基礎(chǔ)上,在“ClusterExplorer”中得到對數(shù)似然率(聚類標(biāo)簽詞提取算法之一),得到關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)聚類表(見表4)。
表4 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)聚類表
對各聚類中的關(guān)鍵詞進(jìn)行分析發(fā)現(xiàn),各聚類研究內(nèi)容存在相互交叉現(xiàn)象,因此可將我國數(shù)據(jù)開放研究歸納為以下七個主題領(lǐng)域:
政府?dāng)?shù)據(jù)開放政策與法規(guī)領(lǐng)域包含“政策研究”“政策體系”“法律法規(guī)”等關(guān)鍵詞。數(shù)據(jù)開放是國家和政府進(jìn)行民主化建設(shè)的有效方式之一,能夠最大程度實現(xiàn)全社會數(shù)據(jù)資源的有效配置和充分再利用。[15]陳朝兵等人選取美、英、澳、新四國為研究對象并運用文獻(xiàn)分析法,提出了適用于我國政府?dāng)?shù)據(jù)開放監(jiān)管的四條路徑。[16]黃如花等人以我國各部委政府?dāng)?shù)據(jù)資源管理政策文本為研究對象,采用質(zhì)性研究方法,提出了基于生命周期的政府?dāng)?shù)據(jù)資源管理政策體系。[17]目前,我國學(xué)者對數(shù)據(jù)開放的研究多是對國外發(fā)達(dá)國家的政府?dāng)?shù)據(jù)開放制度法規(guī)的對比研究,相對來說其他視角下的政府?dāng)?shù)據(jù)開放政策法規(guī)研究還較為缺乏。其次,另有部分學(xué)者也開始聚焦國內(nèi)現(xiàn)有的數(shù)據(jù)開放政策并對其進(jìn)行分析探究,來提出對策建議。從國外到國內(nèi),對于數(shù)據(jù)開放相關(guān)制度法規(guī)的多方位研究,使我國政府未來相關(guān)政策的制定更加科學(xué)和本土化。政府?dāng)?shù)據(jù)開放政策制度的完善與改進(jìn)對數(shù)據(jù)開放的可持續(xù)發(fā)展具有重要意義,并將進(jìn)一步推動政府?dāng)?shù)據(jù)開放工作的發(fā)展。
個人隱私保護(hù)領(lǐng)域包含“信息安全”“隱私保護(hù)”“個人隱私”等關(guān)鍵詞。在數(shù)據(jù)開放工作進(jìn)程中,信息安全是不可忽視的一環(huán),安全性的高低將直接影響到數(shù)據(jù)開放的價值及可利用性。杜荷花從隱私政策角度構(gòu)建了我國政府?dāng)?shù)據(jù)開放用戶隱私保護(hù)評價指標(biāo)體系,發(fā)現(xiàn)政府?dāng)?shù)據(jù)開放平臺的隱私保護(hù)整體較差,用戶隱私安全還面臨著嚴(yán)峻的挑戰(zhàn)。[18]侯曉麗等人從政府角度出發(fā),通過對當(dāng)前較為典型的政府?dāng)?shù)據(jù)開放平臺進(jìn)行調(diào)研,重點探討了數(shù)據(jù)開放過程中還存在的國家秘密泄露風(fēng)險點。[19]眾多學(xué)者從不同角度出發(fā),探究數(shù)據(jù)開放過程中的隱私保護(hù)和信息安全等問題,以期為數(shù)據(jù)開放營造更加良好的環(huán)境與氛圍,為未來更多地方政府的數(shù)據(jù)開放提供前提條件。因而,如何保障“數(shù)據(jù)開放”中信息的安全性成為數(shù)據(jù)開放研究的熱點主題。
生態(tài)學(xué)研究視角領(lǐng)域包含“信息生態(tài)鏈”“眾創(chuàng)空間”“利益相關(guān)者”等關(guān)鍵詞。隨著數(shù)據(jù)開放研究的火熱開展,學(xué)者陸續(xù)從不同的理論角度對數(shù)據(jù)開放進(jìn)行深入的剖析與研究,其中政府?dāng)?shù)據(jù)開放生態(tài)體系作為一個概念被各界多次提及。陳姍姍等人基于眾創(chuàng)空間的背景,從價值理論出發(fā)構(gòu)建了實現(xiàn)政務(wù)數(shù)據(jù)價值的生態(tài)系統(tǒng)模型。[20]趙需要等人從生態(tài)學(xué)和生態(tài)鏈視角出發(fā),對政府開放數(shù)據(jù)生態(tài)鏈的概念、本質(zhì)和類型進(jìn)行了分析與闡述,明確了政府?dāng)?shù)據(jù)開放鏈及鏈上各主體之間的相互關(guān)系。[21]生態(tài)系統(tǒng)視角下的研究更加宏觀和注重實踐,更能發(fā)現(xiàn)政府?dāng)?shù)據(jù)開放實際工作中所出現(xiàn)的問題。生態(tài)系統(tǒng)已成為一個熱點研究方向,在上述學(xué)者對生態(tài)系統(tǒng)與數(shù)據(jù)開放交叉理論研究的基礎(chǔ)上,在未來會得到進(jìn)一步的發(fā)展,提升數(shù)據(jù)開放的價值,促進(jìn)各產(chǎn)業(yè)的轉(zhuǎn)型升級以及創(chuàng)新等。
“實證研究”領(lǐng)域包含“政策量化分析”“實證研究”“層次分析法”等關(guān)鍵詞。實證研究可以有力地支撐定性理論。吳金鵬等人基于生態(tài)系統(tǒng)理論,構(gòu)建了數(shù)據(jù)“供應(yīng)—創(chuàng)新—消費”分析框架,經(jīng)實證研究發(fā)現(xiàn):治理能力、創(chuàng)新能力、公眾參與是促進(jìn)政府?dāng)?shù)據(jù)開放發(fā)展的關(guān)鍵因素。[22]齊艷芬等人構(gòu)建了城市政府開放數(shù)據(jù)行為的影響因素模型并選取部分城市政府的開放數(shù)據(jù)行為進(jìn)行實證分析,發(fā)現(xiàn)企業(yè)、媒體、政府內(nèi)部監(jiān)管要求和其自身技術(shù)能力等對數(shù)據(jù)開放行為有較強的影響。[23]但在目前有關(guān)數(shù)據(jù)開放的研究中,實證研究還尚未得到較為廣泛的應(yīng)用,更多是基于理論的定性研究。但就本領(lǐng)域已有的實證研究發(fā)文年代來看,主要集中于近兩三年(2019年至今),加之由于大數(shù)據(jù)分析等技術(shù)的應(yīng)用導(dǎo)致激增的數(shù)據(jù)量,可以推斷實證研究在未來將會成為一個熱門研究領(lǐng)域。
新興技術(shù)領(lǐng)域包含“大數(shù)據(jù)”“區(qū)塊鏈”“關(guān)聯(lián)數(shù)據(jù)”等關(guān)鍵詞。數(shù)據(jù)獲取、處理及分析是推動數(shù)據(jù)開放的重要技術(shù)基礎(chǔ),技術(shù)發(fā)展與理論研究相輔相成,彼此促進(jìn)。李文彬等人在對我國國內(nèi)省級政府大數(shù)據(jù)應(yīng)用進(jìn)行調(diào)查的基礎(chǔ)上,提出數(shù)據(jù)開放與共享是大數(shù)據(jù)應(yīng)用的前提,是政府最應(yīng)該推動的領(lǐng)域。[24]鄭旭東等人應(yīng)用區(qū)塊鏈技術(shù),從宏微觀兩個方面對區(qū)塊鏈技術(shù)在教育系統(tǒng)政務(wù)數(shù)據(jù)開放平臺建設(shè)的運行與應(yīng)用進(jìn)行了探討,得出區(qū)塊鏈技術(shù)在數(shù)據(jù)開放中的重要地位。[25]趙龍文等人對政府?dāng)?shù)據(jù)開放的模式和方法進(jìn)行了探究,提出了基于關(guān)聯(lián)數(shù)據(jù)和“先發(fā)布、后關(guān)聯(lián)”的兩步式政府?dāng)?shù)據(jù)開放模式,該研究為關(guān)聯(lián)開放政府?dāng)?shù)據(jù)的研究和實踐提供了可行的模式和方法參考。[26]大數(shù)據(jù)等新興技術(shù)及其配套硬件設(shè)備的升級與研發(fā)在政府治理升級和社會進(jìn)步的過程中起著重要作用。眾多學(xué)者就數(shù)據(jù)開放研究中存在的問題及桎梏,應(yīng)用新興技術(shù)對其進(jìn)行探討,以期破解數(shù)據(jù)開放過程中的實際難題,對政府?dāng)?shù)據(jù)開放工作起到幫助。因而,大數(shù)據(jù)成為數(shù)據(jù)開放領(lǐng)域中的一個研究熱點,進(jìn)而筆者認(rèn)為在未來,大數(shù)據(jù)等先進(jìn)技術(shù)依然有很大的發(fā)展前景,在數(shù)據(jù)開放領(lǐng)域內(nèi)有關(guān)大數(shù)據(jù)等新興技術(shù)應(yīng)用的研究將會持續(xù)火熱。
“數(shù)據(jù)資產(chǎn)管理”領(lǐng)域包含“數(shù)據(jù)資產(chǎn)”“信息消費”“數(shù)據(jù)治理”等關(guān)鍵詞。數(shù)據(jù)資產(chǎn)被認(rèn)為是數(shù)字時代最重要的資產(chǎn)形式之一。不僅對于企業(yè),對于政府而言,數(shù)據(jù)資產(chǎn)也是十分重要的,數(shù)據(jù)是數(shù)字城市的智慧源泉,是助推政府?dāng)?shù)字化轉(zhuǎn)型、提升政府治理能力的核心和關(guān)鍵。宋晶晶的研究認(rèn)為當(dāng)前政府?dāng)?shù)據(jù)開放在應(yīng)用方面的研究側(cè)重于資源管理的角度,缺乏資產(chǎn)管理的視角,并在此基礎(chǔ)上,提出了完善我國政府?dāng)?shù)據(jù)資產(chǎn)管理的四條建議。[27]盛小平等人運用比較分析法,解析了數(shù)據(jù)管理與數(shù)據(jù)治理在定義等五個方面的異同,為完善科學(xué)數(shù)據(jù)管理辦法提供參考,從而規(guī)劃與制定使用的科學(xué)數(shù)據(jù)開放共享原則。[28]優(yōu)化我國政府對于數(shù)據(jù)資產(chǎn)的管理,有助于被開放數(shù)據(jù)的價值提升與最大化利用。但就已有研究來看,對于數(shù)據(jù)開放與數(shù)據(jù)資產(chǎn)管理兩者融合的研究不盡完善。以數(shù)據(jù)資產(chǎn)管理為視角對數(shù)據(jù)開放進(jìn)行研究,可在一定程度上填補已有研究的缺位。
科學(xué)數(shù)據(jù)開放領(lǐng)域包括“科學(xué)數(shù)據(jù)”“科研數(shù)據(jù)”“科學(xué)大數(shù)據(jù)”等。大數(shù)據(jù)時代,科技創(chuàng)新越來越依賴于對科學(xué)數(shù)據(jù)的深度挖掘與綜合利用。歐美等發(fā)達(dá)國家都建立了國家級的科學(xué)數(shù)據(jù)中心或數(shù)據(jù)庫,比如美國國立生物信息技術(shù)中心建立維護(hù)的GenBank(基因銀行),美國伊利諾伊州立大學(xué)厄巴納——香檳分校建立維護(hù)的DataBank(數(shù)據(jù)銀行)等。2017年,國家標(biāo)準(zhǔn)化委員會相繼發(fā)布《信息技術(shù)數(shù)據(jù)溯源描述模型》(GB/T 34945-2017)和《信息技術(shù)科學(xué)數(shù)據(jù)引用》(GB/T 35294-2017)國家標(biāo)準(zhǔn),標(biāo)志著科學(xué)數(shù)據(jù)可以像學(xué)術(shù)論文一樣被學(xué)術(shù)同行標(biāo)準(zhǔn)化引用,對于保護(hù)數(shù)據(jù)生產(chǎn)者的知識產(chǎn)權(quán)以及促進(jìn)數(shù)據(jù)擁有者開放共享其數(shù)據(jù)具有重要的意義。2018年3月17日國務(wù)院辦公廳發(fā)布《科學(xué)數(shù)據(jù)管理辦法》,標(biāo)志著科學(xué)數(shù)據(jù)共享與開放工作已進(jìn)入法制軌道??茖W(xué)數(shù)據(jù)即主要包括在自然科學(xué)、工程技術(shù)科學(xué)等領(lǐng)域,通過基礎(chǔ)研究、應(yīng)用研究、試驗開發(fā)等產(chǎn)生的數(shù)據(jù),以及通過觀測監(jiān)測、考察調(diào)查、檢驗檢測等方式取得并用于科學(xué)研究活動的原始數(shù)據(jù)及其衍生數(shù)據(jù),貫穿于科技創(chuàng)新活動的全過程??茖W(xué)數(shù)據(jù)是政府開放數(shù)據(jù)的延展,通過科學(xué)數(shù)據(jù)的開放與共享來推動科學(xué)研究實踐的深化,同時也減少科學(xué)研究中不必要的數(shù)據(jù)資源獲取方面的重復(fù)性工作,勢必會推動科學(xué)研究向更加快速化、國際化、前沿化等方向發(fā)展。
突現(xiàn)詞是某一個時間段內(nèi)被引頻次突然增多的關(guān)鍵詞,可以用來反映某一時間段內(nèi)的研究趨勢。鑒于此,為進(jìn)一步研究我國數(shù)據(jù)開放研究的發(fā)展趨勢,運行CiteSpace5.7,參數(shù)設(shè)置“Burstterms”,得到關(guān)鍵詞突現(xiàn)圖(見圖5)。
圖5 關(guān)鍵詞突現(xiàn)圖
由圖5可看出,在2011—2016年間的突現(xiàn)詞為“電子政務(wù)”;2011—2015 年間的突現(xiàn)詞為“數(shù)據(jù)門戶”;2018—2021年間突現(xiàn)詞為“政府?dāng)?shù)據(jù)開放平臺”;2019—2021年間突現(xiàn)詞為“數(shù)據(jù)開放平臺”。其中“數(shù)據(jù)門戶”“政府?dāng)?shù)據(jù)開放平臺”和“數(shù)據(jù)開放平臺”突現(xiàn)率一直延續(xù)至今,可說明三者為我國數(shù)據(jù)開放目前研究的主要發(fā)展趨勢,也是政府?dāng)?shù)據(jù)開放工作最直觀地展現(xiàn)。
除此之外,關(guān)鍵詞時序圖可以用來反映某一研究主題隨時間變化的主要研究內(nèi)容,也能夠在一定程度上反映某一時間段內(nèi)的研究趨勢,因此運行CiteSpace5.7,在關(guān)鍵詞共現(xiàn)分析基礎(chǔ)上,按時間片段生成關(guān)鍵詞時序圖譜,如圖6所示。從圖中可看出在不同時期學(xué)者的關(guān)注點不同,因此,可以把我國數(shù)據(jù)開放研究的演變劃分成初期探索性研究期、多元化擴(kuò)展研究期、深入精細(xì)化研究期三個發(fā)展研究階段,以更好地分析我國政府?dāng)?shù)據(jù)開放研究的發(fā)展階段。
圖6 關(guān)鍵詞時序圖譜
初期探索性研究期(2009—2013年)。從圖1、圖5可見,在2009年至2013年,關(guān)于政府?dāng)?shù)據(jù)開放的篇名檢索,其研究與發(fā)文量較少,關(guān)鍵詞類別較為單一。說明在此階段,僅有少數(shù)政府有關(guān)部門、高校學(xué)者以及科研機構(gòu)開始對數(shù)據(jù)開放有關(guān)問題進(jìn)行了研究。初期主要圍繞“數(shù)據(jù)開放”“公開”等進(jìn)行探討。由于技術(shù)上不成熟、觀念落后、專業(yè)人才短缺等眾多問題的存在,對數(shù)據(jù)開放的重視度不足,此時市場上也鮮有企業(yè)提及開放數(shù)據(jù)的重要性,造成研究內(nèi)容單一,未成系統(tǒng)化。[29]
多元化擴(kuò)展研究期(2014—2018年)。由圖1、圖5可得,在此階段,發(fā)文量猛增,關(guān)鍵詞類別逐漸豐富,數(shù)據(jù)開放已經(jīng)受到學(xué)界的重視并陸續(xù)加大了研究力度。此階段,眾多學(xué)者開始從不同的學(xué)科領(lǐng)域?qū)?shù)據(jù)開放進(jìn)行探討,主要關(guān)鍵詞類別有“開放政府”“大數(shù)據(jù)”“英國”“云計算技術(shù)”和“平臺建設(shè)”等。白獻(xiàn)陽等人基于大數(shù)據(jù)視角,根據(jù)政府?dāng)?shù)據(jù)開放政策體系框架對數(shù)據(jù)開放相關(guān)政策進(jìn)行梳理,探析其中的問題并給出了改善建議。[30]鄭振宇以英國、美國等發(fā)達(dá)國家政府?dāng)?shù)據(jù)開放活動為研究對象,運用比較分析法,提出了推進(jìn)我國政府?dāng)?shù)據(jù)開放的若干建議。[31]楊瑞仙等人針對我國當(dāng)時現(xiàn)有的數(shù)據(jù)開放平臺進(jìn)行分析與研究,提出我國政府?dāng)?shù)據(jù)開放工作的若干建議和對策。[32]總之,這一階段的研究實用價值導(dǎo)向明顯,重點關(guān)注我國數(shù)據(jù)開放的可行性,研究主要圍繞數(shù)據(jù)獲取與分析處理技術(shù)、國外政府?dāng)?shù)據(jù)開放建設(shè)、我國數(shù)據(jù)開放政策制度的制定等方面,但數(shù)據(jù)安全、公眾參與等問題開始受到了一定的關(guān)注,數(shù)據(jù)開放研究領(lǐng)域逐漸多元化。
深入精細(xì)化研究期(2019年至今)。這一階段,數(shù)據(jù)開放研究進(jìn)一步拓展,快速多元化,發(fā)文量均在120篇以上。這一時期的研究關(guān)鍵詞主要類別有“實證研究”“政策與立法”“信息安全”和“突發(fā)公共衛(wèi)生事件”等。朱曉峰等人運用logistic種群演化模型,選取武漢市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)為研究對象,發(fā)現(xiàn)其和數(shù)據(jù)使用者之間存在相互關(guān)系。[33]侯曉麗等人從信息安全角度出發(fā),對國家秘密泄露的風(fēng)險點進(jìn)行了識別,并提出了相應(yīng)的保護(hù)策略。[34]陳朝兵等人運用文獻(xiàn)分析法,選取美英澳新四國為研究對象進(jìn)行研究,提出了我國政府?dāng)?shù)據(jù)開放監(jiān)管應(yīng)從加快頂層設(shè)計、整合監(jiān)管機構(gòu)、打造多元協(xié)同監(jiān)管格局、強化評估問責(zé)機制建設(shè)四個方面抓起。[35]相雅凡等人構(gòu)建了突發(fā)公共衛(wèi)生事件地方數(shù)據(jù)開放評估體系,對30個地區(qū)在疫情防控期間的政府?dāng)?shù)據(jù)開放工作進(jìn)行評估,發(fā)現(xiàn)疫情嚴(yán)重性成為政府?dāng)?shù)據(jù)開放工作的阻礙等。[36]與前一時期相比,這一時期的政府?dāng)?shù)據(jù)開放工作已成為政府的一項日常議程,并且在實踐領(lǐng)域和理論研究層面都呈現(xiàn)多元化。眾多學(xué)者的研究不僅關(guān)注到了政府?dāng)?shù)據(jù)開放的立法與政策的制定,也就其安全性和隱私性等進(jìn)行了討論,注重系統(tǒng)性的分析與研究。
政府?dāng)?shù)據(jù)開放實踐源于政府信息公開的擴(kuò)展和延伸,對于信息公開的研究最早源于公眾知情權(quán),而對于知情權(quán)的關(guān)注最初源于新聞媒體,逐漸轉(zhuǎn)移至從法學(xué)角度探索如何從立法層面保障該項工作的強制實施,所以法學(xué)界對信息公開的法律框架、信息公開與信息安全之間的平衡等領(lǐng)域開展了豐富的研究。美國于1966年正式頒布《信息自由法案》,我國也于2008年正式頒布實施《政府信息公開條例》。隨著信息公開制度的完善和實踐的推動,人們發(fā)現(xiàn)單公開行政機關(guān)掌握的經(jīng)過加工處理的信息遠(yuǎn)遠(yuǎn)不能滿足數(shù)字經(jīng)濟(jì)、數(shù)字社會對原始數(shù)據(jù)的需求,為了促進(jìn)社會各利益相關(guān)者更加深入、全面地開發(fā)利用潛藏在數(shù)據(jù)背后的價值,數(shù)據(jù)開放的研究與實踐逐漸提上日程。
2009年美國上線政府?dāng)?shù)據(jù)開放平臺,開啟了政府?dāng)?shù)據(jù)開放實踐的先河。此后,世界各地陸續(xù)開展政府?dāng)?shù)據(jù)開放工作,我國最先源于2012年上海市政府?dāng)?shù)據(jù)開放平臺的上線,特別是2015年《大數(shù)據(jù)發(fā)展綱要》中對數(shù)據(jù)開放工作進(jìn)行了專門規(guī)定,從戰(zhàn)略層面將數(shù)據(jù)開放工作提升到了新的高度。學(xué)者也紛紛開始了數(shù)據(jù)開放的研究,目前主要集中在具有信息搜集、處理、分析和利用研究優(yōu)勢與傳統(tǒng)的信息管理學(xué)(圖書情報學(xué))領(lǐng)域,此后行政管理學(xué)界主要從行政機關(guān)自身的職責(zé)與義務(wù),法學(xué)界從立法視角,計算機學(xué)界從數(shù)據(jù)開放平臺與技術(shù)層面,圍繞政府?dāng)?shù)據(jù)開放進(jìn)行了卓有成效的研究。從研究關(guān)鍵詞聚類網(wǎng)絡(luò)可以明顯看出,數(shù)據(jù)開放研究涉及的主題非常廣泛,已觸及數(shù)據(jù)治理、科學(xué)數(shù)據(jù)、政策法規(guī)、技術(shù)平臺、公共服務(wù)、信息消費、政府公信力等,所以研究機構(gòu)也逐漸擴(kuò)展至社會學(xué)界、行業(yè)領(lǐng)域、經(jīng)濟(jì)學(xué)界以及政府機關(guān)等。未來隨著智慧交通、智慧物流、智慧醫(yī)療等各個行業(yè)的深入發(fā)展,數(shù)據(jù)開放的研究必將擴(kuò)展至各個領(lǐng)域,與各個學(xué)科之間的交叉融合將會愈加顯著,從而引領(lǐng)各學(xué)科圍繞數(shù)據(jù)開放的各個研究細(xì)化領(lǐng)域開展深入細(xì)致的研究。隨著數(shù)智賦能時代的推進(jìn),社會各界對數(shù)據(jù)的認(rèn)識越來越深刻,政府?dāng)?shù)據(jù)開放未來將會以更快的速度發(fā)展,并快速擴(kuò)展至公共數(shù)據(jù)開放。同時,隨著數(shù)據(jù)開放氛圍的形成以及用戶參與度的逐步提高,數(shù)據(jù)開放與人們生活實踐的結(jié)合將更為緊密細(xì)微,滲透至人文、藝術(shù)、交通、安全等各個角落,真正實現(xiàn)“Open Data for All”的愿景。
本文采用CiteSpace5.7軟件及文獻(xiàn)計量學(xué)方法對政府?dāng)?shù)據(jù)開放研究的現(xiàn)狀、熱點及態(tài)勢進(jìn)行了系統(tǒng)化梳理與總結(jié)。數(shù)據(jù)開放領(lǐng)域的研究主題經(jīng)歷了由宏觀性研究向具有可操作性的微觀研究方向發(fā)展,從關(guān)注政府組織中的網(wǎng)絡(luò)技術(shù)架構(gòu)與管理銜接到以市場社會的用戶需求導(dǎo)向,以解決我國政府?dāng)?shù)據(jù)開放的內(nèi)在需求為起點和歸宿的變遷過程。目前我國政府?dāng)?shù)據(jù)開放研究依然屬于新興領(lǐng)域,處于起步發(fā)展階段,研究文獻(xiàn)總量還較少,學(xué)術(shù)關(guān)注度仍相對較低。