翁悅鑫,馬海群(.黑龍江大學(xué)信息管理學(xué)院;2.黑龍江大學(xué)信息資源管理研究中心)
開放獲?。∣pen Access),也被稱為開放存取,根據(jù)布達(dá)佩斯開放存取先導(dǎo)計(jì)劃(Budapest Open Access Initiative,BOAI) 中的定義,是指某文獻(xiàn)在Internet公共領(lǐng)域里可以被免費(fèi)獲取,且允許任何用戶閱讀、下載、拷貝、傳遞、打印、檢索、超級(jí)鏈接該文獻(xiàn),并為之建立索引,用作軟件的輸入數(shù)據(jù)或其他任何合法用途。與傳統(tǒng)的期刊訂閱相比,開放獲取節(jié)省了印刷成本,縮短了出版周期,有利于營(yíng)造健康高效的學(xué)術(shù)交流生態(tài)。而信息技術(shù)的不斷革新,為開放獲取模式的逐步建立打下了堅(jiān)實(shí)的基礎(chǔ)。盈江燕等梳理了我國(guó)2004—2014年中國(guó)知網(wǎng)(CNKI) CSSCI論文數(shù)據(jù)庫關(guān)于開放存取發(fā)展的研究現(xiàn)狀與研究熱點(diǎn)[1];徐迎迎等統(tǒng)計(jì)了2004—2012年開放獲取論文,發(fā)現(xiàn)這些文獻(xiàn)與布拉德福定律、洛特卡定律和齊普夫定律這三大定律基本相符[2];曹娟從期刊的概念與類型、產(chǎn)生與發(fā)展、出版模式等方面綜合分析了開放存取期刊的研究進(jìn)展[3]。一些研究存在著過時(shí)且分析范圍有限等問題,因而利用文獻(xiàn)分析法對(duì)已有開放獲取研究論文進(jìn)行統(tǒng)計(jì)和分析就顯得很有必要。
本文擬將我國(guó)2004—2020年間有關(guān)開放獲取的研究論文進(jìn)行統(tǒng)計(jì)分析,首先檢驗(yàn)論文的作者、期刊、詞頻分布是否符合文獻(xiàn)計(jì)量學(xué)三大定律(即布拉德福定律、洛特卡定律和齊普夫定律),其次通過時(shí)間、作者、期刊、關(guān)鍵詞共現(xiàn)、關(guān)鍵詞聚類、關(guān)鍵詞突現(xiàn)來分析我國(guó)開放獲取的研究現(xiàn)狀與趨勢(shì),以期為我國(guó)開放獲取的研究和發(fā)展提供參考。
(1)數(shù)據(jù)來源。本文所選取的數(shù)據(jù)基于CNKI期刊數(shù)據(jù)庫,設(shè)置主題檢索 “開放獲取or開放存取” ,期刊來源為CSSCI與CSCD,時(shí)間設(shè)置為2001—2020年。經(jīng)過檢索發(fā)現(xiàn),與開放獲取主題相關(guān)的論文最早的發(fā)表時(shí)間為2004年,因此把時(shí)間段設(shè)定為2004—2020年。最后,共檢索出2,730篇與開放獲取主題相關(guān)的文獻(xiàn)。
(2)數(shù)據(jù)清洗。由于選取的論文數(shù)量較多,本文根據(jù)文章的作者、摘要和關(guān)鍵詞的信息,刪除了與主題無關(guān)的文獻(xiàn),經(jīng)過數(shù)據(jù)清洗后,共得到2,263篇論文,以此作為本文的研究數(shù)據(jù)基礎(chǔ)。
本文把2004—2020年開放獲取領(lǐng)域的論文所屬期刊劃分為3個(gè)領(lǐng)域(見表1)。第一區(qū)域?yàn)楹诵钠诳瘏^(qū),期刊載文量在92篇及以上;第二區(qū)域?yàn)橄嚓P(guān)期刊區(qū),期刊載文量在67—85篇;第三區(qū)域?yàn)檫吘壠诳瘏^(qū),期刊載文量在1—65篇??梢园l(fā)現(xiàn)三個(gè)期刊區(qū)域發(fā)表開放獲取研究論文的數(shù)量大致相同,期刊數(shù)量的比值近似于1:2:22,與布拉德福定律區(qū)域描述經(jīng)驗(yàn)公式大致相同。如表2所示,居于核心區(qū)域的5家期刊為圖書情報(bào)工作、中國(guó)科技期刊研究、圖書館學(xué)研究、情報(bào)理論與實(shí)踐、科技與出版。其中圖書情報(bào)學(xué)相關(guān)期刊占比較多,發(fā)表的開放獲取論文的累計(jì)數(shù)量占核心期刊區(qū)論文的半數(shù)以上,說明圖書情報(bào)學(xué)的學(xué)者對(duì)開放獲取的關(guān)注最多。
表1 期刊分區(qū)表
表2 我國(guó)2004—2020年開放獲取研究論文核心期刊分布情況
根據(jù)布拉德福定律的圖像表示法制圖(見圖1),其中橫坐標(biāo)是期刊累積量的對(duì)數(shù),縱坐標(biāo)是論文累積量,這個(gè)散點(diǎn)圖的趨勢(shì)走向基本符合布拉德福定律的曲線分布。前部分呈線性增長(zhǎng),但是后部分出現(xiàn)了 “格魯斯下垂” ,由本文統(tǒng)計(jì)不完全導(dǎo)致(僅統(tǒng)計(jì)了CSSCI和CSCD的期刊論文)。
圖1 論文累積量分散曲線
洛特卡定律是文獻(xiàn)計(jì)量學(xué)的經(jīng)典定律之一,又稱科學(xué)生產(chǎn)率的平方反比律,由洛特卡于1926年提出[4]。洛特卡定律主要揭示了科學(xué)論文作者寫作頻率與所寫論文篇數(shù)間的定量關(guān)系,其公式表示為:f(x)=c/xn。其中,x表示為論文的數(shù)量,f(x)代表x篇論文的作者占作者總數(shù)的百分率,c則是某主題領(lǐng)域的特征常數(shù)[5]。
據(jù)此,本文整理了2004—2020年間開放獲取領(lǐng)域論文署名作者,把所有作者視為第一作者且在無姓名重復(fù)的前提下,以洛特卡定律公式為基礎(chǔ),橫坐標(biāo)表示論文的數(shù)量,縱坐標(biāo)為相應(yīng)論文數(shù)量作者占作者總數(shù)的百分率,以此繪制出散點(diǎn)圖(見圖2),得出公式為y=0.5357x-2.392。圖中的虛線是散點(diǎn)的趨勢(shì)線,R2=0.9425,表示擬合程度高,說明我國(guó)開放獲取相關(guān)論文作者的分布符合洛特卡定律。
圖2 開放獲取研究論文作者洛特卡定律分布散點(diǎn)圖
齊普夫定律是齊普夫于1935年提出的,揭示了文獻(xiàn)中詞匯出現(xiàn)頻率的分布規(guī)律,是文獻(xiàn)信息計(jì)量學(xué)的基本定律之一[6]。本文統(tǒng)計(jì)了2,263篇開放獲取研究論文的關(guān)鍵詞,共有9,208個(gè)關(guān)鍵詞,平均每篇論文的關(guān)鍵詞大約有4個(gè)。在統(tǒng)計(jì)關(guān)鍵詞時(shí),將存在不同表達(dá)方式的同義詞進(jìn)行合并處理,如將 “開放存取” “OA” 并入到 “開放獲取” 中,把 “開放存取期刊” 和 “OA期刊” 合并到 “開放獲取期刊” 中,等。由于關(guān)鍵詞數(shù)量過多,繪制散點(diǎn)圖過于復(fù)雜,因此本文只選取排名前200的高頻關(guān)鍵詞繪制開放獲取研究論文詞頻分布圖(見圖3)。其中,以排序的序號(hào)為橫坐標(biāo),以序號(hào)對(duì)應(yīng)的詞頻為縱坐標(biāo),并添加了乘冪的擬合曲線。從圖中可以看出擬合曲線與齊普夫分布曲線大致相同,R2=0.9755,表示擬合程度較好。又以序號(hào)和詞頻的對(duì)數(shù)作為橫縱坐標(biāo)軸,添加線性趨勢(shì)線后,擬合程度達(dá)0.9754(見圖4)。這表明2004—2020年我國(guó)開放獲取領(lǐng)域相關(guān)論文的關(guān)鍵詞詞頻與齊普夫定律相符。
圖3 開放獲取研究論文關(guān)鍵詞詞頻分布散點(diǎn)圖
圖4 開放獲取研究論文關(guān)鍵詞詞頻分布對(duì)數(shù)散點(diǎn)圖
4.1.1 發(fā)表時(shí)間分析
將需要分析的2,263篇文章按照發(fā)表時(shí)間繪制柱形圖(見圖5),可以直觀地看到開放獲取領(lǐng)域在這17年內(nèi)論文數(shù)量的動(dòng)態(tài)變化。年度發(fā)表論文的數(shù)量可以反映出國(guó)內(nèi)學(xué)者對(duì)此主題的關(guān)注程度和未來此領(lǐng)域研究繼續(xù)發(fā)展的可能性。由圖5可知,開放獲取主題論文的發(fā)表數(shù)量和變化可以分為3個(gè)階段:第一個(gè)階段是2004—2007年,這段時(shí)間是開放獲取論文從無到有,逐漸受到了學(xué)者們的關(guān)注,其原因是2003年12月29日中國(guó)簽署了《柏林宣言》,代表著我國(guó)對(duì)開放獲取的支持與關(guān)注,并將這一理念引入國(guó)內(nèi)[7],2005年6月又舉辦了 “科學(xué)信息開放獲取戰(zhàn)略與政策國(guó)際研討會(huì)”[8],發(fā)文量進(jìn)一步的增長(zhǎng);第二個(gè)階段是2008—2016年,這段時(shí)期的發(fā)文量整體大幅度增加,呈上升趨勢(shì),盡管在2011、2012年期間有所下降,但平均每年的發(fā)文量已經(jīng)超過了150篇,說明開放獲取相關(guān)領(lǐng)域受到了更多學(xué)者的關(guān)注;第三階段是2017—2020年,這段時(shí)期與第二階段相比,發(fā)文量有所下降,但是總體的發(fā)表數(shù)量在145篇,表示學(xué)者對(duì)于開放獲取的關(guān)注程度從熱切關(guān)注轉(zhuǎn)變?yōu)槔硇躁P(guān)注,相關(guān)研究處于穩(wěn)定的狀態(tài)。
圖5 2004-2020年開放獲取論文年度發(fā)表數(shù)
4.1.2 年度累積量分析
1963年,普賴斯在《小科學(xué)、大科學(xué)》一書中指出,指數(shù)規(guī)律有可能被破壞,文獻(xiàn)的指數(shù)增長(zhǎng)不可能永遠(yuǎn)持續(xù)下去,實(shí)際上有些知識(shí)領(lǐng)域內(nèi)的文獻(xiàn)是呈現(xiàn)出直線增長(zhǎng)模式的[9]。為了驗(yàn)證開放獲取文獻(xiàn)是否符合線性增長(zhǎng)模式,本文繪制了2004—2020年開放獲取相關(guān)論文的年度累計(jì)增長(zhǎng)折線圖,并在原有的折線圖中又添加一條線性擬合趨勢(shì)線(見圖6)。由圖6可知,R2=0.9896,這代表著文獻(xiàn)累計(jì)增長(zhǎng)變化折線與線性趨勢(shì)線的擬合程度高,表示文獻(xiàn)年度累計(jì)量整體呈持續(xù)的線性增長(zhǎng)狀態(tài)。因此,可以將圖6的曲線視為一條直線,直線方程為y=152.54x-359.99,符合線性文獻(xiàn)增長(zhǎng)規(guī)律。
圖6 開放獲取相關(guān)論文累積量變化
2,263篇文章的署名作者共計(jì)有2,874名,其中發(fā)文量排名前十的作者如表3所示,作者發(fā)表文章數(shù)量的差距較小,發(fā)文量排名第一的是張曉林,他在這期間的發(fā)文量高達(dá)30篇。根據(jù)普賴斯定律確定核心作者的最低發(fā)文量的公式量在4篇及以上的作者可以被確定為本文開放獲取主題的核心作者。
表3 發(fā)文量排名前十作者
經(jīng)統(tǒng)計(jì),發(fā)文量4篇及以上的作者共有178人,核心作者發(fā)文量占所有作者發(fā)文量的27%??梢园l(fā)現(xiàn),開放獲取相關(guān)論文的核心作者發(fā)文量占總發(fā)文量的比重較高,說明我國(guó)開放獲取領(lǐng)域的研究有著比較完備的體系,處于發(fā)展的成熟時(shí)期。
本文利用Citespace軟件對(duì)作者進(jìn)行可視化分析,設(shè)置時(shí)間為2004—2020年,year per silicce=1,即時(shí)間切片為一年,node types=author,即分析類別為作者,pruning=pathfinder,pruning the merged network,其他設(shè)置為默認(rèn)值。設(shè)置可顯示發(fā)文量在5篇及以上作者名字,形成知識(shí)圖譜(見圖7)。其中圓圈表示不同作者的節(jié)點(diǎn),圓圈越大,作者的發(fā)文量越多,反之則越少。節(jié)點(diǎn)之間的連線表示作者之間的合作,線條越粗,作者之間的合作關(guān)系越密切。由圖7可知,以初景利、李麟、張曉林、黃金霞、顧立平等作者為主的合作很密切,已經(jīng)形成了作者之間的合作網(wǎng)絡(luò)。這些作者不僅在數(shù)量上占據(jù)著主要地位,在合作交流方面也有巨大的貢獻(xiàn)。黃如花、盛小平等人發(fā)表的論文數(shù)量居于上游,但是以自己研究為主,與其他作者沒有產(chǎn)生合作??偠灾?,2004—2020年期間,開放獲取研究領(lǐng)域已經(jīng)形成了較為明顯的合作網(wǎng)絡(luò),作者之間的合作有利于最新研究信息的互通,也為之后開放獲取研究的創(chuàng)新發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
圖7 開放獲取相關(guān)作者及作者之間合作知識(shí)圖譜
利用Citespace軟件對(duì)開放獲取的研究機(jī)構(gòu)進(jìn)行可視化分析(見圖8),圖中顯示名稱的研究機(jī)構(gòu)發(fā)文量都在15篇及以上。由圖8可知,我國(guó)有很多開放獲取的研究機(jī)構(gòu),并且研究機(jī)構(gòu)之間形成了一定的合作網(wǎng)絡(luò),其中有些部分是一定區(qū)域內(nèi)之間的合作。如,武漢大學(xué)信息管理學(xué)院和武漢大學(xué)信息管理研究中心,中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心和中國(guó)科學(xué)院大學(xué)等,這從一定程度上說明我國(guó)開放獲取研究機(jī)構(gòu)之間的合作具有局限性。把不同名稱的同一機(jī)構(gòu)合并,最后統(tǒng)計(jì)出排名前10的機(jī)構(gòu)(見表4)。通過表4可以看出,排名第一的是中國(guó)科學(xué)院大學(xué),2004—2020年的發(fā)文量多達(dá)296篇,排名第二的是武漢大學(xué)信息管理學(xué)院,發(fā)文161篇章。這說明中國(guó)科學(xué)院大學(xué)和武漢大學(xué)信息管理學(xué)院在開放獲取領(lǐng)域投入的科研力量大,研究成果多,屬于領(lǐng)軍機(jī)構(gòu)。排名前10的研究機(jī)構(gòu)共發(fā)文696篇,占發(fā)文總量的30.7%,超過了發(fā)文總量的1/4,這些機(jī)構(gòu)中大多數(shù)屬于高校,說明高校是開放獲取領(lǐng)域的主要科研力量。
表4 發(fā)文量排名前10的研究機(jī)構(gòu)
圖8 開放獲取研究機(jī)構(gòu)及機(jī)構(gòu)合作網(wǎng)絡(luò)知識(shí)圖譜
Citespace中的關(guān)鍵詞共現(xiàn)是以論文中出現(xiàn)的關(guān)鍵詞頻次作為參考依據(jù),再以直觀方式表達(dá)關(guān)鍵詞出現(xiàn)的頻次。通過關(guān)鍵詞共現(xiàn)可以發(fā)現(xiàn)某一領(lǐng)域的研究熱點(diǎn)、子領(lǐng)域及其關(guān)系和領(lǐng)域知識(shí)結(jié)構(gòu)[10]。用Citespace軟件對(duì)這2,263篇開放獲取研究論文進(jìn)行可視化分析,排除開放獲取和開放存取這兩個(gè)頻率過高的關(guān)鍵詞,形成開放獲取研究論文關(guān)鍵詞共現(xiàn)圖(見圖9)。圖中的關(guān)鍵詞出現(xiàn)頻率均在15次及以上,每個(gè)圓圈表示一個(gè)關(guān)鍵詞節(jié)點(diǎn),圓圈的大小代表關(guān)鍵詞出現(xiàn)的頻次,圓圈越大,關(guān)鍵詞出現(xiàn)的頻次越多,反之則越少。
圖9 開放獲取研究論文關(guān)鍵詞共現(xiàn)
關(guān)鍵詞聚類是在共詞分析的基礎(chǔ)上,以共詞出現(xiàn)的頻率為分析對(duì)象,利用聚類的統(tǒng)計(jì)學(xué)方法,把眾多分析對(duì)象之間錯(cuò)綜復(fù)雜的共詞網(wǎng)狀關(guān)系簡(jiǎn)化為數(shù)目相對(duì)較少的若干類群之間的關(guān)系并直觀地表示出來的聚類過程[11]。利用Citespace的關(guān)鍵詞聚類功能,對(duì)開放獲取研究的關(guān)鍵詞進(jìn)行聚類分析,取前10個(gè)關(guān)鍵詞聚類(見圖10)。由圖10可見,排名前10的關(guān)鍵詞聚類分別有#0學(xué)術(shù)期刊、#1機(jī)構(gòu)知識(shí)庫、#2圖書館、#3期刊、#4高校圖書館、#5開放數(shù)據(jù)、#6機(jī)構(gòu)庫、#7學(xué)術(shù)影響力、#8電子期刊、#9學(xué)術(shù)出版。
圖10 開放獲取研究論文關(guān)鍵詞聚類
(1)聚類#0學(xué)術(shù)期刊、#3期刊、#8電子期刊作為一類,顯示各種期刊在開放獲取的新模式下,如何轉(zhuǎn)變運(yùn)行模式以達(dá)到可持續(xù)發(fā)展的目標(biāo)。艾嵐認(rèn)為我國(guó)期刊數(shù)字化面臨著諸多問題,試圖從版權(quán)管理方式、人才培養(yǎng)、營(yíng)利模式等方面為數(shù)字出版產(chǎn)業(yè)提出解決方案[12];吳巖等以中國(guó)科學(xué)院金屬研究所 “聯(lián)合期刊” 為例,分析了開放獲取對(duì)期刊影響力的促進(jìn)作用[13]。
(2)聚類#1機(jī)構(gòu)知識(shí)庫、#6機(jī)構(gòu)庫在開放獲取載體方面,從不同角度對(duì)機(jī)構(gòu)知識(shí)庫的建設(shè)、設(shè)計(jì)、發(fā)展等問題提供了建議與對(duì)策。肖可以根據(jù)國(guó)內(nèi)外建設(shè)機(jī)構(gòu)知識(shí)庫的實(shí)際情況,針對(duì)我國(guó)高校機(jī)構(gòu)知識(shí)庫的建設(shè)和發(fā)展問題提出了解決對(duì)策[14];馬建霞從利益相關(guān)方需求的角度就機(jī)構(gòu)知識(shí)庫的建設(shè)與服務(wù)設(shè)計(jì)提出了自己的見解[15]。
(3)聚類#2圖書館與#4高校圖書館可以作為一類進(jìn)行總結(jié)與分析,這是由于這兩個(gè)聚類都是從開放獲取重要的開發(fā)主體角度出發(fā),且兩者的聚類出現(xiàn)年限也相近,分別是2012年和2010年,其主要包括的關(guān)鍵詞有 “圖書館” “高校圖書館” “知識(shí)服務(wù)” “開放出版” “信息服務(wù)” 等。吳天吉等探討了建設(shè)農(nóng)業(yè)高校之間聯(lián)盟知識(shí)庫的幾點(diǎn)解決辦法[16];李詠梅總結(jié)了開放獲取快速發(fā)展環(huán)境下對(duì)圖書館館藏的現(xiàn)狀和需要面對(duì)的挑戰(zhàn),并為開放獲取環(huán)境下館藏的發(fā)展提出建議[17]。
(4)聚類#5開放數(shù)據(jù)包含38個(gè)關(guān)鍵詞,出現(xiàn)頻次比較多的關(guān)鍵詞有 “開放科學(xué)” “科學(xué)數(shù)據(jù)” “開放數(shù)據(jù)” 等,聚類出現(xiàn)的時(shí)間為2014年。吳建中從開放性、關(guān)聯(lián)度、流暢度和傳播力角度研究如何使知識(shí)流通得更為順暢,討論了開放獲取和開放科學(xué)的發(fā)展動(dòng)態(tài)以及出版社和圖書館如何聯(lián)手應(yīng)對(duì)經(jīng)濟(jì)、技術(shù)和社會(huì)發(fā)展的挑戰(zhàn)[18];李志芳等通過調(diào)查和總結(jié)我國(guó)開放科學(xué)數(shù)據(jù)庫平臺(tái),對(duì)開放數(shù)據(jù)資源類型和數(shù)據(jù)服務(wù)進(jìn)行分析[19]。
(5)聚類#7學(xué)術(shù)影響力共包括34個(gè)關(guān)鍵詞,如 “學(xué)術(shù)影響力” “文獻(xiàn)計(jì)量” “社會(huì)網(wǎng)絡(luò)分析” 等,其出現(xiàn)的時(shí)間為2012年。張玉祥等從學(xué)科分布和學(xué)術(shù)質(zhì)量評(píng)價(jià)的角度對(duì)FOAS集成開放存取期刊進(jìn)行統(tǒng)計(jì)分析,認(rèn)為FOAS收錄的期刊整體影響因子偏低,但也不乏存在高影響因子的期刊,且對(duì)于學(xué)術(shù)界和圖書館都呈現(xiàn)出積極的影響[20];蔣靜調(diào)查了597種期刊開放存取的現(xiàn)狀,認(rèn)為開放存取期刊總體發(fā)展態(tài)勢(shì)良好,但期刊質(zhì)量還需進(jìn)一步提升[21]。
(6)聚類#9學(xué)術(shù)出版一共包括30個(gè)關(guān)鍵詞,其中出現(xiàn)的高頻關(guān)鍵詞有 “學(xué)術(shù)出版” “出版服務(wù)” “開放存取出版” 等,聚類出現(xiàn)的時(shí)間為2014年。任翔回顧了歐美各國(guó)在開放獲取政策、出版商主導(dǎo)的OA期刊出版以及學(xué)術(shù)機(jī)構(gòu)主導(dǎo)的開放知識(shí)庫,為我國(guó)學(xué)術(shù)出版界今后的嘗試提供借鑒[22];趙惠芳等通過對(duì)國(guó)外圖書館出版服務(wù)各個(gè)方面的分析,為我國(guó)高校圖書館今后的出版服務(wù)提出了意見和建議[23]。
分析關(guān)鍵詞突現(xiàn)有利于關(guān)注到某一時(shí)期最突出的文獻(xiàn)知識(shí),即 “文獻(xiàn)信息的挖掘與文獻(xiàn)知識(shí)擴(kuò)散、文獻(xiàn)知識(shí)吸收和文獻(xiàn)知識(shí)掃描的發(fā)展進(jìn)程”[24]。利用Citespace軟件分析關(guān)鍵詞突現(xiàn),得到排名前15的突現(xiàn)關(guān)鍵詞(見圖11)。其中Year表示突現(xiàn)詞首次出現(xiàn)的年份,Begin表示的是突現(xiàn)詞開始突現(xiàn)的時(shí)間點(diǎn),End是突現(xiàn)詞結(jié)束的時(shí)間,Strength則代表突現(xiàn)詞突現(xiàn)的強(qiáng)度,其數(shù)值越大,突現(xiàn)詞在某一時(shí)期內(nèi)突發(fā)的可信度越高,也代表這一時(shí)期的研究熱點(diǎn)。
圖11中的關(guān)鍵詞突現(xiàn)分為兩個(gè)階段。①2004—2016年,這一階段開放獲取研究論文處于從無到有的快速發(fā)展階段,出現(xiàn)的突現(xiàn)關(guān)鍵詞數(shù)量比較多,有 “學(xué)術(shù)信息” “信息共享空間” “版權(quán)” “信息服務(wù)” “信息資源建設(shè)” “開放存取資源” “機(jī)構(gòu)庫” “信息資源” “著作權(quán)” “數(shù)字出版” 等。其中最早的突現(xiàn)詞 “學(xué)術(shù)信息” 出現(xiàn)在2005年,持續(xù)的時(shí)間最短,只有2年。 “信息共享空間” 和 “信息服務(wù)” 持續(xù)出現(xiàn)5年以上,時(shí)間最長(zhǎng)。② 第二個(gè)階段是2016—2020年,有 “科學(xué)數(shù)據(jù)” “開放數(shù)據(jù)” “出版服務(wù)” “開放出版” “開放科學(xué)” 這5個(gè)突現(xiàn)關(guān)鍵詞,且持續(xù)的時(shí)間相對(duì)較長(zhǎng),尤其 “科學(xué)數(shù)據(jù)” “開放數(shù)據(jù)” “出版服務(wù)” 和 “開放科學(xué)” 一直持續(xù)到2020年,表示這4個(gè)關(guān)鍵詞是當(dāng)下開放獲取的研究熱點(diǎn)。
圖11 排名前15的突現(xiàn)關(guān)鍵詞
運(yùn)用文獻(xiàn)計(jì)量的方法,對(duì)2004-2020年CSSCI和CSCD期刊數(shù)據(jù)庫有關(guān)開放獲取的研究論文進(jìn)行統(tǒng)計(jì)分析,研究結(jié)果和結(jié)論如下。
(1)開放獲取研究論文的分布規(guī)律基本符合文獻(xiàn)計(jì)量學(xué)三大定律。期刊分布比較符合布拉德福定律, “核心” 區(qū)域、 “相關(guān)” 區(qū)域和 “邊緣” 區(qū)域論文大體相同,期刊數(shù)量比值為1∶2∶22;作者分布符合洛特卡定律,公式為y=0.5357x-2.392;開放獲取研究論文關(guān)鍵詞詞頻散點(diǎn)圖基本符合齊普夫定律分布曲線。
(2)期刊論文分布。在時(shí)間分布上,我國(guó)開放獲取研究論文大致可分為3個(gè)階段,第一階段為2004—2007年,是從無到有的階段;第二階段為2008—2016年,是論文數(shù)量大量增長(zhǎng)的階段;第三階段為2017—2020年,論文數(shù)量稍有下降,但依舊保持在一定的數(shù)量之上。在作者分布上,發(fā)文量排名前十的作者發(fā)表開放獲取論文的數(shù)量均在15篇以上,大多數(shù)作者之間的合作較為密切,也存在一些合作較少的作者。在研究機(jī)構(gòu)的分布上,發(fā)文量排名靠前的機(jī)構(gòu)以高校和一些研究院所為主,機(jī)構(gòu)之間存在一定的合作網(wǎng)絡(luò),但依舊需要更密切交流。
(3)通過關(guān)鍵詞共現(xiàn)發(fā)現(xiàn), “機(jī)構(gòu)知識(shí)庫” “圖書館” “高校圖書館” “學(xué)術(shù)期刊” “科技期刊” 等高頻關(guān)鍵詞受到作者的關(guān)注;通過關(guān)鍵詞聚類,可以總結(jié)出期刊、圖書館、機(jī)構(gòu)知識(shí)庫、科學(xué)數(shù)據(jù)、學(xué)術(shù)影響力和學(xué)術(shù)出版6個(gè)方面;通過關(guān)鍵詞突現(xiàn)可以發(fā)現(xiàn), “科學(xué)數(shù)據(jù)” “開放數(shù)據(jù)” “出版服務(wù)” 和 “開放科學(xué)” 這4個(gè)關(guān)鍵詞依舊是當(dāng)前的研究熱點(diǎn)。