邱小敏 奉國(guó)和 劉宇東
1. 華南師范大學(xué)經(jīng)濟(jì)與管理學(xué)院 廣州 510006;
2. 華南師范大學(xué)計(jì)算機(jī)學(xué)院 廣州 510631
從浩瀚的科技文獻(xiàn)中準(zhǔn)確把握研究熱點(diǎn)是科研人員、科研管理者把握前沿和科技創(chuàng)新的關(guān)鍵任務(wù)之一,也是制定科技發(fā)展戰(zhàn)略時(shí)面臨的一大問(wèn)題。我們國(guó)家非常重視科學(xué)前沿的科研部署,習(xí)近平主席在多種場(chǎng)合提及科技創(chuàng)新的重要性,鼓勵(lì)廣大科技工作者多創(chuàng)新,多進(jìn)行前沿問(wèn)題探索。2016年8月8日,國(guó)務(wù)院印發(fā)了《“十三五”國(guó)家科技創(chuàng)新規(guī)劃》的通知,明確了“十三五”時(shí)期科技創(chuàng)新的總體思路、發(fā)展目標(biāo)、主要任務(wù)和重大舉措。其中,發(fā)展重點(diǎn)為把握世界科技前沿發(fā)展態(tài)勢(shì),超前規(guī)劃基礎(chǔ)前沿領(lǐng)域,全面增強(qiáng)自主創(chuàng)新能力。此外,國(guó)際科技論文被引次數(shù)的世界排名也作為“十三五”科技創(chuàng)新的12個(gè)主要指標(biāo)之一[1]。2019年11月19日,中國(guó)科學(xué)技術(shù)信息研究所發(fā)布中國(guó)科技論文統(tǒng)計(jì)結(jié)果,2009年至2019年10月,中國(guó)科技人員共發(fā)表國(guó)際論文260.64萬(wàn)篇,排在世界第2位,數(shù)量比2018年統(tǒng)計(jì)時(shí)增加了14.7%;論文共被引用2845.23萬(wàn)次,增加了25.2%,排在世界第2位[2]??萍颊撐谋灰闆r已成為領(lǐng)域創(chuàng)新與研究前沿的重要指標(biāo),被廣泛用于學(xué)者、文獻(xiàn)、期刊、專(zhuān)利等領(lǐng)域的評(píng)估與預(yù)測(cè),對(duì)把握學(xué)科發(fā)展動(dòng)態(tài)有積極作用[3]。
研究熱點(diǎn)一直都是眾學(xué)者重點(diǎn)關(guān)注的問(wèn)題,隨著科技發(fā)展,知識(shí)輸出體量呈指數(shù)增長(zhǎng),探究領(lǐng)域發(fā)展?fàn)顩r與當(dāng)前研究熱點(diǎn)能更好指明未來(lái)研究方向。每年大量研究成果通過(guò)期刊文獻(xiàn)的形式發(fā)表,如何從海量文獻(xiàn)中挖掘熱點(diǎn)是各學(xué)科研究焦點(diǎn)之一,目前相關(guān)研究指標(biāo)包括:關(guān)鍵詞詞頻、論文下載量、論文被引量和期刊均篇被引量等?;谶@種啟發(fā),本研究擬依托上述基本指標(biāo),基于z指數(shù),開(kāi)展熱點(diǎn)關(guān)鍵詞探測(cè)研究。
學(xué)術(shù)期刊作為研究人員創(chuàng)新性科研成果的重要載體,其評(píng)價(jià)方法的科學(xué)性、準(zhǔn)確性、合理性受到廣大研究人員的關(guān)注[4]。2005年,Hirsh[5]提出h指數(shù),用于學(xué)術(shù)價(jià)值評(píng)價(jià),即某學(xué)者至少有h篇論文的被引值至少為h次,但h指數(shù)不適用于跨學(xué)科領(lǐng)域比較與低質(zhì)量論文評(píng)價(jià)[6]。針對(duì)h指數(shù)的缺陷,Prathap在h指數(shù)的基礎(chǔ)上加入總發(fā)文量與均篇被引量,提出p指數(shù)[7],但其無(wú)法體現(xiàn)高被引論文價(jià)值[8]與文章被引時(shí)間因素[9]。2014年,Prathap在p指數(shù)的基礎(chǔ)上提出z指數(shù),增加了一致性指標(biāo),用于協(xié)調(diào)高被引文章與文章篇數(shù)的關(guān)系[10]。z指數(shù)的提出創(chuàng)新了科學(xué)評(píng)價(jià)體系,為計(jì)量領(lǐng)域提供了一個(gè)重要研究指標(biāo)與研究方向。
國(guó)外對(duì)z指數(shù)的研究主要集中于Prathap對(duì)z指標(biāo)的探索與完善,其進(jìn)一步解釋了z指數(shù),分析了z指數(shù)與h指數(shù)之間的關(guān)系[11];Prathap認(rèn)為z指數(shù)是一種3D評(píng)價(jià)指標(biāo)模型,屬于高級(jí)評(píng)價(jià)指標(biāo)[12]。在實(shí)際應(yīng)用中,Prathap使用z指數(shù)評(píng)價(jià)印度科研狀況[13],太陽(yáng)能電池領(lǐng)域(polymer solar cells)研究進(jìn)展,從國(guó)家、機(jī)構(gòu)、學(xué)者、期刊等角度論證了z指數(shù)科學(xué)評(píng)價(jià)的適用性[13]。國(guó)內(nèi)學(xué)者通過(guò)比較h指數(shù)、p指數(shù)與z指數(shù),探究z指數(shù)在學(xué)者[14]、期刊[5]、科研機(jī)構(gòu)[15]中的評(píng)價(jià)效果,研究結(jié)果顯示z指數(shù)是一個(gè)靈敏度高、區(qū)分度高、評(píng)價(jià)全面的綜合性評(píng)價(jià)指標(biāo),具備一定的通用性[16]。同時(shí),z指數(shù)也存在缺陷:在期刊評(píng)價(jià)中,z指數(shù)無(wú)法對(duì)施引文獻(xiàn)評(píng)價(jià)[5];在科研機(jī)構(gòu)評(píng)價(jià)中,長(zhǎng)尾效應(yīng)嚴(yán)重影響z指數(shù)的評(píng)價(jià)效果,以及忽視了專(zhuān)利等科研指標(biāo)[16];對(duì)于文章低被引集中度的缺陷,有學(xué)者對(duì)z指數(shù)進(jìn)行了相關(guān)改進(jìn)[16]。此外,z指數(shù)不涉及時(shí)間因素,但文章被引量隨時(shí)間不斷增加,被引量的變化率也隨時(shí)間發(fā)生改變。因此,z指數(shù)無(wú)法區(qū)分與評(píng)估被引量相同但發(fā)表時(shí)間不同,被引變化率上升或下降的文章影響力[17]。
針對(duì)上述問(wèn)題,本文在z指數(shù)的基礎(chǔ)上引入俞立平[18]教授被引峰值的時(shí)間思想與李長(zhǎng)玲[1]教授的時(shí)間因子公式,根據(jù)本文對(duì)關(guān)鍵詞熱度的定義,在單一被引值的基礎(chǔ)上,加入關(guān)鍵詞詞頻要素,通過(guò)模型計(jì)算詞頻與加權(quán)被引值在總年份與出版年份的占比值[19],最終獲取關(guān)鍵詞熱度。其中,關(guān)鍵詞詞頻體現(xiàn)重要性與關(guān)注度,是常用的文獻(xiàn)計(jì)量指標(biāo);被引次數(shù)體現(xiàn)文章之間的傳播性與關(guān)聯(lián)性,是追蹤文章熱點(diǎn)的分析指標(biāo)之一。
z指數(shù)由Prathap提出,通過(guò)改進(jìn)h指數(shù)和p指數(shù)得到,是一種綜合評(píng)價(jià)指標(biāo)。本質(zhì)是將數(shù)量、質(zhì)量、一致性程度三個(gè)指標(biāo)等權(quán)重相乘,故也稱(chēng)quantity(數(shù)量)-quality(質(zhì)量)-consistence(一致性)3D效能評(píng)價(jià)指標(biāo)[11]。表達(dá)公式如下:
其中,c為總被引頻次,表示研究對(duì)象被引規(guī)模;n為文章總篇數(shù);為文章均篇被引量,反映研究對(duì)象在單篇論文層面的平均影響力,也稱(chēng)“質(zhì)量”指標(biāo);為分布一致性指標(biāo),ck表示第k篇文章的被引頻次(k=1,2,…,n),是平衡引用極值及分布頻次對(duì)結(jié)果影響的調(diào)節(jié)因子,從“數(shù)量與質(zhì)量”一致性層面反映研究對(duì)象被引分布的均勻性水平。
基于z指數(shù),引入總年份占比和同年占比的加權(quán)思想[20],加入時(shí)間要素改進(jìn)z指數(shù)的數(shù)量、質(zhì)量指標(biāo),分別獲得關(guān)鍵詞詞頻與時(shí)間加權(quán)被引值的ztw指數(shù)值,最終得到關(guān)鍵詞熱度排名與等級(jí)趨勢(shì)變化情況。
(1)時(shí)間加權(quán)被引函數(shù)
本文根據(jù)李長(zhǎng)玲[1]教授的時(shí)間因子公式,對(duì)不同年份文章的被引值進(jìn)行時(shí)間加權(quán)。被引行為體現(xiàn)學(xué)者對(duì)發(fā)表內(nèi)容的關(guān)注度,本文將時(shí)間加權(quán)被引值的ztw值稱(chēng)為熱度hc。關(guān)鍵詞詞頻從作者第一視角反映文章主體思想與研究?jī)?nèi)容,本文將關(guān)鍵詞詞頻的ztw值稱(chēng)為熱度hf。由于出版文章的關(guān)鍵詞詞頻與被引值在時(shí)間維度上存在差異,出版當(dāng)年文章篇數(shù)與關(guān)鍵詞詞頻已為確定值,而文章的被引值在出版后動(dòng)態(tài)遞增。因此,本文引入時(shí)間加權(quán)被引思想,將出版年份與被引年份的差值和被引年份與當(dāng)前分析年份的差值賦予適當(dāng)權(quán)重,公式如下:
其中,Y為當(dāng)前年份,y為出版年份,x為被引年份,出版后的第一年被引年份x為0,cx為第x年的被引頻次。表1為2014年出版的文獻(xiàn)在2014—2019年各年度發(fā)生的被引值。
表1 2014-2019年關(guān)鍵詞i的被引情況
根據(jù)公式(2)、(3)得:
(2)“時(shí)間加權(quán)被引—出版年份”矩陣
通過(guò)時(shí)間加權(quán)被引函數(shù)的計(jì)算,得到關(guān)鍵詞不同出版年份的加權(quán)被引值,進(jìn)而獲取“時(shí)間加權(quán)被引值—出版年份”矩陣。如矩陣(1)所示,v表示時(shí)間加權(quán)被引值,n為關(guān)鍵詞,m為出版年份,以v2,3為例,表示第二個(gè)關(guān)鍵詞在第三個(gè)時(shí)間窗口(年份)出版的時(shí)間加權(quán)被引值。
(3)“關(guān)鍵詞詞頻—出版年份”矩陣
“關(guān)鍵詞詞頻—出版年份”矩陣如矩陣(2)所示,矩陣(2)的數(shù)值由各年度出版文章的關(guān)鍵詞絕對(duì)詞頻構(gòu)成。被引值通過(guò)引用行為動(dòng)態(tài)遞增,而當(dāng)年出版文章的關(guān)鍵詞詞頻不再發(fā)生改變,所以,兩種數(shù)值產(chǎn)生的影響存在差異性,但相同之處在于都以出版年份為時(shí)間基準(zhǔn)進(jìn)行計(jì)算。例如2015年出版的文獻(xiàn),其關(guān)鍵詞詞頻反映2015年的研究?jī)?nèi)容,時(shí)間加權(quán)被引值則通過(guò)時(shí)間加權(quán)被引函數(shù)的計(jì)算,將不同年份的被引值映射至出版年份,獲得2015年出版文章的綜合被引強(qiáng)度。f表示絕對(duì)詞頻,n為關(guān)鍵詞,m為出版年份,以f2,3為例,表示第二個(gè)關(guān)鍵詞在第三個(gè)時(shí)間窗口(年份)出版的絕對(duì)詞頻。
本文關(guān)鍵詞熱度圍繞關(guān)鍵詞詞頻與被引值,在z指數(shù)數(shù)量、質(zhì)量、一致性程度三個(gè)指標(biāo)的基礎(chǔ)上加入時(shí)間因素,計(jì)算ztw指數(shù)值,最終得到關(guān)鍵詞熱度。
(1)ztw_quality質(zhì)量指標(biāo)
在z指數(shù)中,總被引值表示數(shù)量指標(biāo)。相比之下,矩陣(1)、(2)表示被引要素v與詞頻要素f在ztw指數(shù)下的數(shù)量指標(biāo)。此外,z指數(shù)中的質(zhì)量指標(biāo)表示均篇被引,在此基礎(chǔ)上,本文加入時(shí)間因素,通過(guò)時(shí)間維度反映研究對(duì)象在不同時(shí)期的平均影響力,從總年份占比和同年占比兩個(gè)角度進(jìn)行加權(quán),得到ztw指數(shù)的質(zhì)量指標(biāo)。以時(shí)間加權(quán)被引值為例,ztw指數(shù)的質(zhì)量指標(biāo)如下所示:
其中,i表示第i個(gè)關(guān)鍵詞,n為關(guān)鍵詞總數(shù),i≤n;y表示關(guān)鍵詞對(duì)應(yīng)的出版年份,m為出版總年份,y≤m。
(2)ztw_consistence一致性指標(biāo)
ztw指數(shù)遵循z指數(shù)中的一致性原則,在數(shù)量、質(zhì)量指標(biāo)的基礎(chǔ)上,通過(guò)一致性指標(biāo)平衡高低被引值與文章總篇數(shù)關(guān)系,被引ztw指數(shù)的一致性指標(biāo)如公式(5)所示:
(3)熱度hv與熱度hf
根據(jù)本文對(duì)熱度的定義和上述相關(guān)指標(biāo)的描述,構(gòu)建熱度hv與熱度hf。以熱度hv為例:
其中,z(v)為時(shí)間加權(quán)被引值的ztw指數(shù)值,即熱度hv;z(f)為關(guān)鍵詞絕對(duì)詞頻的ztw指數(shù)值,即熱度hf。
(1)關(guān)鍵詞熱度值
由z(v)與z(f)得到關(guān)鍵詞熱度h值,通過(guò)h值的變化情況,探究熱點(diǎn)關(guān)鍵詞變化趨勢(shì)。由于關(guān)鍵詞詞頻與被引值為不同分析角度,對(duì)z(v)、z(f)標(biāo)準(zhǔn)化處理,關(guān)鍵詞熱度公式如下所示:
(2)關(guān)鍵詞熱度與趨勢(shì)判斷
對(duì)關(guān)鍵詞每年熱度h值降序排名并劃分四個(gè)等級(jí),排名前25%的關(guān)鍵詞定義為熱點(diǎn)詞,25%~50%的為次熱點(diǎn)詞,50%~75%的為弱熱點(diǎn)詞,75%~100%的為非熱點(diǎn)詞。比較關(guān)鍵詞各年度等級(jí)變化,得到關(guān)鍵詞熱度趨勢(shì)。以2014、2015年部分關(guān)鍵詞為例,如表2所示。
表2以2015年排名前50的熱點(diǎn)詞為分析對(duì)象。比較2015年與2014年的排名情況,創(chuàng)客空間、智庫(kù)、互聯(lián)網(wǎng)+與數(shù)字閱讀從非熱點(diǎn)詞上升至熱點(diǎn)詞,上升趨勢(shì)明顯;公共文化服務(wù)、信息安全、資源建設(shè)、資源整合與信息傳播從弱熱點(diǎn)詞上升至熱點(diǎn)詞,具有一定的上升趨勢(shì);全民閱讀、知識(shí)圖譜、虛擬社區(qū)、數(shù)據(jù)挖掘、信息生態(tài)與服務(wù)創(chuàng)新從次熱點(diǎn)上升至熱點(diǎn)詞;此外,高校圖書(shū)館、圖書(shū)館、大數(shù)據(jù)、微信與微博等,排名變化小,且都位于熱點(diǎn)詞范圍。上述實(shí)例,描述了熱點(diǎn)關(guān)鍵詞排名情況,對(duì)關(guān)鍵詞分級(jí)能更好的比較趨勢(shì)變化。
表2 2014—2015年關(guān)鍵詞h值排名(部分)
利用Python編程工具,分析知網(wǎng)引文檢索數(shù)據(jù)庫(kù)與文獻(xiàn)檢索數(shù)據(jù)庫(kù)采集的相關(guān)數(shù)據(jù)。
數(shù)據(jù)來(lái)源于2014—2019年圖書(shū)情報(bào)領(lǐng)域18種核心期刊文獻(xiàn),它們分別為:中國(guó)圖書(shū)館學(xué)報(bào)、圖書(shū)情報(bào)知識(shí)、圖書(shū)與情報(bào)、大學(xué)圖書(shū)館學(xué)報(bào)、情報(bào)理論與實(shí)踐、圖書(shū)情報(bào)工作、情報(bào)科學(xué)、情報(bào)雜志、情報(bào)資料工作、圖書(shū)館論壇、圖書(shū)館工作與研究、圖書(shū)館建設(shè)、數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)、情報(bào)學(xué)報(bào)、國(guó)家圖書(shū)館學(xué)刊、圖書(shū)館、圖書(shū)館學(xué)研究、圖書(shū)館雜志。人為去除會(huì)議、通知、征稿等信息,共獲取有效被引期刊文獻(xiàn)20091篇,有效出版期刊文獻(xiàn)24649篇。以24649篇出版文獻(xiàn)的關(guān)鍵詞作為分析對(duì)象,進(jìn)行數(shù)據(jù)處理。
本文以2014—2019年總詞頻排名前200的關(guān)鍵詞作為研究對(duì)象,計(jì)算熱度h值,對(duì)各年度關(guān)鍵詞排名劃分等級(jí)并研究發(fā)展趨勢(shì)。排名前50的關(guān)鍵詞如表3所示。
表3 Top50的關(guān)鍵詞
3.3.1 關(guān)鍵詞熱度與排名
根據(jù)公式(7)得到排名前200的關(guān)鍵詞熱度h值,如表4所示。
基于上述結(jié)果,將關(guān)鍵詞熱度h值進(jìn)行年度排名并劃分等級(jí)。分析2019年排名前50的熱點(diǎn)關(guān)鍵詞,得到2014—2019年排名變化情況,部分?jǐn)?shù)據(jù)如表5所示。
表4 關(guān)鍵詞熱度h值(保留三位小數(shù))
表5 關(guān)鍵詞熱度h值排名
從表5可知,高校圖書(shū)館、圖書(shū)館、大數(shù)據(jù)、公共圖書(shū)館等關(guān)鍵詞排名位于前列且變化小,屬于熱點(diǎn)關(guān)鍵詞;相比之下,用戶(hù)畫(huà)像在2014—2017年間屬于非熱點(diǎn)詞,2018年排名迅速上升,成為熱點(diǎn)詞;此外,2017年,人工智能排名上升明顯,數(shù)字人文在2016年和2017年間排名變化也十分顯著;公共文化服務(wù)和智慧服務(wù)在國(guó)家大力發(fā)展數(shù)字基礎(chǔ)建設(shè)的背景下成為研究熱點(diǎn),以上為排名顯著上升的關(guān)鍵詞,下文以折線(xiàn)圖對(duì)前200個(gè)關(guān)鍵詞的變化趨勢(shì)進(jìn)行分析。
3.3.2 趨勢(shì)分析
根據(jù)表5數(shù)據(jù)與分級(jí)標(biāo)準(zhǔn),本文將2019年熱點(diǎn)關(guān)鍵詞(排名前50)作為研究對(duì)象,探究其過(guò)去6年排名變化趨勢(shì),對(duì)關(guān)鍵詞在2014年所屬四個(gè)等級(jí)分別進(jìn)行討論。橫坐標(biāo)為年份,縱坐標(biāo)為排名,排名數(shù)值越小,熱度越大。變化情況如圖1所示。
(1)熱點(diǎn)關(guān)鍵詞上升為熱點(diǎn)關(guān)鍵詞
圖1 2019年熱點(diǎn)關(guān)鍵詞趨勢(shì)變化情況(1)
圖1所示,2014年熱點(diǎn)關(guān)鍵詞在2019年仍屬于熱點(diǎn)關(guān)鍵詞,排名變化穩(wěn)定。部分關(guān)鍵詞有明顯的學(xué)科特點(diǎn),如:高校圖書(shū)館、圖書(shū)館、公共圖書(shū)館、圖書(shū)館學(xué)、情報(bào)學(xué)、學(xué)科服務(wù)等。除學(xué)科關(guān)鍵詞外,與文獻(xiàn)計(jì)量學(xué)相關(guān)的研究方法排名也較為穩(wěn)定,如共詞分析法、社會(huì)網(wǎng)絡(luò)分析法等。此外,在互聯(lián)網(wǎng)背景下,大數(shù)據(jù)、突發(fā)事件、網(wǎng)絡(luò)輿情等成為該領(lǐng)域的研究熱點(diǎn)詞。
(2)次熱點(diǎn)關(guān)鍵詞上升至熱點(diǎn)關(guān)鍵詞
圖2所示,2014年次熱點(diǎn)關(guān)鍵詞在六年間上升為熱點(diǎn)關(guān)鍵詞。與圖1相比,圖2關(guān)鍵詞涉及研究方法,除文本挖掘波動(dòng)幅度較大,其余關(guān)鍵詞穩(wěn)中有進(jìn)。近年,知識(shí)圖譜、內(nèi)容分析、文本挖掘、評(píng)價(jià)指標(biāo)等研究方法廣泛運(yùn)用于不同的學(xué)術(shù)領(lǐng)域,大數(shù)據(jù)、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)作為社會(huì)熱門(mén)話(huà)題,直接或間接提高科學(xué)計(jì)量方法在不同領(lǐng)域的使用。
(3)弱熱點(diǎn)關(guān)鍵詞上升至熱點(diǎn)關(guān)鍵詞
圖3所示,2014年弱熱點(diǎn)關(guān)鍵詞在2019年上升為熱點(diǎn)關(guān)鍵詞,排名變化顯著,部分關(guān)鍵詞在2016年上升趨勢(shì)明顯,對(duì)領(lǐng)域熱點(diǎn)的研究具有參考價(jià)值。2016—2017年,AlphaGo與圍棋冠軍的人機(jī)對(duì)戰(zhàn)將機(jī)器學(xué)習(xí)拉入大眾視野,并獲得學(xué)術(shù)界的關(guān)注。2017年底,國(guó)家大數(shù)據(jù)戰(zhàn)略第二次會(huì)議提出加快完善數(shù)字基礎(chǔ)設(shè)施,推進(jìn)數(shù)據(jù)資源整合和開(kāi)放數(shù)據(jù)共享,各大城市、區(qū)域政府開(kāi)啟與互聯(lián)網(wǎng)企業(yè)合作,推出了一系列惠民、便民、利民的數(shù)據(jù)資源開(kāi)放共享平臺(tái),開(kāi)啟了大數(shù)據(jù)服務(wù)的探索。如廣東省于2017年聯(lián)合騰訊、移動(dòng)、電信、聯(lián)通推出數(shù)字廣東,推進(jìn)珠三角地區(qū)信息化發(fā)展。
(4)非熱點(diǎn)關(guān)鍵詞上升至熱點(diǎn)關(guān)鍵詞
圖4所示,2014年非熱點(diǎn)關(guān)鍵詞在2019年上升為熱點(diǎn)詞,上升迅速,對(duì)該領(lǐng)域研究熱點(diǎn)有積極參考價(jià)值。2015年,國(guó)務(wù)院印發(fā)《國(guó)務(wù)院關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)的指導(dǎo)意見(jiàn)》,同年,也成為中國(guó)特色新型智庫(kù)建設(shè)元年,智庫(kù)不僅上升為國(guó)家戰(zhàn)略,也走進(jìn)了公眾視線(xiàn),其關(guān)注度延續(xù)至今。人工智能、深度學(xué)習(xí)同機(jī)器學(xué)習(xí),受到2017年AlphaGo的影響,關(guān)注度上升。用戶(hù)畫(huà)像最早由Alan Cooper提出,于2017年得到國(guó)內(nèi)學(xué)者關(guān)注,作為研究用戶(hù)特點(diǎn)的工具,廣泛用于電子商務(wù)、圖書(shū)館、醫(yī)療健康等領(lǐng)域。在線(xiàn)評(píng)價(jià)作為用戶(hù)對(duì)產(chǎn)品體驗(yàn)的一部分,伴隨電商、社交媒體的發(fā)展和企業(yè)對(duì)用戶(hù)畫(huà)像的關(guān)注,成為2019年圖書(shū)情報(bào)領(lǐng)域熱點(diǎn)關(guān)鍵詞。2009年,數(shù)字人文引入學(xué)界,近年隨著相關(guān)技術(shù)的發(fā)展,數(shù)字人文逐漸得到關(guān)注。
圖2 2019年熱點(diǎn)關(guān)鍵詞趨勢(shì)變化情況(2)
圖3 2019年熱點(diǎn)關(guān)鍵詞趨勢(shì)變化情況(3)
圖4 2019年熱點(diǎn)關(guān)鍵詞趨勢(shì)變化情況(4)
上述四類(lèi)關(guān)鍵詞排名特點(diǎn)如下:學(xué)科類(lèi)關(guān)鍵詞排名高、排名變化小、對(duì)熱點(diǎn)判斷參考價(jià)值??;經(jīng)典文獻(xiàn)計(jì)量方法排名穩(wěn)中有序;基于計(jì)算機(jī)與互聯(lián)網(wǎng)技術(shù)高速發(fā)展的背景,計(jì)算方法、研究理論快速成為熱門(mén)焦點(diǎn),受到廣泛關(guān)注,具有較高的參考意義。
將2017—2019年作為一個(gè)時(shí)間單位,以熱度h值為基準(zhǔn)降序排列,比較原始z指數(shù)值與絕對(duì)詞頻排名,檢驗(yàn)ztw指數(shù)評(píng)價(jià)效果。圖5中,橫坐標(biāo)為關(guān)鍵詞,縱坐標(biāo)為排名,排名數(shù)值越小,越為熱點(diǎn)關(guān)鍵詞。
(1)熱點(diǎn)關(guān)鍵詞比較
圖5為排名前50的熱點(diǎn)關(guān)鍵詞,可以看出,熱度h值排名前列的關(guān)鍵詞三種排名差距小。其中,高校圖書(shū)館等學(xué)科熱點(diǎn)詞位于前列,互聯(lián)網(wǎng)、大數(shù)據(jù)、智庫(kù)、網(wǎng)絡(luò)輿情、知識(shí)圖譜、可視化、微信、微博、社交媒體、人工智能等關(guān)鍵詞都為近年研究熱點(diǎn)詞。此外,三種方法排名差異較大的有開(kāi)放獲取、健康信息與深度學(xué)習(xí)等,深度學(xué)習(xí)在z指數(shù)計(jì)算下,排名僅為171。
圖5 熱點(diǎn)關(guān)鍵詞比較(部分顯示)
(2)次熱點(diǎn)關(guān)鍵詞比較
圖6為排名50~100的次熱點(diǎn)關(guān)鍵詞,比較三種排名結(jié)果,差異特征明顯。熱度h值排名顯著高于原始z指數(shù)值與絕對(duì)詞頻,排名前列的有:機(jī)器學(xué)習(xí)、開(kāi)放政府?dāng)?shù)據(jù)、數(shù)據(jù)共享、開(kāi)發(fā)存取、用戶(hù)畫(huà)像、區(qū)塊鏈、主題模型等,都為近年熱點(diǎn)詞。通過(guò)比較不同方法的排名結(jié)果,可以看出熱度h值能夠提升部分關(guān)鍵詞排名,且結(jié)果較為符合當(dāng)前領(lǐng)域狀況,也符合上述趨勢(shì)分析的相關(guān)背景。
圖6 次熱點(diǎn)關(guān)鍵詞比較(部分顯示)
(3)弱熱點(diǎn)關(guān)鍵詞比較
圖7為排名100~150的弱熱點(diǎn)關(guān)鍵詞,可以看出,熱度h值與z指數(shù)值和絕對(duì)詞頻排名存在正負(fù)排名差,熱度h值排名高于其他兩種方法的關(guān)鍵詞有主題識(shí)別、信息質(zhì)量、文本挖掘、政府?dāng)?shù)據(jù)、知識(shí)挖掘等;熱度h值排名低于其他兩個(gè)方法的關(guān)鍵詞有主題演化、信息安全、在線(xiàn)評(píng)論、知識(shí)管理、CiteSpace、期刊評(píng)價(jià)等。弱熱點(diǎn)關(guān)鍵詞排名特點(diǎn)在于詞頻與被引相互影響,三種方法的排名高低差值分布均勻。
(4)非熱點(diǎn)關(guān)鍵詞比較
圖8為排名150~200的非熱點(diǎn)關(guān)鍵詞,熱度h值排名普遍低于z指數(shù)值與絕對(duì)詞頻。其中,熱度h值排名高于其他兩種方法的關(guān)鍵詞有ischool、人才培養(yǎng)、政府?dāng)?shù)據(jù)開(kāi)放等;熱度h值排名低于其他兩個(gè)方法的關(guān)鍵詞有館藏建設(shè)、情報(bào)研究、總分館制、知識(shí)元、電子書(shū)、知識(shí)組織等。熱度h值排名較高的關(guān)鍵詞與大環(huán)境下的研究熱點(diǎn)相關(guān)。綜上,熱度h值排名能拉低非熱點(diǎn)詞,也較為符合傳統(tǒng)情報(bào)領(lǐng)域的研究現(xiàn)狀。
圖7 弱熱點(diǎn)關(guān)鍵詞比較(部分顯示)
圖8 非熱點(diǎn)關(guān)鍵詞比較(部分顯示)
通過(guò)三種不同方法的比較,熱度h值排名較高的關(guān)鍵詞為近年學(xué)者重點(diǎn)關(guān)注方向,除學(xué)科關(guān)鍵詞外,次熱點(diǎn)關(guān)鍵詞能很好的體現(xiàn)當(dāng)前互聯(lián)網(wǎng)背景下熱門(mén)研究方法與話(huà)題。在分析的過(guò)程中,次熱點(diǎn)關(guān)鍵詞能很好的提升排名,對(duì)于非熱點(diǎn)關(guān)鍵詞能較好的拉低排名,凸顯分析結(jié)果,使關(guān)鍵詞熱點(diǎn)評(píng)價(jià)更加合理、更加有效。
本文設(shè)計(jì)ztw指數(shù)探究圖書(shū)情報(bào)領(lǐng)域研究熱點(diǎn)與變化趨勢(shì)。根據(jù)原始z指數(shù)在評(píng)價(jià)研究對(duì)象數(shù)量、質(zhì)量與一致性指標(biāo)即綜合性?xún)?yōu)勢(shì),基于俞立平、李長(zhǎng)玲教授的時(shí)間加權(quán)被引公式與奉國(guó)和教授的加權(quán)時(shí)間思想,對(duì)已出版文章的被引動(dòng)態(tài)性賦予權(quán)重。根據(jù)新模型計(jì)算關(guān)鍵詞熱度值,通過(guò)排名劃分等級(jí)的方式得到熱度變化趨勢(shì),排名變化大且位于前列的關(guān)鍵詞有大數(shù)據(jù)、用戶(hù)畫(huà)像、人工智能、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等。通過(guò)比較熱度h值與原始z指數(shù)和絕對(duì)詞頻排名差異,檢驗(yàn)熱度h值評(píng)價(jià)效果,結(jié)果顯示:熱點(diǎn)關(guān)鍵詞排名差異小,次熱點(diǎn)與非熱點(diǎn)關(guān)鍵詞差異特征明顯;在次熱點(diǎn)部分,熱度h值排名高于其他兩種方法;在非熱點(diǎn)部分,熱度h值排名低于其他兩種方法。可以得出,ztw指數(shù)能夠提升次熱點(diǎn)關(guān)鍵詞排名,拉低非熱點(diǎn)關(guān)鍵詞排名,得到的關(guān)鍵詞也較為符合當(dāng)前社會(huì)發(fā)展與領(lǐng)域研究狀況,在熱點(diǎn)探究中結(jié)果更加有效與合理。
本文將關(guān)鍵詞詞頻與被引值作為熱度分析要素,對(duì)圖書(shū)情報(bào)領(lǐng)域關(guān)鍵詞評(píng)價(jià),比較三種排名結(jié)果檢驗(yàn)ztw指數(shù)效果,不同等級(jí)排名差異特征顯著。對(duì)于排名差異,可深入探究,指標(biāo)深度即數(shù)量、質(zhì)量與一致性,指標(biāo)廣度即關(guān)鍵詞詞頻與被引值,分析各指標(biāo)對(duì)熱度影響程度,從而挖掘不同等級(jí)排名差異因素。由于不同領(lǐng)域不同學(xué)科的文章存在差異,可將本研究方法擴(kuò)充至其他領(lǐng)域進(jìn)行數(shù)據(jù)分析,比較結(jié)果,進(jìn)而判斷模型適用性。