徐小瑩 李輝
摘 要 進(jìn)行學(xué)術(shù)期刊關(guān)鍵詞分析對(duì)于掌握學(xué)科主題和學(xué)科構(gòu)成脈絡(luò)具有重要意義,由此本研究利用網(wǎng)絡(luò)嵌入技術(shù)提取了大型關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)的高階信息,并利用聚類算法對(duì)“圖書館學(xué);情報(bào)學(xué)”學(xué)科進(jìn)行關(guān)鍵詞主題可視化分析。首先,刻畫了關(guān)鍵詞之間的局部聚集和全局分布,并分析了最近四年中該學(xué)科的熱度持續(xù)、熱度增加和熱度減退主題,最后通過國內(nèi)外關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)對(duì)比揭示了中外研究熱點(diǎn)異同。
關(guān)鍵詞 圖書情報(bào)學(xué) ?聚類算法 ?關(guān)聯(lián)網(wǎng)絡(luò)分析 ?大數(shù)據(jù) ?共詞分析
分類號(hào) G252.8
DOI 10.16810/j.cnki.1672-514X.2021.04.016
Hot Topics Detection of Discipline of Library and Information: by Analyzing a Large Scale of Co-Keywords Based on Network Embedding
Xu Xiaoying, Li Hui
Abstract Keyword analysis of academic journals is of great significance for mastering the subject theme and discipline structure. Therefore, this study uses network embedding technology to extract high-order information of large-scale keyword association network, and uses clustering algorithm to carry out keyword theme visualization analysis of “l(fā)ibrary science; information science”. Firstly, it describes the local aggregation and global distribution of keywords, and analyzes the topics of popularity persistence, popularity increase and popularity decrease in the past four years. Finally, it reveals the similarities and differences between domestic and foreign research hot spots through the comparison of keyword association networks at home and abroad.
Keywords Library and information science. Clustering algorithm. Association network analysis. Big data. Co-word analysis.
0 引言
學(xué)術(shù)論文是學(xué)科研究及其發(fā)展的重要呈現(xiàn)形式之一,其中論文關(guān)鍵詞是一種表述特定學(xué)科主題的重要手段。關(guān)鍵詞作為學(xué)術(shù)期刊所發(fā)表文獻(xiàn)中的重要組成部分,通常由作者給出或由期刊建議,它們是對(duì)文獻(xiàn)內(nèi)容的濃縮和提煉,是能夠反映文獻(xiàn)主題概念和主要內(nèi)容的自然語言詞匯。每一個(gè)學(xué)科領(lǐng)域在特定時(shí)間內(nèi)均積累了大量的關(guān)鍵詞。通過對(duì)關(guān)鍵詞集合的深入分析,可揭示所在學(xué)科領(lǐng)域的總體特征、研究重點(diǎn)內(nèi)容、研究主題及其內(nèi)在聯(lián)系,以及發(fā)展脈絡(luò)與發(fā)展趨勢(shì)[1-2]。常見的關(guān)鍵詞分析方法可分為單詞出現(xiàn)頻次分析[3]、雙詞共現(xiàn)頻次[4]、關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)分析[5-6]等方法。單詞出現(xiàn)頻次分析法認(rèn)為頻次越高的關(guān)鍵詞重要性越大,雙詞共現(xiàn)頻次分析方法認(rèn)為一對(duì)關(guān)鍵詞共同出現(xiàn)次數(shù)越多,則代表它們的關(guān)系越緊密,頻繁共同出現(xiàn)的關(guān)鍵詞能夠反映所代表學(xué)科的構(gòu)成以及熱點(diǎn)主題[7-10]。關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)分析方法擴(kuò)展了雙詞共現(xiàn)詞頻,將所有共同出現(xiàn)的雙詞相互關(guān)聯(lián)而形成一個(gè)網(wǎng)絡(luò),進(jìn)而可描述關(guān)鍵詞重要性及其在學(xué)科領(lǐng)域內(nèi)的全局和局部聯(lián)系[11-16]。
近幾年,關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)成為了學(xué)科領(lǐng)域的研究熱點(diǎn),已經(jīng)被廣泛應(yīng)用多個(gè)方面,包括創(chuàng)客、圖書情報(bào)規(guī)劃、學(xué)術(shù)出版服務(wù)、圖書館學(xué)研究熱點(diǎn)發(fā)現(xiàn)等。然而,當(dāng)前關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)方面的研究文獻(xiàn)僅僅對(duì)100個(gè)之內(nèi)的高頻詞匯進(jìn)行網(wǎng)絡(luò)分析,缺乏對(duì)學(xué)科關(guān)鍵詞整體布局刻畫,也缺乏對(duì)某個(gè)研究方向的細(xì)節(jié)描述。針對(duì)這一問題,本文以我國“圖書情報(bào)”學(xué)科領(lǐng)域?qū)W術(shù)期刊上刊登的關(guān)鍵詞為實(shí)證,利用網(wǎng)絡(luò)嵌入技術(shù)實(shí)施大型復(fù)雜關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)分析,從而揭示該學(xué)科領(lǐng)域的主題結(jié)構(gòu)、重點(diǎn)與熱點(diǎn)問題、研究主題的特征,以及該學(xué)科逐年的發(fā)展趨勢(shì)變化。同時(shí),也通過對(duì)比中國與國際期刊關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò),闡明該學(xué)科領(lǐng)域國內(nèi)外的研究主題特點(diǎn)與差異。
1 基于非負(fù)矩陣分解的網(wǎng)絡(luò)嵌入分析方法
對(duì)于關(guān)鍵詞分析的現(xiàn)有方法通常采用直接的網(wǎng)絡(luò)可視化方法進(jìn)行網(wǎng)絡(luò)分析,即選取網(wǎng)絡(luò)中由高頻詞構(gòu)成的子網(wǎng)絡(luò)進(jìn)行顯示??紤]到所研究對(duì)象是由上萬個(gè)關(guān)鍵詞及其數(shù)萬條共現(xiàn)關(guān)系組成的大型關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò),為了也能顯示次高頻、中高頻和低高頻詞,本文應(yīng)用網(wǎng)絡(luò)嵌入對(duì)關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)進(jìn)行分析。
網(wǎng)絡(luò)嵌入是一種能夠適用大型網(wǎng)絡(luò)分析和推理的熱門技術(shù),旨在將網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn)表示成低維實(shí)值向量,使原網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)信息被高效地保存于學(xué)習(xí)到的向量中,進(jìn)而可將得到的向量表示運(yùn)用到網(wǎng)絡(luò)分析中常見的應(yīng)用中,如可視化任務(wù)、鏈接預(yù)測以及社區(qū)發(fā)現(xiàn)等任務(wù)。
對(duì)于本文的關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò),采用非負(fù)矩陣分解(NMF)實(shí)現(xiàn)網(wǎng)絡(luò)嵌入[17-18],將關(guān)鍵詞映射到低維甚至二維空間,不僅便于人眼觀察,而且可使用機(jī)器學(xué)習(xí)算法進(jìn)行深入分析,從而以定量的方式刻畫關(guān)鍵詞之間的局部聚集和全局分布關(guān)系。其數(shù)學(xué)描述如下:關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)可用權(quán)重圖G(V,A)來表示,其中V={vi}表示結(jié)點(diǎn)集合,vi表示第i個(gè)關(guān)鍵詞,稱為結(jié)點(diǎn);Ak×k={αi,j}稱為權(quán)重矩陣,αi,j對(duì)應(yīng)于兩個(gè)結(jié)點(diǎn)共現(xiàn)詞頻。對(duì)于任意給定一個(gè)包含非負(fù)元素的關(guān)聯(lián)矩陣Ak×k,NMF能夠?qū)ふ业揭粋€(gè)非負(fù)矩陣Uk×l和另一個(gè)非負(fù)矩陣Vl×k,使得滿足A≈UV [18],其中L≤K。對(duì)于關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)而言,V的每一列將每一個(gè)關(guān)鍵詞結(jié)點(diǎn)映射為L維向量,描述了該關(guān)鍵詞的高階統(tǒng)計(jì)信息。利用這種低維向量表示可以計(jì)算關(guān)鍵詞之間的相似性和局部緊密連接關(guān)系。圖1顯示了網(wǎng)絡(luò)嵌入的實(shí)施流程。
(2)屬于熱度增加主題的關(guān)鍵詞一般來說是指排名逐年上升而且詞頻絕對(duì)值也逐年增加的詞匯。熱度增加的主題關(guān)鍵詞有“智慧圖書館”“人工智能”“數(shù)字人文”“公共文化服務(wù)”“智慧服務(wù)”“用戶畫像”“扎根理論”“深度學(xué)習(xí)”“區(qū)塊鏈”“空間再造”“機(jī)器學(xué)習(xí)”等。它們的出現(xiàn)詞頻和詞頻排名自2016起大幅度提升,其中2016年和2019年的數(shù)值突顯了這些主題關(guān)鍵詞的熱度變化量。例如,“人工智能”在2016年出現(xiàn)了7次、排名第766,但在2019年出現(xiàn)了99次、排名第8。可以看出,大部分熱度增加主題關(guān)鍵詞涉及到“智能智慧”這個(gè)主題,順應(yīng)了2017年國務(wù)院頒布的《新一代人工智能發(fā)展規(guī)劃》。
(3)屬于熱度減退主題的高頻關(guān)鍵詞一般來說是指排名逐年下降而且詞頻絕對(duì)值也逐年減少的詞匯。熱度減退的主題關(guān)鍵詞有“建筑物”“MOOC”“微信”“讀者服務(wù)”“移動(dòng)圖書館”“數(shù)字資源”“云計(jì)算”“圖書館員”“微博”“學(xué)科館員”“圖書館聯(lián)盟”“元數(shù)據(jù)”“醫(yī)學(xué)信息學(xué)”等。它們的出現(xiàn)詞頻和詞頻排名自2016起大幅度降低和下降,其中2016年和2019年的數(shù)值突顯了這些主題關(guān)鍵詞的熱度變化量。例如, “MOOC”在2016年出現(xiàn)了109次、排名第12,但在2019年僅出現(xiàn)了10次、排名第350。此外,還有一些熱度減退主題關(guān)鍵詞,如“信息服務(wù)”“互聯(lián)網(wǎng)+”“服務(wù)創(chuàng)新”等,其詞頻數(shù)值呈現(xiàn)出逐年的顯著減少或其詞頻排名呈現(xiàn)顯著下降??梢钥闯?,大部分熱度減退主題關(guān)鍵詞涉及到已經(jīng)成熟的信息平臺(tái),如MOOC、微信等;又或者涉及新技術(shù)相關(guān)主題,如“數(shù)據(jù)挖掘”已經(jīng)被“人工智能”等先進(jìn)技術(shù)所取代。
4.2 從網(wǎng)絡(luò)嵌入空間的角度分析關(guān)鍵詞變化趨勢(shì)
基于網(wǎng)絡(luò)嵌入方法的四個(gè)年度關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析,不僅能夠揭示關(guān)鍵詞個(gè)體熱度變化,而且能夠揭示關(guān)鍵詞群體的年度變化趨勢(shì)。共現(xiàn)關(guān)系密切的關(guān)鍵詞在該空間中相距較近。根據(jù)上述關(guān)鍵詞的三個(gè)類別,下面闡述高頻和中頻等重要關(guān)鍵詞的變化趨勢(shì),其可視化結(jié)果如圖9所示。
(1)熱度持續(xù)主題關(guān)鍵詞共現(xiàn)關(guān)系變化。四年中學(xué)科核心關(guān)鍵詞在網(wǎng)絡(luò)嵌入空間的位置分布中,詞頻最高的“高校圖書館”通常遠(yuǎn)離其它學(xué)科核心關(guān)鍵詞,且在不同年份中與之相鄰的熱度持續(xù)主題詞和熱度變化關(guān)鍵詞也不相同。這種多樣性說明“高校圖書館”的相關(guān)研究內(nèi)容變化較快。
學(xué)科核心關(guān)鍵詞“圖書館”與“公共圖書館”在四年內(nèi)始終保持較近的距離,不僅聚集了學(xué)科核心關(guān)鍵詞中的“閱讀推廣”,而且也聚集了其它重要關(guān)鍵詞,形成了學(xué)科核心關(guān)鍵詞簇,但社區(qū)內(nèi)的內(nèi)容在不同年份中稍有變化。這些詞匯正是圖書館學(xué)的核心研究主題。此外,另一個(gè)學(xué)科核心關(guān)鍵詞“大數(shù)據(jù)”的變化也較為顯著。
(2)熱度增加主題關(guān)鍵詞共現(xiàn)關(guān)系變化。以熱度增幅最大的關(guān)鍵詞“智慧圖書館”為例。在2016年,“智慧圖書館”鄰近“高校圖書館”“大數(shù)據(jù)”“數(shù)字圖書館”和“云計(jì)算”,但與熱度增加主題關(guān)鍵詞中的“人工智能”較遠(yuǎn);在2017年和2018年,它緊密靠近“人工智能”“智慧服務(wù)”“深度學(xué)習(xí)”“數(shù)字圖書館”,并位于“圖書館”關(guān)鍵詞簇當(dāng)中;但在2019年,它逐漸遠(yuǎn)離智能和智慧相關(guān)詞匯,但非??拷肮参幕?wù)”和“讀者服務(wù)”,說明“智慧圖書館”在四年當(dāng)中已經(jīng)從理論概念逐漸落地。此外,“人工智能”“數(shù)字人文”“智慧服務(wù)”“用戶畫像”等熱度增加詞匯的位置變化較大,這說明此類熱度增加主題關(guān)鍵詞的熱度傳播范圍逐漸增加。
(3)熱度減退主題關(guān)鍵詞共現(xiàn)關(guān)系變化。熱度減幅最大的關(guān)鍵詞“建筑物”只在前兩年出現(xiàn),且與“讀者服務(wù)”和“數(shù)字資源”緊密相關(guān)。熱度減退關(guān)鍵詞“MOOC”在2016年、2017年和2019年與“信息素養(yǎng)”密切相關(guān),而在2017年卻與學(xué)科核心詞“高校圖書館”密切相關(guān),2018年進(jìn)入“圖書館”簇,2019年逐漸遠(yuǎn)離其它重要詞匯。另一個(gè)熱度減退關(guān)鍵詞“微信”,在2016 年、2017年和2018年與其他兩個(gè)熱度減退“移動(dòng)圖書館”和“扎根理論”以及一個(gè)熱度增加關(guān)鍵詞“數(shù)字人文”聯(lián)系緊密,具有較高的共現(xiàn)頻率,但在2019年遠(yuǎn)離它們。結(jié)合這兩個(gè)關(guān)鍵詞減退的熱度,這說明“MOOC”和“微信”應(yīng)用已經(jīng)成熟。此外,“讀者服務(wù)”與“數(shù)字資源”在四年內(nèi)都是鄰近詞匯,同隸屬于學(xué)科核心“圖書館”關(guān)鍵詞簇,是該領(lǐng)域的基礎(chǔ)主題但熱度逐漸減退。
5 國內(nèi)外圖情學(xué)科關(guān)鍵詞橫向?qū)Ρ?/p>
為了分析國內(nèi)外“圖情”學(xué)科的研究主題差異,對(duì)比了2019年國內(nèi)和國外關(guān)鍵詞網(wǎng)絡(luò)。從Journal Citation Report上收集“Information Science & Library Science”學(xué)科的63個(gè)SSCI期刊于2019年發(fā)布的SSCI學(xué)術(shù)論文,并抽取其關(guān)鍵詞共現(xiàn)數(shù)據(jù),共包含了10 163個(gè)關(guān)鍵詞和38 232條共現(xiàn)關(guān)系。由于每一個(gè)英文期刊年平均論文數(shù)目為58篇,遠(yuǎn)低于每一個(gè)中文期刊年平均論文數(shù)目214篇,因此中文關(guān)鍵詞的詞頻要遠(yuǎn)大于英文關(guān)鍵詞,例如,中文關(guān)鍵詞里有詞頻為近782次的超高頻詞“高校圖書館”,而英文關(guān)鍵詞的最大詞頻僅為77次(social media),相差10倍。因此,在后續(xù)的分析當(dāng)中,只關(guān)注關(guān)鍵詞的詞頻排名和關(guān)鍵詞共現(xiàn)關(guān)系。
5.1 國內(nèi)外排名前20名的高詞頻關(guān)鍵詞
分別以國內(nèi)外關(guān)鍵詞排名為基準(zhǔn),對(duì)比國內(nèi)外排名前20名的高詞頻關(guān)鍵詞,從表2所示,國內(nèi)外高頻關(guān)鍵詞的內(nèi)容差異很大,國內(nèi)側(cè)重具有圖書館內(nèi)涵詞匯,而國外側(cè)重社交媒體和定性分析。
(1)總的來看, 17個(gè)關(guān)鍵詞的內(nèi)容均不同,只有“高校圖書館”“大數(shù)據(jù)”和“信息素養(yǎng)”三個(gè)共同關(guān)鍵詞。他們的國內(nèi)外排名順序一致,但其具體排名有差別,國內(nèi)排名分別為1、5和18,國外排名分別為5、15和16。另外,對(duì)于兩個(gè)相似詞匯“人工智能”和“機(jī)器學(xué)習(xí)”,國內(nèi)傾向于前者而國外傾向于后者。
(2)以國內(nèi)關(guān)鍵詞排名基準(zhǔn)來看,有6個(gè)國內(nèi)關(guān)鍵詞找不到對(duì)應(yīng)的國外關(guān)鍵詞,分別是“閱讀推廣”“智慧圖書館”“學(xué)科服務(wù)”“情報(bào)學(xué)”“全民閱讀”“互聯(lián)網(wǎng)+”,剩下11個(gè)國內(nèi)關(guān)鍵詞的國內(nèi)外排名差別很大,例如,“知識(shí)圖譜”的國內(nèi)外排名分別為14和2200。
(3)以國外關(guān)鍵詞排名來看,有5個(gè)國外關(guān)鍵詞找不到對(duì)應(yīng)的國內(nèi)關(guān)鍵詞,分別是qualitative、breast cancer、classification、Facebook、communication,剩下12個(gè)國外關(guān)鍵詞的國內(nèi)外排名差別很大。例如,“定性研究”的國內(nèi)外排名分別為5152和17。
5.2 對(duì)比分析國內(nèi)外關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)
在網(wǎng)絡(luò)嵌入空間里對(duì)比了國內(nèi)外關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),形成聚類圖。特別地以國外關(guān)鍵詞為基準(zhǔn)選擇了詞頻大于15英文關(guān)鍵詞,總共62個(gè)詞匯,同時(shí)在國內(nèi)關(guān)鍵詞中選擇了詞頻排名前62以內(nèi)的中文詞匯。這些中高頻詞匯稱為重要關(guān)鍵詞,分別在嵌入空間內(nèi)姨這些重要關(guān)鍵詞的分布狀況進(jìn)行分析,可視化結(jié)果如圖10和圖11所示,每一個(gè)點(diǎn)表示一個(gè)關(guān)鍵詞,點(diǎn)的數(shù)字標(biāo)簽表示該關(guān)鍵詞的詞頻排名,虛線圓圈標(biāo)記了鄰近重要關(guān)鍵詞形成的簇,每一個(gè)簇至少包括三個(gè)關(guān)鍵詞,通常反映了一個(gè)研究主題。
(1) 按照包含關(guān)鍵詞數(shù)目的大小,在國外關(guān)鍵詞網(wǎng)絡(luò)嵌入空間呈現(xiàn)的研究主題分別是:定性知識(shí)分析、社交媒體分析、文獻(xiàn)計(jì)量學(xué)、圖書館員、文獻(xiàn)計(jì)量方法、高校圖書館、信息、知識(shí)傳播。主要內(nèi)容如下:
定性知識(shí)分析主題包含了“qualitative \ knowledge management \ open access \ qualitative research \ case study”5個(gè)高頻詞和“e-government \ literature review \ scholarly communication \ adoption \ open data”等中頻詞。
社交媒體分析主題包含了3個(gè)高頻詞“social media \ Twitter \ Facebook”,及其鄰近的中頻詞“sentiment analysis \ text mining \ online reviews”。
文獻(xiàn)計(jì)量學(xué)主題包含了1個(gè)高頻詞“bibliometrics”及其5個(gè)鄰近中頻詞“citation analysis \ research evaluation \ bibliometric analysis \ library and information science \ web of science”。
圖書館員主題包含了1個(gè)高頻詞“machine learning”和4個(gè)中頻詞 “collaboration \ librarian \ research \ natural language processing”,對(duì)應(yīng)于圖書館員及其所需技能,同時(shí)該主題鄰近定性知識(shí)分析主題。
文獻(xiàn)計(jì)量方法主題包含了1個(gè)高頻詞“h-index”和3個(gè)中頻詞“citations \ social network analysis \ altmetrics”,同時(shí)該主題鄰近文獻(xiàn)計(jì)量學(xué)主題并于該主題關(guān)鍵詞密切相關(guān)。
高校圖書館主題包含了2個(gè)高頻詞“academic libraries \ information literacy”和2個(gè)中頻詞“l(fā)ibrary instruction \ higher education”等中頻詞,同時(shí)該主題鄰近定性知識(shí)分析主題。
信息主題包含了3個(gè)幾乎重疊的中頻詞“knowledge \ information \ data”,且三者意義相近。
知識(shí)傳播主題包含了相鄰的1個(gè)高頻詞和2個(gè)中頻詞“knowledge sharing \ communication \ internet”。
剩下一些重要關(guān)鍵詞相近較為散亂或沒有與其它重要關(guān)鍵詞形成簇。
(2) 按照包含關(guān)鍵詞數(shù)目的大小,在國內(nèi)關(guān)鍵詞網(wǎng)絡(luò)嵌入空間呈現(xiàn)的研究主題分別是:圖書館服務(wù)、服務(wù)數(shù)字化、高校學(xué)科建設(shè)、智庫與輿情、服務(wù)模式、移動(dòng)圖書館、大學(xué)。主要內(nèi)容如下:
圖書館服務(wù)主題包含了“圖書館\公共圖書館\閱讀推廣”3個(gè)超高頻詞、“智慧圖書館\全民閱讀\信息服務(wù)\互聯(lián)網(wǎng)+”4個(gè)高頻詞以及“公共文化服務(wù)\服務(wù)創(chuàng)新”等12個(gè)中頻詞。
服務(wù)數(shù)字化主題的關(guān)鍵詞均聚類包含了3個(gè)高頻“數(shù)字圖書館\數(shù)字人文\知識(shí)圖譜”以及“知識(shí)服務(wù)\研究熱點(diǎn)\文獻(xiàn)計(jì)量\用戶畫像\可視化分析”等9個(gè)中頻詞。
高校學(xué)科建設(shè)主題的關(guān)鍵詞聚類包含了排名第一的超高頻詞“高校圖書館”和其它兩個(gè)高頻詞“圖書館學(xué)\情報(bào)學(xué)”,以及2個(gè)中頻詞,其中“雙一流”幾乎與“高校圖書館”重疊,“圖書情報(bào)工作”與其它的高頻詞鄰近。
智庫與輿情主題包含了“大數(shù)據(jù)\智庫\高校\網(wǎng)絡(luò)輿情\情感分析”5個(gè)關(guān)鍵詞,其中“智庫”與“高校”幾乎重疊,共現(xiàn)關(guān)系緊密。
服務(wù)模式主題的包含了4個(gè)共現(xiàn)頻繁的關(guān)鍵詞“圖書館服務(wù)\服務(wù)模式\深度學(xué)習(xí)\空間再造”。
移動(dòng)圖書館主題包括3個(gè)相互鄰近的中頻詞“扎根理論\社交媒體\移動(dòng)圖書館”。
大學(xué)圖書館主題涉及1個(gè)高頻詞“信息素養(yǎng)”和兩個(gè)“大學(xué)圖書館\大學(xué)生”。
此外“人工智能”和“學(xué)科服務(wù)”2個(gè)高頻詞幾乎重疊,兩者共現(xiàn)頻次很高,說明人工智能技術(shù)已經(jīng)應(yīng)用于圖情學(xué)科服務(wù)當(dāng)中,將為圖情學(xué)科的理論研究與實(shí)踐發(fā)揮出更多的作用。
6 結(jié)論
本文根據(jù)圖書情報(bào)領(lǐng)域?qū)W術(shù)論文關(guān)鍵詞共現(xiàn)信息構(gòu)建了大型期刊論文關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò),利用網(wǎng)絡(luò)嵌入技術(shù)將關(guān)鍵詞映射為低維實(shí)值向量,進(jìn)而在該嵌入空間內(nèi)實(shí)施關(guān)鍵詞主題可視化分析,其主要結(jié)論有如下幾點(diǎn)。
(1)關(guān)鍵詞之間全局分布和局部聚集關(guān)系表明,“高校圖書館”“圖書館”“公共圖書館”“閱讀推廣”“大數(shù)據(jù)”等超高頻關(guān)鍵詞是圖書情報(bào)領(lǐng)域的核心構(gòu)成詞語,閱讀和服務(wù)仍然是該領(lǐng)域的核心內(nèi)容;“文獻(xiàn)計(jì)量”“網(wǎng)絡(luò)輿情”“美國”“高?!薄肮参幕?wù)”是該領(lǐng)域的研究熱點(diǎn);以這些關(guān)鍵詞為中心形成了該領(lǐng)域的多個(gè)研究主題,主要集中在技術(shù)創(chuàng)新、服務(wù)模式創(chuàng)新、圖書館數(shù)字化建設(shè)與服務(wù)、計(jì)量表現(xiàn)形式、數(shù)據(jù)資源整合、精準(zhǔn)服務(wù)、高校輿情分析、高校學(xué)科服務(wù)、文獻(xiàn)計(jì)量研究等方面。
(2)2016—2019年連續(xù)四年的關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)對(duì)比結(jié)果表明,“高校圖書館”等超高頻學(xué)科核心詞匯與和“圖書館服務(wù)”等服務(wù)類詞匯屬于熱度持續(xù)主題的高頻關(guān)鍵詞,而且與之相關(guān)的共現(xiàn)關(guān)鍵詞內(nèi)容呈現(xiàn)多樣化;“智慧圖書館”“人工智能”等“智能智慧”主題屬于熱度增加主題關(guān)鍵詞,而且其熱度傳播范圍逐漸增加;“MOOC”和“微信”等涉及到已經(jīng)成熟的平臺(tái)應(yīng)用詞匯屬于熱度減退主題關(guān)鍵詞,“數(shù)據(jù)挖掘”等已經(jīng)逐漸被“人工智能”等先進(jìn)技術(shù)所取代的詞匯也呈現(xiàn)熱度減退現(xiàn)象。隨著2017年國務(wù)院頒布《新一代人工智能發(fā)展規(guī)劃》以及近幾年人工智能領(lǐng)域各種標(biāo)準(zhǔn)化白皮書的發(fā)布,預(yù)計(jì)人工智能及其相關(guān)應(yīng)用仍是未來5年內(nèi)圖情領(lǐng)域的研究熱點(diǎn)。
(3)2019年國內(nèi)外關(guān)鍵詞關(guān)聯(lián)網(wǎng)絡(luò)對(duì)比結(jié)果表明,“社交媒體”“定性”“文獻(xiàn)計(jì)量”“知識(shí)管理”和“高校圖書館”為國外圖書情報(bào)領(lǐng)域的核心構(gòu)成詞語;國內(nèi)外排名前20高頻關(guān)鍵詞的內(nèi)容差異很大,國外的研究主題側(cè)重定性知識(shí)分析、文獻(xiàn)計(jì)量工作、社交媒體分析和互聯(lián)網(wǎng)知識(shí)傳播,而國內(nèi)的研究主題更加側(cè)重圖書館服務(wù)、高校學(xué)科建設(shè)、智庫以及互聯(lián)網(wǎng)+等互聯(lián)網(wǎng)擴(kuò)展應(yīng)用。從分析也發(fā)現(xiàn),國內(nèi)外共同認(rèn)為互聯(lián)網(wǎng)是知識(shí)傳播的重要渠道,但國外側(cè)重互聯(lián)網(wǎng)本身,而國內(nèi)側(cè)重移動(dòng)圖書館等互聯(lián)網(wǎng)擴(kuò)展應(yīng)用。建議國內(nèi)圖情領(lǐng)域加強(qiáng)專業(yè)性社交媒體的信息傳播以及文獻(xiàn)計(jì)量方面的研究,以便更好地與國際圖情研究接軌,從而擴(kuò)大國內(nèi)圖情研究工作的國際影響力。
參考文獻(xiàn):
尹相旭,張更平,李曉菲.基于關(guān)鍵詞統(tǒng)計(jì)的情報(bào)學(xué)研究現(xiàn)狀分析[J]. 情報(bào)雜志, 2009, 28(11): 1-4.
劉奕杉,王玉琳,李明鑫. 詞頻分析法中高頻詞閾值界定方法適用性的實(shí)證分析[J].數(shù)字圖書館論壇,2017(9): 42-49.
魏瑞斌.基于關(guān)鍵詞的情報(bào)學(xué)研究主題分析[J].情報(bào)科學(xué),2006,24(9):1400-1404,1434.
馮璐,冷伏海. 共詞分析方法理論進(jìn)展[J]. 中國圖書館學(xué)報(bào), 2006, 32(2):88-92.
閔超, 孫建軍. 基于關(guān)鍵詞交集的學(xué)科交叉研究熱點(diǎn)分析:以圖書情報(bào)學(xué)和新聞傳播學(xué)為例[J]. 情報(bào)雜志, 2014,33(5):76-82.
陳新花. 基于關(guān)鍵詞的圖書館知識(shí)服務(wù)研究分析[J]. 圖書情報(bào)工作, 2015,59(S2):128-131.
唐果媛. 基于共詞分析法的學(xué)科主題演化研究方法的構(gòu)建[J ].圖書情報(bào)工作,2017,61 (23): 100-107.
李綱,巴志超. 共詞分析過程中的若干問題研究[J].中國圖書館學(xué)報(bào),2017,43 (4): 93-113.
張明鑫. 基于共詞分析的國內(nèi)圖書館領(lǐng)域微信研究熱點(diǎn)分析[J]. 圖書情報(bào)導(dǎo)刊, 2017,2(5):30-35.
張俊, 洪詩佳. 國內(nèi)圖書館創(chuàng)客空間熱點(diǎn)研究及發(fā)展趨勢(shì)[J]. 圖書館研究, 2017,47(5):128-134.
楊建林. 學(xué)術(shù)個(gè)體研究方向的關(guān)聯(lián)分析:以中國情報(bào)學(xué)領(lǐng)域?yàn)槔齕J]. 情報(bào)科學(xué), 2015,33(2):132-138.
李娜. 國內(nèi)圖書館嵌入式服務(wù)研究主題分析:基于知識(shí)圖譜的視角[J]. 現(xiàn)代情報(bào), 2016, 36(10):156-163.
詹婧, 張仁瓊. 基于文獻(xiàn)計(jì)量的圖書館MOOC研究[J]. 圖書館學(xué)刊, 2017,39(8):106-113.
林龍. 基于共詞網(wǎng)絡(luò)分析法探析2017年圖書館研究特點(diǎn)[J]. 西部皮革, 2018, 40(8):136-137.
嚴(yán)珊. 基于共詞與社會(huì)網(wǎng)絡(luò)分析的圖書館大數(shù)據(jù)現(xiàn)狀研究[J]. 圖書館研究與工作, 2018, 167(5):15-20.
徐坤, 畢強(qiáng). 次高頻關(guān)鍵詞的選擇及在共詞分析中的應(yīng)用[J]. 情報(bào)理論與實(shí)踐, 2019, 42(5):152-156.
李樂,章毓晉. 非負(fù)矩陣分解算法綜述[J]. 電子學(xué)報(bào),2008,36(4):737-743.
申國偉, 楊武, 王巍, 等. 基于非負(fù)矩陣分解的大規(guī)模異構(gòu)數(shù)據(jù)聯(lián)合聚類. 計(jì)算機(jī)研究與發(fā)展, 2016,53(2):459-466
楊愛青,馬秀峰,張風(fēng)燕,等. g 指數(shù)在共詞分析主題詞選取中的應(yīng)用研究[J]. 情報(bào)雜志,2012,31 (2):52-55,74.
陳果,肖璐,趙雪芹. 領(lǐng)域知識(shí)分析中的關(guān)鍵詞選擇方法研究:一種以學(xué)科為背景的全局視角[J].情報(bào)學(xué)報(bào),2014,33 (9): 959-968.
劉敏娟,張學(xué)福,顏蘊(yùn). 基于詞頻、詞量、累積詞頻占比的共詞分析詞集范圍選取方法研究[J]. 圖書情報(bào)工作,2016,60 (23): 135-142.
徐小瑩 西北工業(yè)大學(xué)圖書館館員。 陜西西安,710072。
李 輝 西北工業(yè)大學(xué)圖書館副館長、副研究館員。 陜西西安,710072。
(收稿日期:2020-05-20 編校:劉 明,陳安琪)