張???,李玉華,莊 曉
(1.山東科技大學(xué) 圖書館;2.山東科技大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,山東 青島 266590)
人工智能(Artificial Intelligence)自1956年誕生以來,先后經(jīng)歷了發(fā)展、低潮、再發(fā)展的曲折過程,直至2016年3月,AlphaGo戰(zhàn)勝了人類職業(yè)圍棋冠軍,引發(fā)了人工智能技術(shù)的又一熱潮。本次熱潮呈現(xiàn)出技術(shù)引領(lǐng)、國家重視、企業(yè)推動以及需求牽引四大特點(diǎn),世界多國政府近年來相繼出臺政策,迅速將人工智能上升為國家戰(zhàn)略,將其視為國家核心競爭力的基本要素和重要標(biāo)志。美國政府于2016年10月13日發(fā)布了《國家人工智能研究與發(fā)展策略規(guī)劃》,我國政府于2017年7月20日印發(fā)了《新一代人工智能發(fā)展規(guī)劃》,在2018年中國政府工作報(bào)告中更明確提出“加強(qiáng)新一代人工智能研發(fā)應(yīng)用”。《中國新一代人工智能發(fā)展報(bào)告2019》指出[1],美國、中國、英國在人工智能發(fā)展方面表現(xiàn)突出,已躋身世界“第一梯隊(duì)”,因此,探究人工智能領(lǐng)域的研究前沿,有利于了解當(dāng)前人工智能的研究方向及發(fā)展趨勢,為我國科研政策制定提供數(shù)據(jù)支持和決策參考。
在全球人工智能領(lǐng)域研究方面,研究者從專利或文獻(xiàn)數(shù)據(jù)入手,探究整個(gè)領(lǐng)域的研究前沿。如,張振剛等[2]以專利為數(shù)據(jù)源,利用CiteSpace繪制共詞圖譜并識別出專利突變術(shù)語,以此分析人工智能技術(shù)的研究前沿;余厚強(qiáng)等[3]從關(guān)鍵詞節(jié)點(diǎn)指標(biāo)、網(wǎng)絡(luò)指標(biāo)和聚類分析等多個(gè)角度識別國際人工智能的研究前沿,并從聚類關(guān)鍵詞構(gòu)成、互信息詞和核心文獻(xiàn)三方面對研究前沿進(jìn)行示例解讀。在研究前沿檢測上,吳靜等[4]使用突現(xiàn)檢測技術(shù),對國際技術(shù)創(chuàng)新研究的時(shí)空分布、熱點(diǎn)和趨勢等展開分析;王夢婷[5]采用突現(xiàn)檢測方法,對10年內(nèi)的競爭情報(bào)文獻(xiàn)數(shù)據(jù)進(jìn)行研究,并根據(jù)主題突變的特點(diǎn)劃分出5種不同突變類型。
本文旨在以文獻(xiàn)數(shù)據(jù)作為來源,以中美兩國人工智能領(lǐng)域發(fā)展現(xiàn)狀作為研究對象,從總體發(fā)文量、高產(chǎn)機(jī)構(gòu)、高產(chǎn)作者等方面分析兩國開展人工智能研究的異同,判別中美兩國在人工智能領(lǐng)域的研究方向、研究優(yōu)勢,從而識別兩國研究前沿和研究熱點(diǎn),為我國人工智能未來的發(fā)展方向提供參考。
本文選擇Web of Science核心合集數(shù)據(jù)庫作為數(shù)據(jù)來源,分別檢索2010—2018年中美兩國在人工智能領(lǐng)域發(fā)表的文獻(xiàn),檢索式限定WC=(Computer Science,Artificial Intelligence)AND CU=(USA) AND PY=(2010—2018),以及WC=(Computer Science,Artificial Intelligence)AND CU=(China)AND PY=(2010—2018),文獻(xiàn)類型選擇“Article”,檢索時(shí)間為2019年6月11日。共檢索到來自中國的文獻(xiàn)32439篇,來自美國的文獻(xiàn)17318篇。
突變術(shù)語是指一個(gè)學(xué)科內(nèi)突然發(fā)生變化的專業(yè)術(shù)語,表現(xiàn)為在某些年份發(fā)表文獻(xiàn)中驟增,可用來表征研究前沿。[6]Kleinberg[7]于2002年提出了突現(xiàn)檢測(Burst Detection)算法,他認(rèn)為詞的重要性體現(xiàn)不在于詞出現(xiàn)時(shí)的時(shí)間長短,而是詞出現(xiàn)時(shí)的密度,即那些頻次相對增長率突然增加的詞——突變詞。突現(xiàn)檢測算法能在不受外界因素影響的情況下及時(shí)發(fā)現(xiàn)未達(dá)到詞頻閾值但具有情報(bào)意義的詞[8],它更注重領(lǐng)域內(nèi)研究活躍并具有潛在影響的熱點(diǎn)因素,而不管它是低頻詞還是高頻詞,它認(rèn)為頻次增長率突然增加的詞更有可能涉及領(lǐng)域局部熱點(diǎn)的變化,有助于發(fā)現(xiàn)和推動學(xué)科領(lǐng)域中的微觀因素,在揭示學(xué)科發(fā)展上更具有及時(shí)性和情報(bào)價(jià)值[9]。突變權(quán)重越大表示研究主題越熱門[10],突變術(shù)語成為領(lǐng)域新興研究趨勢的可能性也就越大。
本文采用CiteSpace軟件自帶的突現(xiàn)檢測工具進(jìn)行突現(xiàn)檢測,構(gòu)建術(shù)語共現(xiàn)網(wǎng)絡(luò),從大量專業(yè)術(shù)語中檢測出突變術(shù)語并依據(jù)其權(quán)重進(jìn)行排序,從而探析領(lǐng)域研究熱點(diǎn)的演進(jìn)軌跡。軟件的操作與參數(shù)設(shè)置如下:Time Slicing中時(shí)間段為2010—2018年,時(shí)間片設(shè)置為1,Term Source 選擇Title + Abstract +Author Keywords(DE)+Keywords Plus(ID),Term Type選擇名詞短語(Noun Phrase),Node Types選擇Term,閾值設(shè)置為TOP50;其次,計(jì)算方式設(shè)置主要為網(wǎng)絡(luò)模型優(yōu)化方式設(shè)置,剪切方式(Pruning)選擇路徑發(fā)現(xiàn)(Pathfinder)和修剪合并網(wǎng)絡(luò)(Pruning the Merged Network);最后,結(jié)果展示方式設(shè)置為對可視化方式的選擇,可視化方式(Visualization)選擇靜態(tài)聚類視圖(Cluster View-static)和顯示合并網(wǎng)絡(luò)(Show Merged Network)。
對文獻(xiàn)數(shù)量進(jìn)行統(tǒng)計(jì)分析,有利于在宏觀上掌握某一領(lǐng)域的發(fā)展規(guī)模,從整體上把握學(xué)科的發(fā)展脈絡(luò)。[11]而發(fā)文數(shù)量的變化可以直觀地看到某學(xué)科在特定時(shí)間段內(nèi)研究熱度的變化,是衡量該學(xué)科在該時(shí)間段內(nèi)發(fā)展態(tài)勢的重要指標(biāo)。[12]選擇Web of Science核心合集數(shù)據(jù)庫作為數(shù)據(jù)來源,時(shí)間限定為2010—2018年,共檢索出全球人工智能領(lǐng)域文獻(xiàn)111 332篇。其中,中國發(fā)文32 439篇,占比29.14%,位居各國家/地區(qū)發(fā)文量首位;美國發(fā)文17 318篇,占比15.56%,位居世界發(fā)文量第二位。中美兩國合計(jì)發(fā)文量達(dá)到49 757篇,占世界發(fā)文總量的44.7%。利用CiteSpace軟件自帶的突現(xiàn)檢測工具,對2010—2018年中美兩國發(fā)表的文獻(xiàn)進(jìn)行突變術(shù)語檢測,將檢測到的術(shù)語按照突變年限進(jìn)行排序,形成主題詞突變演化表,如表1和表2所示。
由表1可知,中國人工智能研究領(lǐng)域共產(chǎn)生22個(gè)突變術(shù)語,近九年來的發(fā)展?fàn)顩r主要呈現(xiàn)以下特點(diǎn):
(1)2010年前后,研究前沿集中在系統(tǒng)、算法以及邏輯層面,主成分分析、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、進(jìn)化算法等關(guān)鍵詞在2010年甚至更早的時(shí)間點(diǎn)發(fā)生突變,說明我國在2010年以前就已經(jīng)在人工智能理論研究方面取得進(jìn)展,研究的主要陣地集中在基礎(chǔ)算法領(lǐng)域,同時(shí)呈現(xiàn)出向具體應(yīng)用領(lǐng)域轉(zhuǎn)化的趨勢。
表1 中國人工智能領(lǐng)域研究主題詞突變演化
(2)2011—2013年,我國對人工智能領(lǐng)域的研究從純理論轉(zhuǎn)向了較為具體的前沿應(yīng)用領(lǐng)域,如粗糙集理論、稀疏表示、模糊集、泛化表現(xiàn)、群決策等;同時(shí),硬件設(shè)備的發(fā)展也促使人工智能向大數(shù)據(jù)挖掘時(shí)代邁進(jìn),這一階段的研究相對短暫。
(3)2015年至今,人工智能的研究涉及層面廣泛,呈現(xiàn)出對新問題、新方法的關(guān)注[10],基準(zhǔn)功能、時(shí)變延遲、高精確度等關(guān)鍵詞在2015年發(fā)生突變,但關(guān)注度僅維持到2016年,而數(shù)據(jù)挖掘、先進(jìn)方法(the-art approach)等關(guān)鍵詞在2015年發(fā)生突變后,熱度一直持續(xù)到2018年,目前仍處于研究的熱點(diǎn)位置。
由表2可知,美國人工智能研究領(lǐng)域共有48個(gè)術(shù)語發(fā)生突變,美國在人工智能領(lǐng)域的研究呈現(xiàn)出起步早、研究前沿多、學(xué)科分布均勻的特點(diǎn)。
(1)2010年前后,美國人工智能領(lǐng)域出現(xiàn)的突變詞較多,決策樹、進(jìn)化算法、模式識別等關(guān)鍵詞的突變時(shí)間僅持續(xù)到2011年,說明美國在人工智能理論研究領(lǐng)域開始時(shí)間早,處于領(lǐng)先地位;2010—2011年期間,研究領(lǐng)域不僅涉及支持向量機(jī)等基礎(chǔ)理論算法,同時(shí)在圖像分割、特征提取等具體應(yīng)用領(lǐng)域也有所突破。
(2)2012—2014年期間,美國繼續(xù)在基礎(chǔ)算法和圖像處理等領(lǐng)域展開研究,這一階段平均每項(xiàng)研究持續(xù)2—3年,如降維、訓(xùn)練集、稀疏表示、自然圖像等在2012年發(fā)生突變的術(shù)語基本在2014年前后完成突變;少數(shù)術(shù)語如分類性能等持續(xù)熱度時(shí)間較長,截至目前仍處于熱點(diǎn)位置。
(3)2015年至今,發(fā)生突變的術(shù)語達(dá)到16個(gè),其中多數(shù)保持著高熱度,如特征空間、大數(shù)據(jù)、計(jì)算效率等全球性的新興研究;同時(shí)還包括社交媒體、計(jì)算模型、訓(xùn)練樣本、現(xiàn)實(shí)訓(xùn)練集等現(xiàn)實(shí)應(yīng)用研究點(diǎn)。
表2 美國人工智能領(lǐng)域研究主題詞突變演化
從突變詞檢測的角度探析中美兩國在人工智能領(lǐng)域的研究概況可以發(fā)現(xiàn),盡管中國的發(fā)文總量近乎美國發(fā)文量的兩倍,但從術(shù)語突變趨勢上看,中國在人工智能領(lǐng)域的研究在2012年以前是落后于美國的,其研究重心局限于理論及算法領(lǐng)域,與此同時(shí),美國在人工智能的研究上一方面代表了研究的前沿方向,另一方面起到了引領(lǐng)作用;2015年以后,中國逐步跟上世界研究前沿的步伐,大踏步地趕上甚至超越美國,在先進(jìn)方法(the-art method)研究上比美國研究早了一年。
科研機(jī)構(gòu)是開展科學(xué)研究的基本單位之一,從機(jī)構(gòu)角度探究其研究前沿并進(jìn)行對比,有助于明確機(jī)構(gòu)在領(lǐng)域發(fā)展中的位勢、研究的側(cè)重、整體實(shí)力與機(jī)構(gòu)間研究的差異。[13]利用CiteSpace軟件對清洗后的數(shù)據(jù)進(jìn)行機(jī)構(gòu)發(fā)文量的統(tǒng)計(jì),節(jié)點(diǎn)類型選擇Institution,其他參數(shù)設(shè)為默認(rèn)值,中美兩國排名前10位的高產(chǎn)機(jī)構(gòu)如表3所示。
表3 中美兩國排名前十位的高產(chǎn)機(jī)構(gòu)及其發(fā)文量
由表3可得,在發(fā)文數(shù)量上,中國各機(jī)構(gòu)對人工智能領(lǐng)域的研究明顯多于美國,說明我國對人工智能的研究較為重視且有相當(dāng)?shù)某晒a(chǎn)出。其中,中國科學(xué)院發(fā)文量居于首位,發(fā)表論文量達(dá)到2242篇,排名前十位的高產(chǎn)機(jī)構(gòu)發(fā)文量占我國發(fā)文總量的30.9%。美國發(fā)文量排在前十位的高產(chǎn)機(jī)構(gòu)中,卡耐基梅隆大學(xué)發(fā)文604篇,位于美國各機(jī)構(gòu)首位。
以下以中美兩國發(fā)文量最高的兩所機(jī)構(gòu)(中國科學(xué)院、卡耐基梅隆大學(xué))為例,對其研究前沿進(jìn)行探測和對比分析,從而反映中美兩國在人工智能領(lǐng)域的研究現(xiàn)狀及未來發(fā)展趨勢。采用與前文同樣的突現(xiàn)檢測算法對兩所機(jī)構(gòu)發(fā)表文獻(xiàn)中的術(shù)語進(jìn)行檢測,得到研究機(jī)構(gòu)的突變演化表如表4和表5所示。
1.中國科學(xué)院人工智能領(lǐng)域研究主題詞突變演化趨勢
(1)對2010—2018年中國科學(xué)院發(fā)表的2242篇文獻(xiàn)進(jìn)行突變詞檢測,共得到19個(gè)突變術(shù)語,如表4所示。由表可知,中國科學(xué)院2010年發(fā)生突變的術(shù)語包括線性判別分析以及主成分分析,由于本文檢索時(shí)間限定為2010年及以后,這兩個(gè)突變術(shù)語可能在前期已經(jīng)投入研究。線性判別分析及主成分分析均為經(jīng)典的數(shù)據(jù)降維方法[14],由此可見,中國科學(xué)院在2010年前后對降維方法的關(guān)注度較高。
(2)2011年至2014年,中國科學(xué)院多個(gè)術(shù)語發(fā)生突變。數(shù)據(jù)挖掘、特征選擇、面部識別、圖像處理等術(shù)語的突變反映出中國科學(xué)院將關(guān)注點(diǎn)放到機(jī)器學(xué)習(xí)以及圖像處理領(lǐng)域,在相關(guān)方面取得一定程度的進(jìn)展。
(3)2015年至今,自適應(yīng)動態(tài)規(guī)劃、閉環(huán)系統(tǒng)、交替方向法等術(shù)語發(fā)生突變,其熱度一直持續(xù)至今,表明近年來中國科學(xué)院仍舊將重點(diǎn)放在深度學(xué)習(xí)、機(jī)器學(xué)習(xí)領(lǐng)域,完成從理論層面向應(yīng)用層面的轉(zhuǎn)化,致力于解決實(shí)際問題。
表4 中國科學(xué)院人工智能領(lǐng)域研究主題詞突變演化
表5 卡耐基梅隆大學(xué)人工智能領(lǐng)域研究主題詞突變演化
2.卡耐基梅隆大學(xué)人工智能領(lǐng)域研究主題詞突變演化趨勢
(1)對2010—2018年卡耐基梅隆大學(xué)發(fā)表的604篇文獻(xiàn)進(jìn)行突變詞檢測,共得到12個(gè)突變術(shù)語,如表5所示。由表可知,2010—2014年未能檢測到突變詞,最早發(fā)生突變的術(shù)語為數(shù)據(jù)挖掘,始于2015年,一直到2018年依舊保持高熱度,仍是當(dāng)前的一個(gè)研究熱點(diǎn)。2015年發(fā)生突變的術(shù)語達(dá)到8個(gè),包含行為識別、先進(jìn)方法、先進(jìn)算法等,其中部分術(shù)語的突變一直持續(xù)到2018年。
(2)卡耐基梅隆大學(xué)近三年來的突變術(shù)語包括計(jì)算機(jī)視覺、訓(xùn)練數(shù)據(jù)、面部識別、機(jī)器學(xué)習(xí)等,表明近期的研究熱點(diǎn)多集中于圖像處理和機(jī)器學(xué)習(xí)領(lǐng)域。此外,卡耐基梅隆大學(xué)在視覺及圖像方面的研究多用于無人機(jī)對場景的探測以及圖像內(nèi)容的分析等方面。
以上對中國科學(xué)院和卡耐基梅隆大學(xué)進(jìn)行研究前沿的對比分析可知,中國科學(xué)院和卡耐基梅隆大學(xué)在研究領(lǐng)域上各有側(cè)重又有所交叉,從突變術(shù)語發(fā)生突變的時(shí)間來看,兩所機(jī)構(gòu)研究熱點(diǎn)的步調(diào)基本一致,均處于世界人工智能領(lǐng)域研究的領(lǐng)先地位;從領(lǐng)域研究的側(cè)重點(diǎn)來看,中國科學(xué)院致力于算法模型等方面的研究,在應(yīng)用方面的研究略少于理論研究,卡耐基梅隆大學(xué)集中于智能應(yīng)用方面的研究,以應(yīng)用為導(dǎo)向;兩所機(jī)構(gòu)的相同之處在于近年來的研究均涉及機(jī)器學(xué)習(xí)、圖像處理等領(lǐng)域,側(cè)面反映出全球人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。
作者是科學(xué)研究的主導(dǎo)者,一方面基于學(xué)識、經(jīng)歷與洞察力等探求著科學(xué)技術(shù)發(fā)展的趨向,進(jìn)而產(chǎn)生可能引導(dǎo)學(xué)科領(lǐng)域發(fā)展的研究成果;另一方面受到正在興起的研究領(lǐng)域或者方向的影響,追隨著已有的研究而創(chuàng)造新的產(chǎn)出。[15]本部分從作者層面出發(fā),利用CiteSpace軟件對清洗后的數(shù)據(jù)進(jìn)行作者發(fā)文量的統(tǒng)計(jì),分別得到中美兩國人工智能領(lǐng)域發(fā)文量排在前二十位的高產(chǎn)作者,如表6所示。
表6 中美兩國人工智能領(lǐng)域高產(chǎn)作者
由表6可知,發(fā)文量在100篇以上的中國作者有11位,徐澤水發(fā)文量達(dá)到202篇,位居中國作者發(fā)文量首位;美國作者RONALD R YAGER發(fā)文量為92篇,為美國高產(chǎn)作者之最,發(fā)文量在50篇以上的美國作者有8位,30篇以上的作者有15位。論文中某些術(shù)語頻次的突然增加體現(xiàn)了作者的研究方向發(fā)生了轉(zhuǎn)變[16],為此分別對中美兩國發(fā)文量排在前十位的作者進(jìn)行突變術(shù)語檢測,結(jié)果如表7和表8所示。
表7 中國高產(chǎn)作者及其突變術(shù)語
檢測結(jié)果顯示,中國排名前十位的作者在近年來的研究中均出現(xiàn)了突變術(shù)語,其突變詞涵蓋了人工智能領(lǐng)域的基本術(shù)語和方法理論,其中突變次數(shù)較多的術(shù)語為圖像分類、圖像分割、訓(xùn)練樣本、先進(jìn)方法、神經(jīng)網(wǎng)絡(luò)等。從突變術(shù)語發(fā)生的時(shí)間來看,人工智能領(lǐng)域的發(fā)展呈現(xiàn)出從理論算法向?qū)嵺`應(yīng)用轉(zhuǎn)化的趨勢。以圖像處理技術(shù)和自適應(yīng)動態(tài)規(guī)劃等為特點(diǎn)的機(jī)器人領(lǐng)域受到越來越多的關(guān)注,同時(shí)以神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)領(lǐng)域始終處于中國學(xué)者研究的熱門地位。
對美國排名前十位的作者進(jìn)行術(shù)語的突現(xiàn)檢測后發(fā)現(xiàn),僅有RONALD R YAGER、QI TIAN和HAIBO HE三位作者產(chǎn)生了突變術(shù)語,其余7位作者未能檢測到突變詞。由于本部分致力于從作者角度出發(fā)探索中美兩國人工智能領(lǐng)域的研究熱點(diǎn),因此對于未能檢測到突變術(shù)語的作者,選取其文獻(xiàn)中的高頻術(shù)語進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)結(jié)果如表8所示。
表8 美國高產(chǎn)作者及其突變/高頻術(shù)語
從單個(gè)作者的角度來看,這些突變術(shù)語是其研究興趣或研究方向轉(zhuǎn)變的體現(xiàn),而從領(lǐng)域整體來看,這些研究前沿代表著領(lǐng)域內(nèi)的研究熱點(diǎn)和研究趨勢。[13]因此,由表8可知,美國作者出現(xiàn)的高頻詞匯包括特征選擇、神經(jīng)網(wǎng)絡(luò)、具體數(shù)據(jù)集等,反映出美國人工智能發(fā)展在進(jìn)行理論研究的同時(shí)注重應(yīng)用領(lǐng)域的研究。其突變/高頻詞匯集中在圖像處理、機(jī)器學(xué)習(xí)領(lǐng)域,同時(shí)在控制系統(tǒng)的研究方面有所涉獵,體現(xiàn)出美國在學(xué)科交叉以及智能應(yīng)用方面的發(fā)展趨勢。
本文分別從總體發(fā)文量、高產(chǎn)機(jī)構(gòu)、高產(chǎn)作者角度分析了中美兩國在人工智能領(lǐng)域近九年來的研究前沿。從發(fā)文量角度來看,中國的發(fā)文總量近乎美國發(fā)文量的兩倍,位居世界第一位。從整體發(fā)展情況來看,中國在人工智能領(lǐng)域的研究起步略晚于美國,且早期注重理論研究,2012年前后轉(zhuǎn)向應(yīng)用領(lǐng)域,隨后保持高速發(fā)展;美國在人工智能領(lǐng)域的研究呈現(xiàn)出前沿?cái)?shù)量多、覆蓋面廣的特點(diǎn),近年來發(fā)展平穩(wěn),始終位于世界領(lǐng)先地位。
從高產(chǎn)機(jī)構(gòu)角度出發(fā),通過對突變術(shù)語的檢測,解讀近年來中國科學(xué)院和卡耐基梅隆大學(xué)在人工智能領(lǐng)域研究前沿的變化趨勢。結(jié)果表明兩所機(jī)構(gòu)在研究重心方面各有側(cè)重又有所交叉,中國科學(xué)院致力于算法模型等方面的研究,而卡耐基梅隆大學(xué)以應(yīng)用為導(dǎo)向,側(cè)重于智能應(yīng)用方面的研究。
從高產(chǎn)作者角度出發(fā),分別對中美兩國排名前十位的作者進(jìn)行突變術(shù)語的檢測,檢測結(jié)果表明,兩國作者在領(lǐng)域前沿研究的步調(diào)基本保持一致,近年來致力于深度學(xué)習(xí)、圖像處理領(lǐng)域的挖掘和探索;同時(shí)注重跨學(xué)科融合發(fā)展,在智能機(jī)器人、調(diào)度控制系統(tǒng)等方面呈現(xiàn)出發(fā)展的新趨勢。
此外,本文存在一定的局限性,主要包括對高產(chǎn)機(jī)構(gòu)、高產(chǎn)作者層面進(jìn)行突現(xiàn)檢測的數(shù)據(jù)量偏少,對軟件相關(guān)參數(shù)沒有充分調(diào)優(yōu),未能呈現(xiàn)全面準(zhǔn)確的突變術(shù)語;其次,僅從機(jī)構(gòu)、作者發(fā)文的數(shù)量角度對比分析兩國研究前沿,未能考慮到文獻(xiàn)的引用情況;另外,由于突現(xiàn)檢測算法中,越是詞頻較小的詞越容易產(chǎn)生突變,而真正重要的高頻詞因?yàn)楸容^平穩(wěn),反而不太容易產(chǎn)生突變,因此突現(xiàn)檢測算法錯(cuò)過了對于高頻詞和熱點(diǎn)詞的分析,這也是算法本身存在的一個(gè)弊端。在后續(xù)研究中將獲取更多的數(shù)據(jù)量,充分考慮文獻(xiàn)的發(fā)文量和引用情況,以增強(qiáng)結(jié)論的可靠性和說服力。
山東科技大學(xué)學(xué)報(bào)(社會科學(xué)版)2019年6期