張君冬,嵇紅濤,徐孟輝,盧 成
(南京中醫(yī)藥大學(xué),江蘇 南京 210023)
基于2008—2017年CNKI我國深度學(xué)習(xí)現(xiàn)狀圖譜研究
張君冬,嵇紅濤,徐孟輝,盧 成
(南京中醫(yī)藥大學(xué),江蘇 南京 210023)
文章以2008—2017年CNKI我國深度學(xué)習(xí)來源期刊發(fā)文及引用數(shù)據(jù)為數(shù)據(jù)來源,繪制并分析了深度學(xué)習(xí)作者合作共現(xiàn)圖譜,機構(gòu)合作共現(xiàn)圖譜,關(guān)鍵詞共現(xiàn)圖譜及關(guān)鍵詞共現(xiàn)圖譜Time Zone視圖,Time Line視圖。通過相關(guān)知識圖譜的構(gòu)建,文章可視化地呈現(xiàn)了我國深度學(xué)習(xí)近10年來的科研脈絡(luò)、重要影響力的學(xué)者及科學(xué)合作情況。
知識圖譜;深度學(xué)習(xí);CNKI;圖譜分析;共現(xiàn)分析
新世紀初,隨著計算機技術(shù)的發(fā)展和信息可視化技術(shù)的應(yīng)用,科學(xué)知識圖譜得到迅猛發(fā)展,根據(jù)相關(guān)資料調(diào)查,知識圖譜技術(shù)源于引文分析理論、復(fù)雜網(wǎng)絡(luò)系統(tǒng)、社會網(wǎng)絡(luò)分析以及信息可視化技術(shù)。我們可以把它通俗地理解為由知識點相互連接的語義網(wǎng)絡(luò)。任何一個知識圖譜都是由不同的節(jié)點和連線組成,節(jié)點的大小和緊密程度都直接影響了該學(xué)科的科研狀況,而連線的粗細代表著學(xué)科與學(xué)科間、作者與作者間的關(guān)聯(lián)程度,而通過繪制這種科學(xué)知識圖譜,我們可以把復(fù)雜的科學(xué)知識領(lǐng)域,通過可視化的方法直觀明確地顯示出來,便于我們分析該領(lǐng)域?qū)W科的繁榮程度及未來走向趨勢。機器學(xué)習(xí)是人工智能領(lǐng)域的一個重要學(xué)科。如果說淺層學(xué)習(xí)是機器學(xué)習(xí)的一次浪潮,那么深度學(xué)習(xí)作為機器學(xué)習(xí)的一個新領(lǐng)域,將掀起機器學(xué)習(xí)的又一次浪潮。深度學(xué)習(xí)通過建立、模擬人腦的分層結(jié)構(gòu)來實現(xiàn)對外部輸入的數(shù)據(jù)進行從低級到高級的特征提取從而能夠解釋外部數(shù)據(jù)[1]。其應(yīng)用領(lǐng)域非常廣泛,包括語音識別、機器翻譯、計算機視覺等多個領(lǐng)域。從對實際應(yīng)用的貢獻來說,深度學(xué)習(xí)領(lǐng)域可能是機器學(xué)習(xí)領(lǐng)域最近這10年來最成功的研究方向[2]。本研究將通過繪制作者合作共現(xiàn)圖譜、期刊機構(gòu)合作共現(xiàn)圖譜、期刊關(guān)鍵詞共現(xiàn)圖譜、期刊關(guān)鍵詞共現(xiàn)Time Line視圖,通過可視化技術(shù)來展現(xiàn)2008—2017年間我國深度學(xué)習(xí)領(lǐng)域研究發(fā)展脈絡(luò),數(shù)據(jù)來源為CNKI收錄深度學(xué)習(xí)來源期刊發(fā)文及引用信息。
本節(jié)通過作者共現(xiàn)圖譜來展現(xiàn)出我國這10年內(nèi)深度學(xué)習(xí)學(xué)者之間的研究合作情況,為了具體揭示深度學(xué)習(xí)這一領(lǐng)域的研究特征。2008—2017這10年來發(fā)表文章5篇及以上的學(xué)者一共有18位,按發(fā)文量降序排列,具體情況如表1所示。
表1 2008—2017年CNKI深度學(xué)習(xí)來源期刊高產(chǎn)學(xué)者
如表1所示,我們可以分析得出張雄偉、祝智庭、王志軍3名學(xué)者近10年來在深度學(xué)習(xí)領(lǐng)域發(fā)文量較多,其中張雄偉發(fā)文量達9篇,另外兩名作者也達到7篇。下面本文將通過作者共現(xiàn)圖譜來探究學(xué)者間的科研合作情況,以一年為一個時間切片,經(jīng)過參數(shù)調(diào)整自動聚類后可視化圖譜如圖1所示。
如圖1所示,圖中每個節(jié)點代表一個作者,節(jié)點的大小代表作者發(fā)文量的多少,如張雄偉教授和祝智庭教授,節(jié)點的連線代表作者間的合作關(guān)系,連接線的粗細代表著作者之間合作的強度。網(wǎng)絡(luò)中的連線較少,這表明深度學(xué)習(xí)領(lǐng)域合作網(wǎng)絡(luò)的整體關(guān)系很分散,圖中的連接線偏細,可以看出學(xué)者之間的聯(lián)系強度較弱。通過進一步觀察可知網(wǎng)絡(luò)中仍存在一些小團體如禹龍教授與高雙印教授、史新宇教授,張雄偉教授與吳海佳教授,王志軍教授與陳麗教授就合作密切,而一些學(xué)者如王娟教授、陳玲教授等發(fā)文量則較為稀少。
如圖2所示,陜西師范大學(xué)教育學(xué)院、解放軍理工大學(xué)指揮信息系統(tǒng)學(xué)院這兩個機構(gòu)發(fā)表文獻量較多,但各地學(xué)院圖上各個機構(gòu)連線較少表明各個機構(gòu)之間的聯(lián)系十分松散,都是采取自己獨立研究的方式,很少有機構(gòu)與其他機構(gòu)合作密切。
圖1 2008—2017年CNKI作者合作共現(xiàn)圖譜
圖2 2008—2017年CNKI深度學(xué)習(xí)機構(gòu)合作共現(xiàn)圖譜
通過繪制2008—2017年我國深度學(xué)習(xí)領(lǐng)域整體的關(guān)鍵詞共現(xiàn)圖譜,將這10年的學(xué)科研究成果以一張共現(xiàn)圖譜的方式直觀地呈現(xiàn)出來,進而揭示國內(nèi)深度學(xué)習(xí)領(lǐng)域研究的知識結(jié)構(gòu)及其演進。以一年為一個時間切片,參數(shù)調(diào)整后可視化圖譜如圖3所示。
按照中介中心度的大小來控制節(jié)點標簽的顯示數(shù)量,節(jié)點大小與其代表的關(guān)鍵詞的被引頻次大小成正比,圓環(huán)的顏色代表年代信息,隨著年代的遞進顏色由淺入深,節(jié)點從里到外不同顏色圓環(huán)的厚度與對應(yīng)年份的出現(xiàn)頻次成正比,節(jié)點間連線的顏色代表其共現(xiàn)的年份信息(見圖3)。
如圖3,表2所示,深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、特征提取、神經(jīng)網(wǎng)絡(luò)是這10年來深度學(xué)習(xí)研究領(lǐng)域?qū)W者使用較多的關(guān)鍵詞,其中深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)的頻次最多,中介中心度也領(lǐng)先于其他學(xué)科。為了更直觀地反映這一領(lǐng)域隨著時間的推演深度學(xué)習(xí)這一領(lǐng)域的文獻走勢狀況,特繪制關(guān)鍵詞Time Zone視圖(見圖4),該視圖是由一系列標識時區(qū)的顏色相間的柱形區(qū)域構(gòu)成,這些時區(qū)按照時間順序從左向右排列,節(jié)點的位置代表其出現(xiàn)的年份信息,不同階段節(jié)點數(shù)量的多少反映當前時間段深度學(xué)習(xí)學(xué)科研究領(lǐng)域的繁榮程度。
圖3 2008—2017年CNKI深度學(xué)習(xí)期刊關(guān)鍵詞共現(xiàn)圖譜
表2 2008—2017年CNKI深度學(xué)習(xí)來源期刊熱點關(guān)鍵詞
如圖4所示,深度學(xué)習(xí)從2008年開始便是國內(nèi)外學(xué)者研究的熱門領(lǐng)域,深度學(xué)習(xí)不僅包括深層學(xué)習(xí)、還包括學(xué)習(xí)科學(xué)、學(xué)習(xí)策略、學(xué)習(xí)動機、自主學(xué)習(xí)、淺層學(xué)習(xí)等多方面領(lǐng)域,目前這幾個發(fā)展領(lǐng)域發(fā)展迅猛,且到了2016年將專注于深度神經(jīng)網(wǎng)絡(luò)和深度置信網(wǎng)絡(luò)的傳播特點和影響力這一領(lǐng)域。
為了更清楚地反映國內(nèi)深度學(xué)習(xí)這一領(lǐng)域隨著時間的推演進程繪制了如圖5所示的Time Line視圖,節(jié)點標簽是由中介中心度的大小來控制的,節(jié)點的位置表示所代表引文的發(fā)文時間,可以讓同一聚類的節(jié)點按照時間順序被排布在同一水平線上,所以每個聚類的節(jié)點按照時間順序被排布在同一水平線上,每個聚類中的文獻就像串在一條時間線上,展示出該聚類的歷史成果。如圖5所示,我國目前的深度學(xué)習(xí)的研究領(lǐng)域主要分布在神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、機器學(xué)習(xí)、教學(xué)模式。
本文以知識圖譜作為研究方法,研究數(shù)據(jù)來源于CNKI數(shù)據(jù)庫,通過可視化技術(shù)繪制深度學(xué)習(xí)作者合作共現(xiàn)圖譜,機構(gòu)合作共現(xiàn)圖譜,關(guān)鍵詞共現(xiàn)圖譜及關(guān)鍵詞現(xiàn)圖譜Time Zone視圖,Time Line視圖,Cluster View視圖等角度對我國深度學(xué)習(xí)學(xué)科研發(fā)展進行了可視化分析,相關(guān)結(jié)論如下:2008—2017年間,張雄偉、祝智庭和王志軍是這5年來發(fā)文量最多的兩位學(xué)者;學(xué)者之間的聯(lián)系較為分散且團體合作的整體關(guān)系很不理想;深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、特征提取、神經(jīng)網(wǎng)絡(luò)是這5年來深度學(xué)習(xí)研究領(lǐng)域?qū)W者使用較多的關(guān)鍵詞,其中深度學(xué)習(xí)出現(xiàn)的頻次最高;我國目前的深度學(xué)習(xí)的研究領(lǐng)域主要分布在神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、機器學(xué)習(xí)、教學(xué)模式,且這幾個領(lǐng)域在未來幾年里也將會得到長遠發(fā)展。
圖4 2008—2017年CNKI深度學(xué)習(xí)來源期刊關(guān)鍵詞共現(xiàn)圖譜Time Zone視圖
圖5 2010-2015年CNKI深度學(xué)習(xí)來源期刊關(guān)鍵詞共現(xiàn)圖譜Time Line視圖
[1]劉建偉,劉媛,羅雄麟.深度學(xué)習(xí)研究進展[J].計算機應(yīng)用研究,2014(7):1921-1930,1942.
[2]余凱,賈磊,陳雨強,等.深度學(xué)習(xí)的昨天、今天和明天[J].計算機研究與發(fā)展,2013(9):1799-1804.
Research on the current situation of deep learning based on 2008-2017 CNKI in China
Zhang Jundong, Ji Hongtao, Xu Menghui, Lu Cheng
(Nanjing University of Chinese Medicine, Nanjing 210023, China)
This paper draws and analyzes the co-occurrence map of the cooperation on authors with deep learning, the co-occurrence map of the cooperation on enterprise, the co-occurrence of the key words and its Map Time Zone view and Time Line view. Through the construction of relevant knowledge map, this paper visualizes the scientific research context of deep learning nearly 10 years, the scholars with important influence and scientific cooperation in China.
knowledge map; deep learning; CNKI; map analysis; co-occurrence analysis
張君冬(1996— ),男,江蘇南通人,本科生;研究方向:情報學(xué)領(lǐng)域。