梁立鋒,曾紫云,鄒玉如,劉秀娟
(嶺南師范學(xué)院 物理科學(xué)與技術(shù)學(xué)院,廣東 湛江 524048)
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的子領(lǐng)域[1],是一種對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法[2],還是一個(gè)含有多層網(wǎng)絡(luò)的模型,其學(xué)習(xí)過程是由低到高逐層映射到新的特征空間,具有層次化和分布式抽象的特點(diǎn),這樣可以擬合復(fù)雜的非線性函數(shù),方便處理更高維度的非線性輸入數(shù)據(jù)[3]。自2006年深度學(xué)習(xí)被提出后,這一課題開始受到學(xué)術(shù)界的廣泛關(guān)注[4],十幾年間在深度學(xué)習(xí)應(yīng)用方面不斷發(fā)展創(chuàng)新,特別是近幾年,深度學(xué)習(xí)取得驚人的進(jìn)展[5-6],我國(guó)必須加強(qiáng)研發(fā)以及推廣深度學(xué)習(xí)的應(yīng)用,以解決更多復(fù)雜的模式識(shí)別難題。
本研究對(duì)涉及深度學(xué)習(xí)領(lǐng)域方面的文獻(xiàn)在中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)(簡(jiǎn)稱CNKI)上進(jìn)行檢索和分析,探究深度學(xué)習(xí)領(lǐng)域CNKI論文的發(fā)文特點(diǎn),如年度發(fā)文數(shù)量、論文基金來源、重點(diǎn)發(fā)文機(jī)構(gòu)、主要期刊、研究熱點(diǎn)等,為我國(guó)科研人員提供在該領(lǐng)域的科研活動(dòng)、研究布局、管理等有用信息[7]。
以CNKI為研究分析的文獻(xiàn)數(shù)據(jù)來源,在高級(jí)檢索條件下[8],以“深度學(xué)習(xí)”為檢索詞,“摘要”為檢索范圍進(jìn)行檢索[9],剔除重復(fù)及無關(guān)的文獻(xiàn)。
在檢索條件中利用“不含”選項(xiàng)排除無關(guān)文獻(xiàn),其特點(diǎn)是:根據(jù)“有關(guān)文獻(xiàn)”的主要特征——主題詞、分類號(hào)等,縮小檢索范圍。
本文通過人工閱讀在文獻(xiàn)分類目錄中去除無關(guān)的文獻(xiàn)類別,結(jié)合閱讀文獻(xiàn)標(biāo)題及摘要,剔除以教育學(xué)類、課堂為主題以及新聞快訊、通知等的無關(guān)文獻(xiàn)。剔除文獻(xiàn)時(shí)通過閱讀文獻(xiàn)的標(biāo)題以及摘要,可以判斷是否為有效文獻(xiàn)[10],經(jīng)排除無關(guān)文獻(xiàn),最后得到共7 891篇有效文獻(xiàn)。
文獻(xiàn)計(jì)量是一種基于數(shù)理統(tǒng)計(jì)的定量分析方法,它用科學(xué)文獻(xiàn)的外在特征作為研究對(duì)象探討相關(guān)研究的特征和規(guī)律,是一種成熟的文獻(xiàn)分析和信息挖掘方法[11],有助于研究人員掌握某一科研領(lǐng)域的變化趨勢(shì)[12]。
本文對(duì)文獻(xiàn)的發(fā)表年度、基金資助狀況、文獻(xiàn)類別、主要機(jī)構(gòu)、主要研究作者等信息利用CNKI的計(jì)量可視化分析以及人工計(jì)量的方式進(jìn)行統(tǒng)計(jì)[13],將數(shù)據(jù)導(dǎo)入Excel,利用Excel軟件的統(tǒng)計(jì)功能進(jìn)行統(tǒng)計(jì)分析,并得到分析結(jié)果[14]。
根據(jù)統(tǒng)計(jì),關(guān)于深度學(xué)習(xí)的文獻(xiàn)發(fā)文量近十年年際分布如圖1所示。根據(jù)圖1可以看出,2008-2013年有關(guān)深度學(xué)習(xí)的文獻(xiàn)數(shù)量非常少,總量不足100篇。從2014年開始,其增長(zhǎng)速率不斷增大,發(fā)表文獻(xiàn)的數(shù)量呈逐年遞增趨勢(shì),并且在過去幾年里有兩個(gè)明顯的增長(zhǎng)點(diǎn),分別是2017年和2018年,到2018年已經(jīng)高達(dá)4 322篇。
圖1 深度學(xué)習(xí)主題文獻(xiàn)年度發(fā)文量分布圖
通過統(tǒng)計(jì)得到基金資助的文獻(xiàn),獲得表1數(shù)據(jù)(見下頁(yè)),表1表示的是對(duì)有關(guān)深度學(xué)習(xí)的文獻(xiàn)基金資助前13類基金及獲得資助的總文獻(xiàn)篇數(shù)。國(guó)內(nèi)的基金資助項(xiàng)目都是根據(jù)國(guó)家和地區(qū)的發(fā)展情況制定,科研基金資助能體現(xiàn)科研探索的先進(jìn)性和獨(dú)特性[15]。根據(jù)表1可知,前13類基金占總基金資助超過85%,其中國(guó)家自然科學(xué)基金、國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃和國(guó)家高技術(shù)研究發(fā)展計(jì)劃基金支持為前三的基金支持,總占比約為70%;然后是北京、江蘇、浙江、廣東等我國(guó)東南部城市的自然科學(xué)基金,這些地方的基金支持約占20%。這說明國(guó)家對(duì)于深度學(xué)習(xí)這一領(lǐng)域的發(fā)展是非常重視的,但省級(jí)之間基金資助情況地域差別大,資助較多的省份主要分布在東部沿海一帶,說明深度學(xué)習(xí)研究還需要大量的政策支持以及推廣。
表1 文獻(xiàn)所屬基金資助情況
高產(chǎn)機(jī)構(gòu)是某一學(xué)科或研究領(lǐng)域?qū)W術(shù)成果的主要生產(chǎn)者,具有較大的學(xué)術(shù)影響力[16]。將得到的數(shù)據(jù)對(duì)文獻(xiàn)發(fā)表機(jī)構(gòu)進(jìn)行整理排序,對(duì)文獻(xiàn)發(fā)表較多的機(jī)構(gòu)進(jìn)行分析,結(jié)果如表3所示,主要發(fā)文機(jī)構(gòu)有哈爾濱工業(yè)大學(xué)、西安電子科技大學(xué)、北京郵電大學(xué)以及電子科技大學(xué)、清華大學(xué)等,共占所有機(jī)構(gòu)的73.8%。
表2 文獻(xiàn)所屬機(jī)構(gòu)情況
以“深度學(xué)習(xí)”為摘要,排除無關(guān)文獻(xiàn)后對(duì)所有文獻(xiàn)進(jìn)行分析,由于文獻(xiàn)涉及的學(xué)科范圍較廣,選取前8的學(xué)科進(jìn)行統(tǒng)計(jì)并分析如表3。
從表3中可發(fā)現(xiàn)有很大部分的研究是關(guān)于計(jì)算機(jī)和控制工程類的,其中計(jì)算機(jī)這一類別就有3 810篇,控制工程有2 766篇,兩者總占比約83%,信息通信、交通運(yùn)輸、臨床醫(yī)學(xué)、交通運(yùn)輸、電氣工程、通用技術(shù)、航空宇航約占14%,其他學(xué)科類別總占約3%。這反映出在深度學(xué)習(xí)領(lǐng)域的研究熱門學(xué)科是計(jì)算機(jī)和控制工程,說明其他領(lǐng)域在深度學(xué)習(xí)方面的應(yīng)用還有很大的潛力[17]及提升空間[18],因此在這些學(xué)科類別中需要適當(dāng)加大對(duì)深度學(xué)習(xí)的研究和應(yīng)用。
表3 文獻(xiàn)所屬學(xué)科類別分析
對(duì)有關(guān)深度學(xué)習(xí)文獻(xiàn)的發(fā)表作者進(jìn)行整理分析,如表4所示,其中發(fā)表量超過10篇的只有3人,最高者發(fā)表了13篇,并且發(fā)文量最高的幾個(gè)作者均屬于新疆大學(xué),他們之間合作的文章數(shù)量較多,田生偉和禹龍兩人合作的文獻(xiàn)數(shù)高達(dá)12篇,而根據(jù)統(tǒng)計(jì)的數(shù)據(jù)來看,發(fā)現(xiàn)相同機(jī)構(gòu)的作者合作相對(duì)較多,而不同機(jī)構(gòu)的作者之間合作較少[19]。發(fā)表2篇論文以上的大多數(shù)作者都是以非第一作者的身份發(fā)表論文,第一作者的發(fā)文總量較少,文獻(xiàn)被引用總數(shù)較少,且研究者所在的機(jī)構(gòu)比較分散、分布地區(qū)與基金資助較高區(qū)存在明顯的差別,缺乏核心作者群[20]。
表4 文獻(xiàn)主要作者情況
在CNKI中對(duì)7 891篇關(guān)于深度學(xué)習(xí)的摘要的文獻(xiàn)進(jìn)行分析,得到表5資源類型分布。根據(jù)表5可知,碩士論文文獻(xiàn)篇數(shù)最高,占比59.4%,然后是期刊34.2%,相關(guān)的博士論文有385篇,國(guó)內(nèi)會(huì)議、國(guó)際會(huì)議及學(xué)術(shù)輯刊的文獻(xiàn)數(shù)目則較少,共123篇。博碩士的文獻(xiàn)總篇數(shù)約占64.3%,這反映關(guān)于深度學(xué)習(xí)研究的作者科學(xué)水平較高、文獻(xiàn)的研究質(zhì)量較高。
表5 文獻(xiàn)資源類型分析
文獻(xiàn)來源中,博碩士的論文主要由哈爾濱大學(xué)、清華大學(xué)等大學(xué)機(jī)構(gòu)發(fā)表。深度學(xué)習(xí)文獻(xiàn)發(fā)布的主要期刊如表6所示。根據(jù)表6顯示,主要發(fā)文期刊主要是計(jì)算機(jī)科學(xué)、計(jì)算機(jī)工程與應(yīng)用、計(jì)算機(jī)應(yīng)用等。發(fā)表文獻(xiàn)篇數(shù)較多的還有自動(dòng)化學(xué)報(bào)、中國(guó)圖像圖形學(xué)報(bào)、農(nóng)業(yè)工程學(xué)報(bào)等核心期刊,這些期刊的影響因子較高。
表6 文獻(xiàn)分布主要期刊
關(guān)鍵詞凝聚著文獻(xiàn)的主題,而高頻的關(guān)鍵詞可以體現(xiàn)出該方面研究的熱點(diǎn)方向[10]。對(duì)搜索的文獻(xiàn)進(jìn)行整理,除去“深度學(xué)習(xí)”,對(duì)總數(shù)前9的關(guān)鍵詞進(jìn)行分析得到表7。根據(jù)表7數(shù)據(jù)可知,出現(xiàn)頻率最高的是“卷積神經(jīng)網(wǎng)絡(luò)”,其頻次高達(dá)2 099次。
表7 文獻(xiàn)關(guān)鍵詞頻次分析
通過利用CNKI對(duì)深度學(xué)習(xí)方面的文獻(xiàn)進(jìn)行檢索、統(tǒng)計(jì)、分析,取得結(jié)論如下:
1)數(shù)據(jù)統(tǒng)計(jì)結(jié)果表明:在2008-2010年,關(guān)于深度學(xué)習(xí)的研究較少,說明這方面的研究還處于冷門階段;2015年開始,關(guān)于深度學(xué)習(xí)的文獻(xiàn)數(shù)量快速上升,且每一年的增長(zhǎng)速率都明顯提高,研究方向主要是計(jì)算機(jī)方面,同時(shí)還應(yīng)用在信息科技、電子設(shè)備、控制工程等方面。
2)深度學(xué)習(xí)研究機(jī)構(gòu)主要分布于經(jīng)濟(jì)發(fā)達(dá)的東南部城市,這或許跟我國(guó)的區(qū)域經(jīng)濟(jì)發(fā)展程度高低有關(guān),經(jīng)濟(jì)發(fā)展程度在一定程度上能夠反映科技發(fā)展水平,這與深度學(xué)習(xí)在科技快速發(fā)展的產(chǎn)生背景相對(duì)應(yīng)。
3)研究作者主要是田生偉、胡清華、程學(xué)旗、唐杰等人,在這些作者中基本都是以非第一作者的身份參與研究,說明深度學(xué)習(xí)方面的研究還處于發(fā)展階段,未出現(xiàn)領(lǐng)軍人物。同一機(jī)構(gòu)作者之間的合作程度相當(dāng)高,但與其他機(jī)構(gòu)作者合作并不緊密。