陶于祥 汪書悅 袁野
摘 要:分別以“人工智能”“AI”為關(guān)鍵詞,對中國知網(wǎng)CSSCI數(shù)據(jù)庫和Web of Science SCI拓展期刊數(shù)據(jù)庫進(jìn)行檢索,遴選出2008—2018年1 786、8 515篇文獻(xiàn)作為研究樣本,采用詞頻分析、聚類分析、時(shí)間演化分析等科學(xué)計(jì)量方法,借助CiteSpace可視化軟件,綜合梳理國內(nèi)外人工智能領(lǐng)域研究的熱點(diǎn)、發(fā)展脈絡(luò)和演進(jìn)歷程。通過可視化圖譜展示以及國外和國內(nèi)對比分析,指出國內(nèi)外發(fā)展差異,提出未來我國人工智能領(lǐng)域發(fā)展的相關(guān)建議。研究發(fā)現(xiàn),國外主要圍繞遺傳算法、模糊粒子群優(yōu)化算法等算法層面展開,而國內(nèi)純算法的研究較少;國外多將人工智能應(yīng)用在金融和醫(yī)療中,國內(nèi)則主要體現(xiàn)在教育、圖書館建設(shè)以及出版業(yè)中。未來研究應(yīng)強(qiáng)調(diào)多學(xué)科整合,持續(xù)完善算法,加速人工智能應(yīng)用落地并構(gòu)建多層治理體系。
關(guān)鍵詞:人工智能;CiteSpace;知識圖譜;比較分析
基金項(xiàng)目:重慶市社會(huì)科學(xué)規(guī)劃項(xiàng)目“全球價(jià)值鏈背景下重慶市人工智能產(chǎn)業(yè)重點(diǎn)發(fā)展領(lǐng)域與政策設(shè)計(jì)”(2019YBJJ041);重慶市社會(huì)科學(xué)規(guī)劃重點(diǎn)智庫項(xiàng)目“中美貿(mào)易摩擦背景下重慶市大數(shù)據(jù)智能化產(chǎn)業(yè)發(fā)展應(yīng)對策略研究”(2018ZDZK10)。
[中圖分類號] F49 [文章編號] 1673-0186(2019)011-0089-012
[文獻(xiàn)標(biāo)識碼] A ? ? [DOI編碼] 10.19631/j.cnki.css.2019.011.009
2019年5月,習(xí)近平總書記在國際人工智能與教育大會(huì)的賀信中指出人工智能是引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力。人工智能領(lǐng)域的研究和發(fā)展至關(guān)重要,近年來學(xué)術(shù)界圍繞人工智能涌現(xiàn)出諸多研究成果。從研究視角來看,呂文晶運(yùn)用文獻(xiàn)計(jì)量法對我國人工智能研究文獻(xiàn)的時(shí)間分布、作者分布、主題分布和學(xué)科分布進(jìn)行分析,并指出人工智能發(fā)展與創(chuàng)新交叉研究具有極大潛力[1];胡玉寧等運(yùn)用TDA軟件,利用文獻(xiàn)統(tǒng)計(jì)分析、關(guān)鍵詞共現(xiàn)分析的方法揭示國際人工智能研究熱點(diǎn)[2];李悅等對世界人工智能領(lǐng)域相關(guān)研究進(jìn)行統(tǒng)計(jì)分析,總結(jié)出人工智能領(lǐng)域的熱點(diǎn)并預(yù)測未來發(fā)展方向[3];從研究主題來看,邱均平等對中外自然語言處理的發(fā)展進(jìn)行對比分析[4];劉勇等則對人工智能在我國教育領(lǐng)域應(yīng)用進(jìn)行了可視化分析[5]。
目前我國人工智能相關(guān)研究整體處于何種階段?表現(xiàn)出何種特點(diǎn)、何種演化方式與趨勢?我國人工智能的研究和國外研究究竟有何異同?如何通過國內(nèi)外研究對比分析為我國人工智能發(fā)展提出建議?現(xiàn)有研究主要從國內(nèi)或者國際視角出發(fā)對人工智能相關(guān)研究進(jìn)行梳理,未對比分析國內(nèi)外研究存在的相同點(diǎn)及差異;聚焦于人工智能某一子領(lǐng)域,未從整體、全局視角對人工智能結(jié)構(gòu)、熱點(diǎn)等方面進(jìn)行系統(tǒng)深入的研究;研究方法較為單一,未結(jié)合多種科學(xué)計(jì)量方法對文獻(xiàn)大數(shù)據(jù)進(jìn)行深入挖掘。但已有研究都為人工智能的發(fā)展奠定了一定基礎(chǔ)。
基于此,本文篩選中國知網(wǎng)和Web of Science數(shù)據(jù)庫中的數(shù)據(jù),采用詞頻分析法、聚類分析法、時(shí)間演化分析法等科學(xué)計(jì)量方法,借助可視化軟件,從整體學(xué)科視角出發(fā)綜合梳理分析國內(nèi)外人工智能領(lǐng)域研究的熱點(diǎn)、發(fā)展脈絡(luò)、演進(jìn)歷程,并通過國外、國內(nèi)對比分析展示國內(nèi)外研究熱點(diǎn)、未來研究趨勢的異同,以期為我國人工智能研究提供建議和參考。
一、研究設(shè)計(jì)
本文研究設(shè)計(jì)主要包括四個(gè)部分:研究工具及方法、數(shù)據(jù)來源、數(shù)據(jù)處理和總體特征。
(一)研究工具及方法
CiteSpace軟件由美國德雷賽爾大學(xué)陳超美教授基于Java開發(fā),主要用于科學(xué)文獻(xiàn)數(shù)據(jù)計(jì)量分析、識別和顯示科學(xué)發(fā)展新趨勢和新動(dòng)態(tài)[6]。本文利用CiteSpace軟件提取人工智能研究領(lǐng)域關(guān)鍵詞、繪制學(xué)科共現(xiàn)圖譜、突現(xiàn)詞圖譜以及時(shí)間線圖。
詞頻分析法。本文使用詞頻分析法提取人工智能文獻(xiàn)信息中的關(guān)鍵詞,通過關(guān)鍵詞的高低分布,來研究該領(lǐng)域發(fā)展動(dòng)向和研究熱點(diǎn)。
聚類分析法。聚類分析是一組將研究對象分為相對同質(zhì)群組的統(tǒng)計(jì)分析技術(shù)。同一個(gè)聚類中的對象有很大的相似性,而不同聚類間的對象有很大的相異性。本文選擇CiteSpace中的LLR(潛語義索引算法)算法進(jìn)行聚類。
時(shí)間演化分析法。時(shí)間線視圖側(cè)重于勾畫聚類之間的關(guān)系和某個(gè)聚類中文獻(xiàn)的歷史跨度,能清晰反映某一特定聚類研究的興起、繁榮及衰落過程,利用CiteSpace繪制人工智能研究時(shí)間線視圖(timeline view),可用于分析人工智能領(lǐng)域的研究熱點(diǎn)和趨勢[7]。
(二)數(shù)據(jù)來源
分別使用中國知網(wǎng)和Web of Science進(jìn)行文獻(xiàn)檢索。在中國知網(wǎng)進(jìn)行文獻(xiàn)檢索時(shí),選擇高級檢索功能,檢索式為“主題=人工智能,時(shí)間=2008—2018年,精準(zhǔn)匹配,文獻(xiàn)類型=期刊,期刊來源=CSSCI”,檢索出文獻(xiàn)2 237篇,經(jīng)過手動(dòng)篩選,剔除會(huì)議紀(jì)要、編輯寄語、人物訪談等冗余信息,最終得到文獻(xiàn)1 786篇作為研究樣本;在Web of Science進(jìn)行文獻(xiàn)檢索時(shí),以檢索式“(TS=(Artificial Intelligence))AND語種:(English)AND文獻(xiàn)類型:(Article)”索引=SCI-EXPANDED,時(shí)間跨度=2008—2018進(jìn)行檢索,最終得到文獻(xiàn)8 515篇作為研究樣本。
(三)數(shù)據(jù)處理
中國知網(wǎng):由于中國知網(wǎng)單次最多導(dǎo)出500篇文獻(xiàn),故將所選擇的1 786篇文獻(xiàn)分4次以Refworks格式導(dǎo)出,導(dǎo)出的內(nèi)容包括:文獻(xiàn)的標(biāo)題、摘要、關(guān)鍵詞、作者等關(guān)鍵信息,以download_XX為文件名保存文檔。且中國知網(wǎng)下載的數(shù)據(jù)不能直接使用CiteSpace進(jìn)行分析,故利用CiteSpace轉(zhuǎn)換功能對數(shù)據(jù)格式進(jìn)行轉(zhuǎn)換。
Web of Science:單次最多導(dǎo)出500篇文獻(xiàn),故將所選擇的8 515篇文獻(xiàn)分18次以純文本格式導(dǎo)出,導(dǎo)出內(nèi)容選擇“全記錄并包含所引用的參考文獻(xiàn)”,以download_XX為文件名保存文檔。
數(shù)據(jù)處理是可視化分析中十分重要的一環(huán),本研究在數(shù)據(jù)處理時(shí)邀請國內(nèi)人工智能領(lǐng)域?qū)<覍iteSpace提取的關(guān)鍵詞進(jìn)行處理,包括無效關(guān)鍵詞剔除、相似關(guān)鍵詞合并。
(四)總體特征
發(fā)文總量。根據(jù)人工智能領(lǐng)域相關(guān)文獻(xiàn)的年度總發(fā)文量分布統(tǒng)計(jì)圖(圖1),可形成對人工智能研究領(lǐng)域的初步認(rèn)知。
2008—2018年間,人工智能研究領(lǐng)域相關(guān)文獻(xiàn)量逐年增加,呈穩(wěn)步上升趨勢;從發(fā)文量增長率來看,各年發(fā)文量增長率均大于零,發(fā)文量持續(xù)增長,年均增長率為20.94%,且不同年份間波動(dòng)較大。特別是2016年恰逢“人工智能60周年”,人工智能研究領(lǐng)域發(fā)文量激增,增長率高達(dá)22.78%。2016年以來,人工智能研究領(lǐng)域文獻(xiàn)規(guī)模和影響力均極大提升,此后兩年人工智能領(lǐng)域受關(guān)注程度保持高增長態(tài)勢,發(fā)文量持續(xù)高增長,到2018年發(fā)文增長率為74.31%,達(dá)到階段性頂峰,人工智能研究步入繁榮時(shí)代。
學(xué)科分布。使用Excel繪制國內(nèi)人工智能研究領(lǐng)域?qū)W科分布圖(圖2),從相關(guān)研究的學(xué)科分類來看,目前國內(nèi)相關(guān)研究主要集中于信息科技和社會(huì)科技領(lǐng)域,哲學(xué)與人文科學(xué)、經(jīng)濟(jì)與管理科學(xué)、基礎(chǔ)科學(xué)、工程科技等領(lǐng)域均有涉及,目前國內(nèi)人工智能研究涵蓋領(lǐng)域較為單一。
學(xué)科共現(xiàn)。將Web of Science數(shù)據(jù)導(dǎo)入CiteSpace并建立相應(yīng)數(shù)據(jù)工程,選取2008—2018年且以一年為時(shí)間切片,選取節(jié)點(diǎn)類型(Node Type)為學(xué)科(Category),繪制領(lǐng)域?qū)W科共現(xiàn)圖譜(圖3)。國際上人工智能研究主要涉及COMPUTER SCIENCE(計(jì)算機(jī)科學(xué))與ENGINEERING(工程學(xué))相關(guān)學(xué)科,也時(shí)常涉及OPERATIONS RESEARCH & MANAGEMENT SCIENCE(運(yùn)籌學(xué)與管理科學(xué))、ENERGY & FUELS(能源與燃料)、MATHEMATICS(數(shù)學(xué))、MATERIALS SCIENCE(材料科學(xué))、NVIRONMENTAL SCIENCES & ECOLOGY(環(huán)境科學(xué)與生態(tài)學(xué))及AUTOMATION & CONTROL SYSTEMS(自動(dòng)化—控制系統(tǒng))等學(xué)科。其中計(jì)算機(jī)科學(xué)下的分支學(xué)科——交叉應(yīng)用、信息系統(tǒng)、理論與方法、軟件工程在人工智能領(lǐng)域中聯(lián)系較為緊密;工程學(xué)下的分支學(xué)科——土木工程、電子電氣工程運(yùn)用在人工智能領(lǐng)域中聯(lián)系密切?;谝陨戏治?,可以看出人工智能研究是一個(gè)多學(xué)科交叉性學(xué)術(shù)研究領(lǐng)域,它包含了計(jì)算機(jī)學(xué)、數(shù)學(xué)、基礎(chǔ)科學(xué)、管理學(xué)和經(jīng)濟(jì)學(xué)等諸多學(xué)科的特點(diǎn),借用多學(xué)科的交叉理論來研究人工智能問題已成為主要趨勢,同時(shí)也符合該研究領(lǐng)域進(jìn)一步發(fā)展的需要。
二、國內(nèi)人工智能研究熱點(diǎn)及前沿探析
研究熱點(diǎn)是指某個(gè)領(lǐng)域中學(xué)者共同關(guān)注的一個(gè)或者多個(gè)話題,可結(jié)合研究主題的詞頻分析[6],研究前沿是指正在興起的理論趨勢和新主題的涌現(xiàn),在利用CiteSpace分析時(shí),可從文獻(xiàn)題目、摘要等部分提取的突發(fā)性術(shù)語來進(jìn)行解讀。
(一)研究熱點(diǎn)主題
將CNKI來源數(shù)據(jù)導(dǎo)入CiteSpace中進(jìn)行詞頻統(tǒng)計(jì),生成關(guān)鍵詞列表,為排除無效關(guān)鍵詞的干擾,邀請國內(nèi)人工智能領(lǐng)域?qū)<覍W(xué)者對提取的關(guān)鍵詞進(jìn)行處理,包括無效關(guān)鍵詞剔除、相似關(guān)鍵詞合并。剔除“新時(shí)代”“發(fā)展”“科幻”“作者”等無效關(guān)鍵詞;將“教育信息化”“智慧教育”“智能教育”“教育人工智能”合并為“教育信息化”;“智能圖書館”和“智慧圖書館”合并為“智慧圖書館”。最終整理出關(guān)鍵詞詞頻表,本文僅列出部分關(guān)鍵詞(表1),基于高頻關(guān)鍵詞及相關(guān)文獻(xiàn)對國內(nèi)人工智能研究熱點(diǎn)進(jìn)行剖析。
國內(nèi)人工智能研究高頻關(guān)鍵詞匯總表結(jié)果表明:在人工智能研究領(lǐng)域,“大數(shù)據(jù)”“機(jī)器人”“語義網(wǎng)絡(luò)”“教育信息化”“深度學(xué)習(xí)”“機(jī)器學(xué)習(xí)”等得到較多關(guān)注;其次是“智能機(jī)器人”“圖書館”“算法”“虛擬現(xiàn)實(shí)”“信息技術(shù)”“互聯(lián)網(wǎng)”等。研究熱點(diǎn)內(nèi)容可以整理歸納為兩個(gè)方面:其一,人工智能理論領(lǐng)域,國內(nèi)研究關(guān)注大數(shù)據(jù)、語義網(wǎng)絡(luò)、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、算法、信息技術(shù)、互聯(lián)網(wǎng)和區(qū)塊鏈;其二,人工智能應(yīng)用領(lǐng)域,國內(nèi)關(guān)于人工智能的應(yīng)用體現(xiàn)在智慧教育、智慧圖書館、新媒體、法律和出版業(yè)。
(二)研究前沿與路徑
將CNKI數(shù)據(jù)導(dǎo)入CiteSpace并建立相應(yīng)數(shù)據(jù)工程,選取2008—2018年且以一年為時(shí)間切片,選取節(jié)點(diǎn)類型(Node Type)為關(guān)鍵詞(Keyword),但生成的網(wǎng)絡(luò)圖較為密集,網(wǎng)絡(luò)裁剪功能可以通過對保留重要的連線來提高網(wǎng)絡(luò)可讀性[6],本文選取最小生成樹法(MST)對網(wǎng)絡(luò)進(jìn)行裁剪,得到原始關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),繪制我國人工智能研究領(lǐng)域的時(shí)間線圖,并使用Excel將時(shí)間線圖轉(zhuǎn)換為表2。
在時(shí)間線視圖中,相同聚類的文獻(xiàn)被放置在同一水平線上,聚類中文獻(xiàn)越多代表所聚類的領(lǐng)域越重要[6]。圖形右側(cè)的聚類標(biāo)簽顯示為9類,包括學(xué)習(xí)、語義網(wǎng)絡(luò)、法律、教育信息化2.0、出版業(yè)、區(qū)塊鏈、深度學(xué)習(xí)、媒體融合、虛擬現(xiàn)實(shí)和自我意識,盡管聚類之間存在相互交叉,表明聚類并不完全準(zhǔn)確,但也在一定程度上幫助解讀我國人工智能研究熱點(diǎn)與前沿。研究時(shí)長方面,法律、教育信息化2.0及出版業(yè)等研究主題持續(xù)時(shí)間最長,長達(dá)十年;學(xué)習(xí)、語義網(wǎng)絡(luò)、區(qū)塊鏈、媒體融合及自我意識等研究主題持續(xù)時(shí)長次之;虛擬現(xiàn)實(shí)研究時(shí)長僅持續(xù)2017年一年,而深度學(xué)習(xí)則從2016年開始引起國內(nèi)學(xué)界關(guān)注,至今已持續(xù)兩年,未來將會(huì)被持續(xù)關(guān)注。研究內(nèi)容方面,國內(nèi)人工智能研究可大致分為理論領(lǐng)域和應(yīng)用領(lǐng)域。在人工智能理論領(lǐng)域方面,國內(nèi)研究主要關(guān)注語義網(wǎng)絡(luò)、自然語言處理、知識工程、神經(jīng)網(wǎng)絡(luò)、語言模型、圖靈測試等人工智能子領(lǐng)域;在人工智能應(yīng)用領(lǐng)域方面,國內(nèi)研究聚焦于教育和出版業(yè)領(lǐng)域,教育領(lǐng)域相關(guān)研究包含教育信息化、機(jī)器人教育、線上學(xué)習(xí)等,出版業(yè)領(lǐng)域研究包含智能出版流程再造以及新聞出版業(yè)智能機(jī)器人運(yùn)用等。
三、國際人工智能研究熱點(diǎn)及前沿探析
通過剖析高頻關(guān)鍵詞識別國際人工智能研究熱點(diǎn),根據(jù)關(guān)鍵詞突現(xiàn)圖譜分4個(gè)時(shí)間段闡釋國際人工智能研究前沿。
(一)研究熱點(diǎn)主題
關(guān)鍵詞(Key words)是指能反映論著的主題和中心內(nèi)容的名詞術(shù)語或詞組,當(dāng)某一關(guān)鍵詞在同一領(lǐng)域文獻(xiàn)出現(xiàn)頻率較高,該詞就能反映這一領(lǐng)域的研究熱點(diǎn)與研究動(dòng)向。利用CiteSpace軟件, 通過對Web of Science來源數(shù)據(jù)進(jìn)行關(guān)鍵詞詞頻統(tǒng)計(jì),生成關(guān)鍵詞列表,并邀請人工智能領(lǐng)域?qū)<覍W(xué)者對提取的關(guān)鍵詞進(jìn)行處理,包括無效關(guān)鍵詞剔除、相似關(guān)鍵詞合并。如將“artificial intelligence (ai)”“artificial intelligence”合并為“artificial intelligence”;將“recognition”“pattern recognition”合并為“pattern recognition”;將“ANN”“artificial neural network”合并為“artificial neural network”;將“modeling”“model”合并為“model”等,最終整理出關(guān)鍵詞頻次表,本文僅列出排名前35位的關(guān)鍵詞(表3)。
國際人工智能研究文獻(xiàn)中出現(xiàn)頻率最高的前十位關(guān)鍵詞有:artificial intelligence(人工智能),neural network(神經(jīng)網(wǎng)絡(luò)),system(系統(tǒng)),artificial neural network(人工神經(jīng)網(wǎng)絡(luò)),model(模型),algorithm(算法),prediction(預(yù)測),optimization(優(yōu)化),genetic algorithm(遺傳算法),classification(分類)。其中國際人工智能研究熱點(diǎn)領(lǐng)域包括人工神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、模糊智能、數(shù)據(jù)挖掘、深度學(xué)習(xí),特別是深度學(xué)習(xí)提出后,人工神經(jīng)網(wǎng)絡(luò)重新成為最強(qiáng)大的機(jī)器學(xué)習(xí)算法之一,也成為人工智能研究領(lǐng)域的熱點(diǎn)話題,值得學(xué)界高度關(guān)注;人工智能研究的熱門算法包括粒子群優(yōu)化算法、遺傳算法、人工蜂群;人工智能研究的熱點(diǎn)方法及應(yīng)用包括預(yù)測、優(yōu)化、建模、分類、設(shè)計(jì)、模擬、鑒定、識別、管理、搜索、診斷等。
(二)研究前沿與路徑
將Web of Science數(shù)據(jù)導(dǎo)入CiteSpace并建立相應(yīng)數(shù)據(jù)工程,選取2008—2018年且以一年為時(shí)間切片,選取節(jié)點(diǎn)類型(Node Type)為關(guān)鍵詞(Keyword),閾值設(shè)置為Top30,使用突現(xiàn)詞探測(Citation Burst)算法,抽取突現(xiàn)強(qiáng)度排名前16位的關(guān)鍵詞,得出人工智能領(lǐng)域的突現(xiàn)詞圖譜(圖4)。在CiteSpace中某聚類包含的突發(fā)節(jié)點(diǎn)越多,該領(lǐng)域越活躍,能代表該領(lǐng)域的新興趨勢。
2008—2009開始出現(xiàn)的突現(xiàn)詞為data mining(數(shù)據(jù)挖掘)、knowledge(知識)、expert system(專家系統(tǒng))、decision support system (決策支持系統(tǒng))和case-based reasoning(案例推論)。米歇爾·妮可(Michelle Nicole)等利用數(shù)據(jù)挖掘等相關(guān)技術(shù)對憂郁患者進(jìn)行情感預(yù)測,識別患者相關(guān)心理狀態(tài)[8]。關(guān)于專家系統(tǒng)的研究,有學(xué)者在自動(dòng)船舶導(dǎo)航系統(tǒng)、可再生MG(微電網(wǎng))系統(tǒng)、實(shí)際金融應(yīng)用系統(tǒng)中通過對專家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)以及混合系統(tǒng)的性能、效率進(jìn)行對比來展開研究[9-10]。在對決策支持系統(tǒng)的研究中,有學(xué)者將其運(yùn)用在金融風(fēng)險(xiǎn)管理的信用風(fēng)險(xiǎn)分析以及醫(yī)學(xué)等臨床決策、不確定性推理等領(lǐng)域[11-12],其中賢哲安(Ahn)將案例推論運(yùn)用在企業(yè)破產(chǎn)模型的研究中,并嘗試建立更高效的預(yù)測模型[13]。
2009—2011年開始出現(xiàn)的突現(xiàn)詞包括logic(邏輯)和management(管理)。該時(shí)期,人工智能的邏輯和管理成了研究熱點(diǎn),如塔博(Tabor)構(gòu)建了一種基于遺傳編碼的邊緣檢測算法,其模型的遺傳邏輯有助于更復(fù)雜的生物行為的工程設(shè)計(jì)[14],安德烈·雷蒙托夫(Lermontov, Andre)通過基于模糊邏輯的模糊水質(zhì)指數(shù)(FWQI)創(chuàng)建新的水質(zhì)指標(biāo),并將水質(zhì)指數(shù)用作環(huán)境管理決策的替代工具[15]。
2011—2013年開始出現(xiàn)的突現(xiàn)詞有search(搜索)、geneticalgorithm(遺傳算法)、selection(選擇)、swarm intelligence(集群智能)和diagnosis(診斷)。這一時(shí)期,對于搜索、遺傳算法、選擇、集群智能、診斷的研究成為熱點(diǎn),值得注意的是關(guān)于搜索和選擇的熱點(diǎn)持續(xù)時(shí)間分別為六年和五年,研究持續(xù)時(shí)間較長。其中奧雷斯基(Oreski)提出了一種先進(jìn)的新型啟發(fā)式算法——神經(jīng)網(wǎng)絡(luò)混合遺傳算法(HGA-NN),勇于識別最優(yōu)特征子集,提高信用風(fēng)險(xiǎn)評估的分類精度和可擴(kuò)展性[16]。阿凱(Akay)通過研究群體智能中蜂群算法的修改版本,有效地解決了實(shí)際參數(shù)優(yōu)化問題[17]。賈峰(Jia)通過使用深度神經(jīng)網(wǎng)絡(luò)從測量信號中自適應(yīng)地挖掘出可用的故障特征,對旋轉(zhuǎn)機(jī)械進(jìn)行智能診斷,這種方法提高了現(xiàn)有的診斷精度[18]。
2013年后開始出現(xiàn)的突現(xiàn)詞有:timeseries(時(shí)間序列)、framework(框架)、differential evolution(差分進(jìn)化)和artificial bee colony(人工蜂群算法)。這一時(shí)期學(xué)者重點(diǎn)關(guān)注了時(shí)間序列、框架、差分進(jìn)化和人工蜂群算法的研究。蘇阿里(Soualhi)通過運(yùn)用數(shù)據(jù)驅(qū)動(dòng)和基于經(jīng)驗(yàn)的滾子軸承PHM方法對軸承進(jìn)行故障檢測,提高了原有方法的檢測精度,該方法常運(yùn)用于軍事、航空、航天、核能等領(lǐng)域中[19]。在差分進(jìn)化和人工蜂群的研究中,王暉(Wang)對傳統(tǒng)人工蜂群算法進(jìn)行優(yōu)化研究,其結(jié)果優(yōu)于或相等于其他成熟進(jìn)化算法[20];張?。╖hang)在研究中引入人工蜂群(ABC)算法用于簇幾何的全局優(yōu)化而該方法可能成為化學(xué)家研究集群的有用工具[21]。
四、國內(nèi)外對比分析
通過分析包含高頻和高突現(xiàn)性關(guān)鍵詞的文獻(xiàn),將國內(nèi)外研究熱點(diǎn)按理論領(lǐng)域和應(yīng)用領(lǐng)域兩個(gè)層面進(jìn)行整理總結(jié),如表4所示。
(一)理論領(lǐng)域的對比
在理論研究方面,國內(nèi)外研究側(cè)重點(diǎn)不同,機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)是國內(nèi)外共同關(guān)注的話題。國外側(cè)重算法研究,不僅包含粒子群算法、遺傳算法、蟻群算法等主流算法,同時(shí)不斷改進(jìn)和優(yōu)化算法。目前我國研究中關(guān)于純算法研究卻較少,涉及算法種類不多,且忽視在實(shí)際運(yùn)用中對算法進(jìn)行優(yōu)化。同時(shí),深度學(xué)習(xí)算法概念首次提出是在2006年,而國內(nèi)關(guān)于深度學(xué)習(xí)的研究集中在最近兩年,起步晚于國外。
國內(nèi)理論領(lǐng)域研究熱點(diǎn)主要集中在大數(shù)據(jù)、語義網(wǎng)絡(luò)、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、算法、信息技術(shù)、互聯(lián)網(wǎng)、神經(jīng)網(wǎng)絡(luò)和區(qū)塊鏈等方面。賽迪顧問指出,深度學(xué)習(xí)算法突破、互聯(lián)網(wǎng)時(shí)代海量數(shù)據(jù)的爆發(fā)、計(jì)算能力提升以及計(jì)算成本不斷下降三大因素助推人工智能重獲新生[22]?;诖耍Z義網(wǎng)絡(luò)、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)也一直是國內(nèi)外研究關(guān)注的熱點(diǎn)話題。黨的十九大報(bào)告提出:“推動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實(shí)體經(jīng)濟(jì)深度融合?!痹谖覈鎸?shí)施國家大數(shù)據(jù)戰(zhàn)略、建設(shè)數(shù)字中國的大背景下,我國人工智能領(lǐng)域研究熱點(diǎn)還集中在大數(shù)據(jù)、信息技術(shù)、互聯(lián)網(wǎng)、區(qū)塊鏈等主題上,這對我國發(fā)展十分必要。同時(shí),我國擁有全球最多的互聯(lián)網(wǎng)用戶、最活躍的數(shù)據(jù)生產(chǎn)主體,在數(shù)據(jù)總量上具有一定優(yōu)勢,為大數(shù)據(jù)研究提供了良好的條件。
國際人工智能理論領(lǐng)域出現(xiàn)了artificial neural network(人工神經(jīng)網(wǎng)絡(luò))、model(模型)、algorithm(算法)、prediction(預(yù)測)、genetic algorithm(遺傳算法)、classification(分類)、support vector machine(支持向量機(jī))、performance(性能)、machine learning(機(jī)器學(xué)習(xí))、particle swarm optimization(粒子群優(yōu)化算法)、fuzzy logic(模糊邏輯)、swarm intelligence(群體智能)等關(guān)鍵詞,國外人工智能理論領(lǐng)域的研究趨勢也著重于對人工智能技術(shù)的革新,其中“人工神經(jīng)網(wǎng)絡(luò)”“群體智能”“遺傳算法”為當(dāng)前國外人工智能理論研究領(lǐng)域的熱點(diǎn)主題。
(二)應(yīng)用領(lǐng)域的對比
由于人工智能所處的發(fā)展階段不同,國內(nèi)與國際上關(guān)于人工智能應(yīng)用領(lǐng)域有較大差異。從國內(nèi)的研究成果來看,以人工智能在教育業(yè)、出版業(yè)、圖書館建設(shè)的應(yīng)用現(xiàn)狀、發(fā)展趨勢為主要研究內(nèi)容;國際上則將人工智能在金融風(fēng)險(xiǎn)管理的信用風(fēng)險(xiǎn)分析以及醫(yī)學(xué)等臨床決策、不確定性推理等領(lǐng)域的運(yùn)用為主要研究對象,同時(shí)注重在實(shí)際應(yīng)用系統(tǒng)中對系統(tǒng)的性能、效率進(jìn)行研究。
國內(nèi)應(yīng)用領(lǐng)域的研究多關(guān)注教育信息化、智能機(jī)器人、智慧圖書館、媒體融合、法律、出版業(yè)等主題。教育是社會(huì)發(fā)展的基石,我國一直以來十分重視教育,將人工智能與教育結(jié)合將大大提升教育質(zhì)量,同時(shí)智慧圖書館也成了熱門話題,例如研究人工智能分支在圖書館信息檢索、編目、分類、選書、采購、訂閱、流通、參考咨詢等方面的應(yīng)用[23]。但現(xiàn)有研究中對人工智能在金融以及環(huán)境治理等方面涉及較少,這與我國所處的發(fā)展階段有關(guān),目前我國正處在經(jīng)濟(jì)高速發(fā)展向高質(zhì)量發(fā)展的轉(zhuǎn)型階段,隨著經(jīng)濟(jì)發(fā)展進(jìn)程不斷推進(jìn),人工智能在金融領(lǐng)域的運(yùn)用也將成為我國人工智能未來發(fā)展的方向。同時(shí),潘云鶴院士指出中國人工智能發(fā)展的重點(diǎn)方向包含跨媒體融合、智能城市、智能制造、智能社區(qū)、智能經(jīng)濟(jì)、數(shù)字圖書館等。
在國際人工智能應(yīng)用領(lǐng)域,導(dǎo)航系統(tǒng)、實(shí)際金融應(yīng)用系統(tǒng)、醫(yī)學(xué)臨床決策、環(huán)境監(jiān)測、機(jī)器故障檢測成為應(yīng)用熱點(diǎn)。這符合國外發(fā)展現(xiàn)狀,國外發(fā)達(dá)國家經(jīng)濟(jì)高速發(fā)展,但經(jīng)濟(jì)快速發(fā)展的同時(shí)也帶來一系列環(huán)境問題,導(dǎo)致國外研究關(guān)注點(diǎn)一方面聚焦于利用人工智能與金融應(yīng)用系統(tǒng)的結(jié)合檢測、預(yù)測企業(yè)財(cái)務(wù)狀況,另一方面則落在環(huán)境治理上。例如將人工智能與環(huán)境監(jiān)測結(jié)合,通過計(jì)算模型預(yù)防水質(zhì)、氣質(zhì)災(zāi)害,為大氣、水污染治理提供科學(xué)依據(jù)。國外也十分注重保障國家安全,例如將人工智能與導(dǎo)航系統(tǒng)結(jié)合,能有效減輕相關(guān)航海和觀通站的負(fù)擔(dān),提供決策輔助,其中基于知識的航行專家系統(tǒng)能為未來航海提供更高的容錯(cuò)率、智能化程度[24]。同時(shí),國外醫(yī)療發(fā)展相對較為成熟,將人工智能與醫(yī)學(xué)臨床決策結(jié)合可以實(shí)現(xiàn)臨床觀察與臨床知識無縫連接,并能夠提升臨床決策效率與品質(zhì),改善臨床結(jié)果。
五、結(jié)論與建議
本文使用科學(xué)計(jì)量方法對2008—2018年中國知網(wǎng)CSSCI數(shù)據(jù)庫和Web of Science SCI拓展期刊數(shù)據(jù)庫中與人工智能相關(guān)的文獻(xiàn)進(jìn)行梳理,總結(jié)出幾點(diǎn)結(jié)論和建議,以期為人工智能相關(guān)領(lǐng)域研究提供新思路。
(一)研究結(jié)論
使用科學(xué)計(jì)量方法,借助CiteSpace軟件,對中國知網(wǎng)和Web of Science數(shù)據(jù)庫中2008—2018年有關(guān)人工智能的文獻(xiàn)數(shù)據(jù)進(jìn)行分析解讀以及可視化圖譜展示,構(gòu)建了時(shí)間分布圖譜、研究領(lǐng)域?qū)W科分布圖、突現(xiàn)圖譜、演進(jìn)圖譜,分析得出以下結(jié)論。
時(shí)間分布圖譜表明:人工智能研究領(lǐng)域相關(guān)文獻(xiàn)量呈穩(wěn)步增長趨勢,特別是2016年以來人工智能研究文獻(xiàn)規(guī)模和影響力均極大提升,受關(guān)注度近年來呈持續(xù)高增長態(tài)勢。
研究領(lǐng)域?qū)W科分布圖表明:人工智能研究是一個(gè)多學(xué)科交叉性學(xué)術(shù)研究領(lǐng)域,它包含了計(jì)算機(jī)學(xué)、數(shù)學(xué)、基礎(chǔ)科學(xué)、管理學(xué)和經(jīng)濟(jì)學(xué)等諸多學(xué)科的特點(diǎn),借用多學(xué)科的交叉理論來研究人工智能問題已成為主要趨勢。
突現(xiàn)圖譜表明:國際上的研究聚焦于人工智能理論領(lǐng)域和應(yīng)用領(lǐng)域,理論領(lǐng)域關(guān)注不同算法研究及系統(tǒng)優(yōu)化,而將人工智能運(yùn)用在金融和醫(yī)療領(lǐng)域是應(yīng)用領(lǐng)域的熱點(diǎn)。
時(shí)間線圖譜表明:國內(nèi)關(guān)于人工智能在教育、出版業(yè)應(yīng)用是持續(xù)時(shí)間最長的熱點(diǎn),而對于深度學(xué)習(xí)相關(guān)研究近兩年才出現(xiàn),深度學(xué)習(xí)研究對人工智能發(fā)展具有極其深遠(yuǎn)的影響,是未來研究中極具潛力的方向,同時(shí)智能金融也具有不容小覷的發(fā)展前景。
(二)研究建議
我國人工智能發(fā)展近年來呈快速追趕的態(tài)勢,且在特定領(lǐng)域開始顯現(xiàn)出競爭實(shí)力,部分指標(biāo)與美國站在同一起跑線上,盡管如此我國與國外仍存在較大差異,因此本文從以下幾個(gè)方面提出建議。
第一,多學(xué)科交叉融合,重視基礎(chǔ)科學(xué)。人工智能突破性發(fā)展不僅限于邏輯思維,還需考慮形象思維、靈感思維等,需借助多學(xué)科交叉理論,尤其重視基礎(chǔ)科學(xué)研究。
第二,持續(xù)完善算法,不斷提升計(jì)算能力。加快發(fā)展新一代人工智能是我國贏得全球科技競爭主動(dòng)權(quán)的重要戰(zhàn)略抓手,算法和計(jì)算力是人工智能發(fā)展的強(qiáng)大驅(qū)動(dòng)力,未來國內(nèi)應(yīng)加快推進(jìn)算法等關(guān)鍵領(lǐng)域的基礎(chǔ)研究,力求技術(shù)突破并不斷提升計(jì)算能力,力爭全球科技競爭主動(dòng)權(quán)。
第三,加快推動(dòng)人工智能的應(yīng)用場景落地。國內(nèi)研究大多將人工智能運(yùn)用于教育、出版業(yè)等領(lǐng)域,而運(yùn)用人工智能進(jìn)行金融行業(yè)風(fēng)險(xiǎn)分析等較少。人工智能已由弱人工智能時(shí)代進(jìn)入強(qiáng)人工智能時(shí)代,未來研究應(yīng)深入把握人工智能發(fā)展的特點(diǎn),加強(qiáng)人工智能與產(chǎn)業(yè)發(fā)展融合,特別是加強(qiáng)人工智能在醫(yī)療衛(wèi)生、體育、住房、交通、助殘養(yǎng)老、家政服務(wù)等領(lǐng)域的深度應(yīng)用,推動(dòng)人工智能深度運(yùn)用,為我國高質(zhì)量發(fā)展提供新動(dòng)力。
第四,構(gòu)筑人工智能多層治理體系。近年來隨著數(shù)據(jù)量上漲、計(jì)算機(jī)運(yùn)算力的提升以及深度學(xué)習(xí)算法的出現(xiàn),人工智能得到快速發(fā)展,國內(nèi)外研究大多關(guān)注深度學(xué)習(xí)、自然語言處理、知識工程、遺傳算法等算法層,并將人工智能與教育、出版業(yè)、患者情感預(yù)測以及金融決策支持等融合,卻較少關(guān)注人工智能治理,一定程度上忽視了人工智能潛在的負(fù)面影響。未來應(yīng)關(guān)注人工智能發(fā)展中引發(fā)的社會(huì)問題,如社會(huì)勞動(dòng)力替代等問題,充分預(yù)估人工智能的負(fù)面影響和沖擊,構(gòu)筑人工智能多層治理體系,驅(qū)動(dòng)新一代人工智能不斷健康發(fā)展。
參考文獻(xiàn)
[1] ?呂文晶,徐麗,劉進(jìn),等.中國人工智能研究的十年回顧——基于2008—2017年間文獻(xiàn)計(jì)量和知識圖譜分析[J].技術(shù)經(jīng)濟(jì),2018(10):73-78+116.
[2] ?胡玉寧,丁明,曹高芳.新世紀(jì)國際人工智能研究領(lǐng)域可視化分析[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2013(10):8-13.
[3] ?李悅,蘇成,賈佳,等.基于科學(xué)計(jì)量的世界人工智能領(lǐng)域發(fā)展?fàn)顩r分析[J].計(jì)算機(jī)科學(xué),2017(12):183-187.
[4] ?邱均平,方國平.基于知識圖譜的中外自然語言處理研究的對比分析[J].現(xiàn)代圖書情報(bào)技術(shù),2014(12):51-61.
[5] ?劉勇,生曉婷,李青.人工智能在我國教育領(lǐng)域應(yīng)用的可視化分析[J].現(xiàn)代教育技術(shù),2018(10):27-34.
[6] ?李杰,陳超美.CiteSpace:科技文本挖掘及可視化第二版[M].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2017:88-89.
[7] ?陳悅,陳超美,劉則淵,等.CiteSpace知識圖譜的方法論功能[J].科學(xué)學(xué)研究,2015(02):242-253.
[8] ?Burns M N ,Begale M , Duffecy J , et al. Harnessing Context Sensing to Develop a Mobile Intervention for Depression[J]. Journal of Medical Internet Research,2011,13(3):e55.
[9] ?Thomas S , Gareth H , Mcdonald M K. Autonomous Ship Collision Avoidance Navigation Concepts,Technologies and Techniques[J]. The journal of Navigation,2008,61(1):129-142.
[10] ?Bahrammirzaee A. A comparative survey of artificial intelligence applications in finance: artificial neural networks, expert system and hybrid intelligent systems[J]. Neural Computing & Applications, 2010,19(8):1165-1195.
[11] ?Yu L , Wang S , Lai K K . An intelligent-agent-based fuzzy group decision making model for financial multicriteria decision support:The case of credit scoring[J]. European Journal of Operational Research,2009,195(3):942-959.
[12] ?Patel V L ,Shortliffe E H , Stefanelli M , et al. The coming of age of artificial intelligence in medicine[J]. Artificial Intelligence in Medicine,2009,46(1):5-17D.
[13] ?HyunchulAhn,Kyoung-jae Kim.Bankruptcy prediction modeling with hybrid case-based reasoning and genetic algorithms approach[J]. Applied Soft Computing,2009,9(12):599-607.
[14] ?Jeffrey J. Tabor,Howard M. Salis,Zachary Booth Simpson, et al A Synthetic Genetic Edge Detection Program[J]. Cell,2009,137(7): 1272-1281.
[15] ?André Lermontov, Lídia Yokoyama, Lermontov M , et al. River quality analysis using fuzzy water quality index: Ribeira do Iguape river watershed, Brazil[J]. Ecological Indicators,2009,9(6):1188-1197.
[16] ?OreskiS ,Oreski G . Genetic algorithm-based heuristic for feature selection in credit risk assessment[J]. Expert Systems with Applications,2013,41(4):2052-2064.
[17] ?AkayB ,Karaboga D . A modified Artificial Bee Colony algorithm for real-parameter optimization[J]. Information Sciences, 2012, 192(1):120-142.
[18] ?Jia F , Lei Y , Lin J , et al. Deep neural networks: A promising tool for fault characteristic mining and intelligent diagnosis of rotating machinery with massive data[J]. Mechanical Systems and Signal Processing,2016,72-73:303-315.
[19] ?SoualhiA ,Razik H , Clerc G , et al. Prognosis of Bearing Failures Using Hidden Markov Models and the Adaptive Neuro-Fuzzy Inference System[J]. IEEE Transactions on Industrial Electronics,2014,61(6):2864-2874.
[20] ?Wang H , Wu Z , Rahnamayan S , et al. ?Multi-strategy ensemble artificial bee colony algorithm[J]. Information Sciences,2014,279:587-603.
[21] ?Zhang J,Dolg M. ABCluster:the artificial bee colony algorithm for cluster global optimization[J]. Physical Chemistry Chemical Physics,2015,17(37):24173-24181.
[22] ?賽迪顧問.中美人工智能市場的概況與對比[J].電子產(chǎn)品世界,2017(7):20-23.
[23] ?傅平,鄒小筑,吳丹,等.回顧與展望:人工智能在圖書館的應(yīng)用[J].圖書情報(bào)知識,2018(2):50-60.
[24] ?周永余,陳永冰,李文魁.21世紀(jì)初艦船組合導(dǎo)航系統(tǒng)的發(fā)展趨勢[J].海軍工程大學(xué)學(xué)報(bào),2002(6):46-51.
Abstract:Using the scientific measurement methods such as word frequency analysis, cluster analysis, time evolution analysis, and CiteSpace visualization software, the keywords "Artificial Intelligence" and "AI" were used to select 2008-2018 China Knowledge Network CSSCI Journal and Web of Science SCI Development Journal. The literature data comprehensively combs the hotspots, development context and evolution of international and domestic artificial intelligence research. Through visual map display and foreign and domestic comparative analysis, it points out the development differences at home and abroad, and puts forward relevant suggestions for the development of artificial intelligence in China in the future. The study found that foreign countries mainly focus on genetic algorithms, neural networks, fuzzy particle swarm optimization algorithms and other algorithms, while domestic pure algorithms are less studied; Artificial intelligence is mostly used in finance and medical treatment abroad, while in China it is mainly embodied in education, library construction and publishing industry. Future research should emphasize multi-disciplinary integration, continue to improve the algorithm, accelerate the application of artificial intelligence and build a multi-level governance system.
Key Words: Artificial intelligence; CiteSpace; Knowledge mapping; Comparative analysis
(責(zé)任編輯:易曉艷)