陳文娟
(河南財經(jīng)政法大學圖書館,河南 鄭州 450002)
基于CiteSpace的人工智能研究可視化分析
陳文娟
(河南財經(jīng)政法大學圖書館,河南 鄭州 450002)
本報告借助于CiteSpace引文分析軟件對“人工智能”這一主題的相關文章從共引文獻、共引著者、共引期刊等多個角度進行可視化分析,根據(jù)圖譜分析人工智能相關的研究現(xiàn)狀及前沿。
人工智能;CiteSpace;引文分析;可視化
人工智能也稱機器智能,它是計算機科學、控制論、信息論、神經(jīng)生理學、心理學、語言學等多種學科互相滲透而發(fā)展起來的一門綜合性學科。從計算機應用系統(tǒng)角度來看,人工智能是研究如何制造出智能機器或智能系統(tǒng),實現(xiàn)模擬人類智能活動的能力,以延伸人們智能的科學[1]。
近年來,隨著互聯(lián)網(wǎng)和通訊技術的迅猛發(fā)展,人工智能逐漸滲透到了社會生活的各個方面,極大地改變這社會面貌,也給人們的思想和行為帶來了深刻的變革[2]。本文對近十年來有關人工智能的文獻進行可視化分析,清晰地揭示人工智能研究的發(fā)展演變態(tài)勢。
相比傳統(tǒng)的統(tǒng)計分析方法,引文分析法對于揭示某一學科研究領域的動態(tài)結構和發(fā)展規(guī)律,衡量著者、成果的影響力具有更大的價值。本文以Web of Knowledge為來源數(shù)據(jù)庫,借助于CiteSpace專業(yè)引文分析軟件,截取2003-2013年10年內(nèi)有關人工智能的文獻進行計量分析。具體檢索策略是在Web of Knowledge中輸入檢索式“Artificial Intelligence”,時間限度限定在2000-2013,并選擇文獻類型“ARTICLE”,得到的檢索結果為3 144條。
在CiteSpace中導入數(shù)據(jù),限定時間為2003至2013,時間跨度為1,選取節(jié)點類型為共引文獻(Cited Reference),運行后進行可視化,得到共引文獻聚類的混合網(wǎng)絡,如圖1所示。圖示中的網(wǎng)絡共有170個節(jié)點,836條鏈接。
從圖1可以看出,此聚類圖的發(fā)展途徑呈現(xiàn)出從左上角到右下角的演化,出現(xiàn)三個明顯的聚類:最先出現(xiàn)了左上角的藍色聚類,主要聚焦于蛋白質(zhì)組學(proteomy);隨后出現(xiàn)了以湖藍色聚類,在這之后分為了兩個不同的研究領域,研究內(nèi)容分別為大神經(jīng)網(wǎng)絡(large neural network)與特殊謂語(special predicate);最后出現(xiàn)的是以橙色和黃色的聚類,內(nèi)容涵蓋遺傳算法(genetic al?gorithms)、機器學習(machine learning)、基礎神經(jīng)網(wǎng)絡(funda?mentals neural)、遺傳編程(genetic programming)、計算機智能(IEEE Cevol computer)等新領域。黃色和橙色部分聚類連線較多,聯(lián)系緊密,是目前人工智能領域研究的核心區(qū)域。
圖 1 基于DCA的人工智能引文聚類圖譜
中間中心性和被引次數(shù)均排在前列的文章是Goldberg DE于1989發(fā)表的有關遺傳算法的文章,共被引32次,中心度為0.18,是該群體最具影響力的作者。這一文章可以說是人工智能領域的奠基之作,且仍處于目前研究的核心領域。從綠色到黃色、橙色的過渡并沒有明顯的節(jié)點。藍色和湖藍色的部分都相對孤立的,但左下方的湖藍色部分文章節(jié)點都是紅色,這表明這一領域的文章還是處于研究前沿。綠色節(jié)點較為分散,表明這一領域的研究出現(xiàn)時間較短或者研究尚淺,或是研究中遇到了難題,因此分布比較分散。自2008年之后的黃色與橙色的聚類網(wǎng)絡相對緊密,這說明這些領域是目前研究的熱點,且取得了較多的創(chuàng)新和成果,相互間聯(lián)系比較緊密,分布比較集中。
在CiteSpace中,選取節(jié)點類型為共引著者(Cited Author)進行分析,進入可視化界面,得到文章共引著者的聚類混合網(wǎng)絡,如圖2所示。
圖 2 基于ACA的人工智能引文聚類圖譜
由圖可知,共引作者與共引文獻的走向大致相同,藍色與湖藍色(2004至2005年)與其他文獻之間聯(lián)系不緊密,共引現(xiàn)象不多。在2005年之后共引開始增多,多個研究領域相互交叉,共引率較高。但同時也可以看出,2005年之后出現(xiàn)的研究相對比較分散,形成了多個分叉研究領域,且每個領域尚沒有形成一個系統(tǒng),雖然彼此間聯(lián)系緊密,但從人工智能整個研究領域來說,目前所做的研究尚淺,研究的整體性不強,還有許多內(nèi)容需要探索。
CiteSpace也給出了基于ACA人工智能的共引記錄,其中共引率最高的是Haykin S,被引次數(shù)為64次。被引次數(shù)排名第二的為前面提到的Goldberg DE,中心度為0.18,可以說是人工智能研究領域內(nèi)最具有影響力的權威專家。其他具有影響力的專家還有Zadeh LA,Newell A、Holland JH、Rumelhart DE、Kennnedy J、Mccarthy J等。
根據(jù)統(tǒng)計得知,人工智能研究領域共有126種共引期刊。在CiteSpace中,選取節(jié)點類型為共引期刊Cited Journal進行可視化,可以直觀地看出該領域最重要的期刊有ARTIF INTELL、SCIENCE,以及LNCS、LECT NOTESARTIF INT等。同時視圖也展示出了人工智能隨著時間共引情況的發(fā)展變化情況:人工智能的研究起始于五六十年代,事實上,“人工智能”一詞最初是在1956年Dartmouth學會上提出的[3]。從那以后,研究者們發(fā)展了眾多理論和原理,人工智能的概念也隨之擴展。自80年代以來,人工智能取得了較大的進展,人工智能的研究不斷向多個方向和領域延伸,并取得了很大的成就,許多文獻見諸一些世界級權威期刊。
通過人工智能共引記錄的共引次數(shù)與中心度的排序可以更明確地看出人工智能的共引期刊分布情況,繼而定義該領域的十大核心期刊。排名第一的期刊是ARTIF INTELL,被引次數(shù)(183次)最高,中心度(0.63)最大,是該領域最具有影響力的核心期刊。緊隨其后的是SCIENCE,也是很有該領域內(nèi)最有影響力的核心期刊之一;NATURE、LNCS、LECTNOTESARTIF INT、LECTNOTESCOMPUT SC這四種期刊次于前兩種期刊,影響力處于第二核心等級;COMPUT IND、IEEE TNEURAL NETWOR、EUR JOPER RES、DATA KNOWL ENG這四種期刊影響力弱于其前的四種期刊。
本文利用web of science數(shù)據(jù)庫的檢索數(shù)據(jù)對人工智能(2004-2010年)進行基于CiteSpace的科學知識圖譜分析,根據(jù)圖譜我們分析得知,人工智能的研究已經(jīng)持續(xù)多年,在近些年來更是取得了非凡的進展,研究熱點主要集中在遺傳算法、機器學習、神經(jīng)網(wǎng)絡等方面。但總體來看,人工智能領域的研究尚不成熟,研究主題分布較為分散,主題之間聯(lián)系不緊密。此外,本文通過定量分析,得出這一研究領域內(nèi)具有較大影響力的核心文獻、著者和期刊,有助于從宏觀上把握人工智能的發(fā)展過程和現(xiàn)狀,指導人工智能領域研究的進一步發(fā)展。
[1]胡國華,袁樹杰.人工智能研究現(xiàn)狀與展望[J].淮南師范學院學報,2006,8(37):22-24.
[2]劉樹安.人工智能研究領域及其社會影響[J].合作經(jīng)濟與科技,2012(19):126-128.
[3]丁世飛.人工智能[M].北京:清華大學出版社,2011.
TP18
A
1671-0037(2014)06-88-1.5
2014年度河南省社科聯(lián)、河南省經(jīng)團聯(lián)調(diào)研課題《基于關聯(lián)數(shù)據(jù)的網(wǎng)絡信息資源融和利用機制研究》,項目編號為:SKL-2014-765。
陳文娟(1988.3-),女,碩士,助理館員,研究方向:信息資源管理與服務。