徐彤陽 任浩然 張國標
〔摘要〕[目的意義]圖像包含了豐富、生動的信息,利用圖像檢索技術能夠有效的對大規(guī)模圖像信息進行分析、組織和處理,具有重要的實踐意義。近年來,各國對圖像檢索的研究力度不斷加大,有必要對國際圖像檢索文獻進行梳理。[方法過程]本文采用文獻計量方法和CitespaceⅢ可視化工具,對收集Web of Science數(shù)據(jù)庫中有關圖像檢索領域的文獻進行分析,梳理了文獻時間分布規(guī)律、學科分布狀況,并重點從作者、機構和國家和關鍵詞頻的角度探索了國際圖像檢索領域的主要研究力量和研究熱點。[結果結論]通過總結和分析發(fā)現(xiàn):圖像檢索領域的主要研究作者和機構大部分來自于中國;國際作者合作尚未形成較為規(guī)模的團隊、美國與中國是圖像檢索領域研究的主要力量;目前的研究熱點主要集中在基于內(nèi)容的圖像檢索、圖像分類和相關反饋這3個方面。
〔關鍵詞〕圖像檢索;文獻計量;Web of Science
DOI:10.3969j.issn.1008-0821.2017.10.024
〔中圖分類號〕G254927;G250252〔文獻標識碼〕A〔文章編號〕1008-0821(2017)10-0144-07
〔Abstract〕[Purposesignificance] The image contains rich and vivid information,and it is of great practical significance to analyze,organize and deal with large-scale image information effectively by using image retrieval technology.In recent years,the research of image retrieval has been increasing,so it is necessary to sort out the international image retrieval literature.[Methodprocess]By collecting the literatures in the field of image retrieval in the Web of Science database,this paper used the method of bibliometrics and Citespace Ⅲ visualization to sort out and analyze the time distribution of relevant literatures,the distribution of disciplines,and focused on the main research strength and research hotspot in the field of international image retrieval from the perspective of authors,institutions countries and key words.[Resultconclusion]Through the summary and analysis,it was found that most of the main research authors and institutions in the field of image retrieval come from China ;the cooperation of international authors had not yet formed a relatively large-scale team.The United States and China were the main forces in the field of image retrieval.The current research focus was mainly on content-based image retrieval,image classification and related feedback.
〔Key words〕image retrieval;bibliometrics;Web of Science
隨著數(shù)據(jù)庫技術、互聯(lián)網(wǎng)技術以及多媒體技術的不斷發(fā)展,數(shù)字資源早已不單單以文字的形式存在,互聯(lián)網(wǎng)中還有大量的圖像、音頻、視頻等豐富的多媒體資源。其中,圖像資源是客觀對象的一種相似性的、生動性的描述和寫真,是人類社會中最常見的一種信息載體。近幾年,由于博客、論壇、社交網(wǎng)絡、微博等社交平臺的發(fā)展,給人們提供了分享和交流的機會,而數(shù)據(jù)存儲系統(tǒng)和云服務也日益完善,使得圖像資源呈現(xiàn)幾何增長。為了有效的組織、管理信息資源,自20世紀50年代,信息檢索技術就已出現(xiàn),它被描述為使用戶的信息需求能夠變?yōu)樽罱K的有用信息的過程,對社會信息化進程起到了重大的促進作用[1]。圖像檢索作為信息檢索研究領域中的一個分支,對快速在龐大的數(shù)據(jù)庫中檢索出用戶需求的圖像,提高檢索效率具有重要的研究意義。經(jīng)過20年的發(fā)展,科研人員以人工標注的方式對圖像進行索引,逐漸形成了初步的圖像檢索系統(tǒng)研究體系;90年代初期,圖像資源日益膨脹,以文本的方式檢索圖像出現(xiàn)了效率低、主觀性強和檢索結果差強人意等問題,需要新的方法去解決,因此,新一代圖像檢索系統(tǒng)應運而生。該系統(tǒng)通過提取圖像視覺特征進行查詢,大大提高了檢索的效率,被稱為基于內(nèi)容的圖像檢索[2]。
近年來圖像檢索研究領域的發(fā)展速度很快,得到國內(nèi)外學者的廣泛關注,并有了豐碩的研究成果。梳理國際圖像檢索領域發(fā)展進程并將當前學術研究熱點等特征進行系統(tǒng)的展示顯得尤為重要。國際圖像檢索研究較為完善和成熟,整體來看發(fā)展狀況領先于國內(nèi),并且近幾年國內(nèi)對國際圖像檢索的總結性文獻較少。鑒于此,本文采用文獻計量方法對國際圖像檢索領域相關的文獻進行分析,深入探究該領域的研究結構,以期理清國際圖像檢索發(fā)展脈絡,為進一步推動國內(nèi)相關研究的發(fā)展提供理論參考依據(jù)。endprint
1數(shù)據(jù)來源與分析方法
Web of science是世界上收錄最全面,具有影響力的學術期刊的數(shù)據(jù)庫之一,因此本文檢索來為Web of science數(shù)據(jù)庫。檢索時選擇“題名”字段進行檢索,因為主題檢索會造成大量誤檢,影響數(shù)據(jù)有效性,構造的檢索式為題名=(image retrieval or image search)and 文獻類型=(ARTICLE OR PROCEEDINGS PAPER OR REVIEW)。檢索時間跨度選擇2002-2016年近15年的文獻,最后使用NoteExpress軟件去除重復和不相關的文獻,共檢索出屬于研究范圍的2 894篇文章。
本文主要采用文獻計量方法和知識圖譜方法對檢索到的數(shù)據(jù)進行分析。結合兩種方法可以綜合的分析國際圖像檢索論文發(fā)表的規(guī)律,客觀評價不同國家、機構或作者對該領域的研究現(xiàn)狀和發(fā)展歷程,并將圖像檢索領域的研究熱點、趨勢和知識結構等以客觀、形象的可視化方式展現(xiàn)出來。主要工具選擇CitespaceⅢ可視化分析軟件。該軟件適用于分析多元、分時、動態(tài)的復雜網(wǎng)絡,是新一代信息可視化技術[3]。
2國際圖像檢索發(fā)展概述
21時間分布
研究圖像檢索領域的歷年文獻發(fā)文數(shù)量可以把握該領域的發(fā)展程度和水平,是衡量該領域發(fā)展的重要指標,對評價該領域所處的階段、預測發(fā)展趨勢和動態(tài)具有重要意義[4]。圖1顯示了國際近15年圖像檢索領域文獻發(fā)表數(shù)量狀況。
圖12002-2016年國際圖像檢索文獻發(fā)文時間分布
通過統(tǒng)計分析可得出,國際圖像檢索領域的發(fā)展大致經(jīng)歷的3個階段。第一階段為2002-2005年,由于文本的檢索方式會浪費大量的人力,并且每個人對圖像理解不相同以及其他缺陷,相關學者開始提出了新的基于內(nèi)容的檢索來滿足用戶的檢索個性化需求,同時隨著互聯(lián)網(wǎng)的普及和發(fā)展,圖像資源爆炸式增長,迫切需要新的技術來處理海量信息,因此圖像檢索的相關研究逐漸增加,發(fā)文量逐年上升。該階段主要提出了圖像檢索系統(tǒng)的概念和實現(xiàn)、基于紋理、形狀和顏色等基本的特征提取方法、相關反饋的概念和方法等內(nèi)容。第二階段為2006-2009年,該階段發(fā)問數(shù)量逐年下降是因為圖像檢索技術達到瓶頸,但每年發(fā)文量在100篇以上,表明仍然得到學者的持續(xù)關注。第三階段為2010~2016年,在互聯(lián)網(wǎng)、多媒體技術以及移動端不斷發(fā)展的背景和跨媒體檢索、人工智能等技術的推進下,圖像檢索又獲得了廣泛的關注和重視,近幾年發(fā)文量迅速增長。
22學科分布
探索國際圖像檢索領域的發(fā)展狀況還可以著眼于研究所屬的學科性質,通過深入分析其研究方向,可以揭示不同學科對推動圖像檢索領域的發(fā)展所做出的貢獻及應用前景。表1直觀展示了國際圖像檢索科研成果的學科分布情況。
本文統(tǒng)計顯示了發(fā)表數(shù)量最多的前10位有關圖像檢索的學科領域,表1統(tǒng)計的數(shù)據(jù)顯示,圖像檢索涉及多種學科,屬于多學科交叉領域。其中,所屬計算機科學的文獻最多,共1 728篇,占總數(shù)的5967%,說明圖像檢索領域的發(fā)展離不開計算機技術的支持,計算機科學為推動圖像檢索做出了重要的貢獻;其次依次為:工程學875篇占3023%、成像科學攝影技術242篇占8359%、光學226篇占7807%、電子信息136篇占470%、圖書情報科學132篇占456%以及其他交叉學科的文獻等。通過統(tǒng)計不同學科領域的發(fā)文數(shù)量,我們可以看出圖像檢索領域的文獻廣泛應用于自然科學領域,發(fā)展前景廣闊。計算機科學、工程學是該領域的研究的基礎,除此之外圖像檢索還應用于其他各個學科,這為社會發(fā)展的方方面面都起了不可忽視的作用。
從表中我們還可以得出,在今后的研究中,進一步了解圖像檢索領域的研究特點和發(fā)展狀況時,可以重點從以上學科入手,同時可以借鑒其他學科的研究方法,擴大圖像檢索領域研究的內(nèi)容。
3主要研究力量
31核心期刊
核心期刊是期刊中學術水平較高的刊物,是進行刊物評價而非具體學術評價的工具。核心期刊對教學科研單位申請高級職稱、基本的核心館藏、申報科研項目、科研機構或高等院校學術水平評估等都具有重要的意義。研究國際圖像檢索領域的核心期刊有助于了解主要發(fā)文期刊,把握國際學術研究前沿動態(tài),對今后圖像檢索理論的研究具有指導意義。
依據(jù)布拉德福定律,如果科學期刊按其所刊載某一學科論文的數(shù)量多少,依遞減順序排列并劃分出一個與該學科密切相關的期刊所形成的核心區(qū)期刊區(qū)以及、相關區(qū)和非相關區(qū),各個區(qū)的文章數(shù)量相等,此時核心區(qū)、相關區(qū)、非相關區(qū)期刊數(shù)量成1∶ n∶ n2的關系。將所有相關文獻劃分為3個區(qū),使每個區(qū)的文獻數(shù)大致相等。筆者經(jīng)過統(tǒng)計后,2 894篇圖像檢索的文獻資料共有1245種涉及圖像檢索領域的期刊,均刊載文量為2篇。計算出屬于核心期刊的刊物11種,占全部期刊類別總數(shù)的09%,相關區(qū)期刊的刊物為120種,占全部期刊類別總數(shù)的96%,非相關區(qū)域期刊的刊物為1 114,占全部期刊類別總數(shù)的894%,它們之間的比率為1∶109∶1013(n約10),并且每個區(qū)域發(fā)表文獻數(shù)量大致相等,符合布拉德福定律。核心區(qū)相關期刊刊名及發(fā)文數(shù)量見表2。
由表可見,期刊《LECTURE NOTES IN COMPUTER SCIENCE》(計算機科學講義)以總篇數(shù)327排在第一,發(fā)文數(shù)量是排在第二名期刊《PATTERN RECOGNITION》(模式識別)的35倍。LNCS于1973年設立出版,至今已發(fā)行了8 000多卷,主要涉及人工智能和生物信息等主要領域的研究,LNCS一直與計算及科研院所、眾多知名學者、知名院校和學術團體之間有密切的合作,發(fā)表最新的計算機科學和信息技術的研究報告和會議論文等,學術水準較高。期刊《PATTERN RECOGNITION》于1968年設立出版,是最早發(fā)行模式識別相關文獻的主要期刊之一,比較注重理論、方法的創(chuàng)新和應用。期刊發(fā)表涉及的主要方向有計算機視覺、圖像處理、視覺神經(jīng)網(wǎng)絡、文本和文檔分析、生物信息學、多媒體數(shù)據(jù)分析等,因此圖像檢索領域在該期刊的發(fā)文量也相對較多。endprint
在核心期刊中,除了以上2種期刊,還有《多媒體工具與應用》、《圖像處理協(xié)會》、《神經(jīng)計算》、《IEEE多媒體事物》、《圖像和視頻檢索程序》和《視覺傳達與影像表現(xiàn)雜志》等期刊。這些核心期刊均屬于計算機領域的期刊,從側面說明計算機科學領域是圖像檢索研究的主要力量。同時,這些核心期刊大多都是有關多媒體檢索、圖像檢索領域的專業(yè)期刊,圖像檢索領域發(fā)表的相關文獻向專業(yè)領域的期刊集中,所以這些期刊屬于核心期刊也在情理之中。
32主要研究機構
研究機構是有明確研究方向和任務,有一定水平的學術帶頭人和一定數(shù)量科研人員組成的長期從事研究與開發(fā)活動的機構,是科研成果產(chǎn)生的重要來源。本文統(tǒng)計了圖像檢索領域排名前10的科研機構(見圖2)并對其進行分析。
圖2國際圖像檢索領域主要研究機構
從圖2中可以看出,中國科學院以92篇的發(fā)文量排在第一,新加坡國立大學和南洋理工大學分別以50篇和48篇的發(fā)文量排在第二和第三名。排在前10名的機構還有微軟亞洲研究院、印度理工學院、清華大學、中國科技大學、德克薩斯圣安東尼奧大學、浙江大學和美國國家航天局。通過分析發(fā)現(xiàn):①中國科學院發(fā)文量遙遙領先,在圖像檢索領域占有一定的地位,其它機構發(fā)文數(shù)量相差不大,表明機構之間在圖像檢索領域之間研究水平差距較?。虎趫D像檢索領域發(fā)文量排在前10的機構有8家來自于高校,只有微軟亞洲研究院和美國國家航天局不在高校之列,表明各大高校是研究圖像檢索領域的主力軍;③排在前10的科研機構中,有4家來自中國,在科研機構中占據(jù)絕對優(yōu)勢,表明我國科研機構成為該領域研究的主要群體,對推動圖像檢索領域的發(fā)展做出了積極的貢獻。
33作者發(fā)文情況
331重要影響力作者
因第一作者在文獻中的貢獻度較大,本文基于SSCI數(shù)據(jù)庫檢索結果,以第一作者發(fā)表的高被引文章數(shù)為基礎進行統(tǒng)計,對在該領域發(fā)表高質量文章數(shù)量總被引排名前10位的作者發(fā)文情況進行分析,見表3。
從表3中看出,瑞士保羅謝勒研究所(Paul Scherrer Institut,Switzerland)的Pfeiffer,F(xiàn)作者發(fā)表數(shù)量雖然僅有1篇,但篇均被引高達877次,發(fā)文質量高。該文提出利用低亮度X射線成像,可以有效的表示圖像,能廣泛適用于醫(yī)學成像和工業(yè)無損檢測等領域[5]。發(fā)文質量排在第二的作者Datta,Ritendra來自賓夕法尼亞大學計算機系,在圖像檢索領域主要研究圖像標注[6-7]。另外,排在前10的也有不少海外華人,比如澳大利亞莫納什大學的Liu,Ying,
主要研究圖像檢索中的高層語義檢索;英國倫敦大學伯克貝克學院的Tao,DC和美國西門子公司的Zhou,XS都分析了圖像檢索領域中的相關反饋機制存在的一些問題,并提出了改進的算法。
332核心作者
核心作者是推動學術創(chuàng)新與學科發(fā)展的骨干力量,同時也是提升期刊學術影響力和競爭力的重要因素之一。計算核心作者可以采用普萊斯指數(shù),計算公式為:M=0749(Nmax)12,式中M 代表論文篇數(shù),Nmax 代表統(tǒng)計年限中發(fā)文數(shù)最多的作者的論文數(shù),M為核心作者。據(jù)本文統(tǒng)計,發(fā)表數(shù)量最多的作者論文數(shù)量為38,因此,發(fā)表了5篇以上的作者為圖像檢索領域的核心作者。15年間,圖像檢索領域發(fā)表了5篇以上的核心作者共有250人,發(fā)文數(shù)量共1 914篇,占文獻總數(shù)的61%,大于半數(shù)論文,符合普萊斯指數(shù)定律。這些核心作者中,大部分作者來自中國,是圖像檢索領域研究的關鍵力量。限于核心作者數(shù)量較多,本文列舉了前10位核心作者,具體見表4。
Tian,Q等人共同合作發(fā)表了許多有關圖像檢索模型的結構和算法,如提出基于耦合二進制嵌入的單詞模型圖像檢索,融合了顏色和SHIF紋理特征可以有效提高視覺匹配精度[8];構建了基于視覺次模型和反向索引結構,提出了一種由兩個連續(xù)的模塊組成的有效的重新排列方法,提高了檢索效率[9]。ZHANG HJ等人從關鍵詞和標簽等語義檢索方向來提取圖像信息,并在檢索中引入了相關反饋方法,改善了檢索效果[10-11]。其他的核心作者也提出了許多有關圖像檢索領域的相關理論和創(chuàng)新,對推動圖像檢索研究發(fā)展做出了重要的貢獻。
333作者合作情況
探究科研人員合作情況有利于發(fā)現(xiàn)國際圖像檢索領域的主要研究團隊,揭示核心團隊的研究方向、了解當前該領域的前沿動態(tài)等。本文通過CitespaceⅢ軟件繪制團隊合著情況,其中圓點間的線條表示發(fā)文關系,圓圈表示作者,大小代表發(fā)文質量,如圖3。
從圖3看出,國際圖像檢索領域之間的作者整體聯(lián)系較為稀疏,主要有3個合著團隊。①Q(mào)i Tian為中心的合作網(wǎng)絡,主要研究圖像索引和聚類方法來提高圖像檢索效率,該團隊中Qi Tian來自浙江大學、Zhou WA來自中國科技大學、Huang QM來自中國科學院、Wang SJ來自清華大學;② Tao Dacheng為中心的合作網(wǎng)絡,Tao DC來自悉尼科技大學,主要研究醫(yī)學圖像檢索,提出了醫(yī)學圖片特征提取的若干方法,如多視點的局部線性嵌入(MLLE)[12],可以有效的降低維數(shù),提升圖像的檢索速度和效率。Shen HL來自北京大學,Wang M與Hua XS均來自中國科技大學,Lu YJ來自西南德克薩斯州立大學;③Zhang HJ為中的合作網(wǎng)絡,其中Zhang HJ、Jing F、Li MJ均來自微軟亞洲研究院,Zhang B來清華大學,主要研究圖像檢索領域中的相關反饋和基于區(qū)域的圖像檢索,他們還共同合作發(fā)表了許多國際會議文獻。通過分析看出,國內(nèi)的相關學者努力尋求合作,共同致力于圖像檢索領域的研究并在國際中積極扮演重要的角色。
34國際發(fā)文情況
341國際發(fā)文發(fā)展趨勢
通過統(tǒng)計分析主要國家每年發(fā)文量變化,可以了解不同國家地區(qū)學術水平的的高低以及變化發(fā)展趨勢。本文根據(jù)SSCI自有的國家地區(qū)統(tǒng)計功能,列舉了發(fā)文量排在前6位的國家地區(qū),如圖4。endprint