兌紫璇
摘要:該文基于CiteSpace并利用文獻(xiàn)計(jì)量法,采用關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)及突現(xiàn)詞分析,分析了計(jì)算機(jī)視覺領(lǐng)域國(guó)內(nèi)外近十年的研究熱點(diǎn)與研究前沿。研究結(jié)果顯示,該領(lǐng)域的熱點(diǎn)研究方向?yàn)閳D像處理、圖像分割、特征提取、圖像識(shí)別、三維重建等,而計(jì)算機(jī)視覺對(duì)深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用成為該領(lǐng)域的研究前沿趨勢(shì)。
關(guān)鍵詞:CiteSpace;計(jì)算機(jī)視覺;知識(shí)圖譜;文獻(xiàn)計(jì)量法;機(jī)器視覺
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)08-0216-03
1 背景
隨著計(jì)算機(jī)視覺領(lǐng)域的發(fā)展,越來(lái)越多的知識(shí)信息進(jìn)入了研究者的視野。海量的文獻(xiàn)數(shù)據(jù)在給人們提供了豐富研究資源的同時(shí),也為研究增添了難度。由于數(shù)據(jù)繁多復(fù)雜,人們往往不能對(duì)信息進(jìn)行全面分析,在大量文獻(xiàn)中難以抉擇關(guān)鍵信息。利用文獻(xiàn)具有的可計(jì)量性,文獻(xiàn)計(jì)量法采用數(shù)理統(tǒng)計(jì)學(xué)方法,可以對(duì)計(jì)算機(jī)視覺這一領(lǐng)域的學(xué)術(shù)現(xiàn)狀和發(fā)展趨勢(shì)進(jìn)行定量描述、評(píng)價(jià)和預(yù)測(cè)[1-2]。并且隨著CiteSpace、SCI2、VOSviewer等工具陸續(xù)出現(xiàn),為信息可視化提供了可能,我們可以利用文獻(xiàn)圖譜并基于文獻(xiàn)計(jì)量學(xué)的方法,對(duì)計(jì)算機(jī)視覺領(lǐng)域進(jìn)行共引分析、共詞分析和聚類分析等,對(duì)信息進(jìn)行全面分析,發(fā)現(xiàn)大量數(shù)據(jù)之間的聯(lián)系,理清該領(lǐng)域演進(jìn)脈絡(luò),找到研究熱點(diǎn)并挖掘研究前沿[3]。
2 研究設(shè)計(jì)
2.1 收集處理數(shù)據(jù)
本文分析近十年來(lái)國(guó)內(nèi)外計(jì)算機(jī)視覺領(lǐng)域的研究狀況,原始數(shù)據(jù)來(lái)源于CNKI,以SCI\EI與CSSCI中2010-2019年的699篇論文為研究對(duì)象。其中選擇計(jì)算機(jī)視覺為主題進(jìn)行檢索,將篩選結(jié)果有選擇的導(dǎo)出,并利用CiteSpace中格式轉(zhuǎn)換工具將CNKI中導(dǎo)出的數(shù)據(jù)轉(zhuǎn)換為軟件能夠處理的格式,放入CiteSpace_data文件夾中。
2.2 利用CiteSpace得到知識(shí)圖譜
我們利用CiteSpace對(duì)收集并經(jīng)過(guò)清洗的文獻(xiàn)數(shù)據(jù)進(jìn)行可視化分析,可得到文獻(xiàn)圖譜。其中本文以共現(xiàn)分析和突現(xiàn)詞分析為主,發(fā)現(xiàn)文獻(xiàn)之間潛在關(guān)系并從中獲得信息[4]。引用科學(xué)計(jì)量學(xué)界專家劉則淵教授對(duì)CiteSpace的評(píng)價(jià)“一圖展春秋,一覽無(wú)余;一圖勝萬(wàn)言,一目了然”,可知其可視化方法是文獻(xiàn)計(jì)量學(xué)與計(jì)算機(jī)圖像處理的完美結(jié)合,其分析結(jié)果可為領(lǐng)域的研究提供清晰的指南。
3 計(jì)算機(jī)視覺領(lǐng)域研究熱點(diǎn)
作為對(duì)一篇文章的核心概括,從關(guān)鍵詞中往往可了解文章的主題,而一篇論文中的幾個(gè)關(guān)鍵詞又圍繞文章核心有著緊密的關(guān)聯(lián)。共詞分析通過(guò)對(duì)關(guān)鍵詞共同出現(xiàn)頻次以及相互連接的緊密程度進(jìn)行分析,可以找到該領(lǐng)域各主題之間的關(guān)系。在CiteSpace中創(chuàng)建新項(xiàng)目,對(duì)導(dǎo)人數(shù)據(jù)進(jìn)行分析,可得到圖l所示關(guān)鍵詞共現(xiàn)圖譜。
可知該關(guān)鍵詞共現(xiàn)圖譜中十字標(biāo)記最大的關(guān)鍵詞為機(jī)器視覺,表示機(jī)器視覺在所有文獻(xiàn)關(guān)鍵詞中出現(xiàn)頻次最高。而機(jī)器視覺實(shí)際是計(jì)算機(jī)視覺的別名,作為本文的研究對(duì)象,可將兩者除去。然后依次為圖像處理、深度學(xué)習(xí)、圖像分割、特征提取、圖像識(shí)別、算法、神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、模型、分級(jí)、目標(biāo)跟蹤、識(shí)別、人工智能、無(wú)損檢測(cè)等,這些主題構(gòu)成了在計(jì)算機(jī)視覺領(lǐng)域近十年間的研究熱門。且可得圖像處理為最中介中心性節(jié)點(diǎn),說(shuō)明此關(guān)鍵詞與多個(gè)關(guān)鍵詞相連,是較為關(guān)鍵的熱門。線條的粗細(xì)代表了關(guān)鍵詞之間的聯(lián)系,線條越粗,表示這些主體之間的聯(lián)系越緊密。而對(duì)比圖像上方的時(shí)間線的顏色與連線的顏色,我們可知這些關(guān)鍵詞主要出現(xiàn)在哪一具體的年份。從圖中可知圖像分割、圖像識(shí)別、特征提取之間的連線都為紫色,說(shuō)明這些主題在2010-2013年之間都密切相關(guān)。之后我們利用CiteSpace的聚類功能,可以得到如圖2所示關(guān)鍵詞聚類圖譜。
該關(guān)鍵詞聚類圖譜表示多個(gè)緊密關(guān)聯(lián)的關(guān)鍵詞進(jìn)行聚類,一共聚成了13類。每一類上都有一個(gè)標(biāo)簽,是聚類中值最大的關(guān)鍵詞,分別為人工智能、圖像處理、圖像分割、三維重建、特征提取、深度學(xué)習(xí)、圖像識(shí)別等。標(biāo)簽從小到大排序,表示聚類中包含的關(guān)鍵詞越來(lái)越少。有圖分析可知(#0)聚類包含的關(guān)鍵詞最多,說(shuō)明與很多關(guān)鍵詞都與人工智能相關(guān)。
另外通過(guò)Modularity(Q值)=0.6196,可知該聚類結(jié)構(gòu)顯著。而Silhouette(S值)=0.3254.說(shuō)明該聚類有待于改進(jìn),但由于網(wǎng)絡(luò)不是過(guò)于復(fù)雜,反而剪枝后的圖譜嚴(yán)重不符合實(shí)際,所以可認(rèn)為該圖譜合理并可用于分析。
將2010-2019年關(guān)鍵詞的高頻詞羅列出來(lái)如表1所示。
由表1可知在2010-2019年間,除去機(jī)器視覺和計(jì)算機(jī)視覺,圖像處理在計(jì)算機(jī)視覺領(lǐng)域最為熱門。圖像處理即計(jì)算機(jī)對(duì)圖像進(jìn)行分析的技術(shù),主要包括進(jìn)行壓縮、復(fù)原、描述等。其主要利用數(shù)學(xué)函數(shù)和圖像變化,使圖像完成如平滑、銳化之類的轉(zhuǎn)換,以之滿足所需。因?yàn)橛?jì)算機(jī)視覺處理的核心是圖像,所以兩者密不可分,可認(rèn)為圖像處理為計(jì)算機(jī)視覺的一個(gè)子集[5-6]。
而圖像分割作為第三熱門的研究主題,其關(guān)注的是目標(biāo),完成將目標(biāo)從背景中分離出來(lái)的任務(wù),其作為圖像理解的初步操作,是計(jì)算機(jī)視覺的基礎(chǔ)。從表中還可以看出,圖像識(shí)別、三維重建為計(jì)算機(jī)視覺較為熱門的研究方向,而無(wú)損檢測(cè)、缺陷檢測(cè)、目標(biāo)跟蹤則為計(jì)算機(jī)視覺領(lǐng)域較為熱門的應(yīng)用。深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)也成為計(jì)算機(jī)視覺應(yīng)用的熱門算法與模型。
4 計(jì)算機(jī)視覺領(lǐng)域研究前沿分析
一個(gè)研究領(lǐng)域當(dāng)前的發(fā)展?fàn)顩r可被定義為研究前沿,具體表現(xiàn)為施引文群組。而研究前沿的共被引聚類則形成了該領(lǐng)域的知識(shí)基礎(chǔ)。CiteSpace可通過(guò)共引分析發(fā)現(xiàn)研究前沿與知識(shí)基礎(chǔ)。而在本文中,利用CiteSpace的突變檢測(cè)功能,通過(guò)對(duì)詞頻的時(shí)間分布進(jìn)行考查,可發(fā)現(xiàn)計(jì)算機(jī)視覺領(lǐng)域近十年來(lái)文獻(xiàn)中的突變術(shù)語(yǔ),并得}H變動(dòng)趨勢(shì)。如圖3為從CiteSpace中得到的突變?cè)~表:
由上圖可知2010-2019年有8個(gè)突變?cè)~,分別為攝像機(jī)標(biāo)定、農(nóng)產(chǎn)品、目標(biāo)跟蹤、神經(jīng)網(wǎng)絡(luò)、棉花、深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、模型。Begin列為這些關(guān)鍵詞首次出現(xiàn)的年份,End列為這些關(guān)鍵詞最后出現(xiàn)的年份。通過(guò)對(duì)此表的分析可得2010-2019年計(jì)算機(jī)視覺領(lǐng)域的前沿演進(jìn)情況。其中在2010-2012年期間,計(jì)算機(jī)視覺主要集中于攝像機(jī)標(biāo)定、農(nóng)產(chǎn)品檢測(cè)、無(wú)損檢測(cè)等應(yīng)用方面,可以發(fā)現(xiàn)這一時(shí)間段計(jì)算機(jī)視覺技術(shù)的進(jìn)步推動(dòng)了檢測(cè)技術(shù)的發(fā)展,人們可以利用計(jì)算機(jī)完成更多基于視覺的分析任務(wù)。
而在2017-2019年間,出現(xiàn)了深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、模型等關(guān)鍵詞。這意味著計(jì)算機(jī)視覺的發(fā)展不僅僅滿足于當(dāng)前完成的任務(wù),而是向算法設(shè)計(jì)、更新網(wǎng)絡(luò)結(jié)構(gòu)、完善模型等理論與設(shè)計(jì)層面進(jìn)行結(jié)合與探究來(lái)完善基于學(xué)習(xí)的視覺。其中將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于計(jì)算機(jī)視覺領(lǐng)域是該領(lǐng)域的研究前沿。因?yàn)閭鹘y(tǒng)的計(jì)算機(jī)視覺主要利用特征提取算法如尺度不變特征變換匹配算法、加速魯棒特征算法等從圖像中提取特征,完成邊緣檢測(cè)、角點(diǎn)檢測(cè)、圖像分割等任務(wù)。但由于算法執(zhí)行的效果有時(shí)會(huì)因輸入圖像的性質(zhì)而不如意,所以人們通過(guò)特征工程來(lái)預(yù)先對(duì)圖像進(jìn)行處理。不同的任務(wù)所需要提取的圖像特征不同,使特征工程成為一個(gè)復(fù)雜困難的問(wèn)題。而應(yīng)用深度學(xué)習(xí)算法的卷積神經(jīng)網(wǎng)絡(luò)可對(duì)原始輸入圖像完成特征提取的工作,其提取輸入圖像中局部特征,進(jìn)行訓(xùn)練學(xué)習(xí)可得到最正確有效的特征。另外卷積神經(jīng)網(wǎng)絡(luò)權(quán)值共享降低了網(wǎng)絡(luò)復(fù)雜性,其特殊的布局在原始圖像輸入網(wǎng)絡(luò)時(shí)避免數(shù)據(jù)重建的繁雜工作,這些優(yōu)勢(shì)可極大的推動(dòng)計(jì)算機(jī)視覺的發(fā)展進(jìn)步[7-9]。目前深度學(xué)習(xí)領(lǐng)域飛速發(fā)展,各種網(wǎng)絡(luò)模、算法逐漸更新,未來(lái)計(jì)算機(jī)視覺與深度學(xué)習(xí)的聯(lián)系也將更加緊密。
5 結(jié)束語(yǔ)
本文通過(guò)對(duì)2010年-2019年近十年計(jì)算機(jī)視覺領(lǐng)域國(guó)內(nèi)外權(quán)威期刊的文獻(xiàn)進(jìn)行收集、處理,利用CiteSpace得到知識(shí)圖譜,同時(shí)采用文獻(xiàn)計(jì)量學(xué)的方法進(jìn)行分析可得計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn)方向?yàn)閳D像處理、圖像識(shí)別、圖像分割、三維重建、特征提取等,而目標(biāo)跟蹤、無(wú)損檢測(cè)、缺陷檢測(cè)等則為計(jì)算機(jī)視覺領(lǐng)域較為熱門的應(yīng)用。深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)是計(jì)算機(jī)視覺應(yīng)用的熱門算法與模型,成為計(jì)算機(jī)視覺領(lǐng)域的研究前沿。
由于對(duì)文獻(xiàn)的不同選擇將直接影響分析的結(jié)論,本文以CNKI庫(kù)為基礎(chǔ),得到的數(shù)據(jù)維度比WoS得到的要少。在選取文獻(xiàn)時(shí)還可以WoS得到的信息為數(shù)據(jù)基礎(chǔ),以保證對(duì)研究領(lǐng)域的知識(shí)基礎(chǔ)、研究現(xiàn)狀與研究概述有更全面、更準(zhǔn)確的判斷與分析。
參考文獻(xiàn):
[1]鄭文暉.文獻(xiàn)計(jì)量法與內(nèi)容分析法的比較研究[J].情報(bào)雜志,2006,25(5):31-33.
[2]趙蓉英,許麗敏.文獻(xiàn)計(jì)量學(xué)發(fā)展演進(jìn)與研究前沿的知識(shí)圖譜探析[J].中國(guó)圖書館學(xué)報(bào),2010,36(5):60-68.
[3]陳悅,陳超美,劉則淵,等.CiteSpace知識(shí)圖譜的方法論功能[J].科學(xué)學(xué)研究,2015,33(2):242-253.
[4]張???,趙文斌,葉權(quán)慧,等.機(jī)器學(xué)習(xí)領(lǐng)域研究熱點(diǎn)與前沿演進(jìn)——基于CiteSpace的可視化分析[J].軟件導(dǎo)刊,2019,18(9):5-8,225.
[5]張五一,趙強(qiáng)松,王東云.機(jī)器視覺的現(xiàn)狀及發(fā)展趨勢(shì)[J].中原工學(xué)院學(xué)報(bào),2008,19(1):9-12,15.
[6]王愛民,沈蘭蓀.圖像分割研究綜述[J].測(cè)控技術(shù),2000,19(5):1-6,16.
[7]張順,龔怡宏,王進(jìn)軍.深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2019,42(3):453-482.
[8]李彥冬.基于卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)視覺關(guān)鍵技術(shù)研究[D].成都:電子科技大學(xué),2017.
[9]盧宏濤,張秦川.深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的應(yīng)用研究綜述[J].數(shù)據(jù)采集與處理,2016,31(1):1-17.
【通聯(lián)編輯:謝媛媛】