彭昭勇,伍 權(quán),陳華偉,鄭 躍,王書祥
貴州師范大學(xué) 機械與電氣工程學(xué)院,貴陽 550025
機器視覺的概念,源于美國機械工程師協(xié)會(American Society of Manufacturing Engineers,ASME)中的機器視覺分會以及美國的機器人工業(yè)協(xié)會(Robotics Industries Association,RIA)中的自動化分會[1]。按照其定義,機器視覺是指“經(jīng)過光學(xué)裝置和非碰觸型的傳感器自主接收并處置某個真正物體的圖形,并對其剖析取得所需要的信息或用來管控機器運行的設(shè)施?!睓C器視覺具有精度高、成本低、效率高、靈活性高、自動化程度高等優(yōu)點[2-4],在特定工作條件和環(huán)境下,可以取代人類的工作,因此廣泛應(yīng)用于現(xiàn)代工業(yè)自動化生產(chǎn)中,如零配件批量加工的尺寸檢測,自動裝配的完整性檢查,電子裝配線的元件自動定位,IC 上的字符識別等[5-14]。隨著機器視覺的發(fā)展,學(xué)術(shù)界對機器視覺缺陷檢測的關(guān)注度不斷提高,研究成果不斷積累,據(jù)此一些學(xué)者針對中國機器視覺缺陷檢測研究所取得的成果做了回顧和展望[15-22]。上述研究為促進中國機器視覺缺陷檢測研究奠定了良好的基礎(chǔ),但從研究時間段來看,有的研究距今太過久遠,已不能及時且全面地反映近幾年中國機器視覺缺陷檢測研究領(lǐng)域發(fā)生的新變化;從研究內(nèi)容來看,既有從整體角度,也有從某種類型對中國機器視覺缺陷檢測研究成果進行梳理;從研究方法來看,幾乎所有的研究都采用傳統(tǒng)的內(nèi)容分析,無法發(fā)現(xiàn)研究議題間的知識脈絡(luò)關(guān)系。
因此,本文基于中國知網(wǎng)(CNKI)數(shù)據(jù)庫中1995—2020年的文獻數(shù)據(jù)(根據(jù)檢索條件,能夠檢索到的最早關(guān)于中國機器視覺缺陷檢測研究的文獻[23]發(fā)表于1995年),通過文獻計量和圖譜分析相結(jié)合的方法,能夠系統(tǒng)考察和直觀反映中國機器視覺缺陷檢測研究現(xiàn)狀、熱點和前沿,從而為后續(xù)研究提供借鑒和參考。
本研究的數(shù)據(jù)來源于中國知網(wǎng)(CNKI)期刊全文數(shù)據(jù)庫(https://www.cnki.net/)收錄的全部期刊,包括核心期刊、CSCD 期刊、EI 期刊等。以“機器視覺缺陷檢測”為主題詞進行檢索,檢索日期截至2020年7月17日,對數(shù)據(jù)進行整理后共獲得相關(guān)文獻588篇,以此作為分析研究對象。
本文綜合運用文獻計量法和知識圖譜分析法。時間跨度為“1995—2020 年”,時間間隔為1 年,在此基礎(chǔ)上,分別選擇關(guān)鍵詞、作者、機構(gòu)、發(fā)文期刊等作為研究對象,并繪制相應(yīng)的分析圖,通過可視化手段呈現(xiàn)科學(xué)知識的結(jié)構(gòu)、規(guī)律和分布情況,直觀地反映不同研究間的內(nèi)在聯(lián)系,為科學(xué)有效地預(yù)測某一領(lǐng)域研究的發(fā)展動向和趨勢提供科學(xué)依據(jù)[24]。
某一研究方向發(fā)表論文數(shù)量的變化能夠直觀反映該研究在某一時間段內(nèi)研究熱點的變化,是衡量該研究在該時間段內(nèi)發(fā)展態(tài)勢的一個重要指標(biāo),對分析未來研究發(fā)展動態(tài)和趨勢具有重要意義[25]。根據(jù)我國機器視覺缺陷檢測研究文獻在歷年分布數(shù)量的統(tǒng)計分析可知(如圖1 所示),1995—2020 年,中國對機器視覺缺陷檢測研究大致經(jīng)歷了初步探索、快速增長和高速增長三個階段。其中,1995—2005 年為該研究初步探索的階段,這一階段研究成果相對較少,年均發(fā)文量僅為1.6篇,但隨著1995年關(guān)于產(chǎn)品缺陷自動視覺檢測論文的首次出現(xiàn),揭開了中國機器視覺缺陷檢測研究的序幕。2006—2011 年為該研究快速增長的階段,發(fā)文量逐年攀升,由2006 年的7 篇增加到了2011 年的28 篇,與前一階段的2005年相比,增長了12.9倍。主要原因為隨著企業(yè)自動化生產(chǎn)線的升級迭代,傳統(tǒng)人工和機械檢測方法越來越滿足不了自動檢測的需求,在行業(yè)需求的帶動下,企業(yè)和高校的研究熱情高漲,進而推動了論文數(shù)量的上升。2012—2020 年為該研究的高速發(fā)展階段(其中截止2020年7月17日共發(fā)表48篇,數(shù)據(jù)不完整,在圖中未列入),發(fā)文量逐年快速上升,2019年最多為86篇,總體呈穩(wěn)步上升態(tài)勢。隨著計算技術(shù)進步,機器視覺算法效率越來越高,缺陷檢測效果越來越具有實用性,且機器視覺技術(shù)得到大量應(yīng)用,進一步推動了機器視覺缺陷檢測文獻數(shù)量的增加。
圖1 1995—2019年研究文獻數(shù)量
2.2.1 關(guān)鍵詞分布圖分析
中心度和頻次綜合指標(biāo)作為判斷某一研究領(lǐng)域熱點方向的標(biāo)準(zhǔn),是指一個節(jié)點在網(wǎng)絡(luò)中處于核心地位的程度,節(jié)點的關(guān)聯(lián)性越大,其中心度越高,說明節(jié)點在該領(lǐng)域的重要性越強[27]。中心頻度大于0.1 的關(guān)鍵詞,普遍被認為其在該研究領(lǐng)域的影響力較大[28]。表1 中,中心頻度大于0.1 的關(guān)鍵詞從大到小依次為機器視覺、圖像處理、缺陷檢測、支持向量機、計算機視覺、表面缺陷檢測、表面缺陷、模板匹配、深度學(xué)習(xí)、邊緣檢測。
2.2.2 關(guān)鍵詞演進分析
圖2 關(guān)鍵詞分布圖
表1 文獻中出現(xiàn)頻次高于15的關(guān)鍵詞
為清楚呈現(xiàn)我國機器視覺缺陷檢測研究的整體脈絡(luò),本文繪制了基于時間軸的中國機器視覺缺陷檢測研究趨勢演進圖(如圖3所示),可以看出該領(lǐng)域研究熱點總體上從宏觀的圍繞機器視覺的缺陷檢測、圖像處理、深度學(xué)習(xí)逐步向表面缺陷、圖像分割、數(shù)字圖像處理、模式識別、自適應(yīng)閾值、神經(jīng)網(wǎng)絡(luò)、分類器、中值濾波、人工智能與最小二乘法等細分領(lǐng)域研究拓展。圖中詞語字體和圓圈的大小反映了機器視覺缺陷檢測研究的熱度,關(guān)鍵詞之間的連線表示它們的關(guān)聯(lián)關(guān)系。此外,從圖3中的連線也進一步反映出關(guān)聯(lián)詞之間的這種關(guān)系在時間跨度上有演進趨勢,如在1995 年的關(guān)鍵詞“缺陷檢測”中就包含關(guān)鍵詞“最小二乘法”。
2.2.3 關(guān)鍵詞聚類分析
關(guān)鍵詞共現(xiàn)分析和演進分析能夠直觀呈現(xiàn)目前機器視覺缺陷檢測研究熱點內(nèi)容以及脈絡(luò)[29],但是由于機器視覺與各行業(yè)深度融合是目前各個領(lǐng)域的研究熱點,尤其是機器視覺在檢測領(lǐng)域的相關(guān)研究與應(yīng)用,造成該領(lǐng)域以機器視覺為核心的相關(guān)研究日益多元化,不僅研究的內(nèi)容繁多,而且比較分散,未形成系統(tǒng)的研究框架。因此,本文對統(tǒng)計的全部關(guān)鍵詞進行聚類分析,并根據(jù)各聚類關(guān)鍵詞的組成,總結(jié)出各聚類的名稱與研究內(nèi)容,以梳理機器視覺缺陷檢測研究的整體框架,探究目前機器視覺相關(guān)研究的主要領(lǐng)域,使相關(guān)研究更加體系化,突顯機器視覺檢測研究的熱門領(lǐng)域,也為預(yù)測未來機器視覺檢測熱門研究奠定基礎(chǔ)。本文采用UltraEdit對關(guān)鍵詞去重,用Endnote 軟件將數(shù)據(jù)格式轉(zhuǎn)換成RIS格式,然后通過Vosviewer軟件對關(guān)鍵詞進行聚類分析,閾值選擇為2,最終生成8個聚類(表2)。
圖3 研究趨勢演進圖
表2 關(guān)鍵詞聚類
由表2可知,8個聚類由不同的研究內(nèi)容組成,代表8種不同研究領(lǐng)域,即目前機器視覺缺陷檢測的相關(guān)研究主要集中在“缺陷”“缺陷檢測”“visionpro”“特征提取”“mura缺陷”“模板匹配”“表面缺陷”“模式識別”8 個領(lǐng)域。
2.2.4 戰(zhàn)略坐標(biāo)分析
本文以各細分領(lǐng)域研究關(guān)注度為橫軸,研究新穎度為縱軸,繪制機器視覺研究細分領(lǐng)域戰(zhàn)略坐標(biāo)圖,探究目前機器視覺研究的熱門領(lǐng)域及未來的熱門領(lǐng)域,使8個細分研究領(lǐng)域分別落入不同的象限,如圖4 所示,圖中每個散點代表一個細分研究領(lǐng)域。
在區(qū)塊鏈技術(shù)日益被廣泛關(guān)注和逐漸蓬勃發(fā)展應(yīng)用的大背景下,本文以肉類食品為例,從傳統(tǒng)供應(yīng)鏈出發(fā),分析了傳統(tǒng)供應(yīng)鏈中各個節(jié)點對接的不足,說明了區(qū)塊鏈技術(shù)的優(yōu)點,并與供應(yīng)鏈進行結(jié)合,解決傳統(tǒng)供應(yīng)鏈中信息不對稱,對接效率低等問題,研究了區(qū)塊鏈與供應(yīng)鏈結(jié)合的新管理模式與如何實現(xiàn)產(chǎn)品溯源、防偽驗證等技術(shù)問題。目前,我國對于區(qū)塊鏈在供應(yīng)鏈中的應(yīng)用還處于探索時期,所以,我們應(yīng)該更多的對區(qū)塊鏈在供應(yīng)鏈上的應(yīng)用多加研究,將理論方面的創(chuàng)新實踐到實際生活中,才能讓區(qū)塊鏈技術(shù)有更大的突破。
圖4 戰(zhàn)略坐標(biāo)圖
從4個象限的分布情況看,領(lǐng)域#5“模板匹配”位于第一象限,該象限為熱門研究領(lǐng)域,其代表的研究內(nèi)容具有高頻次與高中心度特點,且與其他研究領(lǐng)域具有較高的關(guān)聯(lián)度。領(lǐng)域#2、#4、#7、#0“visionpro”“mura缺陷”“模式識別”“缺陷”位于第二象限,該象限為高潛熱門領(lǐng)域,其代表的研究內(nèi)容具有低頻次、高中心度特點,表明表面缺陷檢測、邊緣檢測識別、視覺程序軟件開發(fā)、計算機視覺自動檢測是未來研究的熱門領(lǐng)域。領(lǐng)域#6“表面缺陷”位于第三象限,該象限為孤島領(lǐng)域,其代表的研究內(nèi)容既不具備高頻次,也不具有高中心度,表明該領(lǐng)域并不是機器視覺缺陷檢測研究的核心內(nèi)容,相關(guān)研究比較少并且未形成完整的研究體系。但該研究領(lǐng)域部分關(guān)鍵詞處于機器視覺缺陷檢測研究熱點的邊緣,如“表面缺陷”(頻次54;中心度0.46)、“圖像分割”(頻次12;中心度0.11),也有可能發(fā)展為機器視覺缺陷檢測研究的熱點。領(lǐng)域#1、#3“缺陷檢測”“特征提取”位于第四象限,該象限為邊緣領(lǐng)域,其代表的研究內(nèi)容具有高頻次、低中心頻度的特點,說明該領(lǐng)域也是目前機器視覺缺陷檢測研究的熱門領(lǐng)域,但與其他研究領(lǐng)域的關(guān)聯(lián)度不高。
2.2.5 凸顯關(guān)鍵詞
凸顯詞指在較短時間內(nèi)出現(xiàn)較多或使用頻率較高的詞,根據(jù)凸顯詞的詞頻變化可以判斷研究領(lǐng)域的前沿與趨勢[30]?;贑iteSpace的凸顯詞分析,得到機器視覺缺陷檢測凸顯主題及對應(yīng)的凸顯率(如圖5 所示)?!吧疃葘W(xué)習(xí)”“表面缺陷”“計算機視覺”“pcb”“在線檢測”“視覺檢測”“邊緣檢測”是機器視覺缺陷檢測研究的熱點,其中“深度學(xué)習(xí)”主要體現(xiàn)在1995—2007 年,“表面缺陷”體現(xiàn)在2001—2010年,“計算機視覺”體現(xiàn)在2004—2011 年,“pcb”體現(xiàn)在 2007—2013 年,“在線檢測”體現(xiàn)在 2010—2016 年,“視覺檢測”體現(xiàn)在2014—2017 年,“邊緣檢測”體現(xiàn)在2017—2020 年,并且研究趨勢表現(xiàn)為逐年上升。這在一定程度上說明,目前國內(nèi)機器視覺缺陷檢測研究前沿主要體現(xiàn)在深度學(xué)習(xí)、表面缺陷、計算機視覺、pcb、在線檢測、視覺檢測、邊緣檢測等主題。
在文獻計量分析中,通常需要尋找核心作者以發(fā)現(xiàn)某研究領(lǐng)域的骨干力量。核心作者是指發(fā)文數(shù)量較多并且影響力較大的作者[31]。本文依據(jù)普賴斯公式進行統(tǒng)計分析:
式中,M為核心作者發(fā)文數(shù)(篇),Nmax為統(tǒng)計年限中發(fā)文量最多的作者的發(fā)文數(shù)(篇)。發(fā)文量為M篇及以上的作者即為核心作者[32]。經(jīng)統(tǒng)計,中國機器視覺缺陷檢測研究領(lǐng)域Nmax=7,將該數(shù)值帶入式(1)中,求得M≈1.98,取M值為2,即發(fā)文量為2 篇及以上的作者為中國機器視覺缺陷檢測研究領(lǐng)域的核心作者。
根據(jù)統(tǒng)計結(jié)果,參與發(fā)表論文的作者總?cè)藬?shù)為615人,核心作者人數(shù)為126 人,占總?cè)藬?shù)的比例為20.5%,總發(fā)文量為295篇,占總發(fā)文篇數(shù)的50.2%,符合普賴斯理論中“核心作者發(fā)文數(shù)量占總發(fā)文數(shù)量50%”的觀點[33]。
圖5 關(guān)鍵詞凸顯率
圖6為中國機器視覺缺陷檢測研究發(fā)文作者分布圖,由圖6左上角的信息說明窗口可知:N=126,E=126,Density=0.016。其中,N為節(jié)點數(shù),表示此種參數(shù)組合下提取的作者數(shù)量;E為連線數(shù),表示作者間的合作程度,連線越多表明作者間的合作越密切;Density表示網(wǎng)絡(luò)密度[34]。圖6 中的連線數(shù)小于節(jié)點數(shù),說明在中國機器視覺缺陷檢測研究中,作者間的聯(lián)系較少,密度較低。其中,存在較多的單點,說明有部分學(xué)者處于獨立研究狀態(tài);雙點合作如李江波和饒秀勤等表明其研究聯(lián)系較少;三角形合作如喬湘洋、祁超飛和王海芳等表明其研究合作關(guān)系相對穩(wěn)固;以王耀南、彭玉、范濤、周顯恩、劉學(xué)兵等作者為中心點的合作研究網(wǎng)絡(luò)最為緊密,且處于同一個網(wǎng)格之中,有可能是實驗室間相互合作或者同門之間的相互合作。
圖6 發(fā)文作者分布圖
通過對發(fā)文作者所屬機構(gòu)的統(tǒng)計分析可知,本研究設(shè)計的作者分布在108 個機構(gòu)中,發(fā)文數(shù)量在5 篇及以上的機構(gòu)有7個(表3)。其中發(fā)文最多的機構(gòu)為廣東工業(yè)大學(xué)自動化學(xué)院,發(fā)文量共計10篇;其次為四川大學(xué)制造科學(xué)與工程學(xué)院,發(fā)文量共計8 篇;緊隨其后的為江南大學(xué)輕工過程先進控制教育部重點實驗室和上海理工大學(xué)光電信息與計算機工程學(xué)院,發(fā)文量都為6篇。
表3 發(fā)文量較多的機構(gòu)
圖7為中國機器視覺缺陷檢測研究發(fā)文機構(gòu)圖,圖中節(jié)點圓圈大小和發(fā)文機構(gòu)字號大小與發(fā)文機構(gòu)在該研究領(lǐng)域中的研究成果成正比關(guān)系,節(jié)點越大表示該機構(gòu)在中國機器視覺缺陷檢測研究方面的成果越豐富[35]。同時,由圖7 還可以看出:目前,盡管在全國已形成以廣東工業(yè)大學(xué)自動化學(xué)院和四川大學(xué)制造科學(xué)與工程學(xué)院為代表的機器視覺缺陷檢測研究中心,但不同機構(gòu)相互之間的合作研究在不斷加強,并逐漸形成一定的合作網(wǎng)絡(luò)。其中,上海理工大學(xué)光電信息與計算機工程學(xué)院、廣東華中科技大學(xué)工業(yè)技術(shù)研究院廣東省制造裝備數(shù)字化重點實驗室和湖南大學(xué)電氣與信息工程學(xué)院等大部分機構(gòu)為獨立研究狀態(tài);中國科學(xué)院大學(xué)人工智能學(xué)院和中國科學(xué)院自動化研究所精密感知與控制研究中心等為相互合作的狀態(tài);中國科學(xué)院成都計算機應(yīng)用研究所、國網(wǎng)重慶市電力公司電力科學(xué)研究院和中國科學(xué)院大學(xué)為三角形合作,合作關(guān)系較為穩(wěn)固。
圖7 發(fā)文機構(gòu)圖
對刊發(fā)學(xué)術(shù)文獻的期刊進行分析,有助于了解該研究領(lǐng)域的核心期刊群,為學(xué)者選擇文獻發(fā)表平臺、搜索資料提供指導(dǎo)[36]。本文篩選出的588篇文獻中載文7篇及以上的期刊共發(fā)文106篇,占總發(fā)文量的18%(表4)。其中,《激光與光電子學(xué)進展》《制造業(yè)自動化》分別載文14篇,同居榜首,其發(fā)文量略高于其他期刊;《包裝工程》《計算機測量與控制》分別載文12 篇,緊隨其后;《機床與液壓》《組合機床與自動化加工技術(shù)》分別載文11篇;《電子測量與儀器學(xué)報》共載文10 篇;《機械設(shè)計與制造》共載文8篇;《計算機工程與應(yīng)用》《儀表技術(shù)與傳感器》分別載文7篇;其余期刊的發(fā)文量則在7篇以下。
表4 刊載論文7篇以上的期刊
根據(jù)布拉德福定律,將期刊刊載某學(xué)科領(lǐng)域的論文數(shù)量以遞減順序排列,可把該學(xué)科領(lǐng)域的期刊分為核心區(qū)期刊、相關(guān)區(qū)期刊和非相關(guān)區(qū)期刊3 種類型[37]。其計算公式如下:
式中,r0為核心區(qū)期刊,E 為歐拉系數(shù)(E=0.577 2),Y為當(dāng)前領(lǐng)域最大載文量期刊的載文量。本研究中Y=14,通過計算可得r0≈6.4,按照四舍五入原則,取r0的值為6,即處于核心區(qū)的期刊有6 種,分別為《激光與光電子學(xué)進展》《制造業(yè)自動化》《包裝工程》《計算機測量與控制》《機床與液壓》《組合機床與自動化加工技術(shù)》,它們是目前刊載機器視覺缺陷檢測研究成果的主要期刊,反映出這些期刊的辦刊宗旨及對刊發(fā)機器視覺缺陷檢測研究成果的傾向。
本研究的分析樣本來源于中國知網(wǎng)(CNKI)數(shù)據(jù)庫中1995—2020年共588篇期刊文獻,改變了以前傳統(tǒng)的定性分析以及描述統(tǒng)計,綜合運用文獻計量及知識圖譜分析方法,揭示了中國機器視覺缺陷檢測研究的多維結(jié)構(gòu)和網(wǎng)絡(luò)關(guān)系。主要得出以下結(jié)論:
(1)根據(jù)文獻產(chǎn)出逐年變化情況,將1995—2020 年中國機器視覺缺陷檢測研究歷程劃分為3個階段:初步探索階段(1995—2005 年)、快速增長階段(2006—2011年)和高速增長階段(2012—2020 年)。從整個時期來看,發(fā)文數(shù)量總體呈上升趨勢。
(2)在研究關(guān)鍵詞中,機器視覺、圖像處理、缺陷檢測、支持向量機、計算機視覺、表面缺陷檢測等為該領(lǐng)域的核心詞;在關(guān)鍵詞演進分析中,該領(lǐng)域研究熱點總體上從宏觀的圍繞機器視覺的缺陷檢測、圖像處理、深度學(xué)習(xí)逐步向表面缺陷、圖像分割、數(shù)字圖像處理、人工智能與最小二乘法等細分領(lǐng)域拓展。
(3)在發(fā)文作者上,以王耀南、彭玉、范濤及其團隊為引領(lǐng)而取得的成果最為豐碩;在研究機構(gòu)上,以廣東工業(yè)大學(xué)自動化學(xué)院、四川大學(xué)制造科學(xué)與工程學(xué)院為代表的科研院所占據(jù)重要地位;在刊文載體上,已形成由《激光與光電子學(xué)進展》《制造業(yè)自動化》《包裝工程》《計算機測量與控制》《機床與液壓》等9 種期刊組成的核心期刊群。
本文也存在一定局限性:第一,未對機器視覺缺陷檢測引用數(shù)量進行統(tǒng)計,未來可對其深入統(tǒng)計和分析,利于快速、準(zhǔn)確查找對該領(lǐng)域有重要影響和價值的文獻。第二,未對機器視覺缺陷檢測發(fā)文地區(qū)分布情況進行統(tǒng)計分析,未來研究可對發(fā)文地區(qū)分布進行分析,能夠明確目前各地區(qū)對該領(lǐng)域研究內(nèi)容及數(shù)量的差異,為促進各研究機構(gòu)的跨地域合作、交流提供指引。第三,本文僅對知網(wǎng)的全部期刊,如核心期刊、CSCD期刊、EI期刊等數(shù)據(jù)庫中的文獻做統(tǒng)計與分析,未來研究可對國內(nèi)全部中文數(shù)據(jù)庫中該領(lǐng)域的文獻進行統(tǒng)計和分析,進一步增強研究結(jié)論的說服力。