焦李成,高新波,韓軍偉,李云松,白翔,楊淑媛,孟德宇,任文琦,石爭浩,陳秀妍
1.西安電子科技大學(xué),西安 710071;2.重慶郵電大學(xué),重慶 400065;3.西北工業(yè)大學(xué),西安 710021;4.華中科技大學(xué),武漢 430074;5.西安交通大學(xué),西安 710049;6.中山大學(xué),深圳 518107;7.西安理工大學(xué),西安 710048;8.《中國圖象圖形學(xué)報》編輯部,北京 100190
圖像目標(biāo)檢測在區(qū)域監(jiān)控、被動導(dǎo)航、搶險救災(zāi)、飛行器制導(dǎo)等方面具有重要應(yīng)用,是計算機(jī)視覺和圖像處理領(lǐng)域研究中的關(guān)鍵性核心問題和挑戰(zhàn)性難題,也一直是該領(lǐng)域的研究熱點(diǎn),并受到領(lǐng)域內(nèi)廣大學(xué)者的高度關(guān)注。近年來,得益于深度學(xué)習(xí)等人工智能技術(shù)在圖像處理和計算機(jī)視覺中的廣泛應(yīng)用,圖像目標(biāo)檢測技術(shù)研究已取得重大進(jìn)展。但現(xiàn)有研究大多是在引入了很多相關(guān)假設(shè)的簡化場景中,對簡單場景下的目標(biāo)進(jìn)行檢測。由于缺乏恰當(dāng)?shù)闹R表示和推理方法,從而大大限制了其所能應(yīng)用的問題規(guī)模和場景復(fù)雜性。針對復(fù)雜場景下的圖像目標(biāo)檢測依然有很多問題需要人們?nèi)パ芯亢徒鉀Q。
為了更好地推動復(fù)雜場景圖像目標(biāo)智能檢測技術(shù)與應(yīng)用的發(fā)展,及時記錄我國學(xué)者在相關(guān)領(lǐng)域的最新研究進(jìn)展,促進(jìn)學(xué)術(shù)交流和技術(shù)創(chuàng)新,《中國圖象圖形學(xué)報》邀請業(yè)內(nèi)專家共同策劃推出“復(fù)雜場景圖像目標(biāo)智能檢測”專欄,主要收錄國內(nèi)學(xué)者在相關(guān)領(lǐng)域具有創(chuàng)新性、突破性的研究成果。以期為相關(guān)領(lǐng)域的研究人員提供參考。
經(jīng)過嚴(yán)格評審,“復(fù)雜場景圖像目標(biāo)智能檢測”專欄共收錄9 篇論文,包括5 篇綜述和4 篇算法論文:
《無人機(jī)視角下的目標(biāo)檢測研究進(jìn)展》(作者:冷佳旭,莫夢竟成,周應(yīng)華,葉永明,高陳強(qiáng),高新波*)介紹了無人機(jī)視角下的目標(biāo)檢測概念,并總結(jié)無人機(jī)視角下目標(biāo)檢測所面臨的目標(biāo)尺度、空間分布、樣本數(shù)量、類別語義以及優(yōu)化目標(biāo)等5 大不均衡挑戰(zhàn);重點(diǎn)闡述并總結(jié)分析從數(shù)據(jù)增強(qiáng)策略、多尺度特征融合、區(qū)域聚焦策略、多任務(wù)學(xué)習(xí)以及模型輕量化等方面來提升無人機(jī)視角下目標(biāo)檢測性能的方法;全面介紹基于無人機(jī)視角的目標(biāo)檢測數(shù)據(jù)集,并對已有算法在兩個常用公共數(shù)據(jù)集上進(jìn)行性能評估;對無人機(jī)視角下目標(biāo)檢測技術(shù)的未來發(fā)展方向進(jìn)行展望。
《小目標(biāo)檢測研究綜述》(作者:潘曉英,賈凝心*,穆元震,高炫蓉)綜述了國內(nèi)外小目標(biāo)檢測的研究現(xiàn)狀及成果,歸納分析了常用的小目標(biāo)數(shù)據(jù)集,從數(shù)據(jù)增強(qiáng)、超分辨率、多尺度特征融合、上下文語義信息、錨框機(jī)制、注意力機(jī)制以及特定的檢測場景等方面系統(tǒng)總結(jié)了小目標(biāo)檢測方法,并對未來研究方向進(jìn)行了分析與展望。
《航空遙感圖像深度學(xué)習(xí)目標(biāo)檢測技術(shù)研究進(jìn)展》(作者:石爭浩*,仵晨偉,李成建,尤珍臻,王泉,馬城城)對航空遙感圖像深度學(xué)習(xí)目標(biāo)檢測算法,特別是近三年國內(nèi)外的研究方法,進(jìn)行了系統(tǒng)梳理和總結(jié)分析,并指出現(xiàn)階段航空遙感圖像目標(biāo)檢測研究中存在的問題,對未來研究以及發(fā)展趨勢進(jìn)行了展望。
《圖像級標(biāo)記弱監(jiān)督目標(biāo)檢測綜述》(作者:陳震元,王振東,宮辰*)介紹了弱監(jiān)督目標(biāo)檢測的問題定義、基礎(chǔ)框架和面臨的主要難題;按核心網(wǎng)絡(luò)架構(gòu)將現(xiàn)有典型算法歸納為基于優(yōu)化候選框生成的算法、結(jié)合分割的算法和基于自訓(xùn)練的算法,并分析了各種算法的特點(diǎn)及其優(yōu)缺點(diǎn);在多個公共數(shù)據(jù)集和多種指標(biāo)上對主流算法進(jìn)行了效果驗證和比較;根據(jù)現(xiàn)有算法的不足,并以進(jìn)一步解決主要難題為目標(biāo),提出了該領(lǐng)域有價值的未來研究方向。
《Transformer 驅(qū)動的圖像分類研究進(jìn)展》(作者:石爭浩,李成建*,周亮,張治軍,仵晨偉,尤珍臻,任文琦)分類總結(jié)近年來Transformer 驅(qū)動的深度學(xué)習(xí)圖像分類方法和模型,介紹各類方法的核心思想,分析存在的問題及可能的解決方案;梳理Transformer驅(qū)動的深度學(xué)習(xí)圖像分類任務(wù)需要解決的關(guān)鍵性科學(xué)問題,并對未來研究方向及發(fā)展趨勢進(jìn)行展望。
《夜間多場景的臨近感知實時行人檢測算法》(作者:龔安,李中浩*,梁辰宏)將低光增強(qiáng)算法添加到夜間行人檢測任務(wù)中進(jìn)行聯(lián)合訓(xùn)練,并引入臨近感知模塊NOH,提出了一種改進(jìn)的夜間監(jiān)控場景下的臨近感知行人檢測算法NSPDet。NSPDet 提升了基線模型夜間行人檢測的精度,具備實時推理性能,在夜間復(fù)雜場景下表現(xiàn)出良好的魯棒性。
《結(jié)合旋轉(zhuǎn)框和注意力機(jī)制的輕量遙感圖像檢測模型》(作者:李朝輝,安金堂*,賈紅雨,方艷)以光學(xué)遙感圖像為實例背景設(shè)計了一種端到端的輕量級旋轉(zhuǎn)框目標(biāo)檢測模型YOLO-RMV4,使模型精度和參數(shù)量達(dá)到強(qiáng)平衡。
《結(jié)合環(huán)狀原型空間優(yōu)化的開放集目標(biāo)檢測》(作者:孫旭豪,沈陽,魏秀參*,安鵬)提出了一種基于環(huán)狀原型空間優(yōu)化的開放集目標(biāo)檢測框架。實驗證明,在不改變模型封閉集識別性能的情況下,本文提出的框架具有更強(qiáng)的開放集類別檢測能力。
《外觀和運(yùn)動模式感知的有絲分裂細(xì)胞檢測》(作者:林凡超,謝洪濤,劉傳彬*,張勇東)提出基于外觀和運(yùn)動模式感知的檢測框架,通過兩階段預(yù)處理和對細(xì)胞狀態(tài)模式的判別性學(xué)習(xí),能夠?qū)崿F(xiàn)復(fù)雜場景下的精準(zhǔn)預(yù)測。
我們期待廣大讀者和科技人員通過“復(fù)雜場景圖像目標(biāo)智能檢測”專欄,能夠更深入、更全面地了解該領(lǐng)域的最新方法和應(yīng)用,吸引更多學(xué)者從事相關(guān)研究并產(chǎn)生具有國際影響力的優(yōu)秀成果,為本領(lǐng)域發(fā)展做出新的貢獻(xiàn)。
專欄編委會:
焦李成,歐洲科學(xué)院外籍院士、俄羅斯自然科學(xué)院外籍院士、西安電子科技大學(xué)教授,研究領(lǐng)域為智能感知與圖像理解、深度學(xué)習(xí)與類腦計算、進(jìn)化優(yōu)化與遙感解譯。
高新波,重慶郵電大學(xué)教授,研究領(lǐng)域為人工智能、機(jī)器學(xué)習(xí)、計算機(jī)視覺、模式識別。
韓軍偉,西北工業(yè)大學(xué)教授,研究領(lǐng)域為人工智能、模式識別、類腦計算、遙感影像解譯。
李云松,西安電子科技大學(xué)教授,研究領(lǐng)域為遙感圖像編碼、處理、高性能計算以及芯片設(shè)計。
白翔,華中科技大學(xué)教授,研究領(lǐng)域為模式識別、計算機(jī)視覺、文檔分析與識別。
楊淑媛,西安電子科技大學(xué)教授,研究領(lǐng)域為智能目標(biāo)感知與解譯。
孟德宇,西安交通大學(xué)教授,研究領(lǐng)域為機(jī)器學(xué)習(xí)、人工智能、計算機(jī)視覺。
任文琦,中山大學(xué)副教授,研究領(lǐng)域為圖像/視頻處理與增強(qiáng)。
石爭浩,西安理工大學(xué)教授,研究領(lǐng)域為機(jī)器視覺、醫(yī)學(xué)圖像處理及機(jī)器學(xué)習(xí)。
專欄編輯:
陳秀妍,編輯,主要研究方向為學(xué)術(shù)出版和媒體傳播等。E-mail:chenxy@aircas.ac.cn