摘 要:跨域圖像空間數(shù)據(jù)少樣本學(xué)習(xí)(FewShot Learning,FSL) 是近年來機器學(xué)習(xí)研究領(lǐng)域的熱點,旨在利用少量的有標簽圖像空間源域數(shù)據(jù)訓(xùn)練一個可靠的模型對分布差異大的圖像目標域數(shù)據(jù)進行分類。概述了近年來主要的跨域圖像空間數(shù)據(jù)FSL 模型,根據(jù)模型解決問題的主要思想,將其分類為數(shù)據(jù)引入法、特征增強法、參數(shù)控制法以及混合法。將數(shù)據(jù)引入法細分為基于單源域數(shù)據(jù)、基于多源域數(shù)據(jù)和基于目標域數(shù)據(jù);將特征增強法細分為特征轉(zhuǎn)換和特征融合;將混合法細分為不同方法的結(jié)合使用和不同類型損失函數(shù)的結(jié)合使用,并總結(jié)了不同方法的原理、優(yōu)點與不足。對當前跨域圖像空間FSL 常用的數(shù)據(jù)集、基準進行了詳細介紹,在主流基準上對經(jīng)典模型的實驗結(jié)果進行對比與分析。對當前跨域圖像空間數(shù)據(jù)FSL 面臨的挑戰(zhàn)進行總結(jié),指出未來可能的發(fā)展方向。
關(guān)鍵詞:少樣本學(xué)習(xí);跨域少樣本學(xué)習(xí);圖像空間;特征增強
中圖分類號:TP391. 4 文獻標志碼:A
文章編號:1003-3106(2024)12-2800-20
0 引言
隨著大數(shù)據(jù)時代的到來,深度學(xué)習(xí)模型已經(jīng)在圖像分類[1-2]、目標檢測[3-4]、圖像合成[5-6]等計算機視覺任務(wù)方面取得了令人矚目的成果并得到了廣泛應(yīng)用。但深度學(xué)習(xí)模型的成功很大程度上依賴于大規(guī)模的標記數(shù)據(jù)集。與此同時,現(xiàn)實生活中有許多特殊領(lǐng)域,如新型病毒、稀有物種、軍事應(yīng)用等,由于數(shù)據(jù)本身有限,再加上標注成本高,使得獲取大量標記數(shù)據(jù)變得十分困難,嚴重限制了深度學(xué)習(xí)模型的應(yīng)用范圍并影響其進一步發(fā)展。