近幾年,人工智能技術(shù)發(fā)展的如火如荼。就在前不久,兩年一度的世界計算機視覺領(lǐng)域頂級會議ECCV2020的各項挑戰(zhàn)賽結(jié)果出爐。其中,在圖像分類賽中,阿里安全的高效AI分類技術(shù)超越三星、深蘭科技、同濟大學等國內(nèi)外多支隊伍的同類技術(shù),獲得冠軍。
目前人工智能的崛起以海量的帶標簽訓練數(shù)據(jù)作為基石,海量數(shù)據(jù)可以保障AI模型的效果,但是數(shù)據(jù)的收集和標注需要昂貴的人力成本,進行訓練則需要消耗大量計算資源。ECCV2020分類比賽的難題是,與其他比賽動輒使用十幾萬的數(shù)據(jù)不同,ECCV2020的分類比賽共有1000個類別,每個類別僅有50張圖片作為訓練數(shù)據(jù)。比賽要求選手在不使用任何預訓練模型和額外數(shù)據(jù)情況下,從零訓練模型。這意味著訓練難度巨大,幾乎是不可能完成的任務。
不過,這也正是ECCV2020為了考驗參賽隊伍如何對來之不易的訓練數(shù)據(jù)進行充分利用,促使AI神經(jīng)網(wǎng)絡進行高效學習,降低神經(jīng)網(wǎng)絡訓練過程中的人力和計算資源消耗,也就是說,參賽隊伍要打造一個高效能、低成本的分類AI。
阿里安全圖靈實驗室算法工程師夜清介紹,阿里安全智能算法團隊從三個技術(shù)方向進行了突破:利用隨機抽取的兩張訓練圖像,使用數(shù)據(jù)增強并進行拼接,最大程度豐富訓練樣本資源;設(shè)計獨特的神經(jīng)網(wǎng)絡結(jié)構(gòu),加入顯著性特征模塊挖掘樣本的特點,提升分類性能;利用分層語義結(jié)構(gòu),讓AI模型更好地挖掘數(shù)據(jù),實現(xiàn)更好的學習效果。
阿里安全圖靈實驗室資深算法專家華棠認為,高效AI分類技術(shù)極大程度上解決了計算資源消耗和數(shù)據(jù)標注的人力成本問題,為自動駕駛、物體識別、智慧城市等領(lǐng)域提供了新的思路和方法。
在線下新零售場景中,對于新上架的一件商品,原來AI工程師們需要從不同的角度、光照條件和位置拍攝,收集幾千甚至上萬張圖片并進行標注,用于訓練模型,才可以保證AI模型能充分學習到該商品的特征。而在阿里安全提出的方案下,商品圖片數(shù)量縮減到50張以下,就能保證模型的識別能力。
“我們的方法還可以與自監(jiān)督有效的結(jié)合,在學習更好的數(shù)據(jù)表征基礎(chǔ)上,指導模型高效學習,獲得更好的識別能力?!币骨逭f。
目前,阿里安全這項基于小規(guī)模圖像的高效AI技術(shù)已應用在知識產(chǎn)權(quán)商標識別、通用商品識別和動植物保護等場景中。這類場景類別數(shù)量多,每個類別樣本數(shù)量較少,而預訓練任務和目標任務存在差異,預訓練模型可能損害目標任務的準確率,這個方案恰恰能夠解決上述問題。
“以某知名品牌運動鞋上新為例,一段時間內(nèi)我們僅能獲得該產(chǎn)品不同的配色以及商品幾個不同角度的圖片。在僅有少量商品展示圖的情況下,通過高效AI方案,我們在新產(chǎn)品問世的極短時間內(nèi)實現(xiàn)新款商品識別能力的覆蓋,降低新產(chǎn)品被山寨和假冒的風險。”華棠說。