在最近被ECCV2020接收的論文AutoSTR中,第四范式的研究人員提出了使用網(wǎng)絡(luò)結(jié)構(gòu)搜索技術(shù)來自動(dòng)化設(shè)計(jì)文本識(shí)別網(wǎng)絡(luò)中的特征序列提取器,以提升文本識(shí)別任務(wù)的性能。由于文本的多樣性和場景的復(fù)雜性,通過對圖像預(yù)處理模塊(如校正和去模糊)或特征序列翻譯模塊的改進(jìn),提高文本識(shí)別網(wǎng)絡(luò)的性能越來越受到各方關(guān)注。
研究團(tuán)隊(duì)提出以AutoSTR來搜索數(shù)據(jù)相關(guān)的主干網(wǎng)絡(luò)。他們?yōu)镾TR設(shè)計(jì)了一個(gè)特定領(lǐng)域的搜索空間,既包含了操作上的選擇,也包含了對下采樣路徑的約束。通過一個(gè)兩步搜索算法將操作和下采樣路徑分離,以在給定的空間內(nèi)進(jìn)行有效的搜索。實(shí)驗(yàn)表明,通過搜索數(shù)據(jù)相關(guān)的主干網(wǎng)絡(luò),AutoSTR可以在標(biāo)準(zhǔn)基準(zhǔn)測試中優(yōu)于其他SOTA方法。