黃斌+盧金金+王建華+吳星明+陳偉海
摘 要:針對(duì)傳統(tǒng)物體識(shí)別算法中人工設(shè)計(jì)出來(lái)的特征易受物體形態(tài)多樣性、光照和背景的影響,提出了一種基于深度卷神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法。該算法基于NYU Depth V2場(chǎng)景數(shù)據(jù)庫(kù),首先將單通道深度信息轉(zhuǎn)換為三通道;再用訓(xùn)練集中的彩色圖片和轉(zhuǎn)換后的三通道深度圖片分別微調(diào)兩個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)模型;然后用訓(xùn)練好的模型對(duì)重采樣訓(xùn)練集中的彩色和深度圖片提取模型第一個(gè)全連接層的特征,并將兩種模態(tài)的特征串聯(lián)起來(lái),訓(xùn)練線性支持向量機(jī)(LinSVM);最后將所提算法應(yīng)用到場(chǎng)景理解任務(wù)中的超像素特征提取。所提方法在測(cè)試集上的物體分類準(zhǔn)確度可達(dá)到91.4%,比SAE-RNN方法提高4.1個(gè)百分點(diǎn)。實(shí)驗(yàn)結(jié)果表明所提方法可提取彩色和深度圖片高層特征,有效提高物體分類準(zhǔn)確度。
關(guān)鍵詞:計(jì)算機(jī)視覺(jué);卷積神經(jīng)網(wǎng)絡(luò);特征提取;線性支持向量機(jī);物體識(shí)別;場(chǎng)景理解
中圖分類號(hào):TP391.4
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-9081(2016)12-3333-08