【摘要】隨著人工智能技術(shù)的發(fā)展,圖像識(shí)別技術(shù)水平不斷提升,極大地改變傳統(tǒng)的圖像識(shí)別方式,通過(guò)運(yùn)用大數(shù)據(jù),保證實(shí)際的識(shí)別準(zhǔn)確率。但是不同深度學(xué)習(xí)系統(tǒng)具有各自的優(yōu)勢(shì)和缺點(diǎn)。因此,本文結(jié)合深度學(xué)習(xí)系統(tǒng)的圖像識(shí)別方法進(jìn)行分析論述。
【關(guān)鍵詞】深度學(xué)習(xí)系統(tǒng) 圖像識(shí)別 方法 分析
【課題項(xiàng)目】湘潭市科技指導(dǎo)性計(jì)劃項(xiàng)目,課題名稱:《基于卷積深度學(xué)習(xí)系統(tǒng)的圖像識(shí)別方法研究》,課題編號(hào):ZJ20171019。
【中圖分類號(hào)】TP391.41 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2019)10-0231-02
圖片作為互聯(lián)網(wǎng)時(shí)代重要信息載體,為人們生產(chǎn)生活提供了極大的便利。在進(jìn)行圖像識(shí)別過(guò)程中,圖片中包含大量的信息,這就需要技術(shù)人員深度分析學(xué)習(xí)模型,結(jié)合圖片的特征,利用大數(shù)據(jù)處理技術(shù),做好信息的提取,分析不同單元之間的聯(lián)系,真正發(fā)現(xiàn)圖像內(nèi)部的結(jié)構(gòu)特征。因此,本文從深度學(xué)習(xí)系統(tǒng)入手,就如何做好圖像識(shí)別展開(kāi)論述,并且提出合理化建議與意見(jiàn)。
一、卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的具體應(yīng)用
(一)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)稱CNN,屬于深度前饋神經(jīng)網(wǎng)絡(luò),主要包括以下幾方面的內(nèi)容:第一,卷基層,屬于整個(gè)卷積神經(jīng)網(wǎng)絡(luò)的核心構(gòu)件,是一個(gè)權(quán)值矩陣,通過(guò)對(duì)原始圖像矩陣分析,可以提取特定信息,滿足實(shí)際分析的要求。在多層卷積中,第一層主要提取一般的特征。對(duì)于深層的卷積神經(jīng)網(wǎng)絡(luò),可以提取更加復(fù)雜的特征。為了有效解決不同位置像素點(diǎn)利用率不同的問(wèn)題,技術(shù)人員可以采取填充的方式,通過(guò)卷基層,不斷輸出激活圖。第二,池化層,就是為了有效減少網(wǎng)絡(luò)中的計(jì)算量,提升實(shí)際的運(yùn)行速度,通過(guò)引入池化層,技術(shù)人員可以把特征圖分成若干個(gè)區(qū)域,實(shí)現(xiàn)區(qū)域的最大池化,最大限度減少圖像空間,不斷減少計(jì)算量,有效保留輸入圖像的特征。在這種情況下,圖像的尺寸減少。第三,為了實(shí)現(xiàn)圖像不同類別數(shù)量輸出的目標(biāo),技術(shù)人員可以采用全連接層,真正把局部特征融入到整體特征中。同時(shí),技術(shù)人員可以利用損失函數(shù)計(jì)算可能出現(xiàn)的誤差,然后進(jìn)行反向的傳播,通過(guò)不斷更新卷積核參數(shù)的改進(jìn),滿足實(shí)際識(shí)別的基本要求。
(二)卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別應(yīng)用分析
卷積神經(jīng)網(wǎng)絡(luò)基本模型主要包括訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)的圖像,具體包括以下幾層,其中第一層和第三層為卷基層,第二層和第四層為池化層,第五層和第六層為全連接層。另外,輸入層就是把圖片進(jìn)行填充。
二、深度信念網(wǎng)絡(luò)技術(shù)在圖像識(shí)別中的應(yīng)用
(一)深度信念網(wǎng)絡(luò)模型結(jié)構(gòu)
技術(shù)人員利用深度信念網(wǎng)絡(luò),通過(guò)學(xué)習(xí)進(jìn)行概率重構(gòu)。網(wǎng)絡(luò)模型在完成第一個(gè)學(xué)習(xí)步驟以后,可以進(jìn)行監(jiān)督訓(xùn)練,從而構(gòu)成深層神經(jīng)網(wǎng)絡(luò)。根據(jù)實(shí)際運(yùn)行情況,深度信念網(wǎng)絡(luò)模型主要包括預(yù)訓(xùn)練和微調(diào)兩個(gè)步驟。其中預(yù)訓(xùn)練就是預(yù)估初始化的權(quán)重參數(shù),通過(guò)CD算法,然后單獨(dú)訓(xùn)練每一層網(wǎng)絡(luò),具體包括以下幾個(gè)步驟:需要做好可見(jiàn)單元初始化工作,從而獲得訓(xùn)練矢量和權(quán)值矩陣,然后進(jìn)行隱含單元的更新,再利用隱含單元更新可見(jiàn)單元,以上統(tǒng)稱為重建,這就要求技術(shù)人員對(duì)每一層進(jìn)行重建,做好參數(shù)的刷新。在REM完成訓(xùn)練以后,就會(huì)有新的REM進(jìn)行堆積,在最終的訓(xùn)練層進(jìn)行輸入。通過(guò)不同重復(fù)上述過(guò)程,可以滿足實(shí)際的停滯標(biāo)準(zhǔn)。根據(jù)CD算法的要求,其中最大可能性比較粗糙,但是具有良好的有效性。
在完成預(yù)訓(xùn)練之后,技術(shù)人員需要微調(diào)參數(shù)。其中深度信念網(wǎng)絡(luò)的BP神經(jīng)網(wǎng)絡(luò)能夠?qū)τ?xùn)練分類器進(jìn)行監(jiān)督。根據(jù)實(shí)際運(yùn)行的情況,隱含層具有獨(dú)立性的特點(diǎn),其中每一層REM網(wǎng)絡(luò)只能保證層次權(quán)值向特征向量映射實(shí)現(xiàn)最優(yōu),這就需要對(duì)全連接進(jìn)行相應(yīng)的微調(diào)。在利用REM網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練過(guò)程中,是初始化BP網(wǎng)絡(luò)權(quán)值參數(shù),保證參數(shù)的合理性,減少訓(xùn)練時(shí)間,提升運(yùn)行效率。
(二)在圖像識(shí)別中的具體應(yīng)用
深度信念網(wǎng)絡(luò)模型在應(yīng)用到圖像識(shí)別過(guò)程中,極大地提升了識(shí)別的效率,縮短了識(shí)別時(shí)間,可以充分發(fā)揮大數(shù)據(jù)的優(yōu)勢(shì),對(duì)初始權(quán)值參數(shù)進(jìn)行全面優(yōu)化,得到了廣泛的應(yīng)用,滿足了用戶對(duì)圖像識(shí)別的基本要求。在利用深度信念網(wǎng)絡(luò)模型應(yīng)用到手寫字體識(shí)別過(guò)程中,可以設(shè)置成雙層的DBN結(jié)構(gòu),其中隱含層設(shè)置了100個(gè)單元,因此,可以將RBM和BP層的迭代次數(shù)設(shè)置為100,從而滿足實(shí)際識(shí)別的要求。
綜上所述,深度學(xué)習(xí)系統(tǒng)是當(dāng)前智能化技術(shù)發(fā)展的重要內(nèi)容,可以進(jìn)行數(shù)據(jù)的處理、調(diào)整以及訓(xùn)練。其中卷積神經(jīng)網(wǎng)絡(luò)算法具有很強(qiáng)的適應(yīng)性,但是也存在一定的缺點(diǎn)。對(duì)于深度信念網(wǎng)絡(luò)模型,可以初始化權(quán)值參數(shù)進(jìn)行優(yōu)化,但是訓(xùn)練時(shí)間過(guò)長(zhǎng),用戶可以結(jié)合實(shí)際情況,選擇不同的識(shí)別系統(tǒng)。
參考文獻(xiàn):
[1]彭騁.基于深度學(xué)習(xí)的圖像檢索系統(tǒng)[J].通訊世界,2018(06):258-259.
作者簡(jiǎn)介:
張玨(1986-),女,漢族,湖南湘潭人,講師,在讀研究生,研究方向?yàn)樾畔⒓夹g(shù)教育。