楊風(fēng)光
深度卷積神經(jīng)網(wǎng)絡(luò)屬于類腦計算領(lǐng)域的一類比較重要的研究,已經(jīng)在一些領(lǐng)域取得了突出的研究成果且被廣泛運(yùn)用。其中在自然語言處理、信息搜索、聲音識別、計算機(jī)視覺以及語義理解等方面。因為這些成就導(dǎo)致在工業(yè)和學(xué)術(shù)領(lǐng)域人們開始對神經(jīng)網(wǎng)絡(luò)進(jìn)行研究,同時促進(jìn)了人工智能的開發(fā),只需在卷積神經(jīng)網(wǎng)絡(luò)傳入數(shù)據(jù),就可以根據(jù)數(shù)據(jù)表現(xiàn)出相應(yīng)的癥狀。
1引言
很早之前,人類就幻想可以制造出機(jī)器人,擁有人類類似的大腦。為實現(xiàn)這一愿望,研究腦神經(jīng)與心理的專家對人腦的構(gòu)造進(jìn)行了大量的研究,通過各種數(shù)據(jù)得到大量的相關(guān)結(jié)論,并運(yùn)用到人工智能的開發(fā)領(lǐng)域中去。在這樣的情況下,一些專家提出了關(guān)于人工神經(jīng)網(wǎng)絡(luò)的研究,其借鑒計算機(jī)模型來模擬人類大腦的神經(jīng)結(jié)構(gòu),并將其進(jìn)行總結(jié)歸納,構(gòu)建神經(jīng)網(wǎng)絡(luò)系統(tǒng),然后經(jīng)過大量的研究發(fā)展,成為了類腦計算領(lǐng)域的重要研究成果。
在這個方面,專業(yè)人員提出大量模型,其中比較著名的有反傳網(wǎng)絡(luò)、自組織映射網(wǎng)絡(luò)等,其在各種方式的識別中取得了一些成績,并進(jìn)行廣泛的應(yīng)用。
2卷積神經(jīng)網(wǎng)絡(luò)及其相關(guān)技術(shù)
2.1增加網(wǎng)絡(luò)層數(shù)
卷積神經(jīng)網(wǎng)絡(luò)是一種多層神經(jīng)網(wǎng)絡(luò),其形成是由于特征提取的卷積層與特征處理的采樣層疊加形成的,在多年的研究中,使用到了很多研究技術(shù),其中增加網(wǎng)絡(luò)層數(shù)是一個比較重要的技術(shù)。其作用范圍是在標(biāo)簽數(shù)據(jù)不變的基礎(chǔ)上,提高深度神經(jīng)網(wǎng)絡(luò)的識別準(zhǔn)確度。但是其在使用過程中存在一定的缺陷,首先對于比較大的網(wǎng)絡(luò)結(jié)構(gòu)。其參數(shù)的需求量比較大,過多的參數(shù)會使網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)集的過擬合。另一方面是對于計算資源的需求量比較大。這兩方面缺陷的存在使技術(shù)的使用受到阻礙。
2.2增加訓(xùn)練數(shù)據(jù)集規(guī)模
過擬合出現(xiàn)的原因是訓(xùn)練的神經(jīng)網(wǎng)絡(luò)比較大,且沒有足夠的訓(xùn)練數(shù)據(jù)或者由于訓(xùn)練的模型比較復(fù)雜,數(shù)據(jù)干擾大,對其準(zhǔn)確度的重視度降低,一旦出現(xiàn)過擬合的現(xiàn)象,會隨著訓(xùn)練的進(jìn)行,其模型變得更加復(fù)雜,雖然會使訓(xùn)練上的出錯率降低,但是在驗證集上的錯誤率升高。因此,為避免這一現(xiàn)象的出現(xiàn),我們需要做的就是增加訓(xùn)練樣本的數(shù)量。
2.3正則化
正規(guī)化是用來避免隨著訓(xùn)練神經(jīng)網(wǎng)絡(luò)的增大而出現(xiàn)的擬合問題的辦法。經(jīng)過大量數(shù)據(jù)的分析可以看出,過擬合一般是出現(xiàn)在比較小的空間中,因為數(shù)據(jù)形成的函數(shù)值改變比較大,導(dǎo)致函數(shù)的參數(shù)值比較大,會使一些區(qū)間比較小的函數(shù)絕對值比較大。而正規(guī)化可以利用其阻止函數(shù)的浮動范圍太大,來降低模型的復(fù)雜程度,進(jìn)而降低過擬合的出現(xiàn)。
3卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用
3.1目標(biāo)檢測
目標(biāo)檢測的作用是判斷檢測目標(biāo)的類別,其監(jiān)測的對象是定位的圖像中特定物體所出現(xiàn)的區(qū)域,這一應(yīng)用是計算機(jī)視覺領(lǐng)域的一項基本內(nèi)容。其檢測的目的更加注重圖像的局部區(qū)域與特定物體的類別集合,是一個比圖像識別更加復(fù)雜的識別問題。比較舊的目標(biāo)檢測算法主要的使用原理是利用設(shè)計人的先驗知識,然后獲取樣本中的手工設(shè)計特點(diǎn),使用比較少的參數(shù),效率會提升。
3.2圖像分類
圖像分類是比較重要的應(yīng)用,作用是利用計算機(jī)依據(jù)圖片的內(nèi)容進(jìn)行分類,并進(jìn)行語義類別的標(biāo)記,對象是特定的一張照片。
3.3圖像語義分割
在近幾年,人們對人工智能比較重視,因此,對計算機(jī)視覺和機(jī)器學(xué)習(xí)等方向的研究比較多,隨著其研究的加深,專業(yè)人員講重點(diǎn)放在了圖像本身,對其進(jìn)行更加準(zhǔn)確的分析和了解。而圖像語義分割正是在這樣的情況下提出來的,圖像進(jìn)行分割之后,對其分割后所有分割區(qū)域與像素的語義類別進(jìn)行分類,且可以準(zhǔn)確識別,舊的圖像語義分割步驟有3種,其一圖像的底層分割,將圖片劃分成多個小的區(qū)域;其二是獲得小區(qū)域的底層特點(diǎn),比如,形狀特征、顏色等;其三是從底層的特點(diǎn)到高層的語義空間的映射,其目的是為了識別圖像的具體區(qū)域與圖像的每一個像素的語義種類。
3.4人臉識別
人臉識別對計算機(jī)視覺方面是一個比較大的難題,技術(shù)比較難實現(xiàn),其目的分為人臉驗證與人臉辨別。人臉驗證的目的是為了辨別出任意2張人臉是否為一個人的,這是一個二分類的問題,隨機(jī)猜測的正確概率為50 %。人臉辨別的目的是把一個未知的人臉照片分割成幾個身份類型之一,是多分類題目,隨機(jī)猜測的正確概率為N分之一,其正確率比人臉驗證更低,因此其挑戰(zhàn)更大。
4結(jié)束語
最近幾年來,經(jīng)過專業(yè)人士的不斷研究,深度卷積神經(jīng)網(wǎng)絡(luò)在計算機(jī)視覺方面的研究成就比較多,將這些成果進(jìn)行總結(jié)改造,運(yùn)用在人工智能領(lǐng)域,使人工智能方面得到快速的發(fā)展,不斷地滿足人們對人工智能的需求。但是在目前的研究中,依然有很多的問題需要解決,有很大的發(fā)展空間。