王巖 姬一波
【摘要】? ? 近年來,社會經(jīng)濟快速發(fā)展的同時,計算機信息技術(shù)更新的速度不斷加快,逐漸滲透到各個領(lǐng)域當(dāng)中,為人們帶了極大的便捷?;ヂ?lián)網(wǎng)的普及也使得信息量呈爆炸式增長,卷神經(jīng)網(wǎng)絡(luò)能夠大幅度提升圖像的識別率,從而更加高效的挖掘圖片信息數(shù)據(jù),人工智能技術(shù)越來越成熟,深度學(xué)習(xí)也備受人們的高度關(guān)注。傳統(tǒng)圖像識別技術(shù)相對落后,且識別率低,面對海量的圖像信息數(shù)據(jù),傳統(tǒng)識別方式顯然已經(jīng)無法滿足當(dāng)前的實際需求。
【關(guān)鍵詞】? ? 卷積神經(jīng)網(wǎng)絡(luò)? ? 圖像識別? ? 算法? ? 邏輯回歸
引言:
卷積神經(jīng)網(wǎng)絡(luò)是一種基于人工神經(jīng)網(wǎng)絡(luò),并將深度學(xué)習(xí)理論融入其中,從而探索出的一種新型識別算法,這也是目前圖像識別領(lǐng)域發(fā)展過程中的重點研究方向。自上世紀九十年代末以來,CNN識別技術(shù)便步入了高速發(fā)展階段,且逐漸趨于穩(wěn)定,但是該網(wǎng)絡(luò)技術(shù)結(jié)構(gòu)存在一定局限性,在對自然圖像進行識別過程中,整體效率與速度依然存在不足之處,無法達到理想化的程度。為了有效改進與優(yōu)化CNN在自然圖像識別過程中的整體效果,文章通過對當(dāng)前CNN網(wǎng)絡(luò)結(jié)構(gòu)進行了深入分析,并進一步提出了自然圖像識別的卷神經(jīng)網(wǎng)絡(luò)算法,從而逐步實現(xiàn)CNN識別算法可在短期時間之內(nèi)進行快速收斂,從而達到理想的識別效果。
一、圖像識別與卷神經(jīng)網(wǎng)絡(luò)簡述
1.1圖像識別算法
1.1.1貝葉斯分類法
該方法是統(tǒng)計學(xué)中的一種,以統(tǒng)計學(xué)為基礎(chǔ),并采用葉貝斯定理對其進一步分類,這樣的分類方法可以將分類問題逐漸轉(zhuǎn)化為概率的形式進行表達,并且概率為已知,對圖像特征進行提取分類,通過貝葉斯定理公式計算驗證,之后將圖像進行分類,公式如下:
從以上公式當(dāng)中我們能夠看到,P(B)能夠表明B條件下的概率,P(AB)指的是相同條件下實現(xiàn)概率,P(A/B)指的是B條件發(fā)生后,A件的發(fā)生概率。該方法有一定的缺點,并非每個圖像都可有效提取具有一定代表性的特點,當(dāng)出現(xiàn)該情況時,采用該方法進行圖像分類,會造成圖像分類出現(xiàn)非常大的誤差[1]。
1.1.2模板匹配法
從名字當(dāng)中便能夠看的出來,其是由根據(jù)模板在目標(biāo)圖像當(dāng)中對其進行匹配,這樣的方法也被廣泛應(yīng)用于圖像處理過程中。具體的過程為,先制定模板,之后再針對目標(biāo)圖像以及對應(yīng)模式,匹配和模板大致相似的圖像,比較相似的部分還包含圖像的方向與大小,再經(jīng)過匹配之后,便能夠確定圖像的具體位置。這樣的方法也存在缺點和不足,需要結(jié)合圖像設(shè)計類似的模板,因此對設(shè)計者的研究經(jīng)驗要求較高[2]。
1.2卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)屬于人工神經(jīng)網(wǎng)絡(luò),對映射特征圖和卷積神經(jīng)網(wǎng)絡(luò)當(dāng)中的卷積核進行計算,并采用函數(shù)計算,一般經(jīng)常使用的是雙曲正切函數(shù)。卷積層獲取圖像特征,從不同局域獲取單元節(jié)點數(shù)據(jù),需要覆蓋整個數(shù)據(jù)集,如果是相同的圖像,使用卷積核時是不同的,輸入圖像不同,應(yīng)當(dāng)采用相同卷積核,這便是權(quán)值共享。在池化層當(dāng)中,為降低平面圖大小,可取映射平面圖中的矩形區(qū)域最大值,這樣可有效降低平面圖大小,并且維持空間不發(fā)生變形,避免發(fā)生過度擬合的情況。如映射層面特征圖大小為8**,在經(jīng)過池化后,便會得到4*4大小的特征圖[3]。
二、基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別算法設(shè)計
2.1 Mapreduce編程結(jié)構(gòu)模型
Mapreduce是一種并行編程模型,主要應(yīng)用于大型計算機集群工作中,可對TB、PB數(shù)據(jù)集進行有效處理,編程模型具有包容性強、操作簡單以及整體擴展能力強等諸多優(yōu)勢和特征,被廣泛應(yīng)用于計算機科學(xué)領(lǐng)域當(dāng)中,Mapreduce編程結(jié)構(gòu)是一種樹狀圖結(jié)構(gòu),采用主節(jié)點對大數(shù)據(jù)集操作模塊進行管理,主節(jié)點之后再將任務(wù)分發(fā)到不同分界點,由分節(jié)點對數(shù)據(jù)進行處理后匯總到主節(jié)點。Mapreduce整個處理過程中主要是由Map函數(shù)與Reduce函數(shù)兩個部分共同組成,兩個函數(shù)的具體處理任務(wù)也有很大不同,Map函數(shù)是對需要進行處理的任務(wù)進行分解為多個模塊,Ruduce函數(shù)是對完成處理之后的模塊匯總。流程如下圖1所示。
2.2基于Mapreduce的CNN算法設(shè)計
該算法是對所訓(xùn)練數(shù)據(jù)進行分類,分為大致相同的小部分,和Hadoop平臺中的節(jié)點對應(yīng),并且通過平均分布的方式進行有效存儲,通過不同節(jié)點儲存CNN網(wǎng)絡(luò)數(shù)據(jù),進行網(wǎng)絡(luò)訓(xùn)練過程,Mapper任務(wù)接受數(shù)據(jù),可作用在不同節(jié)點,并利用正向和方向傳播,計算權(quán)值和偏置的變化量,并形成中間鍵數(shù)值,完成樣本計算后,對本地文件進行處理,本地文件進行匯總處理之后,各次訓(xùn)練獲取到的數(shù)據(jù)再寫進全局文件當(dāng)中[4]。
2.3 CUDA技術(shù)及平臺分析
CUDA編程模型屬于一種能夠支持GPU處理計算的數(shù)據(jù)開發(fā)利用環(huán)境,其由NVIDIA公司提出,GPU是一種圖像處理器,GPU的發(fā)展及應(yīng)用大幅度提升了計算機圖形的處理效率與質(zhì)量,且對計算機圖像仿真、虛擬現(xiàn)實環(huán)境以及圖像處理技術(shù)等領(lǐng)域的發(fā)展具有重要的促進作用。CUDA和GPU之間的有效結(jié)合,使得編程人員在CUDA平臺上可采用一般通用化的匯編語言C語言進行匯編,之后再采用GPU完成匯編程序整個運行過程,這樣便不需要單獨的去學(xué)習(xí)圖像知識,從而有效降低GPU數(shù)據(jù)計算的難度,使其更加簡化,從而大幅度提升了系統(tǒng)的整體穩(wěn)定性。CUDA平臺下的數(shù)據(jù)處理結(jié)構(gòu)由CPU與GPU兩者共同組成,GPU+CPU結(jié)構(gòu)可有效提升計算機性能,同時也能夠節(jié)約能源。[5]
2.4多區(qū)域邏輯回歸計算的網(wǎng)絡(luò)具體改進方法
圖像識別過程中,為了不斷提升實際訓(xùn)練過程及速度,是需要針對圖像實際情況,對其進行預(yù)處理的,這樣也能夠有效去除圖像當(dāng)中過多的干擾信息數(shù)據(jù),之后再對處理之后的圖像進行劃分以及識別,文章將其主要劃分為5個區(qū)域,即四個角區(qū)域與中心區(qū)域,在測試識別過程中,只對中間區(qū)域進行測試。
三、圖像識別結(jié)果分析
3.1結(jié)果
通過系統(tǒng)的篩選以及訓(xùn)練整個過程,輸入系統(tǒng)當(dāng)中的數(shù)據(jù)集主要分為兩類結(jié)果:系統(tǒng)預(yù)測分類和期望值符合情況下,系統(tǒng)會顯示分類正確,系統(tǒng)預(yù)測分類各期望值不相符情況下,系統(tǒng)會顯示分類錯誤的情況,采用通用數(shù)據(jù)集輸入接口方式,這樣可對數(shù)據(jù)集進行合理有效分類。
3.2不同區(qū)域測試對識別結(jié)果產(chǎn)生的影響
這里主要采用的是COFAR10數(shù)據(jù)集測試,系統(tǒng)會針對每個具體測試結(jié)果以及錯誤率進行合理保存,并采用Python腳本查看錯誤率的整個變化狀況,每個epoch為128個樣本。對參數(shù)與網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)進行調(diào)整,在未采用邏輯回歸計算時,系統(tǒng)分類錯誤率為18%,采用邏輯回歸后,系統(tǒng)分類錯誤率為13.4%,準(zhǔn)確率大幅度提升。原始圖像處理過程中,圖像未經(jīng)裁剪,但在MR-CNN-G使用過程中,圖像是經(jīng)過裁剪的,訓(xùn)練過程中,前者所用時間更少,在測試環(huán)節(jié)當(dāng)中,時間明顯增加了。
四、結(jié)束語
近年來,隨著互聯(lián)網(wǎng)計算機技術(shù)的快速發(fā)展與普及,已經(jīng)逐漸滲透進人們生活中的方方面面,為人們帶來了極大的便捷,圖像識別算法作為一項新型的技術(shù),經(jīng)過長期的發(fā)展,CNN算法也取得了顯著的成果,通過對其進行優(yōu)化改進之后,運用到圖像識別過程中,這樣也極大的提升了圖像識別的實際準(zhǔn)確率,并且在整個提升過程當(dāng)中,數(shù)據(jù)處理效果明顯增加,但是就目前現(xiàn)狀來看,依然存在諸多問題,如圖像處理過程復(fù)雜化,預(yù)處理時間也比較長,在對GPU引入過程中,因為數(shù)據(jù)接口不通用,因此,需要選擇及輸入相關(guān)數(shù)據(jù)集。
參? 考? 文? 獻
[1]張榮磊, 田愛奎, 譚浩,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別算法研究[J]. 山東理工大學(xué)學(xué)報(自然科學(xué)版), 2018, 032(001):48-50.
[2]田壯壯, 占榮輝, 胡杰民,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像目標(biāo)識別研究[J]. 雷達學(xué)報, 2016, 5(3)33-34
[3]杜蘭, 劉彬, 王燕,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像目標(biāo)檢測算法[J]. 電子與信息學(xué)報, 2016(12).22-23
[4]許振雷, 楊瑞, 王鑫春,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的樹葉識別的算法的研究[J]. 電腦知識與技術(shù), 2016, 12(010):194-196.
[5]李志明. 基于卷積神經(jīng)網(wǎng)絡(luò)的虹膜活體檢測算法研究[J]. 計算機工程, 2016, 42(005):239-243,248.