宋炯+柏松平+王燕華
摘 要 在人工智能領(lǐng)域之中,眾多技術(shù)被研發(fā)和應(yīng)用,其中圖像識(shí)別技術(shù)是基于人工智能的代表技術(shù)之一?,F(xiàn)今我國的科技技術(shù)、電子信息技術(shù)都在不斷發(fā)展,人工智能中的圖像識(shí)別技術(shù)也在不斷更新,越來越多的領(lǐng)域關(guān)注并應(yīng)用該技術(shù),包括醫(yī)療診斷、信息識(shí)別、衛(wèi)星云圖識(shí)別等等,基于人工智能的圖像識(shí)別技術(shù)能夠?yàn)楦鱾€(gè)領(lǐng)域的發(fā)展提供便利。本文對(duì)此展開探討。
關(guān)鍵詞 人工智能;圖像識(shí)別技術(shù);應(yīng)用
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)202-0106-02
現(xiàn)今計(jì)算機(jī)技術(shù)和信息技術(shù)日益發(fā)展,在此背景下圖像識(shí)別技術(shù)也越來越多的被人們關(guān)注。從現(xiàn)實(shí)發(fā)展角度來說,圖像識(shí)別技術(shù)的產(chǎn)生和更新是一種必然的趨勢(shì),且在未來的發(fā)展中會(huì)有更廣闊的應(yīng)用空間,無論是醫(yī)療、安檢、信息搜集、產(chǎn)品安全等等,都會(huì)更加依賴于圖像識(shí)別技術(shù)[ 1 ]。
圖像識(shí)別技術(shù)通常是指利用計(jì)算機(jī)對(duì)系統(tǒng)前端捕獲的圖片根據(jù)既定的目標(biāo)對(duì)其進(jìn)行處理,因此,人們?cè)谌粘I詈凸ぷ髦幸矔?huì)經(jīng)常接觸到該技術(shù),例如條碼識(shí)別、指紋識(shí)別等等,該技術(shù)給人們的生產(chǎn)安全提供了重要的保障,因此展開圖像識(shí)別技術(shù)的研究和探討是非常有意義的。
1 圖像識(shí)別技術(shù)的基本原理
人眼產(chǎn)生的視覺效果是一種非常神奇的現(xiàn)象,由此人眼對(duì)圖像的識(shí)別能力是很強(qiáng)的。當(dāng)某個(gè)圖像距離、位置、角度發(fā)生改變時(shí),人的感官也會(huì)隨之發(fā)生變化,圖像在人眼視網(wǎng)膜上的成像也會(huì)相應(yīng)發(fā)生大小和形狀的改變,但這種改變不足以影響人們對(duì)圖像的判斷,且人可以通過各種感官判斷某種圖像,例如當(dāng)在手背上寫字時(shí),也可以通過感官判斷這個(gè)字體。圖像識(shí)別技術(shù)是人工智能領(lǐng)域中的重要技術(shù),因此其識(shí)別原理與人眼識(shí)別的原理相似,都是以圖像的突出性特征為基礎(chǔ)進(jìn)行的[ 2 ]。
圖像識(shí)別的重點(diǎn)是尋找圖像的特征,例如英文大寫字母中,A有個(gè)突出的尖角,O有個(gè)圈、而Y則基本可以視為線條和銳角鈍角所組成,對(duì)于特殊信息,也就是突出特征的捕捉和識(shí)別,才能通過圖像中的有效信息對(duì)這個(gè)圖像進(jìn)行識(shí)別,并且判斷這個(gè)圖像的內(nèi)容和性質(zhì),并且分析它所代表的含義。
為了模仿人眼識(shí)別圖像的原理,達(dá)到人眼識(shí)別的效果,科學(xué)家編制模擬人類圖像識(shí)別活動(dòng)的計(jì)算機(jī)程序,從而獲取了眾多關(guān)于圖像識(shí)別的識(shí)別模型,當(dāng)計(jì)算機(jī)捕捉到某個(gè)圖像時(shí),若圖像特征與記憶中人腦的感官刺激相匹配,則認(rèn)為這個(gè)圖像已經(jīng)被識(shí)別。
2 基于人工智能的圖像識(shí)別過程
圖像識(shí)別技術(shù)是基于人工智能誕生的,因此,計(jì)算機(jī)對(duì)圖像識(shí)別的過程也與人腦識(shí)別圖像的過程基本類似,只不過是以技術(shù)和科技展現(xiàn)出來[ 3 ]?;谌斯ぶ悄艿膱D像識(shí)別過程如下:
1)信息數(shù)據(jù)的獲取,信息數(shù)據(jù)的獲取是圖形識(shí)別的基礎(chǔ),利用各類傳感器將聲音和光等特殊信號(hào)轉(zhuǎn)化為電信號(hào),從而獲取所需的數(shù)據(jù)和信息,在圖像識(shí)別技術(shù)中,所需要獲取的信息是圖像的特征和特殊數(shù)據(jù),這些信息和數(shù)據(jù)要求能夠區(qū)分圖形之間的特征,將其存儲(chǔ)于計(jì)算機(jī)的數(shù)據(jù)庫內(nèi),則可以用于之后步驟的展開。
2)信息數(shù)據(jù)預(yù)處理,此過程對(duì)圖像進(jìn)行去噪、變換以及平滑等處理操作,將圖像的特征和重要信息突顯。
3)特征抽取與選擇,圖像識(shí)別技術(shù)中的核心內(nèi)容就是對(duì)圖像進(jìn)行特征的抽取與選擇,尤其是識(shí)別模式中,對(duì)于特征的要求更為嚴(yán)格,這決定著圖像最終能夠否被成功識(shí)別,也就是將不同圖形的特殊特征提取,選擇能夠區(qū)分圖形的特征,并且將所選擇的特征存儲(chǔ),讓計(jì)算機(jī)記憶這種特征。
4)分類器設(shè)計(jì)與分類決策,此步驟是圖像識(shí)別的最后一步,分類器設(shè)計(jì)是指以有效的程序制定出一個(gè)識(shí)別規(guī)則,這種識(shí)別規(guī)則能夠按照某種規(guī)律對(duì)圖像進(jìn)行識(shí)別,而不是盲目混亂的進(jìn)行識(shí)別,借此識(shí)別規(guī)律能夠?qū)⑾嗨频奶卣鞣N類突顯,致使圖像識(shí)別過程的辨識(shí)率更高,之后通過對(duì)特殊特征的識(shí)別,完成圖像的評(píng)價(jià)和確認(rèn)。
3 常見的圖像識(shí)別技術(shù)形式
3.1 模式識(shí)別
模式識(shí)別(PatternRecognition)是圖像識(shí)別技術(shù)中的一種有效模型,該模式從大量信息和數(shù)據(jù)出發(fā)進(jìn)行圖像識(shí)別。該識(shí)別模型是圖像識(shí)別技術(shù)專家在多年經(jīng)驗(yàn)的積累基礎(chǔ)上和已有對(duì)圖像識(shí)別的認(rèn)知基礎(chǔ)上,通過計(jì)算機(jī)進(jìn)行計(jì)算,并且以數(shù)學(xué)原理進(jìn)行推理,在圖像的形狀、模式、曲線、數(shù)字、字符格式等各個(gè)特征方面自動(dòng)完成識(shí)別,并且在識(shí)別的過程中對(duì)這些特征進(jìn)行評(píng)價(jià)[ 4 ]。
識(shí)別模式的進(jìn)行分為兩個(gè)階段,即學(xué)習(xí)階段和實(shí)現(xiàn)階段,學(xué)習(xí)階段實(shí)質(zhì)可以將其理解為一個(gè)存儲(chǔ)的過程,也就是對(duì)圖像的特殊信息、特征、樣本提前采集和存儲(chǔ),通過計(jì)算機(jī)的存儲(chǔ)記憶能力將這些熟悉聚合信息按照一定的識(shí)別規(guī)律進(jìn)行分類和識(shí)別,并且形成相應(yīng)圖像的識(shí)別程序。
后一個(gè)階段則是實(shí)現(xiàn)階段,實(shí)現(xiàn)階段強(qiáng)調(diào)圖像必須與腦中的模板完全符合,如此才能完成識(shí)別程序,從現(xiàn)實(shí)角度來說,計(jì)算機(jī)的識(shí)別與人腦的識(shí)別還是有巨大的差異,但在計(jì)算機(jī)的識(shí)別過程中,能夠根據(jù)之前記憶階段的特征、數(shù)據(jù)以及信息,將最新捕捉的圖像信息進(jìn)行匹配,若按照既定的規(guī)律能夠匹配完成,這說明這個(gè)圖像已經(jīng)被識(shí)別。但這種識(shí)別是有限的,對(duì)于某一類特別相似的特征,可能會(huì)出現(xiàn)識(shí)別錯(cuò)誤的現(xiàn)象。
3.2 神經(jīng)網(wǎng)絡(luò)形式
神經(jīng)網(wǎng)絡(luò)形式的圖像識(shí)別技術(shù)是當(dāng)前應(yīng)用較多且全面更新的一種技術(shù),該技術(shù)基于傳統(tǒng)的圖像識(shí)別方式,與現(xiàn)代神經(jīng)網(wǎng)絡(luò)算法完美融合,從而形成了這種全新的識(shí)別形式。因?yàn)閳D像識(shí)別是人工智能領(lǐng)域的技術(shù),因此,這里的神經(jīng)網(wǎng)絡(luò)是指人工神經(jīng)網(wǎng)絡(luò),也就是說這種技術(shù)是模擬了人類及動(dòng)物的神經(jīng)網(wǎng)絡(luò)分布特征,相較于傳統(tǒng)的圖像識(shí)別技術(shù),融入神經(jīng)網(wǎng)絡(luò)算法的圖像識(shí)別程序更為復(fù)雜,成本更高,但發(fā)揮的效果也是顯而易見的。
被提取和捕捉的圖像特征能夠在神經(jīng)網(wǎng)絡(luò)程序中加以映射,更為精確、全面的完成圖像識(shí)別,并且對(duì)其進(jìn)行分類處理。在交通管理系統(tǒng)中,智能汽車監(jiān)控拍攝識(shí)別,就是應(yīng)用這一技術(shù)進(jìn)行的,能夠在拍攝的瞬間迅速識(shí)別和分辨車牌信息,從而協(xié)助交通管理的進(jìn)行。
3.3 非線性降維形式
非線性識(shí)別技術(shù)是一種高維形式的識(shí)別技術(shù),該技術(shù)的優(yōu)勢(shì)在于對(duì)于分辨率較低的圖形也可進(jìn)行有效的識(shí)別,因?yàn)檫@種技術(shù)產(chǎn)生的數(shù)據(jù)具有多維性特征,且經(jīng)過了非線性處理。這種技術(shù)在最初構(gòu)想時(shí)就遇到了諸多的困難,非線性降維的圖像識(shí)別需要計(jì)算機(jī)在短時(shí)間內(nèi)進(jìn)行大量的計(jì)算。最初將降維劃分成非線性降維與線性降維兩類,諸但非線性降維更為簡單,其效果也較為突出。
例如人臉識(shí)別就可利用非線性降維實(shí)現(xiàn),因?yàn)楦呔S度空間內(nèi)的人臉圖像分布不均,突出的特征信息也無法有效提取,而非線性降維方式則有效提升了人臉的辨識(shí)度。
4 結(jié)論
綜上所述,圖像識(shí)別技術(shù)是現(xiàn)今科技發(fā)展中的新興技術(shù)種類,已經(jīng)被越來越多的人關(guān)注,并且廣泛應(yīng)用于各個(gè)領(lǐng)域。在未來的發(fā)展中,圖像識(shí)別技術(shù)將被進(jìn)一步普及,而隨著用戶的增加技術(shù)會(huì)進(jìn)一步更新,以滿足人們生產(chǎn)生活的需求。圖像識(shí)別技術(shù)目前已經(jīng)成為能夠服務(wù)社會(huì)、促進(jìn)經(jīng)濟(jì)發(fā)展、保障財(cái)產(chǎn)安全的重要技術(shù),在未來會(huì)有更為廣闊的發(fā)展空間,被人們愈發(fā)深刻的認(rèn)識(shí)與掌握。
參考文獻(xiàn)
[1]李萍,徐安林.基于BP神經(jīng)網(wǎng)絡(luò)的智能制造系統(tǒng)圖像識(shí)別技術(shù)[J].現(xiàn)代電子技術(shù),2016,39(18):107-109.
[2]蔣樹強(qiáng),閔巍慶,王樹徽.面向智能交互的圖像識(shí)別技術(shù)綜述與展望[J].計(jì)算機(jī)研究與發(fā)展,2016,53(1):113-122.
[3]葛瑋,吳佳.關(guān)于計(jì)算機(jī)智能圖像識(shí)別的算法及技術(shù)分析[J].無線互聯(lián)科技,2014(10):82.
[4]陳波光,劉姝姝,蔡揚(yáng)亞.計(jì)算機(jī)的智能化圖像識(shí)別技術(shù)的理論性突破[J].電子制作,2013(15):69.
[5]張家怡.圖像識(shí)別的技術(shù)現(xiàn)狀和發(fā)展趨勢(shì)[J].電腦知識(shí)與技術(shù),2010,6(21):6045-6046.