王灶紅 蘭雁
【摘 要】人類正處在信息化的時代,計算機的應用也隨著時代的變遷幾乎進入所有領(lǐng)域。計算機視覺是人工智能的一個重要分支領(lǐng)域,它在人工智能中扮演著越來越重要的作用,對現(xiàn)如今人們的生活和認識世界的方式有著越來越重要的作用。隨著深度學習,尤其是卷積神經(jīng)網(wǎng)絡的出現(xiàn),使計算機視覺在各個領(lǐng)域發(fā)揮了重要作用。本文主要介紹關(guān)于計算機視覺技術(shù)以及在各個行業(yè)的應用。
【關(guān)鍵詞】深度學習;卷積神經(jīng)網(wǎng)絡;計算機視覺
現(xiàn)代科學研究表明,人類的學習和認識活動中,至少80%以上都是通過視覺完成的。也就是說,視覺感知是人類理解和認識世界的主要手段。視覺對人類如此重要,對于計算機的研究當然也不能少了視覺相關(guān)領(lǐng)域,即計算機視覺。
一、計算機視覺概述
計算機視覺研究對象之一是如何利用二維投影圖像恢復三維景物世界,其基本目的可以歸結(jié)為從單幅或多福二維投影圖像(或視頻序列)計算出觀察點和目標對象之間的空間位置關(guān)系及目標對象的物理屬性。從人工智能誕生之日起,視覺相關(guān)的應用就一直是該領(lǐng)域內(nèi)科學家偏愛的方向。深度學習始于神經(jīng)網(wǎng)絡,神經(jīng)網(wǎng)絡始于感知機。感知機是1957年由FrankRosenblat提出的,感知機事實上就是人工神經(jīng)網(wǎng)絡的最小單元,這個結(jié)構(gòu)里有最兩個基本的成分:計算輸入向量的線性變化;對線性組合的結(jié)果進行閾值判斷,實際上就是非線性變換?;蛘吒唵蝸碚f把閾值和線性變換放一起,則是仿射變換,所以感知機本質(zhì)上就是一個仿射變換接一個非線性變換。而神經(jīng)網(wǎng)絡其實就是一種模仿生物神經(jīng)的連接模型,運行分布式并行信息處理的算法數(shù)學模型。這種網(wǎng)絡內(nèi)部十分復雜,也正是依靠著這些復雜,通過調(diào)整內(nèi)部節(jié)點相互連接的關(guān)系,從而達到處理信息的目的,神經(jīng)網(wǎng)絡的出現(xiàn)無疑于給機器算法奠定了基礎(chǔ)。而伴隨著各種機器學習算法的全面開花,機器學習開始成為計算機視覺,尤其是識別、檢測和分類等應用中的一個不可分割的重要工具。計算機視覺應用也成為了我們?nèi)粘I钪胁豢扇鄙俚陌閭H。
二、計算機視覺與卷積神經(jīng)網(wǎng)絡
計算機視覺技術(shù)是使計算機模擬人類的視覺過程,具有感受環(huán)境的能力和人類視覺功能的技術(shù),是一門綜合性較強的技術(shù),設(shè)計的學科和技術(shù)非常廣泛。主要包括圖像處理、人工智能、模式識別、計算機科學、物理學、生物學和心理學等學科的綜合。
和計算機視覺最緊密聯(lián)系的就是卷積神經(jīng)網(wǎng)絡。但其實卷積神經(jīng)網(wǎng)絡也是受到了人類視覺神經(jīng)系統(tǒng)的啟發(fā)。人類神經(jīng)系統(tǒng)是一個非常復雜的系統(tǒng),至今還沒有比完全的理解,而且大多數(shù)的人類視覺系統(tǒng)視覺特性不是憑直覺獲知的。人類視覺系統(tǒng)是人們理解和認知自然世界的關(guān)鍵工具。所以我們先來簡單了解一下視覺神經(jīng)系統(tǒng)。眼睛是一個成像系統(tǒng),圖像通過瞳孔、晶狀體最終在視網(wǎng)膜上成像,這一部分是視覺的光學系統(tǒng)。視網(wǎng)膜上布滿了大量的光感受細胞,可以把光刺激轉(zhuǎn)換成神經(jīng)沖動,然后進入視覺神經(jīng)系統(tǒng)傳遞進大腦的初級視覺皮層。從視覺皮層開始對圖像信息分層,這些層從v1~v5,每一層處理特定的信息。而在1958年對貓視覺皮層的研究發(fā)現(xiàn)了簡單細胞和復雜細胞,這兩種細胞的特點就是每個細胞質(zhì)只對特定方向的條形圖樣有刺激反應,也就是說這種細胞是有方向選擇性的,兩者區(qū)別則是,簡單細胞對應的視網(wǎng)膜的光感受細胞所在區(qū)域很小,而復雜細胞相對大,這個區(qū)域被稱為感受野。簡單來說卷積層用來模擬對特定圖案的響應,而池化層模擬感受野。卷積神經(jīng)網(wǎng)絡對計算機視覺的應用非常廣泛,比如圖像的分類、物體檢測、人臉識別、圖像搜索、圖像分割等。
三、計算機視覺的應用
計算機視覺的相關(guān)技術(shù)給計算機帶來了更多廣泛的應用,擁有“視覺”的智能計機不但使計算機更便于為人們所使用,同時如果用這樣的計算機來控制各種自動化裝置特別是智能機器人就可以是這些自動化裝置和機器人具有使用環(huán)境和自主決策的能力。下面來介紹關(guān)于計算機視覺的應用。
安防。安防是最早應用于計算機視覺的領(lǐng)域之一。人臉識別和指紋識別在許多國家都有應用,常見的應用有利用人臉庫和公共攝像頭對犯罪嫌疑人進行識別和布控。如利用公共攝像頭捕捉到的畫面,在其中查找可能出現(xiàn)的犯罪嫌疑人,用超分辨率技術(shù)對圖像進行修復,并自動或輔助人工進行識別以追蹤犯罪嫌疑人的蹤跡。移動監(jiān)測也是計算機視覺在安防中的重要應用,利用攝像頭監(jiān)控畫面移動用于防盜和監(jiān)控監(jiān)獄。
交通。比如利用計算機視覺技術(shù)對違章車輛的照片進行分析提取車牌號碼并登記在案。這是大家都熟知的一項應用。此外很多停車場和收費站也用到車牌識別。除了車牌識別,還有利用攝像頭分析交通擁堵狀況或者隧道橋梁監(jiān)控等技術(shù)。
工業(yè)生產(chǎn)。工業(yè)生產(chǎn)也是最早應用于計算機視覺領(lǐng)域之一。如利用攝像頭拍攝的圖片對長度進行非精密測量。利用識別技術(shù)識別工業(yè)部件上的缺陷和劃痕等。
在線購物。事實上計算機視覺在電商領(lǐng)域的應用也非常多。比如當我們一打開購物時,我們最先看到的一定是圖片,而為了看到這些精美的圖片,電商背后的計算機視覺就成了非常重要的技術(shù)。還有我們熟知的掃描照片提取相似寶貝,也用了圖像識別技術(shù)。
醫(yī)療。醫(yī)學影像是醫(yī)療領(lǐng)域中一個非?;钴S的研究方向,各種影像和視覺技術(shù)在這個領(lǐng)域中至關(guān)重要。計算機斷層成像,核磁共振成像中重建三維圖像,并進行一些三維表面渲染都有涉及一些計算機視覺的基礎(chǔ)手段。細胞識別和腫瘤識別用于輔助診斷,一些細胞或者體液中小型顆粒物的識別,還可以用來量化分析血液或其它體液中的指標。
當然計算機視覺的應用不止于此,也遠不止于此。在未來它還會開拓出更多、更廣、更深層次的應用。
四、計算機視覺未來發(fā)展趨勢
計算機視覺在人工智能里面可以類比于人類的眼睛,是在感知層上最為重要的核心技術(shù)之一。它在各個行業(yè)都有或多或少的應用,涉及的技術(shù)、學科都非常的廣泛。隨著5G時代的到來,將會推動醫(yī)療、自動駕駛發(fā)揮發(fā)展,同時會加大推動計算機視覺在這些行業(yè)的應用,例如醫(yī)療影像識別、自動駕駛中的影響識別等等。隨著算法的更迭、硬件升級、大數(shù)據(jù)的爆發(fā),計算機視覺也將會有更大的想象空間。
【參考文獻】
[1] (美)薩利斯基著.艾海舟,興軍亮等譯.計算機視覺—算法與應用[M].北京:清華大學出版社,2012.
[2] 張波.數(shù)字圖像處理技術(shù)的發(fā)展與應用[J].品牌 :理論月刊,2011(Z2):158-158.
[3] 甄棟志,朱永偉,蘇楠等.基于計算機視覺對目標識別檢測的研究[J].機械工程與自動化,2014(1):129-130.
[4]楊雪.基于紋理基元快的圖像語義分割[D].西南科技大學,2015.
[5]吳 璟 莉,劉 袁 靜.一種基于顏色拮抗感受野的輪廓檢測模型[J].計 算 機 科 學,2016,43(7):319-323.
[6]160-183.姜楓,顧慶,郝慧珍.基于內(nèi)容的圖像分割方法綜述[J].軟件學報,2017,28(1):160-183.
[7]王嫣然,陳清亮,吳俊君.面向復雜環(huán)境的圖像語義分割方法綜述[J].計算機科學,2019,46(9):36-46.[3]KRIZHEVSKY A,SUTSKEVER I,HINTON G.ImageNet classifica.