郭元戎
伴隨著互聯(lián)網科技的突飛猛進,圖像處理和識別領域的技術突破正在深刻地改變人類的生活。圖像處理和識別技術當前的研究重點包括人工智能視覺化、三維圖像重建和虛擬現實,主要應用領域包括智能交通、家政服務、醫(yī)療保健乃至國防工業(yè)等,未來的發(fā)展趨勢則主要集中在網絡化、智能化和功能的高度集成。
【關鍵詞】圖像處理 圖像識別 計算機視覺 智能汽車 人工智能
1 前言
圖像處理(Image Processing)技術在近些年伴隨著移動互聯(lián)網的快速興起實現了飛躍的發(fā)展,在工業(yè)生產、建筑交通、醫(yī)療保健、娛樂傳媒乃至尖端國防工業(yè)中都有著越來越深入的滲透和越來越廣泛的應用。圖像處理最早可以追溯到1920年人們利用鋪設在北大西洋海底的電纜從英國倫敦到美國紐約傳輸了一張經過簡單的數字壓縮技術處理過后的照片,這一創(chuàng)舉可謂是圖像處理技術的起源。在上世紀50年代隨著電子計算機的發(fā)展,計算機呈現出的呈指數級上升的數據分析處理能力讓人們看到了新的突破方向,數字圖像處理(Digital Image Processing, DIP)的研究也開始成為熱點,并在上世紀60年代正式宣告了數字圖像處理這一全新學科的誕生。數字圖像處理研究的蓬勃展開也產生了繁榮的成果:1964年美國噴氣推進實驗室(JPL)在宇航空間領域率先打開了數字圖像處理的應用之門,對先期發(fā)射的月球探測器傳回的數千張月表圖片進行了去噪、校正和變換處理,并考量了其他環(huán)境因素的影響從而成功繪制了月表地形圖,JPL對后續(xù)月球探測器傳回的超過十萬張月表圖片進行了進一步的圖像處理,最終得出了月球的全景鑲嵌圖,為人類的探月工程做出了不可磨滅的巨大貢獻;1979年英國EMI公司工程師發(fā)明的全身CT診斷技術獲得當年的諾貝爾生理學和醫(yī)學獎,這一造福千萬患者的開創(chuàng)性計算機斷層攝影方法可以說正是圖像處理技術卓有成效的典型應用;90年代以來高速公路上的電子不停車收費系統(tǒng)(Electronic Toll Collection, ETC)在歐美得到了迅速的普及,極大地提高了交通通行效率,方便了人們的生活。時至今日,圖像處理與識別技術的應用身影已經在衛(wèi)星遙感、醫(yī)學治療、文藝娛樂等高新技術行業(yè)或與人們日常生活緊密相關的領域無處不在,伴隨著相關的技術突破逐漸改變著人們的社會生活。
2 圖像處理與識別技術的研究重點
2.1 人工智能可視化
圖像處理廣義上是指利用計算機系統(tǒng)強大的數據處理分析能力,對輸入的圖像進行識別、分析、處理乃至理解的過程,而數字圖像處理正是憑借著其存儲圖像信息能力、對圖像進行無損壓縮能力以及保證圖像信息傳輸過程中發(fā)生失真概率較低能力的強大成為了當前圖像處理領域的主流應用技術。依托人工智能領域不斷涌現的研發(fā)成果,計算機智能化的圖像識別(或者成為人工智能的可視化)正在成為數字圖像處理技術中的新潮流,在海量大數據分析技術和全新深度學習算法的支撐下,從圖像信息經過初步數字化處理后從外界輸入,到計算機對于輸入圖像信息的背景分離、虛假特征消除和細化增強等中間預處理,再到圖像庫中的快速準確搜索并與輸入圖像精確匹配這一后續(xù)分析處理的整個過程中計算機識別處理圖像的精準程度都會得到相應的增強。傳統(tǒng)的圖像識別及處理技術在人工神經網絡、模糊識別算法和非線性圖像降維處理技術的推動下有了極大的原理革新和效率提升。不僅如此,人工智能在計算機視覺方面的研發(fā)突破還催生了一些全新的領域,2015年Google公司的人工智能Deep Dream就以其獨特的機器美學創(chuàng)造了新的藝術潮流,以至于2016年Google甚至舉辦了別開生面的“機器藝術展”來向公眾展示計算機視覺下藝術作品奇幻的展現形式??梢灶A見的未來,人工智能作為當下計算機視覺領域關注的焦點,其相關技術的進一步突破將會成為推動圖像分析及處理技術廣泛深度應用源源不竭的動力。
2.2 三維重建
三維重建是可視計算領域近些來興起的研究熱點,并且已經在基于先進醫(yī)學儀器斷層圖像數據的逆向工程、建筑學的混凝土技術三維建模、考古學中待發(fā)掘古墓墓道結構數字建模、工業(yè)生產中利用CT圖像可視化以提高零件無損檢測能力等等領域都已經有了豐碩的應用成果??梢曈嬎惆藦娜S場景或數據正向生成二維圖像的計算機圖形學和由二維圖像反向進行三維模型重建的計算機視覺,也正因為二者的交叉融合程度極高,一般而言將兩個方向的研究內容合稱可視計算。
以醫(yī)學應用領域的CT斷層圖像三維重建為例,整個將二維數字圖像反向映射成為三維模型的過程中同樣會運用到各種數字圖像處理的典型方法理論,例如在圖像的預處理部分,獲取二維數字圖像之后為了提高圖像質量即需要對圖像進行平滑或者銳化的預處理,其目的分別是藉由低通濾波技術剔除圖像中無關重要的小細節(jié)或者將不同目標之間的空隙間斷進行模糊化連接處理,以及藉由高通濾波技術對模糊的細節(jié)進行強化為后續(xù)分析處理奠定良好數據基礎;在對圖像進行分割并提取特征之前,圖像的邊緣檢測和邊緣增強是常見的區(qū)域處理方法,而在進行正式的圖像分割時則會大多利用灰度圖像二值化方法,設定好相應的灰度閾值,將所攝取的CT斷層圖像中的骨主體和關節(jié)軟組織進行準確清晰的圖像分割,從而將一幅看上去黑白斑駁且錯綜復雜的CT圖像處理為簡單的黑白二值圖像;在對數字圖像進行平滑濾波處理時,非線性的中值濾波是目前主流的實現方法,中值濾波由于其獨有的摒棄乘除運算的特性以及高處理速度的優(yōu)勢,在保證有價值的信號部分的同時能盡可能地去除振動噪音,達到“削峰留谷”的效果。
三維逆向重建技術目前正處在蓬勃的發(fā)展過程之中,自動化與智能化顯而易見地將成為未來這一技術發(fā)展的趨勢,同時如何將三維逆向重建技術更好地與人們的日常生活緊密結合起來(例如藉由無人機航測技術的普及和消費級旋翼無人機市場的擴大,更加方便快捷地創(chuàng)建3D地圖模型來滿足不同地域人們的導航需求),也是相關的工程技術人員需要密切關注的另一方向。
2.3 虛擬現實/增強現實
虛擬現實(Virtual Reality, VR)以及增強現實(Augmented Reality)已經成為當下計算機視覺和圖形學領域發(fā)展速度最快也最具潛力的應用領域?;趫D像處理和識別算法的虛擬現實、增強現實應用不勝枚舉,實時的三維立體人臉識別、醫(yī)學虛擬手術、人機交互中人物動作的跟蹤識別等方面都需要圖像處理和識別技術的深度融合,可以想見此后這一熱門領域將會誕生更多的技術成果和更貼近日常生活的市場應用。
3 圖像處理與識別技術的應用領域
3.1 智能交通
圖像處理和識別技術因其快速精準的判斷能力和較寬的掃描范圍在汽車上的應用非常廣泛。目前在駕駛輔助、智能交通、車輛定位等方面都開始應用圖像處理和識別技術。駕駛輔助方面,車道偏離預警系統(tǒng)能夠在駕駛員因為過度疲勞或者長時間單調行駛等原因而引發(fā)的注意力分散、疏忽大意,放棄對車輛的操作時能夠按照一定的車道偏離預警準則給出及時的警示信號,其核心技術就是基于機器視覺對道路幾何特征的識別提取以及后續(xù)的圖像分析處理,來為車輛運動狀態(tài)的計算和車道偏離可能性的評估提供準確依據。車道保持輔助系統(tǒng)則依托車道識別和跟蹤這一技術核心,是圖像處理與識別技術和智能車有機結合的一款典型輔助駕駛應用,基于機器視覺的自適應巡航ACC、交通標志識別TSR和遠關燈輔助HBA也已經逐漸成為了自動駕駛汽車的標配;智能交通方面,對于整體的交通系統(tǒng),應用攝像頭進行圖像的收集也有很廣泛的應用。如車道識別、車流量計算等等;車輛定位方面,自動泊車系統(tǒng)和車身定位系統(tǒng)已不鮮見。自動泊車系統(tǒng)自動泊車系統(tǒng)需要汽車識別后方的路況信息,識別停車位置,目前已經有基于攝像頭識別來進行車輛泊車的功能。后方攝像頭也可以進行輔助泊車,通過攝像頭將后方信號直觀地顯示在駕駛室,這樣可以來輔助駕駛員泊車。車身定位系統(tǒng)則通過攝像頭對周圍環(huán)境進行感知,與地圖進行結合對汽車的定位進行校準,使定位更加精確。
圖像處理及識別技術作為人類利用計算機軟硬件代替視覺感官系統(tǒng)的代表性技術,是智能車乃至整個人工智能感知外界信息從而做出響應的重大進展。因此進一步研究圖像處理及識別技術,對于提升智能車乃至整個人工智能的思維能力與決策能力有著重要意義。
3.2 醫(yī)學治療
醫(yī)學治療領域的圖像處理及識別應用處處可見,微觀層面的細胞染色體分類、基于虛擬現實技術的虛擬內窺鏡、3D超聲成像、核磁共振(MRI)影像分析、數字減影血管造影技術、骨質疏松的圖像識別算法、針對患者病患部位的所拍攝的2D斷層圖像進行逆向3D可視化建模以及功能圖像和解剖圖像的二者融合等都是典型的應用成果。
3.3 交互通訊
光纖通訊和微波通訊中,如何排除各種環(huán)境噪音對于所傳輸圖像信息的干擾一直是重要的研究課題,而包括了變換域法和空間域法的多種通信圖像的去噪方法都有著廣泛的應用。
3.4 公安刑偵
目前的大中城市普遍覆蓋了“天網”系統(tǒng),在此基礎上所衍生的針對可疑目標所捕捉到的圖像處理及識別任務也逐漸提出了更高的技術要求。諸如利用小波分析的算法的快速人臉識別、掌紋/足紋的圖像處理建模、對于模糊圖像的非失真還原處理、快速準確的圖像標注測量等方面都已經有了較為成熟的應用成果,未來隨著相關技術的突破將為豐富公安刑偵手段,提高破案效率做出更大的貢獻。
4 結束語
顯然,圖像處理及識別技術將沿循著立體化、智能化、標準化、網絡化和集成化的發(fā)展趨勢進一步發(fā)展,更貼近真實的圖像采集效果、更高清的圖像顯示分辨率、更精確的圖像數據庫匹配結果、更高效的圖像處理及識別算法都將是未來圖像處理及識別技術所追求的的目標。
參考文獻
[1]翁和王.關于人工智能中的圖像識別技術的研究[J].信息通信,2016(10):191-192.
[2]唐錄潔.計算機智能化圖像識別技術的理論性探究[J].計算機光盤軟件與應用,2013(13):98-100.
[3]孫亮.計算機智能化圖像識別技術的理論性突破[J].數字技術與應用,2013(06):106-107.
[4]徐彩云.圖像識別技術研究綜述[J].電腦知識與技術,2013(04):2446-2447.
[5]李康.智能化圖像識別技術的發(fā)展概況[J].軍民兩用技術與產品,2016(08).
[6]萬卷.圖像處理智能化的發(fā)展方向[J].電子技術與軟件工程,2017(09):66-66.
[7]陳曉紅.計算機圖像處理技術發(fā)展趨勢研究[J].信息與電腦:理論版,2013(07):215-216.
[8]陳艷.探討計算機圖像處理技術的發(fā)展趨勢與展望①[J]..科技資訊,2017,15(04):16-16.
[9]李玉榮.計算機圖像處理技術的發(fā)展趨勢探討[J].無線互聯(lián)科技,2015(09):104-105.
[10]張彩霞.數字圖像處理技術的發(fā)展現狀及發(fā)展趨勢研究[J].計算機光盤軟件與應用,2014(12):216-216.
[11]任玉苓.試析數字圖像處理在刑偵技術工作中的應用[J].云南警官學院學報,2004(03):63-65.
作者單位
山東省萊蕪市第一中學 山東省萊蕪市 271100