潘東
【摘 要】計算機視覺技術(shù)的主要作用是以人眼的視角且高于人眼的能力去解決分工、切割、搜索、提取、加工處理等問題,利用計算機視覺系統(tǒng)從而建立一個平面2D圖像或三維立體圖像數(shù)據(jù),以此來建造一個可以獲得所需信息的人工智能數(shù)據(jù)庫?,F(xiàn)如今我國計算機技術(shù)高速發(fā)展,特別是近些年OPENCV的不斷更新與完善,更使得我國基于OPENCV的計算機視覺技術(shù)有了很大突破。所以本文目的主要是對基于OPENCV的計算機視覺技術(shù)進行研究,了解改進系統(tǒng)整個創(chuàng)建過程中還存在的一些問題并提出相應(yīng)解決方案,來幫助基于OPENCV的計算機視覺技術(shù)能得到更好發(fā)展。
【關(guān)鍵詞】OPENCV;計算機視覺技術(shù);研究
現(xiàn)在由于人們的文化素質(zhì)的普遍提高,從業(yè)范圍的擴大,以及生活質(zhì)量的提升,使得計算機視覺技術(shù)被應(yīng)用于人類生活的各個層面,特別是在基于OPENCV的計算機視覺技術(shù)下的對圖片處理技術(shù)在人類日常生活的不斷推動下已發(fā)展得相當(dāng)成熟。
OPENCV全稱為:Open Source Computer Vision Library。是在1999年由Intel建立的。其可應(yīng)用到多種操作系統(tǒng)當(dāng)中,甚至跨平臺使用。在包含的編程語言當(dāng)中主要用到的是C函數(shù)和C++語言。Opencv有很強的應(yīng)用性,一般在計算機視覺領(lǐng)域可以較好的實現(xiàn)通用算法和圖像的高性能分析。
計算機視覺技術(shù)的實質(zhì)其實是讓一些人眼無法完成的工作由計算機系統(tǒng)下的人工智能來代替完成,即以計算機視覺系統(tǒng)為基礎(chǔ),對從根本上主觀存在的三維立體世界框架進行全過程的智能化處理?,F(xiàn)在基于OPENCV的計算機視覺技術(shù)已經(jīng)被用在我國神經(jīng)學(xué)、生理學(xué)、計算機工程、信號科學(xué)、化工學(xué)、應(yīng)用學(xué)等一系列高級綜合學(xué)科上。計算機視覺技術(shù)若要完成對數(shù)據(jù)的提取、搜索等操作必須要將高性能計算機系統(tǒng)作為基礎(chǔ)然后再通過人工智能在特定算法的操作下來對大量數(shù)據(jù)進行加工,此為計算機視覺技術(shù)的工作流程。
基于OPENCV的計算機視覺技術(shù)對視頻中物體運動狀態(tài)下的檢驗原理其方法大致分為兩種,一種為宏觀方式的檢驗方法,另一種則為微觀方式的檢驗方法。二者在使用方法上大不相同,微觀方式的檢驗方法是要先確定需要進行檢驗的具體區(qū)域,然后在對該確切區(qū)域進行檢索[1],而宏觀方式的檢驗方法則是直接對得到的整個圖像進行檢索。當(dāng)基于OPENCV的計算機視覺技術(shù)開始對運動狀態(tài)下的物體進行檢索時,第一步必須先將需要的圖像數(shù)據(jù)采集完全(此為所有計算機視覺技術(shù)的必要操作),然后對得到的數(shù)據(jù)信息進行適當(dāng)處理,第二步便要根據(jù)需要的圖像對其進行切割,再依次采集運動狀態(tài)下的物體的影響,完成對數(shù)據(jù)的加工。另外,在采集圖像的任務(wù)中最好應(yīng)用差分背景的方法,即用特定算法對圖像的背影進行提取或是以人為的方式獲取那些沒有背影的圖像。還有一些計算機視覺技術(shù)在對運動狀態(tài)下的物體進行檢驗時用到幀間差分法,該方法的主要原理是將那些得來的圖像數(shù)值進行一幀一幀的相互比對,以此獲得那些具有不同數(shù)值的圖像。值得一提的是,在對那些運動的物體進行檢驗時一定要保證圖像的連續(xù)和完整,在此前提下把圖像以此連接起來,這樣便得到了該物體的大致運動軌跡,然后使用圖像切割技術(shù)描繪出該物體的具體外形,以上步驟任何一步錯誤得到的數(shù)值都將無任何參考意義?,F(xiàn)在,由于對計算機視覺技術(shù)的研究越來越深,有相關(guān)學(xué)者認為上文的兩種方法如果全都單獨使用,但在本質(zhì)上都有一定的缺點,所以,有相關(guān)技術(shù)人員將兩種方法結(jié)合起來,形成了一套全新的綜合性檢驗方式。此綜合性檢驗方法將兩種方法的優(yōu)點巧妙結(jié)合,也完美地彌補了兩者單獨使用狀態(tài)下的不足?,F(xiàn)在該綜合性檢驗方式在日常生產(chǎn)生活上已經(jīng)得到廣泛使用,也取得了不錯的成效。
(一)基于OPENCV的計算機視覺技術(shù)對圖像的預(yù)處理
計算機視覺技術(shù)運用到的地方各不相同,有些地方由于自身光照強度變化有很大差距,使得在一些場景下所呈現(xiàn)的環(huán)境因素對視頻采集數(shù)據(jù)的質(zhì)量有著很大影響。一般情況下,環(huán)境因素可能會讓得到圖像所表現(xiàn)出來的數(shù)據(jù)信息的質(zhì)量降低,這對于檢驗運動狀態(tài)下的物體和特定圖像下數(shù)據(jù)的采集有很大的影響,且在得到視頻的圖像幀數(shù)之后要對表現(xiàn)數(shù)據(jù)進行加工,這便是對圖像的預(yù)處理[2]。簡單來說,圖像預(yù)處理是將那些有平滑處濾波的地方進行修正或者對那些受到影響的圖像進行重新填充、更新等。
1、平滑度濾波處理
在進行對視頻圖像的信息采集時經(jīng)常會出現(xiàn)難以避免的噪聲,所以為了解決此問題,我們需要在完成圖像的信息采集后對噪聲進行處理,最大程度的減小噪聲,從而達到理想的信息采集效果。在處理噪音時最常用的便是平滑度濾波處理,改處理方式分為兩種,一種為線性處理,另一種為非線性處理。線性處理的優(yōu)點是其有著簡便的運算方法,運算速率快,但缺點是在完成噪音的處理之后,圖像很大可能會出現(xiàn)不清楚的狀況。而非線性處理與之恰恰相反,用非線性方法完成噪音處理后,雖能將噪音很好地降低,保證信號的完整性,但與線性處理相比,其預(yù)算速度較慢,花費時間較長。
2、圖像填充
在對圖像幀率的處理過程中,一般都是運用檢測邊緣填充法或是腐蝕膨脹法來完成這項任務(wù)的,其中檢測邊緣填充法指的是在檢測到該具體物體目標(biāo)之后,應(yīng)用邊緣檢測的方式對物體進行辨析,然后再根據(jù)形態(tài)學(xué)中的利用漫水填充的方法進行填充,而圖像的腐蝕膨脹則主要是因為拍攝設(shè)備的性能過低等問題導(dǎo)致的。
3、圖像背景更新
在進行圖像的分辨之前,必須先要對背景圖像進行確定,然后再對其進行一系列初始化處理。這樣可以方便在日后的檢測過程中對圖像背景進行實時地辨析,也只有這樣做,才可以得到效果最好的背景效果[3]。在圖像差分時,要先依據(jù)特定的算法確定好第一幀的背景圖像,然后把它指定為首張背景圖片,其次以此圖片為基準(zhǔn)對檢測過程中的圖像進行背景更新。
(二)提取前景運動物體圖像
在檢測運動物體時,最基本的便是要保證相應(yīng)的精度,讓前景跟蹤效果保持在最適狀態(tài)。圖像要經(jīng)過二催化處理之后對其進行分割,再將圖像進行充分填充,最后再把圖像進行分析,這樣一來,便可以保證前景圖像的完整性。在對前景圖像進行提取時,首先要拆分前景圖像背景圖,拆分完成后,開始二催化處理,將檢測出來的前景圖像的邊緣,輪廓確定之后再進行填充。
本文通過對計算機視覺技術(shù)下運動物體的檢測進行深入研究,對圖像預(yù)處理,信息切割,提取等任務(wù)進行詳細分析,其目的在于希望能夠為基于OPENCV的計算機視覺技術(shù)提供幫助,為一些相應(yīng)研究作出貢獻,給所有參與計算機視覺技術(shù)研究的學(xué)者提供想法,讓計算機視覺技術(shù)能有更好的發(fā)展。
參考文獻:
[1]張???基于Opencv的人手識別與跟蹤定位技術(shù)研究與實現(xiàn)[D].云南大學(xué).2013
[2]馬玉真,胡亮,方志強,曹素芝.計算機視覺檢測技術(shù)的發(fā)展及應(yīng)用研究[J].濟南大學(xué)學(xué)報(自然科學(xué)版).2004(03):222-227.
[3]程駿.基于立體視覺的直升機旋翼動態(tài)三維重建方法研究[D].南昌航空大學(xué).2012