白 娜
華為技術(shù)有限公司,陜西西安 710000
21 世紀(jì)以來(lái),我國(guó)在電子科學(xué)技術(shù)和計(jì)算機(jī)技術(shù)水平的飛速發(fā)展中,人類社會(huì)的步伐逐漸走向了一個(gè)高速化、現(xiàn)代化的時(shí)代,信息的獲取和處理在我們的生活與生產(chǎn)中已經(jīng)發(fā)展成為了一種重要的產(chǎn)業(yè)。據(jù)統(tǒng)計(jì),人類從外部環(huán)境中直接獲取的信息大約可以占到所有獲取信息的一半以上。但是這個(gè)龐大的數(shù)字在數(shù)字的傳輸與處理中給數(shù)據(jù)存儲(chǔ)過(guò)程增加了處理負(fù)擔(dān)。在我們的日常生活中,我們可能僅僅需要圖像所傳遞的基本信息,但是,在對(duì)圖像進(jìn)行一些加工和處理后,我們能夠在以前的基礎(chǔ)上獲取更多的相關(guān)信息,這就是我們所說(shuō)的視頻圖像,也稱之為運(yùn)動(dòng)中的視覺(jué)信息。
數(shù)字視頻視覺(jué)處理可以根據(jù)處理前后的輸入、輸出的信息劃分為3 個(gè)層次:1)低級(jí)層次:在處理的過(guò)程中,處理后的輸出結(jié)果和處理前的輸入信息都顯示為圖像,不包含其他的特征信息;2)中級(jí)層次:在這個(gè)層次中,處理之前輸入的信息內(nèi)容為圖像,但是在經(jīng)過(guò)處理之后,輸出的結(jié)果顯示為特征性的信息,而不是抽象意義的圖片;3)高級(jí)層次:這個(gè)層次的視覺(jué)處理就像是人類的視覺(jué)認(rèn)知能力一樣,具備一定的人中與感知的能力。低級(jí)的數(shù)字視頻視覺(jué)處理是為了通過(guò)這一過(guò)程,達(dá)到改善圖像的質(zhì)量的目的。中級(jí)層次的主要目的是將低級(jí)層次的圖像描述的內(nèi)容進(jìn)行系統(tǒng)性的分類,然后做出相應(yīng)的分析,最后直接提取有興趣的信息。高級(jí)層次的視覺(jué)處理是將提取后的信息做進(jìn)一步深入的處理和歸類,促進(jìn)與人類視覺(jué)相似的邏輯推理的有效完成,得出一種信息符號(hào),作為其標(biāo)志。
在數(shù)字視頻視覺(jué)的處理與控制系統(tǒng)的基礎(chǔ)之上,數(shù)字視頻處理系統(tǒng)可以應(yīng)用到以下幾個(gè)領(lǐng)域:1)機(jī)器制造領(lǐng)域,主要用于工業(yè)產(chǎn)品的檢測(cè),產(chǎn)品包裝的印刷、產(chǎn)品終極損傷度的檢測(cè)等;2)視覺(jué)上的導(dǎo)航,包括日常生活中的駕駛GPS 導(dǎo)航、自主導(dǎo)航和智能交通導(dǎo)航等領(lǐng)域;3)安全防衛(wèi)監(jiān)控領(lǐng)域,這一技術(shù)廣泛運(yùn)用于電子警察、遠(yuǎn)程行為監(jiān)控和區(qū)域性的防盜等區(qū)域。鑒于我國(guó)的制造業(yè)的迅猛發(fā)展,視頻視覺(jué)處理和控制系統(tǒng)已經(jīng)普遍性的應(yīng)用于工業(yè)的生產(chǎn)、發(fā)展之中,我們預(yù)言,在未來(lái)不久的日子里,我國(guó)也勢(shì)必走向全球市場(chǎng),成為一個(gè)與世界媲美的生產(chǎn)場(chǎng)地。
數(shù)字視頻的采集與處理系統(tǒng)大致由三個(gè)主要的模塊構(gòu)成:成像模塊,在這一模塊中,主要包括圖像傳感器和鏡頭這兩個(gè)部分,不用類型的圖像傳感器具備不一樣的分辨率、感光面積和動(dòng)態(tài)的范圍等。這些技術(shù)已經(jīng)廣泛的應(yīng)用與我們?nèi)粘I钪谐R?jiàn)的數(shù)碼相機(jī)、攝像機(jī)、手機(jī)等一系列的電子產(chǎn)品中。在處理控制模塊中,我們最常見(jiàn)的成分有:PC 機(jī)、通用的DSP 和常用的ASIC 等部件構(gòu)成。在PC 機(jī)主要是由不同類型的板卡和人機(jī)相互應(yīng)用的一種軟件類型,生活中也常見(jiàn)此技術(shù)得以應(yīng)用,比如在高速公路上的收費(fèi)站選用的收費(fèi)系統(tǒng),我們身邊的醫(yī)療成像系統(tǒng)。通用的DSP 和ASIC 的工作效率很高,體積相對(duì)較小,便于攜帶,基于以上優(yōu)點(diǎn),我們生活中廣泛應(yīng)用的是在對(duì)實(shí)時(shí)性要求比較高的一些特殊的場(chǎng)合:工廠里面的生產(chǎn)流水線上的監(jiān)控、無(wú)人駕駛車上的監(jiān)控裝置。傳輸與顯示模塊會(huì)將獲取的信息加工、處理,最后發(fā)送到中端處理器上,再進(jìn)行深度的存儲(chǔ)和加工。這種系統(tǒng)針對(duì)于視頻圖像而言,數(shù)據(jù)處理的數(shù)量相對(duì)較大,對(duì)實(shí)時(shí)性的要求也很高,當(dāng)然在傳據(jù)的傳輸率要求也是非常的嚴(yán)謹(jǐn)。
3.1.1 多媒體計(jì)算機(jī)
對(duì)于計(jì)算機(jī)的硬件配置相求較高的計(jì)算機(jī)主機(jī),在數(shù)字視頻處理的過(guò)程中的要求是相對(duì)較高的。比如說(shuō)如果選用的CPU是雙核配置,就可以選擇AMD 和INTEL 這兩種類型,最好的選擇是后者或者酷睿系列的配置。對(duì)于主頻而言,越高的配置當(dāng)然是越好的。為提高整體的速度和處理的能力,最好選用內(nèi)存在DDR21G 以上大小的,硬盤的平均存取時(shí)間一般要低于15ms,然而這樣速度的前提是選用SCSI 系列的硬盤,這樣能更好的保證系統(tǒng)的穩(wěn)定性。
3.1.2 視頻采集卡
視頻采集卡的主要用途是獲取數(shù)碼視頻信息,并在獲取信息之后將其有效的存儲(chǔ)和播放,視頻素材的選擇非常重要,一般選取模擬信號(hào),并結(jié)合視頻采集卡來(lái)完成整個(gè)視頻的處理。部分特殊的視頻采集卡還會(huì)配備有更多的功能,比如說(shuō)壓縮功能,而且數(shù)據(jù)處理的速度較快,更為重要的是,它還可以全屏幕的數(shù)字視頻捕捉。
3.1.3 主流顯卡與壓縮卡
在日前的市場(chǎng)上推出的主流顯卡和壓縮卡的類型比較多,ATI4870 和GTX280 等都是性價(jià)比相對(duì)較高的兩款。但是在壓縮卡的選擇上,要著重考慮壓縮之后的文件的各種性質(zhì),比如說(shuō)文件的質(zhì)量狀況、穩(wěn)定性能、價(jià)格及其功能的綜合情況。當(dāng)然,顯卡和壓縮卡的匹配度對(duì)于數(shù)據(jù)視頻的處理而言是相當(dāng)重要的。
3.2.1 桌面視頻捕獲過(guò)程
數(shù)字視頻的捕獲與壓縮是一個(gè)非常復(fù)雜的過(guò)程,一般稱為桌面視頻的捕獲,它是通過(guò)視頻卡從視頻源基地獲得模擬性的視頻信號(hào),并借助一系列的工具將其接收的視頻信號(hào)有效轉(zhuǎn)化為數(shù)字視頻類的信號(hào),一般包括視頻的采集和視頻的壓縮兩個(gè)過(guò)程。
經(jīng)過(guò)采集壓縮之后的視頻媒體文件需要在一系列的處理之后完成編輯的工作,這個(gè)過(guò)程中就包括:剪切、編輯、切換以及特效功能的搭配,因此借助計(jì)算機(jī)的編輯技術(shù)可以解決這個(gè)問(wèn)題。在數(shù)字圖像捕獲和測(cè)量的過(guò)程中不僅要注重過(guò)程的嚴(yán)謹(jǐn),更要注意測(cè)量方法的合理搭配。只有通過(guò)科學(xué)的、合理的測(cè)量方法,才能獲取多樣化的視頻信息,并逐漸展開(kāi),提高數(shù)字視頻視覺(jué)的采集和系統(tǒng)處理的過(guò)程。
3.2.2 像素當(dāng)量測(cè)量法
每個(gè)像素都代表有實(shí)際的長(zhǎng)度,在沒(méi)有標(biāo)定數(shù)據(jù)的圖像像素所代表的實(shí)際長(zhǎng)度是不一樣的,一旦經(jīng)過(guò)了標(biāo)定,每個(gè)像素所代表的實(shí)際長(zhǎng)度就會(huì)成為一個(gè)常函數(shù)。在我們的后續(xù)工作中,先將給定的圖像進(jìn)行校正,然后求得各個(gè)特征點(diǎn)的像素,和像素當(dāng)量相乘的結(jié)果就是我們要求取的各個(gè)特征點(diǎn)之間的實(shí)際的距離。
像素當(dāng)量測(cè)量方法的具體過(guò)程如下:1)針對(duì)圖像進(jìn)行中值濾波,在原始的灰度差別較大的圖像基礎(chǔ)上,保持一個(gè)相對(duì)穩(wěn)定的狀態(tài),這樣就避免了復(fù)雜的預(yù)處理全過(guò)程,可以有效的去除存在于圖像中的多種噪聲;2)分割水平方向和豎直方向的閾值。根據(jù)水平方向和豎直方向的標(biāo)尺灰度的差值,進(jìn)行有效的修改,得到一個(gè)最優(yōu)值,最后,將標(biāo)尺邊緣的部分去除,就能得到有效的部分。
3.2.3 邊緣檢測(cè)技術(shù)
圖像邊緣產(chǎn)生的原因是灰度值不連續(xù)而導(dǎo)致的結(jié)果,在圖像顯示中,指那一部分灰度變化特別顯著的部分。在圖像中,往往會(huì)因?yàn)榫拔锏奈锢硖匦缘淖兓a(chǎn)生圖像邊緣,物理特性主要包括以下幾個(gè)方面:陰影部分、物體的方向和深度以及反射的系數(shù)。
實(shí)際中圖像是一個(gè)復(fù)雜的整體,這就導(dǎo)致了邊緣類型的多樣化。我們可以根據(jù)灰度的變化情況,將邊緣劃分為階躍型和屋脊型的邊緣。通過(guò)灰度的導(dǎo)數(shù),我們可以在實(shí)際的數(shù)學(xué)運(yùn)算中刻畫(huà)出邊緣點(diǎn)的具體的變化過(guò)程。對(duì)于階梯型邊緣,它的灰色變化曲線越大,它所對(duì)應(yīng)的導(dǎo)數(shù)值就會(huì)到達(dá)一個(gè)極限值。
目前主要通過(guò)兩方面的改進(jìn)來(lái)提高圖像測(cè)量系統(tǒng)的精準(zhǔn)度:第一,硬件設(shè)備的改進(jìn);第二,有效的利用空間目標(biāo)的成像特征,利用亞像素定位技術(shù)來(lái)測(cè)量定位的精準(zhǔn)度。
數(shù)字視頻視覺(jué)的采集與處理技術(shù)在安防監(jiān)控的相關(guān)產(chǎn)業(yè)、工業(yè)檢測(cè)與包裝印刷等領(lǐng)域里以及圖像、內(nèi)容的處理與控制系統(tǒng)中得到了廣泛的應(yīng)用與發(fā)展。它的最大優(yōu)勢(shì)在于處理和傳輸、存儲(chǔ)的途徑快捷,通過(guò)數(shù)字視頻技術(shù)對(duì)視頻材料進(jìn)行有效的編輯與整理,是多媒體綜合課件中一個(gè)必不可少的環(huán)節(jié)。因此,本文對(duì)此研究熱點(diǎn)進(jìn)行了探析,希望可以為人類社會(huì)的開(kāi)發(fā)和發(fā)展提供一定幫助。
[1]岡薩雷斯.數(shù)字圖像處理.北京:電子工業(yè)出版社,2004.
[2]李玉山,來(lái)新泉,等.電子系統(tǒng)集成設(shè)計(jì)技術(shù).北京: 電子工業(yè)出版社,2007.
[3]劉文開(kāi).數(shù)碼影像處理實(shí)用技術(shù)[M].沈陽(yáng):遼寧科學(xué)技術(shù)出版社,2000.