李淵 趙金環(huán)
摘要:在我國市場經濟不斷發(fā)展的背景下,人們對高品質圖像的需求逐漸增加,因此,利用計算機視覺算法提升圖像處理工作效果已成為業(yè)內首選。文章從計算機圖像處理技術的概念著手,分析了在計算機圖像處理工作中利用視覺算法的優(yōu)勢,并從多個角度闡述了基于計算機視覺算法的圖像處理技術應用路徑,以期為提升圖像處理工作的整體效果提供建議,從而為我國計算機應用行業(yè)的發(fā)展做出一定貢獻。
關鍵詞:計算機視覺算法;圖像處理;應用探究
中圖法分類號:TP391 文獻標識碼:A
在當前的二維計算機圖片處理工作中,物體往往只能呈現(xiàn)出一個側面的投影,而隨著技術的進步,人們對立體圖像的需求有所增加。本文介紹了一種利用計算機視覺技術實現(xiàn)三維立體顯示的計算機視覺方法。與BP 神經網絡相比,該方法具有較高的校正準確率,在圖像處理中具有較大的實用價值。
1 計算機圖像處理技術概述
1.1 圖像處理步驟
采用計算機技術對圖像進行處理,首先,要對圖像進行分析,獲取具體的圖像數據后才能得到要處理的圖像信息。其次,要做好圖像處理工作,并將處理后的圖像信息通過相關軟件轉換為計算機能夠采集的數據,接著將其存儲起來,以便以后可以利用不同的計算方法對儲存在計算機中的圖像信息進行變換和分析處理。
1.2 圖像類別
在計算機進行圖像處理時,可以將圖像分為如下2 類。(1)模擬圖像。其是指通過像素點位置進行數據儲存。這類圖像的傳輸具有快速、精確、不靈活等特點。(2)數碼影像。在技術進步的同時,影像技術也逐漸向數碼技術方向發(fā)展。數字圖像是一種新興的技術,由計算機和計算機技術發(fā)展而來。與模擬圖像相比,數字圖像具有更高的準確度[1] 。
2 計算機圖像處理技術的應用優(yōu)勢
2.1 準確性高
通過計算機圖像處理技術對數字圖像進行分析后,可以獲取一個二維點陣陣列,它的二維陣列可以對任意尺寸的圖像進行數字化處理。大部分人都會使用一種能夠分辨出像素的灰度級別的儀器,相關的處理數據儲存在16 位的字符中,其既能保證圖像的精度,又能滿足用戶對圖像處理的要求。
2.2 再現(xiàn)能力強
從目前的圖像處理工作來看,客戶對圖像處理的結果要求依然較為簡單,客戶最重要的目標就是提高處理后圖片的真實感。然而,模擬圖像技術在很大程度上降低了圖像的原始質量,難以保證整體的處理效果。利用數碼影像處理技術,可以更精確地還原原圖像,不管是否經過處理,影像的品質都不會受到太大影響。另外,利用計算機數碼影像信號處理技術,可以在不改變原影像品質的前提下,對數碼影像進行復制、傳送,并能實現(xiàn)圖片的高品質再現(xiàn)。
2.3 可以滿足社會對高品質圖像的需求
圖像的格式直接影響圖像的處理,相較于以往的模擬圖像,利用計算機視覺算法處理的圖像要豐富得多,不管是光圖像,流行圖像,還是航空圖像,都可以通過數碼圖像編碼設備進行轉換。因此,計算機視覺算法在進行圖片處理時有著較高的適用性。不管是哪一種類型的信息處理工具,都能實現(xiàn)對圖像的數字化,利用網絡技術可以實現(xiàn)對圖像的快速處理。
3 基于計算機視覺算法的圖像處理技術的應用路徑
隨著信息時代的來臨,計算機視覺技術在圖像處理技術中得到了越來越多的應用,它能使圖像的質量得到提高,利用三維體素映射出目標的三維坐標,能夠真實地反映出目標在空間中的位置,控制體素的亮度、色彩,從而獲取立體影像信息。為防止立體投影儀造成的影像畸變,必須應用比BP 神經網絡更精確的影像運算和影像處理技術,并利用高速投影機、散射屏、基于CNN 模型的深度學習方法,以實現(xiàn)較好的影像復原效果[2] 。
3.1 計算機視覺顯示系統(tǒng)設計
3.1.1 光場重構
與傳統(tǒng)的2D 顯示方法相比,為獲得更加逼真的3D顯示效果,必須使用更加復雜和先進的處理技術,才能獲得理想的像素處理效果。在三維數據分析中,要構造出一個完整的三維空間,在此基礎上,將三維空間中的各個基本單元作為一個像素點,并采用三維坐標來表示,而真實的三維影像則是由許多立體的像素點組成。光場的重建需要借助光機和機構的運動來完成。
例如,目前主要通過五維光場函數進行圖像處理,利用該函數,能對三維空間中的圖像內容進行分析,目前圖像的3 位坐標主要使用F:L∈R5→∈R3 來描述,L =[x,y,z]為下方向,數字圖像色彩的數據信息是Y =[r、g、b]。在三維模型和紋理的顯示過程中,采用了離散的集合形式,利用Li =[Pi,Yi]來表達3D 空間中的色彩和位置,并基于光場的擴散曲線來確定光場視覺算法。然后,利用3D 光場重建了h 深度的子集,在不同的深度情況下,將其分割為若干子集合,利用二維投影、散射屏幕重建光場,從而獲得三維影像。
目前,相關技術研究人員認為,利用二維投影技術可以重建快速轉動的影像,從而使影像在三維光場中得到重建。
3.1.2 顯示系統(tǒng)設計
目前,利用旋轉式液晶顯示點陣系統(tǒng)進行圖像分析的結果表明,利用成像方法重建三維立體光場,只能形成圓柱形,無法獲得良好的視覺位置和分辨率。利用ARM 芯片的優(yōu)良性能,計算機視覺算法能夠實現(xiàn)與圖像信息的智能交互,從而形成一個真實的立體顯示器,可以從不同的角度觀測所形成的立體影像,并進一步提高圖像的像素和清晰度,使體素的存儲容量達到30MB。具體的設計過程是:采用3DSMA 進行數字模型化、圖像格式轉換、紋理貼圖,提取坐標色彩信息,組織技術人員進行交叉分析、抽取像素色彩信息。
在圖像處理的過程中,將人體的三維數據通過USB 接口發(fā)送到SDRAM 中,然后由FPGA 對圖像進行處理,最后將圖像信息發(fā)送到ARM。在旋轉物體的圖像顯示中,ARM 處理后的影像信息被傳輸至旋轉物體顯示裝置,FPGA 將轉換后的影像信息投影到散射屏上,由馬達和編碼器對其進行調解,并將調節(jié)位置反饋至FPGA,由該編碼馬達向驅動模塊發(fā)送定位信息[3] 。
在三維場景中拍攝物體時,要從立體角度顯示物體,對存儲在物體上的數據進行掃描,利用視頻獲取技術將物體的編號輸入物體中,從而判斷出物體所要處理的圖像數據。然后通過DMD 控制設備、投影機等對數據和圖像進行處理與投射,通過傳輸方向散射實現(xiàn)圖像的投射。
在高速圖像處理中,編碼馬達是一個必不可少的先決條件,它既能監(jiān)測轉臺的角度和速度,又能把監(jiān)測信號傳輸到控制器,從而達到閉環(huán)控制的目的。在高速運行時,由同步控制裝置獲取編碼電機的位置信息,并與DVI 視頻信號相結合,使控制器能夠依據編碼器的信號狀態(tài)生成幀頻率信號,從而保證了散射屏的位置和投影儀同步。散射屏采用方位型,傾斜角度為45°,與投影機、光學系統(tǒng)保持同步。
步進馬達能實現(xiàn)對散射屏幕方向和速度的定向調整,以及使底座旋轉。在開展展覽、會議等活動時,通過此裝置結合遙控方式進行精密地旋轉,并安裝黑色的吸光片,可以防止投射時的光線泄露。通過在玻璃罩子上放置光電傳感器,可以將運動的仿真信號轉換成數字信號,然后通過ARM 處理器將處理后的數據傳送到步進電機,繼而實現(xiàn)對3D 圖像的精確旋轉,以滿足用戶對3D 圖像的需求,從而達到與用戶互動的目的。
上轉臺是用來帶動方向散射屏幕轉動的,從而達到立體投影的效果,而下轉臺則是用來驅動整個設備,通過藍牙、局域網等方式采集控制信號,然后把控制信號傳送到步進電機。在展覽、會議等場合,通過遠程控制設備,實現(xiàn)360°全方位的展示[4] 。
3.2 圖像畸變矯正算法
3.2.1 畸變矯正
基于計算機視覺的方法,可以充分發(fā)揮計算機圖像處理技術的優(yōu)點,使處理畸變圖像更加方便靈活。
采用投射裝置進行垂直投影,但由于視場變化,垂軸的放大倍數會逐漸增大,從而導致像素點發(fā)生明顯的偏移。當偏差距離超過規(guī)定范圍時,會產生失真的問題,因此,必須采取相應的圖像處理技術,以確?;謴秃蟮膱D像的保真度,避免因畸變嚴重而導致的失真。
目前,徑向畸變和切向畸變是主要的畸變類型,切向畸變導致的畸變并不明顯,所以在處理畸變時應把徑向畸變作為研究的重點,而軸向畸變有桶形和枕形畸變。
人們普遍認為,造成圖像失真的原因是空間狀態(tài)的扭曲,即所謂的曲線失真。利用二次多項式矩陣來確定失真系數,當有較大的失真時,這種方法不能采用。
然而,由于多項式的數目越來越多,在處理失真時所使用的矩陣的反演也就越大,因此使用程序設計技術來解決和處理這類問題將會很困難。利用BP 神經網絡的方法校正圖像的失真,可以進一步提高處理的準確率,并與計算機視覺相結合,實現(xiàn)更深層次的校正。卷積神經網絡具有較好的圖像失真處理能力,它類似于生物神經網絡,利用相似權重構建了一個共享網絡,進而利用網絡模型降低了圖像處理的難度,也減少了相應的權重,具有更強的識別和概括能力。
3.2.2 畸變圖像處理
CNN 卷積神經網絡具有較強的圖像處理能力,以及優(yōu)秀的稀疏連接性和權重分享性,同時具有較強的學習和訓練能力。在處理變形圖像時,其具有良好的連接模式,只要一次輸入足夠多的圖像信息,便能有效提升AI 的圖像處理能力,且不需要重新抽取圖像信息,就能有效提升圖像處理效果。
通過權值分配,用戶能夠獲得較好的學習效果,降低了學習和訓練的難度,便于對數據的容量進行控制,并能更精準地發(fā)現(xiàn)問題。卷積神經網絡算法采用卷積層和池化層,不會出現(xiàn)明顯的特征采樣,利用卷積神經網絡的權重來進行深度學習,并利用卷積神經網絡的權重來減少訓練參數,使其易于調節(jié)和控制,從而提高失真處理的普遍性[5] 。
利用卷積神經網絡的解析度來表示圖像數據,它和數字圖像的處理方法一致,但由于圖像會發(fā)生幾何變形,因此要進行正確的判別和訓練,只需要對變形的形狀進行預測和分析,就可以得到正確的測量窗口,從而實現(xiàn)精確的切割。比如,一個數碼格式的影像分辨率僅為227×227,經過相減運算,其由2 個全連接層和5個卷積層組成,然后將影像資料轉換成符合卷積神經網絡運算的條件,并將其設定成同樣的解析度。
3.3 圖像處理技術程序的實現(xiàn)
相關人員可以利用Matlab 軟件建立圖像的數學模型,并利用程序對圖像的畸變進行分析和計算。在確定和處理圖像的過程中,為提升卷積神經網絡的處理能力,以1 000 個畸變和標準圖像作為AI 處理樣本。該系統(tǒng)采用了基于DeepLearning 的計算機視覺算法,對畸變圖像進行了處理和校正,在進行校正時,首先要將圖像中的各個像素點進行映射,然后根據不同的灰度差來確定灰度。它具有低通濾波器的特性,校正精度高,沒有灰度的缺陷。因此,利用二次線性內插方法,可以分析和計算出4 個失真點周圍的4 個灰度值的畸變值。
在對圖像進行幾何變形的情況下,利用計算機視覺方法構建CNN 模型,對卷積和下降取樣層數進行適當的分配,并確定下降的取樣幅度,并將其與卷積神經網絡相結合。利用灰度差中的雙線性插值方法,可對畸變圖像的點位灰度進行優(yōu)化,并對各畸變點進行處理,使1 000 張圖像中的畸變點全部被處理,從而獲得校正后的完整圖像。
為降低卷積神經網絡的運算難度和縮短變形處理的時間,將變形校正圖像分為2 個階段,第1 階段采用CNN 模型進行校正,第2 階段合理分配校正參數。在進行參數修正時,首先要建立1 張查詢表,并將它作為一種常用的形式,確保其有足夠的存儲空間。然后,將已錄入的圖像數據與相應的灰度值相結合,將當前的灰度值設定為設定值,從而能夠進行數字圖像的處理和修正。通過這種方法,可以在初始化階段根據映射表建立數字圖像的CMM 模型,并通過此模型對圖像的變形進行處理,并實現(xiàn)檢索表的自動生成[6] 。
4 結束語
利用卷積神經網絡進行變形校正,并在此基礎上構造一種新的自適應算法,能有效提升計算機圖像處理的效果,在目前的計算機圖像處理方面有著較為廣闊的應用前景,該方法在實際應用中比多項模型和BP 神經網絡的處理效果更理想,具有很好的穩(wěn)定性和推廣能力,有著較好的應用前景。
參考文獻:
[1] 王麗.計算機圖像處理技術的應用及其發(fā)展趨勢展望[J].信息系統(tǒng)工程,2022(12):101?104.
[2] 謝曉旦.計算機視覺算法的圖像處理技術研究[J].無線互聯(lián)科技,2022,19(3):103?104.
[3] 付正廣.計算機圖像處理與識別技術的應用研究[J].黑龍江科學,2021,12(24):110?112.
[4] 葉一帆.基于計算機視覺算法的圖像處理技術研究[J].長江信息通信,2021,34(10):73?75.
[5] 楊璐.基于計算機視覺算法的圖像處理技術研究[J].信息記錄材料,2021,22(9):134?135.
[6] 賀銀平.計算機視覺算法的圖像處理技術的探究[J].電子世界,2021(4):96?97.
作者簡介:李淵(1996—),碩士,助教,研究方向:機器學習、圖像處理。