劉海艷 陸映峰
摘 要:社會經濟體系在利用機械進行生產的過程中,對于機械的識別、追蹤與測算能力有著較高的要求,為了進一步提升機械的服務能力,滿足實際生產活動中的使用需求。計算工作者以計算機視覺作為研究核心,將攝像機與計算機為基本框架,在機械當中模擬出人類的視覺功能,完成識別、追蹤與測算等一系列工作。文章以計算機視覺作為研究中心,從多個維度出發(fā),對深度估算的方法進行優(yōu)化,以期為后續(xù)技術研究與應用工作的開展準備條件。
關鍵詞:計算機視覺 深度估計 雙目視覺 單目視覺
中圖分類號:TP391 文獻標識碼:A 文章編號:1672-3791(2018)02(a)-0037-02
計算機視覺要求相關技術體系運行過程中,能夠從景物的二維圖像中獲取三維立體結構與景物的基本屬性,并在這一過程中,對一幅或者多幅圖像中的信息進行獲取,這一過程稱之為深度估計。在進行深度估計的過程中,為了提升估計結果的準確性,普遍使用主動視覺與被動視覺兩種方式,主動視覺與被動視覺是根據(jù)成像光源的差異來進行區(qū)分的,主動視覺是被測量的物體可以發(fā)出可控光束,而后對光束進行獲取,形成最終的影像。被動視覺不需要可控光源也可以進行成像操作,因此應用性相較于主動視覺技術要更為廣泛,操作性更強。基于這種情況,文章將計算機被動視覺深度估計方法作為主要的研究對象,從多個維度出發(fā),以現(xiàn)有的技術為條件,對計算機視覺深度估計的方法進行優(yōu)化與發(fā)展。
1 被動視覺原理分析
被動視覺作為被動傳感器技術體系的重要分支,涵蓋了雙目立體視覺、運動視覺、描影視覺與聚焦法等集中不同的技術類型,由于被動視覺不要求測量物體本身具有發(fā)光屬性,因此具有較強的實用性?,F(xiàn)階段被動視覺被廣泛應用于距離測量與3D景物恢復工作之中,借助于自身的技術優(yōu)勢,被動視覺可以使用多臺攝像機對同一目標的兩幅照片進行視差計算形成計算深度,通過這種方式最大程度地提升了被動視覺測量的科學性與準確性。但是從實際情況來看,被動視覺所使用的雙目立體視覺、運動視覺、描影視覺等操作模式,雖然滿足了部分計算機視覺技術應用工作的客觀要求,但是受到多種因素的影響,被動視覺技術的應用效果受到制約,難以發(fā)揮被動視覺的技術優(yōu)勢[1]。對被動視覺原理的全面分析,幫助技術人員進一步理清被動視覺估計的核心訴求,為后續(xù)計算機視覺深度估計活動的開展創(chuàng)造了良好的外部環(huán)境,為后續(xù)計算機視覺技術體系的完善與發(fā)展提供了必要的技術支持。
2 深度估計在計算機視覺中實現(xiàn)所遵循的原則
計算機視覺深度估計活動的有序開展,不僅需要技術人員對于計算機視覺深度估計的重難點進行明晰,還需要從原則框架的角度出發(fā),對自身工作進行梳理,以期完善計算機視覺深度估計工作實施的途徑與手段,構建起科學高效的計算機視覺深度估計的全新模式。
2.1 計算機視覺深度估計要遵循科學性的原則。
計算機視覺深度估計體系的構建,要充分體現(xiàn)科學性的原則,只有從科學的角度對計算機視覺深度估計活動的主要流程、計算機視覺深度估計的基本要求以及計算機視覺深度估計的重難點進行細致而全面的考量,才能夠最大限度地保證鄉(xiāng)村小學音樂教學課體系實踐操作模式滿足切實滿足使用要求,只有在科學精神、科學手段、科學理念的指導下,技術人員才能夠以現(xiàn)有的教學資源為基礎,構建計算機視覺深度估計新體系。
2.2 計算機視覺深度估計必須要遵循實用性的原則。
由于計算機視覺深度估計的內容多樣,操作環(huán)節(jié)較多。為了適應這一現(xiàn)實狀況,計算機視覺深度估計的相關操作之中,就要盡可能地增加計算機視覺深度估計方案的容錯率,減少外部環(huán)境對計算機視覺深度估計活動的影響[2]。降低操作的難度,使得在較短時間內,進行批量操作,保證各個環(huán)節(jié)之中計算機視覺深度估計的順利開展。
3 深度估計在計算機視覺中實現(xiàn)的途徑與方法
深度估計在計算機視覺中的實現(xiàn)是一個全方位的過程,技術人員需要明確被動視覺的技術原理,以科學性原則、實用性原則為基本框架。采取針對性的技術手段,構建起計算機深度估計的有效方法,確保計算機視覺體系的有序構建。
3.1 立體視覺技術的優(yōu)化
雙目立體視覺是人類獲取距離信息的主要方法,其主要用于解決二維投影圖像進行三維結構的轉化,在這一體系下,為了實現(xiàn)距離獲取的準確性,需要在不同的位置進行不同數(shù)量攝像機的設置、移動或者旋轉,通過這種方式來進行圖像的獲取,并通過數(shù)學算法對多幅圖片的視差進行計算,并在此基礎上形成三維坐標[3]。具體原理如圖1所示。
在獲取信息的過程中,雙目立體視覺技術的視差與相機測量的深度成反比例管理,因此,只有在近距離測量的過程中,測量數(shù)據(jù)才具有可參考性,一旦測量距離超過一定的限度,測量數(shù)據(jù)的準確性難以得到保證。為了應對上述情況,發(fā)揮雙目立體視覺技術在深度估計中的重要性,技術人員需要在科學性原則的框架體系下,分析雙目立體視覺技術的各個環(huán)節(jié),借助于計算機技術將相機建模、特征提取、圖像匹配與深度計算進行高度整合,充分發(fā)揮計算機在數(shù)據(jù)獲取、信息處理與三維坐標構建中的積極作用,通過計算機強大的計算能力,對雙目立體視覺獲取的坐標進行糾偏,防止坐標體系計算過程中出現(xiàn)錯誤,實現(xiàn)計算機被動視覺的三維重建,促進計算機視覺技術的健康快速發(fā)展。
3.2 運動視覺在計算機視覺中的實現(xiàn)
運動視覺借助于被測對象與攝像設備之間的相對運動,構建起三維表面信息體系。運動視覺以因分子分解的運動估算結構為框架,研究不同時間段內運動變化場景中,物體形狀、位置與運動信息的獲取。在運動視覺進行三維信息獲取的過程中,需要技術人員從兩個維度入手,一個維度在于通過對多幅圖片進行抽取特點,建立起對應的位置關系,另一個維度在于根據(jù)不同點之間的位置關系進行函數(shù)關系的推定,形成物體的結構表述與運動特性。為了進一步發(fā)揮運動是覺得技術優(yōu)勢,技術人員可以在實用性原則的基礎上,全面分析運動視覺的基本環(huán)節(jié),從對運動視覺技術操作的冗余環(huán)節(jié)入手,不斷進行技術流程的優(yōu)化,在此基礎上,將數(shù)學算法融入到計算機視覺之中,形成數(shù)學表達形式,z=(Δx+XΔz)/[X(r31X+r32Y-r33)+(r11X+r12Y-r13)],其中,z為計算機視覺深度;Δx為測量物體的運動矢量變化;X、Y、r分別為被測算物體的三維坐標,通過構建起科學的數(shù)學表達式,技術人員可以準確便捷的進行運動視覺數(shù)據(jù)信息的計算,發(fā)揮運動視覺估計方法的技術優(yōu)勢。
4 結語
計算機視覺深度估計方法在實踐中的應用,需要技術人員從現(xiàn)階段技術發(fā)展的實際出發(fā),將被動視覺作為研究核心,明確被動視覺的技術原理。在此基礎上,以科學性原則、實用性原則為基本框架,以現(xiàn)有的技術手段為引導,將雙目立體視覺技術與運動視覺技術為突破口,借助于數(shù)學表達式的形式,形成深度估計運行模式,發(fā)揮深度估計方法的技術優(yōu)勢,實現(xiàn)計算機視覺體系的合理化構建,確保相關技術操作的有序開展。
參考文獻
[1] 秦彤.基于單幅散焦圖像的深度估計算法的研究[J].合肥工業(yè)大學,2014.
[2] 薛松,王文劍.基于高斯-柯西混合模型的單幅散焦圖像深度恢復方法[J].計算機科學,2017,44(1):32-36.
[3] 袁紅星,吳少群,安鵬,等.對象引導的單幅散焦圖像深度提取方法[J].電子學報,2014,42(10):2009-2015.