包 輝
(河北省計(jì)量監(jiān)督檢測(cè)研究院 河北 石家莊 050227)
雙目立體視覺是我國(guó)在計(jì)算機(jī)視覺研究領(lǐng)域中的熱點(diǎn)內(nèi)容,可以對(duì)人類視覺進(jìn)行模擬,在各種條件下都可以對(duì)景物的立體信息進(jìn)行測(cè)量,有著其他計(jì)算機(jī)測(cè)量技術(shù)難以取代的價(jià)值。 因此,在對(duì)該技術(shù)的研究上,不管是基于視覺生理角度還是工程實(shí)踐角度,均有著重要的實(shí)用作用。 立體視覺的研究工作起源于20 世紀(jì)60 年代中期,實(shí)現(xiàn)了二維圖像向三維圖像研究工作的轉(zhuǎn)變。 在之后的數(shù)十年里,經(jīng)過有關(guān)研究學(xué)者的不斷研究,該技術(shù)已經(jīng)成為一門新興學(xué)科[1]。
激光跟蹤測(cè)量?jī)x技術(shù)主要是通過對(duì)球面坐標(biāo)系的合理利用,對(duì)目標(biāo)點(diǎn)三維坐標(biāo)進(jìn)行求解。 在該技術(shù)的使用過程中,長(zhǎng)度L 可以直接利用激光干涉原理來獲取角度,α和β 則可以通過不同角度編碼器來獲取。 如果想要在實(shí)踐工作過程中獲得工件坐標(biāo),需要同步進(jìn)行半徑補(bǔ)償處理。 由此使用該技術(shù)時(shí),反射鏡的移動(dòng)速度不能超出要求。 若是在測(cè)量過程中發(fā)生了靶鏡丟光問題,則測(cè)量工作無法繼續(xù),而是需要重新調(diào)整。 由此可以看出激光跟蹤測(cè)量?jī)x技術(shù)效率相對(duì)較低,操作過程有著較大的技巧性,需要有關(guān)工作人員有豐富的工作經(jīng)驗(yàn)。
室內(nèi)全球定位系統(tǒng)(global positioning system,GPS)測(cè)量技術(shù)主要是通過對(duì)三角定位測(cè)量技術(shù)的合理利用,實(shí)現(xiàn)全球定位功能。 其整個(gè)系統(tǒng)組成和衛(wèi)星網(wǎng)絡(luò)結(jié)構(gòu)存在一定的相似性。 雖然室內(nèi)GPS 技術(shù)可以滿足大范圍、大面積的空間動(dòng)態(tài)測(cè)量標(biāo)準(zhǔn),但是該技術(shù)的使用有著較高的成本投入。 與此同時(shí),測(cè)量的精度無法滿足高精度測(cè)量要求。 再加上接收器數(shù)量存在限制,獲取的空間點(diǎn)坐標(biāo)數(shù)量也存在限制,我國(guó)的高精度室內(nèi)GPS 技術(shù)使用仍有很大的進(jìn)步空間。
視覺測(cè)量技術(shù)與其他技術(shù)相比,其優(yōu)勢(shì)和價(jià)值便在于有著較好的測(cè)量效率,測(cè)量靈活性將會(huì)得到顯著提升。 以立體視覺測(cè)量技術(shù)為代表,是視覺測(cè)量技術(shù)中的重要分支之一,被廣泛運(yùn)用在實(shí)際工作中。 立體視覺測(cè)量分為三個(gè)步驟,分別是測(cè)量之前的準(zhǔn)備工作、信息的采集以及后續(xù)的算法處理。 較早運(yùn)用在工程實(shí)踐中的立體視覺測(cè)量技術(shù),可以追溯到20 世紀(jì)70 年代。 1978 年,美國(guó)一家公司研制出了V?STARS 系統(tǒng),將該系統(tǒng)應(yīng)用在了航空制造等裝備生產(chǎn)活動(dòng)中。 2005 年,V?STARS 系統(tǒng)開始逐漸被引入到我國(guó),在我國(guó)的通信航天領(lǐng)域中發(fā)揮出了重要的價(jià)值。 經(jīng)過對(duì)系統(tǒng)的全面改進(jìn),現(xiàn)階段廣船國(guó)際有限公司(Guangzhou Shipyard International Company Limited,GSI)已經(jīng)推出了新一代的測(cè)量系統(tǒng),可以滿足高精度測(cè)量需求。與此同時(shí),新一代的雙相機(jī)系統(tǒng)及典型測(cè)量精度也達(dá)到了10 μm+10 μm/m。 我國(guó)的立體視覺測(cè)量技術(shù)已經(jīng)被廣泛運(yùn)用在大尺寸測(cè)量工作中,例如可以利用立體視覺測(cè)量技術(shù),針對(duì)車身進(jìn)行自動(dòng)測(cè)量、設(shè)計(jì)車輛參數(shù)測(cè)量系統(tǒng)、對(duì)車輛尺寸進(jìn)行幾何參數(shù)的快速測(cè)量[2]。
與視覺測(cè)量技術(shù)相比,其他的測(cè)量技術(shù)或是設(shè)備測(cè)量效率較低,或是操作過程有著較高的技術(shù)要求,或是設(shè)備成本投入較高。 為此,需要開發(fā)高效、準(zhǔn)確、性價(jià)比高的立體視覺測(cè)量技術(shù)系統(tǒng),以滿足大尺寸的快速測(cè)量需求。
雙目立體視覺主要依賴于計(jì)算機(jī)技術(shù)對(duì)人類數(shù)據(jù)原理的動(dòng)態(tài)模擬,并借助計(jì)算機(jī)來實(shí)現(xiàn)距離的被動(dòng)感知。 該方法基于兩個(gè)或更多的點(diǎn)去觀察同一物體的環(huán)境,從而產(chǎn)生不同維度的圖像。 然后,根據(jù)圖像中像素的匹配程度,運(yùn)用三角測(cè)量的原理,獲取兩幅圖像中空間點(diǎn)的偏移數(shù)據(jù),最終得到物體的三維數(shù)據(jù)信息。 人們不僅能夠獲取到物體的實(shí)際景深數(shù)據(jù),還能清楚地了解物體與相機(jī)之間的真實(shí)距離,并且能夠把握物體的三維尺寸,從而確定兩點(diǎn)之間的真實(shí)距離[3]。
雙目立體視覺測(cè)量技術(shù)的價(jià)值在于效率較高、精度科學(xué)合理、系統(tǒng)結(jié)構(gòu)較為簡(jiǎn)單、成本投入較低,更加適合運(yùn)用在制造現(xiàn)場(chǎng)的在線非接觸產(chǎn)品檢測(cè)及質(zhì)量控制工作中。雙目立體視覺系統(tǒng)是我國(guó)計(jì)算機(jī)視覺的主要技術(shù)之一,可以獲得三倍場(chǎng)景的距離信息,是在計(jì)算機(jī)科學(xué)研究工作中的重點(diǎn)內(nèi)容。 與其他立體視覺測(cè)量跟蹤方法相比,雙目立體視覺技術(shù)可以對(duì)人類雙眼處理景物的方式方法進(jìn)行直接模擬及數(shù)據(jù)獲取,結(jié)果更為可靠和便捷,在很多領(lǐng)域都有著較好的應(yīng)用價(jià)值。 舉例來說,對(duì)于微操作系統(tǒng)的位置檢測(cè)與控制、機(jī)器人導(dǎo)航、宇航三維測(cè)量學(xué)和虛擬現(xiàn)實(shí)領(lǐng)域,該技術(shù)都可以發(fā)揮出有用價(jià)值。
在計(jì)算機(jī)的視覺科技范疇內(nèi),雙目立體視覺系統(tǒng)主要依賴雙攝像機(jī),從多個(gè)角度同步捕捉被觀察物體的兩幅數(shù)碼照片,或者是通過攝像機(jī)在各個(gè)時(shí)間點(diǎn)、各個(gè)角度捕捉被觀察物體的兩幅數(shù)碼照片,并運(yùn)用視覺偏差原理來修復(fù)物體的三維幾何信息,對(duì)物體的三維形狀和位置進(jìn)行重塑。 各種雙目視覺系統(tǒng)的設(shè)計(jì)各具特色,并且能夠適應(yīng)各種環(huán)境。 對(duì)于那些需要進(jìn)行廣泛、大規(guī)模的測(cè)量,并且需要較高精確度的情況,可以選擇雙攝像頭的雙目立體視覺系統(tǒng)。 針對(duì)測(cè)量范圍相對(duì)要求較小、視覺系統(tǒng)體系和質(zhì)量要求較為嚴(yán)格、需要以較快的速度實(shí)時(shí)測(cè)量的對(duì)象,可以利用光學(xué)成像的單攝像機(jī)。
視覺系統(tǒng)的安裝方法將會(huì)對(duì)測(cè)量結(jié)果的精準(zhǔn)度帶來直接影響。 利用雙攝像機(jī)的雙目立體視覺系統(tǒng),必須將其安裝在穩(wěn)定平臺(tái)中,再進(jìn)行雙目視覺系統(tǒng)標(biāo)定。 或是利用該系統(tǒng)進(jìn)行測(cè)量的過程中,需要保障攝像機(jī)內(nèi)置參數(shù)和兩臺(tái)攝像機(jī)相對(duì)位置的穩(wěn)定性,整個(gè)過程不可出現(xiàn)變化。 若是其中某一環(huán)節(jié)出現(xiàn)變化,則需要重新對(duì)雙目立體視覺系統(tǒng)進(jìn)行標(biāo)定處理。 在進(jìn)行雙目立體視覺標(biāo)定時(shí),需要利用高精度的標(biāo)定模板、更為完善且科學(xué)合理的攝像機(jī)標(biāo)定數(shù)學(xué)模型,基于復(fù)雜的環(huán)境條件下,保障系統(tǒng)現(xiàn)場(chǎng)標(biāo)定的合理性。 并利用左右圖像特征點(diǎn)的圖像坐標(biāo),以實(shí)現(xiàn)特征點(diǎn)在三維坐標(biāo)空間的有效測(cè)量[4]。
雙目立體視覺的研究一直是我國(guó)在視覺研究工作中的熱點(diǎn)內(nèi)容,更是難點(diǎn)內(nèi)容。 利用雙目立體視覺系統(tǒng)可以確定物體的三維輪廓,同時(shí)從輪廓中獲得任意點(diǎn)的三維坐標(biāo)。 為此,雙目立體視覺系統(tǒng)在整個(gè)機(jī)器視覺和測(cè)繪領(lǐng)域都有著廣泛的使用前景。 為將該技術(shù)合理運(yùn)用在不同的工程中,需要優(yōu)化算法的效率和精度,并使用圖像校正立體視覺系統(tǒng)讓立體匹配全面簡(jiǎn)化,依托于濾波、分布分類器和集合變現(xiàn)等方式方法,提高效率和質(zhì)量。
攝像機(jī)是使用計(jì)算機(jī)技術(shù)構(gòu)建出物理世界的重要測(cè)量工具。 由于在攝像機(jī)的使用過程中,其參數(shù)情況會(huì)在環(huán)境、溫度、條件變化等相關(guān)因素的影響之下出現(xiàn)不同程度的轉(zhuǎn)變,為此,為保證定位的精準(zhǔn)、有效,必須進(jìn)行攝像機(jī)標(biāo)定工作。 一般情況下,可以先使用單攝像機(jī)標(biāo)定技術(shù),隨后再通過同一世界坐標(biāo)中的某一組定標(biāo)點(diǎn),明確雙向機(jī)制之間存在的位置聯(lián)系。 目前標(biāo)定方法主要分為兩類,線性標(biāo)定法和非線性標(biāo)定法。 在進(jìn)行單攝像機(jī)標(biāo)定時(shí),常用到的方法包括透視變換矩陣、直接線性變換法。 在進(jìn)行雙目相機(jī)標(biāo)定時(shí),是否可以保障外部參數(shù)的精準(zhǔn)有效,將會(huì)對(duì)最終結(jié)果帶來直接影響。 一般情況下,需要確定8 個(gè)及以上的已知世界坐標(biāo)點(diǎn),才可以獲得科學(xué)合理的參數(shù)矩陣。
在計(jì)量檢測(cè)時(shí),測(cè)量的精度將會(huì)對(duì)二維圖像坐標(biāo)點(diǎn)提取的精準(zhǔn)性帶來直接影響。 為此,在進(jìn)行提取時(shí),特征點(diǎn)需要和傳感器類型以及技術(shù)情況適配,同時(shí)需要確保特征點(diǎn)提取的一致性和魯棒性,雙目特征點(diǎn)匹配流程如圖1 所示。 而在進(jìn)行圖像獲取時(shí),可能會(huì)存在其他的噪聲源,為進(jìn)一步優(yōu)化圖像的綜合質(zhì)量,凸顯出圖像的特征點(diǎn),在進(jìn)行特征點(diǎn)提取之前,首先要進(jìn)行圖像的預(yù)處理工作。 目前常見且有效的特征點(diǎn)提取方法主要是最小灰度差法、興趣算子法和邊緣提取法。 邊緣提取法以及興趣算子法有著較高的光照敏感度,若是物體臨近面灰度較為相似,這兩種方法可以在低精度的要求下,實(shí)現(xiàn)對(duì)特征點(diǎn)的有效概括和提取。 但是如果某一像素存在局部灰度差異區(qū)域,或是有不同的灰度值,在相鄰區(qū)域中進(jìn)行相關(guān)操作時(shí)需要對(duì)其綜合性考量,明確其是否可以精準(zhǔn)提取特征點(diǎn)[5]。
圖1 雙目特征點(diǎn)匹配流程圖
在雙目立體視覺測(cè)量技術(shù)的使用過程中,立體匹配是其中的重要環(huán)節(jié),也是技術(shù)使用過程中最復(fù)雜的環(huán)節(jié)。 在二維圖像特征點(diǎn)已經(jīng)被提取完成之后,便需要進(jìn)行立體匹配,也就是明確左右圖像中的各個(gè)特征點(diǎn)在其他圖像中的對(duì)應(yīng)點(diǎn)。 在將三維場(chǎng)景投射為二維影像時(shí),相同的景物在不同的視點(diǎn)下將會(huì)存在一定的差異,會(huì)對(duì)整個(gè)場(chǎng)景造成干擾,因此只用灰度值來定性存在較大的困難。 為有效解決錯(cuò)誤匹配問題,可以利用唯一性約束、外極限約束和一致性約束。 但是伴隨著約束條件的全面增加,匹配難度也會(huì)不斷提高。 研究人員可以使用區(qū)域匹配算法,通過對(duì)局部窗口灰度信息的關(guān)聯(lián)性進(jìn)行分析,明確特征點(diǎn)和對(duì)應(yīng)點(diǎn)之間的相互聯(lián)系。
在車道檢測(cè)環(huán)節(jié)中,視覺需對(duì)道路彎曲、陰影、路面變化、標(biāo)識(shí)線變化等路況實(shí)時(shí)反饋分析,并通過深度學(xué)習(xí)算法,自動(dòng)生成車輛最佳行駛路線。 而想要實(shí)現(xiàn)快速機(jī)動(dòng)反應(yīng),便需要高速的環(huán)境采集能力,雙目視覺慣性模組的圖像采集幀率快,在遇到車道變化時(shí)快速檢測(cè)車道變化,還可以通過連續(xù)多幀分析車道變化趨勢(shì),為自動(dòng)駕駛算法提供多方面精準(zhǔn)、快速的環(huán)境信息數(shù)據(jù),輔助算法實(shí)現(xiàn)高機(jī)動(dòng)自動(dòng)駕駛。
在檢測(cè)環(huán)節(jié)中,視覺需對(duì)物料大小、陰影、表面磨損等變化實(shí)時(shí)反饋分析,并通過深度學(xué)習(xí)算法,自動(dòng)生成檢測(cè)結(jié)果。 而想要實(shí)現(xiàn)快速機(jī)動(dòng)反應(yīng),需要高速的環(huán)境采集能力,雙目視覺模組的圖像采集幀率可達(dá)到200 幀,雙目視覺模組可以0.005 s/幀的速度快速檢測(cè)物料,并通過連續(xù)多幀分析表面缺陷,提供多方面精準(zhǔn)、快速的環(huán)境信息數(shù)據(jù),輔助算法實(shí)現(xiàn)高性能表面檢測(cè)。
隨著視覺導(dǎo)航系統(tǒng)在iRobot、戴森等掃地機(jī)器人頭部陣營(yíng)不斷發(fā)酵,關(guān)于視覺導(dǎo)航單目、雙目的技術(shù)問題,也得到了掃地機(jī)器人廠商的廣泛關(guān)注。 雙目視覺導(dǎo)航是定位精度更高、系統(tǒng)性更強(qiáng),更加智能的掃地機(jī)器人導(dǎo)航方案,能夠更好地引領(lǐng)掃地機(jī)器人向家庭清潔智能助手轉(zhuǎn)變。隨著技術(shù)的不斷進(jìn)步,可以預(yù)見雙目視覺導(dǎo)航系統(tǒng)將會(huì)逐漸成為掃地機(jī)器人主流導(dǎo)航定位方案。
視覺技術(shù)目前已經(jīng)在全球的計(jì)量檢測(cè)工作中獲得了廣泛運(yùn)用。 舉例來說,日本大阪大學(xué)機(jī)械系統(tǒng)研究院研制出了一種自適應(yīng)雙目視覺伺服系統(tǒng);華盛頓大學(xué)與微軟公司合作之后,研制出了寬基線立體視覺系統(tǒng),該系統(tǒng)可以在火星中進(jìn)行千米范圍之內(nèi)的精確定位及導(dǎo)航。 但是總體來看,想要真正地創(chuàng)造出和人眼無異的通用雙目視覺系統(tǒng),未來還有很長(zhǎng)的路要走,其整體的發(fā)展趨勢(shì)可以從以下幾點(diǎn)概括:一是受益于5G 配套基礎(chǔ)設(shè)施的日益完善,制造行業(yè)發(fā)展規(guī)模的全面擴(kuò)大,智能化水平不斷提升,再加上政策利好,我國(guó)的雙目立體視覺市場(chǎng)需求也會(huì)全面增長(zhǎng)。 因此,在行業(yè)技術(shù)水平提升、產(chǎn)品應(yīng)用領(lǐng)域愈發(fā)廣泛的時(shí)代背景之下,未來的機(jī)器視覺市場(chǎng)將會(huì)得到全方位的擴(kuò)大。 二是市場(chǎng)空間巨大。 據(jù)預(yù)測(cè),2025 年,全球機(jī)器視覺市場(chǎng)規(guī)模將會(huì)超過150 億美元。 應(yīng)用市場(chǎng)的全面擴(kuò)大,市場(chǎng)需求將會(huì)得到全方位放量。 面對(duì)日益擴(kuò)大的市場(chǎng),大多數(shù)公司都會(huì)選擇運(yùn)用雙目視覺測(cè)量技術(shù),在圖像算法上獲得更為成熟的發(fā)展經(jīng)驗(yàn)。 三是雙目視覺芯片為未來發(fā)展趨勢(shì)。 圖像處理算法最開始是采用服務(wù)器的軟件算法來完成,但是伴隨著5G 技術(shù)、智能化技術(shù)的全面成熟,將會(huì)逐步拓展到云端計(jì)算來完成。 由此也會(huì)對(duì)云服務(wù)器的計(jì)算量提出更高的標(biāo)準(zhǔn)及要求,需要更大的網(wǎng)絡(luò)帶寬。 因此,雙目視覺芯片具有的技術(shù)優(yōu)勢(shì)更為明顯,可以進(jìn)一步降低成本投入,改善運(yùn)算能力。 四是機(jī)器視覺是強(qiáng)需求。在當(dāng)今時(shí)代,計(jì)算機(jī)視覺領(lǐng)域展現(xiàn)出了全新的發(fā)展趨勢(shì),除了可運(yùn)用在手機(jī)、個(gè)人電腦和工藝檢測(cè)之外,計(jì)算機(jī)視覺技術(shù)在機(jī)器人、智能駕駛、增強(qiáng)現(xiàn)實(shí)等眾多領(lǐng)域都出現(xiàn)了不同形態(tài)的應(yīng)用方式,為此,計(jì)算機(jī)視覺將迎來應(yīng)用爆炸式增長(zhǎng)的時(shí)代。 五是探索全新的、適用范圍更為廣泛的立體視覺計(jì)算理論以及匹配的方式方法,選擇科學(xué)合理的匹配原則,明確算法結(jié)構(gòu),從根本上解決灰度失真、幾何畸變、噪聲干擾、特殊結(jié)構(gòu)等重點(diǎn)問題。 六是算法走向并行化的發(fā)展之路,進(jìn)一步提高速度,降低有關(guān)工作人員的運(yùn)算總量,使得系統(tǒng)的實(shí)用性得到增強(qiáng),強(qiáng)化場(chǎng)景和任務(wù)的約束,面對(duì)不同的應(yīng)用目的,構(gòu)建出具有一定目標(biāo)性的體視系統(tǒng)。
綜上所述,在生產(chǎn)過程中檢測(cè)是一項(xiàng)重要的工作,對(duì)產(chǎn)品質(zhì)量的提升有著至關(guān)重要的作用。 因此,為了提高產(chǎn)品質(zhì)量檢測(cè)工作的效率和準(zhǔn)確度,很多企業(yè)開始采用機(jī)器視覺技術(shù)。 本文主要介紹了雙目立體視覺幾何量的高精度測(cè)量技術(shù)在計(jì)量檢測(cè)中的應(yīng)用和發(fā)展前景,并對(duì)其進(jìn)行了簡(jiǎn)要分析,希望能給相關(guān)工作人員提供一些參考。