翟紫伶
摘要:基于圖像的三維建模占建模領(lǐng)域很大的比重,如果可以全面地掌握基于圖像建模的特點及其關(guān)鍵技術(shù),則可幫助該領(lǐng)域的技術(shù)人員更高效準(zhǔn)確地尋找到技術(shù)改進點。對該領(lǐng)域?qū)@治稣n題的研究,可為基于圖像的三維建模提供關(guān)鍵技術(shù)和理論支撐,推動基于圖像建模相關(guān)技術(shù)的商業(yè)應(yīng)用和推廣,具有重要的學(xué)術(shù)意義和應(yīng)用價值。
關(guān)鍵詞:圖像;三維建模;特征點;標(biāo)定;專利申請
1.引言
對于計算機而言,其所能夠直接獲取到的數(shù)據(jù)源僅為二維平面圖像,相對于真實的三維景物無疑會存在著一定程度的信息丟失,因此利用二維圖像來重建三維物體便不可避免的成為一個重點問題。在實際工作中采用對同一物體從不同的角度分別成像,進而對這些數(shù)據(jù)進行分析、綜合來恢復(fù)出被攝物體的三維信息。
基于圖像的建模分為主動法和被動法兩種。其中,利用主動式重建算法中可以通過硬件實時獲取場景深度的優(yōu)勢。被動式單目重建算法雖然流程復(fù)雜、運行時間長,但其擴展性高、成本低、不易受環(huán)境光的干擾、應(yīng)用場景多,因此深受研究人員的青睞。
2.圖像三維建模技術(shù)
2.1 基于輪廓法的三維建模技術(shù)
基于輪廓的三維建模主要是通過分析物體多視角下的輪廓圖像或者物體的側(cè)影輪廓線,從而得到物體的三維模型。輪廓線法是Keppel提出的采用三角面片覆蓋物體表面,且這些三角面片所圍成的體積為最大的方法。之后又出現(xiàn)了諸如基于最小周長、最小對角線等各種改進的輪廓線法??傮w的思路就是將每層圖像的輪廓提取出來,然后采用以輪廓線點為頂點的三角面片進行連接。
通過檢索現(xiàn)有專利分析可知,基于輪廓的三維建模技術(shù)主要發(fā)展在于輪廓的獲取。輪廓作為三維模型的一個重要特征,一直是公司、學(xué)校等相關(guān)人員的研究重點,其主要發(fā)展方向為:直接基于點云數(shù)據(jù)進行輪廓提取、基于圖像的特征點進行輪廓提取以及手動輸入輪廓信息。
由于輪廓信息相對圖像中其他線索信息而言,是一種明確、不含二義性的信息形式,這使得輪廓法具有建模速度快、魯棒性高的優(yōu)勢。并且,由于其數(shù)據(jù)的取值范圍只有2種(屬于前景區(qū)域或背景區(qū)域),因此,計算復(fù)雜性較低。輪廓法是所有建模方法中效率最高的,也是唯一能夠滿足實時需求的建模方法。由于幾乎所有物體在圖像中都包含明確、清楚的輪廓信息,使得輪廓法可以應(yīng)用于透明、特征點較少、紋理欠缺等其他方法難以處理的物體的建模,具有較高的通用性。輪廓法的缺點是其需要的輸入數(shù)據(jù)源較苛刻、建模精度較低。
2.2 基于亮度法的三維建模技術(shù)
基于亮度的建模是通過分析物體多個視角下圖像中亮度特征的一致性關(guān)系,恢復(fù)出其表面的深度信息,并得到其三維幾何模型?;诹炼鹊娜S建模可分為正向法和逆向法,正向法對物體所在的三維空間進行均勻采樣,將各采樣點投影到所有二維圖像中,如果其滿足亮度一致性,則說明該三維點屬于物體表面,將其保留,否則,將其剔除,而逆向法則是搜索滿足亮度一致性的匹配點,使用立體視覺的三角測量原理,由這些特征點反算其對應(yīng)的三維點位置。
亮度法的優(yōu)勢是可以幾乎全自動地得到較高的建模精度。由于亮度信息是圖像中最豐富、包含數(shù)據(jù)量最大的信息形式,這使得可以通過計算亮度在不同圖像之間的匹配性,精確地計算物體表面每個點的深度值,這使得其可以更好地表現(xiàn)出物體表面的幾何細節(jié)。對于一些滿足亮度法假設(shè)的物體,現(xiàn)有的方法已可達到與三維掃描儀相近的建模精度。并且,亮度法沒有嚴格的光照條件要求,也沒有圖像分割、改變焦距等手工交互,這使得該方法能滿足全自動的要求。
亮度法要求物體基本滿足朗伯表面的假設(shè),這使得其無法應(yīng)用于重建透明、金屬、瓷器等包含大量高光、反射信息的物體。缺少表面紋理變化、重復(fù)的表面紋理會增加亮度匹配的誤匹配率,使得該方法的魯棒性與靈活性較低。由于在亮度匹配的計算過程中,需要使用數(shù)值優(yōu)化算法,使得該方法計算復(fù)雜性較高,無法滿足實時需求.而且精確的相機定標(biāo)要求使其應(yīng)用受限。但由于亮度法能夠得到很高的建模精度,使得這種方法廣泛應(yīng)用于文物數(shù)字化、人臉自動建模等對精度要求較高的場合。
2.3 基于運動法的三維建模技術(shù)
基于運動的建模通過在2幅或多幅未定標(biāo)圖像中檢測匹配的特征點集,使用數(shù)值方法,同時恢復(fù)出相機運動參數(shù)與場景幾何,并得到物體三維模型。運動法首先在圖像中尋找匹配特征點,以恢復(fù)出相鄰圖像間相機的位姿關(guān)系。首先獲取匹配特征點檢測算子,這些算子能從圖像中得到大量的候選匹配點,由于其中存在大量的誤匹配,可以對這些匹配點進行精化,得到少量精確的匹配點,并從中恢復(fù)出相機的運動參數(shù)與特征點的三維坐標(biāo)。
運動法的優(yōu)勢是不需預(yù)先標(biāo)定相機的參數(shù),從而降低了對圖像采集過程的限制,這使得該方法的輸入源并不局限在為建模而專門采集的圖像序列,還可使用已有的隨意拍攝的圖像序列,甚至視頻序列進行三維建模。同時,由于運動法的基礎(chǔ)是特征點匹配技術(shù),而該技術(shù)是計算機視覺領(lǐng)域的重要熱點技術(shù),隨著魯棒的特征點匹配算子的出現(xiàn)。使得運動法對于光照條件、圖像噪聲等也具有了極強的魯棒性。并且,運動法獨有的分層次重建特性可以分開獨立進行,可控性較高。
然而,由于運動法計算的僅是所有匹配特征點的三維坐標(biāo),而特征點信息在圖像中含量通常較少,只是對物體表面三維幾何的稀疏逼近,因此運動法的建模精度較低,通常應(yīng)用于對物體結(jié)構(gòu)的感知,因此被較多應(yīng)用于室外場景、自然景觀、建筑物等的三維建模。
通過上述專利分析可知,基于運動的三維建模技術(shù)主要發(fā)展在于輪廓的特征點的匹配。特征點的匹配三維建模的一個重要過程,一直是學(xué)校等相關(guān)人員的研究重點。
3. 小結(jié)
基于如上的分析過程可以看出,無論從圖像三維建模的任一技術(shù)分支來看,在經(jīng)歷了從20世紀(jì)90年代末到21世紀(jì)初之間的從無到有、從萌芽到飛速發(fā)展的階段之后,這些技術(shù)都逐漸走向成熟,而協(xié)同機器學(xué)習(xí)技術(shù)將是未來圖像三維建模的重點發(fā)展方向。與此對應(yīng),國內(nèi)的相關(guān)專利申請隨著近幾年相關(guān)技術(shù)的快速發(fā)展而呈現(xiàn)勢頭較猛的追趕趨勢,越來越多的企業(yè)及高校和研究所在基于圖像的三維建模的研究上投入了大量的精力,也獲得了豐碩的研究成果,國內(nèi)的專利申請數(shù)量有了較大幅度的提升,但是國內(nèi)專利申請的質(zhì)量方面仍有很大提升空間。
參考文獻
[1]鄧春新,基于圖形圖像的三維建模技術(shù)研究,工業(yè)設(shè)計[J],2017.11.20
[2]董鵬輝 等,基于圖像的三維重建技術(shù)綜述,無線電通信技術(shù)[J],2019.02.28