◆張卓群 曹鐘淼 王 慧
(1.河北工業(yè)大學國際教育學院 天津 300000;2.華北理工大學電氣工程學院 河北 063000;3.河北師范大學資源與環(huán)境科學學院 河北 050000)
近來,由于數(shù)字媒體處理科技的飛速發(fā)展,再加上計算機硬件成本的大大降低,使得計算機視覺與機器學習技術獲得了更加廣泛的普及和應用,尤其是在三維人體動畫方面,運動獲取裝置的普遍應用令更多更具真實感的三維人體運動數(shù)據(jù)得以出現(xiàn),并且可以被應用到虛擬現(xiàn)實、動畫生成、運動模擬等一系列領域中。現(xiàn)如今,計算機視覺和機器學習技術中的數(shù)字角色、場景建模、交互式角色動畫管理等內(nèi)容均在智能三維人體動畫研究當中獲得了廣泛運用。下面我們對計算機視覺與機器學習技術在三維人體動畫中的具體應用進行研究。
借助運動捕獲科技創(chuàng)作三維人體動畫的實質(zhì)為數(shù)據(jù)驅(qū)動的動畫制作方法之一,其具備數(shù)據(jù)獲取更便捷、更具真實性、精度更高、效率更高等諸多優(yōu)點,國外學者曾說過:選取特殊硬件設施實時獲取真實運動物體(譬如人類和動物等)的三維運動數(shù)據(jù),同時把它映射到提前構建的三維模型之上,并最終生成動畫序列,這就是運動捕獲這項技術的中心思想。
(1)基于統(tǒng)計學習的三維人體運動捕獲技術
由缺乏顯著特點或者標志的視頻中恢復三維人體姿態(tài)是一個約束條件極為不足的優(yōu)化求解過程,解決此問題的可行性做法之一即為基于理論學習來取得并約束先驗模型。眾所周知,統(tǒng)計理論在計算機視覺領域當中的運用非常普遍,最近幾年也有不少專家把它引入到基于視頻的人體運動捕獲技術中進行使用。此模式的基本思想為基于預先學習的先驗理論對圖像或者視頻里的人體運動參數(shù)做出判斷,然而這和機器學習理論擁有同樣的問題,借助這一手段僅僅可以對事先學習過的特有姿態(tài)及運動類型獲取良好的恢復效果。國外學家Agarwal等人基于一組先前的人體側影圖像計算它局部形狀上下文的分布狀況,緊接著借助有關向量機構構建一個部分形狀上下文回歸函數(shù)用到三維人體姿態(tài)的判斷中。然而,此方法僅僅在簡單的走路運動中被應用,在擴展到另外一些運動類型時回歸函數(shù)的構建便十分煩瑣、不容易控制。
(2)基于視覺方法的三維人體運動捕獲技術
在20世紀末期,人類便提出了借助視覺方法由包括人體運動的圖像或視頻序列當中提取所需的運動參數(shù),目的是便于更深入、更全面地剖析人體運動。這一方法的主要優(yōu)點在于:成本較低、操作性較強、應用范圍大等,其自始至終都是學術界的研究焦點。然而,由二維視頻中精確地恢復三維人體運動數(shù)據(jù)是一個挑戰(zhàn)性極強的課題。基于視覺方法,三維人體運動捕獲技術主要可分成基于特征跟蹤、基于模型匹配以及基于側影剖析這三大類人體運動捕獲技術?;谀P推ヅ湟约皞扔捌饰龅娜梭w運動捕獲技術,其根本理念為給定一個人體姿態(tài)的搜尋空間,在提取出的圖像特征和所構建的模型二者間找出科學的匹配形式,從而實現(xiàn)三維人體運動姿態(tài)恢復的根本目的。其次,基于特征跟蹤的人體運動捕獲技術,它的根本理念為選取光流場跟蹤、點特征跟蹤等特征跟蹤方法由圖形或視頻序列中提取出二維人體運動參數(shù),進一步借助視覺原理來恢復三維人體運動參數(shù)序列。
因為捕獲環(huán)境、誤差或為達到特定使用需求而捕獲的三維人體運動數(shù)據(jù)必須進行一定的預處理之后才可以被運用到三維人體動畫的制作當中,運動數(shù)據(jù)的預處理主要涵蓋了運動數(shù)據(jù)壓縮、關鍵幀的提取、運動序列分割及識別等一系列內(nèi)容。換言之,三維人體運動數(shù)據(jù)其實也是一類多媒體數(shù)據(jù),所以在多媒體內(nèi)容研究工作中科學地借助機器學習技術是十分有必要的。舉例說明,如Ren等人借助PCA方法集中構建了一組層次鮮明的低維局部線性模型,在處理丟失標記點的運動數(shù)據(jù)時,預先構建的分類器會篩選適宜的局部線性模型對其進行重建。另外,他們還提出了約減運動數(shù)據(jù)標記法。再比如,在三維人體運動數(shù)據(jù)的分割、識別方面,Arikan等人基于一組手工標注的訓練樣本建立起支持向量機分類器用于人體運動序列的自動標注,這一方法同樣適用于人體運動序列的分割及識別。
提高已有運動數(shù)據(jù)的重用性即為三維人體動畫創(chuàng)作最關鍵的問題之一,尤其是運動捕獲裝置和人體運動數(shù)據(jù)庫的存在,給運動數(shù)據(jù)重用技術提供了充足的數(shù)據(jù)支持,從根本上講,此項技術不妨看作一類數(shù)據(jù)驅(qū)動的運動生成技術,也恰恰是因為此特點,各類子空間研究、統(tǒng)計學習、流形學習等機器學習技術被廣泛地運用其中,作用是對已有的三維人體運動數(shù)據(jù)做出全面科學的剖析,學習及指導新運動數(shù)據(jù)的生成。
當中運用最為普遍的即為PCA技術,比如說之前Alexa等人提出的借助主成分來表示動畫序列。另外,也有一些專家提出了基于 PCA把原始運動數(shù)據(jù)投射至低維子空間,然后提取可量化高層運動參數(shù),像運動速度等等。除此之外,借助內(nèi)外插值及時生成最新的走路運動數(shù)據(jù),并可以擴展到擁有各種各樣尺寸的角色模型上,最終生成動畫序列。為了令運動數(shù)據(jù)的研究和生成環(huán)節(jié)更容易被控制和可視化,Shin等人把原始運動數(shù)據(jù)借助多尺度縮放技術投射至低維空間,同時對其進行了參數(shù)化及可視化操作,如此一來,用戶便能夠在低維空間里面借助草圖的勾畫、對三維人體姿態(tài)的直接操作和關鍵幀的指定等手段對原始運動數(shù)據(jù)在空間、時間上做出編輯、合成等一系列操作。Mukai等人把運動插值作為預定義參數(shù)空間里的統(tǒng)計預測問題,同時基于泛克里格方法對應參數(shù)空間里采樣點距離間的關聯(lián),對特定參數(shù)值的插值做出了優(yōu)化,并且把參數(shù)空間內(nèi)特定的空間約束做出了更精確的估計和生成。
計算機動畫,尤其是三維人體動畫研究工作中的一個關鍵即為實現(xiàn)智能化、自動化的人體行為動畫生成。部分專家人士借助對擁有自主決策能力的自治體的創(chuàng)建完成了這一目標。也有一些專家通過行為模型的建立來指導虛擬角色行為動畫的生成。像Conde等人借助增強學習理論對虛擬角色所處的虛擬環(huán)境作出了深入研究,并且對虛擬場景的層次架構等進行了剖析,在這一前提下,進一步對虛擬角色在特定場景下漫游的真實感行為驅(qū)動引擎進行了構建。再比如,在仿真訓練當中,F(xiàn)ernlund等人借助基于上下文推理及遺傳規(guī)劃算法對士兵在格斗中的技戰(zhàn)術行為規(guī)劃和生成模型進行了深入研究,以此在戰(zhàn)斗仿真訓練中自動生成規(guī)范、合理的各類技戰(zhàn)術動作。除了借助機器學習方法來生成自動行為動畫之外,還有部分專家借助視覺交互的手段來實時合成行為動畫序列。比方說,Lee等提出的基于視覺交互運動序列的生成技術,由身穿緊身衣的人員做出表演,同時把跟蹤獲取到的側影圖像傳輸至系統(tǒng)當作控制信號,進一步從已有的三維人體運動數(shù)據(jù)庫里面搜索類似的運動數(shù)據(jù)進行合成。
綜上所述,盡管計算機動畫隸屬于計算機圖形學的研究范疇,然而從技術手段而言,三維人體動畫囊括了人工智能、機器學習、計算機視覺、認知科學等諸多領域。目前,計算機視覺及機器學習理論正以一個迅猛的速度融入人體動畫研究領域,而這也是未來三維人體動畫研究領域的重要趨勢之一。計算機視覺與機器學習理論在三維人體動畫中的廣泛運用必然會在很大程度上推動人體動畫創(chuàng)作技術的進步。