喬秀全 任沛 商彥磊
隨著近兩年支付寶“掃福集??ā?、基于位置的增強(qiáng)現(xiàn)實(AR)紅包、QQ AR傳遞奧運(yùn)火炬等活動的開展,AR與虛擬現(xiàn)實(VR)作為一種新型計算機(jī)視覺技術(shù)逐漸進(jìn)入人們的視線,從學(xué)術(shù)界到產(chǎn)業(yè)界,AR/VR都成為了非常值得關(guān)注的熱點(diǎn)。人們的生活由于AR/VR的出現(xiàn)而在慢慢發(fā)生著改變,并且這種改變還在不斷地深入與擴(kuò)大。我們可以預(yù)見的是,在未來的生活中,AR/VR將具有極其廣闊的發(fā)展空間與應(yīng)用前景,并且將會成為5G的一種殺手級應(yīng)用。
1 對AR/VR技術(shù)發(fā)展的
思考
AR[1]是一種將真實世界信息和虛擬世界信息無縫集成的新技術(shù),是把原本在現(xiàn)實世界的一定時間空間范圍內(nèi)很難體驗到的實體信息,通過計算機(jī)視覺等科學(xué)技術(shù),應(yīng)用到真實世界,被人類感官所感知,從而達(dá)到超越現(xiàn)實的感官體驗。通過AR技術(shù),真實的環(huán)境和虛擬的物體實時疊加到了同一個畫面或空間。
VR[2]則是綜合利用計算機(jī)圖形系統(tǒng)和各種現(xiàn)實及控制等接口設(shè)備,在計算機(jī)上生成的、可交互的三維環(huán)境中提供沉浸感覺的技術(shù),通過提供使用者關(guān)于視覺、聽覺、觸覺等感官的模擬,讓使用者如同身臨其境一般,可以及時、沒有限制地觀察三維空間內(nèi)的事物。
1.1 AR/VR具有廣泛的應(yīng)用場景
AR/VR作為一種新的視覺交互技術(shù),將帶動一大批新的產(chǎn)業(yè)發(fā)展模式。在教育領(lǐng)域,通過VR技術(shù),可以實現(xiàn)沉浸式的教學(xué)方式,寓教于樂;通過AR技術(shù),可以更加形象生動地展現(xiàn)書本中的內(nèi)容,從而大大增加閱讀的互動性與趣味性。在文化旅游及展覽領(lǐng)域,通過VR技術(shù)可以打造數(shù)字化旅游景點(diǎn),使用戶足不出戶就可以遍覽天下美景;而AR技術(shù)在展覽領(lǐng)域可以實現(xiàn)規(guī)劃效果與真實場景的疊加,大大便利了市政建設(shè)規(guī)劃任務(wù)。在娛樂領(lǐng)域,VR游戲、VR視頻、AR游戲等也為人們提供了一種全新的娛樂休閑的方式。在工業(yè)制造領(lǐng)域,通過AR可以將多種輔助信息顯示給用戶;而VR則可以幫助企業(yè)更好地訓(xùn)練工人。
1.2 AR/VR的歷史嘗試與發(fā)展
雖然AR/VR是在近兩年內(nèi)才得以井噴式的發(fā)展,但其起源甚至可以追溯到現(xiàn)代計算機(jī)技術(shù)的誕生之際。著名計算機(jī)科學(xué)家、圖靈獎獲得者伊萬·薩瑟蘭(Ivan Sutherland)在1968年發(fā)明的頭戴式顯示器能夠?qū)⒑唵尉€框圖轉(zhuǎn)換為3D效果的圖像,這種頭戴式顯示器(HMD)在結(jié)構(gòu)上與現(xiàn)在的各種AR/VR產(chǎn)品也驚人的相似。1998年,AR技術(shù)第1次被成功應(yīng)用于實時直播,Sportvision作為當(dāng)時體育轉(zhuǎn)播圖文包裝和運(yùn)動數(shù)據(jù)追蹤領(lǐng)域的領(lǐng)先公司,開發(fā)了1st & Ten系統(tǒng),從此開啟了AR的應(yīng)用與探索之路。
1.3 AR/VR具有極強(qiáng)的發(fā)展?jié)摿?/p>
AR/VR技術(shù)離不開硬件設(shè)備的發(fā)展。VR 講究的是沉浸感、交互性和構(gòu)想性,構(gòu)想性的關(guān)鍵在內(nèi)容設(shè)計,而沉浸感和交互性的關(guān)鍵則在于硬件實現(xiàn)。AR講究的是現(xiàn)實世界疊加虛擬世界,從而實現(xiàn)“虛實結(jié)合”,顯示技術(shù)與感知技術(shù)都是有待解決的重要問題。包括Oculus、Google、SONY、HTC、Samsung、Microsoft、百度、阿里巴巴、騰訊、樂視、愛奇藝、優(yōu)酷等在內(nèi)的多家公司已經(jīng)開始參與從事VR/AR的相關(guān)研發(fā),僅在2015年內(nèi)就涌現(xiàn)出了100多家VR/AR的硬件廠商,其中不乏各大手機(jī)終端廠商。盡管目前的AR/VR行業(yè)仍然處于起步階段,但依據(jù)Digi Capital預(yù)測,至2020年,全球AR與AR市場規(guī)模將達(dá)到1 500億美元;BI Intelligence則統(tǒng)計,2020年僅頭戴式VR硬件設(shè)備市場規(guī)模將達(dá)到28億美元。AR/VR市場巨大的潛力吸引了越來越多的廠商、研究機(jī)構(gòu)參與到了AR/VR軟件、硬件的研發(fā)浪潮之中。
1.4 目前提供AR的兩種主要形式
(1)配備專門的AR/VR設(shè)備(比如AR/VR頭盔或者AR/VR眼鏡):這是一種極其重量級的解決方案:一方面因為設(shè)備的費(fèi)用相對較貴,如Oculus Rift(VR設(shè)備)的消費(fèi)成本約為1 500美元,微軟推出的全息眼鏡HoloLens、SONY推出的Morpheus頭盔、Samsung推出的Gear VR頭戴設(shè)備都由于其高額的成本,其推廣范圍大大受到了限制;而專用的AR/VR設(shè)備的另外一個缺陷在于其較差的便攜性,用戶對于AR/VR的使用范圍受限,大大局限了AR/VR的應(yīng)用范圍與場景;因此,通過AR/VR近幾年的發(fā)展歷程,可以看出,基于專用設(shè)備的AR/VR應(yīng)用推廣遇到了很大的障礙,還無法大規(guī)模、普適化地應(yīng)用起來,目前更多的是在非常垂直的領(lǐng)域和特定的場合提供此類AR/VR體驗。事實上,給用戶增添個額外的設(shè)備,是很有挑戰(zhàn)性的事情,3D電視的市場經(jīng)驗證明:哪怕只是多增加一副3D眼鏡,對于內(nèi)容消費(fèi)來說都是巨大的障礙。因此,AR設(shè)備的便捷化、輕量化,嵌入用戶的日常生活用品是一個必然的趨勢。
(2)基于智能手機(jī)終端的AR APP應(yīng)用:隨著智能手機(jī)終端計算、存儲等能力的不斷提升,使得基于智能手機(jī)終端的AR應(yīng)用成為可能。利用APP調(diào)用智能手機(jī)攝像頭,從而對物理世界進(jìn)行識別,并疊加虛擬信息,從而達(dá)到增強(qiáng)現(xiàn)實的目的。目前,基于APP的AR服務(wù)提供目前也有兩種形式:
·一種是專門的、獨(dú)立的、離線的APP形式。所有AR的功能(包括開啟攝像頭、圖像識別、目標(biāo)跟蹤和動畫渲染等)都在手機(jī)終端來完成;在這種模式下,AR服務(wù)中所涉及到的計算需求都要在本地進(jìn)行,其特點(diǎn)在于實時跟蹤快,用戶體驗好;但這種模式下,用戶需要下載專門的APP,應(yīng)用推廣的成本比較高;另外,單純依靠智能終端進(jìn)行計算,AR服務(wù)的功能將大大受到受限(如識別圖片數(shù)量、種類、精確度等能力)。
·另一種則是采用“云+端”的模式,如支付寶、聚劃算、QQ AR等服務(wù),借助云端強(qiáng)大的計算能力,可以精確識別更多的圖片,但與此同時,由于網(wǎng)絡(luò)傳輸時延的增大,要做到實時的識別與跟蹤難度很大,因而無法為用戶提供優(yōu)良的AR體驗。endprint
目前看來,基于專用AR設(shè)備的應(yīng)用提供模式太過重量級,無法大規(guī)模、普適化推廣與應(yīng)用;而基于智能手機(jī)終端APP形式的AR應(yīng)用,對于每個APP而言,又都是一個個獨(dú)立封閉的孤島,信息只局限于該APP的用戶,難以跨平臺提供普適化的AR服務(wù),無法觸及更多受眾群體。另外一個致命問題在于AR應(yīng)用的下載與安裝。AR服務(wù)的體驗必須依托于特定的應(yīng)用軟件,從而導(dǎo)致了服務(wù)體驗的門檻過高,并不方便用戶的使用??傮w來說,跨平臺地提供普適化的AR應(yīng)用是目前AR提供技術(shù)存在的最大的一個問題。因此,需要提供一種輕量級、跨平臺的AR應(yīng)用解決方案,使用戶不需要下載專門的APP或者不局限于某個具體的APP,就可獲得AR體驗,從而推動基于移動智能終端的AR大規(guī)模移動化、普適化應(yīng)用。
2 Web AR是普適化AR
發(fā)展的轉(zhuǎn)折點(diǎn)
目前,AR技術(shù)出現(xiàn)了一種新的動向。這主要?dú)w功于偉大的WWW之父——蒂姆伯納斯.李(2016年圖靈獎得主),他在20世紀(jì)90年代所發(fā)明的Web天然地具備了跨平臺的特性。現(xiàn)有的很多APP是支持移動智能終端瀏覽器(HTML5)網(wǎng)頁的,比如微信、QQ、微博、今日頭條等,因此如果提供基于Web的AR應(yīng)用,那么用戶不用下載專門的APP,只需要利用通用的Web瀏覽器或者這些內(nèi)在支持HTML5網(wǎng)頁的APP就可以體驗AR服務(wù)。Web天然的普適特性將為AR/VR的應(yīng)用提供一條更加便捷的傳播方式。目前,越來越多的廠商開始關(guān)注原生支持AR/VR服務(wù)的智能終端硬件設(shè)備組件,這也給基于普適化的Mobile Web AR應(yīng)用帶來了很大的機(jī)遇。因此,基于Web的AR技術(shù),特別是基于移動智能終端的Mobile Web AR技術(shù),開始逐漸萌芽,為實現(xiàn)AR應(yīng)用的大規(guī)模、跨平臺的傳播和分享奠定了基礎(chǔ),為解決AR的普適化應(yīng)用難題提供了一種新的研究方向和技術(shù)可能。
然而,Mobile Web AR目前所面臨的技術(shù)難題主要有以下3點(diǎn)。
(1)目前Mobile Web AR還處于技術(shù)的萌芽狀態(tài),現(xiàn)有的生態(tài)環(huán)境和技術(shù)條件、網(wǎng)絡(luò)支撐等都還不是很成熟,無法完全發(fā)揮出它的全部潛力。比如:Web瀏覽器計算能力很弱,無法像現(xiàn)有的APP一樣,在移動終端就完成全部AR的功能;參考現(xiàn)在基于獨(dú)立APP的AR的實現(xiàn)方式,想要完全利用前端JavaScript技術(shù)來完成全部AR的工作,包括圖像采集、特征點(diǎn)提取、圖像匹配、動畫渲染等,功能非常受限,目前只能識別簡單的基于標(biāo)識的圖片(即基于Marker的AR技術(shù)),不足以支持自然圖片和實物(即Markerless圖像/實物)在前端的實時計算和識別;另外,由于JavaScript的弱計算能力,造成AR服務(wù)非常嚴(yán)重的卡頓現(xiàn)象,嚴(yán)重影響AR服務(wù)的用戶體驗。因此,只靠純前端的方式,目前看來基本上還行不通,無法大規(guī)模商用。這也就意味著更多的計算功能需要放到云端服務(wù)器來完成,也就是所謂的“云+端”的實現(xiàn)模式。但這時候,網(wǎng)絡(luò)的通信時延就成了很大的一個問題,現(xiàn)有的網(wǎng)絡(luò)環(huán)境又很難滿足AR技術(shù)在自動跟蹤和識別方面的實時性和低延時的苛刻要求。
(2)瀏覽器的功能和性能差異比較大?,F(xiàn)在手機(jī)終端上有多種不同的瀏覽器,如百度瀏覽器、360瀏覽器、QQ瀏覽器、Chrome瀏覽器、Safari瀏覽器、火狐瀏覽器、UC瀏覽器等,除此之外,還有一些APP應(yīng)用內(nèi)嵌了簡化版的瀏覽器功能模塊(如微信、微博、QQ等),因此對于眾多瀏覽器的適配工作也比較復(fù)雜。然而,與原生提供AR服務(wù)的APP相比,手機(jī)瀏覽器的功能要弱化很多,較大的3D動畫模型和VR場景的加載和運(yùn)行都會比較慢,直接影響了用戶的業(yè)務(wù)體驗;另外,Web網(wǎng)頁不具備直接調(diào)用很多手機(jī)底層資源的權(quán)限,這也就給AR服務(wù)的提供帶來了很大程度上的不便。
(3)內(nèi)容制作和適配的問題也是Web AR普及所面臨的一大難題?,F(xiàn)有的大部分3D建模工具對基于Web的3D呈現(xiàn)兼容性較差,很多工具導(dǎo)出的模型無法直接加載使用。另外一個關(guān)鍵的問題就是用戶與動畫模型的交互技術(shù)現(xiàn)在也不成熟,使得用戶在Web AR應(yīng)用體驗的過程中娛樂性和趣味性無法很好地得到體現(xiàn)。
3 Mobile Web AR:一種輕
量級、普適化的AR技術(shù)
面對Web AR應(yīng)用輕量化和普適化的攔路虎,我們團(tuán)隊經(jīng)過無數(shù)次的技術(shù)攻關(guān),在Mobile Web AR方面取得了技術(shù)性突破。首次成功研制了一套完整的、具有自主知識產(chǎn)權(quán)的、基于HTML5的、能夠支持自然圖片和實物識別功能的Web增強(qiáng)現(xiàn)實技術(shù),超前性地采用了面向Web的“端計算+邊緣計算+云計算”無縫協(xié)同的分布式AR實現(xiàn)方案,利用邊緣服務(wù)器來提供即時的復(fù)雜計算能力,利用云服務(wù)器來保存實時性要求比較低的、與大量業(yè)務(wù)運(yùn)營相關(guān)的數(shù)據(jù)和邏輯,解決當(dāng)前Web增強(qiáng)現(xiàn)實面臨的瀏覽器能力弱、圖像計算量大、擴(kuò)展性不好、實時性低的技術(shù)難題?;赪eb AR技術(shù),用戶可以利用網(wǎng)頁超鏈接機(jī)制將AR的功能嵌入到各種Web網(wǎng)頁中,并且能夠方便地進(jìn)行轉(zhuǎn)發(fā)、分享和傳播,讓用戶不再受限于專門的APP 就能獲得AR體驗,開啟了一個全新的、基于Web的AR應(yīng)用新時代。
如圖1所示,Mobile Web AR技術(shù)可以靈活地嵌入到微信公眾號中,用戶只需要關(guān)注特定的公眾號,通過點(diǎn)選公眾號中的菜單欄選項即可體驗AR技術(shù),程序?qū)⑼ㄟ^調(diào)取手機(jī)攝像頭進(jìn)行圖像的采集、云端圖像識別,以及在微信瀏覽器下進(jìn)行3D模型的加載與渲染等一系列操作,方便快捷地為互聯(lián)網(wǎng)用戶帶來輕量級、普適化的AR體驗。
4 5G網(wǎng)絡(luò)為AR/VR的
大規(guī)模商用提供了機(jī)會
4G改變生活,5G[3-4]改變社會。5G網(wǎng)絡(luò)將會帶來更高的速率、更寬的帶寬,能夠充分滿足消費(fèi)者高帶寬、低延時等更高的業(yè)務(wù)體驗需求。同時,5G在網(wǎng)絡(luò)的整體設(shè)計中也將會采用一些全新的設(shè)計思路,比如軟件定義網(wǎng)絡(luò)(SDN)/網(wǎng)絡(luò)功能虛擬化(NFV)/網(wǎng)絡(luò)切片技術(shù),從而可以根據(jù)業(yè)務(wù)需求來靈活動態(tài)地調(diào)整網(wǎng)絡(luò)資源,進(jìn)而滿足不同業(yè)務(wù)類型的需求;設(shè)備到設(shè)備(D2D)的自組織通信使得終端與終端之間就可以直接進(jìn)行數(shù)據(jù)傳輸和內(nèi)容分享;移動邊緣計算(MEC)[5]技術(shù)使得計算和存儲等功能進(jìn)一步下沉到網(wǎng)絡(luò)的邊緣,在更靠近用戶的地方運(yùn)行,進(jìn)一步滿足了低延時類的應(yīng)用需求,避免了核心網(wǎng)絡(luò)的傳輸時延,對時延敏感的AR、自動駕駛、工業(yè)物聯(lián)網(wǎng)等應(yīng)用將會在5G網(wǎng)絡(luò)中得到更好的支持。endprint
4.1 5G網(wǎng)絡(luò)下AR/VR的機(jī)遇與挑戰(zhàn)
5G到來之后,很多新型應(yīng)用將會出現(xiàn)并大規(guī)模普及。AR/VR具有高帶寬、低延時、計算量大的特點(diǎn);高清的VR視頻每秒容量都高達(dá)百兆,現(xiàn)有4G網(wǎng)絡(luò)下,移動用戶很難進(jìn)行流暢的體驗,只能對視頻進(jìn)行壓縮,或者采用將球形全景圖轉(zhuǎn)換成立方體切片逐步加載的方式來進(jìn)行處理;而AR對實時性和計算的要求更高,需要對目標(biāo)進(jìn)行實時識別和自動跟蹤,若所有計算都從云端服務(wù)器進(jìn)行處理,則網(wǎng)絡(luò)時延將會是一個很大的挑戰(zhàn)。然而,5G網(wǎng)絡(luò)具有的新特點(diǎn),能夠很好地滿足消費(fèi)者對超高清視頻、AR/VR、自動駕駛等高帶寬、低延時的業(yè)務(wù)體驗需求,可以說AR/VR將是5G的一種殺手級應(yīng)用。
4.2 5G網(wǎng)絡(luò)下Mobile Web AR的
機(jī)遇與挑戰(zhàn)
相比較于AR/VR專用設(shè)備或者基于APP的AR/VR應(yīng)用,Mobile Web AR理論上更加依賴于通信網(wǎng)絡(luò)的支持。由于Web前端計算能力弱,很多的工作需要在云端服務(wù)器來進(jìn)行。在現(xiàn)有網(wǎng)絡(luò)環(huán)境下,可以在各地計算中心通過部署邊緣服務(wù)器來進(jìn)行處理,但邊緣服務(wù)器的部署和管理都將浪費(fèi)巨大的人力和物力。5G時代,有了統(tǒng)一的移動邊緣服務(wù),應(yīng)用提供商就能夠很方便地進(jìn)行全網(wǎng)的按需靈活部署和動態(tài)遷移,解決現(xiàn)在Mobile Web AR所面臨的時延和帶寬問題。
Mobile Web AR技術(shù)能真正提供一種移動化、跨平臺、普適化的AR服務(wù),可以應(yīng)用到各行各業(yè),包括:城市規(guī)劃宣傳、文化旅游行業(yè)、博物館、房地產(chǎn)行業(yè)、大型企業(yè)、連鎖酒店行業(yè)、連鎖餐飲行業(yè)、大型商場超市、商貿(mào)城、大型展會、廣告營銷行業(yè)等。AR/VR將不僅是一次視覺技術(shù)的革命,更是一次生活方式的巨大轉(zhuǎn)變。
目前,AR/VR還在進(jìn)一步發(fā)展中,生態(tài)鏈尚不成熟。因此,AR/VR相關(guān)產(chǎn)業(yè)鏈(硬件設(shè)備、軟件平臺、內(nèi)容制作工具、應(yīng)用開發(fā)商等多方面)需要先形成產(chǎn)業(yè)聯(lián)盟,共同推進(jìn)協(xié)同合作。在此基礎(chǔ)上,還應(yīng)制訂相關(guān)標(biāo)準(zhǔn),通過標(biāo)準(zhǔn)來進(jìn)行互聯(lián)互通,讓產(chǎn)業(yè)生態(tài)鏈上的各個環(huán)節(jié)無縫協(xié)作,這樣才能開展大規(guī)模的AR/VR產(chǎn)業(yè)化應(yīng)用,形成一個良好的產(chǎn)業(yè)生態(tài)鏈。
5 結(jié)束語
5G的低延遲、高吞吐量、D2D、多輸入多輸出(MIMO),以及邊緣計算等新的技術(shù),將推動AR/VR的快速發(fā)展,而Web AR/VR輕量級和良好的跨平臺性將極大地提升用戶的使用體驗,從而產(chǎn)生更多更豐富的AR/VR應(yīng)用,并帶來更多的業(yè)務(wù)和技術(shù)創(chuàng)新。目前Web AR的研究仍然處在初級階段,存在諸多待解決的問題,這需要學(xué)術(shù)界和產(chǎn)業(yè)界共同努力,在算法、協(xié)議、標(biāo)準(zhǔn)、Web 3D內(nèi)容、產(chǎn)業(yè)鏈等方面完善和創(chuàng)新。
致謝
Mobile Web AR的成功實現(xiàn)與應(yīng)用,離不開團(tuán)隊老師和同學(xué)們的辛苦努力。感謝研究生張鵬、閆浩然、郭佳豪、徐言、宋麗敏以及任沛博士、南國順博士等同學(xué)的辛勤付出,對他們謹(jǐn)致謝意!
參考文獻(xiàn)
[1] KARHU A, HEIKKINEN A, KOSKELA T. Towards Augmented Reality Applications in A Mobile Web Context[C]// International Conference on Next Generation Mobile Apps, Services and Technologies. USA: IEEE, 2014:1-6. DOI: 10.1109/NGMAST.2014.36
[2] VINCE J. Virtual Reality Systems[M].New York: ACM Press/Addison-Wesley Publishing Co., 1995
[3] AGIWAL M, ROY A, SAXENA N. Next Generation 5G Wireless Networks: A Comprehensive Survey[J]. IEEE Communications Surveys & Tutorials, 2016, 18(3): 1617-1655. DOI: 10.1109/COMST.2016.2532458
[4] FOUKAS X, PATOUNAS G, ELMOKASHFI A, et al. Network Slicing in 5G: Survey and Challenges[J]. IEEE Communications Magazine, 2017, 55(5): 94-100. DOI: 10.1109/MCOM.2017.1600951
[5] TRAN T X, HAJISAMI A, PANDEY P, et al. Collaborative Mobile Edge Computing in 5G Networks: New Paradigms, Scenarios, and Challenges[J]. IEEE Communications Magazine, 2017, 55(4): 54-61. DOI: 10.1109/MCOM.2017.1600863endprint