劉定 張婷
【摘要】物聯(lián)網(wǎng)中機(jī)器和機(jī)器的通信、人和人的通信不是天然有界限的,機(jī)器和機(jī)器通信還是要受人為控制的,最終也是為人服務(wù)的;所以人機(jī)交互是物聯(lián)網(wǎng)中必不可少的重要環(huán)節(jié)。所以說(shuō),人機(jī)的智能交互是物聯(lián)網(wǎng)中人物之間聯(lián)系的重要方面,智能交互也是物聯(lián)網(wǎng)智能的重要體現(xiàn)之一。本文討論的物聯(lián)網(wǎng)視覺(jué)的智能化交互技術(shù),根據(jù)“擬人”的技術(shù)分析,將人類感知外在世界的視覺(jué)智能化交互技術(shù)進(jìn)行簡(jiǎn)要分析。
【關(guān)鍵詞】物聯(lián)網(wǎng);視覺(jué);智能化;交互技術(shù)
中圖分類號(hào):J9? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? DOI:10.12246/j.issn.1673-0348.2022.09.078
“人機(jī)交互”這個(gè)名詞對(duì)于計(jì)算機(jī)領(lǐng)域的人來(lái)說(shuō),有點(diǎn)兒老舊。可是,“新”名詞——可穿戴設(shè)備也并不新。第一臺(tái)可穿戴設(shè)備誕生于1961年。進(jìn)入21世紀(jì),隨著物聯(lián)網(wǎng)的蓬勃發(fā)展,人機(jī)交互也步入物聯(lián)網(wǎng)時(shí)代,出現(xiàn)了眾多基于微交互的可穿戴產(chǎn)品。微交互是只為實(shí)現(xiàn)單一任務(wù)而存在的一系列操作行為。也就是當(dāng)前主流微交互的三種實(shí)現(xiàn)方法。物聯(lián)網(wǎng)雖然是“物物相連的網(wǎng)”,例如,谷歌AR眼鏡、3D手勢(shì)互動(dòng)、體感交互等概念產(chǎn)品正顛覆著我們的傳統(tǒng)認(rèn)知。這些基于五覺(jué)(眼、耳、口、鼻、舌)及其綜合應(yīng)用的多維協(xié)同感知與交互,正是物聯(lián)網(wǎng)作為深度信息化的重要體現(xiàn),將深刻影響著人們的日常生活。本文對(duì)視覺(jué)的智能化交互技術(shù)進(jìn)行簡(jiǎn)要分析。
1. 視覺(jué)的智能化
物聯(lián)網(wǎng)視視覺(jué)源自圖像、視頻等能夠代替人眼功能的系統(tǒng),這些系統(tǒng)能夠?qū)崿F(xiàn)視覺(jué)增強(qiáng)感知、視覺(jué)理解與交流等視覺(jué)功能。
視覺(jué)增強(qiáng)技術(shù)。視覺(jué)增強(qiáng)屬于AR(增強(qiáng)現(xiàn)實(shí))中的一種,也有人稱AR為混合現(xiàn)實(shí)。視覺(jué)增強(qiáng)就是借助計(jì)算機(jī)技術(shù)、可視化技術(shù)以及可以突破人類視覺(jué)限制的技術(shù),簡(jiǎn)單來(lái)說(shuō),視覺(jué)增強(qiáng)是虛擬世界和真實(shí)世界通過(guò)人類視覺(jué)融合的一種增強(qiáng)現(xiàn)實(shí)技術(shù),屬于視覺(jué)類人機(jī)交互技術(shù)。視覺(jué)增強(qiáng)將會(huì)是通過(guò)視覺(jué)融合能夠突破人類視覺(jué)極限的技術(shù)之一。它的出現(xiàn)與下述幾種技術(shù)密切相關(guān)。
一是計(jì)算機(jī)圖形圖像處理技術(shù)和光學(xué)傳感器。視覺(jué)增強(qiáng)的實(shí)現(xiàn),可以通過(guò)基于圖形圖像處理技術(shù)的融合,實(shí)現(xiàn)人眼所無(wú)法實(shí)現(xiàn)的廣度和清晰度。整套系統(tǒng)的核心是一個(gè)不斷旋轉(zhuǎn)的熱傳感器,置于其上的處理器持續(xù)不斷地將圖像拼接在一起,為一個(gè)持續(xù)刷新的全景視頻系統(tǒng)源源不斷地提供圖片,而且,智能軟件會(huì)發(fā)現(xiàn)潛在的威脅。
二是3D技術(shù),目前,裸眼3D技術(shù)產(chǎn)品已經(jīng)在市面出現(xiàn)。實(shí)現(xiàn)裸眼3D視圖,與千里之外的家人可實(shí)現(xiàn)面對(duì)面交流,而且不需要借助任何媒介。
三是夜視技術(shù)和穿透技術(shù)。紅外技術(shù)和微光夜視技術(shù)作為夜視技術(shù)中較為成熟的技術(shù),突破了人類在黑暗無(wú)光的環(huán)境中無(wú)法看到的視力限制,廣泛用于搜救和軍事用途。美國(guó)軍事部門(mén)DARPA最近正在開(kāi)發(fā)一種可穿透墻壁、路障等視覺(jué)障礙物的可視技術(shù),被稱為“生物識(shí)別技術(shù)AT-T距離”。根據(jù)DARPA的項(xiàng)目計(jì)劃,不僅可以看到兩個(gè)墻壁后面的范圍,而且可以檢測(cè)墻壁背后的人的心跳。其余的視覺(jué)增強(qiáng)技術(shù)應(yīng)用還包括哈勃望遠(yuǎn)鏡、電子顯微鏡等電子輔助感知系統(tǒng),能夠?qū)崿F(xiàn)視覺(jué)穿透的雷達(dá)和衛(wèi)星技術(shù)中常用的遙感應(yīng)用。
2. 視覺(jué)理解與交流
人類視覺(jué)的理解并不僅局限于能夠看見(jiàn),目光、眼神和視線的移動(dòng)也能傳達(dá)視覺(jué)信息??梢园血?dú)立于眼睛所看到的圖像之外的視覺(jué)信息表達(dá)為視覺(jué)理解與視覺(jué)交流。
2.1 眼動(dòng)檢測(cè)
眼動(dòng)檢測(cè)是討論人機(jī)交互中眼睛運(yùn)動(dòng)模式(各種眼部姿勢(shì)與動(dòng)作)的辨識(shí)技術(shù),也叫眼姿辨別。根據(jù)眼電信號(hào)產(chǎn)生的生理機(jī)制和采集方法,分析各種眼姿勢(shì)的特點(diǎn),包括基本眼動(dòng)模式(眼睛上移、下移、左移、右移)、眨眼模式、凝視模式等,并據(jù)此研究相應(yīng)的辨識(shí)技術(shù)。應(yīng)用眼姿辨別匹配等多種算法可將基本眼動(dòng)模式、眨眼模式、凝視等各種眼姿勢(shì)進(jìn)行特征分類、準(zhǔn)確辨識(shí),為設(shè)計(jì)眼機(jī)接口、實(shí)現(xiàn)人機(jī)交互提供基礎(chǔ)。眼姿勢(shì)的準(zhǔn)確辨識(shí)是成功實(shí)現(xiàn)新型的眼機(jī)接口的關(guān)鍵環(huán)節(jié)之一。
2.2 視線追蹤
跟蹤瞳孔(虹膜)、眼球方位及視線方向,可以實(shí)現(xiàn)用戶視線(感興趣區(qū)域)的跟蹤和分析。視線追蹤作為眼機(jī)接口技術(shù),能夠使老年人和殘疾人更加方便地使用計(jì)算機(jī)進(jìn)行信息交互,同時(shí)增加計(jì)算機(jī)對(duì)人類視覺(jué)信息的理解。視線追蹤不僅是AR/VR的關(guān)鍵技術(shù)之一,還應(yīng)用于兒童早期自閉癥檢測(cè)、神經(jīng)病學(xué)、視力科學(xué)、心理學(xué)、體育訓(xùn)練等領(lǐng)域。
2.3 視覺(jué)交流
基于視線追蹤、眼姿辨別等視覺(jué)理解技術(shù)最終能夠通過(guò)眼機(jī)接口,實(shí)現(xiàn)目光對(duì)計(jì)算機(jī)或者便攜終端、可穿戴設(shè)備的操作。例如,在閱覽電子書(shū)時(shí),目光能夠代替我們手指的部分功能,視線之下,一切跟著目光走??磿?shū)時(shí),書(shū)本內(nèi)容會(huì)隨著目光的移動(dòng)自動(dòng)向上向下移動(dòng),書(shū)本的翻頁(yè)隨著目光的自左而右或自右而左實(shí)現(xiàn)翻頁(yè)。上網(wǎng)時(shí),頁(yè)面內(nèi)容隨著眼神的游走或聚焦而變換;看電視時(shí),通過(guò)視覺(jué)交流實(shí)現(xiàn)換臺(tái)和調(diào)節(jié)音量。眼動(dòng)檢測(cè)、視線追蹤、視覺(jué)交流這些新興技術(shù)研究人類視覺(jué)系統(tǒng)在心理學(xué)中的心理語(yǔ)言。
表述與應(yīng)用,可作為一種輸入裝置用于人機(jī)交互。應(yīng)用包括Web可用性、廣告、包裝設(shè)計(jì)和汽車工程,其中,汽車設(shè)計(jì)領(lǐng)域被認(rèn)為是最有前途的應(yīng)用之一。
3. 智能視覺(jué)的應(yīng)用
基于視覺(jué)的智能交互技術(shù)的發(fā)展,最終將作為物聯(lián)網(wǎng)視覺(jué)感知與交互的組成部分,在交通領(lǐng)域?qū)崿F(xiàn)“智能視覺(jué)物聯(lián)網(wǎng)”。智能視覺(jué)物聯(lián)網(wǎng)是指由智能視覺(jué)傳感器、智能視覺(jué)信息傳輸、智能視覺(jué)信息處理和針對(duì)人、車、物三大類目標(biāo)的物聯(lián)網(wǎng)應(yīng)用。智能視覺(jué)還可以被“打上”情感標(biāo)簽,頗具情感創(chuàng)意的Ping Lamp異地感應(yīng)Wi-Fi臺(tái)燈,可以使分居兩地的親人通過(guò)燈光溫暖彼此的思念。該款可以分合式設(shè)計(jì)的花蕾般模樣的臺(tái)燈,可以分成兩個(gè)獨(dú)立的“花瓣”,每一部分都可以獨(dú)立照明。
分居兩地的親人(戀人)可以各拿一瓣各自使用,這分開(kāi)的兩瓣臺(tái)燈可以通過(guò)無(wú)線網(wǎng)絡(luò)相連接,只要有一方打開(kāi)了自己的臺(tái)燈,另一瓣臺(tái)燈也將會(huì)亮起來(lái)。當(dāng)對(duì)方也開(kāi)啟臺(tái)燈時(shí),燈的亮度就會(huì)加強(qiáng)來(lái)回應(yīng)你的思念。這份借物傳情的含蓄表達(dá),顯然擴(kuò)大了視覺(jué)理解與情感交流的領(lǐng)域,把人類的情感納入了物聯(lián)網(wǎng)中。智能視覺(jué)還可以把AR用于知識(shí)傳播、表示和刺激腦洞的打開(kāi),例如,Amazon網(wǎng)站上可以找到售價(jià)20美元的AR魔法書(shū),閱讀中可享受裸眼3D視圖頁(yè)面。如DRS技術(shù)公司推出的廣角駕駛員視覺(jué)增強(qiáng)器。該熱像儀稱為廣角駕駛員視覺(jué)增強(qiáng)器,它采用圖像拼接技術(shù)可獲得107°×30°的視場(chǎng)。廣角駕駛員視覺(jué)增強(qiáng)器可對(duì)現(xiàn)有的駕駛員視覺(jué)增強(qiáng)器(視場(chǎng)為40°×30°)進(jìn)行一對(duì)一傳感器替換,具有向后兼容能力,非常便于部署和安裝。
4. 智能視覺(jué)聯(lián)合標(biāo)示與識(shí)別
2016年12月,亞馬遜推出的Amazon Go“免結(jié)賬”實(shí)體便利店,據(jù)稱不需要排隊(duì),無(wú)須注冊(cè),也不需要排隊(duì)結(jié)賬。用戶進(jìn)入時(shí)只需在手機(jī)上打開(kāi)Amazon Go APP的二維碼,在閘機(jī)上刷一下,選好商品就可以徑直離開(kāi)。從官方的宣傳看,其技術(shù)亮點(diǎn)包括傳感器融合和深度學(xué)習(xí)算法。然而,亞馬遜并未公布該系統(tǒng)的詳細(xì)工作原理,所以網(wǎng)絡(luò)中的大討論只能是對(duì)其進(jìn)行大致推測(cè)。
在商店中,所有物品都會(huì)被標(biāo)記。結(jié)合對(duì)于人(客戶標(biāo)簽)的標(biāo)示,計(jì)算機(jī)可以創(chuàng)建物品的動(dòng)態(tài)地圖。此外,通過(guò)壓力傳感器和稱重傳感器,系統(tǒng)可以判斷貨架上的商品是否已經(jīng)被拿走或還回。再配合圖像分析,系統(tǒng)就能及時(shí)發(fā)現(xiàn)用戶在還回商品時(shí)是否放錯(cuò)了貨架。
更有網(wǎng)友BrianRoemmlel透露,亞馬遜曾提交過(guò)兩份專利文件,里面的描述和Amazon Go如出一轍。這兩份文件分別為:《檢測(cè)物品互動(dòng)與移動(dòng)》和《物品從物料處理設(shè)施上轉(zhuǎn)移》?!稒z測(cè)物品互動(dòng)與移動(dòng)》這份專利的大致內(nèi)容是:用戶從貨架上拿起或放下物品時(shí),系統(tǒng)可以檢測(cè)到這個(gè)動(dòng)作,并且更新用戶移動(dòng)設(shè)備里的清單。從專利中能夠了解到,系統(tǒng)中包含多個(gè)攝像頭,它們被分別置于天花板、貨架兩側(cè)和內(nèi)部。其中,天花板上的攝像頭用來(lái)采集用戶和貨品的位置,貨架兩側(cè)的攝像頭用來(lái)捕捉用戶的圖像和周圍的環(huán)境,貨架內(nèi)的攝像頭則用來(lái)確定貨品的位置或用戶手的移動(dòng)。《物品從物料處理設(shè)施上轉(zhuǎn)移》這份專利主要是說(shuō):物品被識(shí)別,并且當(dāng)用戶正在拿起物品時(shí),物品自動(dòng)與用戶發(fā)生關(guān)聯(lián)。當(dāng)用戶進(jìn)入或穿過(guò)“轉(zhuǎn)移區(qū)”,被拿起的物品將自動(dòng)轉(zhuǎn)移到用戶,而不需要有用戶的“確認(rèn)”輸入或帶來(lái)附加延遲。
測(cè)試階段的Amazon Go暫時(shí)只對(duì)亞馬遜員工開(kāi)放,通過(guò)網(wǎng)絡(luò)上的分析可見(jiàn),計(jì)算機(jī)視覺(jué)還需要聯(lián)合貨架上的傳感器,在一個(gè)智能視覺(jué)的環(huán)境中,判斷被標(biāo)記的人和被標(biāo)記的商品之間,是拿起、放下,還是拿走。所有被標(biāo)記為同一人“拿走”的商品,在出口處自動(dòng)結(jié)賬。使用智能視覺(jué)減少員工(減輕勞動(dòng)程度)的思路不止這一種。Autonomous展示的遠(yuǎn)程控制機(jī)器人,可代替員工巡視店面,員工只要坐在辦公室,就能一次監(jiān)控多個(gè)機(jī)器人,在店內(nèi)以更髙的密度提供顧客所需的服務(wù),包括用遠(yuǎn)程操控提供資訊,以及回答問(wèn)題等。
物聯(lián)網(wǎng)的智能特征也要求著更為智能化的交互方式,一方面是強(qiáng)調(diào)了終端的智能化,為了把機(jī)器的世界和人的世界結(jié)合起來(lái),我們要增強(qiáng)機(jī)器對(duì)信息的智能收集和處理的能力,這樣對(duì)終端的智能化就有所要求,因?yàn)檫@些信息的來(lái)源不僅局限于物,還可能是源自人或人的感官的信息。另一方面強(qiáng)調(diào)了交互的智能化,因?yàn)槲覀儾粫?huì)僅停留在鼠標(biāo)、鍵盤(pán)這樣的交互上,需要在更為融洽的人機(jī)環(huán)境中用觸摸、語(yǔ)音、眼神、動(dòng)作甚至心理感應(yīng),與機(jī)器交流人類的真實(shí)想法。視覺(jué)標(biāo)簽作為智能視覺(jué)物聯(lián)網(wǎng)的重要技術(shù),是指對(duì)圖像和視頻中內(nèi)容所進(jìn)行的識(shí)別、理解、分類??傊悄芤曈X(jué)物聯(lián)網(wǎng)是基于視覺(jué)的大感知技術(shù),不僅局限于上述的幾個(gè)方面,還可以包括車輛行駛環(huán)境感知、生態(tài)環(huán)境感知、空間感知等。智能視覺(jué)物聯(lián)網(wǎng)使人類視覺(jué)突破生理極限,借助機(jī)器(計(jì)算機(jī))視覺(jué)技術(shù)看得更遠(yuǎn)、更細(xì)、更準(zhǔn)、更全。
參考文獻(xiàn):
[1]物聯(lián)網(wǎng)信息感知與交互技術(shù)研究[J].王曉東.山西煤炭管理干部學(xué)院學(xué)報(bào).2016(01)
[2]基于物聯(lián)網(wǎng)信息安全感知與交互技術(shù)研究[J].王為民.信息安全與技術(shù).2016(01)
[3]物聯(lián)網(wǎng)信息感知與交互技術(shù)研究[J].劉建慶.電子技術(shù)與軟件工程.2016(01)
作者簡(jiǎn)介:劉定,1989,男,漢族,河南省焦作市人,焦作大學(xué),助教,研究方向:物聯(lián)網(wǎng)應(yīng)用技術(shù).張婷,1992,女,漢族,河南省焦作市人,焦作大學(xué),助教,研究方向:大數(shù)據(jù)與云計(jì)算.