萬(wàn)心媛,宋萌,趙渴欣,王繹然,劉千
(哈爾濱商業(yè)大學(xué)金融學(xué)院,哈爾濱 150028)
虛擬現(xiàn)實(shí)(VR)融合了計(jì)算機(jī)圖形、數(shù)字多媒體、模擬仿真技術(shù)等多種技術(shù),包括模擬環(huán)境、感知等以達(dá)到用戶無(wú)法區(qū)分這究竟是現(xiàn)實(shí)環(huán)境還是計(jì)算機(jī)模擬出來(lái)的環(huán)境[1]。
(1)虛擬現(xiàn)實(shí)技術(shù)特點(diǎn)
虛擬現(xiàn)實(shí)技術(shù)具有3I的特征,分別是沉浸感(Im?mersion)、交互性(Interaction)和想象性(Imagination):
沉浸性,通過(guò)計(jì)算機(jī)的三維建模技術(shù)創(chuàng)造出仿真虛擬環(huán)境,使體驗(yàn)者感受到強(qiáng)大且震撼的真實(shí)感,仿佛身臨其境。
交互性,在計(jì)算機(jī)創(chuàng)建的模擬環(huán)境中,用戶可以通過(guò)一些可穿戴設(shè)備進(jìn)行人機(jī)交互。例如:在虛擬環(huán)境中佩戴可穿戴手套去觸摸虛擬環(huán)境中的物體時(shí),會(huì)真實(shí)地感受到物體的觸感與粗糙程度,并且當(dāng)抓取此物體時(shí),會(huì)切實(shí)地感覺(jué)到物體的重量。
想象性,虛擬現(xiàn)實(shí)環(huán)境可以讓受眾用戶沉浸其中,通過(guò)體驗(yàn)計(jì)算機(jī)創(chuàng)造出的各種虛擬環(huán)境,在短時(shí)間內(nèi)、高效率地體會(huì)多種不同的人機(jī)交互環(huán)境。并且可以通過(guò)計(jì)算機(jī)的交互設(shè)備,將自己的動(dòng)作與觸感信息錄入計(jì)算機(jī),在計(jì)算機(jī)收到這些信息后,通過(guò)傳感設(shè)備進(jìn)行數(shù)據(jù)的處理,從而更好地為用戶創(chuàng)造更加真實(shí)的環(huán)境。用戶在根據(jù)自己需要向計(jì)算機(jī)發(fā)出指令,從而體驗(yàn)虛擬環(huán)境,在此過(guò)程中,用戶激發(fā)了自身想象力,并且在人機(jī)交互的過(guò)程中,不斷會(huì)將自身新的想法與感知輸入到計(jì)算機(jī)內(nèi),從而通過(guò)與計(jì)算機(jī)進(jìn)一步的人機(jī)交互中,激發(fā)創(chuàng)造力、觸發(fā)靈感。
我們團(tuán)隊(duì)的新型盲人閱讀器利用虛擬現(xiàn)實(shí)技術(shù),通過(guò)計(jì)算機(jī)捕捉盲人用戶頭部等身體部位的運(yùn)動(dòng)軌跡、利用特制的虛擬現(xiàn)實(shí)手套將盲人的觸感放大,并且通過(guò)聲源的捕捉,利用人機(jī)交互的技術(shù),為盲人用戶創(chuàng)建一個(gè)仿真的視覺(jué)環(huán)境。三維建模是其中的一項(xiàng)核心技術(shù),通過(guò)3D Max和VRML語(yǔ)言編寫(xiě),主要包括模式識(shí)別技術(shù)、支持向量計(jì)算技術(shù)、傳感器技術(shù)、通訊技術(shù)等[2]。虛擬仿真環(huán)境的創(chuàng)建也是基于三維建模技術(shù)的重要支持。
(1)頭部運(yùn)動(dòng)追蹤創(chuàng)建盲人模擬視覺(jué)環(huán)境
我們團(tuán)隊(duì)的新型盲人閱讀器即是利用虛擬現(xiàn)實(shí)技術(shù),將產(chǎn)品設(shè)計(jì)為一個(gè)虛擬現(xiàn)實(shí)的眼鏡,盲人由于自身視力障礙的特殊性,通過(guò)佩戴本產(chǎn)品眼鏡時(shí),產(chǎn)品上有感知盲人頭部運(yùn)動(dòng)軌跡的接觸點(diǎn),通過(guò)這些接觸點(diǎn)可以實(shí)時(shí)感知到盲人頭部的運(yùn)動(dòng)軌跡,從而可以利用盲人的頭部跟蹤來(lái)改變圖像的視角,而出于針對(duì)盲人用戶群體特殊性的考慮。當(dāng)盲人用戶頭部在發(fā)生運(yùn)動(dòng)時(shí),本產(chǎn)品眼鏡的接觸點(diǎn)感知后,就會(huì)自動(dòng)智能追蹤盲人用戶運(yùn)動(dòng)的軌跡,實(shí)時(shí)給出相關(guān)語(yǔ)音的播報(bào)。創(chuàng)造出一種盲人用戶仿佛是視力正常者的虛擬環(huán)境,為盲人用戶提供無(wú)障礙出行的環(huán)境,從此解決了盲人視力障礙的問(wèn)題,使盲人用戶能夠和明眼人一樣正常出行,而不再受到諸多局限。這也就是,利用虛擬現(xiàn)實(shí)技術(shù),使盲人用戶可以用另一套系統(tǒng)來(lái)觀察環(huán)境,也就是頭部的運(yùn)動(dòng)。
(2)判定聲源方向創(chuàng)建盲人模擬視覺(jué)環(huán)境
人類具有判定聲音方向的能力,人類的雙耳可以根據(jù)聲音的強(qiáng)度、來(lái)源的方向來(lái)判定位置,并且聲音在傳到兩個(gè)耳朵時(shí)的時(shí)間和強(qiáng)弱也會(huì)有細(xì)微的差別,這就是雙耳效應(yīng)。而作為盲人這一特殊群體來(lái)說(shuō),由于視覺(jué)方面的障礙,導(dǎo)致他們的聽(tīng)覺(jué)感知更加靈敏,他們對(duì)于利用聲音來(lái)判別方向這一技能更為突出。他們可以更加快速地對(duì)于聲源方向進(jìn)行識(shí)別,并且能夠更加靈敏通過(guò)雙耳效應(yīng)辨別出左右耳在聽(tīng)到聲音時(shí)細(xì)微的差別,從而對(duì)于聲源來(lái)源的方向有一個(gè)更加清晰的把控。
盲人足球這一運(yùn)動(dòng)地快速傳播就為本閱讀器利用判定聲源方向創(chuàng)建盲人模擬視覺(jué)環(huán)境的這一技術(shù)提供了現(xiàn)實(shí)依據(jù)。盲人足球19世紀(jì)80年代在西班牙出現(xiàn),這種新興的運(yùn)動(dòng)模式激發(fā)了全世界各地愛(ài)好足球運(yùn)動(dòng)的盲人朋友的興趣。之前由于自身視力方面的障礙,盲人運(yùn)球運(yùn)動(dòng)幾乎是一件不可能實(shí)現(xiàn)的事情,但盲人足球這種運(yùn)動(dòng)方式卻將盲人也能夠出色地進(jìn)行一次足球比賽帶來(lái)了可能。由于這項(xiàng)運(yùn)動(dòng)開(kāi)啟了盲人群體進(jìn)行足球運(yùn)動(dòng)的新世界,這項(xiàng)運(yùn)動(dòng)迅速普及,在巴西、英國(guó)、阿根廷、德國(guó)等世界足球強(qiáng)國(guó)非常普遍。2004年,在雅典,五人制盲人足球運(yùn)動(dòng)項(xiàng)目首次進(jìn)入殘奧會(huì)。2006年,中國(guó)正式組建了第一支盲人足球隊(duì),而廣東省盲人足球隊(duì)則是其中非常出色的盲人足球隊(duì)之一。與普通的足球比賽不同,盲人足球比賽一開(kāi)始,觀眾席就必須寂靜無(wú)聲,任何與足球比賽無(wú)關(guān)的噪音都可能會(huì)影響盲人運(yùn)動(dòng)員對(duì)于足球方向辨別的準(zhǔn)確度。因?yàn)?,比賽時(shí),盲人隊(duì)員只能通過(guò)聲音來(lái)辨別方向,完全是在利用“耳朵”在踢球,他們通過(guò)聲音的辨別來(lái)判斷足球的方向,隊(duì)友的位置,自己的位置。5人制盲人足球賽制規(guī)定,除守門(mén)員以外的4名選手的視力傷殘程度應(yīng)是B1級(jí),即完全喪失視力并無(wú)光感。并且為了保證比賽公平防止作弊,場(chǎng)上除守門(mén)員以外的隊(duì)員均需佩戴眼罩。這樣就完全避免了盲人隊(duì)員可能通過(guò)微弱的光感來(lái)辨別方向,從而保證場(chǎng)上除守門(mén)員以外的所有隊(duì)員都是通過(guò)聲音來(lái)辨別方向。并且盲人足球還會(huì)內(nèi)置鐵片和滾珠,從而加大聲音的清晰程度,更好地幫助球員根據(jù)聲音來(lái)判斷球的方位和距離。皮球內(nèi)的鈴鐺聲音提醒著隊(duì)員們帶球人的位置,接球的球員和防守的球員要喊出聲,讓隊(duì)友和對(duì)手知道自己的位置,場(chǎng)內(nèi)的守門(mén)員、場(chǎng)外的引導(dǎo)員和教練,則要不斷大聲指揮隊(duì)友調(diào)整前進(jìn)方向和防守位置。就是通過(guò)這樣特殊的訓(xùn)練方式和比賽方式,盲人運(yùn)動(dòng)員利用自身對(duì)于聲音的獨(dú)特辨識(shí)能力,出色的完成了每一次訓(xùn)練和比賽。廣東省盲人足球隊(duì)多名主力入選國(guó)家隊(duì),并且于2014年12月代表中國(guó)參加在香港舉辦的亞洲盲人足球隊(duì)公開(kāi)賽,在其中表現(xiàn)出色,一舉奪冠。對(duì)于足球這一激烈的運(yùn)動(dòng),盲人隊(duì)員都能夠通過(guò)聲音的識(shí)別來(lái)完成比賽并取得出色的成績(jī),那對(duì)于盲人群體來(lái)說(shuō),平時(shí)生活中出行通過(guò)聲音來(lái)判斷障礙物的位置將更容易被實(shí)現(xiàn)。
因此,根據(jù)盲人用戶這一特殊性,在本產(chǎn)品的VR系統(tǒng)中,加入聲源探測(cè)器,將探測(cè)器的接觸點(diǎn)貼近雙耳,從而在盲人用戶聽(tīng)到聲音后,通過(guò)接觸點(diǎn)可以探測(cè)到聲源的方向,與聲音的強(qiáng)弱,再與頭部追蹤系統(tǒng)相融合。當(dāng)頭部發(fā)生運(yùn)動(dòng)時(shí),聽(tīng)到的聲音也會(huì)改變,從而帶來(lái)定位的不同。通過(guò)頭部的運(yùn)動(dòng)追蹤與聲源的判定,能夠更加準(zhǔn)確地為盲人用戶確定當(dāng)前的位置,所創(chuàng)建的模擬視覺(jué)環(huán)境將更為真實(shí)。
(3)感覺(jué)反饋創(chuàng)建盲人虛擬視覺(jué)環(huán)境
基于盲人用戶群體的特殊性,用戶無(wú)法看到虛擬的物體,但可以通過(guò)感知來(lái)判斷物體的存在,這個(gè)模擬環(huán)境的創(chuàng)建可以通過(guò)本產(chǎn)品盲人閱讀器虛擬現(xiàn)實(shí)眼鏡配備的虛擬現(xiàn)實(shí)手套完成。通過(guò)在手套內(nèi)層安裝一些可以感知以及振動(dòng)的觸發(fā)點(diǎn),在盲人用戶接觸物體或障礙物時(shí),就會(huì)觸發(fā)到這些接觸點(diǎn)。這些接觸點(diǎn)通過(guò)對(duì)于物體表面進(jìn)行感知,根據(jù)其質(zhì)地、粗糙程度的感知帶來(lái)的振動(dòng)頻率強(qiáng)度不同,從而為盲人用戶判斷障礙物做出幫助。在基于可穿戴傳感器的手勢(shì)識(shí)別算法研究方面,有學(xué)者用離散的隱馬爾可夫模型結(jié)合矢量量化技術(shù)獲得的特征碼本識(shí)別了6種不同的網(wǎng)球擊球動(dòng)作,獲得了較高的識(shí)別率[3]。進(jìn)一步將盲人虛擬視覺(jué)環(huán)境創(chuàng)建的更為真實(shí)細(xì)致。
(4)語(yǔ)音匹配與盲人虛擬視覺(jué)環(huán)境的創(chuàng)建
在VR系統(tǒng)中,語(yǔ)音匹配系統(tǒng)是十分重要的。這要求模擬環(huán)境系統(tǒng)能快速識(shí)別用戶的語(yǔ)言,并對(duì)于用戶的指令做出反應(yīng)。但對(duì)于計(jì)算機(jī)來(lái)說(shuō),讓其快速識(shí)別人類語(yǔ)言并及時(shí)做出反應(yīng)是較為困難的。由于我國(guó)是一個(gè)多民族國(guó)家,各地的方言千差萬(wàn)別,并且每個(gè)用戶在發(fā)音時(shí)的清晰程度和準(zhǔn)確度也是無(wú)法統(tǒng)一量化的。這就為計(jì)算機(jī)在進(jìn)行語(yǔ)音識(shí)別方面帶來(lái)了難度。
而本產(chǎn)品,新型盲人閱讀器則配備有多國(guó)語(yǔ)言智能識(shí)別系統(tǒng),與區(qū)域語(yǔ)言識(shí)別系統(tǒng),能夠帶來(lái)盲人用戶語(yǔ)言的快速識(shí)別。基于人工智能技術(shù),在對(duì)于用戶語(yǔ)音進(jìn)行識(shí)別方面加入更多智能識(shí)別技術(shù),不只是簡(jiǎn)單地將用戶輸入的語(yǔ)音與語(yǔ)音庫(kù)數(shù)據(jù)進(jìn)行對(duì)比匹配,而是將用戶的語(yǔ)音輸入進(jìn)行更為智能的識(shí)別,加入更多“人”的思維智慧,從而可以更好的完成人機(jī)交互。在盲人用戶需要幫助時(shí),可以直接通過(guò)語(yǔ)言的方式與本產(chǎn)品所創(chuàng)建的虛擬環(huán)境進(jìn)行溝通。在機(jī)器自動(dòng)識(shí)別后,根據(jù)閱讀器內(nèi)裝備的人工智能系統(tǒng),及時(shí)解決回答盲人用戶的困難和問(wèn)題,從而使本產(chǎn)品創(chuàng)建的盲人虛擬現(xiàn)實(shí)環(huán)境更為人性化、智能化。
我們生活在一個(gè)全球化的時(shí)代,不同文化、不同語(yǔ)言間的交流日益頻繁,多語(yǔ)種的互譯就顯得尤其重要。本團(tuán)隊(duì)設(shè)計(jì)的盲人閱讀器的多語(yǔ)種翻譯功能,旨在通過(guò)攝像頭錄入所需閱讀的文字后,轉(zhuǎn)化為數(shù)據(jù),通過(guò)內(nèi)置的翻譯軟件將其翻譯為客戶所需要的語(yǔ)言。其不僅可以方便我國(guó)盲人的生活,讓其感受多種語(yǔ)言、多種文化的魅力,還擴(kuò)大了應(yīng)用地域范圍,能為更多來(lái)自不同國(guó)度的盲人群體提高服務(wù)。
隨著技術(shù)的不斷提高,翻譯系統(tǒng)也在不斷創(chuàng)新完善。目前的多語(yǔ)種輔助翻譯系統(tǒng)多采用網(wǎng)絡(luò)版和單機(jī)版兩種架構(gòu)模式。網(wǎng)絡(luò)版系統(tǒng)包括:客戶端在線功能模塊、核心功能模塊、服務(wù)端WCF服務(wù)接口模塊、應(yīng)用服務(wù)模塊、數(shù)據(jù)庫(kù)接口模塊,以及后臺(tái)數(shù)據(jù)存儲(chǔ)模塊。單機(jī)版包括:系統(tǒng)核心功能模塊、本地接口模塊和本地文件存儲(chǔ)模塊[4]。
應(yīng)用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)作為翻譯系統(tǒng)運(yùn)行的基礎(chǔ),通過(guò)按鍵向系統(tǒng)發(fā)出翻譯請(qǐng)求,在與數(shù)據(jù)庫(kù)進(jìn)行交互后,將翻譯得出的結(jié)果傳遞給語(yǔ)音朗讀系統(tǒng),通過(guò)預(yù)設(shè)的聲音模式,直接將其朗讀出來(lái),即可將文字信息翻譯成所需要的語(yǔ)種并通過(guò)聲音傳遞給盲人用戶,帶來(lái)方便快捷的用戶體驗(yàn)。
本團(tuán)隊(duì)采用中間語(yǔ)言法作為翻譯的核心方法,通過(guò)互聯(lián)網(wǎng)資源和自然語(yǔ)言處理技術(shù),利用算法將源語(yǔ)言轉(zhuǎn)化為目標(biāo)語(yǔ)言,從而完成翻譯。使用基于中間語(yǔ)言的方法,這種方法利用一種人工制定的標(biāo)準(zhǔn)語(yǔ)言作為語(yǔ)言翻譯的中介,即首先把源語(yǔ)言解析為中間語(yǔ)言的表示形式,然后再由這種中間語(yǔ)言生成目標(biāo)語(yǔ)言[5]。這種方法具有研究人員無(wú)需精通2種以上語(yǔ)言、可分步進(jìn)行語(yǔ)種添加等優(yōu)點(diǎn),技術(shù)要求低,操作簡(jiǎn)單易上手,是多語(yǔ)種機(jī)器翻譯核心機(jī)理的首選。
通過(guò)盲人閱讀器的攝像頭,將需要進(jìn)行閱讀的文字信息進(jìn)行錄入,而后轉(zhuǎn)化為數(shù)據(jù)暫存入數(shù)據(jù)庫(kù),由數(shù)據(jù)庫(kù)對(duì)基本信息進(jìn)行短時(shí)間內(nèi)存儲(chǔ),通過(guò)嵌入的翻譯腳本,將數(shù)據(jù)庫(kù)中的數(shù)據(jù)提取出來(lái),通過(guò)單機(jī)版翻譯軟件、云翻譯等翻譯程序,將其翻譯為所需的語(yǔ)種,再通過(guò)語(yǔ)音功能將其播放出來(lái)。
影像資料的處理:從外部的影像設(shè)備將需要翻譯的信息錄入以后,首先將其轉(zhuǎn)化為一張張的靜態(tài)圖片。并且根據(jù)盲人閱讀器內(nèi)部的程序,在一句話的最后選擇5個(gè)比對(duì)點(diǎn),若比中,可以將兩張圖片在系統(tǒng)中串聯(lián)起來(lái),形成完整的信息。若不能比中,則說(shuō)明掃描的速度太快,中間有斷點(diǎn),缺了若干行文字。
文字特征抽?。禾卣鞒槿】梢哉f(shuō)是盲人閱讀器的核心,用什么特征,怎么抽取,直接影像到識(shí)別的好壞。特征抽取是文字識(shí)別中一個(gè)基本而又十分重要的問(wèn)題,合理、正確抽取文字是提高識(shí)別率的關(guān)鍵[6]。
數(shù)據(jù)庫(kù)比較:通過(guò)與閱讀器自身數(shù)據(jù)庫(kù)的對(duì)比,將文字特征轉(zhuǎn)化為數(shù)據(jù)庫(kù)中的文字信息,將與之匹配的語(yǔ)音信息,通過(guò)擴(kuò)音器朗讀出來(lái)。盲人閱讀器默認(rèn)的翻譯語(yǔ)言將設(shè)置為中文,用戶可以通過(guò)計(jì)算機(jī)聯(lián)網(wǎng)方式下載所需翻譯語(yǔ)言的數(shù)據(jù)包,以實(shí)現(xiàn)閱讀器的多語(yǔ)種翻譯。用戶也應(yīng)當(dāng)定期更新盲人閱讀器的聯(lián)網(wǎng)數(shù)據(jù)庫(kù),以保證數(shù)據(jù)的實(shí)效性。
人工矯正與學(xué)習(xí):由于識(shí)別的正確度無(wú)法達(dá)到百分之百,想要加強(qiáng)閱讀器的實(shí)用性,人工矯正與學(xué)習(xí)這一步至關(guān)重要。盲人在使用過(guò)程中如果發(fā)現(xiàn)翻譯的語(yǔ)意嚴(yán)重偏離,那么就可以開(kāi)啟矯正與學(xué)習(xí)功能。此時(shí)盲人閱讀器內(nèi)部相關(guān)程序段就會(huì)運(yùn)行,盲人只需要語(yǔ)音輸入他認(rèn)為正確的語(yǔ)義內(nèi)容,閱讀器便通過(guò)語(yǔ)音識(shí)別內(nèi)容,并與數(shù)據(jù)庫(kù)對(duì)比是否有相似翻譯。一旦比中,程序就會(huì)修改關(guān)于這類詞語(yǔ)的翻譯方式,以提高系統(tǒng)的適用性。
本團(tuán)隊(duì)設(shè)計(jì)研發(fā)的此款盲人閱讀器運(yùn)用了OCR技術(shù)、TTS技術(shù)、ASR技術(shù)等,不僅具有強(qiáng)大的內(nèi)置攝像頭智能識(shí)別及提醒功能,還具有靈活的語(yǔ)音詞匯搜索功能。
本閱讀器能夠?qū)⒋喿x文本進(jìn)行圖像采集,然后利用圖像處理技術(shù)完成對(duì)文本的提取和文字識(shí)別,最后對(duì)識(shí)別的文字進(jìn)行音頻輸出。文字識(shí)別(OCR)技術(shù)是模式識(shí)別的一個(gè)分支,是智能閱讀的核心[7]。閱讀器的提醒功能是指夠幫助盲人對(duì)想要獲取的信息文本進(jìn)行完全錄入,使其閱讀過(guò)程更為順暢。在文字信息的處理方面,我團(tuán)隊(duì)在盲人閱讀器中安裝了doPDF?Cajviewer 7.0系統(tǒng)。此系統(tǒng)可以做到經(jīng)攝像頭讀取后確定文本范圍,進(jìn)行文本內(nèi)容錄入的操作。在錄入過(guò)程中,可以對(duì)識(shí)別內(nèi)容進(jìn)行自動(dòng)調(diào)整,對(duì)于拍攝過(guò)程中的燈光角度自行調(diào)節(jié)。
在對(duì)文本進(jìn)行拍攝錄入時(shí),應(yīng)用了文字轉(zhuǎn)語(yǔ)音技術(shù)。TTS(Text-To-Speech)文字轉(zhuǎn)語(yǔ)音技術(shù)是一項(xiàng)實(shí)現(xiàn)任意文本信息到語(yǔ)音信號(hào)轉(zhuǎn)換的技術(shù)[8]。被拍攝的目標(biāo)文本信息可以與多語(yǔ)種文字系統(tǒng)進(jìn)行匹配,閱讀器會(huì)按照用戶需求進(jìn)行文本信息的處理。在音頻信息的處理方面,通過(guò)多語(yǔ)種語(yǔ)音系統(tǒng),建立生成多語(yǔ)種音頻庫(kù),同時(shí)盲人用戶在使用過(guò)程中對(duì)于文本范圍的選取伴有建議范圍提醒功能,具體精確到對(duì)于范圍角度及廣度的提醒,提醒過(guò)程充分考慮到盲人的不便與需求。在已確定文本語(yǔ)種及音頻語(yǔ)種的前提下,系統(tǒng)將文字與音頻進(jìn)行一對(duì)一搭配,匹配過(guò)程中智能查找錯(cuò)誤進(jìn)行修改與完善。并且,盲人用戶在文本信息讀取過(guò)程中,能夠及時(shí)進(jìn)行詞匯語(yǔ)音搜索。具體來(lái)說(shuō)即是盲人在聽(tīng)讀過(guò)程中,遇到有疑問(wèn)的詞匯,能夠立即通過(guò)語(yǔ)音搜索系統(tǒng)提出自己的疑問(wèn),閱讀器在接收到盲人用戶的語(yǔ)音反饋后,通過(guò)無(wú)線網(wǎng)絡(luò)系統(tǒng)進(jìn)行智能搜索。通過(guò)這一服務(wù)項(xiàng)目,達(dá)到瞬時(shí)通過(guò)語(yǔ)音反饋解決閱讀過(guò)程中出現(xiàn)的困難的目的。
語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別(ASR)。語(yǔ)音識(shí)別技術(shù)與語(yǔ)音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤(pán),通過(guò)語(yǔ)音命令進(jìn)行相應(yīng)的操作[9]。其目標(biāo)是將人類的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。在語(yǔ)音識(shí)別處理中,過(guò)高的語(yǔ)音采樣速率會(huì)使一段語(yǔ)音信號(hào)的幀數(shù)大大增加,不利于系統(tǒng)的實(shí)時(shí)處理[10]。
參考文獻(xiàn):
[1]張毅.虛擬現(xiàn)實(shí)技術(shù)的發(fā)展現(xiàn)狀與展望[J].電腦迷,2017(11):32.
[2]王陽(yáng)陽(yáng).基于虛擬現(xiàn)實(shí)的三維建模技術(shù)探析[J].數(shù)字技術(shù)與應(yīng)用,2017(07):209-210.
[3]趙小川.手勢(shì)識(shí)別技術(shù)研究綜述與應(yīng)用展望[A].中國(guó)高科技產(chǎn)業(yè)化研究會(huì)智能信息處理產(chǎn)業(yè)化分會(huì)、中國(guó)高科技產(chǎn)業(yè)化研究會(huì)信號(hào)處理專家委員會(huì).第十一屆全國(guó)信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議??痆C].中國(guó)高科技產(chǎn)業(yè)化研究會(huì)智能信息處理產(chǎn)業(yè)化分會(huì)、中國(guó)高科技產(chǎn)業(yè)化研究會(huì)信號(hào)處理專家委員會(huì),2017:4.
[4]尼加提·納吉米,席小剛,馬斌,買(mǎi)合木提·買(mǎi)買(mǎi)提.多語(yǔ)種輔助翻譯系統(tǒng)研究與實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2012,8(02):345-350.
[5]包蘇魯?shù)?多語(yǔ)種機(jī)器翻譯平臺(tái)關(guān)鍵技術(shù)研究[D].復(fù)旦大學(xué),2008.
[6]潘保昌.浮動(dòng)模板法——一種抽取文字特征的方法[J].計(jì)算機(jī)學(xué)報(bào),1983,(06):469-477.
[7]秦瑞強(qiáng).嵌入式盲人閱讀器系統(tǒng)設(shè)計(jì)與開(kāi)發(fā)[D].大連理工大學(xué),2015.
[8]廖正和.淺析語(yǔ)音合成技術(shù)[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2006(18):216-217.
[9]劉向華.語(yǔ)音識(shí)別技術(shù)及應(yīng)用[J].溫州職業(yè)技術(shù)學(xué)院學(xué)報(bào),2006(03):33-35.
[10]王一.盲人信息輸入新方法的研究與實(shí)現(xiàn)[D].湖南大學(xué),2009.