南拉才讓 完么措
(西藏大學(xué)圖書(shū)館,西藏 拉薩 850000)
順應(yīng)我國(guó)車(chē)輛迅速增加和公路交通網(wǎng)的強(qiáng)大建設(shè), 車(chē)載導(dǎo)航系統(tǒng)可以最好地滿足自身車(chē)輛的定位以及迅速了解路況信息的需求。 因?yàn)樵谛旭傔^(guò)程中,駕駛者需要隨時(shí)隨地注意著路面的狀況, 語(yǔ)音識(shí)別技術(shù)與車(chē)載系統(tǒng)的巧妙結(jié)合, 實(shí)現(xiàn)了人機(jī)交互的過(guò)程。 駕駛者雙手就能夠集中在方向盤(pán)的操作上, 無(wú)需用手去操作車(chē)載導(dǎo)航系統(tǒng), 還可以完成其他一系列的后續(xù)操作, 這對(duì)于駕駛者已經(jīng)是目前較為安全的手段之一。在當(dāng)今嚴(yán)謹(jǐn)?shù)慕煌ㄒ?guī)則下, 通過(guò)語(yǔ)音技術(shù)實(shí)現(xiàn)人機(jī)交互的方式, 大大降低了一系列駕駛問(wèn)題, 例如開(kāi)車(chē)時(shí)接聽(tīng)電話、 開(kāi)車(chē)時(shí)點(diǎn)擊屏幕操作其他系統(tǒng)等等危險(xiǎn)行為。 語(yǔ)音識(shí)別技術(shù)與車(chē)載導(dǎo)航系統(tǒng)的完美結(jié)合, 真的是一個(gè)利好的消息和應(yīng)用, 對(duì)于語(yǔ)音識(shí)別技術(shù)發(fā)展也有意味深長(zhǎng)的意義。
通過(guò)系統(tǒng)性的識(shí)別理解把語(yǔ)音信號(hào), 轉(zhuǎn)化為相應(yīng)的文本或命令操作的新型技術(shù)已經(jīng)面世, 它就是我們強(qiáng)大的語(yǔ)音識(shí)別技術(shù)。 語(yǔ)音識(shí)別技術(shù)應(yīng)該在多個(gè)領(lǐng)域中占有重要地位,例如移動(dòng)電話、車(chē)載導(dǎo)航系統(tǒng)、社會(huì)信息服務(wù)等行業(yè), 對(duì)各行各業(yè)都有一定影響力。 語(yǔ)音識(shí)別技術(shù)與車(chē)載導(dǎo)航系統(tǒng)結(jié)合, 也發(fā)揮很大的作用和得到深入應(yīng)用。 以往比較舊款式的車(chē)載導(dǎo)航系統(tǒng)是需要駕駛者手動(dòng)輸入才能夠確定目的地, 這樣在行駛過(guò)程中輸入時(shí)非常危險(xiǎn)的行為。 隨著先進(jìn)的技術(shù)設(shè)備發(fā)展, 現(xiàn)在市面上很多的車(chē)載導(dǎo)航系統(tǒng)已經(jīng)可以進(jìn)行語(yǔ)音識(shí)別, 搭建起了穩(wěn)定的人機(jī)交互交流平臺(tái), 深受廣大駕駛者的熱衷。 駕駛過(guò)程中, 司機(jī)需要在路上高度集中注意力, 但很多時(shí)候他們必須把目光轉(zhuǎn)向汽車(chē)才能操作里面的設(shè)備。 設(shè)備, 所以語(yǔ)音識(shí)別技術(shù)在車(chē)載導(dǎo)航系統(tǒng)中有著至關(guān)重要的地位。 雖然車(chē)載導(dǎo)航系統(tǒng)是獲取車(chē)輛信息的有效渠道, 但是目前很多車(chē)載導(dǎo)航系統(tǒng)接收信息還存在一些問(wèn)題, 他們不太適合司機(jī)的習(xí)慣和實(shí)際需要。 司機(jī)正在開(kāi)車(chē), 如果分散視覺(jué)注意力會(huì)發(fā)生不堪設(shè)想的后果, 這時(shí)候聽(tīng)覺(jué)就成為了另一個(gè)收取信息的好工具。根據(jù)新的交通法,司機(jī)在開(kāi)車(chē)時(shí)不允許接電話。 這是為防止駕駛員在駕駛過(guò)程中發(fā)生意外而建立的措施, 因?yàn)檐?chē)載導(dǎo)航系統(tǒng)的操作遠(yuǎn)遠(yuǎn)多于接聽(tīng)電話,這個(gè)也是相當(dāng)危險(xiǎn)的信號(hào)和威脅。
舉個(gè)例子,我們準(zhǔn)備出發(fā)到某個(gè)酒店,即使酒店是四個(gè)字符, 如果在嵌入式系統(tǒng)中使用T9 輸入法, 那么每個(gè)漢字需要約4 至5 個(gè)鍵,還有進(jìn)一步的選詞操作。因此,對(duì)于您選擇的每個(gè)地名,用一只手離開(kāi)方向盤(pán)大約需要10 秒鐘, 但是同時(shí)您的注意力和眼睛被分散了,這聽(tīng)起來(lái)非常危險(xiǎn)。 相對(duì)這些輸入方法,語(yǔ)音識(shí)別有非常的優(yōu)勢(shì), 可以說(shuō)是另外一個(gè)概念。 語(yǔ)音識(shí)別技術(shù)只需要使用者說(shuō)出具體的地名和操作步驟, 屏幕就會(huì)展現(xiàn)出來(lái), 操作者只需要確認(rèn)信息便完成整個(gè)操作過(guò)程。 這樣的操作方式不但可以簡(jiǎn)化操作, 而且提高了操作者的安全性。 因此, 語(yǔ)音識(shí)別技術(shù)與車(chē)載導(dǎo)航系統(tǒng)的結(jié)合應(yīng)用, 既提高了車(chē)載導(dǎo)航系統(tǒng)的使用率,也方便了駕駛者的操作, 對(duì)駕駛者者也有很大的幫助。 其實(shí),除了語(yǔ)音識(shí)別技術(shù)之外,在設(shè)計(jì)出完美的語(yǔ)音接口后, 還可以實(shí)現(xiàn)語(yǔ)音的合成, 這樣駕駛者根本不用低頭留意屏幕上的信息。
針對(duì)語(yǔ)音識(shí)別技術(shù)與車(chē)載導(dǎo)航系統(tǒng)的實(shí)際應(yīng)用,主要體現(xiàn)在以下操作:
(1)命令輸入。針對(duì)車(chē)載導(dǎo)航系統(tǒng)各層界面的各種指令進(jìn)行控制, 只要車(chē)載導(dǎo)航儀啟動(dòng)菜單、 導(dǎo)航、游戲、音樂(lè)等模板及其子菜單名稱進(jìn)入語(yǔ)音識(shí)別庫(kù),通過(guò)簡(jiǎn)單的輸入指令即可自由操作導(dǎo)航儀。
(2)地名輸入。根據(jù)每個(gè)城市的主要交通道路或建筑物的名稱,如果系統(tǒng)允許,這些名稱可以并入語(yǔ)音識(shí)別庫(kù)以直接識(shí)別。
(3) 連續(xù)數(shù)字串輸入。 根據(jù)每條道路上的號(hào)牌識(shí)別, 或者利用導(dǎo)航儀撥打電話與接聽(tīng)等功能時(shí), 就可以識(shí)別電話號(hào)碼或呼叫對(duì)象。
(4) 附屬設(shè)施查詢。 尋找出地圖中的酒店、 加油站、學(xué)校、醫(yī)院等設(shè)施。
語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)過(guò)程主要是系統(tǒng)訓(xùn)練和系統(tǒng)識(shí)別, 大致分為以上兩個(gè)步驟。 語(yǔ)音識(shí)別主要通過(guò)識(shí)別聲學(xué)模型和文法分析語(yǔ)言模型來(lái)實(shí)現(xiàn)系統(tǒng)訓(xùn)練步驟。至于系統(tǒng)識(shí)別步驟, 是利用相應(yīng)的識(shí)別算法, 分析語(yǔ)言信號(hào)中的特色參數(shù), 然后與系統(tǒng)模型系列對(duì)比,最后獲取識(shí)別結(jié)果。 語(yǔ)音識(shí)別技術(shù)的重點(diǎn)是對(duì)語(yǔ)音信號(hào)提煉和比對(duì)的模式識(shí)別。
預(yù)處理環(huán)節(jié)、提取特色參數(shù)環(huán)節(jié)、模型匹配和其他環(huán)節(jié),都是語(yǔ)音信號(hào)的環(huán)節(jié)。 在預(yù)處理環(huán)節(jié)中,通過(guò)利用語(yǔ)音識(shí)別技術(shù)首先去除語(yǔ)音信號(hào)中的雜音和氣流等不穩(wěn)定信號(hào)。 在預(yù)處理后, 就是提取和分析語(yǔ)音信號(hào)中的特色參數(shù)。 提取特色參數(shù)的方法也有很多, 例如梅爾倒譜系數(shù)算法、 短時(shí)平均能量算法等等。 最后一個(gè)環(huán)節(jié)就是參數(shù)篩選, 按時(shí)間順序?qū)μ厣珔?shù)進(jìn)行重新排列, 然后把模式表和參考模式進(jìn)行逐一對(duì)比。 根據(jù)判定規(guī)則采用最佳參考模式進(jìn)行識(shí)別, 因而得到最后的識(shí)別結(jié)果。
因?yàn)槭艿乩砦恢孟拗频仍颍?藏區(qū)人民長(zhǎng)期處于分散狀態(tài), 藏語(yǔ)也因此出現(xiàn)了各地的差異性, 在藏區(qū)不同的片區(qū)可能就會(huì)產(chǎn)生另外一種方言。 隨著綜合國(guó)力的提升, 藏區(qū)人民生活水平也隨之帶動(dòng)起來(lái), 交通和通信問(wèn)題得到了很大的改善, 打破了藏語(yǔ)受限制的交流。 藏語(yǔ)需要一個(gè)具有權(quán)威性的參考點(diǎn), 才能夠形成藏語(yǔ)的規(guī)范化。 在現(xiàn)今信息化的時(shí)代中, 通過(guò)開(kāi)發(fā)藏語(yǔ)語(yǔ)音識(shí)別系統(tǒng), 不但可以成為地方性方法參考點(diǎn), 而且能夠形成共同的語(yǔ)言特別, 為藏語(yǔ)語(yǔ)音識(shí)別作出一定的貢獻(xiàn)。
(1)逐漸完善藏語(yǔ)語(yǔ)音識(shí)別資料庫(kù),通過(guò)學(xué)習(xí)更多的藏語(yǔ)文本, 收集和整理相關(guān)資料, 進(jìn)行相應(yīng)的語(yǔ)音采集和系統(tǒng)標(biāo)注。
(2)通過(guò)對(duì)音節(jié)的研究,結(jié)合藏語(yǔ)語(yǔ)言特點(diǎn),在藏語(yǔ)語(yǔ)音別系統(tǒng)中確定音素作為識(shí)別基元。
(3)選取適合藏語(yǔ)語(yǔ)音的系統(tǒng)語(yǔ)言模型,結(jié)合聲學(xué)提高系統(tǒng)識(shí)別能力。
(4)對(duì)在特定人和非特定人的藏語(yǔ)中,進(jìn)行孤立詞語(yǔ)識(shí)別和對(duì)比, 檢驗(yàn)藏語(yǔ)特定人對(duì)于孤立詞語(yǔ)的識(shí)別率,進(jìn)一步提高藏語(yǔ)的語(yǔ)音系統(tǒng)識(shí)別性。
藏語(yǔ)語(yǔ)音識(shí)別技術(shù)主要面臨著以下困難:(1)基元選取。 語(yǔ)音基元有單詞、音節(jié)和音素,是語(yǔ)音識(shí)別的重要工作。 藏文是一種音素拼音文字, 多數(shù)都是用音素進(jìn)行表示。 藏語(yǔ)的音節(jié)最少是由一個(gè)字母構(gòu)成, 最多是七個(gè)字母組成, 各個(gè)音節(jié)之間都會(huì)用音節(jié)符合相隔開(kāi)。(2)端點(diǎn)位置檢測(cè)。端點(diǎn)位置檢測(cè)就是找到音節(jié)的起始點(diǎn)和結(jié)束點(diǎn),是語(yǔ)音識(shí)別中的關(guān)鍵。(3)適應(yīng)性能不高。 適應(yīng)性能主要是針對(duì)環(huán)境和說(shuō)話者。 特定環(huán)境下采集的語(yǔ)音可能只是在當(dāng)時(shí)的環(huán)境下應(yīng)用, 通用性會(huì)下降。 對(duì)說(shuō)話者的適應(yīng)性,主要體現(xiàn)在不同性別、年齡或情感音素情況下的相同語(yǔ)音內(nèi)容, 都是會(huì)存在差異的。 (4)方言影響。 每一個(gè)地方都有屬于自己的方言,藏區(qū)按方言劃分為衛(wèi)藏、康巴、安多三塊,而衛(wèi)藏又分“前藏”和“后藏”,可想而知藏語(yǔ)有多復(fù)雜。 (5)語(yǔ)料庫(kù)資料短缺。 由于藏區(qū)不是一個(gè)系統(tǒng)的語(yǔ)音庫(kù),而藏區(qū)的地區(qū)劃分也不是特別清晰, 每個(gè)地區(qū)都有其獨(dú)立性和特別性, 所以目前收集到的語(yǔ)音資料庫(kù)都是非常有限的資源。
藏語(yǔ)其實(shí)是一個(gè)非常值得深入研究的領(lǐng)域,還是有很多發(fā)展空間和問(wèn)題有待研究。主要是藏語(yǔ)作為一種小語(yǔ)種,存在一定的復(fù)雜度,所以是一個(gè)很好的探究方向和目標(biāo)。 希望藏語(yǔ)語(yǔ)音識(shí)別系統(tǒng)得以更加完整,針對(duì)日后規(guī)劃,主要還有以下幾個(gè)方面的工作探究:
(1)完善和整合語(yǔ)音資料庫(kù)。藏語(yǔ)語(yǔ)音資料庫(kù)資料尚少且未算很成熟, 若果想提高藏語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率, 還是需要繼續(xù)整合和完善語(yǔ)音資料庫(kù), 不斷拓展研究方向, 希望語(yǔ)音資料庫(kù)越來(lái)越大, 為科學(xué)研究提供更多的參考。
(2)研究藏語(yǔ)的各種資料。 因?yàn)槟壳安卣Z(yǔ)研究都是比較片面和零碎, 希望日后能夠?qū)ΜF(xiàn)存的問(wèn)題優(yōu)化分析,通過(guò)一系列的論證和實(shí)際檢驗(yàn),總結(jié)出更多的藏語(yǔ)語(yǔ)言學(xué)知識(shí),提高藏語(yǔ)在語(yǔ)音識(shí)別技術(shù)中的完整度和整體識(shí)別度,讓藏語(yǔ)語(yǔ)言被更多的人所熟悉和認(rèn)識(shí)。
語(yǔ)音識(shí)別是以最方便、 自然和快捷的方式聽(tīng)懂人類語(yǔ)言的一門(mén)技術(shù), 也是人機(jī)交互重要的一步。 車(chē)載導(dǎo)航系統(tǒng)也成為了新的研究熱點(diǎn), 不但可以為駕駛者提供更多便利功能, 還能大大提高了行駛安全。 許多新技術(shù)可以應(yīng)用到車(chē)載導(dǎo)航系統(tǒng)中, 不斷豐富和改進(jìn)了系統(tǒng)的功能。 語(yǔ)音識(shí)別在車(chē)載導(dǎo)航系統(tǒng)的完美結(jié)合,造福廣大人們?nèi)罕姟?相信在未來(lái),通過(guò)多方的合作開(kāi)發(fā),互相提供技術(shù)支持,語(yǔ)音識(shí)別技術(shù)的逐漸強(qiáng)化,加上語(yǔ)言的多樣性研究, 各種語(yǔ)言的識(shí)別準(zhǔn)確度和精準(zhǔn)度都會(huì)在語(yǔ)音識(shí)別技術(shù)中不斷呈現(xiàn)和進(jìn)步。 而藏語(yǔ)也可以作為一個(gè)很好的研究點(diǎn), 因?yàn)槠洫?dú)特性和多元化是值得深究。