祁鏝潼,包蓉,楊司杰,劉維勇
(江蘇師范大學(xué) 電氣工程及自動化學(xué)院,江蘇徐州,221116)
本文介紹的電動輪椅智能控制器,融入智能語音技術(shù),實現(xiàn)智能導(dǎo)航和情感陪護,切實滿足電動輪椅使用者的需求。
智能語音技術(shù)主要承擔(dān)人與計算機之間交流溝通的任務(wù),由語音識別、自然語言處理、語音合成三部分構(gòu)成。語音識別是將音頻信號變換為文本信號的技術(shù)手段。將語音識別技術(shù)應(yīng)用于智能電動輪椅控制器上,可以準確地識別老年人想要表達的意思,更好地滿足老人真實的心理訴求。自然語言處理主要解決人與計算機之間的交流問題,然而要實現(xiàn)自然語言處理還是較為困難的,它需要計算機有強大的計算能力以及處理數(shù)據(jù)的能力。語音合成是將各種不同文字形式的信息轉(zhuǎn)化成大家便于理解的口語的形式輸出給用戶。其基本流程如圖1所示。
圖1 智能語音技術(shù)實現(xiàn)過程
系統(tǒng)硬件構(gòu)成主要包含以下模塊:語音輸入輸出模塊(TLC320AD50C)、主處理器模塊(TMS320VC5402)、存儲器擴展模塊、供電模塊[11]。
(1)語音輸入輸出模塊:選用TI公司的TLC320AD50C能夠準確快捷的實現(xiàn)A/D轉(zhuǎn)換。
(2)主處理器模塊:選用TMS320VC5402芯片,該芯片的優(yōu)勢就在于有非常強的運算能力,能夠?qū)崟r處理語音識別所需的運算,實現(xiàn)主處理器安全高效的運行。
(3)存儲器擴展模塊:選用SST公司的SSTLE29010型號的存儲器。該存儲器可重復(fù)擦寫,兼容性強,反應(yīng)迅速,能耗也比較低。
(4)供電模塊:通過低電壓的方實現(xiàn)芯片的低功耗。整個系統(tǒng)的工作電壓分為核心器件和非核心器件兩種,前者采用5V電壓,后者采用1.8V電壓。
(5)TMS320VC5402(主處理器模塊)與 TLC320AD50C(語音輸入輸出模塊)接口設(shè)計:
接口選用多通道帶緩存串行口McBSP。該接口能夠?qū)崿F(xiàn)快速高效傳輸,不僅能單向傳輸還能夠?qū)崿F(xiàn)往返的雙向傳輸。該接口通訊機制為全雙工能夠連續(xù)傳輸數(shù)據(jù)流,工作起來非常的高效便捷。
智能語音處理算法會兼用匯編語言和C語言。兩種語言組合使用令系統(tǒng)軟件的開發(fā)設(shè)計更加靈活高效。系統(tǒng)軟件主要模塊及其相關(guān)關(guān)聯(lián)性如圖2所示。
圖2 系統(tǒng)軟件主要模塊關(guān)聯(lián)圖
預(yù)處理:主要由預(yù)加重和分幀處理構(gòu)成。預(yù)加重的意義就在于使高頻信號的占比增加,從而使信號的頻譜趨于平緩,更有利于進行下一步的頻譜分析。上述方法更有利于小詞匯量語音端點的監(jiān)測[6]。在自適應(yīng)閾值的情況下,能夠更加準確的監(jiān)測出語音信號為進一步的研究做好鋪墊。分幀處理:本質(zhì)上就是對語音信號進行切割劃分,約20ms為一幀。劃分的意義就在于能夠?qū)⒉环€(wěn)定的語音信號變得穩(wěn)定,使下面的操作更高效便捷。
MFCC參變量提取中的Mel濾波器組是針對平滑信號。為了使我們的頻譜更具普遍性我們選擇Log對數(shù)能量,除此之外它在防止數(shù)據(jù)溢出方面也起到較好的作用。離散余弦變換(DCT)運算既可以使低維能量占比大幅增加,又可以減少相關(guān)信號的影響,從而使假設(shè)更具說服力。
模板匹配利用動態(tài)時間規(guī)劃(DTW)算法通過已有的模板對要檢測的每一個詞條進行最精準的匹配識別。
目前市面上的電動輪椅智能化程度不高,仍需要用戶自行設(shè)定目的地位置以及位置確定。將智能語音算法引入,實現(xiàn)音智能導(dǎo)航,提高電動輪椅的智能化程度,讓老年人不需要復(fù)雜的操作僅發(fā)出語音指令就可以操作輪椅,為老年人的出行提供方便。
要實現(xiàn)導(dǎo)航功能的研究設(shè)計要從以下幾點做出努力:
(1)環(huán)境感知:傳感器在實現(xiàn)對外界環(huán)境的感知上起著至關(guān)重要的作用。用于環(huán)境感知的有溫度傳感器、光電傳感器、超聲測距傳感器、紅外傳感器以及電磁傳感器。單個傳感器難以獲得系統(tǒng)全面的環(huán)境信息,因而要綜合運用上述傳感器實現(xiàn)對環(huán)境最準確的感知[7]。
(2)定位技術(shù):采用GPS和ZigBee相結(jié)合的方式。在戶外選擇GPS,GPS定位范圍廣且適應(yīng)性強;在室內(nèi)選擇ZigBee,該技術(shù)定位更加準確,能精確到0.1米且性價比更高,兩者綜合起來可以實現(xiàn)定位的精準快捷[13]。
(3)路徑規(guī)劃:本智能控制系統(tǒng)選用勢場法來進行路徑規(guī)劃 。所謂勢場法即將地圖虛擬為一個勢場,將智能輪椅控制器看作勢場上的點[10]。目的地對該點產(chǎn)生引力,障礙物對它產(chǎn)生斥力。通過引力與斥力的共同作用指引智能輪椅控制器到達目的地。
老年人在生活中經(jīng)常會感到孤單寂寞,普通的輪椅僅能在物理層面幫助老人活動并不能代替人給予老人心靈上的關(guān)懷,因此在設(shè)計智能輪椅的時候考慮到將情感陪護融入其中。將語音識別、自然語音理解、自然語言生成、語音合成以及情感計算融合起來,真正實現(xiàn)對老年人的情感陪護。
具體實現(xiàn):主要由麥克風(fēng)、流媒體服務(wù)器、應(yīng)用服務(wù)器以及客戶端四部分組成。執(zhí)行流程圖如圖3所示。
圖3 情感陪護具體執(zhí)行流程圖
(1)麥克風(fēng)安裝在智能輪椅上用來收集音頻,麥克風(fēng)收集的音頻信號經(jīng)網(wǎng)線傳輸給流媒體。
(2)流媒體驅(qū)動將音頻信號傳輸給后臺,執(zhí)行邏輯處理、數(shù)據(jù)庫操作等任務(wù)。
(3)客戶端是人與計算機交流的主要平臺,本系統(tǒng)的客戶端主要是面向老年人。該客戶端的任務(wù)包括幫助老年人完成登錄注冊、進行情感分析以及心率的實時監(jiān)測等,讓老年人有更好地體驗感。
智能輪椅在設(shè)計的時候要注意詞庫的構(gòu)建,讓智能輪椅控制器在與老年人聊天時選擇一些溫和型詞匯,選擇老人感興趣的話題,與老年人建立良好溝通。
所設(shè)計的集導(dǎo)航與情感陪護為一體的多功能智能輪椅控制器,充分發(fā)揮智能語音技術(shù)在導(dǎo)航以及情感陪護中作用。使老年人在智能輪椅控制器的幫助下不僅能實現(xiàn)行走上的便利,也能得到情感上的陪護。