□黃冠程 陸 越 張曉穎
口吃,英文名:stuttering,世界衛(wèi)生組織定義為“一種言語障礙現(xiàn)象,即個人知道自己想說什么,但由于無法控制的重復(fù)、停頓或延伸而無法表達(dá)自己?!毙聤W爾良圖蘭大學(xué)發(fā)表的一項神經(jīng)研究發(fā)現(xiàn),嚴(yán)重或長期口吃的人會導(dǎo)致大腦左額葉或右額葉形狀不規(guī)則,相應(yīng)的區(qū)域是負(fù)責(zé)空值語言表達(dá)的中樞,在后續(xù)對正常人與口吃患者說話時的頭部掃描影像中發(fā)現(xiàn),相比之下,口吃患者在右半球有更多的興奮點,這也干擾了本應(yīng)由左腦完成的語言表達(dá)功能,加劇腦部額葉形狀的變化,進(jìn)而影響額葉控制聽力的相關(guān)部位,使口吃患者在講話、尤其是在面對公眾發(fā)言時,聽力功能受到一定影響導(dǎo)致語言表達(dá)不流暢,這些神經(jīng)系統(tǒng)的異常反應(yīng)可能將錯誤的表達(dá)信息傳遞到主導(dǎo)發(fā)音的肌肉:嘴唇、舌頭和聲帶,從而加重口吃患者的病情。下文通過分析口吃人群的實際需求,探索使用科技手段來幫助口吃患者矯正。
(一)沉浸式VR與口吃矯正。VR(虛擬現(xiàn)實)又稱“靈境”,它是通過對現(xiàn)實場景的數(shù)據(jù)采集,結(jié)合3D建模、構(gòu)圖,實現(xiàn)在計算機(jī)中重現(xiàn)現(xiàn)實場景的技術(shù),并通過各種傳感器設(shè)備為用戶提供各種感官,它能讓用戶有身臨其境的真實操控感,并能為用戶模擬觸覺、視覺等感官體驗,使虛擬環(huán)境更加貼近真實,非常具有代入感。
目前市面上的口吃康復(fù)訓(xùn)練方法,大多是將患者集中,面對逐漸增加的聽眾,進(jìn)行不同時長的演講,利用系統(tǒng)脫敏法,使患者逐漸擺脫講話時的心理障礙。希望利用VR的沉浸感、交互性和便捷性,實現(xiàn)專業(yè)性更高、效果更好的口吃遠(yuǎn)程治療,使口吃患者克服心理障礙,提高口吃患者的生活質(zhì)量,既能達(dá)到改善口吃的目的,也為口吃治療領(lǐng)域提供更優(yōu)質(zhì)的治療手段,拓寬了虛擬現(xiàn)實技術(shù)在醫(yī)學(xué)領(lǐng)域的使用。
關(guān)于沉浸式VR技術(shù)在口吃治療領(lǐng)域的研究,曹留進(jìn)研究了其專利裝置對口吃患者的治療效果,通過實際治療結(jié)果數(shù)據(jù),對本系統(tǒng)改進(jìn)及提升患者實用性具有參考價值;嚴(yán)磊2016年研究了口吃矯正治療與VR技術(shù)結(jié)合的必要、優(yōu)勢及應(yīng)用,實現(xiàn)了實際應(yīng)用理論基礎(chǔ)雛形,對后續(xù)的研究具有較大幫助。
(二)VR在口吃矯正中的優(yōu)勢及特點。
1.代入感??诔曰颊呖梢酝ㄟ^VR相關(guān)外設(shè),置身于虛擬訓(xùn)練環(huán)境中,讓口吃患者從被動的接受訓(xùn)練內(nèi)容,轉(zhuǎn)為更傾向于實際練習(xí)操作,口吃患者在練習(xí)演講的過程中可以觀察到每位觀眾的神態(tài)表情動作,如果口吃患者演講流暢,無吞音等良好表現(xiàn),觀眾會產(chǎn)生相應(yīng)反饋,微笑、叫好、部分起身鼓掌等反饋;相反若達(dá)到觀眾應(yīng)激閾值,則會激起觀眾失望表情、走神、玩手機(jī)等反饋?;颊咝柰ㄟ^反復(fù)訓(xùn)練測試,采用系統(tǒng)脫敏法使患者在面對現(xiàn)實生活中人群講話時克服恐懼害羞等心理障礙。
2.長效性。線下的言語康復(fù)機(jī)構(gòu)或多或少不便于患者隨時練習(xí),所以導(dǎo)致超過70%的參與矯正患者在結(jié)束后出現(xiàn)復(fù)發(fā)甚至更嚴(yán)重的口吃情況,VR的虛擬現(xiàn)實技術(shù)使病人不受康復(fù)機(jī)構(gòu)的限制,在家里就可以完成發(fā)音訓(xùn)練。利用移動端設(shè)備下載響應(yīng)程序,就能不受時間、空間和教師資源等條件約束,更適合患者隨時鞏固練習(xí),達(dá)到訓(xùn)練自由。
3.直觀性。傳統(tǒng)的口吃矯正方法主要是基于簡單插圖的書籍,結(jié)合言語矯正師現(xiàn)場發(fā)聲動作教學(xué),但因為患者數(shù)量多且不能直觀地看到口腔內(nèi)部活動,它不能及時準(zhǔn)確地顯示每個器官的結(jié)構(gòu),直觀的呼吸和發(fā)聲也很復(fù)雜,導(dǎo)致很多口吃患者在練習(xí)發(fā)音時不知道如何調(diào)動發(fā)音單元肌肉,或者發(fā)音不當(dāng)導(dǎo)致發(fā)音錯誤。而在VR訓(xùn)練場景中,對于每個音節(jié)是如何發(fā)聲的都有對應(yīng)的三維口腔動作剖析圖,使患者更直觀地看到發(fā)聲單元工作狀態(tài),提高矯正的效率。
使用3Dsmax構(gòu)建虛擬演講環(huán)境,通過制作全景圖來模仿演講環(huán)境,包括觀眾及觀眾的表情、動作,給演講者制造緊張的氛圍,關(guān)鍵技術(shù)在于VR場景的創(chuàng)建以及語音分析,目前計劃可以通過拍攝全景圖或制作3D動畫來實現(xiàn)場景及人物的創(chuàng)建,而語音分析模塊預(yù)計達(dá)到的效果是可以通過演講者的演講情況,在合適的時間引起觀眾對應(yīng)的反應(yīng)。圖1是VR場景圖的創(chuàng)建流程圖。
圖1 場景圖創(chuàng)建流程
核心技術(shù)在于語音分析,通過患者的演講情況,包括:語言流暢度,字節(jié)重復(fù)頻率,字節(jié)間的時間停頓等信息來得到臺下觀眾的反饋,包括:語言、動作、神態(tài),在規(guī)定的時間內(nèi)口吃患者需要完成自我介紹、工作匯報、主題講話等任務(wù),同時屏幕上設(shè)置計時器,對口吃患者施加一定的壓力,有助于推進(jìn)康復(fù)進(jìn)度,在交互上,通過語音分析,在患者開口講話時,所有觀眾注視演講者,當(dāng)患者口吃率超過閾值時,臺下觀眾會表現(xiàn)失望不耐煩的表情,反之觀眾會微笑鼓掌。
在實際語音采集過程中,由于環(huán)境音及患者口吃間摩擦產(chǎn)生的噪音會不利于特征向量的提取,所以先對采集的語音數(shù)字信號進(jìn)行預(yù)處理,預(yù)處理流程圖如圖2所示。
圖2 語音信號預(yù)處理
為了提高準(zhǔn)確率,通過語音活動檢測(VAD)從患者輸入的語音數(shù)字信號流中識別并消除長時間的靜音期。通過中值濾波消除采集器的電沖激信號、患者口齒摩擦等外界噪聲,通過取分段數(shù)字信號中間向量的方法提高整體平滑度,便于提取特征值。
x(i)=Median[x(i-1),x(i),x(i+1)]
(1)
將中值濾波后的數(shù)字信號進(jìn)行歸一化處理,把數(shù)字信號映射到同一區(qū)間[-1,1],以消除聲音音幅大小不同對特征向量提取的影響。
x(i)=x(i)/max(x(0),x(1)…x(i))
(2)
為了對語音進(jìn)行分析,需要對聲音進(jìn)行分幀,因為聲音音節(jié)與音節(jié)之間具有很強過渡性,因此不能簡單地削減它。在這里用移動窗函數(shù)來實現(xiàn)它,幀之間通常有重疊,如圖3所示。每幀的長為20ms,兩幀之間20-10=15ms的重疊稱為移幀。
圖3 音頻信號分幀
為了使分幀之后的數(shù)字信號更加平滑,使用海明窗口,余弦窗口之一,在這里使用與其他窗函數(shù)相比,海明窗的加權(quán)系數(shù)可以使旁瓣更小,使處理后的數(shù)字信號更加平滑。海明窗函數(shù)如下:
(3)
為了準(zhǔn)確地提取梅爾倒譜系數(shù)(MFCC),通過快速傅里葉變換得到語音信號的DFT為:
(4)
為消除諧波的影響,在三角帶通濾波器對熱量譜進(jìn)行平滑處理,并算每一個濾波器輸出的對數(shù)能量s(m),通過離散余弦變換得到MFCC系數(shù):
(5)
口吃作為一種患者數(shù)量龐大、治療周期長且易復(fù)發(fā)、影響患者正常生活的語言類障礙,因患者口吃程度差異性較大,重視程度不同導(dǎo)致的治療不當(dāng),致使口吃矯正領(lǐng)域的治療手段長時間沒有突破性進(jìn)展,這也是口吃患者數(shù)量與治療矯正機(jī)構(gòu)數(shù)量嚴(yán)重失衡的主要原因之一。但隨著社會口吃患者數(shù)量的不斷增多,亟需一種口吃矯正手段可以便捷且高效地幫助口吃患者矯正口吃。在當(dāng)今社會科技迅速發(fā)展的前提下,利用沉浸式VR技術(shù)可以通過建立虛擬訓(xùn)練場景幫助患者訓(xùn)練,利用系統(tǒng)脫敏法,即把患者暴露在恐懼的事物之下,從輕微到重度刺激逐級遞增,最終使刺激失效。這既可以幫助患者達(dá)到矯正口吃的目的,也推動了言語治療領(lǐng)域新興治療手段的發(fā)展,使醫(yī)療領(lǐng)域與現(xiàn)代科技巧妙融合,不但讓患者擺脫了治療場地的限制,也可以通過VR設(shè)備實現(xiàn)不同場景的切換,滿足患者不同環(huán)境訓(xùn)練的需求,這種新興的治療手段也會吸引更多的口吃患者參與治療,幫助更多的口吃患者解決困擾生活的口吃難題,對口吃治療與言語治療領(lǐng)域的推動具有深遠(yuǎn)意義。