舒敏 張毅 蔣家琪
嗓音是言語(yǔ)交流的媒介,是人聲作用于聽(tīng)覺(jué)器官產(chǎn)生的一種主觀感受;靈敏的聽(tīng)力可能勝過(guò)許多精密的儀器,因此,盡管嗓音評(píng)估的客觀方法有很多,主觀評(píng)估仍被視為最能夠反映嗓音自然特征的方法,并被視作檢驗(yàn)嗓音客觀評(píng)估是否準(zhǔn)確的金標(biāo)準(zhǔn)[1,2]。日本言語(yǔ)醫(yī)學(xué)和嗓音醫(yī)學(xué)學(xué)會(huì)提出的GRBAS分級(jí)方法(Hirano,1981)是目前臨床上應(yīng)用最廣泛的嗓音主觀感知評(píng)價(jià)方法,然而,目前許多研究表明,其元音聲樣及離散分級(jí)方法需要進(jìn)一步改進(jìn)。美國(guó)言語(yǔ)及聽(tīng)力協(xié)會(huì)提出的CAPE-V分級(jí)標(biāo)準(zhǔn)使用特定語(yǔ)句,有效激發(fā)病理嗓音,結(jié)合非范疇響應(yīng)技術(shù)進(jìn)行主觀評(píng)估,在臨床上具有一定實(shí)用價(jià)值[3],但其測(cè)試語(yǔ)句為英文,并不適用于中文語(yǔ)言者。本研究擬通過(guò)對(duì)基于CAPE-V設(shè)計(jì)原則[4]建立的嗓音評(píng)估中文測(cè)試文本進(jìn)行信度和效度分析,包括評(píng)委自身穩(wěn)定性、評(píng)委間一致性以及與客觀聲學(xué)評(píng)估的一致性,探討該測(cè)試文本臨床應(yīng)用的可行性,以期為建立統(tǒng)一、標(biāo)準(zhǔn)的中文主觀評(píng)估系統(tǒng)提供參考。
1.1研究對(duì)象及分組 隨機(jī)選擇就診于復(fù)旦大學(xué)附屬眼耳鼻喉科醫(yī)院、以聲嘶為主要癥狀就診的患者196例(試驗(yàn)組),其中,男92例,年齡22~75歲,平均45.6±10.3歲,女104例,年齡18~69歲,平均40.9±9.6歲,具體病種及分布見(jiàn)表1。選擇無(wú)嗓音障礙病史、無(wú)咽喉疾患、無(wú)吸煙飲酒史、喉鏡檢查聲帶無(wú)明顯異常者24例作為對(duì)照組,其中,男10例,年齡29~58歲,平均33.9±9.0歲,女14例,年齡23~71歲,平均38.0±12.4歲。
表1 不同病理嗓音病種在試驗(yàn)組男、女性患者中的分布(例)
1.2主觀聽(tīng)覺(jué)評(píng)估 通過(guò)CSL(Computerized Speech Lab)應(yīng)用MDVP軟件進(jìn)行聲音樣本信號(hào)采集。方法:受試者口距麥克風(fēng)10 cm,囑其以舒適、自然的音調(diào)朗讀測(cè)試文本;遵照CAPE-V設(shè)計(jì)原則:①反映聲帶振動(dòng)功能;②反映聲門閉合情況;③激發(fā)輕松起聲;④激發(fā)硬起聲;⑤可評(píng)估鼻腔共鳴情況。本研究中已建立的中文測(cè)試文本如下:①大伯喜愛(ài)綠色植物;②湖里的荷花很好看;③我們能去哪里呢;④阿姨支持義務(wù)教育;⑤李麗拉我過(guò)馬路。使用Audition3軟件對(duì)所有嗓音樣本進(jìn)行歸一化處理,以避免不同聲強(qiáng)對(duì)評(píng)估者可能造成的判斷上的差異,同時(shí)避免評(píng)估者在評(píng)估過(guò)程中不斷調(diào)整音量。10位聽(tīng)評(píng)委為來(lái)自不同醫(yī)院的耳鼻喉科高年資醫(yī)生(工作年限>7年),對(duì)咽喉科疾病具有豐富的診療經(jīng)驗(yàn)。正式評(píng)估前,每位評(píng)委均接受“外部參考模式”培訓(xùn),以消除因“內(nèi)部參考模式”不同而引起的評(píng)委間差異性[1,5~8]。嗓音主觀聽(tīng)覺(jué)評(píng)估在各自安靜的辦公室環(huán)境中進(jìn)行,聽(tīng)取錄音過(guò)程中,評(píng)估者可反復(fù)聽(tīng)取錄音直至做出認(rèn)為正確的評(píng)價(jià),評(píng)估維度包括總體嚴(yán)重度、粗糙感、氣息聲和緊張感,評(píng)委將評(píng)估結(jié)果標(biāo)注在量尺上,量尺采用非范疇響應(yīng)技術(shù)及mVA分級(jí)標(biāo)準(zhǔn)[4,9](圖1),量尺全長(zhǎng)10 cm,起點(diǎn)為0,代表嗓音正常;1 cm處標(biāo)注MI,代表輕度障礙;5 cm處標(biāo)注MO,代表中度障礙;9 cm處標(biāo)注SE,代表重度障礙;終點(diǎn)為10 cm,代表極重度障礙,計(jì)分時(shí)不包含單位cm。為便于分組比較,將患者嗓音障礙嚴(yán)重程度按主觀評(píng)估得分劃分:0~4分為1級(jí)(輕度障礙);4~20分為2級(jí)(中度障礙);20~36分為3級(jí)(重度障礙);36~40分為4級(jí)(極重度障礙)。四個(gè)維度得分相加,得分越高則嗓音障礙越嚴(yán)重。
圖1 嗓音主觀評(píng)估量尺
1.3嗓音客觀聲學(xué)分析 囑受試者發(fā)元音/a/,每個(gè)元音發(fā)聲持續(xù)3秒鐘,共三次;取第二次發(fā)聲的聲音樣本的中間段(以中點(diǎn)為界,左右各取0.5 s,共1 s)用于聲學(xué)客觀分析。分析以下指標(biāo):
頻率微擾(jitter):是聲帶振動(dòng)周期在時(shí)間上差異的度量,結(jié)果用微擾百分?jǐn)?shù)(%)表示;振幅微擾(shimmer):是聲帶振動(dòng)周期在聲強(qiáng)上差異的度量,結(jié)果用振幅微擾百分?jǐn)?shù)(%)表示;信噪比(SNR):反映聲音波形中噪聲的含量;倒頻譜峰值突出(cepstral peak prominence, CPP):由于周期性聲音的頻譜在頻率上具有周期性,這個(gè)頻譜本身就可以被分析,這種對(duì)頻率進(jìn)行雙重處理分析的結(jié)果稱為倒頻譜。倒頻譜峰值突出是倒頻譜峰值與回歸線上該峰值點(diǎn)對(duì)應(yīng)的振幅值的比值,信號(hào)的周期性越高,CPP值亦越高。由于非周期性嗓音信號(hào)的倒頻譜圖峰值不突出,較為平坦,因而CPP值也較低。近期研究發(fā)現(xiàn),CPP與主觀分析結(jié)果高度相關(guān)[10~13]。關(guān)聯(lián)維(correlation dimension, D2)和二階墑(second-order entropy, K2):關(guān)聯(lián)維是一個(gè)用來(lái)測(cè)量相空間內(nèi)軌跡上兩點(diǎn)間關(guān)聯(lián)度的幾何參數(shù);二階墑是描述動(dòng)態(tài)系統(tǒng)隨時(shí)間其信息消失速率的參數(shù)。非線性分析相對(duì)于傳統(tǒng)的微擾分析,不需要準(zhǔn)確計(jì)算基頻,且對(duì)嗓音信號(hào)的長(zhǎng)度、采樣速率及嗓音的要求顯著低于微擾分析,在多項(xiàng)研究中顯示出了較微擾分析更高的有效性、可靠性和診斷效力,是分析病理嗓音信號(hào)較理想的工具。D2與K2值越大,表明嗓音信號(hào)的不規(guī)則性越高[14~17]。
1.4統(tǒng)計(jì)學(xué)方法 數(shù)據(jù)統(tǒng)計(jì)采用軟件SPSS 20 (IBM Corp),采用Pearson相關(guān)分析對(duì)評(píng)委自身穩(wěn)定性進(jìn)行評(píng)估;采用組內(nèi)相關(guān)系數(shù)(ICC)對(duì)評(píng)委間一致性進(jìn)行評(píng)估;主觀評(píng)估系統(tǒng)對(duì)正常與病理嗓音的區(qū)別作用采用受試者工作特征曲線(ROC曲線)下面積(AUC)分析,若AUC>0.5,說(shuō)明該系統(tǒng)具有一定診斷價(jià)值;主觀分析與客觀分析的一致性采用Pearson相關(guān)分析及單因素ANOVA分析,Pearson相關(guān)系數(shù)用r表示,r為0~0.3時(shí),兩者間的相關(guān)性較弱;r為0.3~0.7時(shí),兩者具有中等相關(guān)性;r為0.7~1.0時(shí),兩者強(qiáng)烈相關(guān)。P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
2.1主觀評(píng)估中文測(cè)試文本的信度分析 信度分析包括評(píng)委自身穩(wěn)定性及評(píng)委間一致性。共獲得275個(gè)聲音樣本,包括正常嗓音樣本24個(gè),病理嗓音樣本196個(gè),重復(fù)嗓音樣本55個(gè)。重復(fù)嗓音樣本是在正常嗓音和病理嗓音樣本中隨機(jī)選擇的,用于評(píng)估評(píng)委自身穩(wěn)定性,重復(fù)數(shù)據(jù)的比例占總研究對(duì)象的28%,與文獻(xiàn)報(bào)道一致[1],在總體嚴(yán)重度、粗糙感、氣息聲和緊張感四個(gè)維度中,評(píng)委們對(duì)粗糙感的評(píng)估穩(wěn)定性最高,相關(guān)系數(shù)均值為0.748;對(duì)緊張感的評(píng)估穩(wěn)定性較差,相關(guān)系數(shù)均值為0.687(表2)。
表2 10位評(píng)委4個(gè)評(píng)估維自身穩(wěn)定性評(píng)估Pearson相關(guān)系數(shù)(r值)均值及r>0.7的評(píng)委人數(shù)
10位評(píng)委對(duì)各個(gè)維度的評(píng)估一致性較高,在總體嚴(yán)重度上,組內(nèi)相關(guān)系數(shù)(ICC)為0.685,粗糙感為0.654,氣息感為0.589,緊張感為0.623。一般認(rèn)為ICC低于0.4表示信度較差,高于0.75表示信度良好。
2.2與既往主觀評(píng)估測(cè)試文本信度分析研究的結(jié)果比較 與Karnell[18]、Kelchner[19]和Zraick[3]已發(fā)表的研究結(jié)果進(jìn)行對(duì)比,各個(gè)研究及各個(gè)維度間的結(jié)果具有明顯差異 (表3)。
2.3嗓音主觀評(píng)估與聲學(xué)分析一致性評(píng)估 在10位評(píng)委中,除去一個(gè)最高值和一個(gè)最低值,取剩下值的平均值作為該維度的主觀評(píng)估得分,每例樣本的主觀評(píng)估得分為4個(gè)維度得分的總和。主觀評(píng)估與客觀分析一致性比較Pearson相關(guān)系數(shù)分析顯示,jitter(%)、shimmer(%)、SNR、CPP、D2、K2的r值分別為0.343(P<0.01)、0.469(P<0.01)、-0.665(P<0.01)、-0.557(P<0.01)、0.269(P<0.01)、-0.032(P>0.05),可見(jiàn),除K2之外,jitter(%)、shimmer(%)、SNR、CPP均與主觀評(píng)估有一定相關(guān)性,以SNR的相關(guān)性最強(qiáng)。將受試者的嗓音障礙程度按照主觀評(píng)估得分分為4級(jí),其聲學(xué)測(cè)試結(jié)果以單因素ANOVA進(jìn)行分析,結(jié)果表明,在所有客觀指標(biāo)上,不同等級(jí)間的嗓音聲學(xué)分析結(jié)果差異均具有統(tǒng)計(jì)學(xué)意義(P<0.01),嗓音障礙程度越重,則jitter(%)、shimmer(%)、D2、K2值越高,SNR、CPP值越低(表4)。
2.4主觀評(píng)估中文測(cè)試文本對(duì)正常嗓音和客觀嗓音的區(qū)別能力 在嗓音主觀評(píng)估的總體嚴(yán)重度、粗糙感、氣息聲、緊張感各維度中,總體嚴(yán)重度的ROC曲線下面積(AUC)為0.948,粗糙感為0.96,氣息聲為0.949,緊張感為0.96,均大于0.5,提示該文本對(duì)正常嗓音及病理嗓音的鑒別能力良好。
表3 各主觀評(píng)估測(cè)試文本信度分析研究的結(jié)果比較
注: G=總體嚴(yán)重度; R=粗糙度; B=氣息聲; S=緊張感;rs: Spearman 相關(guān)系數(shù); ICC:組內(nèi)相關(guān)系數(shù);r:Pearson 相關(guān)系數(shù)
表4 主觀評(píng)估不同程度嗓音障礙者的嗓音聲學(xué)分析結(jié)果比較
注:*D2和K2值趨向于無(wú)窮,無(wú)法計(jì)算。**G0~G2之間比較
嗓音障礙表現(xiàn)為聲音的音高、音強(qiáng)和音質(zhì)發(fā)生變化,又可表現(xiàn)為嘶啞、粗糙、氣息聲以及共鳴障礙。音高及音強(qiáng)的變化可通過(guò)客觀分析儀器定量評(píng)估,主觀評(píng)估對(duì)音質(zhì)障礙的感知更具優(yōu)勢(shì)。本研究已建立的測(cè)試語(yǔ)句以激發(fā)病理性嗓音、獲取不同的喉部行為和臨床癥狀為目的,語(yǔ)句1“大伯喜愛(ài)綠色植物”包括所有常用單元音,且均為一個(gè)聲母加一個(gè)韻母的二音素單字或僅以雙元音作為一個(gè)音節(jié)的單字;該設(shè)計(jì)可最大程度的延長(zhǎng)元音發(fā)音,使元音發(fā)音清晰可辨;語(yǔ)句2“湖里的荷花很好看”多采用以/h/開頭的漢字,用來(lái)評(píng)估軟起聲的發(fā)聲方式;語(yǔ)句3“我們能去哪里呢”采用的漢字多包含鼻音/m/或/n/,用于評(píng)估鼻腔共鳴的情況;語(yǔ)句4“阿姨支持義務(wù)教育”以元音開頭的漢字易激發(fā)硬起聲,該句用于評(píng)估硬起聲方式。另外,采用喉塞音評(píng)估聲門閉合情況。喉塞音是通過(guò)阻礙空氣在聲腔流動(dòng)來(lái)發(fā)音,由于發(fā)音部位在聲門,因此通過(guò)聲門閉塞而發(fā)音。由于日常漢語(yǔ)中缺少獨(dú)立的喉塞音漢字,本研究采用第四聲調(diào)的元音模擬喉塞音;語(yǔ)句5“李麗拉我過(guò)馬路”由濁輔音和元音組成的漢字,用來(lái)考察聲帶振動(dòng)情況。本研究結(jié)果顯示,評(píng)委自身穩(wěn)定性及評(píng)委間一致性均較高,但對(duì)緊張感的評(píng)估穩(wěn)定性與一致性最差,這與Karnell[18]、Kelchner[19]和Zraick[3]等三人的研究結(jié)果一致。Kelchner[19]認(rèn)為造成此結(jié)果的原因在于,發(fā)音緊張的患者除了聲音上具有能被感受到的特征外,更重要的是喉部肌肉在發(fā)音時(shí)也具有極大的張力,而這一點(diǎn)是無(wú)法通過(guò)聲音感知的,使得評(píng)估者無(wú)法作出正確的判斷。本研究共招募嗓音障礙患者196名,用于主觀分析的嗓音樣本為275個(gè),10位經(jīng)驗(yàn)豐富的臨床醫(yī)生應(yīng)邀參與了主觀評(píng)估工作;而在上述三項(xiàng)研究中,評(píng)估者3~21名不等,用于分析的嗓音樣本則均少于60個(gè)。一般認(rèn)為,樣本量越大,評(píng)估者越多,變異性就越大[20,21],而本研究所檢驗(yàn)的中文測(cè)試文本在評(píng)委自身穩(wěn)定性和評(píng)委間一致性方面與其他測(cè)試文本相近,部分維度甚至優(yōu)于其他量表,表明該評(píng)估系統(tǒng)具有較高的可信度。
嗓音的自然特性決定了主觀評(píng)估作為檢驗(yàn)客觀分析有效性的參考方法[22],而從另一方面看,客觀評(píng)估指標(biāo)與主觀評(píng)估結(jié)果的高度一致性亦在多項(xiàng)研究中被驗(yàn)證,從這一點(diǎn)來(lái)說(shuō),客觀評(píng)估有助于交叉驗(yàn)證主觀評(píng)估的正確性。本研究結(jié)果顯示,所設(shè)計(jì)的中文測(cè)試文本主觀評(píng)估值與客觀分析值高度相關(guān),具有較高的校標(biāo)效度;主客觀相關(guān)性最高的客觀指標(biāo)為信噪比(r=0.668),其次為倒頻譜分析參數(shù)CPP(r=-0.557),該結(jié)果與文獻(xiàn)報(bào)道[12,15]一致。非線性動(dòng)力學(xué)分析有助于定性定量地描述非周期性信號(hào),然而在本研究中,D2和K2值與嗓音障礙程度相關(guān)性較其他客觀指標(biāo)低;Awan[23]的研究中也得出同樣的結(jié)果。可能的原因?yàn)?,在非周期性嗓音樣本中,存在一類高隨機(jī)性、具有白噪音特征的第四類嗓音信號(hào)[24],計(jì)算這類信號(hào)D2和K2值的曲線無(wú)法聚攏,而使得關(guān)聯(lián)維值趨向于無(wú)窮,無(wú)法量化嗓音的嚴(yán)重程度,從而降低了與主觀評(píng)估的關(guān)聯(lián)度。
本研究結(jié)果顯示,對(duì)于不同程度嗓音障礙者的嗓音樣本的客觀聲學(xué)分析值也有明顯差異,大多數(shù)指標(biāo)[jitter(%)、 shimmer(%)、SNR、 CPP]在相鄰等級(jí)間的差異顯著(P<0.01);在重度障礙的嗓音組中,部分樣本由于高度不規(guī)則,無(wú)法定量計(jì)算D2和K2值,因此僅在正常嗓音、輕度障礙嗓音和中度障礙嗓音之間進(jìn)行比較,顯示相鄰等級(jí)間存在差異(P<0.05)。雖然重度障礙嗓音不能通過(guò)測(cè)量D2和K2值定量分析,但是從定性分析的角度看,重度嗓音障礙與其他等級(jí)的嗓音障礙間存在明顯差異,因此,可以看出,本研究設(shè)計(jì)的中文測(cè)試文本對(duì)不同程度嗓音障礙的分辨率良好,具有較好的區(qū)分效度。
受試者特征曲線(ROC)及曲線下面積(AUC)用來(lái)分析量表區(qū)別正常與病理嗓音的能力[25,26],曲線越靠近左上角,說(shuō)明模型的預(yù)測(cè)力越強(qiáng)。在AUC>0.5的情況下,AUC越接近于1,說(shuō)明診斷效果越好。AUC在0.5~0.7時(shí)有較低準(zhǔn)確性,AUC在0.7~0.9時(shí)有一定準(zhǔn)確性,AUC在0.9以上時(shí)有較高準(zhǔn)確性。本研究中,每個(gè)維度的AUC均在0.95左右及以上,說(shuō)明應(yīng)用該主觀評(píng)估測(cè)試文本,研究者能夠準(zhǔn)確區(qū)分正常與病理嗓音的概率在95%及以上,結(jié)果令人滿意。
本研究通過(guò)對(duì)所設(shè)計(jì)的主觀評(píng)估中文測(cè)試文本進(jìn)行信度和效度分析,結(jié)果表明,該測(cè)試文本具有較高的信度以及區(qū)分效度和校標(biāo)效度,與國(guó)外文獻(xiàn)相比,本測(cè)試文本的信度亦優(yōu)于或相似于其他測(cè)試文本,具有潛在臨床應(yīng)用價(jià)值。不足之處在于,缺乏與國(guó)內(nèi)目前使用的朗讀文本及主觀評(píng)估量表的比較,有待今后進(jìn)一步研究。