亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

嗓音主觀評(píng)估中文測(cè)試文本的信度和效度研究*

2020-01-18 03:19:10舒敏張毅蔣家琪

聽(tīng)力學(xué)及言語(yǔ)疾病雜志 2020年1期

關(guān)鍵詞：文本分析

舒敏張毅蔣家琪

嗓音是言語(yǔ)交流的媒介，是人聲作用于聽(tīng)覺(jué)器官產(chǎn)生的一種主觀感受；靈敏的聽(tīng)力可能勝過(guò)許多精密的儀器，因此，盡管嗓音評(píng)估的客觀方法有很多，主觀評(píng)估仍被視為最能夠反映嗓音自然特征的方法，并被視作檢驗(yàn)嗓音客觀評(píng)估是否準(zhǔn)確的金標(biāo)準(zhǔn)[1,2]。日本言語(yǔ)醫(yī)學(xué)和嗓音醫(yī)學(xué)學(xué)會(huì)提出的GRBAS分級(jí)方法(Hirano,1981)是目前臨床上應(yīng)用最廣泛的嗓音主觀感知評(píng)價(jià)方法，然而，目前許多研究表明，其元音聲樣及離散分級(jí)方法需要進(jìn)一步改進(jìn)。美國(guó)言語(yǔ)及聽(tīng)力協(xié)會(huì)提出的CAPE-V分級(jí)標(biāo)準(zhǔn)使用特定語(yǔ)句，有效激發(fā)病理嗓音，結(jié)合非范疇響應(yīng)技術(shù)進(jìn)行主觀評(píng)估，在臨床上具有一定實(shí)用價(jià)值[3]，但其測(cè)試語(yǔ)句為英文，并不適用于中文語(yǔ)言者。本研究擬通過(guò)對(duì)基于CAPE-V設(shè)計(jì)原則[4]建立的嗓音評(píng)估中文測(cè)試文本進(jìn)行信度和效度分析，包括評(píng)委自身穩(wěn)定性、評(píng)委間一致性以及與客觀聲學(xué)評(píng)估的一致性，探討該測(cè)試文本臨床應(yīng)用的可行性，以期為建立統(tǒng)一、標(biāo)準(zhǔn)的中文主觀評(píng)估系統(tǒng)提供參考。

1 資料與方法

1.1研究對(duì)象及分組隨機(jī)選擇就診于復(fù)旦大學(xué)附屬眼耳鼻喉科醫(yī)院、以聲嘶為主要癥狀就診的患者196例(試驗(yàn)組)，其中，男92例，年齡22～75歲，平均45.6±10.3歲，女104例，年齡18～69歲，平均40.9±9.6歲，具體病種及分布見(jiàn)表1。選擇無(wú)嗓音障礙病史、無(wú)咽喉疾患、無(wú)吸煙飲酒史、喉鏡檢查聲帶無(wú)明顯異常者24例作為對(duì)照組,其中，男10例，年齡29～58歲，平均33.9±9.0歲，女14例，年齡23～71歲，平均38.0±12.4歲。

表1 不同病理嗓音病種在試驗(yàn)組男、女性患者中的分布(例)

1.2主觀聽(tīng)覺(jué)評(píng)估通過(guò)CSL(Computerized Speech Lab)應(yīng)用MDVP軟件進(jìn)行聲音樣本信號(hào)采集。方法：受試者口距麥克風(fēng)10 cm，囑其以舒適、自然的音調(diào)朗讀測(cè)試文本；遵照CAPE-V設(shè)計(jì)原則：①反映聲帶振動(dòng)功能；②反映聲門閉合情況；③激發(fā)輕松起聲；④激發(fā)硬起聲；⑤可評(píng)估鼻腔共鳴情況。本研究中已建立的中文測(cè)試文本如下：①大伯喜愛(ài)綠色植物；②湖里的荷花很好看；③我們能去哪里呢；④阿姨支持義務(wù)教育；⑤李麗拉我過(guò)馬路。使用Audition3軟件對(duì)所有嗓音樣本進(jìn)行歸一化處理，以避免不同聲強(qiáng)對(duì)評(píng)估者可能造成的判斷上的差異，同時(shí)避免評(píng)估者在評(píng)估過(guò)程中不斷調(diào)整音量。10位聽(tīng)評(píng)委為來(lái)自不同醫(yī)院的耳鼻喉科高年資醫(yī)生(工作年限>7年)，對(duì)咽喉科疾病具有豐富的診療經(jīng)驗(yàn)。正式評(píng)估前，每位評(píng)委均接受“外部參考模式”培訓(xùn)，以消除因“內(nèi)部參考模式”不同而引起的評(píng)委間差異性[1，5～8]。嗓音主觀聽(tīng)覺(jué)評(píng)估在各自安靜的辦公室環(huán)境中進(jìn)行，聽(tīng)取錄音過(guò)程中，評(píng)估者可反復(fù)聽(tīng)取錄音直至做出認(rèn)為正確的評(píng)價(jià)，評(píng)估維度包括總體嚴(yán)重度、粗糙感、氣息聲和緊張感，評(píng)委將評(píng)估結(jié)果標(biāo)注在量尺上，量尺采用非范疇響應(yīng)技術(shù)及mVA分級(jí)標(biāo)準(zhǔn)[4,9](圖1)，量尺全長(zhǎng)10 cm，起點(diǎn)為0，代表嗓音正常；1 cm處標(biāo)注MI，代表輕度障礙；5 cm處標(biāo)注MO，代表中度障礙；9 cm處標(biāo)注SE，代表重度障礙；終點(diǎn)為10 cm，代表極重度障礙，計(jì)分時(shí)不包含單位cm。為便于分組比較，將患者嗓音障礙嚴(yán)重程度按主觀評(píng)估得分劃分：0～4分為1級(jí)(輕度障礙)；4～20分為2級(jí)(中度障礙)；20～36分為3級(jí)(重度障礙)；36～40分為4級(jí)(極重度障礙)。四個(gè)維度得分相加，得分越高則嗓音障礙越嚴(yán)重。

圖1 嗓音主觀評(píng)估量尺

1.3嗓音客觀聲學(xué)分析囑受試者發(fā)元音/a/，每個(gè)元音發(fā)聲持續(xù)3秒鐘，共三次；取第二次發(fā)聲的聲音樣本的中間段(以中點(diǎn)為界，左右各取0.5 s，共1 s)用于聲學(xué)客觀分析。分析以下指標(biāo)：

頻率微擾(jitter)：是聲帶振動(dòng)周期在時(shí)間上差異的度量，結(jié)果用微擾百分?jǐn)?shù)(%)表示；振幅微擾(shimmer)：是聲帶振動(dòng)周期在聲強(qiáng)上差異的度量，結(jié)果用振幅微擾百分?jǐn)?shù)(%)表示；信噪比(SNR)：反映聲音波形中噪聲的含量；倒頻譜峰值突出(cepstral peak prominence, CPP)：由于周期性聲音的頻譜在頻率上具有周期性，這個(gè)頻譜本身就可以被分析，這種對(duì)頻率進(jìn)行雙重處理分析的結(jié)果稱為倒頻譜。倒頻譜峰值突出是倒頻譜峰值與回歸線上該峰值點(diǎn)對(duì)應(yīng)的振幅值的比值，信號(hào)的周期性越高，CPP值亦越高。由于非周期性嗓音信號(hào)的倒頻譜圖峰值不突出，較為平坦，因而CPP值也較低。近期研究發(fā)現(xiàn)，CPP與主觀分析結(jié)果高度相關(guān)[10～13]。關(guān)聯(lián)維(correlation dimension, D2)和二階墑(second-order entropy, K2)：關(guān)聯(lián)維是一個(gè)用來(lái)測(cè)量相空間內(nèi)軌跡上兩點(diǎn)間關(guān)聯(lián)度的幾何參數(shù)；二階墑是描述動(dòng)態(tài)系統(tǒng)隨時(shí)間其信息消失速率的參數(shù)。非線性分析相對(duì)于傳統(tǒng)的微擾分析，不需要準(zhǔn)確計(jì)算基頻，且對(duì)嗓音信號(hào)的長(zhǎng)度、采樣速率及嗓音的要求顯著低于微擾分析，在多項(xiàng)研究中顯示出了較微擾分析更高的有效性、可靠性和診斷效力，是分析病理嗓音信號(hào)較理想的工具。D2與K2值越大，表明嗓音信號(hào)的不規(guī)則性越高[14～17]。

1.4統(tǒng)計(jì)學(xué)方法數(shù)據(jù)統(tǒng)計(jì)采用軟件SPSS 20 (IBM Corp)，采用Pearson相關(guān)分析對(duì)評(píng)委自身穩(wěn)定性進(jìn)行評(píng)估；采用組內(nèi)相關(guān)系數(shù)(ICC)對(duì)評(píng)委間一致性進(jìn)行評(píng)估；主觀評(píng)估系統(tǒng)對(duì)正常與病理嗓音的區(qū)別作用采用受試者工作特征曲線(ROC曲線)下面積(AUC)分析，若AUC>0.5，說(shuō)明該系統(tǒng)具有一定診斷價(jià)值；主觀分析與客觀分析的一致性采用Pearson相關(guān)分析及單因素ANOVA分析，Pearson相關(guān)系數(shù)用r表示，r為0～0.3時(shí)，兩者間的相關(guān)性較弱；r為0.3～0.7時(shí)，兩者具有中等相關(guān)性；r為0.7～1.0時(shí)，兩者強(qiáng)烈相關(guān)。P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。

2 結(jié)果

2.1主觀評(píng)估中文測(cè)試文本的信度分析信度分析包括評(píng)委自身穩(wěn)定性及評(píng)委間一致性。共獲得275個(gè)聲音樣本，包括正常嗓音樣本24個(gè)，病理嗓音樣本196個(gè)，重復(fù)嗓音樣本55個(gè)。重復(fù)嗓音樣本是在正常嗓音和病理嗓音樣本中隨機(jī)選擇的，用于評(píng)估評(píng)委自身穩(wěn)定性，重復(fù)數(shù)據(jù)的比例占總研究對(duì)象的28%，與文獻(xiàn)報(bào)道一致[1]，在總體嚴(yán)重度、粗糙感、氣息聲和緊張感四個(gè)維度中，評(píng)委們對(duì)粗糙感的評(píng)估穩(wěn)定性最高，相關(guān)系數(shù)均值為0.748；對(duì)緊張感的評(píng)估穩(wěn)定性較差，相關(guān)系數(shù)均值為0.687(表2)。

表2 10位評(píng)委4個(gè)評(píng)估維自身穩(wěn)定性評(píng)估Pearson相關(guān)系數(shù)(r值)均值及r>0.7的評(píng)委人數(shù)

10位評(píng)委對(duì)各個(gè)維度的評(píng)估一致性較高，在總體嚴(yán)重度上，組內(nèi)相關(guān)系數(shù)(ICC)為0.685，粗糙感為0.654，氣息感為0.589，緊張感為0.623。一般認(rèn)為ICC低于0.4表示信度較差，高于0.75表示信度良好。

2.2與既往主觀評(píng)估測(cè)試文本信度分析研究的結(jié)果比較與Karnell[18]、Kelchner[19]和Zraick[3]已發(fā)表的研究結(jié)果進(jìn)行對(duì)比，各個(gè)研究及各個(gè)維度間的結(jié)果具有明顯差異 (表3)。

2.3嗓音主觀評(píng)估與聲學(xué)分析一致性評(píng)估在10位評(píng)委中，除去一個(gè)最高值和一個(gè)最低值，取剩下值的平均值作為該維度的主觀評(píng)估得分，每例樣本的主觀評(píng)估得分為4個(gè)維度得分的總和。主觀評(píng)估與客觀分析一致性比較Pearson相關(guān)系數(shù)分析顯示，jitter(%)、shimmer(%)、SNR、CPP、D2、K2的r值分別為0.343(P<0.01)、0.469(P<0.01)、-0.665(P<0.01)、-0.557(P<0.01)、0.269(P<0.01)、-0.032(P>0.05)，可見(jiàn)，除K2之外，jitter(%)、shimmer(%)、SNR、CPP均與主觀評(píng)估有一定相關(guān)性，以SNR的相關(guān)性最強(qiáng)。將受試者的嗓音障礙程度按照主觀評(píng)估得分分為4級(jí)，其聲學(xué)測(cè)試結(jié)果以單因素ANOVA進(jìn)行分析，結(jié)果表明，在所有客觀指標(biāo)上，不同等級(jí)間的嗓音聲學(xué)分析結(jié)果差異均具有統(tǒng)計(jì)學(xué)意義(P<0.01)，嗓音障礙程度越重，則jitter(%)、shimmer(%)、D2、K2值越高，SNR、CPP值越低(表4)。

2.4主觀評(píng)估中文測(cè)試文本對(duì)正常嗓音和客觀嗓音的區(qū)別能力在嗓音主觀評(píng)估的總體嚴(yán)重度、粗糙感、氣息聲、緊張感各維度中，總體嚴(yán)重度的ROC曲線下面積(AUC)為0.948，粗糙感為0.96，氣息聲為0.949，緊張感為0.96，均大于0.5，提示該文本對(duì)正常嗓音及病理嗓音的鑒別能力良好。

表3 各主觀評(píng)估測(cè)試文本信度分析研究的結(jié)果比較

注: G=總體嚴(yán)重度; R=粗糙度; B=氣息聲; S=緊張感;rs: Spearman 相關(guān)系數(shù); ICC:組內(nèi)相關(guān)系數(shù);r:Pearson 相關(guān)系數(shù)

表4 主觀評(píng)估不同程度嗓音障礙者的嗓音聲學(xué)分析結(jié)果比較

注：*D2和K2值趨向于無(wú)窮，無(wú)法計(jì)算。**G0～G2之間比較

3 討論

嗓音障礙表現(xiàn)為聲音的音高、音強(qiáng)和音質(zhì)發(fā)生變化，又可表現(xiàn)為嘶啞、粗糙、氣息聲以及共鳴障礙。音高及音強(qiáng)的變化可通過(guò)客觀分析儀器定量評(píng)估，主觀評(píng)估對(duì)音質(zhì)障礙的感知更具優(yōu)勢(shì)。本研究已建立的測(cè)試語(yǔ)句以激發(fā)病理性嗓音、獲取不同的喉部行為和臨床癥狀為目的，語(yǔ)句1“大伯喜愛(ài)綠色植物”包括所有常用單元音，且均為一個(gè)聲母加一個(gè)韻母的二音素單字或僅以雙元音作為一個(gè)音節(jié)的單字；該設(shè)計(jì)可最大程度的延長(zhǎng)元音發(fā)音，使元音發(fā)音清晰可辨；語(yǔ)句2“湖里的荷花很好看”多采用以/h/開頭的漢字，用來(lái)評(píng)估軟起聲的發(fā)聲方式；語(yǔ)句3“我們能去哪里呢”采用的漢字多包含鼻音/m/或/n/，用于評(píng)估鼻腔共鳴的情況；語(yǔ)句4“阿姨支持義務(wù)教育”以元音開頭的漢字易激發(fā)硬起聲，該句用于評(píng)估硬起聲方式。另外，采用喉塞音評(píng)估聲門閉合情況。喉塞音是通過(guò)阻礙空氣在聲腔流動(dòng)來(lái)發(fā)音，由于發(fā)音部位在聲門，因此通過(guò)聲門閉塞而發(fā)音。由于日常漢語(yǔ)中缺少獨(dú)立的喉塞音漢字，本研究采用第四聲調(diào)的元音模擬喉塞音；語(yǔ)句5“李麗拉我過(guò)馬路”由濁輔音和元音組成的漢字，用來(lái)考察聲帶振動(dòng)情況。本研究結(jié)果顯示，評(píng)委自身穩(wěn)定性及評(píng)委間一致性均較高，但對(duì)緊張感的評(píng)估穩(wěn)定性與一致性最差，這與Karnell[18]、Kelchner[19]和Zraick[3]等三人的研究結(jié)果一致。Kelchner[19]認(rèn)為造成此結(jié)果的原因在于，發(fā)音緊張的患者除了聲音上具有能被感受到的特征外，更重要的是喉部肌肉在發(fā)音時(shí)也具有極大的張力，而這一點(diǎn)是無(wú)法通過(guò)聲音感知的，使得評(píng)估者無(wú)法作出正確的判斷。本研究共招募嗓音障礙患者196名，用于主觀分析的嗓音樣本為275個(gè)，10位經(jīng)驗(yàn)豐富的臨床醫(yī)生應(yīng)邀參與了主觀評(píng)估工作；而在上述三項(xiàng)研究中，評(píng)估者3～21名不等，用于分析的嗓音樣本則均少于60個(gè)。一般認(rèn)為，樣本量越大，評(píng)估者越多，變異性就越大[20,21]，而本研究所檢驗(yàn)的中文測(cè)試文本在評(píng)委自身穩(wěn)定性和評(píng)委間一致性方面與其他測(cè)試文本相近，部分維度甚至優(yōu)于其他量表，表明該評(píng)估系統(tǒng)具有較高的可信度。

嗓音的自然特性決定了主觀評(píng)估作為檢驗(yàn)客觀分析有效性的參考方法[22]，而從另一方面看，客觀評(píng)估指標(biāo)與主觀評(píng)估結(jié)果的高度一致性亦在多項(xiàng)研究中被驗(yàn)證，從這一點(diǎn)來(lái)說(shuō)，客觀評(píng)估有助于交叉驗(yàn)證主觀評(píng)估的正確性。本研究結(jié)果顯示，所設(shè)計(jì)的中文測(cè)試文本主觀評(píng)估值與客觀分析值高度相關(guān)，具有較高的校標(biāo)效度；主客觀相關(guān)性最高的客觀指標(biāo)為信噪比(r=0.668)，其次為倒頻譜分析參數(shù)CPP(r=-0.557)，該結(jié)果與文獻(xiàn)報(bào)道[12,15]一致。非線性動(dòng)力學(xué)分析有助于定性定量地描述非周期性信號(hào)，然而在本研究中，D2和K2值與嗓音障礙程度相關(guān)性較其他客觀指標(biāo)低；Awan[23]的研究中也得出同樣的結(jié)果。可能的原因?yàn)?，在非周期性嗓音樣本中，存在一類高隨機(jī)性、具有白噪音特征的第四類嗓音信號(hào)[24]，計(jì)算這類信號(hào)D2和K2值的曲線無(wú)法聚攏，而使得關(guān)聯(lián)維值趨向于無(wú)窮，無(wú)法量化嗓音的嚴(yán)重程度，從而降低了與主觀評(píng)估的關(guān)聯(lián)度。

本研究結(jié)果顯示，對(duì)于不同程度嗓音障礙者的嗓音樣本的客觀聲學(xué)分析值也有明顯差異，大多數(shù)指標(biāo)[jitter(%)、 shimmer(%)、SNR、 CPP]在相鄰等級(jí)間的差異顯著(P<0.01)；在重度障礙的嗓音組中，部分樣本由于高度不規(guī)則，無(wú)法定量計(jì)算D2和K2值，因此僅在正常嗓音、輕度障礙嗓音和中度障礙嗓音之間進(jìn)行比較，顯示相鄰等級(jí)間存在差異(P<0.05)。雖然重度障礙嗓音不能通過(guò)測(cè)量D2和K2值定量分析，但是從定性分析的角度看，重度嗓音障礙與其他等級(jí)的嗓音障礙間存在明顯差異，因此，可以看出，本研究設(shè)計(jì)的中文測(cè)試文本對(duì)不同程度嗓音障礙的分辨率良好，具有較好的區(qū)分效度。

受試者特征曲線(ROC)及曲線下面積(AUC)用來(lái)分析量表區(qū)別正常與病理嗓音的能力[25,26]，曲線越靠近左上角，說(shuō)明模型的預(yù)測(cè)力越強(qiáng)。在AUC>0.5的情況下，AUC越接近于1，說(shuō)明診斷效果越好。AUC在0.5～0.7時(shí)有較低準(zhǔn)確性，AUC在0.7～0.9時(shí)有一定準(zhǔn)確性，AUC在0.9以上時(shí)有較高準(zhǔn)確性。本研究中，每個(gè)維度的AUC均在0.95左右及以上，說(shuō)明應(yīng)用該主觀評(píng)估測(cè)試文本，研究者能夠準(zhǔn)確區(qū)分正常與病理嗓音的概率在95%及以上，結(jié)果令人滿意。

本研究通過(guò)對(duì)所設(shè)計(jì)的主觀評(píng)估中文測(cè)試文本進(jìn)行信度和效度分析，結(jié)果表明，該測(cè)試文本具有較高的信度以及區(qū)分效度和校標(biāo)效度，與國(guó)外文獻(xiàn)相比，本測(cè)試文本的信度亦優(yōu)于或相似于其他測(cè)試文本，具有潛在臨床應(yīng)用價(jià)值。不足之處在于，缺乏與國(guó)內(nèi)目前使用的朗讀文本及主觀評(píng)估量表的比較，有待今后進(jìn)一步研究。