高少華 盧紅云 韓立文 周靜 Kim HaKyung
2000年Wutys等[1]構(gòu)建了嗓音障礙嚴(yán)重程度指數(shù)(dysphonia severity index, DSI),其為一種基于音域圖、空氣動(dòng)力學(xué)和聲學(xué)測(cè)量的反映整體發(fā)聲質(zhì)量的多維測(cè)量指標(biāo),其公式為:DSI=0.13×MPT(s)+0.005 3×F0-High(Hz)-0.26×I-Low(dB)-1.18×jitter(%)+12.4(其中,MPT為最長(zhǎng)聲時(shí),F(xiàn)0-High為最高基頻,I-Low為最低強(qiáng)度,jitter為基頻微擾)。2001年,歐洲喉科學(xué)會(huì)將其制定為嗓音障礙客觀參數(shù)的金標(biāo)準(zhǔn)。在該指數(shù)的臨床應(yīng)用過程中,有研究者指出不同測(cè)量設(shè)備的精度和算法差異會(huì)導(dǎo)致DSI的差異。2012年,Aichinger等[2]比較了LingWAVES和DiVAS設(shè)備所測(cè)的DSI數(shù)據(jù),發(fā)現(xiàn)數(shù)值存在顯著差異。2017年Maryn等[3]探討了語音分析軟件Praat測(cè)量DSI指數(shù)的可行性,并將其與美國(guó)Kay PENTAX公司的音域圖(voice range profile,VRP,顯示個(gè)體發(fā)聲壓級(jí)度和基頻范圍)和多維嗓音分析軟件(multi-dimensional voice program,MDVP,提供三十余項(xiàng)嗓音參數(shù)數(shù)據(jù))測(cè)得的數(shù)值進(jìn)行比較,發(fā)現(xiàn)兩種設(shè)備測(cè)得的DSI值高度相關(guān)。
Dr.Speech(DRS)軟件是國(guó)內(nèi)常用的言語評(píng)估與矯治設(shè)備之一,但以單參數(shù)測(cè)量為主,暫無DSI多參數(shù)測(cè)量功能;而目前嗓音的評(píng)估主要依賴于喉鏡檢查和主觀評(píng)估。主觀評(píng)估中,除了被視為嗓音主觀感知評(píng)估的GRBAS分級(jí)外,應(yīng)用最廣泛的還有嗓音障礙指數(shù)量表(voice handicap index,VHI),前者是基于專家的聽感知評(píng)估,后者則是基于患者對(duì)自身嗓音質(zhì)量的感知和評(píng)價(jià)。本研究通過建立DSIDRS函數(shù)模型,將其與GRBAS分級(jí)的總嘶啞度(G分級(jí))進(jìn)行比較,驗(yàn)證其有效性;并同時(shí)運(yùn)用DRS軟件和Praat軟件進(jìn)行DSI測(cè)量并比較結(jié)果,以檢驗(yàn)兩組測(cè)試軟件間一致性;最后,進(jìn)行DSIDRS與VHI之間的相關(guān)性分析,以更進(jìn)一步評(píng)估DRS軟件測(cè)量DSIDRS的準(zhǔn)確性。本研究同時(shí)納入嗓音健康人和嗓音疾病患者,以獲取不同等級(jí)音質(zhì)的數(shù)據(jù)結(jié)果,并對(duì)音質(zhì)分級(jí)進(jìn)行交叉驗(yàn)證,旨在探討DRS軟件用于DSI測(cè)量的可行性。
1.1研究對(duì)象 選取2019年1月至3月在上海交通大學(xué)附屬第九人民醫(yī)院耳鼻喉科確診為嗓音疾病的患者55例以及嗓音正常成人(為患者家屬及志愿者)21例為研究對(duì)象,共76例受試者,年齡18~74歲,平均41.34±10.83歲,男35例,女41例。
排除標(biāo)準(zhǔn):存在認(rèn)知功能障礙;存在因器質(zhì)性疾病導(dǎo)致的構(gòu)音不清;測(cè)試期間存在感冒、呼吸道感染等影響發(fā)音的疾病。
確保所有受試者為自愿參與本研究,本研究經(jīng)過寧波衛(wèi)生職業(yè)技術(shù)學(xué)院倫理委員會(huì)及華東師范大學(xué)人體實(shí)驗(yàn)倫理委員會(huì)審查批準(zhǔn)(批準(zhǔn)號(hào)HR183-2017)。
1.2研究方法
1.2.1嗓音聲學(xué)分析及DSI測(cè)試 使用DRS軟件(上海泰億格康復(fù)醫(yī)療科技股份有限公司)和Praat語音分析軟件(荷蘭阿姆斯特丹大學(xué)語音科學(xué)實(shí)驗(yàn)室)同時(shí)錄制和分析嗓音各項(xiàng)指標(biāo)。DRS軟件中的實(shí)時(shí)言語分析軟件和嗓音評(píng)估分析軟件用于錄制和分析嗓音樣本,軟件連接低通濾波器,設(shè)置采樣頻率44 100 Hz、16 bits[4];Praat軟件內(nèi)置于HP envy13-AD109TU筆記本電腦,連接同一型號(hào)的低通濾波器,并設(shè)置采樣頻率44 100 Hz、16 bits;兩臺(tái)Shure-SV100C動(dòng)圈式麥克風(fēng)分別連接DRS和Praat設(shè)備,以10 cm距離平行放置,水平傾斜45°角,并保持錄制嗓音時(shí)保持發(fā)音者口部距離麥克風(fēng)10~15 cm。錄音前,指導(dǎo)受試者如何正確發(fā)聲,最長(zhǎng)聲時(shí)(maximum phonation time,MPT)錄制要求受試者以自然舒適的音調(diào)和響度發(fā)元音/a/三次,最長(zhǎng)的一次將用于DSI計(jì)算;最高基頻(Highest F0,HF0)和最低強(qiáng)度(lowest intensity,LI)測(cè)量分別要求受試者以自然舒適的音調(diào)和響度發(fā)元音/a/,再逐漸過渡到最高或最低音調(diào)和響度發(fā)/a/,每例受試者的HF0和LI均分別錄制3次,取最高音調(diào)和最低強(qiáng)度用于DSI計(jì)算;要求受試者以舒適自然的音調(diào)和響度持續(xù)發(fā)元音/a/3~5秒,取每段音頻中間的1~2秒分析基頻微擾(jitter),每例對(duì)象的jitter均錄制3次,取3次的均值用于DSI計(jì)算。
聲壓級(jí)校準(zhǔn)與jitter算法的篩選:Maryn等[4]運(yùn)用Praat軟件進(jìn)行了DSI的測(cè)量與驗(yàn)證,并指出聲壓級(jí)校準(zhǔn)能夠使得不同環(huán)境中測(cè)得的聲壓級(jí)值均衡化,因而聲壓級(jí)校準(zhǔn)對(duì)于嗓音強(qiáng)度測(cè)量有重要影響。DRS軟件測(cè)得的強(qiáng)度值為相對(duì)值,與聲級(jí)計(jì)測(cè)得的實(shí)際聲壓級(jí)值存在一定的差異,因而在計(jì)算前需要對(duì)DRS測(cè)量的強(qiáng)度進(jìn)行校準(zhǔn)。
聲壓級(jí)校準(zhǔn)地點(diǎn)與數(shù)據(jù)采集地點(diǎn)保持統(tǒng)一,為背景噪聲低于35 dB A的一間診室。聲壓級(jí)測(cè)量的標(biāo)準(zhǔn)參考值是以AWA6291型實(shí)時(shí)信號(hào)分析儀所測(cè)得的實(shí)際聲壓級(jí)為準(zhǔn),進(jìn)行如下校準(zhǔn):首先,校準(zhǔn)信號(hào)為HP envy13-AD109TU筆記本電腦中Adobe Audition 3.0軟件播放的不同強(qiáng)度言語聲(穩(wěn)態(tài)元音/a/),DRS軟件、Praat軟件和AWA6291型實(shí)時(shí)信號(hào)分析儀同時(shí)采集聲音和進(jìn)行聲壓級(jí)分析,并將結(jié)果記錄于Excel表格中。通過Excel中的一元線性回歸分析方法將DRS軟件和Praat軟件測(cè)得的強(qiáng)度值(IE)轉(zhuǎn)換為實(shí)際強(qiáng)度值(IM)。
由于DRS軟件中的jitter有四種算法,需要篩選最佳算法用于DSI計(jì)算。而GRBAS評(píng)估與聲學(xué)指標(biāo)如jitter、shimmer和HNR等密切相關(guān)[5,6],GRBAS在音質(zhì)評(píng)估中信效度較好,因而其評(píng)估結(jié)果常被用作多維聲學(xué)分析的基礎(chǔ)[1,7,8]。本研究中,Spearman相關(guān)分析結(jié)果顯示DRS軟件中四種算法的jitter均與G分級(jí)顯著正相關(guān)(P<0.01),其中jitter(PPQ)與G分級(jí)相關(guān)最高(r=0.442),而其他三種算法的jitter(jitter%,jitterRAP和jitter11pts)與G分級(jí)相關(guān)系數(shù)分別為0.414、0.399和0.390,因而選擇jitterPPQ用于DSI計(jì)算。
1.2.2GRBAS及VHI評(píng)估 由兩名言語病理學(xué)家對(duì)受試者的錄音樣本進(jìn)行GRBAS主觀聽感知評(píng)估,兩人評(píng)估不一致時(shí),請(qǐng)另一位言語病理學(xué)家進(jìn)行評(píng)級(jí),取其中一致的結(jié)果;受試者填寫VHI量表,根據(jù)量表中的所有問題,選擇最符合自己情況的選項(xiàng)并打鉤,對(duì)于部分文字閱讀有困難者,測(cè)試者以朗讀方式讀題目和選項(xiàng),并勾選出受試者所選項(xiàng)。
1.3統(tǒng)計(jì)學(xué)方法 以SPSS16.0軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。采用判別分析方法建立DSIDRS模型,其中76例受試者的MPT、HF0、LI和jitter值為自變量,G分級(jí)為因變量,建立判別函數(shù),并判定76例受試者嗓音的G分級(jí),采用留一法(Leave-one-out cross validation)對(duì)病例的分級(jí)進(jìn)行交叉驗(yàn)證。
采用Pearson相關(guān)分析法分析DSIDRS與DSIpraat之間的相關(guān)性,以了解測(cè)量的設(shè)備間一致性;采用Pearson相關(guān)分析法分析DSIDRS與VHI評(píng)估的相關(guān)性,以了解主客觀評(píng)估之間的關(guān)系;顯著性水平α=0.05。
2.1嗓音主客觀評(píng)估結(jié)果 76例受試者DSR、Praat軟件嗓音客觀評(píng)估以及嗓音主觀評(píng)估(G分級(jí)和VHI得分)的結(jié)果見表1。
表1 DRS、Praat軟件嗓音分析各指標(biāo)及G分級(jí)、VHI評(píng)分結(jié)果
2.2DSIDRS判別模型 表2顯示基于判別分析方法的DSIDRS函數(shù)的系數(shù)和對(duì)應(yīng)的常數(shù)。根據(jù)典型判別函數(shù)系數(shù)可知,存在三個(gè)判別函數(shù);而根據(jù)特征值和典型相關(guān)系數(shù)可知第一判別函數(shù)的特征值和典型相關(guān)值最大,因而第一判別函數(shù)最適用于判別分組,故得出DSIDRS的計(jì)算公式為:DSIDRS=1.916×jitter(PPQ)-0.004×HF0+0.027×LI+0.020×MPT-0.870。
表2 典型判別函數(shù)系數(shù)
表3顯示根據(jù)G分級(jí)的Fisher線性判別函數(shù),對(duì)4級(jí)嗓音質(zhì)量給出了四組分類判別系數(shù),通過四組分類判別系數(shù)構(gòu)成的判別函數(shù)可以對(duì)未分級(jí)病例進(jìn)行分級(jí)。在已知某病例HF0、jitter(PPQ)、LI和MPT這四個(gè)指標(biāo)的情況下,可以算出這四組判別函數(shù)的值,其中,最大的函數(shù)值即可表明該病例對(duì)應(yīng)的G分級(jí)。
表3 不同G分級(jí)的Fisher判別系數(shù)
表4為分類矩陣表,上半部分為76例受試者G分級(jí)初始判別與經(jīng)判別函數(shù)判定后分級(jí)之間的一致性,結(jié)果顯示原先判定為0、1、2和3級(jí)者,與經(jīng)判別函數(shù)判定為0、1、2和3級(jí)的一致性是52.6%,即在已知分級(jí)的病例中,應(yīng)用判別函數(shù)正確分級(jí)的病例占52.6%。下半部分顯示采用留一法(Leave-one-out)進(jìn)行交叉驗(yàn)證(即每個(gè)受試者的嗓音通過除了其自身之外的其他受試者推導(dǎo)出來的判別函數(shù)來分級(jí))的結(jié)果與經(jīng)判別函數(shù)判定分級(jí)比較,交叉驗(yàn)證有47.4%的受試者被判對(duì);根據(jù)Wuyts等[1]的研究,若考慮相鄰分級(jí)也可以被接受的情況,則分級(jí)一致性可達(dá)到82.9%。
表4 DSIDRS初始判別及交叉驗(yàn)證G分級(jí)經(jīng)判別函數(shù)判定分級(jí)結(jié)果(例,%)
2.3DSIPraat判別模型 為獲取可靠的數(shù)據(jù)以比較DRS軟件與Praat軟件所測(cè)得的DSI值之間的一致性,同樣采用判別分析方法建立DSIPraat判別模型。根據(jù)特征值和典型判別函數(shù)系數(shù)的結(jié)果,DSIPraat的計(jì)算公式為:DSIPraat=2.955×jitter(PPQ)-0.002×HF0+0.042×LI-0.024×MPT-1.356。
表5為分類矩陣表,上半部分顯示76例G分級(jí)初始判別與經(jīng)判別函數(shù)判定函數(shù)分級(jí)之間的一致性,結(jié)果顯示原先判定為0、1、2和3級(jí)者,與經(jīng)判別函數(shù)判定為0、1、2和3級(jí)的一致性是50%,即在已知分級(jí)的病例中,應(yīng)用判別函數(shù)正確分級(jí)的病例占總體的50%。下半部分顯示采用留一法(Leave-one-out)進(jìn)行交叉驗(yàn)證的結(jié)果,與經(jīng)判別函數(shù)判定分級(jí)比較,43.4%的受試者被判對(duì);若考慮相鄰分級(jí)也可以被接受的情況,則分級(jí)一致性可達(dá)到77.6%??梢姡w上,對(duì)于同一批受試者而言,DRS軟件對(duì)于G分級(jí)的成功率高于Praat軟件。
表5 DSIPraat初始判別及交叉驗(yàn)證G分級(jí)經(jīng)判別函數(shù)判定分級(jí)結(jié)果(例,%)
2.4兩種軟件測(cè)量DSI的一致性 DRS和Praat兩種軟件測(cè)量的DSI及其他指標(biāo)的Pearson相關(guān)分析結(jié)果顯示,兩軟件測(cè)得的HF0之間相關(guān)系數(shù)為0.981(P<0.01),jitter相關(guān)系數(shù)為0.701(P<0.01),LI相關(guān)系數(shù)為0.652(P<0.01),DSI相關(guān)系數(shù)為0.641(P<0.01)??梢妰煞N軟件所測(cè)得的DSI及所有指標(biāo)之間均存在極顯著相關(guān),其中,兩種軟件所測(cè)的HF0之間高度相關(guān)。MPT為時(shí)長(zhǎng)變量,兩設(shè)備間測(cè)得的值相同。
2.5DSIDRS與VHI的相關(guān)性 76例受試者DSI值與VHI總分及VHI分量表得分相關(guān)性分析結(jié)果分別為:DSIDRS與VHI總分之間無顯著相關(guān)(r=0.163,P>0.05);與VHI功能分量表得分(r=0.246,P<0.05)、生理分量表得分(r=0.229,P<0.05)之間存在顯著相關(guān),但相關(guān)程度較低;與VHI情緒分量表得分之間無顯著相關(guān)(r=-0.094,P>0.05)。
DRS軟件作為常用的言語嗓音評(píng)估工具,在臨床中多用于嗓音音質(zhì)的測(cè)量和分析,然而目前尚無研究對(duì)其測(cè)量DSI的可行性進(jìn)行探究。本研究采用判別分析的方法建立DSIDRS判別模型并進(jìn)行交叉驗(yàn)證,并采用留一法與Praat軟件所測(cè)的DSI值進(jìn)行比較,從而證實(shí)其用于DSI測(cè)量和嗓音質(zhì)量判別的有效性。
首先,本研究構(gòu)建了適用于DRS軟件的DSI測(cè)量公式:DSIDRS=1.916×jitter(PPQ)-0.004×HF0+0.027×LI+0.020×MPT-0.870。這一函數(shù)模型與2000年Wutys等[1]構(gòu)建的DSI計(jì)算公式:DSI=0.13×MPT(s)+0.0053×F0-High(Hz)-0.26×I-Low(dB)-1.18×jitter(%)+12.4存在一定的差異,這種差異是合理的,因?yàn)閃uyts所使用的軟件為MDVP,而近年來,Aichinger[2]、Maryn[3]等均提出DSI測(cè)量需關(guān)注設(shè)備間差異,不同設(shè)備測(cè)量DSI時(shí),不宜直接套用公式,需根據(jù)所使用的測(cè)量設(shè)備做合理調(diào)整。本研究中DSIDRS計(jì)算公式的建立以符合DRS軟件本身的測(cè)量特性為導(dǎo)向,例如,在本研究中,由于DRS軟件本身測(cè)得的聲壓級(jí)值為相對(duì)值,為獲取更準(zhǔn)確可靠的數(shù)值,需要轉(zhuǎn)換為實(shí)際強(qiáng)度值,因而進(jìn)行了聲壓級(jí)校準(zhǔn);此外,jitter在DRS軟件中有不同的算法,本研究通過篩選出與G分級(jí)相關(guān)性最高的算法,從而獲取更可靠和更適于DSIDRS計(jì)算的jitter值。
其次,本研究采用交叉驗(yàn)證的方式,對(duì)所構(gòu)建的DSIDRS判別函數(shù)在嗓音質(zhì)量分級(jí)方面的有效性進(jìn)行了驗(yàn)證,結(jié)果顯示,DSIDRS對(duì)47.4%的病例判斷正確。而根據(jù)Wuyts等[1]的研究,認(rèn)為相鄰分級(jí)也可以被接受,則本研究中,DSIDRS的正確分級(jí)達(dá)到82.9%。這一結(jié)果說明,在以基于專家聽感知評(píng)估的G分級(jí)為參照的情況下,DSIDRS能夠較好地實(shí)現(xiàn)對(duì)嗓音質(zhì)量及嗓音障礙嚴(yán)重程度的判定。
此外,本研究中還使用臨床中另一常用的Praat語音分析軟件進(jìn)行了DSI測(cè)量,建立了基于Praat軟件的DSIPraat公式,并通過與DSIDRS比較和分析,以了解兩種軟件測(cè)量DSI的一致性。交叉驗(yàn)證結(jié)果顯示,運(yùn)用DSIPraat,有43.4%的受試者判斷正確,如考慮相鄰分級(jí)被接受,分級(jí)成功率為77.6%,略低于DSIDRS的82.9%,說明DRS軟件測(cè)量的DSI對(duì)于嗓音障礙正確分級(jí)的準(zhǔn)確性略高于Praat軟件。Maryn等[3]2017年在其研究中已證實(shí)了Praat軟件測(cè)量DSI的可行性和有效性,因而本研究中DSIDRS用于嗓音質(zhì)量的評(píng)估也得到了進(jìn)一步支撐。
最后,本研究分析了基于DRS軟件的DSIDRS測(cè)量結(jié)果與患者VHI得分之間的關(guān)系,VHI量表常用作各種嗓音主觀評(píng)估,但在不同研究中,其與嗓音客觀分析指標(biāo)的相關(guān)性結(jié)果不盡相同[9~11]。本研究結(jié)果顯示DSIDRS與VHI之間相關(guān)性不顯著,一方面可能與國(guó)人對(duì)于嗓音的認(rèn)識(shí)及自我感知與專家的聽感知評(píng)估存在較大差別有關(guān),另一方面也可能與量表本身所側(cè)重的維度與客觀測(cè)量所提示的嗓音特征之間有較大差距有關(guān)。
綜上所述,本研究結(jié)果表明,基于DRS軟件的DSIDRS,能夠用于嗓音測(cè)量和嗓音障礙嚴(yán)重程度判別;DSIDRS嗓音質(zhì)量評(píng)估的分級(jí)正確率略高于Praat軟件測(cè)得的DSIPraat;基于DRS軟件測(cè)量的DSI,設(shè)備間測(cè)量一致性良好;DSI與VHI相關(guān)不顯著,提示其可能反映嗓音不同維度的特征。臨床上,可以根據(jù)所具備的研究條件,運(yùn)用該兩種軟件測(cè)量DSI值,以獲取音質(zhì)總體情況和嗓音障礙嚴(yán)重程度的數(shù)據(jù),為嗓音評(píng)估提供更多參考信息。由于DSI研究在國(guó)內(nèi)相對(duì)較少,后續(xù)研究需要進(jìn)一步明確國(guó)人DSI 的正常值和異常值范圍以及分級(jí)標(biāo)準(zhǔn),為嗓音客觀分析提供參考。