吳丹 張華 王碩 武文芳
1 首都醫(yī)科大學(xué)附屬北京同仁醫(yī)院,北京市耳鼻咽喉科研究所(北京 100005);2 首都醫(yī)科大學(xué)生物醫(yī)學(xué)工程學(xué)院
言語測(cè)聽可為聽力損失患者的咨詢及需求評(píng)估提供參考,并便于了解其助聽后的康復(fù)效果[1]。一套好的言語測(cè)試詞表必須具有良好的信度(reliability)和效度(validity),才能用于言語評(píng)估。評(píng)估聽力干預(yù)對(duì)言語理解能力改善的效果涉及到詞表的復(fù)測(cè)信度,即聽力干預(yù)前后該詞表測(cè)試結(jié)果的差異是否有統(tǒng)計(jì)學(xué)意義,是否能證明聽力干預(yù)有效。雙音節(jié)詞言語測(cè)試在臨床上有很廣泛的應(yīng)用價(jià)值,它可以檢查純音測(cè)聽結(jié)果的準(zhǔn)確性,考查患者對(duì)言語的敏感性并得到言語識(shí)別閾(speech recognition threshold,SRT),以決定閾上給聲強(qiáng)度;也可以測(cè)試言語識(shí)別率,用于評(píng)估人工聽覺裝置的效果。言語識(shí)別率較言語識(shí)別閾測(cè)試方法統(tǒng)一且簡單,應(yīng)用更廣泛;復(fù)測(cè)信度評(píng)估常用言語識(shí)別率的變異范圍評(píng)估,其有理論的數(shù)學(xué)模型,為此,本研究采用具有等價(jià)性的雙音節(jié)詞表言語識(shí)別率測(cè)試進(jìn)行復(fù)測(cè)信度評(píng)估[2],旨在得出復(fù)測(cè)信度的參考指標(biāo),在同表等價(jià)的基礎(chǔ)上保證其測(cè)試結(jié)果的可靠性,對(duì)詞表進(jìn)行標(biāo)準(zhǔn)化。
1.1 測(cè)試材料 采用張華等[2]編制的普通話言語測(cè)聽材料(mandarin speech test materials,MSTMs)中具有等價(jià)性的9張普通話雙音節(jié)詞表(每表50個(gè)雙音節(jié)字)作為言語測(cè)聽材料。另有練習(xí)表一張,測(cè)試項(xiàng)11個(gè),練習(xí)表中的測(cè)試項(xiàng)與9張雙音節(jié)詞表中的測(cè)試項(xiàng)沒有重復(fù)。
1.2 測(cè)試對(duì)象 測(cè)試對(duì)象為18~27歲青年人32例(32耳),平均年齡23.41±1.88歲,其中男15例,女17例,左耳17例,右耳15例;均為大學(xué)本科及以上學(xué)歷,日常交流方式為普通話,無耳科疾病史且近期無上呼吸道感染,純音聽閾均在正常范圍(雙耳250、500、1 000、2 000、4 000和8 000Hz純音氣導(dǎo)聽閾≤15dB HL),鼓室導(dǎo)抗圖均為A型,均能引出聲反射。受試者均首次接觸此詞表。
1.3 測(cè)試地點(diǎn)及設(shè)備 測(cè)試地點(diǎn)為北京同仁醫(yī)院耳鼻咽喉科臨床聽力學(xué)中心標(biāo)準(zhǔn)雙間隔聲室,本底噪聲<20dB(A),測(cè)試人員與受試者同室測(cè)試。言語測(cè)聽材料的言語信號(hào)通過Lenovo計(jì)算機(jī)聲卡輸出,送入MADSEN OB922聽力計(jì)輸出至MADSEN Telephonics 296D000-1壓耳式耳機(jī),經(jīng)單側(cè)耳機(jī)傳遞給受試者。將1.0kHz純音作為校準(zhǔn)音,使用B&K 2209型精密聲級(jí)計(jì)、B&K 4145電容傳聲器和B&K 4152型仿真耳(設(shè)備經(jīng)北京市計(jì)量科學(xué)研究院校準(zhǔn))校準(zhǔn)設(shè)備與聲場(chǎng),參考國標(biāo)GB/T 7341.2-1998將0dB SHL言語聽力級(jí)校準(zhǔn)為言語聲強(qiáng)級(jí)(20dB SPL)。
1.4 測(cè)試方法 運(yùn)用首都醫(yī)科大學(xué)生物醫(yī)學(xué)工程學(xué)院與北京同仁醫(yī)院聯(lián)合開發(fā)的漢語言語測(cè)聽智能化系統(tǒng)[3,4],在智能化軟件中選擇手動(dòng)選表、手動(dòng)操控給詞的測(cè)試方式。每張表中各個(gè)詞的測(cè)試順序由智能化軟件控制隨機(jī)給出。言語信號(hào)通過軟件經(jīng)電腦輸入聽力計(jì)Channel 1,然后經(jīng)單側(cè)耳機(jī)傳遞給受試者。以受試者500、1 000、2 000和4 000Hz氣導(dǎo)平均純音聽閾(pure tone average,PTA)較好耳為測(cè)試耳。
預(yù)測(cè)試:選擇5名受試者進(jìn)行預(yù)測(cè)試,找出得分正確率為40%~60%的給聲強(qiáng)度。采用下降法,對(duì)9張表分別以2dB為步距,根據(jù)每名受試的純音平均聽閾(PTA),從PTA+14dB HL到PTA-2dB HL范圍分別給聲。5名受試者分別從第1、3、5、7、9張表開始,依次測(cè)試完九張表,最后得出每名受試者的固定給聲強(qiáng)度為各自的閾上4dB,即PTA+4 dB HL。
正式測(cè)試:本測(cè)試所用的9張普通話雙音節(jié)詞表順序采用拉丁方設(shè)計(jì)(表1),27位受試者隨機(jī)進(jìn)入實(shí)驗(yàn),反應(yīng)方式為受試者聽到測(cè)試詞后復(fù)述出來,當(dāng)受試者沒有聽清楚測(cè)試詞時(shí),鼓勵(lì)猜測(cè)。
表1 27例受試者M(jìn)STMs雙音節(jié)詞表播放順序
27名受試者復(fù)測(cè)時(shí)間間隔7~28天,平均14天,以完全相同的實(shí)驗(yàn)條件(相同地點(diǎn)、相同強(qiáng)度、相同測(cè)試順序等)對(duì)每名受試者進(jìn)行第二輪測(cè)試。
1.5 計(jì)分方式 采用“全或無”的方式,所用智能化軟件會(huì)自動(dòng)計(jì)算該表識(shí)別率。雙音節(jié)詞中兩個(gè)字聲母、韻母及聲調(diào)均復(fù)述正確得一分,無反應(yīng)、聲母錯(cuò)、韻母錯(cuò)或聲調(diào)錯(cuò)均計(jì)為0分。每張?jiān)~表的言語識(shí)別率得分=(復(fù)述正確詞數(shù)/總詞數(shù))×100%。
1.6 統(tǒng)計(jì)學(xué)方法 本實(shí)驗(yàn)得分率范圍0%~100%。識(shí)別-強(qiáng)度(performance-intensity,PI)函數(shù)曲線上50%左右得分率變異最大,而在兩端得分率變異度最小,各個(gè)得分率的隨機(jī)誤差是不一致的[5]。因此,Studerbaker提出了一種對(duì)識(shí)別率分?jǐn)?shù)進(jìn)行“合理化”反正弦變換(“rationalized”arcsine transform)的方法[6],采用SPSS17.0軟件計(jì)算每張表兩次得分差值及其變異程度,進(jìn)行復(fù)測(cè)信度評(píng)估。
經(jīng)正態(tài)性檢驗(yàn),各表復(fù)測(cè)和初測(cè)得分都符合正態(tài)分布。9張表總體的復(fù)測(cè)和初測(cè)的言語識(shí)別率分別為52.40%±13.82%和50.74%±13.51%,復(fù)測(cè)和初測(cè)得分平均差值僅為1.66%。對(duì)每張表得分進(jìn)行復(fù)測(cè)和初測(cè)的配對(duì)t檢驗(yàn)顯示,各表復(fù)測(cè)和初測(cè)結(jié)果差異無統(tǒng)計(jì)學(xué)意義(P>0.05)(表2)。
表2 27例受試者9張MSTMs雙音節(jié)詞表復(fù)測(cè)、初測(cè)言語識(shí)別率比較(%,±s)
表2 27例受試者9張MSTMs雙音節(jié)詞表復(fù)測(cè)、初測(cè)言語識(shí)別率比較(%,±s)
表序 復(fù)測(cè) 初測(cè) 復(fù)測(cè)-初測(cè)差值 P值1 55.09±13.26 50.90±14.37 4.19 0.051 2 52.46±15.40 52.20±11.67 0.26 0.925 3 56.92±13.12 55.06±15.34 1.87 0.455 4 53.53±13.17 50.01±12.20 3.52 0.095 5 50.50±12.29 48.63±15.25 1.87 0.346 6 51.15±17.10 50.81±14.42 0.33 0.890 7 53.89±12.25 49.74±13.76 4.15 0.057 8 48.31±13.03 49.68±13.51 -1.37 0.625 9 49.72±13.88 49.63±11.35 0.10 0.965
表3 9張雙音節(jié)詞表初、復(fù)測(cè)結(jié)果差值的標(biāo)準(zhǔn)差及臨界差值(%)
根據(jù)各表在兩輪測(cè)試中各自識(shí)別率得分的差值,逐表統(tǒng)計(jì)該差值在27名受試者中的標(biāo)準(zhǔn)差(standard difference,SD),并換算成95%置信度下的臨界差值(critical difference,CD)=SD×1.96(表3)??梢?,該套詞表總體標(biāo)準(zhǔn)差為12.0%,總體臨界差值為23.6%。
3.1 實(shí)驗(yàn)設(shè)計(jì) 本研究中所采用的9張測(cè)試詞表的順序采用拉丁方設(shè)計(jì),對(duì)于不同受試者將測(cè)試詞表順序循環(huán)排列,避免某張表總是在最前或最后,測(cè)試期間間斷休息,這樣可避免疲勞測(cè)試使言語識(shí)別率降低[7]。本研究通過預(yù)實(shí)驗(yàn)找出得分正確率為40%~60%的給聲強(qiáng)度為測(cè)試強(qiáng)度,既可以比較靈敏地判斷出得分的差異,又避免了得分最差的地板效應(yīng)(floor effect)和得分最高的天花板效應(yīng)(ceiling effect)。
本實(shí)驗(yàn)采用的是受試者口頭復(fù)述、測(cè)試者即時(shí)記錄的方式,所以實(shí)際聽力測(cè)試不僅受到受試者反應(yīng)的影響,也受測(cè)試者的聽力感知的影響[8]。因此,在更嚴(yán)格的試驗(yàn)中,可以在測(cè)試者記錄受試者復(fù)述內(nèi)容的基礎(chǔ)上對(duì)受試者進(jìn)行錄音或錄像,以提高測(cè)試結(jié)果記錄的準(zhǔn)確性[8]。
Bamford等[9]提出應(yīng)該對(duì)同一受試者在相同的條件下進(jìn)行測(cè)試,這樣有助于去除儀器和人為因素的誤差。本研究復(fù)測(cè)時(shí)測(cè)試者、測(cè)試地點(diǎn)、給聲強(qiáng)度及詞表順序都與初測(cè)時(shí)保持不變,要最大程度的減少系統(tǒng)誤差。然而,相對(duì)于純音測(cè)聽,重復(fù)言語測(cè)試面臨一個(gè)不可避免問題,就是受試者可能會(huì)對(duì)測(cè)試材料有學(xué)習(xí)和記憶,即可能存在學(xué)習(xí)效應(yīng)這種系統(tǒng)誤差。理論上雙音節(jié)詞相對(duì)于單音節(jié)詞有更多的冗余度,更易于學(xué)習(xí)記憶,但是本研究結(jié)果顯示,各表的復(fù)測(cè)和初測(cè)得分差值均無統(tǒng)計(jì)學(xué)意義,表明該套詞表并沒有受到明顯的學(xué)習(xí)效應(yīng)的影響,證實(shí)了使用該套詞表進(jìn)行復(fù)測(cè)評(píng)估的可行性,復(fù)測(cè)和初測(cè)得分平均差值僅為1.66%,遠(yuǎn)小于臨界差值23.6%,說明本研究較好地排除了系統(tǒng)誤差的影響。
3.2 復(fù)測(cè)信度評(píng)估 信度指標(biāo)關(guān)注的是測(cè)試結(jié)果的可靠性程度,它對(duì)于臨床上選擇什么樣的測(cè)試材料、如何理解測(cè)試結(jié)果的誤差范圍都至關(guān)重要[10]。信度包括多張測(cè)聽表之間的等價(jià)性(復(fù)本信度)和得分在多次測(cè)試中的穩(wěn)定性(復(fù)測(cè)信度)。本研究通過對(duì)9張等價(jià)的雙音節(jié)詞表復(fù)測(cè)信度評(píng)估,得出復(fù)測(cè)和初測(cè)的言語識(shí)別率差異無統(tǒng)計(jì)學(xué)意義,證實(shí)了該套詞表復(fù)測(cè)的可靠性,準(zhǔn)確的評(píng)估測(cè)試結(jié)果。
言語測(cè)聽材料復(fù)測(cè)信度評(píng)估的常用指標(biāo)是臨界差值(critical difference,CD)。重復(fù)測(cè)量獲得的實(shí)際測(cè)量值往往并不能穩(wěn)定在同一值,而是圍繞某一個(gè)數(shù)值左右波動(dòng),這種誤差稱為隨機(jī)誤差。本研究設(shè)計(jì)時(shí)最大化的排除了系統(tǒng)誤差,但是由于變異的存在,隨機(jī)誤差不可避免。復(fù)測(cè)信度體現(xiàn)的是這種隨機(jī)測(cè)量誤差,它通過計(jì)算受試者自身復(fù)測(cè)得分差值的標(biāo)準(zhǔn)差(standard deviation,SD)進(jìn)行評(píng)估,這個(gè)SD值可用來確定得分變化的臨界差值(CD=SD×1.96,95%置信度),只有大于該臨界差值,才能確切地得出"兩次言語識(shí)別率有差異"的結(jié)論。應(yīng)用二項(xiàng)式分布理論,由50個(gè)彼此獨(dú)立的、聽敏度(audibility)上完全同質(zhì)的測(cè)試項(xiàng)組成的測(cè)聽表,其言語識(shí)別率在50%時(shí)所對(duì)應(yīng)的臨界差值為18.1%[11],即兩次測(cè)試條件完全一致,測(cè)量的差值也將在此理論值范圍內(nèi)波動(dòng),此范圍內(nèi)的言語識(shí)別率變化不能表明結(jié)果存在統(tǒng)計(jì)學(xué)差異。
該套詞表的臨界差值為23.6%,略大于理論值18.1%。分析原因:①測(cè)試的給聲強(qiáng)度為50%左右得分率,在PI曲線上變異最大,且雙音節(jié)詞較單音節(jié)詞PI曲線斜率更大,故得到較大值;②參考值是將得分率作為二項(xiàng)分布來研究,但它的前提條件是測(cè)試項(xiàng)特征應(yīng)具有完全同質(zhì)性;50詞的雙音節(jié)詞表在音位平衡、可懂度和言語聽力級(jí)上基本達(dá)到一致;此外,對(duì)表內(nèi)各測(cè)試項(xiàng)而言,受試者的狀態(tài)、測(cè)試條件等也應(yīng)彼此獨(dú)立,而現(xiàn)實(shí)中這些前提條件不可能嚴(yán)格成立,所以實(shí)驗(yàn)結(jié)果與理論值存在一定的差異。
總之,本次研究初步驗(yàn)證了9張普通話雙音節(jié)表具有較好的復(fù)測(cè)信度,在實(shí)驗(yàn)和臨床應(yīng)用中其評(píng)估言語識(shí)別的結(jié)果是可靠的。應(yīng)用該套雙音節(jié)表在正常人群中進(jìn)行相關(guān)言語評(píng)估測(cè)試時(shí),確認(rèn)兩次測(cè)試言語識(shí)別率有差異,其前后兩次得分的差值應(yīng)超過該臨界差值(23.6%)。
1 Zhang H,Wang L,Wang S,et al.Speech and language evaluation for cochlear implant[J].Chinese Journal of Clinical Rehabilitation,2005,9:188.
2 Wang S,Mannel R,Philip N,et al.Development and evalua-tion of Mandarin disyllabic materials for speech audiometry in China[J].International Journal of Audiology,2007,46:721.
3 張華,王碩,陳靜,等.普通話言語測(cè)聽材料的智能化研究[J].中華耳鼻咽喉頭頸外科雜志,2008,43:407.
4 Wu WF,Zhang H,Chen J,et al.Development and evaluation of computerized mandarin speech test system in China[J].Computers in Biology and Medicine,2011,41:133.
5 Thornton AR,Raffin MJ.Speech-discrimination scores modeled as a binomial variable[J].J Speech Hear Res,1978,21:507.
6 Studerbaker GA.A"rationalized"arcsine transform[J].Speech Hear Res,1985,28:455.
7 Mendel LL,Danhauer JL.Test administration and interpretation[M].In:Mendel LL,Danhauer JL.ed.Audiologic evaluation and management and speech perception assessment.Singular Publishing Group,Inc,1997.21~25.
8 邵廣宇,張華,陳靜,等.口頭復(fù)述與書寫反應(yīng)方式對(duì)普通話言語識(shí)別率的影響[J].聽力學(xué)及言語疾病雜志,2009,17:207.
9 Bamford J,Wilson I.Methodological considerations and practical aspects of the BKB sentence lists[M].In:Bench J,Bamford J,eds.Speech-h(huán)earing tests and the spoken language of hearing-impaired children.London,UK:Academic Press,1979.146~187.
10 郗昕,趙烏蘭,冀飛,等.漢語單音節(jié)測(cè)聽表在北京聽力正常人群中的復(fù)測(cè)信度評(píng)估[J].聽力學(xué)及言語疾病雜志,2009,17:98.
11 Raffin MJ,Thornton AR.Confidence levels for differences between speech-discrimination scores:a research note[J].Speech and Hearing Research,1980,23:11.