李玉玲 孫君 張華 陳靜 王碩
聽力正常成人普通話語句測聽復測信度評估*
李玉玲1孫君1張華1陳靜1王碩1
目的 評估漢語普通話言語測聽材料(Mandarin speech test materials,MSTMs)中的等價語句測聽材料在聽力正常成人中的復測信度,以進一步完善該材料的標準化設計。方法 隨機抽取40例18~30歲聽力言語正常的受試者,采用MSTMs中的等價語句測聽材料(共15張測試表),根據(jù)預實驗結果測試受試者相對好耳在9 d B HL時的言語識別率,間隔14~28天后在完全相同的條件下復測言語識別率,對兩輪測試結果進行配對t檢驗,并計算臨界差值。結果 除表6外,其余14張MSTMs語句測聽材料兩輪言語識別率得分差異均無統(tǒng)計學意義;取95%置信區(qū)間的臨界差值為18.93%,對應關鍵詞數(shù)10個。結論 本實驗測得MSTMs語句測聽材料復測信度好;使用該語句測聽材料進行言語聽覺能力評估時,若同一受試者前后兩次識別率差異超過18.93%、對應關鍵詞數(shù)超過10個,則認為干預有效。
言語測聽; 復測信度; 語句測試材料
網(wǎng)絡出版地址:http://www.cnki.net/kcms/detail/42.1391.R.20141028.1110.012.html
言語測聽作為一種以言語信號為刺激聲的聽力學檢測手段,是評價聽力障礙殘疾程度、社會交往能力、治療或康復效果等的重要指標,測試材料主要包括單音節(jié)詞表、雙音節(jié)詞表及語句材料等。由于語句測試材料更接近日常交流言語,能更好地評估受試者理解日常言語的能力[1],因此在言語測試中,語句評估是必不可少的項目,也是目前人工耳蝸應用效果評估中主要的言語測聽材料[2]。
本研究對張華等[3]前期開發(fā)并做了等價性評估的15張普通話言語測聽材料(Mandarin speech testmaterials,MSTMs)中的語句測聽材料進行復測信度評估,以進一步使MSTMs測試材料標準化,利于該言語測試材料的推廣和應用。
1.1 研究對象 以40例18~30歲(中位年齡22. 5歲)聽力正常人為研究對象,其中,女23例,男17例;選擇聽力較好一側耳測試,聽力較好耳250、500、1 000、2 000、4 000和8 000 Hz純音聽閾均≤15 dB HL,鼓室導抗圖均為A型,無耳科疾病史;日常交流方式為普通話;所有受試者均首次接觸測試材料,且自愿配合測試。
1.2 普通話語句測聽材料 采用張華等[3]研發(fā)的普通話言語測聽材料,其中等價的語句測聽材料共15張表,10句/表,50個關鍵詞/表。另有練習表1張,5個句子,25個關鍵詞,練習表中的測試項與15張正式測試語句測聽材料的測試項無重復。
1.3 測試方法 以首都醫(yī)科大學附屬北京同仁醫(yī)院耳鼻咽喉科研究所標準雙間隔聲室為測試場地,本底噪聲<20 dB A,測試前參考國家標準GB/T7341.2-1998對測試設備進行校準。
1.3.1 測試步驟 為盡量減少受試者個人心理、生理狀態(tài)等因素對研究結果的影響,本研究采用拉丁方設計[4],將語句表順序循環(huán)排列,使每張表在整個測試過程中均有兩次機會作為首張測試表出現(xiàn),MSTMs語句表排序設計見表1。測試前向受試者講解測試流程,并播放練習表使受試者理解和熟悉測試方法及應答方式,練習表不計分。反應方式為受試者聽到測試語句后復述,當受試者沒有聽清楚時,鼓勵猜測。
表1 MSTMs語句表測試順序
1.3.2 預測試 從40例受試者中隨機抽取10例進行預測試。初始給聲強度為患者純音平均聽閾(500~4 000 Hz),以2 dB為步距降低或升高給聲強度,為覆蓋患者10%~90%言語識別率,按表1的測試順序每例受試者約測試8張語句表,記錄每例受試者每張語句表的言語識別率得分及其對應的給聲強度。為了在信度和敏感度之間尋求平衡,根據(jù)Wilson等的研究[5],通過預測試選取得分在80%左右的平均給聲強度作為正式測試時的固定給聲強度,預測試得到該強度為9 dB HL。
1.3.3 正式測試 30例受試者隨機進入正式測試,按照表1順序依次完成所有語句表測試,并記錄言語識別率得分。測試過程中根據(jù)受試者要求適當安排休息。間隔14~28天后,30例受試者分別于同一時間段,同一隔聲室內,以完全相同的測試環(huán)境、測試設備、測試表順序和計分標準,由同一名測試人員,以初測時相同的給聲強度,對其進行語句材料識別率復測。
1.3.4 計分方法 受試者以聽到語句測試材料后口頭復述為應答形式,關鍵詞復述正確計分,無反應或復述錯誤不計分。單張語句表言語識別率得分計算方法:言語識別率=(復述正確詞數(shù)/總詞數(shù)50) ×100%。
1.4 統(tǒng)計學方法 為了使所有得分的隨機誤差大致一致,利用Studerbaker[6]提出的方法對識別率得分進行“合理化”反正弦變換(“rationalized”arcsine transform)處理。采用統(tǒng)計學軟件SPSS19.0對經(jīng)“合理化”反正弦變換的初測和復測得分進行配對t檢驗,并以95%置信區(qū)間(confidence interval,CI)計算總體及各語句表初測、復測臨界差值(critical difference,CD),計算式公式為:CD=SD×1.96。
2.1 兩輪測試結果 15張語句測聽材料初測復測得分都呈正態(tài)分布,初測和復測平均得分結果分別為88.8%±18.2%和89.4%±17.2%。將各受試者兩輪測試得分進行配對t檢驗,結果總體和總體均值無統(tǒng)計學差異(P>0.05);15張語句測試表中,除表6外其余14張表兩輪測試得分差異均無統(tǒng)計學意義(P>0.05)(表2)。
2.2 臨界差值 15張語句測聽材料初測復測得分總體標準差為9.66%,臨界差值18.93%,對應關鍵詞數(shù)為10個。在臨床使用該語句材料進行測試時,兩次結果的差異需大于所得18.93%方可認為兩次言語識別率有差異,干預有效。各表初測復測得分差值的具體標準差、臨界差值和對應關鍵詞數(shù)見表3。表4給出95%和99%置信區(qū)間25項詞表和50項詞表的標準臨界差值[6]。
表3 各表兩輪測試得分差值的標準差、臨界差值和對應關鍵詞數(shù)
表4 25項和50項詞表的標準臨界差值(95%CI和99%CI)
3.1 實驗設計分析 張華等[7]驗證MSTMs語句測聽材料等價性的研究結果中,正常人語句測聽材料的識別-強度函數(shù)曲線(performance-intensity function,P-Ifunction)在言語識別率接近100%或0%時斜率變緩,此時復測變異度較小,復測信度較高,但敏感度較差,P-I函數(shù)曲線斜率最大時復測敏感度最高但變異度較大。因此,最好能使初次測試得分在65%~85%之間[5],故本研究選取得分均值在80%左右的給聲強度作為正式試驗時的固定給聲強度,以保證受試者在測試時不致過于疲憊,也不會得分高至飽和。
由于語句的冗余度較大,容易產(chǎn)生學習效應,為提高測試結果的準確性,應適當增大初測與復測的間隔時間,但有學者[8]提出:如果兩次測試的時間間隔超過數(shù)月,受身體發(fā)育、社會經(jīng)歷等因素的影響,言語識別能力可能會有變化。故本實驗選擇兩輪測試時間間隔為14~28天,并保證初測、復測在同一時間段進行,同時避開感冒、生理期、疲勞、情緒波動等自身干擾因素,為保證數(shù)據(jù)的準確可靠,出現(xiàn)個別受試者狀態(tài)不佳時另招募志愿者替換。
另外,有學者等[9]對DANTALE句子材料單次測試的學習效應的研究中發(fā)現(xiàn),學習效應主要在熟悉測試方法的過程中引起,主要表現(xiàn)在開始階段。因此,為降低學習效應對測試結果的影響,在正式測試前利用練習表使受試者充分練習,并且語句表測試順序采用拉丁方設計,使每個語句表都有兩次機會作為首測語句表。
3.2 復測信度 科學研究中測量工具必須穩(wěn)定可靠,且多次測量結果應前后一致。測量工具的可靠性和穩(wěn)定性程度即為信度,信度是指測量結果的一致性和可靠性,是反映測試結果受隨機誤差影響程度的指標,是評價測試質量的最基本的指標[10]。言語測聽材料的信度主要包括復本信度和復測信度,張華等[2]在前期MSTMs語句表等價性測試的研究中已完成復本信度的評估,本研究主要對等價的語句測聽材料進行復測信度評估。
本研究結果顯示各受試者總體和總體均值兩輪測試得分差異無統(tǒng)計學意義(P>0.05),15張語句測聽表中有14張表兩輪測試得分無顯著差異(P>0.05),說明這14張表的復測信度相對穩(wěn)定可靠,并且該語句測試材料的總體可靠度也較好;雖然表6兩輪測試得分出現(xiàn)顯著性差異,但并未影響總體和總體均值結果,分析其原因,可能是受個別受試者數(shù)據(jù)波動較大的影響,所以后續(xù)研究中可以適當增加受試者的數(shù)量,以進一步驗證。由于在實際言語識別率測試時,任意選取兩組語句表[2],故建議臨床不要單獨使用語句表6。
3.3 臨界差值 本研究每個表的測試項為50個詞,得到的95%置信區(qū)間下的臨界差值為18.93%,與標準臨界誤差18.1%[6]比較接近,說明實驗結果較為準確,并且該臨界差值較為可信。
本研究表明MSTMs語句測聽材料(除語句表6)具有良好的復測信度,但仍需其他實驗室以及聽力障礙患者中的進一步驗證。
1 陳靜,王碩.語句辨別測試[J].國外醫(yī)學耳鼻咽喉科學分冊,2003,27:330.
2 張華,陳靜,王碩,等.漢語普通話語句測聽句表的編輯與評估[J].中華耳鼻咽喉頭頸外科雜志,2005,40:774.
3 張華,王碩,王靚,等.普通話言語測聽材料的數(shù)字化錄制與等價性分析[J].臨床耳鼻咽喉科雜志,2006,20:1101.
4 郗昕,趙烏蘭,冀飛,等.漢語單音節(jié)測聽表在北京聽力正常人群中的復測信度評估[J].聽力學及言語疾病雜志,2009,17:95.
5 Wilson RH,Carter AS.Relation between slopes of word recognition psychometric functions and homogeneity of the stimulus materials[J].J Am Acad Audiol,2001,12:7.
6 Studebaker GA.A"rationalized"arcsine transform[J].Journal of Speech,Language,and Hearing Research,1985,28:455.
7 張華,王碩,陳靜.正常人單音節(jié)及語句識別-強度函數(shù)測試[J].臨床耳鼻咽喉頭頸外科雜志,2008,22:1.
8 陳艾婷,冀飛,郗昕,等.一組漢語普通話單音節(jié)詞表在聽力損失人群中的復測信度研究[J].聽力學及言語疾病雜志,2009,17:201.
9 冀飛.言語測聽材料的復測信度評估[J].聽力學及言語疾病雜志,2009,17:209.
10 張力為.信度的正用與誤用[J].北京體育大學學報,2002,25:348.
(2014-05-04收稿)
(本文編輯 雷培香)
Test-retest ReIiabiIity of the Sentence MateriaIs in Mandarin Speech Test MateriaIs
Li YuIing,Sun Jun,Zhang Hua,Chen Jing,Wang Shuo
[Beijing Tongren HospitaI,CapitaI MedicaI University;Beijing Institute of OtoIaryngoIogy Key Laboratory of OtoIaryngoIogy Head and Neck Surgery(CapitaI MedicaI University),Ministry of Education,Beijing,100005,China]
Objective To evaluate the test-retest reliability of sentence materials,and to standardize Mandarin Speech Test Materials(MSTMs).Methods Forty normal-hearing subjects aged from 18 to 30 years old were recruited in this study.The sentence materials were tested at 9 dB HL to these subjects according to the prepare experiment.The retest was carried out in the same condition after an interval of 14~28 days.The difference between test and retest score was examined by t-test,and the critical difference(CD)was analyzed with 95%confidence interval(CI).ResuIts There was no significant difference between the test and retest scores about speech perception performance.The critical difference was 18.93%at 95%confidence interval,and the number of the corresponding key words was 10.ConcIusion The results showed that sentence materials of MSTMs have good test-retest reliability except list 6.The interventions could be considered effective just when the difference of the same subject's score exceed 18.93%,that means 10 key words are necessary to improve that the intervention is effective.
Speech audiometry; Test-retest reliability; Mandarin sentence materials
10.3969/j.issn.1006-7299.2015.01.005
時間:2014-10-28 11:10
H018.4
A
1006-7299(2015)01-0021-04
* 國家自然科學基金(30772408,81200753)資助
1 首都醫(yī)科大學附屬北京同仁醫(yī)院 北京市耳鼻咽喉科研究所耳鼻咽喉頭頸外科學教育部重點實驗室(北京 100005)
李玉玲,女,河南人,研究實習員,碩士研究生,主要從事耳科及臨床聽力學方面的研究。
張華(Email:a-zhang@263.net)
·信 息·