陸爍 丘國(guó)新 錢思宇 高樂妍
提 要 中山大學(xué)中文系神經(jīng)語(yǔ)言學(xué)教學(xué)實(shí)驗(yàn)室面向語(yǔ)言障礙篩查開發(fā)的漢語(yǔ)兒童言語(yǔ)交際水平評(píng)估系統(tǒng),以一套固定程序作為引導(dǎo),能在短時(shí)間內(nèi)快速采集兒童的言語(yǔ)數(shù)據(jù)?;谶@個(gè)評(píng)估范式,實(shí)驗(yàn)室采集了大量2~14歲兒童言語(yǔ)交際過程中的言語(yǔ)數(shù)據(jù),從語(yǔ)音、能產(chǎn)性、流暢度、語(yǔ)法、語(yǔ)義、邏輯六大語(yǔ)言維度出發(fā),細(xì)分為16項(xiàng)指標(biāo)對(duì)語(yǔ)料進(jìn)行人工標(biāo)注和機(jī)器識(shí)別,建立起一個(gè)應(yīng)用于語(yǔ)言能力評(píng)估和語(yǔ)言障礙篩查的漢語(yǔ)兒童言語(yǔ)數(shù)據(jù)庫(kù),可以精準(zhǔn)評(píng)估漢語(yǔ)兒童的言語(yǔ)交際水平。目前該語(yǔ)料庫(kù)儲(chǔ)存了966名漢語(yǔ)兒童的言語(yǔ)數(shù)據(jù),并對(duì)638名兒童的語(yǔ)料進(jìn)行了標(biāo)注。該語(yǔ)料庫(kù)可以對(duì)兒童語(yǔ)言障礙的智能化篩查提供機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù),也可以為研究漢語(yǔ)兒童語(yǔ)言習(xí)得和各類兒童語(yǔ)言障礙提供數(shù)據(jù)資源支持。
關(guān)鍵詞 兒童語(yǔ)言障礙;語(yǔ)言評(píng)估;言語(yǔ)交際;數(shù)據(jù)庫(kù);語(yǔ)料庫(kù)
中圖分類號(hào) H002 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-1014(2021)06-0045-14
DOI 10.19689/j.cnki.cn10-1361/h.20210604
Developing a Speech Communication Ability Evaluation System
for Screening Language Disorders in Chinese-Speaking Children
Lu Shuo, Qiu Guoxin, Qian Siyu and Gao Leyan
Abstract Language is an indispensable communication tool for human beings, and language ability is an essential skill that children must acquire in their development. Oriented to the language disorders in Chinese-speaking children, an evaluation system has been developed by the Neurolinguistics teaching laboratory at Sun Yat-sen University to measure Chinese childrens speech communication ability and screen language-related disabilities. Using a fixed procedure as a guide, the system can collect childrens speech communication data in a very short time. Based on this evaluation paradigm, a speech corpus of Chinese-speaking children for language disorder screening was established, and up to now data of 996 children aged between 2-14 have been collected. The data are evaluated from six linguistic aspects (including phonology, productivity, fluency, grammar, semantics, and logic) with 16 indicators recognized by both manual annotation and machine recognition. Currently, the data of 638 Chinese-speaking children have been processed and annotated. Such a corpus can offer an affluent training set for automatic screening of childrens language disorders, and provide resource for studies on language acquisition and language disorders.
Keywords Childrens language disorder; language evaluation; speech communication; data base; corpus
一、引 言
語(yǔ)言是人類必不可少的溝通交流工具,也是兒童發(fā)育過程中需要習(xí)得的核心能力。兒童在母語(yǔ)習(xí)得過程中常常會(huì)發(fā)生語(yǔ)言理解、加工、整合、產(chǎn)出的水平低于同齡兒童的現(xiàn)象,如發(fā)音困難、發(fā)音不準(zhǔn)確、詞匯匱乏、話語(yǔ)過于簡(jiǎn)單、不愿意說話等等,即出現(xiàn)兒童語(yǔ)言障礙的現(xiàn)象。據(jù)統(tǒng)計(jì),6%~8%的學(xué)前兒童無(wú)法達(dá)到預(yù)期的語(yǔ)言發(fā)展目標(biāo)(Tomblin et al. 1997;Collisson et al. 2016;Norbury et al. 2016)。本研究采用廣義上的兒童語(yǔ)言障礙概念,既包括由于聽力或其他感官損傷、神經(jīng)功能發(fā)育異常等疾病引起的語(yǔ)言障礙,也包括原發(fā)性而非其他疾病衍生的發(fā)展性語(yǔ)言障礙(Developmental Language Disorder,DLD)。
兒童語(yǔ)言障礙往往難以與語(yǔ)言發(fā)育遲緩?fù)耆珔^(qū)分開來(lái),許多身體正常發(fā)育的兒童都會(huì)出現(xiàn)語(yǔ)言發(fā)育遲緩的現(xiàn)象,尤其常見于兒童發(fā)育早期。有的兒童隨著年齡的增長(zhǎng)會(huì)逐漸達(dá)到同齡正常語(yǔ)言水平,有的則可能發(fā)展為語(yǔ)言障礙。倘若兒童的語(yǔ)言發(fā)育問題得不到有效的識(shí)別和干預(yù),則不僅會(huì)阻礙兒童語(yǔ)言理解和語(yǔ)言表達(dá)能力的發(fā)展,還將對(duì)兒童的身心健康、學(xué)業(yè)以及未來(lái)的職業(yè)發(fā)展產(chǎn)生不良影響(Whitehurst et al. 1991;Bishop 2000;Rescorla 2009)。因此,在漢語(yǔ)兒童群體中廣泛開展語(yǔ)言能力評(píng)估,盡早準(zhǔn)確地篩查出兒童語(yǔ)言障礙,應(yīng)是兒童語(yǔ)言工作的重中之重。
語(yǔ)言的基本功能就在于交際,因此在兒童語(yǔ)言障礙篩查過程中,要側(cè)重對(duì)兒童言語(yǔ)交際能力的評(píng)估,即將兒童在言語(yǔ)交際過程中的行為作為評(píng)估其語(yǔ)言水平的核心內(nèi)容。但由于兒童的配合度低、專注力差,在短時(shí)間內(nèi)充分觀測(cè)到兒童的言語(yǔ)交際水平極為困難,因此目前國(guó)內(nèi)外都缺乏通行而有效的兒童言語(yǔ)交際能力評(píng)估方案,國(guó)內(nèi)大多數(shù)兒童語(yǔ)言障礙診斷都基于監(jiān)護(hù)人報(bào)告或長(zhǎng)時(shí)間的測(cè)評(píng),且以引進(jìn)西方量表為主,對(duì)漢語(yǔ)的特性考慮不足,往往只是對(duì)某方面語(yǔ)言能力的評(píng)估(如詞匯理解),尤其欠缺對(duì)言語(yǔ)交際能力的評(píng)估。要直接評(píng)估兒童言語(yǔ)交際水平,對(duì)兒童的言語(yǔ)進(jìn)行分析評(píng)估是最為直接和可觀的。近些年來(lái)語(yǔ)料庫(kù)成為語(yǔ)言學(xué)研究領(lǐng)域常用的數(shù)據(jù)庫(kù)形式之一,國(guó)內(nèi)外基于兒童語(yǔ)料庫(kù)建設(shè)對(duì)語(yǔ)言障礙診斷與語(yǔ)言發(fā)展測(cè)評(píng)進(jìn)行了一定的探索,取得了顯著的成績(jī)。數(shù)據(jù)庫(kù),尤其是語(yǔ)料庫(kù)的建設(shè),在語(yǔ)言障礙篩查領(lǐng)域有著廣闊的應(yīng)用空間。
本研究設(shè)計(jì)了一套面向語(yǔ)言障礙篩查的漢語(yǔ)兒童言語(yǔ)交際水平評(píng)估范式,能在短時(shí)間內(nèi)快速評(píng)估兒童的言語(yǔ)交際水平?;谶@個(gè)評(píng)估范式,我們采集了大量2~14歲兒童言語(yǔ)交際過程中的言語(yǔ)數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行了六大語(yǔ)言維度、16項(xiàng)細(xì)分指標(biāo)的語(yǔ)料分析標(biāo)注,建立起一個(gè)可應(yīng)用于語(yǔ)言能力評(píng)估和語(yǔ)言障礙篩查的漢語(yǔ)兒童言語(yǔ)數(shù)據(jù)庫(kù)。
(一)兒童語(yǔ)言能力評(píng)估概況
目前國(guó)內(nèi)外兒童語(yǔ)言能力測(cè)評(píng)工具類型包括調(diào)查問卷、訪談?wù)疹櫿?、環(huán)境觀察、標(biāo)準(zhǔn)化評(píng)量工具、語(yǔ)言樣本分析等(锜寶香2006)。大多數(shù)語(yǔ)言測(cè)評(píng)都選擇使用標(biāo)準(zhǔn)化的評(píng)估工具,以便實(shí)現(xiàn)良好的信度和效度水平。按照評(píng)估對(duì)象劃分,可以分為直接評(píng)估和間接評(píng)估兩種:前者直接對(duì)兒童的語(yǔ)言表現(xiàn)進(jìn)行測(cè)評(píng);后者則通過監(jiān)護(hù)人填寫問卷等方式間接測(cè)評(píng),往往用于低齡幼兒。按照評(píng)估內(nèi)容劃分,標(biāo)準(zhǔn)化評(píng)估方法又可分為綜合發(fā)育評(píng)估和語(yǔ)言專項(xiàng)評(píng)估。
中國(guó)對(duì)兒童語(yǔ)言問題的認(rèn)識(shí)起步較晚,較為成熟的漢語(yǔ)兒童語(yǔ)言能力測(cè)評(píng)量表相對(duì)欠缺。在專門針對(duì)兒童語(yǔ)言能力進(jìn)行評(píng)估的工具中,既有基于西方國(guó)家的語(yǔ)言量表進(jìn)行漢化的評(píng)估工具,也有少數(shù)針對(duì)漢語(yǔ)獨(dú)立開發(fā)的語(yǔ)言評(píng)估量表。常見評(píng)估量表情況如表1所示。
從中不難發(fā)現(xiàn),當(dāng)前漢語(yǔ)兒童語(yǔ)言能力評(píng)估方法具有以下問題:
一是廣泛引進(jìn)西方的標(biāo)準(zhǔn)化評(píng)估量表,缺乏自主研發(fā)的、可行性和科學(xué)性較高的評(píng)估工具。毋庸置疑,對(duì)漢語(yǔ)兒童直接使用從外語(yǔ)翻譯為漢語(yǔ)的量表是不夠科學(xué)的。因此,在借鑒西方量表時(shí)要考慮語(yǔ)言文化背景,并建立不同地區(qū)、年齡和年級(jí)兒童語(yǔ)言能力的常模。同時(shí),當(dāng)前亟待開發(fā)出具有漢語(yǔ)特色、推廣性強(qiáng)的語(yǔ)言功能評(píng)估工具。在這一方面,臺(tái)灣地區(qū)做出了較好的示范,從早期翻譯國(guó)外量表走向開發(fā)本土化評(píng)估工具,如“國(guó)小兒童語(yǔ)言能力評(píng)量工具”(林寶貴,锜寶香2000)、“話語(yǔ)學(xué)齡兒童溝通及語(yǔ)言能力測(cè)驗(yàn)”(黃瑞珍,等2014)等??紤]到大陸地區(qū)各省不同的語(yǔ)言環(huán)境,語(yǔ)言評(píng)估工具的開發(fā)和推行則更具挑戰(zhàn)性。
二是偏重低齡兒童,對(duì)于學(xué)齡期兒童關(guān)注不足。這是國(guó)內(nèi)外兒童語(yǔ)言發(fā)育進(jìn)程評(píng)估方法的共同問題。對(duì)低齡兒童的語(yǔ)言關(guān)注較多,并在此基礎(chǔ)上進(jìn)行早期的指導(dǎo)與干預(yù);但這也導(dǎo)致了大齡兒童的語(yǔ)言評(píng)估存在缺口,社會(huì)對(duì)兒童語(yǔ)言的持續(xù)發(fā)育情況不夠重視,以至于許多學(xué)齡兒童的語(yǔ)言障礙得不到識(shí)別。
三是全面性弱、精細(xì)化程度低,尤其欠缺對(duì)言語(yǔ)交際能力的評(píng)估。已有的兒童語(yǔ)言發(fā)育評(píng)估大多關(guān)注兒童某方面的語(yǔ)言能力,其中詞匯評(píng)估占據(jù)了很大的比重,而其他語(yǔ)言能力的評(píng)估則十分缺乏(黃文橋2020)。許多量表屬于綜合性發(fā)育評(píng)估量表,語(yǔ)言只是綜合評(píng)估的一部分,因此不夠全面。另外,語(yǔ)言是交際的工具,習(xí)得語(yǔ)言的目的就在于在交際中運(yùn)用語(yǔ)言,因此對(duì)言語(yǔ)交際能力的評(píng)估應(yīng)是兒童語(yǔ)言發(fā)展評(píng)估的重要內(nèi)容。
四是測(cè)評(píng)時(shí)間普遍較長(zhǎng),需要專業(yè)人員輔助實(shí)施。由于兒童注意力容易分散,耗時(shí)較長(zhǎng)的測(cè)評(píng)方案實(shí)際上難以精確地測(cè)量?jī)和恼Z(yǔ)言能力,因?yàn)閮和3R驅(qū)y(cè)試內(nèi)容缺乏興趣或于測(cè)試后期出現(xiàn)倦怠心理而放棄繼續(xù)測(cè)評(píng)。中國(guó)是人口大國(guó),現(xiàn)有的醫(yī)療資源也難以保障對(duì)兒童進(jìn)行長(zhǎng)時(shí)間的一對(duì)一測(cè)評(píng)。因此,開發(fā)一套快速且高效、易于執(zhí)行的兒童語(yǔ)言測(cè)評(píng)工具至關(guān)重要。
(二)基于語(yǔ)料庫(kù)建設(shè)的兒童語(yǔ)言發(fā)展評(píng)估
近年來(lái),隨著計(jì)算機(jī)科學(xué)與人工智能技術(shù)的發(fā)展,語(yǔ)料庫(kù)和大數(shù)據(jù)分析成為語(yǔ)言學(xué)研究熱門路線,基于兒童語(yǔ)料庫(kù)建設(shè)的語(yǔ)言研究和語(yǔ)言能力評(píng)估、語(yǔ)言障礙診斷也不斷涌現(xiàn)。
目前國(guó)外兒童語(yǔ)料庫(kù)建設(shè)最成熟的成果是兒童語(yǔ)言數(shù)據(jù)交流系統(tǒng)CHILDES(Child Language Data Exchange System),它是目前世界范圍內(nèi)使用最廣、規(guī)模最大的兒童語(yǔ)料庫(kù),包括三大部分——兒童語(yǔ)言數(shù)據(jù)庫(kù)、錄寫賦碼系統(tǒng)、自動(dòng)分析系統(tǒng)。目前,DATA數(shù)據(jù)庫(kù)收錄了全世界包括漢語(yǔ)普通話和粵方言在內(nèi)的28種語(yǔ)言的兒童語(yǔ)料,支持產(chǎn)出了超過3000篇研究論文(詳見溫志軍,胡瑰玲2001)。截至2020年12月,在CHILDES系統(tǒng)數(shù)據(jù)庫(kù)中,漢語(yǔ)普通話兒童語(yǔ)料庫(kù)包含19個(gè)涉及不同話語(yǔ)場(chǎng)景的子語(yǔ)料庫(kù),以3~6歲兒童言語(yǔ)數(shù)據(jù)為主。另外,國(guó)內(nèi)也建成了一些出于特定研究目的的小型語(yǔ)料庫(kù),如中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所基于對(duì)23名兒童3年左右的縱向觀察建立的漢語(yǔ)普通話兒童語(yǔ)音庫(kù)(高軍2012);張廷香(2010)建立的3~6歲漢語(yǔ)兒童語(yǔ)料庫(kù);胡亞娟(2015)、楊金煥(2016)先后建立的3~4歲、4~5歲漢語(yǔ)兒童語(yǔ)料庫(kù),分別探究幼兒語(yǔ)言的性別差異和會(huì)話能力發(fā)展情況。這類語(yǔ)料庫(kù)通常規(guī)模較小,標(biāo)注內(nèi)容服務(wù)于特定研究目的。
在語(yǔ)料庫(kù)的應(yīng)用方面,華東師范大學(xué)兒童語(yǔ)言研究中心團(tuán)隊(duì)基于341名3~6歲漢語(yǔ)兒童自由游戲語(yǔ)料,參考CHILDES中的KIDEVAL指令,初步構(gòu)建了漢語(yǔ)兒童詞匯和語(yǔ)法發(fā)展常模與指標(biāo)體系,并依此探索可預(yù)測(cè)兒童語(yǔ)言障礙的指標(biāo),因而可應(yīng)用于語(yǔ)言障礙診斷與語(yǔ)言發(fā)展測(cè)評(píng)(張義賓2019;周兢,張義賓2020)。這是探究漢語(yǔ)兒童語(yǔ)言發(fā)展規(guī)律及篩查語(yǔ)言障礙的有益探索,但一方面仍需進(jìn)一步拓展兒童常模的年齡范圍,另一方面所觀測(cè)的指標(biāo)也不應(yīng)僅限于詞匯和語(yǔ)法。
總體而言,目前漢語(yǔ)兒童語(yǔ)料庫(kù)建設(shè)及研究仍存在以下不足:(1)語(yǔ)料標(biāo)注不充分??紤]到漢語(yǔ)語(yǔ)言學(xué)個(gè)性特征,照搬其他語(yǔ)言的標(biāo)注經(jīng)驗(yàn)不可取,而且現(xiàn)有的兒童語(yǔ)料標(biāo)注側(cè)重詞匯、語(yǔ)法等有限維度,缺乏對(duì)兒童語(yǔ)料和語(yǔ)言能力研究的全局視角。(2)語(yǔ)料庫(kù)建設(shè)發(fā)展不平衡,單個(gè)語(yǔ)料庫(kù)所涉及的兒童人口學(xué)特征(如年齡、民族、居住地等)單一。(3)語(yǔ)料庫(kù)的應(yīng)用價(jià)值亟待開發(fā)。豐富完善的兒童語(yǔ)料庫(kù)在語(yǔ)言障礙和相關(guān)疾病篩查、人工智能等領(lǐng)域有廣闊的應(yīng)用潛力。(4)亟待應(yīng)用大數(shù)據(jù)機(jī)器學(xué)習(xí)方法。無(wú)論是國(guó)際兒童語(yǔ)料庫(kù),還是漢語(yǔ)兒童語(yǔ)料庫(kù),都已經(jīng)由單純的語(yǔ)料共享向兒童語(yǔ)言發(fā)展測(cè)評(píng)、語(yǔ)言障礙診斷系統(tǒng)建設(shè)轉(zhuǎn)變,初步印證了基于大數(shù)據(jù)語(yǔ)料分析這一非標(biāo)準(zhǔn)化評(píng)估方法在漢語(yǔ)兒童語(yǔ)言測(cè)評(píng)中的可行性。面對(duì)現(xiàn)有兒童語(yǔ)言發(fā)展評(píng)估工具不足的困境,迫切需要通過人工智能的方法來(lái)自動(dòng)、定量地衡量?jī)和Z(yǔ)言發(fā)育的情況(Leit?to et al. 1997)。
二、面向語(yǔ)言障礙篩查的漢語(yǔ)兒童言語(yǔ)交際評(píng)估方案
(一)設(shè)計(jì)思路
我們?cè)O(shè)計(jì)的面向語(yǔ)言障礙篩查的漢語(yǔ)兒童言語(yǔ)交際水平評(píng)估范式首先全部采用圖片、視頻、音頻形式來(lái)向兒童呈現(xiàn)評(píng)估任務(wù),趣味性較強(qiáng),過程中采集兒童的言語(yǔ)錄音。其次,為了實(shí)現(xiàn)語(yǔ)言障礙的篩查、分類、定級(jí),需要對(duì)不同說話人的語(yǔ)料進(jìn)行橫向?qū)Ρ龋蚨自u(píng)估以一套固定程式為引導(dǎo),以實(shí)現(xiàn)多個(gè)兒童言語(yǔ)樣本具備可供比較的特征。再者,考慮到兒童容易出現(xiàn)注意力分散的問題,我們?cè)陬}量上進(jìn)行了控制,可以在大約10分鐘內(nèi)快速、充分引導(dǎo)出兒童的最優(yōu)言語(yǔ)表現(xiàn)。
評(píng)估所用的固定引導(dǎo)程序涵蓋重復(fù)跟讀、重述、自主發(fā)言等多種言語(yǔ)模式,不同題型的題目?jī)?nèi)部在語(yǔ)言學(xué)特征(如詞頻、句長(zhǎng)、語(yǔ)法和語(yǔ)義復(fù)雜度等)存在難度差異,遵循由易到難的階梯分布,能采集到兒童真實(shí)且豐富的言語(yǔ)數(shù)據(jù),進(jìn)而評(píng)估兒童的綜合言語(yǔ)交際能力。
(二)固定引導(dǎo)程序
測(cè)試分為3種題型,分別為圖片內(nèi)容復(fù)述、視頻內(nèi)容復(fù)述和自主發(fā)言,一共7道題目。下文舉例介紹3類題目的內(nèi)容。
1.圖片內(nèi)容復(fù)述
這一類又分為聽錄音復(fù)述和看圖說話兩種。聽錄音復(fù)述題目的測(cè)試程序會(huì)自動(dòng)播放關(guān)于圖片內(nèi)容的指導(dǎo)語(yǔ)錄音,兒童需要在此基礎(chǔ)上自己復(fù)述圖片的內(nèi)容。本組共3道題目,難度依次提升,測(cè)試形式如圖1所示??磮D說話部分無(wú)指導(dǎo)語(yǔ),兒童直接看圖描述故事內(nèi)容,測(cè)試形式如圖2所示。
2.視頻內(nèi)容復(fù)述
兒童需要認(rèn)真觀看兩個(gè)短視頻,第一個(gè)有指導(dǎo)語(yǔ),第二個(gè)無(wú)指導(dǎo)語(yǔ),觀看完成后復(fù)述看到的內(nèi)容。測(cè)試形式如圖3所示。
3.自由發(fā)言
從3道自主發(fā)言題目中任選一道回答。兒童無(wú)須按照回答“提示”一一回答,只要所講內(nèi)容與題目相關(guān)即可。以題目1“自我介紹”為例,向兒童提問:“請(qǐng)談?wù)勀阕约?,比如你和你的爸爸媽媽是哪里人,你今年幾歲了,你有沒有兄弟姐妹,你平時(shí)有什么興趣愛好,喜歡吃什么東西,等等?!?/p>
(三)數(shù)據(jù)采集方法
為了實(shí)現(xiàn)漢語(yǔ)兒童言語(yǔ)交際水平的評(píng)估,要保質(zhì)保量地完成兒童言語(yǔ)數(shù)據(jù)的采集,即利用固定程序引導(dǎo)兒童發(fā)音并儲(chǔ)存語(yǔ)音數(shù)據(jù)。我們通過中山大學(xué)中文系神經(jīng)語(yǔ)言學(xué)教學(xué)實(shí)驗(yàn)室開發(fā)的數(shù)據(jù)采集軟件進(jìn)行一對(duì)一的兒童語(yǔ)言數(shù)據(jù)采集。在采集數(shù)據(jù)時(shí),需保證環(huán)境安靜、無(wú)明顯噪音,最好在單獨(dú)的封閉房間內(nèi)進(jìn)行。對(duì)于低齡幼兒,父母或老師可在一旁陪同以穩(wěn)定兒童情緒,但避免對(duì)兒童進(jìn)行過度提示(如直接告訴兒童如何作答)。在評(píng)估過程中,兒童的語(yǔ)音數(shù)據(jù)將以題目為單位進(jìn)行儲(chǔ)存,相關(guān)數(shù)據(jù)將直接傳送到后臺(tái)。另外考慮到兒童單次錄音可能失敗,如意外錄入他人的說話聲、環(huán)境噪音,或兒童拒絕發(fā)言等情況,每道題目允許重復(fù)錄音2次,以最終次為準(zhǔn)。
三、面向語(yǔ)言障礙篩查的漢語(yǔ)兒童言語(yǔ)交際水平數(shù)據(jù)庫(kù)建設(shè)
在獲取兒童的原始語(yǔ)料后,首先對(duì)數(shù)據(jù)歸檔,分別以被試和題型為單位,分類儲(chǔ)存原始音頻數(shù)據(jù),建立起漢語(yǔ)兒童言語(yǔ)交際數(shù)據(jù)庫(kù);其次,通過全面和詳細(xì)的語(yǔ)料標(biāo)注實(shí)現(xiàn)數(shù)據(jù)的對(duì)齊。由于兒童的語(yǔ)言尚在發(fā)展期,對(duì)語(yǔ)言障礙的篩查應(yīng)當(dāng)涉及語(yǔ)言的多個(gè)維度和層次,如基礎(chǔ)層級(jí)上的發(fā)音準(zhǔn)確性和高級(jí)層次上的表達(dá)邏輯性等,因此我們?cè)O(shè)定的言語(yǔ)標(biāo)注項(xiàng)為語(yǔ)音、語(yǔ)義、語(yǔ)法、能產(chǎn)性、流暢性、邏輯性六大維度,可細(xì)分為16項(xiàng)指標(biāo)。
(一)數(shù)據(jù)標(biāo)注方法
1.標(biāo)注的前期處理及標(biāo)注軟件
數(shù)據(jù)處理由3名具有語(yǔ)言學(xué)專業(yè)背景的研究生進(jìn)行,在語(yǔ)料標(biāo)注環(huán)節(jié)進(jìn)行3輪標(biāo)注,以確保標(biāo)注的可靠性。一般質(zhì)量良好的數(shù)據(jù)可直接進(jìn)行語(yǔ)料標(biāo)注。但在以下情況下需要對(duì)音頻進(jìn)行剪輯和降噪
處理:
①若音頻中有測(cè)試人員的說話內(nèi)容,需全部剪切;
②若音頻含有背景噪音,與人聲相混,應(yīng)降噪至能聽清人聲的標(biāo)準(zhǔn)。
若經(jīng)過預(yù)處理后,音頻質(zhì)量仍然不合格,如環(huán)境噪音過大、降噪后過于失真等,則舍棄這部分不合格音頻。本研究所涵蓋的510名被試均完成了語(yǔ)言測(cè)評(píng),且音頻質(zhì)量良好。
經(jīng)過預(yù)處理后的音頻數(shù)據(jù),使用獨(dú)立開發(fā)的面向特殊人群的語(yǔ)料標(biāo)注軟件系統(tǒng)(見圖4)進(jìn)行語(yǔ)料轉(zhuǎn)寫,并輔以語(yǔ)料標(biāo)注。該系統(tǒng)包含以下功能:音頻信息顯示、標(biāo)注音頻的自動(dòng)播放切換、調(diào)整音頻播放進(jìn)度、機(jī)器自動(dòng)輔助標(biāo)注、人工標(biāo)注自動(dòng)合并、多輪標(biāo)注計(jì)算沖突項(xiàng)目、自動(dòng)生成沖突音頻數(shù)據(jù)庫(kù)。標(biāo)注完成可保存該段音頻的詳細(xì)標(biāo)注信息(.json格式),同時(shí)得到一個(gè)自動(dòng)生成的標(biāo)注數(shù)據(jù)表(.csv格式)。
2.標(biāo)注項(xiàng)目
由于兒童語(yǔ)言障礙具有不同的類型,如聽理解障礙、構(gòu)音障礙、語(yǔ)用障礙等,對(duì)兒童言語(yǔ)數(shù)據(jù)的標(biāo)注和評(píng)分也應(yīng)該覆蓋多個(gè)方面,才能實(shí)現(xiàn)對(duì)兒童語(yǔ)言障礙的有效分類和定級(jí)。在數(shù)據(jù)庫(kù)建設(shè)方面,相較于儲(chǔ)存原始兒童言語(yǔ)數(shù)據(jù)的生語(yǔ)料庫(kù),經(jīng)過細(xì)致專業(yè)標(biāo)注的熟語(yǔ)料庫(kù)無(wú)疑更具研究?jī)r(jià)值。因此,我們采用獨(dú)立開發(fā)的轉(zhuǎn)寫標(biāo)注軟件對(duì)語(yǔ)料進(jìn)行轉(zhuǎn)寫以及多維度的語(yǔ)言學(xué)人工標(biāo)注分析,并通過機(jī)器自動(dòng)識(shí)別提取一些言語(yǔ)指標(biāo)(如停頓次數(shù)和時(shí)長(zhǎng)等),包含語(yǔ)音、能產(chǎn)性、流暢度、語(yǔ)法、語(yǔ)義、邏輯六大語(yǔ)言維度,共細(xì)分為16個(gè)指標(biāo),從而實(shí)現(xiàn)了兒童言語(yǔ)交際水平的精細(xì)評(píng)估。詳細(xì)標(biāo)注項(xiàng)目如表2所示。
在標(biāo)注指標(biāo)的設(shè)計(jì)方面,大多數(shù)兒童語(yǔ)言障礙的篩查量表僅對(duì)兒童的詞匯理解和表達(dá)能力進(jìn)行量化評(píng)估。而對(duì)于言語(yǔ)交際水平的評(píng)估而言,發(fā)音清晰度和表達(dá)能產(chǎn)性作為言語(yǔ)交際的基礎(chǔ)應(yīng)被納入考量。兒童要能與他人進(jìn)行良好的溝通,首先其言語(yǔ)應(yīng)當(dāng)具有較高的可懂度和能產(chǎn)性,即兒童產(chǎn)出的話語(yǔ)內(nèi)容能被他人識(shí)別和理解,因此語(yǔ)音、能產(chǎn)性兩類指標(biāo)是兒童的基礎(chǔ)層級(jí)能力。其次,言語(yǔ)的語(yǔ)法和流暢度也應(yīng)納入評(píng)估,詳細(xì)標(biāo)注兒童在話語(yǔ)中語(yǔ)法錯(cuò)誤的數(shù)量以及出現(xiàn)長(zhǎng)時(shí)間停頓、重復(fù)、改述等減損流暢度的情況,這兩類指標(biāo)屬于中等層級(jí)能力。我們還設(shè)計(jì)了語(yǔ)義、邏輯兩類高階能力指標(biāo),主要考查語(yǔ)篇中的表意完整性和話語(yǔ)組織能力。
為保證所有語(yǔ)料標(biāo)注的可靠性和準(zhǔn)確性,我們采用3輪標(biāo)注的方式。首先讓兩位具有語(yǔ)言學(xué)專業(yè)知識(shí)背景的標(biāo)注員對(duì)同一語(yǔ)料分別標(biāo)注,直覺打分應(yīng)做到完全一致,除直覺打分外的各個(gè)指標(biāo)均設(shè)置10%的容錯(cuò)率。接著選取兩輪標(biāo)注后存在沖突的語(yǔ)料進(jìn)行第三次標(biāo)注,由3位標(biāo)注員對(duì)每段語(yǔ)料同時(shí)標(biāo)注,在商議后3位標(biāo)注員的意見仍不一致的情況下采取投票制,最終得出所有指標(biāo)得分情況。根據(jù)標(biāo)注后自動(dòng)生成的數(shù)據(jù)結(jié)果(csv格式文件),進(jìn)一步對(duì)數(shù)據(jù)結(jié)果進(jìn)行歸一化(normalization)處理。對(duì)于語(yǔ)音、流暢性、語(yǔ)法和邏輯相關(guān)的負(fù)邏輯指標(biāo),分?jǐn)?shù)歸一化的方法為:
x' = max{X} - x
max{X} - min{X}
x∈X?RN,X代表以往數(shù)據(jù)庫(kù)收集所有被試表達(dá)數(shù)據(jù)的單項(xiàng)指標(biāo)分?jǐn)?shù),N為被試數(shù)量。對(duì)于能產(chǎn)性、語(yǔ)義相關(guān)的正邏輯指標(biāo),分?jǐn)?shù)歸一化的方法為:
x' = x - min{X}
max{X} - min{X}
歸一化后的分?jǐn)?shù)能較好地代表各項(xiàng)指標(biāo)的能力水平,分?jǐn)?shù)越高意味著能力越強(qiáng)。標(biāo)注數(shù)據(jù)分類分層儲(chǔ)存在語(yǔ)料數(shù)據(jù)庫(kù)中,可用于后續(xù)進(jìn)一步的數(shù)據(jù)挖掘,如大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)等。
3.語(yǔ)音維度的標(biāo)注
語(yǔ)音維度包括輔音聲母、韻母和聲調(diào)3項(xiàng)指標(biāo)。對(duì)兒童語(yǔ)料進(jìn)行聲母、韻母、聲調(diào)錯(cuò)誤的數(shù)量標(biāo)注,即在音節(jié)單位內(nèi)部對(duì)語(yǔ)音準(zhǔn)確度進(jìn)行考察。我們僅對(duì)音位層次的語(yǔ)音錯(cuò)誤進(jìn)行標(biāo)注,即“讀錯(cuò)一個(gè)字的聲母、韻母或聲調(diào)”(劉照雄1996)。對(duì)聽感上發(fā)音不夠飽滿的語(yǔ)音缺陷(如撮口呼的韻母圓唇度不夠、去聲下降不到位等),則不作語(yǔ)音錯(cuò)誤標(biāo)注,只在最后的直覺打分處適度扣分。語(yǔ)音維度標(biāo)注示例如下:
(1)我不喜歡吃蘿卜,我喜歡吃糖果。(自我介紹,3:6男)
→,。
4.語(yǔ)義維度的標(biāo)注
語(yǔ)義維度僅語(yǔ)義點(diǎn)覆蓋情況一個(gè)指標(biāo)。在圖片描述和視頻復(fù)述兩類題型中,相應(yīng)設(shè)定了每道題的語(yǔ)義信息點(diǎn),說出某個(gè)語(yǔ)義點(diǎn),就在標(biāo)注軟件內(nèi)打“√”。倘若兒童答非所問,則勾選“語(yǔ)義冗余”這一項(xiàng)。語(yǔ)義維度標(biāo)注示例如下:
(2)正在 看各個(gè)國(guó)家的地址和各個(gè)國(guó)家的名字。(李老師正在教小朋友們看地球儀,8:6女)
→目標(biāo)語(yǔ)義信息點(diǎn)包括:(李)老師 教 小朋友/學(xué)生 ?看地球儀;
5.能產(chǎn)性維度的標(biāo)注
能產(chǎn)性維度包括實(shí)際音節(jié)數(shù)、發(fā)音時(shí)長(zhǎng)、語(yǔ)速3項(xiàng)指標(biāo)。我們所定義的“能產(chǎn)性”是指被試在單位時(shí)間產(chǎn)出有意義的話語(yǔ)的能力。所有標(biāo)注項(xiàng)目都基于實(shí)際音節(jié)數(shù)這一指標(biāo),發(fā)音時(shí)長(zhǎng)由計(jì)算機(jī)自動(dòng)識(shí)別得出,累加非停頓區(qū)域的時(shí)長(zhǎng)即為發(fā)音時(shí)長(zhǎng)。語(yǔ)速則為實(shí)際音節(jié)數(shù)與總發(fā)音時(shí)長(zhǎng)、停頓時(shí)長(zhǎng)之和的比值,即每秒產(chǎn)出實(shí)際音節(jié)的數(shù)量,在人工標(biāo)注實(shí)際音節(jié)數(shù)后,計(jì)算機(jī)結(jié)合發(fā)音時(shí)長(zhǎng)、停頓時(shí)長(zhǎng)的標(biāo)注可自動(dòng)生成語(yǔ)速。能產(chǎn)性維度標(biāo)注示例如下:
(3)兔子跑得很快,烏龜卻慢吞吞的。兔子跑到樹旁邊睡了一個(gè)懶覺,結(jié)果烏龜先到終點(diǎn)了。(龜兔賽跑,4:1男)
→人工轉(zhuǎn)寫后計(jì)得;機(jī)器標(biāo)注發(fā)音時(shí)長(zhǎng)10.643秒,語(yǔ)速1.854個(gè)音節(jié)/秒。
6.流暢性維度的標(biāo)注
流暢性維度包括冗贅獨(dú)立語(yǔ)、冗贅語(yǔ)氣詞、語(yǔ)音改述、內(nèi)容改述、重復(fù)、停頓次數(shù)和停頓時(shí)長(zhǎng)共7項(xiàng)指標(biāo)。由于口語(yǔ)表達(dá)的隨意性,說話人常常會(huì)在語(yǔ)言思維受阻時(shí)出現(xiàn)無(wú)意義停頓,或增加多余成分,如冗贅語(yǔ)、重復(fù),或通過改述來(lái)修正不當(dāng)之處,而這些都會(huì)減損語(yǔ)言表達(dá)的流暢性和完整性。對(duì)于停頓指標(biāo),我們參考Raupach(1980)、張文忠和吳旭東(2001)對(duì)停頓的定義,即0.3秒及以上時(shí)間閾值為停頓的下限,并通過計(jì)算機(jī)自動(dòng)識(shí)別停頓次數(shù)與時(shí)長(zhǎng)。流暢性維度標(biāo)注示例如下:
(4)烏龜和兔子比,兔子跑得快。然后呢,烏龜跑得慢。呃,,,兔子就很累了。烏龜呢,就,呃,,,兔子睡醒了。然后飛來(lái)一個(gè)小鳥。,睡醒了以后,我看到烏龜就跑到終點(diǎn)線了。然后,就沒啦?。斖觅惻埽?:9女)
→人工標(biāo)注(然后/然后呢),冗贅語(yǔ)氣詞2(呃),內(nèi)容改述1,重復(fù)4;機(jī)器標(biāo)注停頓次數(shù)19,停頓時(shí)長(zhǎng)19.235秒。對(duì)于“然后”的判定采取較寬容的態(tài)度,若“然后”可視為表時(shí)間或事理邏輯上的承接性連詞,就不計(jì)入冗贅獨(dú)立語(yǔ)。對(duì)于連續(xù)重復(fù)出現(xiàn)的“然后(呢)”,第二個(gè)通常直接判定為冗贅獨(dú)立語(yǔ)。
7.語(yǔ)法維度的標(biāo)注
語(yǔ)法維度僅語(yǔ)法錯(cuò)誤一個(gè)指標(biāo)。在語(yǔ)法標(biāo)注時(shí),考慮到兒童語(yǔ)言習(xí)得進(jìn)程的特殊性,我們采取較寬松的標(biāo)注原則,主要考慮明顯影響交際的語(yǔ)法錯(cuò)誤:①句內(nèi)語(yǔ)序錯(cuò)誤,如主語(yǔ)、謂語(yǔ)、賓語(yǔ)的位置顛倒;②成分殘缺,如缺少必要的謂語(yǔ)動(dòng)詞、時(shí)態(tài)助詞等句法成分導(dǎo)致不成句;③句式雜糅,結(jié)構(gòu)混亂;④虛詞使用不當(dāng)。語(yǔ)法維度標(biāo)注示例如下:
(5)然后它就得了第一名,(龜兔賽跑,6:1女)
→(語(yǔ)序錯(cuò)誤),兒童實(shí)際要表達(dá)“然后烏龜它就得了第一名”。
(6)兔子跑快,烏龜跑慢(龜兔賽跑,3:4男)
→(成分殘缺),缺少結(jié)構(gòu)助詞“得”,應(yīng)為“跑得快”“跑得慢”。
(7)最后,小兔子離開跑道(龜兔賽跑,4:3女)
→(虛詞使用錯(cuò)誤),結(jié)構(gòu)助詞“的”可改為動(dòng)態(tài)助詞“了”。
8.邏輯維度的標(biāo)注
邏輯維度僅邏輯錯(cuò)誤一個(gè)指標(biāo)。若兒童在篇章表達(dá)時(shí)前后邏輯矛盾、時(shí)間順序錯(cuò)誤,或句間缺少必要的銜接詞以及銜接詞誤用(如關(guān)聯(lián)詞誤用)等,均屬于言語(yǔ)邏輯錯(cuò)誤。邏輯維度標(biāo)注示例如下:
(8)小豬、小豬佩奇,還有、還有、還有豬爸爸,他們?cè)谔?,他們?cè)谔嗫印寢屨f:(小豬佩奇,6:7男)
→(時(shí)間順序錯(cuò)誤),“下雨”這一事件是跳泥坑之前發(fā)生的,應(yīng)作為敘事背景先講述。
(二)漢語(yǔ)兒童言語(yǔ)交際水平數(shù)據(jù)庫(kù)
通過兒童語(yǔ)料的采集和標(biāo)注,我們建立起一個(gè)2~14歲漢語(yǔ)兒童言語(yǔ)交際水平數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)目前已經(jīng)儲(chǔ)存了966名漢語(yǔ)兒童在固定程序引導(dǎo)下的言語(yǔ)數(shù)據(jù),這些兒童來(lái)自廣東、廣西、貴州等不同經(jīng)濟(jì)發(fā)展水平的地區(qū),除漢族兒童外,還包括約200名壯族、侗族、瑤族、苗族等少數(shù)民族兒童,漢族兒童又包含約200名掌握母語(yǔ)方言(以粵方言、客家話、西南官話為主)的被試,約100名存在語(yǔ)言障礙及相關(guān)疾?。ㄈ缏犝?、視障、孤獨(dú)癥、神經(jīng)發(fā)育異常等)的兒童,數(shù)據(jù)較為豐富。對(duì)于這些數(shù)據(jù),我們分別按照被試和題型進(jìn)行分類歸檔,并進(jìn)行了統(tǒng)一的文本轉(zhuǎn)寫。其中,對(duì)638名兒童的語(yǔ)料進(jìn)行了標(biāo)注,并輸出言語(yǔ)交際能力得分。數(shù)據(jù)庫(kù)目前概況見表3。
四、漢語(yǔ)兒童言語(yǔ)交際水平評(píng)估系統(tǒng)應(yīng)用前景
本數(shù)據(jù)庫(kù)具有廣闊的語(yǔ)言學(xué)、教育學(xué)、醫(yī)學(xué)研究?jī)r(jià)值,如可以根據(jù)兒童語(yǔ)料文本對(duì)兒童習(xí)得語(yǔ)言過程中的語(yǔ)法偏誤、篇章組織能力進(jìn)行探究,對(duì)比不同地域漢語(yǔ)兒童的語(yǔ)言發(fā)展能力差異等。我們已初步使用該數(shù)據(jù)庫(kù)內(nèi)容進(jìn)行了多項(xiàng)關(guān)于兒童語(yǔ)言障礙研究和服務(wù)的開發(fā)探索,簡(jiǎn)要介紹如下。
(一)結(jié)合機(jī)器深度學(xué)習(xí)的漢語(yǔ)兒童語(yǔ)言障礙智能快速篩查
該數(shù)據(jù)庫(kù)結(jié)合機(jī)器學(xué)習(xí)技術(shù)可用于漢語(yǔ)兒童語(yǔ)言障礙的智能化自動(dòng)篩查,基于固定程序引導(dǎo)的語(yǔ)料具有較高的可比性,因而適合利用機(jī)器學(xué)習(xí)相關(guān)技術(shù)建模訓(xùn)練數(shù)據(jù),實(shí)現(xiàn)語(yǔ)言障礙的自動(dòng)篩查。Zhang et al.(2020)基于本數(shù)據(jù)庫(kù)中的284名漢語(yǔ)兒童言語(yǔ)交際水平音頻數(shù)據(jù)和標(biāo)注數(shù)據(jù),通過雙通路(two-stream encoder)深度學(xué)習(xí)算法,同時(shí)提取語(yǔ)音流和內(nèi)容流兩個(gè)維度上的特征,從而建立起漢語(yǔ)兒童語(yǔ)言音頻特征、各項(xiàng)標(biāo)注指標(biāo)與語(yǔ)言能力等級(jí)之間的相關(guān)模型,篩查語(yǔ)言障礙的準(zhǔn)確率高達(dá)92.6%。
除此之外,還可從語(yǔ)言學(xué)角度進(jìn)一步探索漢語(yǔ)兒童語(yǔ)言障礙的特點(diǎn),語(yǔ)言障礙兒童在言語(yǔ)交際中的各個(gè)維度表現(xiàn)如圖5所示,不同線條代表不同被試的言語(yǔ)表現(xiàn)得分。
六大語(yǔ)言維度對(duì)于兒童語(yǔ)言障礙篩查的貢獻(xiàn)率也存在差異,如表4所示。其中排在前三的是流暢性、語(yǔ)音、能產(chǎn)性,貢獻(xiàn)率分別為27.6%、23.7%和17.3%。
各個(gè)語(yǔ)言指標(biāo)對(duì)于言語(yǔ)交際得分的貢獻(xiàn)率也存在差異。其中排在前五的語(yǔ)言指標(biāo)為語(yǔ)義、輔音聲母、冗贅語(yǔ)、內(nèi)容改述、語(yǔ)法,如表5所示。
目前,此漢語(yǔ)兒童言語(yǔ)交際水平數(shù)據(jù)庫(kù)仍在擴(kuò)大建設(shè)當(dāng)中。一方面,標(biāo)注的數(shù)據(jù)結(jié)果可以作為模型的訓(xùn)練集進(jìn)一步提升智能化篩查語(yǔ)言障礙的準(zhǔn)確率;另一方面,隨著不同年齡段兒童言語(yǔ)數(shù)據(jù)量的提升,我們有望建立起漢語(yǔ)兒童言語(yǔ)交際能力發(fā)展數(shù)據(jù)的常模,從而更精準(zhǔn)地評(píng)估兒童綜合言語(yǔ)能力的發(fā)展,如測(cè)得兒童的語(yǔ)言發(fā)育年齡、明確語(yǔ)言障礙的具體分型等等,這對(duì)于兒童語(yǔ)言障礙的篩查診斷以及言語(yǔ)矯正訓(xùn)練都具有重要意義。
(二)人工耳蝸植入兒童綜合語(yǔ)言能力研究
1.人工耳蝸植入兒童綜合語(yǔ)言能力發(fā)展研究
漢語(yǔ)兒童言語(yǔ)交際評(píng)估系統(tǒng)還可以應(yīng)用于特殊兒童的語(yǔ)言能力研究,如人工耳蝸植入兒童。通過精細(xì)全面的語(yǔ)言能力評(píng)估,我們不僅可以了解特殊兒童的言語(yǔ)能力發(fā)展情況,判定人工耳蝸的有效性,還能將特殊兒童的各語(yǔ)言維度與正常兒童進(jìn)行對(duì)比,有針對(duì)性地為他們?cè)O(shè)計(jì)言語(yǔ)提升方案。本數(shù)據(jù)庫(kù)已收入40名人工耳蝸植入(cochlear implant,CI)兒童的標(biāo)注數(shù)據(jù),并將這40名CI兒童被試按照實(shí)際年齡分為3組:2.5~4歲、5~6歲、7~10歲,對(duì)其進(jìn)行ANOVA單因素分析,結(jié)果發(fā)現(xiàn)3個(gè)年齡組之間的綜合語(yǔ)言能力分?jǐn)?shù)和六大語(yǔ)言維度分?jǐn)?shù)均不存在顯著差異(P > 0.05),即年齡因素對(duì)CI兒童語(yǔ)言能力的影響不顯著。這些兒童的綜合語(yǔ)言能力分?jǐn)?shù)分布較為分散,說明其語(yǔ)言能力的個(gè)體差異性較大,具體分布情況如圖6所示。
另一方面,我們參考了各個(gè)年齡段城市兒童的語(yǔ)言分?jǐn)?shù)均值,發(fā)現(xiàn)3~9歲城市兒童的綜合語(yǔ)言能力分?jǐn)?shù)達(dá)到平均值的比率為58%。我們將35名3~9歲的CI兒童與同齡城市兒童的語(yǔ)言分?jǐn)?shù)進(jìn)行比較,發(fā)現(xiàn)僅有40%的CI兒童達(dá)到了同齡兒童的平均語(yǔ)言水平,被界定為語(yǔ)言發(fā)展水平達(dá)標(biāo),具體數(shù)據(jù)如表6所示。
與正常兒童有別,CI兒童的綜合語(yǔ)言能力并不隨著年齡增長(zhǎng)而顯著提升。這35名CI兒童中,4歲年齡組的語(yǔ)言表現(xiàn)最佳,有55.6%能達(dá)到同齡兒童的平均語(yǔ)言水平;而4歲以后,相較于同齡兒童,CI組的表現(xiàn)反而出現(xiàn)相對(duì)下滑——達(dá)標(biāo)率隨著年齡的增長(zhǎng)越來(lái)越低。我們推測(cè),在幼年早期(3歲以前),這些兒童由于聽力障礙錯(cuò)過了言語(yǔ)感知與聽理解能力的最佳發(fā)展時(shí)機(jī),而3歲以前也是大多數(shù)聽力障礙兒童CI植入的階段,本研究中有75%的兒童都在3歲前完成CI植入,需要一定的時(shí)間來(lái)調(diào)節(jié)適應(yīng),因此3歲CI兒童的語(yǔ)言發(fā)展普遍落后,4歲CI組的整體語(yǔ)言表現(xiàn)才有了明顯提升。但隨著年齡的進(jìn)一步增長(zhǎng),CI組和正常同齡兒童的語(yǔ)言能力差距越來(lái)越大,可見人工耳蝸的植入雖然促進(jìn)了患兒的聽覺言語(yǔ)功能發(fā)展,但仍無(wú)法彌補(bǔ)他們與正常兒童的差距。
既然年齡因素在CI兒童的語(yǔ)言發(fā)展過程中并不產(chǎn)生顯著影響,我們推測(cè)CI植入的影響可能更為關(guān)鍵,因此進(jìn)一步探究CI兒童的植入年齡與其綜合語(yǔ)言能力分?jǐn)?shù)之間的關(guān)系。我們將40名被試按照耳蝸植入年齡進(jìn)行分組,分為1.5歲前植入、1.5~3歲植入和3歲后植入組,以植入年齡為因子、綜合語(yǔ)言能力分?jǐn)?shù)為因變量進(jìn)行了方差分析。結(jié)果發(fā)現(xiàn),CI植入年齡顯著影響兒童的語(yǔ)言發(fā)展水平(F = 3.484,P = 0.041 < 0.05)。3組CI兒童的綜合語(yǔ)言能力得分情況如表7所示。
事后檢驗(yàn)結(jié)果表明,只有植入年齡早于1.5歲的患兒在語(yǔ)言發(fā)展上顯著好于1.5~3歲組(P = 0.019 < 0.05),而植入年齡在3歲以上的兒童與其余兩組之間差異不顯著(P > 0.05),這可能與植入年齡在3歲以上的兒童普遍實(shí)際年齡較大、相應(yīng)地獲得較高的語(yǔ)言分?jǐn)?shù)有關(guān)。但無(wú)論如何,在1.5歲以前植入人工耳蝸對(duì)于聽力障礙兒童的語(yǔ)言發(fā)展是有益的,這與前人研究基本一致(周惠群,殷善開2010;Craddock et al. 2016)。因此,對(duì)于聽障兒童,如有條件,應(yīng)當(dāng)盡早進(jìn)行人工耳蝸植入手術(shù),促進(jìn)患兒的語(yǔ)言發(fā)展。
2.人工耳蝸植入兒童六大語(yǔ)言維度發(fā)展情況
這35名3~9歲的CI兒童與同齡正常兒童相比,在綜合語(yǔ)言能力分?jǐn)?shù)上具有顯著差異(t = 2.689, P = 0.010)。如表8所示,兩者在語(yǔ)音、能產(chǎn)性、流暢性、語(yǔ)法、邏輯五大維度上同樣具有顯著差異(P < 0.05),僅在語(yǔ)義維度差異不顯著,且均為CI兒童得分低于正常兒童??梢?,CI兒童在多個(gè)語(yǔ)言維度的發(fā)展均顯著區(qū)別于同齡正常兒童,低于同齡正常兒童的發(fā)展水平。
其次,由于目前對(duì)于聽障兒童的語(yǔ)言障礙診斷標(biāo)準(zhǔn)尚未達(dá)成一致,因此我們?cè)趨⒖颊和Z(yǔ)言均分的前提下,先將CI兒童劃分為語(yǔ)言發(fā)展達(dá)標(biāo)(14人)與未達(dá)標(biāo)(21人)兩組,探究未達(dá)標(biāo)CI兒童的語(yǔ)言障礙特征。結(jié)果發(fā)現(xiàn)兩組兒童不僅在綜合語(yǔ)言能力分?jǐn)?shù)具有顯著差異(t = 6.535, P < 0.001),在語(yǔ)音、能產(chǎn)性和語(yǔ)義三大維度上也存在顯著差異(P < 0.05),具體數(shù)據(jù)如表9所示。由此可見,在CI兒童群體內(nèi)部,達(dá)標(biāo)組在發(fā)音準(zhǔn)確性、表意完整性和言語(yǔ)能產(chǎn)性方面都具有優(yōu)勢(shì),而未達(dá)標(biāo)組通常發(fā)音含混,表意不清晰,言語(yǔ)能產(chǎn)性也較差。
綜上,CI兒童的整體語(yǔ)言發(fā)展低于正常兒童的平均水平,且這種語(yǔ)言發(fā)展的落后體現(xiàn)在語(yǔ)音、語(yǔ)法、邏輯、言語(yǔ)能產(chǎn)性和流暢性五大方面,這提示我們需要重點(diǎn)關(guān)注CI兒童在各個(gè)語(yǔ)言維度上的發(fā)展情況,必要時(shí)介入語(yǔ)言干預(yù)措施。在語(yǔ)言障礙的評(píng)估方面,與單純性語(yǔ)言障礙的篩查一致,CI兒童在語(yǔ)音、能產(chǎn)性兩大維度的分?jǐn)?shù)也具有顯著的指示意義。需要說明的是,在語(yǔ)義方面,CI兒童內(nèi)部存在差異——達(dá)標(biāo)組表意能力良好,與正常兒童相當(dāng);而未達(dá)標(biāo)組表意能力則很差。因此,我們推測(cè),在聽力障礙兒童群體的語(yǔ)言障礙篩查中,語(yǔ)義維度或許是一項(xiàng)極為顯著的篩查指標(biāo),能較好地篩選出語(yǔ)言發(fā)育障礙的CI兒童,這有待進(jìn)一步的研究與驗(yàn)證。
五、總 結(jié)
兒童是祖國(guó)的未來(lái)、民族的希望,要為億萬(wàn)兒童的健康成長(zhǎng)保駕護(hù)航,就必須要做好兒童語(yǔ)言工作。本研究致力于構(gòu)建一個(gè)全面有效的漢語(yǔ)兒童言語(yǔ)交際水平評(píng)估系統(tǒng),包括一套固定引導(dǎo)程序和精準(zhǔn)數(shù)據(jù)標(biāo)注指標(biāo),基于該系統(tǒng)廣泛收集正常兒童和語(yǔ)言異常兒童的語(yǔ)言發(fā)展數(shù)據(jù)建立數(shù)據(jù)庫(kù),并利用機(jī)器學(xué)習(xí)技術(shù)以實(shí)現(xiàn)對(duì)兒童言語(yǔ)交際能力的自動(dòng)化評(píng)估,填補(bǔ)漢語(yǔ)兒童言語(yǔ)評(píng)估領(lǐng)域的空白。
該系統(tǒng)具有廣闊的應(yīng)用前景。在語(yǔ)言學(xué)理論層面上,可以探究漢語(yǔ)兒童語(yǔ)言習(xí)得的一般規(guī)律,把握當(dāng)今漢語(yǔ)兒童的整體語(yǔ)言發(fā)展概況和各方面語(yǔ)言能力的發(fā)展特征;在語(yǔ)言應(yīng)用層面上,基于對(duì)漢語(yǔ)兒童語(yǔ)言發(fā)展進(jìn)程的把握,通過比較分析可以找出兒童語(yǔ)言發(fā)育障礙的特征,探索特殊群體的言語(yǔ)能力發(fā)展路徑,并提出語(yǔ)言發(fā)育障礙的精準(zhǔn)評(píng)估方案,這對(duì)于今后兒童語(yǔ)言障礙評(píng)估工作的具體開展具有提示意義。
參考文獻(xiàn)
高 軍 2012 《中國(guó)社會(huì)科學(xué)院語(yǔ)言所普通話兒童語(yǔ)音庫(kù)——CASS Mandarin Child Speech Corpus》,上海:第十屆中國(guó)語(yǔ)音學(xué)學(xué)術(shù)會(huì)議論文。
胡亞娟 2015 《基于語(yǔ)料庫(kù)的漢語(yǔ)兒童指稱發(fā)展研究》,《當(dāng)代外語(yǔ)》第1期。
黃瑞珍,蔡昀純,林佳蓉,等 2014 《華語(yǔ)學(xué)齡兒童溝通及語(yǔ)言能力測(cè)驗(yàn)》,臺(tái)北:心理出版社。
黃文橋 2020 《漢語(yǔ)兒童語(yǔ)言能力評(píng)估的系統(tǒng)評(píng)價(jià)》,《語(yǔ)言戰(zhàn)略研究》第4期。
林寶貴,锜寶香 2000 《國(guó)小兒童語(yǔ)言能力評(píng)量工具之發(fā)展》,《“中華民國(guó)”聽力語(yǔ)言學(xué)會(huì)雜志》第15期。
劉照雄 1996 《普通話水平測(cè)試大綱》,長(zhǎng)春:吉林人民出版社。
锜寶香 2006 《兒童語(yǔ)言障礙——理論、評(píng)量與教學(xué)》,臺(tái)北:心理出版社股份有限公司。
溫志軍,胡瑰玲 2001 《開發(fā)利用世界上最大的兒童語(yǔ)料庫(kù)——CHILDES》,《外語(yǔ)教學(xué)與研究》第5期。
楊金煥 2016 《4—5歲兒童會(huì)話能力研究——基于“兒童—成人”與“兒童—同伴”比較視角》,南京師范大學(xué)碩士學(xué)位論文。
張廷香 2010 《基于語(yǔ)料庫(kù)的3—6歲漢語(yǔ)兒童詞匯研究》,山東大學(xué)博士學(xué)位論文。
張文忠,吳旭東 2001 《第二語(yǔ)言口語(yǔ)流利性發(fā)展定量研究》,《現(xiàn)代外語(yǔ)》第4期。
張義賓 2019 《基于漢語(yǔ)兒童語(yǔ)料庫(kù)的語(yǔ)言障礙診斷系統(tǒng)研究》,華東師范大學(xué)博士學(xué)位論文。
周惠群,殷善開 2010 《耳蝸植入術(shù)后兒童聽覺及語(yǔ)言發(fā)展的研究現(xiàn)狀》,《實(shí)用醫(yī)院臨床雜志》第5期。
周 兢,張義賓 2020 《基于漢語(yǔ)兒童語(yǔ)料庫(kù)構(gòu)建的兒童語(yǔ)言發(fā)展測(cè)評(píng)系統(tǒng)》,《學(xué)前教育研究》第6期。
Bishop, D. M. 2000. Pragmatic language impairment: A correlate of SLI, a distinct subgroup, or part of the autistic continuum. In D. M. Bishop & L. B. Leonard (Eds.), Speech and Language Impairments in Children: Causes, Characteristics, Intervention and Outcome, 115?130. New York: Psychology Press.
Collisson, B. A., S. A. Graham, J. L. Preston, et al. 2016. Risk and protective factors for late talking: An epidemiologic investigation. The Journal of Pediatrics 172, 168?174.
Craddock, L., H. Cooper, A. Riley, et al. 2016. Cochlear implants for pre-lingually profoundly deaf adults. Cochlear Implants International 17, 26?30.
Leit?to, S., J. Hogben & J. Fletcher. 1997. Phonological processing skills in speech and language impaired children. International Journal of Language & Communication Disorders 32(2s), 91?111.
Norbury, C. F., D. Gooch, C. Wray, et al. 2016. The impact of nonverbal ability on prevalence and clinical presentation of language disorder: Evidence from a population study. Journal of Child Psychology and Psychiatry 57(11), 1247?1257.
Raupach, M. 1980. Temporal variables in first and second language speech production. In D. Dechert & M. Raupach (Eds.), Temporal Variables in Speech. New York: Mouton.
Rescorla, L. 2009. Age 17 language and reading outcomes in late-talking toddlers: Support for a dimensional perspective on language delay. Journal of Speech, Language, and Hearing Research 52(1), 16?30.
Tomblin, J. B., N. Records, L. Buckwalter, et al. 1997. Prevalence of specific language impairment in kindergarten children. Journal of Speech, Language, and Hearing Research 40(6), 1245?1260.
Whitehurst, G. J., A. S. Arnold, M. Smith, et al. 1991. Family history in developmental expressive language delay. Journal of Speech, Language, and Hearing Research 34(5), 1150?1157.
Zhang, X., F. Qin, Z. Chen, et al. 2020. Fast screening for childrens developmental language disorders via comprehensive speech ability evaluation—Using a novel deep learning framework. Annals of Translational Medicine 8(11), 707.
責(zé)任編輯:王 飆