何家勇 周 陽 劉伊梅
(電子科技大學,成都 611731;成都理工大學,成都 610059;成都理工大學,成都 610059)
提 要:本研究利用PSOLA技術(shù),移植英語本族語者的時長、基頻、“基頻+時長”到中國學習者音段,合成語音刺激;并反向移植,將學習者的時長、基頻、“基頻+時長”移植到本族語音段,合成語音刺激。在嚴格控制信噪比、音速的條件下,請24名英語本族語者對實驗刺激進行逐字轉(zhuǎn)寫,計算可理解度,研究韻律和音段對可理解度的影響。結(jié)果顯示,中國學習者的時長模式對可理解度有負面作用,而基頻則沒有。學習者的音段,不論是與學習者自己的“基頻+時長”組合,還是與本族語者的“基頻+時長”組合,其可理解度都顯著低于本族語者音段與本族語者自己的“基頻+時長”組合,也低于本族語者音段與學習者“基頻+時長”組合。這說明音段錯誤是致使中國學習者英語可理解度低下最主要的原因。改善學習者的音段,是提高其可理解度最有效的辦法。
近三十年來,英語學習者的外國口音和可理解度①(intelligibility)問題一直是國外語音教學研究的核心問題。近年來,更是涌現(xiàn)出大量關(guān)于可理解度的研究(Fogerty 2015;Sewell 2015;Chen 2015;Orikasa 2016;Sheppard et al. 2017;Crowther,De Costa 2017)。國際英語口語測試的語音評價標準中,也明確表示對學習者外國口音的容忍,而日益強調(diào)交際中的可理解度。
國內(nèi)對可理解度問題的研究雖然起步較晚(何家勇 2007),但也逐漸引起國內(nèi)學者的重視(何家勇等 2010,高超 文秋芳 2012,周衛(wèi)京 宋會萍 2015,張伶俐 2015,朱立剛 馬秋武 2018,秦川 2018)。但總體上講,學界對中國學生可理解度的研究仍處于起步階段,尤其是對如何有效地提高中國學習者的可理解度缺乏實證研究。雖然我們可以從對我國學習者外國口音的研究中發(fā)現(xiàn)的各種音段和超音段問題得到重要啟示,但是外國口音與可理解度并不顯著相關(guān)。外國口音重的學習者,其可理解度也可能會較高(Smith,Rafiqzad 1979:371;Jenkins 2002:83;Levis 2005:369)。因此,找到真正影響可理解度的直接因素是指導語音教學、幫助學習者有效提高可理解度的前提條件?;诖?,本研究利用PSOLA語音合成技術(shù)移植韻律合成語料,進行可理解度聽辨實驗,研究韻律(本研究僅指基頻和時長模式)、音段與可理解度的關(guān)系。
可理解度指說話者的言語被實際理解的程度(Munro et al. 2006:111),也可以說是言語的識別度。盡管國外學者對語音可理解度問題進行過大量研究,但是對于音段、超音段與可理解度的關(guān)系仍未取得一致性的認識。部分學者強調(diào)超音段因素對可理解度的作用。Anderson-Hsieh和Koehler(1988:561)以及Anderson-Hsieh等(1992:529)發(fā)現(xiàn)語音水平較低的中國學習者在語速加快時,可理解度會因韻律(重音、節(jié)奏、語調(diào))的惡化而降低。Anderson(1993:1)發(fā)現(xiàn),學習者的節(jié)奏模式越接近本族語者(以重音計時),可理解度越高。語調(diào)的某些特征與重讀和弱讀的交互作用對言語理解非常重要,因為它們能突出言語信息中最重要的部分,為聽話人的注意力提供指向(Jenkins 1997:15)。Munro和Derwing(1995:73)以及Derwing和Munro(1997:1)認為,較多的音段偏誤會導致非母語者的外國口音較重,但并不影響其可理解度的得分。Tajima等(1997)對中國英語學習者的研究發(fā)現(xiàn),移植本族語時長模式到學習者音段,可顯著提高學習者的可理解度;Quen’e 和Van Delft(2010)對波蘭的荷蘭語學習者研究也得到同樣的結(jié)論。
近幾年的一些研究認為,音段才是影響可理解度最關(guān)鍵的因素。語調(diào)中的音高變化部分對可理解度的影響不大(Chela-Flores 2003:356)。Pinet和Iverson(2010)對法國學習者的研究發(fā)現(xiàn),本族語音段的可理解度比學習者音段的可理解度更高,而移植本族語韻律(時長+基頻)到學習者音段后,會降低可理解度。Winters和O’Brien(2013)對德國學習者的研究和Sereno等(2016)對韓國學習者的研究也得到同樣的結(jié)論。Moedjito(2015)要求5個本族語者針對5個日本高中生和6個印尼高中生產(chǎn)出的語料,就9個影響可理解度的潛在因素進行主觀性評分,結(jié)果發(fā)現(xiàn)語調(diào)、節(jié)奏與可理解度無顯著相關(guān),音段的準確度可以有效地預(yù)測可理解度。他同時也發(fā)現(xiàn)重音(屬于超音段因素)影響可理解度。
有研究表明,超音段對可理解度的影響與學習者的母語背景相關(guān)。Holm(2008)對中國、波斯、英、法、德、俄羅斯、印度的挪威語學習者的研究發(fā)現(xiàn),本族語基頻和時長模式對提高英、法、德、俄羅斯、印度學習者的可理解度有幫助,而對中國和波斯學習者無顯著作用。因此,非常有必要對中國英語學習者的音段和超音段與可理解度的關(guān)系進行探索,回答以下問題:
(1)改善中國學習者英語語調(diào)中的音高變化(基頻)能否提高可理解度;
(2)改善中國學習者英語節(jié)奏中的時長模式能否提高可理解度;
(3)音高變化和時長模式之間有沒有交互作用,同時改善二者能否提高可理解度;
(4)音段和以上韻律因素相比,哪一個對可理解度的貢獻更大。
發(fā)音人為4名國內(nèi)某普通高校已通過大學英語四級考試的非英語專業(yè)學生(2男2女)和2名本族語者(美國人,1男1女)。對這4名學生的語音水平進行評分,并將其與該高校其他隨機選取的30名學習者的語音評分進行比較,發(fā)現(xiàn)4位發(fā)音人的語音水平與30個樣本中96.7%的同學沒有顯著差別。如果把國外獲得助教資格的中國留學生的語音水平定義為高級水平的話,這4名發(fā)音人的語音水平屬于低級水平。
錄音設(shè)備為筆記本電腦、心形指向性電容USB話筒(鐵三角AT2020)及專業(yè)錄音軟件xRecorder. 采樣率為22050,16字節(jié),單通道,環(huán)境為某高校錄音棚。朗讀材料為Winters和O’Brien(2013:505)為可理解度研究設(shè)計的24個低語境句子,如I ate sour green apples in kindergarten,聽話人難以靠其認知圖式對句子內(nèi)容進行推測。句型包括12句陳述句和12句疑問句(一般疑問句6句,特殊疑問句6句),便于產(chǎn)出多樣的語調(diào)類型。6名發(fā)音人共產(chǎn)出144個原始句子。使用Winters和O’Brien(2013)的語料可以方便與他們的研究結(jié)果做比較。
利用Praat(Boersma,Weenink 2012)軟件為每個文件生成PitchTier文件,并修改數(shù)據(jù)文件中錯誤基頻數(shù)據(jù),如基頻跳點、斷點等錯誤。然后以音節(jié)為單位,對所有句子進行音段切分,并標注出正則層(包括單詞和每個音節(jié)的音標)和調(diào)域?qū)?最高基頻點和最低基頻點)。
利用Praat的PSOLA功能,編寫腳本程序,進行以下4種韻律移植:
(1)基頻(語調(diào)②)移植:將本族語者的基頻曲線移植到同性別的中國學習者相同的句子上,合成學習者音段+本族語基頻的刺激;并反向移植,合成本族語音段+學習者基頻的刺激;(24句×4學習者+24句×2本族語者=144句);
(2)時長(節(jié)奏③)移植:將本族語者的時長模式(以下“音節(jié)時長”,簡稱“時長”)移植到同性別的中國學習者相同的句子上,合成學習者音段+本族語時長的刺激;并反向移植,合成本族語音段+學習者時長的刺激; (24句×4學習者+24句×2本族語者=144句);
(3)基頻+時長(語調(diào)+節(jié)奏)移植:同時將本族語者的基頻和時長模式移植到同性別的中國學習者相同的句子上,合成學習者音段+本族語基頻及時長的刺激;并反向移植,合成本族語音段+學習者基頻及時長的刺激;(24句×4學習者+24句×2本族語者=144句);
(4)自我移植④:同時將本族語者的基頻和時長模式移植到自己的句子上,合成本族語音段+本族語基頻及時長的刺激;同時將學習者的基頻和時長模式移植到自己的句子上,合成學習者音段+學習者基頻及時長的刺激;(24句×4名學習者+24句×2名本族語者=144句)。
最后得到576句刺激(144×4)。由于本族語者與學習者產(chǎn)出的句子總時長有差異,移植時長后,音速會發(fā)生變化。為了避免音速變化對可理解度產(chǎn)生影響⑤,我們用Adobe Audition調(diào)整所有涉及時長移植而合成的刺激的總時長,使移植前后的句子總時長保持一致,讓音速不變。
為避免可理解度實驗中可能出現(xiàn)的天花板效應(yīng)⑥,以上步驟完成后,我們用Adobe Audition將所有刺激進行標準化處理,然后利用Matlab腳本程序添加粉噪音,合成信噪比為10dB的刺激。
可理解度測試的音頻文件制作如下:用Adobe Audition將576個帶噪的刺激按24×24的拉丁方設(shè)計(Tajima et al. 1997:11)編輯成24個內(nèi)容不同的音頻文件,每個文件包含 24個內(nèi)容不重復(fù)的句子;每個文件由2種刺激組成:含本族語音段的刺激和含學習者音段的刺激,各12句;每種刺激都包含4類移植:基頻、時長、基頻+時長、自我移植,各3句。
聽辨人為24名自述沒有聽力障礙和對中國學習者沒有偏見的英語本族語者,14男10女,英美各12人。鑒于聽辨人對中國學習者英語的熟悉程度可能會對實驗結(jié)果產(chǎn)生影響⑦,我們選擇與學習者有不同接觸經(jīng)歷的本族語者。他們與學習者接觸的時間為:0年4人, 0.5-1年10人,2-3年6人, 6-15年3人,年齡在20至76歲之間,可以代表較為廣泛的本族語群體。
實驗在某高校語言實驗室中進行,聽辨人用Beyer-Dynamic DT-660頭戴式耳機收聽實驗刺激,自行將音量調(diào)至舒適水平。先為聽辨人講解實驗步驟,但不告訴他們實驗?zāi)康?,要求他們盡可能在紙上寫下聽到的所有單詞。每位聽辨人面前有1臺電腦,電腦桌面上有1個編輯好的音頻文件(每位聽者的文件內(nèi)容不同)。在聽到開始指令后,每位聽辨人自行播放電腦中的任務(wù)文件。每個刺激只能順序播放1遍,聽到1個句子之后,可以自行暫停,以保證有足夠的時間轉(zhuǎn)寫。在任務(wù)正式開始之前,提供3個額外的練習句,練習句不計入實驗結(jié)果。整個實驗時間約30分鐘。
利用Praat腳本程序,提取發(fā)音人產(chǎn)出的自然語句(標注和切分后)的基頻數(shù)據(jù);利用He(2013:125)中Joop Kerkhoff編寫的Praat腳本程序,自動計算出節(jié)奏指數(shù)nPVI⑧和音速。然后利用SPSS對基頻數(shù)據(jù)、音速和nPVI進行統(tǒng)計分析。表1是兩組發(fā)音人主要聲學參數(shù)的描述性統(tǒng)計數(shù)據(jù)。獨立樣本t檢驗結(jié)果顯示,無論是基頻均值、調(diào)域均值、音速均值還是平均節(jié)奏指數(shù)nPVI,本族語發(fā)音人和中國學習者發(fā)音人都有顯著性差異。就基頻均值而言,學習者顯著高于本族語者,女性:t=-14.723,df=46,p﹤0.001; 男性:t=-5.795,df=26.36,p﹤0.001。但是就調(diào)域均值而言,學習者顯著低于本族語者,女性:t=3.158,df=34.73,p﹤0.005; 男性:t=3.948,df=27.28,p﹤0.001。
表1 兩組發(fā)音人原始錄音的主要聲學參數(shù)對比
就總體音速而言,學習者顯著地比本族語者的音速略快,但是沒有顯著性差異t=-1.028,df=46,p=0.233。這與我們的預(yù)期相反,也與Ding等(2016:758)的發(fā)現(xiàn)不同??赡苁怯捎诒緦嶒炛械哪刚Z者為了把錄音讀的更清晰,無意中放慢語速所致。因為中國學習者的音速均值與Ding等(同上)的中國學習者比較接近,而本族者的音速比Ding等(同上)的本族語者慢一些。
本研究中,本族語者與學習者的節(jié)奏模式也有顯著性差異,本族語者的節(jié)奏指數(shù)nPVI均值顯著高于學習者的nPVI,t=3.603,df=46,p﹤0.005,支持Ding和Xu(2016:2696)的結(jié)論。這說明中國學習者的元音約減程度不如本族語者。或者說中國學習者的節(jié)奏模式更接近以音節(jié)為節(jié)拍的漢語節(jié)奏模式,而非英語的以重音為節(jié)拍的節(jié)奏模式。總的說來,本研究中所選發(fā)音人的語料能夠代表一般中國學習者的語調(diào)和節(jié)奏特征。
計算可理解度時,區(qū)分實詞和虛詞,只計算實詞的正確率(Pinet,Iverson 2010:1359;Smiljani,Bradlow 2011:4023),這樣可以減少某些聽辨人因漏寫虛詞造成的影響。另外,有拼寫錯誤或時態(tài)錯誤的單詞按正確計算。這樣可以降低語法對可理解度造成的影響(Winters,O’Brien 2013:498)。
圖1 不同音段與韻律組合的可理解度比較
以本族語聽辨人的國籍為自變量,學習者自我移植后的刺激的可理解度為因變量,進行單因素組間方差分析,結(jié)果顯示英國聽者和美國聽者給出的可理解度得分無顯著性差異,F(xiàn)(1-23)=0.085,p=0.773。這說明本族語聽辨人的國籍差異不會對實驗結(jié)果造成影響。
圖2移植本族語時長、基頻、“時長+基頻”到中國學習者音段后的可理解度
圖3移植學習者語時長、基頻、“時長+基頻”到本族語音段后的可理解度
本研究發(fā)現(xiàn),學習者的音段錯誤是致使其可理解度低下的主要原因,改善學習者英語的音段可以顯著地提高可理解度,支持Winters和O’Brien(2013)、Chen(2015)及Sereno等(2016)的結(jié)論。
本研究的貢獻在于將基頻和時長分開移植,從而發(fā)現(xiàn)中國學習者的語調(diào)(本文僅指基頻)對可理解度沒有顯著的影響。移植本族語基頻到學習者音段,不能顯著地提高學習者的可理解度。而以往的研究(Pinet,Iverson 2010;Sereno et. al. 2016;Winters,O’Brien 2013)因移植技術(shù)的限制,在移植基頻時也被迫移植時長,因此難以單獨研究語調(diào)與可理解度的關(guān)系。其次,本研究發(fā)現(xiàn)中國學習者的時長模式對可理解度有顯著的負面作用, 支持Tajima等(1997)對中國學習者的研究結(jié)論。造成這種負面作用的原因可能是在學習者受母語音節(jié)節(jié)拍節(jié)奏的影響下,傾向于重讀所有的詞語。本實驗中的句子較長,學習者在說話氣息不足的情況下,句末某些承載重要信息的實詞可能得不到應(yīng)有的重音。下面選取1個句子為例。
圖4為其中一個本族語句子在獲得學習者時長模式前后的對比。為了使移植前后的音速不變,該句的移植后的總時長調(diào)整為與移植前相等,都是5.37秒。移植前,句中虛詞has, been, his, since的總時長為0.91秒,占總時長的20%左右;而移植后,虛詞的總時長增加為1.59秒,占總時長的30%左右。這樣,虛詞就擠占實詞10%的時間。結(jié)果造成最后3個實詞email,yesterday和afternoon的時長明顯比原句短,尤其是最后一個詞afternoon. 實際上,該句在轉(zhuǎn)寫時,有32%左右的聽者在afternoon一詞上出現(xiàn)錯誤。
然而,本研究中移植本族語者的時長模式到學習者音段后,可理解度并未像Tajima等(1997)的研究一樣得到顯著性提高。這可能與學習者語音水平這個變量有關(guān)。Hardman(2015:860)發(fā)現(xiàn)對獲得美國高校助教資格的高水平中國學習者,音段的準確度高低對可理解度沒有顯著影響。Moedjito(2015:155)的結(jié)論為語調(diào)、節(jié)奏與可理解度無顯著相關(guān),音段的準確度可以有效地預(yù)測可理解度,是基于語音水平較低的學習者的。本研究發(fā)音人是通過大學英語四級考試的中國學生,本族語聽辨人反映學生的音段錯誤非常多,應(yīng)該算作語音水平較低的學習者。而Tajima等(1997:6)的發(fā)音人是在美國留學2年的中國學生,語音水平應(yīng)該比國內(nèi)普通學生好得多。因此,可以推測,音段的準確度可能是可理解度的基礎(chǔ)。本研究中學習者的音段錯誤較多,再加上有粉噪音的掩蔽(10dB),對音段的識別比較困難。在這種情況下,節(jié)奏對可理解度的貢獻可能難以表現(xiàn)出來。而且,本研究僅移植時長。在技術(shù)上,沒有能夠?qū)崿F(xiàn)移植節(jié)奏的一個重要因素——重音。所以,節(jié)奏的貢獻在本研究中可能并未完全發(fā)揮出來。
本研究中,移植本族語“基頻+時長”到學習者音段后,可理解度沒有顯著性變化。這與Pinet和Iverson(2010)對法國英語學習者的研究,Sereno等(2016)對韓國學習者的研究,以及Winters和O’Brien(2013)對德國英語學習者的研究不同。這3項研究中,移植本族語“時長+基頻”到學習者音段后,可理解度都顯著地降低。這可能與他們都沒有控制音速有關(guān)。這些研究中,本族語發(fā)音人的語速都比學習者快。學習者獲得本族語韻律后,也獲得本族語時長模式,語速變快,可理解度可能因此而降低。Anderson-Hsieh和Koehler(1988:571)發(fā)現(xiàn)學習者的語速比正常語速快30%,可理解度會顯著降低,Sereno等(2016:319)則發(fā)現(xiàn)學習者的語速比正常語速快20%,可理解度就會顯著降低。
此外,本研究所用噪音水平為10dB,比Winters和O’Brien(2013:490)低10倍。本族語發(fā)音人(自己的音段和自己的韻律)在10dB的噪音掩蔽下的可理解度均值為88.5%,比Winters和O’Brien(2013:501)研究中的本族語者可理解度(75.3%)高13.2%。說明本研究中的噪音條件有效地避免天花板效應(yīng),為韻律發(fā)揮作用提供更為有利的條件。
圖4中國學習者時長模式移植到本族語音段前后的個案對比(上圖為移植前,下圖為移植后)
本研究在嚴格控制音速、噪音水平、基頻、時長等變量的條件下,發(fā)現(xiàn)對于語音水平較低的中國學習者而言,節(jié)奏(本文僅指時長模式)對可理解度有負面作用,而語調(diào)(本文僅指基頻)則沒有。音段錯誤是致使這些中國學習者英語可理解度低下最主要的原因。改善學習者的音段,應(yīng)該是提高其可理解度最有效的辦法。這一點,為Jenkins(2007:10)構(gòu)建的基于可理解度的語音“共核”提供了依據(jù)。
本研究對我國的英語語音教學有重要啟示。如果語音教學的目標是提高可理解度(如對大量語音水平較低的非英語專業(yè)的學生),則首先應(yīng)優(yōu)先改善學生的音段,尤其是糾正那些與可理解度相關(guān)的音段錯誤,如輔音叢的簡化(Chen 2015:749)、長短元音的混淆、雙元音的單元音化等(張伶俐 2015:36)。其次,應(yīng)改善學生的節(jié)奏,讓學生學會約減弱讀音節(jié)(一般是虛詞)的元音,這樣可以省下氣息,將重讀音節(jié),尤其是句末的重讀音節(jié)(常常是承載重要信息的調(diào)核)讀得更清晰,從而提高可理解度。
需要說明的是,本研究并未否定語調(diào)的教學意義。語調(diào)不僅指音高,即基頻,還包括調(diào)核位置(tonicity)、調(diào)群的切分(tonality)(Halliday 1967:285)。語調(diào)在交際中有傳達意義中的重要功能。調(diào)核的位置、音高重音、音節(jié)長度等因素的相互作用和變化識別說話人的會話含義時具有舉足輕重的作用(Ortiz-Lira 1994:382)。語調(diào)的其他功能,如語篇功能(Levis 2004:353)和情態(tài)功能(Wells 2006:182)更是不可忽視的。節(jié)奏的另外兩個聲學指征,響度和音強對可理解度的貢獻同樣需要進一步研究。此外,學習者的語音水平可能是個重要的變量。以后的研究可以選用語音水平較高的學習者進行實驗。
注釋
①Iintelligibility也可以稱為“清晰度”(田朝霞 金檀 2015:80),或“可理解性”(張伶俐 2015:36)。本文采用何家勇(2010:102)、周衛(wèi)京和宋會萍(2015:1)的譯法,即可理解度。
②語調(diào)實際上是一個綜合概念,除了音高,還可能加上響度、音強、音速、停頓等韻律要素(Crystal 1997:252),本研究中僅研究語調(diào)的一個重要聲學指征,即基頻。
③英語的節(jié)奏實際是由重音和時長一起實現(xiàn),本研究只研究時長。時長較長的音節(jié)一般伴隨著重音,時長較短的音節(jié)一般是弱讀,因此英語的時長模式從一定程度上反映其節(jié)奏特點。
④合成的語音可能與自然語音有細微的差異。采用自我移植后合成的語音作為參照可減少合成技術(shù)對實驗產(chǎn)生的不利影響(Winters,O’Brien 2013:490)。
⑤音速與語速都以每秒鐘所說的音節(jié)數(shù)為度量,區(qū)別在于前者不包括停頓,后者包括停頓(李愛軍2010:29)。
⑥加噪音以避免天花板效應(yīng)是可理解度研究中的常用方法,如Tajima等(1997:8)、Pinet和Iverson(2010:1359)、Winters和O’Brien(2013:490)。為了避免噪音的掩蔽作用過大而掩蓋韻律的作用,本研究中的信噪比高于Winters和O’Brien(2013:490)5dB。
⑦對發(fā)音人口音更熟悉的聽辨人比不熟悉的聽辨人可能更容易聽懂發(fā)音人的英語(Gass, Varonis 1984:68)。
⑧nPVI(normalized Pairwise Variability Index)即節(jié)奏指數(shù),測量相鄰音節(jié)或元音的時長差異(Low et al. 2000:378)。