王 璐,張 吉 生
(華東師范大學 外語學院,上海 200241)
由于地理因素以及語言特點,吳方言通常被分為南北兩大部分,即北部吳語和南部吳語。不管是對方言學家或是吳語作為母語的說話者來說,都有一個共識,即吳語內(nèi)部的互通度(mutual intelligibility)程度差別很大。通常認為,北部吳語區(qū)內(nèi)部的互通度比較大;而南北吳語間的互通度就低得多;南部吳語區(qū)之間的互通度也很低。涉及方言間可通度的因素很多,就語言本身包括語音、音系、詞匯、句法以及文化等因素;就語言的使用者而言,涉及人的文化背景、社會背景、身體和心理狀況、年齡與性別等因素。但決定語言(方言)間可通度的最重要因素當然是語言的音系結(jié)構(gòu)(Gooskens 2007:445-467)。目前,有關(guān)吳方言內(nèi)部互通度的研究不多。本研究旨在闡述可通度與音段層面的語言距離之間的關(guān)系。
本研究選取了吳方言內(nèi)部的五個片區(qū)的五個方言點(黃巖、溫州、永康、衢州、吳江),對它們相互間的互通度進行了測試,得出這五個方言之間互通度的一個相對值。然后根據(jù)Levenshtein(1966:707-710)的編輯距離(edit distance)計算方法,計算出不同方言間的語言距離(linguistic distance)與互通度之間的關(guān)系,從而在音段層面揭示導致方言間互通度差異的音系學原因。
(一)實驗設計。本研究設計的語料選取了日常生活中常用的30個三音節(jié)的詞,內(nèi)容涵蓋食品、身體部位、天氣、稱謂、節(jié)日、衣物等多個方面。選取的語料由從五個方言區(qū)土生土長的5名(3女2男)大學生錄音而成①五位錄音人都出生和成長于代表方言區(qū),父母也都操該方言,雖然目前都在外讀書,但和家人通電話等都用方言,在家交流都使用方言。。每個方言點的聽音人都會聽到所有五個方言點的語料,包括他們自己的母語。然而,為了防止出現(xiàn)預示效果(priming effect),聽音人的母語都會被安排在其它四個方言之后。之所以需要聽音人聽自己的方言并且做互通度的測試,是為了證明本實驗的語料的可行性。因為如果他們可以在自己的方言測試中取得較高的分數(shù),那么至少證明了實驗語料的設計的合理性。各個方言點測試的先后順序安排的原則是將預計可懂度最小的,也就是最難聽懂的方言排在最先被聽的位置,然后依次而排。在到各個方言點進行實地測試之前,我們曾在華東師范大學內(nèi)請了5位來自上述5個方言點的大學生進行過預測試。預測試的結(jié)果與我們對于方言聽懂度的預期是一致的①本文涉及的互通度聽音測試是整個研究項目《吳方言內(nèi)部互通性音系研究》中的一部分。吳方言內(nèi)部互通度的聽音測試的全部過程和詳細數(shù)據(jù)統(tǒng)計,可參見《吳語內(nèi)部互通性研究實驗報告》(張吉生、王璐、朱音爾2013)。。
(二)聽音人。聽音人必須是要識字的、受過教育的,因為他們需要寫下他們所聽到的詞②與以往其它互通度測試方法不同(如Tang 2009;Heeringa, et al. 2005:312-336),本研究不用選擇題方法,而采用聽寫方法,目的是為了測試出真實性更強的可通度。。本研究關(guān)注的是互通度, 所以需要的理想實驗對象是幾乎沒有與其它四個方言有接觸的聽音人。
本研究所選擇的聽音人是介于17至19歲的75名當?shù)馗咧袑W生,五個方言點各有15名,他們都是在當?shù)亻L大,父母和本人的單母語(即母語)都是當?shù)胤窖?,沒有在其它吳方言區(qū)生活的經(jīng)歷,(除普通話)不會其它方言③為確保聽音人的合格條件,每位聽音人需要填寫問卷,回答關(guān)于家庭和語言背景、對其它方言熟悉程度等問題。。
(三)實驗過程。實驗分別在五個方言點的五個高中完成。測試是在當?shù)貙W校的安靜的教室里進行。在實驗開始前,聽音人會聽到關(guān)于本次實驗的簡單介紹。測試的語料通過電腦以及音響播放。聽音人記錄下他們認為他們聽到的內(nèi)容。每個詞組開始的時候均有普通話的基數(shù)詞指出,且均連續(xù)播放兩遍。兩個不同的三音節(jié)的詞組中間播放的間隔是5秒鐘。如此,可以確保聽音人的短期記憶不會對理解造成影響,同時也確保聽音人能夠有足夠的時間寫下他們的翻譯。聽音測試時,五個方言的30個詞匯順序是隨機打亂的,不同的方言詞匯順序的排列不同,聽音人一次性聽寫完五個不同方言(包括自己的母語方言)的所有語料。
(四)實驗數(shù)據(jù)統(tǒng)計。一個方言語料被準確翻譯的百分比即是這一方言的可懂度。三音節(jié)的詞,每個音節(jié)得分為1分,全對得3分。比如,“八仙桌”這個詞,如果被試者只寫出了“八”,那么就是得1分。具體舉例來說,黃巖與衢州,就“八仙桌”這個三音節(jié)的詞而言,黃巖聽懂衢州的百分比是100%,而衢州聽懂黃巖的百分比只有13%。如此,就“八仙桌”這個詞,黃巖方言與衢州方言的互通度是56.5%。那么基于所有30個三音節(jié)詞的聽懂度的平均值,我們得出對黃巖方言的聽者而言,衢州方言的可懂度是36%,而對衢州方言的聽者,黃巖方言的可懂度是48%。兩個方言間詞匯的互通度值為42%。下表是五個方言間30個詞匯的互通度測試結(jié)果:
五個方言點的互通程度 表1
從表1我們可以清晰地看出五個方言點之間的互通程度差異?;ネǔ潭茸罡叩那叭屈S巖、吳江、衢州三個方言之間的交錯組合,位居榜首的是黃巖與吳江,其次是黃巖與衢州,接下來吳江與衢州。互通程度最低的三名是溫州與黃巖、溫州與永康,溫州和衢州。由此可見,凡是與溫州方言互通的,其互通度都很低,尤其是溫州與其它兩個南部吳語(永康和衢州),溫州方言可以被稱為吳方言中最難懂的方言。
語言距離指的是不同語言或者語言變體之間的相似程度或者是相異程度。語言之間的相似度越高,語言距離就越近,反之亦然。語言距離可以包括許多層面:音系、句法、形態(tài)、詞匯,它可以是指這些單獨的語言層面,也可以是這些語言層面的不同組合。關(guān)于語言距離的測量方法,又可分成兩大類:感知語言距離和客觀語言距離。測量感知語言距離的方法通常為將語言距離的遠近分成幾個層級,通過讓受試者聆聽不同語言的錄音,以調(diào)查問卷的方式,讓受試者選出他們認為受試語言間的遠近距離(參見Van Hout & Münstermann 1981:101-123)。一直以來,語言學家或者是方言學家都試圖找到客觀地測量語言距離的方法。Kessler(1995:60-67)最先提出運用編輯距離(edit distance)來計算方言間的語言距離①編輯距離最早由Levenshtein(1966:707-710)提出,因此也被稱為Levenshtein Distance。。由于編輯距離能夠通過定量研究客觀地顯示語言間的親疏遠近關(guān)系,近年來, 編輯距離被越來越多地應用到計算方言間的語言距離,從而達到將語言或方言歸類的目的(參見Heeringa 2004,Tang 2009,Serva & Petroni 2008:1-5),因此通常被用在語言的類型學的研究。編輯距離的計算原理是計算將字符串A變?yōu)樽址瓸的編輯次數(shù),而且是A轉(zhuǎn)化為B所需的最少編輯操作次數(shù)。就音段層面而言,編輯的方式有三種:刪除、插入和替換。編輯距離的一個強大之處在于它所強調(diào)的最少編輯次數(shù),因為字符串A變?yōu)樽址瓸的方式可能可以通過好幾種不同的編輯方式的組合而達到。那么相應地應用到語言學中,一個語言變體的一串語音可以相應地對應到另一個語言變體的一串語音。語音的對應通常是基于詞的音節(jié)結(jié)構(gòu),元音對應元音,輔音對應輔音。那么半元音[j]和[w]可能對應的是元音,如此就可避免輔音配元音的非常不相配的對應出現(xiàn)。
下面以“八仙桌”這個詞在黃巖話和衢州話中的各自語音表達為例來具體說明編輯距離。
黃巖話與衢州話“八仙桌”的編輯過程② 本研究只涉及音段層面,包括輔音,元音,并未涉及超音段層面的聲調(diào),因為就可懂度而言,聲調(diào)對可懂度的影響最小。譬如,外國人說漢語,很多都掌握不了漢語的聲調(diào),但基本不影響他們的交流。 表2
表2說明,“八仙桌”這個三音節(jié)詞,最多有九個音段,從黃巖方言的語音表達可以通過最少6個編輯過程(4個替換音段,一個刪除音段,一個插入音段)變?yōu)獒橹莘窖缘恼Z音表達。那么兩者的編輯距離就是 6。但是由于音節(jié)的長度不同,編輯次數(shù)的多少在整個音節(jié)所占的比重也是不同的,從而對聽懂度造成的影響也是不同的。如果將詞的長度因素考慮在內(nèi),將編輯距離標準化,就是將編輯距離除以音段上可達到的最大對應數(shù)。上述例詞“八仙桌”在音段上可達到的最大的位置對應數(shù)是 9。因此兩者之間的語音距離(phonetic distance)就是6/9=0.67。為了回答元音和輔音在互通度中各起的作用是什么,兩者之間誰的作用大?我們需要把語音距離再分成元音距離和輔音距離。同樣以表 2“八仙桌”這個三音節(jié)詞為例,元音部分最少可經(jīng)過3次編輯過程而達到完全相同,然后再除以全部的最大對應數(shù)9, 兩詞間的元音距離就是3/9=0.33。輔音部分也是同樣的道理,用輔音部分的最少編輯數(shù)除以全部的最大對應數(shù),3/9=0.33。
本研究涉及的五個吳語方言兩兩相互配對(除去自我配對),一共是10對。根據(jù)上述編輯距離的計算方法,我們詳細計算了30個被試三音節(jié)詞匯10對方言之間的編輯距離。下表是本文所研究的五個方言點相互之間的語音距離、元音距離和輔音距離。
五個方言點相互之間的語音距離、元音距離和輔音距離 表3
溫州 吳江 0.57 0.38 0.19溫州 永康 0.56 0.42 0.15溫州 衢州 0.64 0.43 0.21吳江 衢州 0.54 0.36 0.18吳江 永康 0.55 0.40 0.15衢州 永康 0.60 0.44 0.16
本研究主要通過編輯距離與互通度之間的相關(guān)分析來闡述兩個關(guān)系:(1)語音距離與互通度之間的關(guān)系;(2)輔音距離和元音距離與互通度之間的關(guān)系。
本研究除了對10對方言的互通度值與語音距離、輔音距離和元音距離做了相關(guān)性分析外,還對各個語言層次之間,即語音距離、輔音距離和元音距離相互間也做了相關(guān)性分析。各個因素間的相關(guān)性分析的結(jié)果如表4所示:
互通度值、語音距離、輔音距離、元音距離之間的相關(guān)① *相關(guān)在0.05水平上是顯著的(雙尾檢驗);**相關(guān)在 0.01 水平上是顯著的(雙尾檢驗)。 表4
從表 4,我們可以看出互通度值與各個語言距離之間的關(guān)系。其中語音距離、元音距離與互通值的關(guān)系在0.05水平上都是顯著的。而其中輔音對互通度的影響為非顯著性。元音距離與語音距離相比之下,語音距離與互通度的相關(guān)最大,但兩者的差別并不顯著。在各個語言因素間,元音距離和輔音距離與語音距離的相關(guān)度都為顯著,但其中元音距離與語音距離的相關(guān)高于輔音距離與語音距離的相關(guān)度,且元音距離與語音距離在0.01水平上是顯著的,輔音距離與語音距離在0.05水平上顯著。由此可見,元音距離在互通度上起的作用更大。
此外,元音距離與輔音距離的相關(guān)并不呈顯著性,這也說明了此兩者間的關(guān)系是各自相對獨立的。元音距離與輔音距離的具體區(qū)別可表示如下:
元音距離與輔音距離的比較 表5
從表 5,我們可以看出元音距離要比輔音距離在各個方面的值都大,包括平均值、標準差、以及全距,這說明五個吳方言間元音之間的差別比較大。
本研究通過測試吳方言內(nèi)部五個方言點之間的互通度,從音段層面分析了五個吳方言之間的語言距離,揭示了吳方言內(nèi)部的互通度程度與語言距離(音段層面)之間的關(guān)系,并且具體檢驗了輔音和元音不同方面的語言距離與五個吳方言之間的互通度之間的相關(guān)性。我們根據(jù)編輯距離的計算方法,檢驗了語音距離與互通度之間的相關(guān)性,相關(guān)性分析顯示語音距離是具有顯著性的預測因子,即吳方言內(nèi)部相互間的音段編輯距離越大,互通度越小;反之,相互間音段的編輯距離越小,互通度則越大。在元音與輔音之間,我們發(fā)現(xiàn)元音有比輔音在互通度中起更重要的作用(r=-0.733),輔音在吳方言內(nèi)部的互通度中起的作用很小。此結(jié)論與Ashby和Maidment(2005)關(guān)于不同語言互通度與語言距離的假設相反,他們認為輔音比元音包含更多的信息。這一區(qū)別也許反映了影響不同語言間的互通度與不同方言間的互通度的不同因素,也許輔音距離的大小可以用作鑒別語言與方言、或不同方言與同方言內(nèi)部之間的界線的手段之一。當然這一假設需要我們將來做進一步深入、系統(tǒng)的跨語言、跨方言的實證研究來證實。
張吉生、王璐、朱音爾 2013 吳語內(nèi)部互通性研究實驗報告,游汝杰等主編《吳語研究》第七輯,上海教育出版社。
Ashby, M. & J. Maidment 2005 Introducing Phonetic Science. Cambridge: Cambridge University Press.
Gooskens, C. 2007 The contribution of linguistic factors to the intelligibility of closesly related lanaguages.Journal of Multilingual and Multicultural Development. Vol. 28, No. 6. 445-467.
Kessler, B. 1995 Computational Dialectology in Irish Gaelic. In Proceedings of the 7th Conference of the European Chapter of the Association for Computational Linguistics (pp. 60-67). Dublin: Association for Computational Linguistics.
Heeringa, W. 2004 Measuring Dialect Pronunciation Differences Using Levenshtein Distance. Doctoral dissertation: University of Groningen.
Heeringa, W., K. Johnson & C. Gooskens 2005 Measuring Norwegian Dialect Distances Using Acoustic Features. In UC Berkeley Phonology Lab Annual Report 2005, University of California, Berkeley:312-336.
Levenshtein, V. I. 1966 Binary Codes Capable of Correcting Deletions, Insertions and Reversals (in Russian), Dokl. Akad, Nauk SSSR 163, No. 4, (1965), 845-848; English Translation in Soviet Physics Doklady 10:8.707-710,
Serva, M. & F. Petroni 2008 Indo-European Languages Tree by Levenshtein Distance. Europhysics Letters 81, 1-5.
Tang, Chaoju 2009 Mutual Intelligibility of Chinese Dialects: An Experimental Approach. LOT Dissertation Series, Utrecht: LOT.
Van Hout, R. & H. Münstermann 1981 Linguistische Afstand, Dialekt en Attitude [Linguistic Distance,Dialect and Attitude]. Gramma, 5: 101-123.