亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于編輯距離的漢語(yǔ)中介語(yǔ)語(yǔ)音計(jì)算分類(lèi)

        2020-04-12 11:24:25于爽冉啟斌史晴琳
        現(xiàn)代語(yǔ)文 2020年11期

        于爽 冉啟斌 史晴琳

        摘 ?要:借鑒ASJP模式的語(yǔ)檔距離計(jì)算方法,對(duì)25個(gè)母語(yǔ)背景的漢語(yǔ)學(xué)習(xí)者的中介語(yǔ)語(yǔ)音表現(xiàn)進(jìn)行分類(lèi),并借助統(tǒng)計(jì)學(xué)和系統(tǒng)發(fā)生學(xué)方法,繪制漢語(yǔ)普通話與25種中介語(yǔ)距離關(guān)系樹(shù)圖。這些樹(shù)圖均顯示出,母語(yǔ)在同一語(yǔ)系的中介語(yǔ)基本分布在同一總分支上,反映出母語(yǔ)對(duì)中介語(yǔ)的形成產(chǎn)生主導(dǎo)影響。同時(shí),樹(shù)圖中也存在母語(yǔ)屬于同一語(yǔ)系的中介語(yǔ)分開(kāi)、或是與其他語(yǔ)系中介語(yǔ)歸入同一小分支的現(xiàn)象。由此看出,不同語(yǔ)系的母語(yǔ)影響大小有一定區(qū)別,偏誤共性對(duì)距離關(guān)系的形成也會(huì)產(chǎn)生較大影響。

        關(guān)鍵詞:漢語(yǔ)中介語(yǔ);編輯距離;計(jì)算分類(lèi);ASJP

        一、引言

        就目前的研究現(xiàn)狀來(lái)看,國(guó)內(nèi)學(xué)界對(duì)漢語(yǔ)作為第二語(yǔ)言學(xué)習(xí)者的中介語(yǔ)語(yǔ)音研究,方法多種多樣,并取得了豐碩的成果。施光亨通過(guò)記錄語(yǔ)音資料的方法,統(tǒng)計(jì)出阿拉伯學(xué)生在習(xí)得漢語(yǔ)時(shí)的語(yǔ)音偏誤[1](P106-112)。傅氏梅、張維佳采用對(duì)比聽(tīng)辨的方法,從聽(tīng)感和發(fā)音能力兩個(gè)方面,考察了越南學(xué)生中介語(yǔ)中的聲母偏誤[2](P69-80)。李紅印在研究泰國(guó)學(xué)生學(xué)習(xí)漢語(yǔ)的語(yǔ)音偏誤時(shí),借助了實(shí)驗(yàn)語(yǔ)音學(xué)的聲學(xué)分析方法[3](P66-71)。梅麗利用一至兩年的跟蹤實(shí)驗(yàn),對(duì)日本學(xué)習(xí)者學(xué)習(xí)漢語(yǔ)卷舌聲母的語(yǔ)音變異情況進(jìn)行了探討[4](P97-105)。張林軍從感知的角度,采用實(shí)驗(yàn)手段,闡釋了日本留學(xué)生的聲調(diào)習(xí)得情況[5](P9-15)。冉啟斌、于爽的《漢語(yǔ)語(yǔ)音偏誤的特點(diǎn)與模式——基于25種母語(yǔ)背景學(xué)習(xí)者的偏誤條目數(shù)據(jù)的分析》一文,利用528條偏誤條目數(shù)據(jù),歸納了第二語(yǔ)言學(xué)習(xí)者中介語(yǔ)語(yǔ)音中的偏誤特點(diǎn),如學(xué)習(xí)者聲母、韻母、聲調(diào)在漢語(yǔ)學(xué)習(xí)中發(fā)生偏誤的情形并不是均衡的,學(xué)習(xí)者個(gè)別語(yǔ)音表現(xiàn)受母語(yǔ)影響,會(huì)呈現(xiàn)出不同于其他學(xué)習(xí)者的個(gè)性偏誤表現(xiàn)等[6](P417-432)。

        本文以冉啟斌、于爽整理出的各母語(yǔ)背景的偏誤條目為依據(jù)[6],借鑒ASJP模式的語(yǔ)檔距離計(jì)算方法,分析不同母語(yǔ)背景學(xué)習(xí)者的中介語(yǔ)語(yǔ)音之間的距離關(guān)系,并對(duì)25種母語(yǔ)背景帶有偏誤的漢語(yǔ)中介語(yǔ)語(yǔ)音進(jìn)行分類(lèi),探討影響中介語(yǔ)分類(lèi)的各種因素。

        “相似性自動(dòng)判斷程序數(shù)據(jù)庫(kù)(Automated Similarity Judgment Program,網(wǎng)址是https://asjp.clld.org/)”,簡(jiǎn)稱(chēng)“ASJP”,是馬普研究院建立的“跨語(yǔ)言關(guān)聯(lián)(Cross Linguistic Linked Database)”在線數(shù)據(jù)庫(kù)之一。該數(shù)據(jù)庫(kù)收集了龐大的數(shù)據(jù)量,其第19版數(shù)據(jù)庫(kù)收錄了世界語(yǔ)言中的9788個(gè)語(yǔ)檔,語(yǔ)檔涉及到世界范圍的5499種語(yǔ)言。同時(shí),項(xiàng)目團(tuán)隊(duì)在該數(shù)據(jù)庫(kù)基礎(chǔ)上,發(fā)展出一套完備的相似度計(jì)算方法,并開(kāi)放提供計(jì)算所需的軟件程序。ASJP模式的語(yǔ)言距離及相似度計(jì)算,在世界語(yǔ)言研究中產(chǎn)生了廣泛影響。其中,Wichmann et al探究了不同語(yǔ)系語(yǔ)言的發(fā)源地[7](P50-60);Holman et al考察了不同語(yǔ)言的分化年代[8](P841-875);Müller et al通過(guò)對(duì)第16版數(shù)據(jù)庫(kù)資源進(jìn)行距離計(jì)算,制作了6895個(gè)語(yǔ)檔的世界語(yǔ)言分類(lèi)樹(shù)圖[9](P1-67);江荻采用萊文斯坦編輯距離計(jì)算的方法,以斯瓦迪士100核心詞為材料,對(duì)195種藏緬語(yǔ)族語(yǔ)言或方言進(jìn)行了自動(dòng)分類(lèi)[10](P62-80)。在漢藏語(yǔ)系研究領(lǐng)域,維希曼、冉啟斌對(duì)65個(gè)漢語(yǔ)方言語(yǔ)檔做了系統(tǒng)發(fā)生學(xué)分析[11](P4-13);趙志靖、江荻通過(guò)計(jì)算元、輔音間的距離,再計(jì)算編輯距離,從而對(duì)數(shù)種藏語(yǔ)方言進(jìn)行了分類(lèi)[12](P43-48)。在第二語(yǔ)言習(xí)得領(lǐng)域,崔萌等以漢語(yǔ)水平考試(HSK)作為研究對(duì)象,通過(guò)引入漢語(yǔ)與學(xué)習(xí)者母語(yǔ)的距離計(jì)算,分析了學(xué)習(xí)者的母語(yǔ)差異對(duì)漢語(yǔ)作為第二語(yǔ)言習(xí)得的影響,指出語(yǔ)言距離與漢語(yǔ)習(xí)得呈負(fù)相關(guān)關(guān)系[13](P280-288)。總的來(lái)說(shuō),在目前以多個(gè)母語(yǔ)背景學(xué)習(xí)者的中介語(yǔ)研究中,借助距離計(jì)算方法對(duì)中介語(yǔ)語(yǔ)音表現(xiàn)進(jìn)行的分析,還較少有人涉及。

        本文首先確定40個(gè)能夠典型體現(xiàn)漢語(yǔ)語(yǔ)音特點(diǎn)的詞語(yǔ),按照冉啟斌、于爽歸納的偏誤條目,對(duì)25種母語(yǔ)背景的中介語(yǔ)進(jìn)行轉(zhuǎn)寫(xiě);然后,利用ASJP工具計(jì)算不同中介語(yǔ)之間的距離和相似度,并采用聚類(lèi)分析、系統(tǒng)發(fā)生學(xué)分類(lèi)方法對(duì)中介語(yǔ)進(jìn)行分類(lèi)。在此基礎(chǔ)上,探討學(xué)習(xí)者中介語(yǔ)受其母語(yǔ)影響的程度、不同母語(yǔ)背景學(xué)習(xí)者中介語(yǔ)語(yǔ)音之間的關(guān)系。

        二、研究設(shè)計(jì)

        (一)研究對(duì)象

        本文以美國(guó)、俄羅斯、韓國(guó)、泰國(guó)、西班牙、德國(guó)、荷蘭、法國(guó)、日本、埃及、烏克蘭、哈薩克斯坦、巴西、意大利、土耳其、蒙古、白俄羅斯、芬蘭、尼泊爾、巴基斯坦、尼日利亞、印度尼西亞等22個(gè)國(guó)家和中國(guó)壯族、藏族、維吾爾族3個(gè)少數(shù)民族的學(xué)習(xí)者為研究對(duì)象,對(duì)以上25個(gè)母語(yǔ)背景的學(xué)習(xí)者的中介語(yǔ)語(yǔ)音表現(xiàn)與漢語(yǔ)普通話進(jìn)行相似度和距離計(jì)算。這25個(gè)國(guó)家或民族的母語(yǔ)語(yǔ)種相應(yīng)為:英語(yǔ)、俄語(yǔ)、韓語(yǔ)、泰語(yǔ)、西班牙語(yǔ)、德語(yǔ)、荷蘭語(yǔ)、法語(yǔ)、日語(yǔ)、阿拉伯語(yǔ)、烏克蘭語(yǔ)、哈薩克語(yǔ)、巴西葡萄牙語(yǔ)、意大利語(yǔ)、土耳其語(yǔ)、蒙語(yǔ)、白俄羅斯語(yǔ)、芬蘭語(yǔ)、尼泊爾語(yǔ)、烏爾都語(yǔ)、尼日利亞(英語(yǔ))①、印度尼西亞語(yǔ)、壯語(yǔ)、藏語(yǔ)、維吾爾語(yǔ)等。以上25種語(yǔ)言與語(yǔ)種的情況如表1所示:

        以上25個(gè)國(guó)家或民族分布于世界七大洲中的五個(gè)大洲、所涉及母語(yǔ)語(yǔ)種涵蓋了九個(gè)主要語(yǔ)系中的六個(gè)語(yǔ)系,研究對(duì)象的覆蓋范圍較為均勻。以上25種母語(yǔ)背景所形成的漢語(yǔ)中介語(yǔ),不僅能夠很好地體現(xiàn)出世界漢語(yǔ)學(xué)習(xí)者中介語(yǔ)的特點(diǎn),而且對(duì)探究學(xué)習(xí)者母語(yǔ)與中介語(yǔ)的關(guān)系也具有較高的學(xué)術(shù)價(jià)值。

        (二)中介語(yǔ)語(yǔ)檔的構(gòu)建

        ASJP數(shù)據(jù)庫(kù)以“斯瓦迪士100核心詞”為內(nèi)容,盡可能多地收集世界上各種語(yǔ)言或方言中不少于斯瓦迪士核心詞表中40個(gè)詞的語(yǔ)音形式。這40個(gè)詞均是經(jīng)過(guò)檢測(cè)和論證得到的、用于距離和相似度計(jì)算的最穩(wěn)定的詞。以往的研究表明,在第二語(yǔ)言學(xué)習(xí)中,漢語(yǔ)的22個(gè)聲母(含零聲母)、39個(gè)韻母發(fā)生偏誤的情況并不均衡,如聲母和韻母中最易產(chǎn)生偏誤的前5種語(yǔ)音類(lèi)型是:舌尖后聲母r,舌尖后聲母zh、ch、sh,舌尖元音(-?、-?),復(fù)韻母,鼻音韻尾-n、-ng等。因此,根據(jù)漢語(yǔ)語(yǔ)音的實(shí)際情況,本文單獨(dú)設(shè)計(jì)了能夠典型體現(xiàn)漢語(yǔ)語(yǔ)音特點(diǎn)的中介語(yǔ)詞表。該詞表共包含40個(gè)詞語(yǔ),具體如表2所示:

        該詞表的設(shè)計(jì)主要遵循兩個(gè)原則。一是詞表對(duì)漢語(yǔ)普通話單念和語(yǔ)流中的語(yǔ)音音位(音素)進(jìn)行了全方位的覆蓋,它既包括普通話單念時(shí)的22個(gè)聲母(含零聲母)、39個(gè)韻母和4個(gè)聲調(diào),也包括語(yǔ)流中的三聲變調(diào)、輕聲、兒化、“一、不”的變調(diào)等音變現(xiàn)象。二是詞表著重凸顯了二語(yǔ)學(xué)習(xí)中容易發(fā)生的語(yǔ)音偏誤。根據(jù)冉啟斌、于爽的研究結(jié)論[6],該詞表包含了更多的舌尖后音聲母、舌尖元音、[er]韻母、前后鼻音、送氣音等,目的是為了更充分地展現(xiàn)學(xué)習(xí)者中介語(yǔ)之間的特點(diǎn)和差異。

        為了構(gòu)建25個(gè)母語(yǔ)背景學(xué)習(xí)者學(xué)習(xí)漢語(yǔ)的中介語(yǔ)語(yǔ)檔,本文將上述40個(gè)詞語(yǔ)按照冉啟斌、于爽研究中的偏誤條目描述進(jìn)行國(guó)際音標(biāo)轉(zhuǎn)寫(xiě),使之成為帶有偏誤特征的語(yǔ)音表現(xiàn)。比如,泰國(guó)學(xué)習(xí)者的常見(jiàn)偏誤主要有將舌面擦音x[?]發(fā)為[s]、將舌尖后音發(fā)為舌尖前音、將送氣塞擦音發(fā)為同部位的擦音等,因此,可以將泰國(guó)學(xué)習(xí)者“大學(xué)”一詞的國(guó)際音標(biāo)轉(zhuǎn)寫(xiě)為[ta su?],“中秋”一詞的國(guó)際音標(biāo)轉(zhuǎn)寫(xiě)為[tsu? ?i?u]。之后,再將帶有學(xué)習(xí)者偏誤發(fā)音的中介語(yǔ)和漢語(yǔ)普通話的國(guó)際音標(biāo)標(biāo)音形式轉(zhuǎn)換為ASJP碼的標(biāo)寫(xiě)形式,最終形成漢語(yǔ)普通話和25個(gè)中介語(yǔ)共26個(gè)語(yǔ)檔。

        (三)語(yǔ)檔相似度與距離計(jì)算方法

        我們之所以將26個(gè)語(yǔ)檔由國(guó)際音標(biāo)轉(zhuǎn)換為ASJP碼的標(biāo)寫(xiě)方式,是因?yàn)樗梢允褂?jì)算得到的語(yǔ)檔距離和相似度更加符合語(yǔ)言之間的實(shí)際距離和相似度。語(yǔ)檔轉(zhuǎn)寫(xiě)后,使用ASJP的工具軟件,計(jì)算各語(yǔ)檔的LDND距離,形成距離矩陣。具體的距離計(jì)算方法為“萊文斯坦編輯距離(Levenshtein Distance)”,簡(jiǎn)稱(chēng)“LD”。所謂的“萊文斯坦編輯距離”,就是由一個(gè)字符串轉(zhuǎn)換為另一個(gè)字符串所需的最少操作次數(shù)。這一計(jì)算方法只允許插入、刪除、替換三種操作。ASJP模式的距離計(jì)算有不同的方法,如“歸一化萊文斯坦距離(Levenshtein Distance Normalized)”、“歸一化萊文斯坦距離商(Levenshtein Distance Normalized Divided)”等,前者簡(jiǎn)稱(chēng)“LDN”,后者簡(jiǎn)稱(chēng)“LDND”。本文計(jì)算語(yǔ)檔之間的距離均采用LDND這一方法。LDND距離計(jì)算的公式是:

        最后,依據(jù)距離矩陣進(jìn)行計(jì)算分類(lèi),形成統(tǒng)計(jì)學(xué)系統(tǒng)聚類(lèi)樹(shù)圖和系統(tǒng)發(fā)生學(xué)樹(shù)圖等。

        三、漢語(yǔ)中介語(yǔ)語(yǔ)音的計(jì)算和分類(lèi)

        (一)漢語(yǔ)中介語(yǔ)語(yǔ)音的距離與相似度

        在形成距離矩陣后,本文首先將25種中介語(yǔ)與漢語(yǔ)普通話的LDND距離數(shù)據(jù)單獨(dú)提取出來(lái),并計(jì)算出各中介語(yǔ)與普通話之間的相似度。具體數(shù)據(jù)如表3所示(為便于觀察,將漢語(yǔ)普通話放在第1行):

        如表3所示,在25種中介語(yǔ)中,藏族學(xué)習(xí)者的中介語(yǔ)與漢語(yǔ)普通話距離最近,為23.65,兩者的相似度達(dá)到了76.35%;而日本學(xué)習(xí)者的中介語(yǔ)與漢語(yǔ)普通話距離最遠(yuǎn),為63.96,兩者的相似度最低,僅有36.04%。維希曼、冉啟斌曾根據(jù)世界語(yǔ)言語(yǔ)檔中語(yǔ)言變體之間的關(guān)系層級(jí)問(wèn)題,給出了不同關(guān)系層級(jí)的參考指標(biāo):如果兩種語(yǔ)言的相似度大于50.90%,則屬于相同方言;相似度在50.90%~18.64%之間的,屬于相同語(yǔ)族之間的語(yǔ)言;相似度在18.64%~2.37%之間的,屬于相同語(yǔ)系不同語(yǔ)族之間的語(yǔ)言;低于2.37%的,則屬于不同語(yǔ)系[14](P126-135)。根據(jù)這一參考指標(biāo)可以看出,藏族、白俄羅斯、尼日利亞等12個(gè)民族或國(guó)家的學(xué)習(xí)者的中介語(yǔ)相似度均大于50.90%,若將中介語(yǔ)視作是一種獨(dú)立的世界語(yǔ)言,它們的語(yǔ)音表現(xiàn)都接近漢語(yǔ)方言;這其中就包括了母語(yǔ)與漢語(yǔ)在同一語(yǔ)系的藏族、泰國(guó)、壯族學(xué)習(xí)者。而其余13個(gè)民族或國(guó)家的學(xué)習(xí)者的中介語(yǔ)相似度,均在50.90% ~18.64%之間,若將中介語(yǔ)視作是一種獨(dú)立的世界語(yǔ)言,它們的語(yǔ)音表現(xiàn)都接近于漢語(yǔ)同一語(yǔ)族的語(yǔ)言。同時(shí),從表3還可看出,同樣為英語(yǔ)背景,尼日利亞跟美國(guó)學(xué)習(xí)者的中介語(yǔ)與漢語(yǔ)相似度差別較大,其原因可能是在于我們所收集到的尼日利亞偏誤條目較少、不夠完備,因此,沒(méi)有完全體現(xiàn)出尼日利亞學(xué)習(xí)者的特點(diǎn)。

        我們還將以上相似度的數(shù)據(jù)繪制為折線圖,具體如圖1所示:

        從圖1可以看出,25種中介語(yǔ)的下降較為平緩,僅在白俄羅斯、泰國(guó)和蒙古處有輕微的陡坡;大部分中介語(yǔ)相似度緊密集中在40%~60%之間。由此可以得知,漢語(yǔ)學(xué)習(xí)者的語(yǔ)音發(fā)音表現(xiàn)較為集中和一致。

        (二)漢語(yǔ)中介語(yǔ)語(yǔ)音的聚類(lèi)分析

        我們又采用了SPSS軟件,對(duì)26個(gè)語(yǔ)檔的距離數(shù)據(jù)進(jìn)行分析。這里采取平均聯(lián)接(組間)的方法進(jìn)行系統(tǒng)聚類(lèi),其度量標(biāo)準(zhǔn)為平方歐氏距離,從而得到Ward聯(lián)接的分類(lèi)樹(shù)狀圖。具體如圖2所示:

        從圖2可以看出,該樹(shù)狀圖可以分為四大分支。在第一大分支中,漢語(yǔ)普通話正好位于最上端,藏語(yǔ)中介語(yǔ)與漢語(yǔ)普通話處于同一末端節(jié)點(diǎn)上,其次是泰語(yǔ)與壯語(yǔ)中介語(yǔ)。與之較近的第二大分支為意大利語(yǔ)、烏爾都語(yǔ)、俄語(yǔ)、法語(yǔ)、白俄羅斯語(yǔ)與尼泊爾語(yǔ)中介語(yǔ),其中,意大利語(yǔ)與烏爾都語(yǔ)中介語(yǔ)、俄語(yǔ)與法語(yǔ)、白俄羅斯語(yǔ)與尼泊爾語(yǔ)中介語(yǔ)分別在同一末端節(jié)點(diǎn)上。其次較遠(yuǎn)的第三大分支又被分成兩個(gè)分支:一個(gè)為土耳其語(yǔ)、蒙語(yǔ)、芬蘭語(yǔ)中介語(yǔ)分支;另一個(gè)則為烏克蘭語(yǔ)、巴西葡萄牙語(yǔ)、西班牙語(yǔ)等印歐語(yǔ)系中介語(yǔ)主導(dǎo)(其中的哈薩克語(yǔ)為阿爾泰語(yǔ)系、印尼語(yǔ)為南島語(yǔ)系)的分支。最遠(yuǎn)的第四大分支里包括了韓語(yǔ)、日語(yǔ)、美國(guó)英語(yǔ)、維吾爾語(yǔ)、阿拉伯語(yǔ)、荷蘭語(yǔ)中介語(yǔ),它們形成了一個(gè)非常特別的組合。

        在圖2的基礎(chǔ)上,我們可以對(duì)漢語(yǔ)學(xué)習(xí)者的中介語(yǔ)語(yǔ)音表現(xiàn)進(jìn)行一個(gè)初步分析。

        第一,學(xué)習(xí)者的中介語(yǔ)的語(yǔ)音形成受到自身母語(yǔ)的影響,而且其影響程度較強(qiáng)??傮w來(lái)看,中介語(yǔ)總的分支分布基本符合其對(duì)應(yīng)母語(yǔ)在世界語(yǔ)言中的語(yǔ)系分布。與漢語(yǔ)普通話在同一末端節(jié)點(diǎn)的為母語(yǔ)同是漢藏語(yǔ)系的藏語(yǔ)中介語(yǔ),而壯語(yǔ)、泰語(yǔ)也同屬漢藏語(yǔ)系,以其為母語(yǔ)背景的中介語(yǔ)也與它們?cè)谕环种?。土耳其語(yǔ)與蒙語(yǔ)的中介語(yǔ)分屬在同一末端。同時(shí),第三大分支中除哈薩克和印尼語(yǔ)外,其他中介語(yǔ)均為印歐語(yǔ)系中介語(yǔ)的集合。而日語(yǔ)、韓語(yǔ)語(yǔ)系未定,以其母語(yǔ)為背景的中介語(yǔ)則處于距漢語(yǔ)最遠(yuǎn)的一個(gè)大的分支中;雖然在地緣上中、日、韓距離非常接近,但并沒(méi)有拉近漢語(yǔ)與二者中介語(yǔ)的距離。

        第二,雖然學(xué)習(xí)者中介語(yǔ)語(yǔ)音的形成受到了自身母語(yǔ)的影響,但并未成為影響其語(yǔ)音表現(xiàn)的充分條件。冉啟斌、于爽指出,在學(xué)習(xí)者中介語(yǔ)中,某些音素會(huì)產(chǎn)生一致的偏誤表現(xiàn),如舌尖后音最易產(chǎn)生的偏誤是發(fā)為舌葉音等[6]。因此,漢語(yǔ)學(xué)習(xí)者的偏誤共性對(duì)于中介語(yǔ)的形成也產(chǎn)生了較大影響,母語(yǔ)背景原本屬于不同語(yǔ)系的中介語(yǔ),可能會(huì)由此突破母語(yǔ)的語(yǔ)系分類(lèi)而歸屬于同一分支內(nèi)。從圖2可以看出,部分中介語(yǔ)并沒(méi)有按照其母語(yǔ)的規(guī)律歸入相應(yīng)語(yǔ)系的分支中,甚至有些語(yǔ)系的中介語(yǔ)散落在不同的分支中,從而形成了與漢語(yǔ)普通話距離遠(yuǎn)近不一的情況;或者是雖同屬一個(gè)語(yǔ)系、但屬于不同語(yǔ)族的語(yǔ)言,其中介語(yǔ)卻被重組到了同一個(gè)末端內(nèi)。比如,母語(yǔ)同屬于印歐語(yǔ)系,意大利語(yǔ)、法語(yǔ)、烏爾都語(yǔ)等的中介語(yǔ),就位于漢語(yǔ)最近的一個(gè)大分支內(nèi);而烏克蘭語(yǔ)、西班牙語(yǔ)、德語(yǔ)等的中介語(yǔ),位于更遠(yuǎn)的分支上;美國(guó)英語(yǔ)、荷蘭語(yǔ)則距離漢語(yǔ)最遠(yuǎn)。再如,母語(yǔ)同屬于阿爾泰語(yǔ)系,哈薩克語(yǔ)中介語(yǔ)與土耳其語(yǔ)中介語(yǔ)并未進(jìn)入同一個(gè)末端;維吾爾語(yǔ)中介語(yǔ)則更是處在距漢語(yǔ)最遠(yuǎn)處的分支中。此外,印歐語(yǔ)系中各語(yǔ)族的語(yǔ)言,其形成的中介語(yǔ)也并未能進(jìn)入同一個(gè)末端,反而是進(jìn)行了重新組合,如拉丁語(yǔ)族中的意大利語(yǔ)與印度語(yǔ)族中的烏爾都語(yǔ)的中介語(yǔ)位于同一末端,而拉丁語(yǔ)族的另一語(yǔ)言法語(yǔ)則與斯拉夫語(yǔ)族的俄語(yǔ)的中介語(yǔ)位于同一末端等。

        四、漢語(yǔ)中介語(yǔ)語(yǔ)音的系統(tǒng)發(fā)生學(xué)分析

        上文主要運(yùn)用了統(tǒng)計(jì)分析的方法,對(duì)26個(gè)語(yǔ)檔進(jìn)行了聚類(lèi)分析;下面,我們將采用分子生物學(xué)中的發(fā)生學(xué)分類(lèi)法,對(duì)漢語(yǔ)中介語(yǔ)語(yǔ)檔進(jìn)行分類(lèi)。通常情況下,學(xué)習(xí)者的中介語(yǔ)之間彼此獨(dú)立,不具有發(fā)生學(xué)關(guān)系,不過(guò),本文主要是借鑒發(fā)生學(xué)的分類(lèi)方法,為其提供一個(gè)分類(lèi)的參照。筆者使用分子生物學(xué)軟件MEGA7(Molecular Evolutionary Genetics Analysis),采用鄰接樹(shù)法(Neighbor-Joining Tree),構(gòu)建26個(gè)語(yǔ)檔的分類(lèi)關(guān)系,從而得到有根分類(lèi)樹(shù)圖。具體如圖3所示:

        經(jīng)過(guò)發(fā)生學(xué)分類(lèi)法繪制的樹(shù)形圖,與聚類(lèi)分析得到的結(jié)果大體一致,同時(shí)也有一定的區(qū)別。最外圍的是美國(guó)英語(yǔ)和韓語(yǔ)中介語(yǔ)分支,維吾爾語(yǔ)中介語(yǔ)單獨(dú)在一個(gè)分支。其次,是日語(yǔ)中介語(yǔ)與荷蘭語(yǔ)中介語(yǔ)相連的分支,這一點(diǎn)與聚類(lèi)分析的結(jié)果有所不同。再次,是含有漢語(yǔ)普通話的一個(gè)大分支,這一分支中漢語(yǔ)與藏語(yǔ)中介語(yǔ)仍然在同一分支,與之相接近的是泰語(yǔ)與壯語(yǔ)中介語(yǔ)分支,這些均與聚類(lèi)分析的結(jié)果一致;不過(guò),白俄羅斯語(yǔ)中介語(yǔ)成為單獨(dú)一個(gè)分支,同歸在這一分支之內(nèi),這一點(diǎn)又與聚類(lèi)分析不同。芬蘭語(yǔ)單獨(dú)成為一個(gè)分支。接下來(lái)的一個(gè)分支被分為兩個(gè)大組??可系囊唤M基本與聚類(lèi)分析一致:烏克蘭語(yǔ)和巴西葡萄牙語(yǔ)中介語(yǔ)、西班牙語(yǔ)與德語(yǔ)中介語(yǔ)在同一分支,不同的是哈薩克語(yǔ)中介語(yǔ)與蒙語(yǔ)中介語(yǔ)成為了單獨(dú)的分支??肯碌囊唤M是與聚類(lèi)分析分歧最大的部分。這一分支中,最外部的土耳其語(yǔ)成為單獨(dú)一個(gè)分支,其次是烏爾都語(yǔ)分支,意大利語(yǔ)與其分開(kāi)成為下一層單獨(dú)一個(gè)分支,內(nèi)部是俄語(yǔ)和法語(yǔ)、阿拉伯語(yǔ)與尼泊爾語(yǔ)兩個(gè)小分支。

        為了能更清晰地顯示26個(gè)語(yǔ)檔的分支關(guān)系,本文又在MEGA中繪制了放射狀的無(wú)根分類(lèi)樹(shù)圖。具體如圖4所示(見(jiàn)下頁(yè)):

        在放射狀模式中,各語(yǔ)檔的分支關(guān)系更為明顯。圖4中,芬蘭語(yǔ)中介語(yǔ)處在單獨(dú)的分支,其余語(yǔ)檔則分為三簇:以漢語(yǔ)為代表的漢藏語(yǔ)系中介語(yǔ)分支(其中也出現(xiàn)了非漢藏語(yǔ)系的白俄羅斯語(yǔ)的中介語(yǔ)),韓語(yǔ)、日語(yǔ)、美國(guó)英語(yǔ)等中介語(yǔ)的分支,剩下的語(yǔ)檔則組成的一個(gè)大的分支。最后這一大的分支以印歐語(yǔ)系中介語(yǔ)為主導(dǎo),阿爾泰語(yǔ)系的中介語(yǔ)亦夾雜其間。

        由系統(tǒng)發(fā)生學(xué)鄰接法形成的兩種樹(shù)狀圖,再次印證了上文的分析;同時(shí),我們還可以從其與聚類(lèi)分析的不同之處,發(fā)現(xiàn)一些新的特點(diǎn)。

        第一,系統(tǒng)發(fā)生學(xué)樹(shù)圖再次印證了學(xué)習(xí)者的中介語(yǔ)的語(yǔ)音形成受自身母語(yǔ)的影響,但不同語(yǔ)系的影響強(qiáng)弱有一定區(qū)別。維吾爾語(yǔ)、蒙語(yǔ)、哈薩克語(yǔ)、土耳其語(yǔ)同屬于阿爾泰語(yǔ)系,但以它們作為母語(yǔ)背景的中介語(yǔ)分別進(jìn)入了不同分支中,而且它們之間相距較遠(yuǎn)。印歐語(yǔ)系中的斯拉夫語(yǔ)族——俄語(yǔ)、烏克蘭語(yǔ)、白俄羅斯語(yǔ),以其母語(yǔ)為背景的漢語(yǔ)中介語(yǔ)也出現(xiàn)了同樣的狀況。而接近漢語(yǔ)的漢藏語(yǔ)系其他語(yǔ)言、印歐語(yǔ)系除斯拉夫語(yǔ)族的其他語(yǔ)言的中介語(yǔ),則較為集中。這種現(xiàn)象也可以歸結(jié)為印歐語(yǔ)系的語(yǔ)言自身的影響力較大,在一定程度上更容易影響漢語(yǔ)習(xí)得。

        第二,與母語(yǔ)負(fù)遷移相比,地理上的位置遠(yuǎn)近對(duì)中介語(yǔ)的形成影響較小。雖然藏語(yǔ)、壯語(yǔ)中介語(yǔ)與漢語(yǔ)普通話距離較近,但同樣屬于中國(guó)少數(shù)民族的維吾爾語(yǔ)中介語(yǔ)則距離漢語(yǔ)較遠(yuǎn),蒙語(yǔ)中介語(yǔ)甚至位于距離漢語(yǔ)最遠(yuǎn)的一個(gè)大分支內(nèi)。地緣、文化相近的烏克蘭、白俄羅斯、俄羅斯也有相同的情況。反觀各小分支中,烏克蘭與巴西、尼日利亞與印度尼西亞、荷蘭與日本、美國(guó)與韓國(guó),它們甚至不在一個(gè)大洲內(nèi),但它們學(xué)習(xí)者的中介語(yǔ)則位于同一分支下。至于出現(xiàn)這一現(xiàn)象的原因,上文亦曾提及,主要是在于這些學(xué)習(xí)者的中介語(yǔ)內(nèi)部存在著一定的偏誤共性,如美國(guó)與韓國(guó)學(xué)習(xí)者的聲母zh、ch、sh均產(chǎn)生了偏誤,而且其偏誤表現(xiàn)均為“舌葉音[?]、[?]、[?]”。由系統(tǒng)發(fā)生學(xué)鄰接法形成的兩種樹(shù)狀圖也再次印證了這一分析。

        五、結(jié)語(yǔ)

        本文采用ASJP的計(jì)算模式和方法,并結(jié)合漢語(yǔ)普通話,對(duì)25個(gè)母語(yǔ)背景的漢語(yǔ)中介語(yǔ)語(yǔ)檔進(jìn)行了距離計(jì)算。通過(guò)對(duì)統(tǒng)計(jì)系統(tǒng)聚類(lèi)和系統(tǒng)發(fā)生學(xué)分類(lèi)進(jìn)行的分析,進(jìn)一步深化了對(duì)漢語(yǔ)中介語(yǔ)的認(rèn)識(shí)。首先,大部分學(xué)習(xí)者的中介語(yǔ)水平較為集中,如果將之視作一種獨(dú)立的世界語(yǔ)言,可以達(dá)到接近漢語(yǔ)方言或與漢語(yǔ)同語(yǔ)族的水平。其次,漢語(yǔ)學(xué)習(xí)者的自身母語(yǔ)的影響在中介語(yǔ)的形成中起到了主導(dǎo)作用,但不同語(yǔ)系的影響大小有一定區(qū)別,如印歐語(yǔ)系母語(yǔ)的影響就比較大。除母語(yǔ)影響之外,漢語(yǔ)學(xué)習(xí)者的偏誤共性也對(duì)中介語(yǔ)的形成產(chǎn)生了一定影響。當(dāng)然,本文的研究也存在不足之處,部分國(guó)家或民族(如尼日利亞)的偏誤條目收集不夠完備,或許會(huì)對(duì)分析的結(jié)果產(chǎn)生一定影響。今后將針對(duì)這些國(guó)家集中收集學(xué)習(xí)者實(shí)際的語(yǔ)音表現(xiàn),并通過(guò)實(shí)驗(yàn)語(yǔ)音學(xué)方法測(cè)量,獲得更為完備的偏誤條目,以期完善距離分析計(jì)算研究。

        參考文獻(xiàn):

        [1]施光亨.對(duì)阿拉伯學(xué)生進(jìn)行漢語(yǔ)語(yǔ)音教學(xué)的幾個(gè)問(wèn)題[J].語(yǔ)言教學(xué)與研究,1980,(2).

        [2]傅氏梅,張維佳.越南留學(xué)生的漢語(yǔ)聲母偏誤分析[J].世界漢語(yǔ)教學(xué),2004,(2).

        [3]李紅印.泰國(guó)學(xué)生漢語(yǔ)學(xué)習(xí)的語(yǔ)音偏誤[J].世界漢語(yǔ)教學(xué),1995,(2).

        [4]梅麗.日本學(xué)習(xí)者習(xí)得普通話卷舌聲母的語(yǔ)音變異研究[J].世界漢語(yǔ)教學(xué),2005,(1).

        [5]張林軍.日本留學(xué)生漢語(yǔ)聲調(diào)的范疇化知覺(jué)[J].語(yǔ)言教學(xué)與研究,2010,(3).

        [6]冉啟斌,于爽.漢語(yǔ)語(yǔ)音偏誤的特點(diǎn)與模式——基于25種母語(yǔ)背景學(xué)習(xí)者的偏誤條目數(shù)據(jù)的分析[J].世界漢語(yǔ)教學(xué),2019,(3).

        [7]冉啟斌.基于詞匯聲學(xué)距離的語(yǔ)言計(jì)算分類(lèi)實(shí)驗(yàn)[J].民族語(yǔ)文,2020,(3).

        [8]Holman,E.W.,Brown,C.H.,Wichmann,S.et al.Automated Dating of the Worlds Language Families Based on Lexical Similarity[J].Current Anthropology,2011,(6).

        [9]Müller,A.,Velupillai,V.,Wichmann,S.et al.ASJP world language tree of lexical similarity:Version 4 (October 2013).

        [10]江荻.藏緬語(yǔ)譜系的自動(dòng)分類(lèi)實(shí)驗(yàn)[A].《中國(guó)民族語(yǔ)言學(xué)報(bào)》編委會(huì).中國(guó)民族語(yǔ)言學(xué)報(bào)(第一輯)[C].北京:商務(wù)印書(shū)館,2017.

        [11]索倫·維希曼,冉啟斌.ASJP模式的漢語(yǔ)方言計(jì)算分析——以65個(gè)漢語(yǔ)方言語(yǔ)檔為例[J].現(xiàn)代語(yǔ)文,2019,(5).

        [12]趙志靖,江荻.基于編輯距離的語(yǔ)言分類(lèi)研究[J].語(yǔ)言研究,2020,(6).

        [13]崔萌,張衛(wèi)國(guó),孫濤.語(yǔ)言距離、母語(yǔ)差異與漢語(yǔ)習(xí)得:基于語(yǔ)言經(jīng)濟(jì)學(xué)的實(shí)證研究[J].世界漢語(yǔ)教學(xué), 2018,(2).

        [14]索倫·維希曼,冉啟斌.語(yǔ)言與方言的區(qū)分層級(jí)——ASJP模式的核心詞匯距離計(jì)算再分析[J].南開(kāi)語(yǔ)言學(xué)刊,2019,(2).

        基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“中國(guó)境內(nèi)語(yǔ)言核心詞匯聲學(xué)數(shù)據(jù)庫(kù)及計(jì)算研究”(19ZDA300);南開(kāi)大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)項(xiàng)目“數(shù)字中文實(shí)驗(yàn)室建設(shè)啟動(dòng)項(xiàng)目”(63202924)

        Quantitative Classification on Phonological Transcriptions for Interlanguages:

        with Mandarin as Target Language

        Yu Shuang1,Ran Qibin2,Shi Qinglin3

        (1.School of Foreign Languages, Tian University of Technology and Educaion, Tianjin 300222;

        2.School of Literature, Nankai University, Tianjin 300071;

        3.School of Foreign Languages, Tianshi College, Tianjin 301700)

        Abstract:Drawing on the pholonogical distance calculation method of the ASJP, with the speech performance in the interlanguages of 25 learners with native language backgrounds classified, tree diagrams of the distance relationship between Chinese Mandarin and 25 interlanguages above mentioned are drawn in this paper, using statistical and phylogenetic methods. Several tree diagrams indicate that the interlanguages whose native languages belong to the same language family are largely distributed over the same general branch, reflecting the dominant influence of the native language on the formation of the interlanguage. However, there are also the cases that the interlanguages of the same language family are grouped into the same sub-branch with those of other language families. The analysis reveals that the degree of the native languages influence on the interlanguage differs across language families, and that the commonality of speech errors can have a large impact on the formation of distance relations.

        Key words:Chinese interlanguage;edit distance;quantitative classification;ASJP

        作者簡(jiǎn)介:1.于 ?爽,女,天津職業(yè)技術(shù)師范大學(xué)外國(guó)語(yǔ)學(xué)院助教,漢語(yǔ)國(guó)際教育碩士。

        2.冉啟斌,男,南開(kāi)大學(xué)文學(xué)院教授,博士生導(dǎo)師,文學(xué)博士。

        3.史晴琳,女,天津天獅學(xué)院外國(guó)語(yǔ)學(xué)院講師,文學(xué)碩士。

        亚洲国产人成自精在线尤物| 中文字幕人妻中文av不卡专区| 男女下面进入的视频| 午夜片无码区在线| 日韩精品视频在线一二三| av成人一区二区三区| 区二区三区亚洲精品无| 一区二区视频中文字幕| 最新国产精品久久精品| 日韩毛片基地一区二区三区| 中文字幕精品亚洲二区| 青青草成人在线播放视频| 欧美精品亚洲精品日韩专区 | 欧美日韩中文国产一区发布| 一本无码av一区二区三区| 亚洲综合有码中文字幕| 亚洲av无码成人精品国产| 欧美野外疯狂做受xxxx高潮| 妞干网中文字幕| 日产一区二区三区的精品| 亚洲一区二区三区四区五区黄| 欧美a级毛欧美1级a大片免费播放| 久久久国产一区二区三区四区小说| av一区无码不卡毛片| 熟妇人妻丰满少妇一区| 亚洲精品国产精品乱码视色| 国产精品自在线拍国产| 中文字幕亚洲无线码高清| 亚洲中文字幕精品久久久| 东京热人妻系列无码专区 | 成熟了的熟妇毛茸茸| 国产av电影区二区三区曰曰骚网| 五月婷婷激情综合| 久久人妻精品中文字幕一区二区| 久久在一区二区三区视频免费观看| 免费看又色又爽又黄的国产软件 | 国产爽爽视频在线| 午夜黄色一区二区不卡| 亚洲av免费手机在线观看| 亚洲中文字幕无码久久| 中文字幕无码免费久久9|