基于語料庫統(tǒng)計的“音-形”激活概率及加工機(jī)制

2018-03-01 03:31:43李梅秀DanielWorlton邢紅兵

心理學(xué)探新 2018年1期

李梅秀 Daniel S.Worlton 邢紅兵

(北京語言大學(xué)漢語進(jìn)修學(xué)院，北京 100083)

1 引言

形、音、義在心理詞典中的聯(lián)結(jié)關(guān)系及其加工機(jī)制是語言加工中很重要的問題，三者在心理詞典中是相互聯(lián)結(jié)的，并且在語言加工過程中相互作用。其中，“音-形”(從音到形)的加工情況是一個重要的方面。弄清楚“音-形”加工機(jī)制，對于深入了解母語者心理詞典加工機(jī)制、預(yù)測二語學(xué)習(xí)者習(xí)得情況、矯治“音-形”加工問題導(dǎo)致的閱讀障礙等都有一定的參考意義。

在國外詞匯識別領(lǐng)域，Van Orden和Goldinger(1994)提出的共振模型認(rèn)為語音和詞形之間存在雙向共振關(guān)系，即語音的激活會影響詞形激活，反過來詞形的激活也會影響語音的激活。后來的一系列研究證實了這種關(guān)系，并且發(fā)現(xiàn)詞匯加工過程中存在反饋一致性效應(yīng)(feedback consistent effect)，即與拼讀一致的詞(一個語音只對應(yīng)一個詞形)相比，拼讀不一致的詞(一個語音對應(yīng)多個詞形)的識別速度更慢，錯誤率更高。因為在詞匯加工過程中，同音詞形會被激活，相互間產(chǎn)生競爭(Pattamadilok，Morais，Ventura，& Kolinsky，2007；Petrova，Gaskell，& Ferrand，2011；Ventura，Morais，& Kolinsky，2007；Ziegler，Petrova，& Ferrand，2008)。

在漢語的研究中也發(fā)現(xiàn)了這種一致性效應(yīng)。比如來自成人的一些研究發(fā)現(xiàn)“音-形”加工過程中有同音字的比無同音字的加工難度更大(Zhou & Marslen-Wilson，1994)；與同音字家族小的情況相比，同音字家族大的加工難度更大(周海燕，舒華，2008；Wang，Li，Ning，& Zhang，2012)。

然而，值得注意的是，在英語中，同音詞家族成員多數(shù)只有2個，多音詞也多數(shù)只有2個讀音。因此，考察英語的“音-形”加工(即語音到字形或詞形的加工，下文簡稱“音-形”加工)機(jī)制基本上只需分為拼讀一致和拼讀不一致兩種情況。但是漢語的音、形關(guān)系比類似英語這樣的拼音文字系統(tǒng)復(fù)雜得多。從音到形的角度看，音節(jié)載字量(一個音節(jié)對應(yīng)的漢字?jǐn)?shù)量稱為該音節(jié)的“載字量”，即相關(guān)研究中所說的同音字家族數(shù)量)最多達(dá)92個，平均載字量為8.31(蘇新春，林進(jìn)展，2006)。從形到音的角度看，漢語多音字一般有兩到三個讀音，有些多音字的讀音多達(dá)6個，而且多音字在常用漢字中的比例及其在語料中的使用率都比較高。據(jù)劉云漢(2012)統(tǒng)計，3500常用字中共有多音字507個，占14.5%；Worlton(2014)統(tǒng)計的8953個漢字中有901個多音字，占10%，其使用率占語料庫近一半的字次。

顯然，漢語“音-形”關(guān)系類型不能簡單地分為一致(一音對應(yīng)一字或一字對應(yīng)一音)和不一致(一音多字或一字多音)兩種情況，因為后者的交叉對應(yīng)關(guān)系還可以分為很多情況，這使得漢語音、形之間的聯(lián)結(jié)關(guān)系和激活機(jī)制比“音-形”對應(yīng)關(guān)系相對比較簡單的拼音文字要復(fù)雜得多，加工機(jī)制也會更復(fù)雜。

近年來，在心理詞典表征和音、形、義加工的相關(guān)研究中，研究者越來越重視漢語的這一特點。很多研究以獨立的漢字為實驗材料，結(jié)合同音字的頻度差異，考察了同音字家族數(shù)、同音字具體頻率、音節(jié)的累積頻率等因素在“音-形”加工中的作用。多數(shù)研究證實了在漢字加工中存在同音字家族數(shù)效應(yīng)，并且發(fā)現(xiàn)同音字對目標(biāo)漢字的影響受頻度因素的制約(陳寶國，寧愛華，2005)，各個同音字在加工過程中的激活程度存在差異(王文娜，2006；李小健，方杰，樓婧，2011；李小健，王文娜，李曉倩，2011；方杰，李小健，羅畏畏，2014)。

陳寶國等(2005)的視、聽跨通道判斷實驗結(jié)果顯示，當(dāng)呈現(xiàn)的漢字為低頻字時，其同音字越多，判斷時間越長，但呈現(xiàn)的漢字為高頻字時，沒有同音字效應(yīng)。說明在“音-形”加工過程中高頻字的激活程度比較高，受同音字的干擾比較小。

李小健、王文娜等人進(jìn)行的一系列相關(guān)研究進(jìn)一步證實了同音字?jǐn)?shù)的影響和同音字激活程度差異的存在。王文娜(2006)以一個單音節(jié)聽寫任務(wù)和兩個“音-字”同音匹配判斷任務(wù)來考察漢語單字詞“音-形”加工過程中的同音字激活情況，結(jié)果發(fā)現(xiàn)高頻字比低頻字更容易激活，并且有優(yōu)先通達(dá)最高頻同音字的傾向。另外，同音字家族大的音節(jié)通達(dá)速度慢于同音字家族小的音節(jié)。李小健、方杰、樓婧(2011)和方杰、李小健、羅畏畏(2014)的研究采用跨通道“音-字”判斷任務(wù)考察漢語同音字具體頻率和同音字?jǐn)?shù)在聽覺詞匯通達(dá)中的作用，結(jié)果顯示漢字具體頻率高的組反應(yīng)時顯著短于漢字具體頻率低的組，正確率也更高；漢字具體頻率和同音字?jǐn)?shù)之間相互牽制，在二者的相互作用中具體頻率起主導(dǎo)作用。李小健、王文娜、李曉倩(2011)用一個單音節(jié)聽寫實驗和一個“音-字”判斷實驗重點考察了同音字族內(nèi)的聽覺通道詞頻效應(yīng)，結(jié)果也顯示存在同音字族內(nèi)的聽覺通道字頻效應(yīng)，同音字族內(nèi)頻度越高的字通達(dá)的機(jī)會越大，最高頻字通常得到最多的通達(dá)機(jī)會。

從這些研究結(jié)果來看，當(dāng)輸入一個漢語音節(jié)時，會激活多個同音字，但激活程度有很大差異，表現(xiàn)為頻度越高的字越容易激活，并且傾向于優(yōu)先激活最高頻字，說明不同頻度的漢字在“音-形”加工中的激活程度是不一樣的。這些研究成果對相關(guān)的研究有很多啟發(fā)，但是，關(guān)于多音字的問題還需要探討。以上提到的研究并沒有對研究中所采用的字頻進(jìn)行說明，如果研究中采用的字頻來自不區(qū)分多音字的漢字文本語料，那么得到的結(jié)果是不準(zhǔn)確的。以往多數(shù)字頻統(tǒng)計只是統(tǒng)計了字形的頻率，并不區(qū)分多音字。比如：在字頻詞典中查到“和”的頻度為0.00785，這個頻度很可能包括“和(hé)”、“和(hè)”、“和(huó)”、“和(huò)”、“和(hú)”的頻度。音節(jié)“huò”對應(yīng)的幾個比較常用的漢字字形按《漢字字頻詞典》中的頻率從大到小排列依次為：和(0.00785)、或(0.00054)、獲(0.00050)、貨(0.00029)。那么，按照“頻率越高的漢字越容易被激活”的結(jié)論，聽到“huò”這個音節(jié)時這四個字的激活強(qiáng)度順序(從大到小)應(yīng)該是：和>或>獲>貨。然而，試測的結(jié)果顯示，當(dāng)聽到“huò”時，這四個字被激活的概率(從大到小)為：或>獲>貨>和。與按照具體讀音統(tǒng)計得到的頻度順序一致：或(0.1348)、獲(0.0285)、貨(0.0220)、和(0.0002)。顯然，只有考慮多音字問題，按實際讀音統(tǒng)計得到的頻度才能體現(xiàn)這個激活規(guī)律。另外，有些研究為了控制相關(guān)因素，實驗材料的選擇避開多音字，那么這樣得到的結(jié)果就不能預(yù)測多音字的“音-形”加工機(jī)制。

總之，已有研究多數(shù)證實了在“音-形”加工過程中存在一致性效應(yīng)和頻度效應(yīng)。然而，由于漢字形與音的雙向?qū)?yīng)關(guān)系比較復(fù)雜，不能簡單地分為一致或不一致兩種情況，因為不一致的對應(yīng)關(guān)系還包括一對多、多對一、多對多等多種情況，頻度效應(yīng)在不同對應(yīng)關(guān)系中所起的作用必定會不一樣。因此，要深入觀察不同對應(yīng)關(guān)系的“音-形”加工機(jī)制，需要綜合考慮音、形對應(yīng)關(guān)系和頻度。

為了解決這個問題，研究首先通過基于語料庫的統(tǒng)計數(shù)據(jù)計算出了“音-形”激活概率(即在語料庫中出現(xiàn)某個音節(jié)時，其對應(yīng)某個漢字的概率)，并通過一個獨立音節(jié)的聽寫實驗來驗證這種基于語料庫統(tǒng)計的激活概率是否反映實際加工過程中的激活情況。如果基于語料庫統(tǒng)計得到的激活概率反映真實的激活情況，就可以通過該“音-形”激活概率推測一個音節(jié)在加工過程中激活各個漢字的概率，可以基于該概率值構(gòu)建“音-形”加工模型，模擬心理詞典的加工。

2 “音-形”激活概率

Worlton(2014)建立的音節(jié)統(tǒng)計數(shù)據(jù)庫已經(jīng)解決了前面提出的多音字的問題。該數(shù)據(jù)庫包含8953個漢字(type)、1400多個音節(jié)，提供所有漢字和音節(jié)的頻率，以及漢字與音節(jié)的共現(xiàn)頻率。在此基礎(chǔ)上求出了語料庫中的“音-形”對應(yīng)概率(即一個音節(jié)對應(yīng)于某個漢字的概率)，具體計算方法如下。

將音節(jié)和漢字視為隨機(jī)變量，用Z代表漢字，Y代表音節(jié)，通過以下條件概率公式的推導(dǎo)求得語料庫中每個音節(jié)對應(yīng)于某個漢字的概率。

以上公式中的P(Z∩Y)表示音節(jié)“Y”與漢字“Z”共同出現(xiàn)的概率，由公式“P(Z∩Y)=P(Y|Z)P(Z)”得到，P(Y|Z)是指語料庫中某個漢字“Z”對應(yīng)于某個音節(jié)“Y”的概率，P(Y)是音節(jié)在語料庫中的頻率，P(Z)是漢字在語料庫中的頻率。在當(dāng)前研究中，P(Y|Z)、P(Y)、P(Z)均為已知變量(均為前期相關(guān)研究所建混合數(shù)據(jù)模型得到的數(shù)據(jù))*P(Y|Z)=Z在語料中以Y音出現(xiàn)的頻次÷Z在語料中的總頻次(Z以不同讀音出現(xiàn)的頻次之和)。以計算“說”對應(yīng)于“shuì”為例，模型可從原始數(shù)據(jù)中得到的已知數(shù)據(jù)為：P說(shuì)=0.000128，P稅(shuì)=0.000236，P睡(shuì)=0.000173；P說(shuō)=0.004371，P說(shuo)=0.000025，P說(yuè)=0；F說(shuì)=24583，F(xiàn)說(shuō)=845659，F(xiàn)說(shuo)=4916，F(xiàn)說(yuè)=0(“F”代表頻次，即在語料庫中出現(xiàn)的次數(shù))。由此可得：P(說)=P說(shuì)+P說(shuō)+P說(shuo)+P說(yuè)=0.004523；P(shuì)=P說(shuì)+P稅(shuì)+P睡(shuì)=0.000537；P(shuì |說)=F說(shuì)÷(F說(shuì)+F說(shuō)+F說(shuo)+F說(yuè))=24583÷(24583+845659+4916+0)=0.028090。。以計算音節(jié)“shuì”對應(yīng)于漢字“說”的概率為例，已知：P(shuì|說)=0.028090，P(說)=0.004523，P(shuì)=0.000537，計算過程如下：

(1)P(說∩shuì)=P(shuì|說)P(說)=0.028090×0.004523=0.000127；

(2)P(說|shuì)=P(說∩shuì)÷P(shuì)=0.000127÷0.000537=0.236499。

由此得到語料中出現(xiàn)“shuì”時對應(yīng)的漢字是“說”的概率為0.236499。

研究假設(shè)這樣求得的概率值反映實際加工中語音激活字形的概率，因此將其稱為“音-形”激活概率(下文簡稱“激活概率”，用“PZY”表示)，PZY值的范圍均為0到1之間，每個音節(jié)與其對應(yīng)的所有漢字的PZY值之和為1。

從統(tǒng)計的結(jié)果來看，多字音節(jié)可按“音-形”激活概率分為兩類：一類為有優(yōu)勢字的音節(jié)，這類音節(jié)的特點是與之對應(yīng)的多個漢字中某一個漢字的激活概率大于0.5，研究稱這個漢字為該音節(jié)的絕對優(yōu)勢字；另一類是無絕對優(yōu)勢字的音節(jié)，即與各個對應(yīng)漢字的激活概率分布趨于平均的音節(jié)，其中激活概率最高的漢字稱為該音節(jié)的相對優(yōu)勢字(例子見圖1～圖4)。

圖1 載字量高、有絕對優(yōu)勢字的音節(jié) 圖2 載字量高、無絕對優(yōu)勢字的音節(jié)

圖3 載字量低、有絕對優(yōu)勢字的音節(jié) 圖4 載字量低、無絕對優(yōu)勢字的音節(jié)

圖1～圖4括號中的數(shù)字為音節(jié)的載字量，漢字后面的數(shù)字表示“音-形”激活概率。如果這種基于語料庫得到的激活概率反映實際加工中的“音-形”激活概率，那么圖1和圖3將優(yōu)先通達(dá)第一個漢字，各個漢字的激活強(qiáng)度從上到下逐漸減弱。而圖2和圖4的漢字在“音-形”激活過程中被激活的隨機(jī)性會比較大。另外，即使“音-形”對應(yīng)概率分布模式基本相同，如果載字量不同，平均每個漢字分得的激活概率大小有差異，“音-形”激活情況也會不同，即圖1和圖3之間、圖2和圖4之間在加工機(jī)制上也會有一定差異。

3 實驗研究

3.1 實驗設(shè)計

3.2 被試

61名普通話標(biāo)準(zhǔn)的漢語母語者，均為北京語言大學(xué)碩士研究生，視力或矯正視力、聽力均正常，未參加過相似的實驗。

3.3 實驗材料

從第2部分統(tǒng)計形成的數(shù)據(jù)庫中選出100個音節(jié)，按圖1～圖4所示音節(jié)類型分成四組，每組25個音節(jié)，音節(jié)的鄰域密度*鄰域密度是指某個音節(jié)的鄰居數(shù)量，一個音節(jié)的鄰居是指與這個音節(jié)發(fā)音上相似、某些音位相同的音節(jié)，即通過增加、刪減或替換一個音節(jié)的某個音位或聲調(diào)得到的合法音節(jié)就是該音節(jié)的鄰居(李梅秀，2014)。和頻度為主要的控制變量(平均值見表1)。

表1 實驗材料相關(guān)數(shù)據(jù)平均值和例子

實驗材料的重復(fù)測量方差分析結(jié)果顯示，PZY值組間差異主效應(yīng)顯著，F(xiàn)(3，96)=110.276，p<0.0005；載字量高水平上和載字量低水平上有優(yōu)勢字組和無優(yōu)勢字組間PZY值差異均顯著(均為p<0.0005)；不同載字量水平上兩個有優(yōu)勢字組之間和兩個無優(yōu)勢字組之間PZY值差異均不顯著(優(yōu)勢字組間：p=0.136，無優(yōu)勢字組間：p=0.255)。

載字量組間差異主效應(yīng)顯著，F(xiàn)(3，96)=96.943，p<0.0005；有優(yōu)勢字組和無優(yōu)勢字組內(nèi)載字量水平差異顯著(均為p<0.0005)；載字量高有優(yōu)勢字組和載字量高無優(yōu)勢字組之間以及載字量低有優(yōu)勢字和載字量低無優(yōu)勢字組之間載字量差異均不顯著(分別為p=0.677，p=0.645)。

鄰域密度組間差異主效應(yīng)不顯著，F(xiàn)(3，96)=0.159，p=0.923)；頻率組間差異主效應(yīng)不顯著，F(xiàn)(3，96)=2.020，p=0.116。

統(tǒng)計結(jié)果說明材料的相關(guān)變量值符合分組要求，控制變量得到了有效控制。

所有音節(jié)的音頻均來自一名普通話水平為一級乙等(94分)的中國女發(fā)音人，用專業(yè)的錄音設(shè)備在錄音室錄制。所有實驗音節(jié)按隨機(jī)順序排列，并通過人工核查，保證所有相鄰音節(jié)之間不構(gòu)成雙音節(jié)詞，然后按隨機(jī)排好的順序編輯成一個連續(xù)的音頻，每個音節(jié)前面以“嘟”聲開頭，每兩個音節(jié)之間間隔3000ms(通過試測確定3000ms時間足夠被試寫下一個漢字，但是沒有富余時間修改或?qū)懙谝环磻?yīng)以外的字)。

3.4 實驗程序

實驗在一個安靜的多媒體教室進(jìn)行，集體施測，要求被試每聽到一個音節(jié)之后，在3000ms內(nèi)寫下最先想到的一個漢字，寫好以后不可以返回修改。整個實驗時長約7分鐘。

3.5 實驗結(jié)果

3.5.1 兩因素被試內(nèi)方差分析

在最后的統(tǒng)計分析中，被試寫出的漢字與目標(biāo)音節(jié)不能對應(yīng)的情況均視為錯誤。最終，所有被試計入統(tǒng)分析(所有被試正確率均達(dá)到90%以上，被試平均正確率為94.47%)；所有項目也計入統(tǒng)計(所有項目正確率均在85%以上，項目的平均正確率為87.74%)。

分別以優(yōu)勢字產(chǎn)出率、字種數(shù)、各字產(chǎn)出率與PZY值的擬合度、錯誤率為因變量進(jìn)行統(tǒng)計分析。其中，優(yōu)勢字產(chǎn)出率指被試寫出PZY值最高的漢字(優(yōu)勢字或相對優(yōu)勢字)的平均比例；字種數(shù)指每個音節(jié)對應(yīng)的所有漢字中被被試寫出的字種數(shù)量；優(yōu)勢字產(chǎn)出率與PZY值的擬合度是某個漢字被被試寫出的頻率與其在語料庫中的“音-形”對應(yīng)概率的擬合度(通過擬合度分析所得的值)；錯誤率是指被試寫出的漢字不符合對應(yīng)音節(jié)的比例。具體實驗結(jié)果如表2所示。

表2 漢字產(chǎn)出情況和錯誤率(括號中為標(biāo)準(zhǔn)差)

優(yōu)勢字產(chǎn)出率的方差分析結(jié)果顯示，音節(jié)類型主效應(yīng)顯著，有絕對優(yōu)勢字的音節(jié)，被試產(chǎn)出絕對優(yōu)勢字的比例高于無絕對優(yōu)勢字組被試產(chǎn)出相對優(yōu)勢字的比例，F(xiàn)(1，24)=4.276，p=0.05；載字量主效應(yīng)顯著，載字量低的組，被試更容易產(chǎn)出優(yōu)勢字(絕對優(yōu)勢字或相對優(yōu)勢字)，F(xiàn)(1，24)=7.487，p<0.05；音節(jié)類型和載字量的交互作用不顯著，F(xiàn)(1，24)=0.128，p=0.723。

字種數(shù)的方差分析結(jié)果顯示，音節(jié)類型主效應(yīng)顯著，有絕對優(yōu)勢字的組，被試產(chǎn)出的字種數(shù)少于無絕對優(yōu)勢字的組，F(xiàn)(1，24)=192.000，p<0.0005；載字量主效應(yīng)顯著，載字量高的組產(chǎn)出的字種數(shù)多于載字量低的組，F(xiàn)(1，24)=246.674，p<0.0005；音節(jié)類型和載字量交互作用顯著，F(xiàn)(1，24)=14.769，p=0.001。簡單效應(yīng)檢驗結(jié)果顯示，在載字量低的水平上，音節(jié)類型的簡單效應(yīng)顯著，F(xiàn)(1，24)=48.00，p<0.0005；但是，在載字量高的水平上，音節(jié)類型的簡單效應(yīng)更顯著，F(xiàn)(1，24)=109.71，p<0.0005。

各個漢字產(chǎn)出率與PZY值擬合度方差分析結(jié)果顯示，音節(jié)類型主效應(yīng)不顯著，F(xiàn)(1，24)=1.516，p=0.230；載字量主效應(yīng)不顯著，F(xiàn)(1，24)=1.884，p=0.183；音節(jié)類型和載字量交互作用不顯著，F(xiàn)(1，24)=2.377，p=0.136。

錯誤率方差分析結(jié)果顯示，音節(jié)類型主效應(yīng)顯著，有絕對優(yōu)勢字組錯誤率低于無絕對優(yōu)勢字組，F(xiàn)(1，24)=25.334，p<0.0005；載字量主效應(yīng)顯著，載字量低的組錯誤率更高，F(xiàn)(1，24)=20.600，p<0.0005；音節(jié)類型和載字量交互效應(yīng)顯著，F(xiàn)(1，24)=29.509，p<0.0005。簡單效應(yīng)檢驗的結(jié)果顯示，在載字量高的水平上，音節(jié)類型的簡單效應(yīng)不顯著，F(xiàn)(1，24)=0.32，p=0.574；在載字量低的水平上，音節(jié)類型的簡單效應(yīng)顯著，F(xiàn)(1，24)=27.51，p<0.0005。

3.5.2 回歸分析

由于影響漢字加工的因素較多，除了“音-形”概率值所涉及的字頻和多音字之外，前面的分析結(jié)果以及已有相關(guān)研究結(jié)果均顯示載字量也有很大影響，相關(guān)研究還證實漢字筆畫數(shù)(如彭聃齡，王春茂，1997；楊沙沙，2015)、形聲字的形旁或聲旁(如王協(xié)順等，2016)等也有影響。另外，根據(jù)被試的產(chǎn)出結(jié)果，如果一個音節(jié)對應(yīng)的漢字中既有成詞語素和非詞語素，被試傾向于寫出成詞的漢字，由此推測成詞與否也對加工帶來一定影響。

因此，為了觀察“音-形”激活概率在加工過程中的獨特作用，對“音-形”激活概率(PZY)、載字量、筆畫數(shù)、是否為形聲字(形聲字=1，非形聲字=0)、是否成詞(成詞=1，不成詞=0)五個自變量和產(chǎn)出率進(jìn)行了相關(guān)分析(見表3)。

表3 四個自變量及漢字產(chǎn)出率的相關(guān)矩陣

從表3的相關(guān)矩陣中可以看到，“音-形”激活概率、載字量、是否為形聲字、是否成詞都和產(chǎn)出率顯著相關(guān)。其中，“音-形”激活概率與產(chǎn)出率的相關(guān)度最高(r=0.562，p<0.0005)，是否成詞次之(r=0.353，p<0.0005)。另外，其他變量之間也存在一定的相關(guān)。

進(jìn)一步以“音-形”激活概率、載字量、筆畫數(shù)、是否為形聲字、是否成詞五個變量為自變量，產(chǎn)出率為因變量進(jìn)行了回歸分析。采用Enter法進(jìn)行回歸分析，得到R2=0.365，表明五個自變量能夠解釋產(chǎn)出率總變異的36.5%。顯著性檢驗表明，自變量可解釋的因變量變異與誤差變異相比是統(tǒng)計上顯著的，F(xiàn)(5，452)=51.918，p<0.0005。系數(shù)分析發(fā)現(xiàn)，PZY值和是否成詞都對產(chǎn)出率有重要影響。進(jìn)一步的層次回歸分析結(jié)果顯示，控制了其他三個變量之后，“音-形”激活概率的貢獻(xiàn)仍然達(dá)到22.5%(ΔR2=0.358)，其貢獻(xiàn)在統(tǒng)計上是顯著的(p<0.0005)。該結(jié)果表明，“音-形”激活概率確實有其他變量不能解釋的作用，是“音-形”加工過程中漢字產(chǎn)出率的一個重要預(yù)測指標(biāo)，可以反映實際加工中的“音-形”激活情況。

3.5.3 錯誤率分布情況

為了進(jìn)一步了解“音-形”加工過程中除了對應(yīng)漢字的字形，還有哪些表征可能會被激活，研究還對錯誤類型進(jìn)行了分類統(tǒng)計。錯誤情況如圖5所示。

圖5 錯誤率分布

出現(xiàn)的錯誤可分為四大類：音近別字(如：bìng→定)、錯字(如多筆畫或者少筆畫)、形近別字(如：yin1→困)、意義相關(guān)別字(如：xie1→休，該錯誤同時屬于音近別字，因此也計入“音近別字”)。其中，音近別字最多，88%以上的錯誤輸出都是音近別字，其他類型的錯誤非常少，都在10%以下。

這個結(jié)果至少可以說明兩點：一、“音-形”加工過程中，與目標(biāo)音節(jié)相似的語音也會部分激活；二、“音-形”加工過程中，相關(guān)的正字法信息和相關(guān)語義也部分參與了加工。

4 討論

研究結(jié)果顯示，漢語“音-形”加工過程中，不同“音-形”關(guān)系類型的音節(jié)在激活機(jī)制上存在差異，表現(xiàn)為：(1)有絕對優(yōu)勢字組有明顯的優(yōu)勢字效應(yīng)，優(yōu)勢字的平均產(chǎn)出率達(dá)到約50%。(2)有絕對優(yōu)勢字組產(chǎn)出的字種數(shù)(平均4個字)少于無絕對優(yōu)勢字組(約5.2個字)。說明有絕對優(yōu)勢字的音節(jié)在“音-形”加工過程中，主要集中激活與之聯(lián)結(jié)概率最高的幾個漢字，這幾個漢字的激活值遠(yuǎn)高于PZY值較低的漢字，其在產(chǎn)出中占絕對優(yōu)勢，一定程度上抑制了其他同音字的激活；而無絕對優(yōu)勢字的音節(jié)，其對應(yīng)的各個同音字被激活的概率比較平均，因此在聽寫過程中被寫出的機(jī)會也較均等。(3)從回歸分析的結(jié)果來看，PZY值在“音-形”加工過程中有著其他因素所沒有的預(yù)測作用。從產(chǎn)出率與PZY值擬合度的被試內(nèi)方差分析結(jié)果來看，不同類型音節(jié)PZY值對實際加工中“音-形”激活概率的預(yù)測作用也是一樣的，表現(xiàn)為無論是有優(yōu)勢字組還是無優(yōu)勢字組，對應(yīng)漢字的產(chǎn)出率與其PZY值的擬合度都是一樣的，沒有顯著差異。(4)有絕對優(yōu)勢字的組錯誤率較低。這是因為有絕對優(yōu)勢字的音節(jié)傾向于優(yōu)先激活絕對優(yōu)勢字，受音近、形近或意義相關(guān)漢字的影響較小，而無絕對優(yōu)勢字的音節(jié)，對應(yīng)的多個漢字都有差不多的激活概率，每個漢字得到的激活度相對較低，容易受到音近、形近或意義相關(guān)漢字的干擾，甚至輸出這些漢字。這些結(jié)果都說明基于語料庫得到的“音-形”激活概率基本反映實際的激活情況。

另外，載字量也會影響“音-形”激活機(jī)制，表現(xiàn)為：(1)與載字量高的音節(jié)相比，載字量低的音節(jié)更傾向于激活優(yōu)勢字，這是因為根據(jù)計算“音-形”激活概率的方法，每個音節(jié)激活其對應(yīng)的所有漢字的概率值之和都是1，載字量高的音節(jié)，每個漢字分得的PZY值相對較低，即使同為有優(yōu)勢字或有相對優(yōu)勢字的音節(jié)，載字量高的音節(jié)激活優(yōu)勢字或相對優(yōu)勢字的概率要低于載字量低的組，因此，表現(xiàn)出了載字量高的組激活優(yōu)勢字或相對優(yōu)勢字的概率低于載字量低的組。(2)載字量低的組產(chǎn)出的字種數(shù)相對較少，除了因為載字量低的音節(jié)對應(yīng)的漢字更少，另外一個原因是載字量低的音節(jié)優(yōu)勢字激活概率較高，其他同音字的激活概率相對更低。(3)在不同載字量水平上，“音-形”加工過程中音節(jié)類型差異的表現(xiàn)也不同，載字量高的組，有優(yōu)勢字和無優(yōu)勢字產(chǎn)出的字種數(shù)相差更大，這是因為載字量高的水平上，有絕對優(yōu)勢字的組，絕對優(yōu)勢字以外的同音字PZY值都很低(因為有更多的同音字“分享”PZY值)，這些字的激活水平相應(yīng)的都很低；在載字量低的水平上，大部分音節(jié)絕對優(yōu)勢字與其它同音字之間的激活值差異相對較小，絕對優(yōu)勢字以外的同音字也有一定的競爭力，因此產(chǎn)出的字種數(shù)要多一些；而對于無絕對優(yōu)勢字的音節(jié)來講，無論是載字量高的組還是載字量低的組，同音字之間的PZY值都比較平均，被寫出來的概率都差不多。(4)從錯誤率上看，載字量越低的音節(jié)，對應(yīng)漢字產(chǎn)出的錯誤率越高。這可能是因為載字量低的音節(jié)在“音-形”加工中可選擇的輸出相對較少，容易受到音近、形近或意義相關(guān)漢字的干擾。

通過這些結(jié)果，可以肯定的是，同音字家族內(nèi)各個成員被激活的概率存在明顯的差異，這一結(jié)果支持李小健、王文娜等關(guān)于漢語同音字表征激活具有不同等性的發(fā)現(xiàn)(王文娜，2006；李小健，方杰，樓婧，2011；李小健，王文娜，李曉倩，2011)。這種激活強(qiáng)度的差異，可以用基于語料庫的“音-形”激活概率來預(yù)測。

另外，通過錯誤類型的統(tǒng)計發(fā)現(xiàn)，在“音-形”加工過程中，還會激活音節(jié)對應(yīng)漢字字形以外的信息，包括鄰居音節(jié)(讀音相似的音節(jié))，還有形近或意義相關(guān)的漢字。說明“音-形”的加工過程并不是簡單地從音到形的單向激活過程，相關(guān)的語音、正字法和語義信息也會被激活，周海燕和舒華(2008)的研究也發(fā)現(xiàn)“音-形”加工過程中受到語義的影響。因此，雖然目前的“音-形”激活概率已經(jīng)基本可以預(yù)測實際的加工情況，但在未來的研究中，如果要更加精確地預(yù)測和模擬“音-形”激活情況，語義也是需要考慮的一個因素。

通過以上討論，可以得出這樣幾點認(rèn)識：首先，漢語心理詞典中音-形的加工機(jī)制在某種程度上表現(xiàn)為一個概率模型，心理詞典的加工機(jī)制取決于二者之間的聯(lián)結(jié)概率，這種概率可以用基于語料庫統(tǒng)計得到的概率值來預(yù)測。其次，音、形、義的加工在某種程度上會相互影響，從其中任何一種表征到另一種表征的加工過程中必定會不同程度地激活第三種表征，只是激活強(qiáng)度有差異，至于哪種表征的激活強(qiáng)度更強(qiáng)取決于具體的加工目的。

5 結(jié)論

基于語料統(tǒng)計得到的“音-形”激活概率基本反映實際的“音-形”激活情況：

(1)“音-形”激活概率越高的漢字被激活的概率和強(qiáng)度越高，并且有明顯的優(yōu)勢字效應(yīng)。

(2)“音-形”的加工還受載字量、筆畫數(shù)、是否為形聲字、是否成詞等因素的影響，部分與目標(biāo)音節(jié)和目標(biāo)漢字相關(guān)的語音、字形和語義信息也參與到加工中，但基于頻率和多音字信息得到的統(tǒng)計概率仍然具有獨立于這些因素的預(yù)測功能。

陳寶國，寧愛華.(2005).漢字識別中的同音字效應(yīng)：語音影響字形加工的證據(jù).心理學(xué)探新，25(4)，35-39.

方杰，李小健，羅畏畏.(2014).漢語音節(jié)累積詞頻對同音字聽覺詞匯表征的激活作用.心理學(xué)報，46(4)，467-480.

李小健，方杰，樓婧.(2011).漢語同音字具體頻率和同音字?jǐn)?shù)在聽覺詞匯通達(dá)中的相互作用.心理科學(xué)，34(1)，43-47.

李小健，王文娜，李曉倩.(2011).同音字族內(nèi)的聽覺通道詞頻效應(yīng)與同音字表征的激活.心理學(xué)報，43(7)，749-762.

劉云漢.(2012).常用多音字的讀音考察.廊坊師范學(xué)院學(xué)報(社會科學(xué)版)，28(5)，27-30.

彭聃齡，王春茂.(1997).漢字加工的基本單元：來自筆畫數(shù)效應(yīng)和部件數(shù)效應(yīng)的證據(jù).心理學(xué)報，29(1)，9-17.

蘇新春，林進(jìn)展.(2006).普通話音節(jié)數(shù)及載字量的統(tǒng)計分析——基于《現(xiàn)代漢語詞典》注音材料.中國語文，(3)，274-288.

王文娜.(2006).同音字音節(jié)的聽覺詞匯通達(dá)研究.碩士學(xué)位論文.廣州：華南師范大學(xué).

Worlton，D.S.(2014).超越漢字：現(xiàn)代漢語音節(jié)動態(tài)統(tǒng)計分析.數(shù)字化漢語教學(xué)(2014)(pp.437-443).北京：清華大學(xué)出版社.

王協(xié)順，吳巖，趙思敏，倪超，張明.(2016).形旁和聲旁在形聲字識別中的作用.心理學(xué)報，48(2)，130-140.

楊沙沙.(2015).漢字加工中的筆畫數(shù)效應(yīng)：來自ERP的證據(jù).碩士學(xué)位論文.重慶：西南大學(xué).

周海燕，舒華.(2008).漢語音-形通達(dá)過程中的同音字家族效應(yīng)和語義透明度效應(yīng).心理科學(xué)，31(4)，852-855.

Pattamadilok，C.，Morais，J.，Ventura，P.，& Kolinsky，R.(2007).The locus of the orthographic consistency effect in auditory word recognition：Further evidence from French.LanguageandCognitiveProcesses，22，1-27.

Petrova，A.，Gaskell，M.G.，& Ferrand，L.(2011).Orthographic consistency and word frequency effects in auditory word recognition：New evidence from lexical decision and rime detection.FrontiersinPsychology，2(4)，263.

Van Orden，G.C.，& Goldinger，S.D.(1994).Interdependence of form and function in cognitive systems explains perception of printed words.JournalofExperimentalPsychology：HumanPerceptionandPerformance，20(6)，1269-1291.

Ventura，P.，Morais，J.，& Kolinsky，R.(2007).The development of the orthographic consistency effect in speech recognition：From sublexical to lexical involvement.Cognition，105(3)，548-576.

Wang，W.，Li，X.，Ning，N.，& Zhang，J.X.(2012).The nature of the homophone density effect：An ERP study with Chinese spoken monosyllable homophones.NeuroscienceLetters，516(1)，67-71.

Zhou，X.，& Marslen-Wilson，W.D.(1994).Words morphemes and syllables in the Chinese mental lexicon.LanguageandCognitiveProcesses，9(3)，393-422.

Ziegler，J.C.，Petrova，A.，& Ferrand，L.(2008).Feedback consistency effects in visual and auditory word recognition：Where do we stand after more than a decade?JournalofExperimentalPsychology：LearningMemory&Cognition，34(3)，643-661.

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放