亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        筆畫節(jié)點在手寫體漢字識別中的作用*

        2023-12-13 14:01:10朱一鳴周吉帆沈模衛(wèi)
        心理學(xué)報 2023年12期
        關(guān)鍵詞:效應(yīng)實驗

        朱一鳴 趙 陽 唐 寧 周吉帆 沈模衛(wèi)

        (浙江大學(xué)心理與行為科學(xué)系, 杭州 310058)

        1 前言

        漢字是利用二維空間表達(dá)信息的象形文字, 由筆畫交錯連接構(gòu)成, 其正字法規(guī)則(Orthographic regularities)較為復(fù)雜(陳天泉, 1983)。雖然當(dāng)前印刷體漢字識別技術(shù)已經(jīng)成熟, 手寫體漢字因其筆畫多變、風(fēng)格各異, 給機(jī)器識別帶來巨大挑戰(zhàn)(任曉倩等, 2018; Krizhevsky et al., 2012)。然而, 漢字使用者往往具備熟練識別手寫漢字的能力。因此理解并借鑒人的手寫漢字識別機(jī)制, 探明筆畫、部件等各層次單元的表征及計算機(jī)制, 有著重要的理論意義和應(yīng)用價值(周吉帆 等, 2016; Li et al., 2020; Zhang et al., 2020)。

        植根于建構(gòu)主義的視覺合成分析過程理論(Analysis-by-synthesis process)認(rèn)為, 所有圖像都是由某些因果過程在時間和空間上的執(zhí)行而產(chǎn)生的,動態(tài)生成的結(jié)果是一幅靜態(tài)圖像。面對這一輸出結(jié)果, 人的視覺系統(tǒng)會自發(fā)地以概率計算的方式解釋圖像是如何產(chǎn)生的(Grenander, 1976; Yuille & Kersten,2006)。例如, 人們將蘋果公司的標(biāo)志看作是被“咬了一口”的殘缺蘋果。面對漢字, 人的視覺系統(tǒng)可能執(zhí)行了類似的過程: 漢字是筆畫和部件按照自上而下、自左向右等正字法規(guī)則書寫生成的產(chǎn)生式文字,漢字識別可能是根據(jù)整字這一靜態(tài)輸出結(jié)果, 逆向推理此前的動態(tài)書寫過程, 猜測輸入圖像最有可能由哪個原型字書寫而成。該產(chǎn)生式的概率推斷思想得到行為學(xué)和神經(jīng)科學(xué)證據(jù)的支持(Gershman et al.,2012; Kok et al., 2013; Laeng et al., 2014)??梢? 如果漢字識別是一個產(chǎn)生式過程, 那么首先需要理解漢字是如何產(chǎn)生的。

        漢字是由內(nèi)含層次關(guān)系的各個單元在正字法的引導(dǎo)下生成的。以往的模型大多將漢字分為筆畫、部件、整字三層次, 例如經(jīng)成分模型(Huang &Wang, 1992)、合體漢字識別的相互作用模型(沈模衛(wèi), 朱祖祥, 1997)、多層次交互模型(Taft & Zhu,1997)和格式塔認(rèn)知模型(陳傳鋒, 黃希庭, 2004)。盡管各模型有所差別, 但它們隱含了一致的觀點,即筆畫是漢字結(jié)構(gòu)和識別的最小單元。如果漢字識別的過程相當(dāng)于漢字產(chǎn)生的反向推理, 那么獲得筆畫表征應(yīng)當(dāng)是漢字識別的前提。

        支持筆畫是漢字識別最小單元的實驗證據(jù)主要來自漢字的筆畫數(shù)效應(yīng)、筆順效應(yīng)和筆畫獨立組塊效應(yīng)。筆畫數(shù)效應(yīng)是指筆畫數(shù)多的漢字加工更困難。研究發(fā)現(xiàn), 識別或辨認(rèn)筆畫數(shù)較多的合體字需要花費更多時間(張武田, 馮玲, 1992), 同時正確率和辨別力更低(鄭昭明, 高尚仁, 1982); 判斷一組筆畫是否構(gòu)成漢字時, 少筆畫組構(gòu)字的錯誤率低于多筆畫組(羅艷琳 等, 2008)。上述研究提示, 整字包含的筆畫數(shù)量越多, 需要加工的特征量也越多, 支持筆畫是漢字字形加工的最小單元。筆順效應(yīng)是指筆順不同的筆畫在整字識別中具有不同的權(quán)重。研究發(fā)現(xiàn), 省略首筆畫比省略中間或尾部的筆畫, 對整字識別造成的干擾更大(閆國利 等, 2013); 以筆順在前的筆畫作為啟動材料, 比筆順靠后的筆畫更有助于漢字命名(Giovanni, 1994)。這些結(jié)果也支持筆畫是識別過程的基礎(chǔ)單元。筆畫獨立組塊效應(yīng)是指漢字識別的基本單元是單個完整筆畫。有研究發(fā)現(xiàn), 去除單個完整筆畫比去除多個筆畫的部分像素產(chǎn)生的干擾更大(Yu et al., 2018)。簡單和復(fù)雜筆畫所含像素數(shù)量盡管不同, 但識別績效無差別(張積家 等, 2002)。以上結(jié)果均支持筆畫是高于像素的最低計算單元。

        既然筆畫是漢字產(chǎn)生和識別的起點, 那么了解筆畫的識別機(jī)制, 可能是理解漢字識別過程的前提和基礎(chǔ)。然而目前尚未見反映筆畫表征產(chǎn)生機(jī)制的相關(guān)證據(jù)。筆畫識別的本質(zhì)是, 從構(gòu)成一個漢字的交錯線條中分離、抽取與筆畫模板相似1與印刷體漢字不同, 手寫體筆畫變形較大, 難以通過與標(biāo)準(zhǔn)筆畫直接比對的方式識別。的基本線段的過程。這些線條由書寫運動產(chǎn)生, 它們交錯連接所產(chǎn)生的交接或交叉區(qū)域即為節(jié)點。相交的數(shù)條線,有多種分割線段的方式, 所有分割方式構(gòu)成了一個筆畫空間, 識別的目的就是在這個空間中尋找最合理的一個分割方案。例如, 僅由“橫”和“豎鉤”兩劃和一個節(jié)點構(gòu)成的“丁”字, 還可能存在兩種分割方案: “橫折鉤”和“短橫”; 兩個“短橫”和一個“豎鉤”。可見節(jié)點附近的所有潛在筆畫組合可以由歷遍該節(jié)點附近每一條線段來產(chǎn)生。對于由n個筆畫構(gòu)成的節(jié)點, 若令其潛在筆畫組合的集合為A(n), 則可以推論,A(n)會隨交點相連的筆畫數(shù)迅速膨脹。同時, 對于含有m個節(jié)點的漢字, 若令整字的潛在筆畫組合為集合A(m), 則A(m)也會隨整字包含的節(jié)點數(shù)增加而迅速增加??梢? 識別的主要難點在于筆畫空間太大。此外, 手寫體本身的連筆、缺筆特性可能造成節(jié)點冗余或缺失, 使正確識別筆畫的難度進(jìn)一步提高。

        對于上述求解空間過大的問題, 基于產(chǎn)生式思想的貝葉斯推理算法或許是目前最為有效的求解方法。Science期刊2015 年12 月的封面文章介紹了適用于字符識別的貝葉斯規(guī)劃學(xué)習(xí)(Bayesian Program Learning, BPL)模型, 認(rèn)為字符的識別是一個基于產(chǎn)生式模型的反向推理過程(Lake et al,2015)。產(chǎn)生式模型是指, 給定目標(biāo)變量y的前提下觀測變量X的條件概率模型, 表示為p= (X|Y=y)(Meila, 2006)。基于產(chǎn)生式的反向推理則是根據(jù)觀測變量X求解目標(biāo)變量Y的過程, 假設(shè)有數(shù)個目標(biāo)y1、y2……yn, 如果由產(chǎn)生式模型得出yn產(chǎn)生X的概率高于其他目標(biāo), 即可認(rèn)為Y最有可能由yn產(chǎn)生, 則獲得了目標(biāo)變量的最優(yōu)解。以常見的產(chǎn)生式模型——BPL 模型為例, 識別手寫字符的過程可以概括如下:先從字母樣例中提取節(jié)點, 枚舉所有可能產(chǎn)生該節(jié)點的基元(類似于筆畫)組合方式。再根據(jù)基元間關(guān)系的先驗知識2BPL 模型認(rèn)為先驗知識包含兩類, 一是任意兩類基元在序列上相鄰出現(xiàn)的概率, 二是任意兩類基元的各種空間關(guān)系(尾首相接、首首相接等)的概率。, 得到各種基元組合的后驗概率。最后將輸入字符的產(chǎn)生方式和數(shù)據(jù)庫中原型字符的產(chǎn)生方式進(jìn)行相似度比較, 從而推測出哪個字符最有可能“寫出”當(dāng)前觀察到的手寫字母。該模型在人工字符集的識別任務(wù)中達(dá)到了人類水平的識別績效(Lake et al, 2015)。

        類比貝葉斯規(guī)劃學(xué)習(xí)模型, 漢字的產(chǎn)生式識別是對漢字產(chǎn)生過程的逆推理(Yuille & Kersten,2006)。漢字(獨體字)的產(chǎn)生過程可以描述為: 首先定義漢字的基本筆畫集合, 從中抽取數(shù)個筆畫, 并依據(jù)先驗的筆畫組合概率, 按照恰當(dāng)?shù)捻樞蚝涂臻g位置將它們書寫出來, 從而構(gòu)成整字圖像。產(chǎn)生式識別則是根據(jù)整字圖像, 反推之前的書寫過程: 從識別輸入字的筆畫開始, 先基于線段交點提取出節(jié)點, 接著枚舉所有能產(chǎn)生該節(jié)點的筆畫組合方式,再利用筆畫先驗概率篩選出其中概率最高的組合方案, 從而獲得輸入字的產(chǎn)生方式(Gershman et al.,2012)。當(dāng)長時記憶中某個原型字的產(chǎn)生方式與之高度相似時, 則可將輸入字判定為原型字, 從而完成漢字識別。就合體字而言, 理論上可將合體字視為多個獨體字(部件)的嵌套: 合體字識別需要先拆分部件,然后執(zhí)行部件識別過程, 從而獲得最有可能產(chǎn)生當(dāng)前輸入字的部件組合方案, 之后匹配長時記憶中部件產(chǎn)生方式與之最相符的原型字, 進(jìn)而完成識別3產(chǎn)生式框架下, 合體字中節(jié)點和筆畫的加工過程與獨體字一致。此處的部件等高層級加工過程暫是猜想。。

        此外, 產(chǎn)生式識別依賴的先驗知識可能來源于人的書寫經(jīng)驗。大量研究表明, 書寫能促進(jìn)漢字識別和詞句閱讀(朱朝霞 等, 2019): 一方面, 書寫動作可以加強(qiáng)漢字正字法相關(guān)的視空間表征, 以及形、音、義的聯(lián)結(jié), 并促進(jìn)漢字長時動作記憶的形成(Tan et al., 2005); 另一方面, 閱讀文字會調(diào)用書寫相關(guān)的空間結(jié)構(gòu)和運動知識, 識別有手寫經(jīng)驗的文字相比無經(jīng)驗字會引發(fā)感覺運動皮層的更強(qiáng)激活(Cao et al., 2013)。綜合產(chǎn)生式理論和經(jīng)典漢字書寫研究, 手寫漢字的識別, 可能正是基于節(jié)點提供的自下而上信息, 結(jié)合由漢字書寫習(xí)得的自上而下的筆畫運動和多層級概率知識, 以產(chǎn)生式的概率推斷方法逐步求解正確漢字表征的過程。

        假設(shè)人以上述過程識別漢字, 則可預(yù)測其識別過程應(yīng)出現(xiàn)以下兩種效應(yīng): (1)節(jié)點數(shù)量效應(yīng)。節(jié)點數(shù)量是指一個漢字中筆畫交叉或相接區(qū)域的數(shù)量。由于對節(jié)點的分析是獲得筆畫表征的前提, 整字含有的節(jié)點越多, 且都得到了充分加工, 則在貝葉斯推測過程中提供的信息量就越大, 即包含較多節(jié)點的漢字具有識別優(yōu)勢。(2)節(jié)點復(fù)雜度效應(yīng)。對于連結(jié)較多筆畫的復(fù)雜節(jié)點, 由于其附近潛在的筆畫空間較為龐大, 為了壓縮問題空間, 識別過程會更依賴節(jié)點的引導(dǎo)作用。因此, 復(fù)雜節(jié)點為筆畫組合的計算提供更大的信息量。本研究通過數(shù)個實驗, 分別對節(jié)點數(shù)量效應(yīng)和節(jié)點復(fù)雜度效應(yīng)加以檢驗。

        2 實驗1: 節(jié)點數(shù)量效應(yīng)

        本實驗的目的在于檢驗節(jié)點數(shù)量效應(yīng), 即包含節(jié)點數(shù)量較多的漢字具有識別優(yōu)勢。

        2.1 被試

        實驗共招募26 位浙江大學(xué)學(xué)生(10 男, 16 女),年齡范圍17 至26 歲(M= 21.31 歲,SD= 2.43 歲)。所有被試的母語均為漢語且均為右利手。視力或者矯正視力正常。

        2.2 實驗設(shè)計

        實驗采用2 (節(jié)點數(shù): 多節(jié)點和少節(jié)點)×6 (呈現(xiàn)時間: 10 ms、20 ms、30 ms、40 ms、50 ms、60 ms)兩因素被試內(nèi)設(shè)計。76 個刺激在6 種呈現(xiàn)時間下分別出現(xiàn)一次, 每個被試共完成456 個試次。刺激的呈現(xiàn)順序完全隨機(jī)。因變量為字判別任務(wù)的正確率和反應(yīng)時。選取多檔刺激呈現(xiàn)時間的原因是, 漢字識別是始于節(jié)點分析的時序加工: 識別系統(tǒng)需要先定位節(jié)點, 然后拆解附近筆畫, 再計算各種筆畫組合的概率并取優(yōu)。因此, 當(dāng)視覺系統(tǒng)執(zhí)行到一定加工深度時方能在整字績效上發(fā)現(xiàn)相關(guān)效應(yīng)。由于暫不明確對應(yīng)的時間窗口, 本實驗采用的刺激呈現(xiàn)時間數(shù)值參考了采用微觀發(fā)生法的類似研究(沈模衛(wèi),朱祖祥, 1997; 沈模衛(wèi) 等, 1998), 因其較好展現(xiàn)了漢字加工變化過程的精細(xì)信息。

        2.3 實驗材料

        由于獨體字由筆畫直接構(gòu)成, 節(jié)點對筆畫表征的影響可以較為直接地反映在整字的識別績效上,因此本實驗使用獨體字作為實驗材料。實驗分為練習(xí)階段和正式實驗階段, 練習(xí)階段的刺激包含5 個真字和5 個假字, 正式實驗的刺激使用另外38 個真字和38 個假字。其中真字又分為多節(jié)點組和少節(jié)點組, 前者由19 個包含3 到6 個節(jié)點的真字組成, 后者由19 個包含0 到2 個節(jié)點的真字組成, 多節(jié)點組(M= 3.95,SD= 0.97)和少節(jié)點組(M= 1.32,SD= 0.58)的節(jié)點數(shù)差異顯著4由于節(jié)點數(shù)不服從正態(tài)分布, 故采用Mann-Whitney U 檢驗。,df= 1,p< 0.001,χ2= 29.04。兩組材料的筆畫數(shù)和字頻相匹配: 多節(jié)點組和少節(jié)點組均包括13 個四筆畫字和6 個五筆畫字。通過規(guī)模高達(dá)兩億字的漢語網(wǎng)絡(luò)數(shù)據(jù)庫(http://lingua.mtsu.edu/chinesecomputing/)確定多節(jié)點組的字頻范圍是2217~755256 次, 平均為4.48(轉(zhuǎn)換為以10 為底的對數(shù)), 少節(jié)點組的字頻是312~2237915 次, 平均為4.94 (轉(zhuǎn)換為以10 為底的對數(shù))。假字由真實筆畫根據(jù)漢字書寫習(xí)慣組合而成, 也包括多節(jié)點和少節(jié)點兩組, 前者由19 個含3 到6 個節(jié)點的假字組成, 后者由19 個含0 到2 個節(jié)點的假字組成。多節(jié)點組(M=3.58,SD= 0.90)與少節(jié)點組(M= 1.26,SD= 0.65)的節(jié)點數(shù)差異顯著,df= 1,p< 0.001,χ2= 29.44。為提升實驗的外部效度, 真假字材料都以仿手寫字體呈現(xiàn)。使用Photoshop CC 2018 將所有真假字制作為150 磅大小的白色字, 放置于邊長130 像素的黑色正方形中心。本實驗的真假字樣例見圖1。

        圖1 實驗1 的實驗材料示意圖

        2.4 實驗裝置及流程

        實驗程序采用Psychtoolbox 編寫, 呈現(xiàn)于17吋CRT 屏幕上, 分辨率設(shè)為1024×768, 刷新率為100 Hz。實驗分為預(yù)備實驗和正式實驗兩個階段。在預(yù)備實驗階段, 主試通過展示指導(dǎo)語向被試說明實驗的要求和任務(wù)。預(yù)備實驗流程與正式實驗一致,如圖2 所示, 并要求被試進(jìn)行20 個試次的練習(xí)以熟悉實驗流程。實驗中首先在屏幕中央呈現(xiàn)一個注視點, 短暫空屏后出現(xiàn)一個刺激字。該字可能是真字也可能是假字, 隨后加以掩蔽。掩蔽消失后, 要求被試又快又準(zhǔn)確地判斷剛才的刺激字是真字還是假字, 并按下相應(yīng)的按鍵。

        圖2 實驗1 字判別任務(wù)示意圖

        2.5 實驗結(jié)果

        本實驗中假字組的設(shè)置只用于控制被試的反應(yīng)傾向, 因此只對真字組的正確率, 以及真字組內(nèi)正確試次和錯誤試次的反應(yīng)時加以分析。本文所有實驗報告的F1和F2分別是基于被試和基于項目的分析結(jié)果。

        2.5.1 正確率

        正確率的整體平均值為63%, 標(biāo)準(zhǔn)差為29%。正確率隨呈現(xiàn)時間的變化趨勢如圖3a 所示。重復(fù)測量方差分析發(fā)現(xiàn), 節(jié)點數(shù)量的主效應(yīng)顯著,F1(1,25) = 9.65,p= 0.005,, 差異的95% CI =[?5%, ?1%];F2(1, 18) = 4.56,p= 0.047,,差異的95% CI = [?5%, ?1%], 多節(jié)點字的正確率(M= 57%,SD= 35%)顯著高于少節(jié)點字(M= 55%,SD= 34%)。刺激呈現(xiàn)時間的主效應(yīng)顯著,F1(1, 25) =113.29,p< 0.001,;F2(3.37, 60.70) =501.33,p< 0.001,, 隨呈現(xiàn)時間增長, 正確率顯著提高。

        圖3 (a)正確率隨呈現(xiàn)時間變化的趨勢圖 (b)反應(yīng)時隨呈現(xiàn)時間變化的趨勢圖

        基于被試的分析發(fā)現(xiàn)兩因素間交互作用邊緣顯著5由于被試在40 ms 及以上的呈現(xiàn)時長下方能做出有效真假字判斷(正確率高于隨機(jī)水平50%), 故獨立分析了40 至60 ms 的試次, 兩因素間交互作用為:F1 (2, 50) = 4.72, p = 0.013, =.16; F2 (2, 36) = 2.48, p = 0.098, = 0.12。,F1(5, 125) = 1.998,p= 0.083,;F2(5,90) = 1.12,p= 0.355。進(jìn)一步分析發(fā)現(xiàn): 當(dāng)刺激呈現(xiàn)時間為40 ms 時, 被試在真字少節(jié)點(M= 71%,SD= 21%)條件下的正確率顯著低于真字多節(jié)點(M= 78%,SD= 21%)條件,t(25) = ?3.51,p= 0.002,Cohen’sd= 0.69, 差異的95% CI = [?11%, ?3%]。在呈現(xiàn)時間為50 ms 的條件下, 少節(jié)點字(M= 85%,SD= 16%)與多節(jié)點字(M= 88%,SD= 16%)也存在類似的差異,t(25) = ?2.17,p= 0.040, Cohen’sd=0.41, 差異的95% CI = [?7%, 0%]。

        2.5.2 反應(yīng)時

        反應(yīng)時的整體平均值為 908 ms, 標(biāo)準(zhǔn)差為218 ms。不同呈現(xiàn)時間條件下的反應(yīng)時見圖3b。重復(fù)測量方差分析發(fā)現(xiàn), 節(jié)點數(shù)量的主效應(yīng)不顯著,F1(1, 25) = 0.19,p= 0.663;F2(1, 18) = 0.08,p=0.785。刺激呈現(xiàn)時間的主效應(yīng)顯著6本文中所有不滿足Mauchly 球形檢驗的重復(fù)測量方差分析結(jié)果均采用Greenhouse-Geisser 方法校正。,F1(1.64, 40.97) =7.55,p= 0.003,;F2(5, 90) = 4.01,p=0.003, 隨呈現(xiàn)時間增長, 反應(yīng)時顯著減少。

        基于被試的分析發(fā)現(xiàn)兩因素間交互作用顯著,F1(3.75, 93.66) = 3.52,p= 0.012,;F2(5,90) = 0.74,p= 0.599。進(jìn)一步分析發(fā)現(xiàn): 當(dāng)刺激呈現(xiàn)時間為40 ms 時, 被試在真字少節(jié)點(M= 876 ms,SD= 160 ms)條件下的反應(yīng)時顯著高于真字多節(jié)點(M= 806 ms,SD= 144 ms)條件,t(25) = 3.67,p=0.001, Cohen’sd= 0.73, 差異的95% CI = [31 ms,110 ms]。在呈現(xiàn)時間為50 ms 的條件下, 少節(jié)點字(M= 841 ms,SD= 138 ms)與多節(jié)點字(M= 787 ms,SD= 135 ms)也存在類似的差異,t(25) = 2.36,p= 0.026,Cohen’sd= 0.61, 差異的95% CI = [5 ms, 105 ms]。

        2.6 討論

        本實驗的結(jié)果表明, 節(jié)點數(shù)量多的字具有識別優(yōu)勢, 表現(xiàn)為更高的正確率和更短的反應(yīng)時。該效應(yīng)在刺激呈現(xiàn)時間為40 ms 和50 ms 時顯著。當(dāng)刺激呈現(xiàn)時間少于30 ms 時, 節(jié)點數(shù)量并未出現(xiàn)上述效應(yīng)。此時被試對真字的判斷正確率也低于隨機(jī)水平, 說明被試傾向于在無法辨認(rèn)真假字時做出“假字”的判斷。當(dāng)刺激呈現(xiàn)時間達(dá)到60 ms 時, 被試可以對整字做充分表征, 此時節(jié)點數(shù)量對整字識別的影響不明顯。

        綜上所述, 在視覺系統(tǒng)能充分獲取和分析節(jié)點信息的前提下, 節(jié)點數(shù)量越多, 為筆畫拆解過程提供的信息越豐富, 計算系統(tǒng)可以同時利用的有效信息越多, 提高了整字識別的績效。可見, 本實驗驗證了人的漢字識別過程具有貝葉斯產(chǎn)生式模型所預(yù)測的節(jié)點數(shù)量效應(yīng)。

        3 實驗2: 節(jié)點復(fù)雜度效應(yīng)

        本實驗的目的在于檢驗節(jié)點復(fù)雜度效應(yīng), 即連接更多筆畫的節(jié)點在筆畫分離過程中能提供更豐富的信息量。

        3.1 被試

        29 位浙江大學(xué)學(xué)生(10 男, 19 女)參與正式實驗,年齡范圍18 至26 歲(M= 21.14,SD= 2.18)。所有被試第一語言均為漢語, 視力或者矯正視力正常。

        3.2 實驗設(shè)計

        實驗采用2 (掩蓋復(fù)雜節(jié)點和掩蓋簡單節(jié)點)×2 (掩蓋第1 節(jié)點和掩蓋第5 節(jié)點)×4 (呈現(xiàn)時間:60 ms、70 ms、80 ms、90 ms)三因素被試內(nèi)設(shè)計。160 個刺激在4 種呈現(xiàn)時間下分別出現(xiàn)一次, 每個被試共完成640 個試次。刺激的呈現(xiàn)順序完全隨機(jī)。因變量為字判別任務(wù)的正確率和反應(yīng)時。

        3.3 實驗材料

        為進(jìn)一步確認(rèn)節(jié)點在漢字識別中的作用, 本實驗使用單個節(jié)點被掩蓋的合體字作為實驗材料。合體字的單個部件可以視為一個獨體字, 節(jié)點通過干擾部件內(nèi)的筆畫表征, 進(jìn)而影響部件以及合體字整字的識別。實驗分為練習(xí)階段和正式實驗階段, 練習(xí)階段的刺激是5 個真字和5 個假字, 正式實驗的刺激使用另外的80 個真字和80 個假字。

        由于筆順位置不同的筆畫在整字識別中具有不同的權(quán)重(Giovanni, 1994; 閆國利 等, 2013), 掩蓋不同位置的節(jié)點對整字識別的影響, 可能會受節(jié)點所在筆畫的筆順位置干擾。因此, 本實驗將在控制節(jié)點順序的前提下驗證節(jié)點復(fù)雜度效應(yīng)。節(jié)點順序為一個漢字按照標(biāo)準(zhǔn)筆順書寫時節(jié)點依次產(chǎn)生的順序。

        定義節(jié)點的復(fù)雜度為構(gòu)成該節(jié)點的筆畫數(shù)量。本實驗中, 由兩個筆畫形成的節(jié)點稱為簡單節(jié)點,例如“下”中橫與豎的交點。有3 或4 個筆畫形成的節(jié)點稱為復(fù)雜節(jié)點, 例如“木”中橫、豎、撇、捺的交點。正式實驗材料分為真字組和假字組, 真字組分別包含20 個第1 節(jié)點為簡單節(jié)點(M= 2.00,SD=0)和第1 節(jié)點為復(fù)雜節(jié)點(M= 3.60,SD= 0.50)的真字, 兩類字中第1 節(jié)點的復(fù)雜度差異顯著,df= 1,p<0.001,χ2= 34.82; 20 個第5 節(jié)點是簡單節(jié)點(M=2.00,SD= 0)和20 個第5 節(jié)點是復(fù)雜節(jié)點(M= 3.45,SD= 0.51)的真字, 其節(jié)點復(fù)雜度差異也顯著,df=1,p< 0.001,χ2= 34.71)。分別掩蓋真字的第1 節(jié)點和第5 節(jié)點, 以分離不同節(jié)點順序的效應(yīng)。假字組對應(yīng)真字也分為4 類, 每個假字由對應(yīng)的真字替換一個部件制得, 且替換的部件不含被掩蓋的節(jié)點。真字4 類字組在節(jié)點數(shù)、筆畫數(shù)、部件數(shù)、整字構(gòu)型和字頻上均加以匹配(見表1), 呈現(xiàn)材料均使用手寫字體。本實驗所使用字樣如圖4 所示。

        表1 實驗2 材料的各種屬性

        圖4 實驗2 的實驗材料示意圖

        3.4 實驗裝置及流程

        實驗裝置與實驗1 相同。由于實驗1 中刺激呈現(xiàn)時間達(dá)到40 ms 時節(jié)點數(shù)量才會對被試判斷產(chǎn)生影響, 并且本實驗的材料是更為復(fù)雜的合體字, 因此刺激的呈現(xiàn)時間改為60 ms 至90 ms, 其他條件與實驗1 一致。

        3.5 實驗結(jié)果

        本實驗對真字組的正確率, 以及真字組內(nèi)正確試次和錯誤試次的反應(yīng)時加以分析。

        3.5.1 正確率

        正確率的整體平均值為79%, 標(biāo)準(zhǔn)差為21%。分別掩蓋第1 和第5 節(jié)點時, 字判別任務(wù)正確率隨呈現(xiàn)時間的變化趨勢如圖5 所示。重復(fù)測量方差分析發(fā)現(xiàn), 節(jié)點復(fù)雜度主效應(yīng)顯著7本實驗中項目分析不顯著, 可能是由于沒有控制部件的筆畫數(shù)、頻率、結(jié)合律等無關(guān)變量。實驗3 對上述因素加以平衡后,觀察到了F2 上的顯著差異。,F1(1, 28) = 6.93,p= 0.014,, 差異的95% CI = [?4%, ?1%];F2(1, 19) = 0.73,p= 0.404。掩蓋復(fù)雜節(jié)點的正確率(M= 81%,SD= 21%)顯著低于掩蓋簡單節(jié)點的正確率(M= 83%,SD= 22%)。呈現(xiàn)時間的主效應(yīng)顯著,F1(2.22, 62.14) = 8.06,p= 0.001,;F2(3, 57) =7.69,p< 0.001,, 隨呈現(xiàn)時間增長, 正確率顯著提高。節(jié)點順序的主效應(yīng)不顯著,F1(1, 28) =1.74,p= 0.197;F2(1, 19) = 0.32,p= 0.580。

        圖5 (A)掩蓋第1 節(jié)點時正確率隨呈現(xiàn)時間變化的趨勢圖; (B)掩蓋第5 節(jié)點時正確率隨呈現(xiàn)時間變化的趨勢圖

        復(fù)雜度和節(jié)點順序之間的交互作用顯著,F1(1,28) = 11.56,p= 0.002,;F2(1, 19) = 2.49,p= 0.131。其余的交互作用均不顯著: 復(fù)雜度和呈現(xiàn)時間之間的交互作用,F1(2.29, 64.18) = 1.34,p=0.266;F2(3, 57) = 1.32,p= 0.277。節(jié)點順序和呈現(xiàn)時間之間的交互作用,F1(3, 84) = 0.16,p= 0.926;F2(3, 57) = 0.10,p= 0.961。三因素之間的交互作用,F1(3, 84) = 0.93,p= 0.430;F2(3, 57) = 0.57,p=0.636。

        簡單效應(yīng)分析表明, 對于順序第5 的節(jié)點, 掩蓋復(fù)雜節(jié)點的正確率(M= 79%,SD= 18%)顯著低于掩蓋簡單節(jié)點(M= 84%,SD= 21%),t(116) =?5.22,p< 0.001, Cohen’sd= 0.48, 差異的95% CI =[?7%, ?3%]。對于順序第1 的節(jié)點, 掩蓋復(fù)雜節(jié)點的正確率(M=83%,SD= 19%)與掩蓋簡單節(jié)點 (M=82%,SD= 19%)無顯著差異,t(116) = 0.57,p=0.572。

        3.5.2 反應(yīng)時

        反應(yīng)時的整體平均值為929 ms, 標(biāo)準(zhǔn)差為210 ms。分別掩蓋不同位置節(jié)點時的反應(yīng)時見圖6。重復(fù)測量方差分析發(fā)現(xiàn), 節(jié)點順序和呈現(xiàn)時間之間的交互作用顯著,F1(3, 84) = 4.14,p= 0.009,;F2(3, 57) = 0.16,p= 0.020,。其余的主效應(yīng)和交互作用均不顯著: 節(jié)點復(fù)雜度的主效應(yīng),F1(1,28) = 0.35,p= 0.558;F2(1, 19) = 0.33,p= 0.575。呈現(xiàn)時間的主效應(yīng),F1(2.45, 68.56) = 2.27,p=0.100;F2(3, 57) = 2.70,p= 0.054。節(jié)點順序的主效應(yīng),F1(1, 28) = 0.34,p= 0.566;F2(1, 19) = 0.08,p=0.780。復(fù)雜度和節(jié)點順序之間的交互作用,F1(1,28) = 0.85,p= 0.366;F2(1, 19) = 0.16,p= 0.693。復(fù)雜度和呈現(xiàn)時間之間的交互作用,F1(3, 84) = 0.36,p= 0.786;F2(3, 57) = 0.52,p= 0.668。三因素之間的交互作用,F1(3, 84) = 1.05,p= 0.376;F2(3, 57) =1.45,p= 0.239。

        圖6 (A)掩蓋第1 節(jié)點時反應(yīng)時隨呈現(xiàn)時間變化的趨勢圖, (B)掩蓋第5 節(jié)點時反應(yīng)時隨呈現(xiàn)時間變化的趨勢圖

        3.6 討論

        本實驗發(fā)現(xiàn), 掩蓋復(fù)雜節(jié)點比簡單節(jié)點對整字識別產(chǎn)生的干擾更大, 即識別正確率更低。該效應(yīng)在掩蓋順序靠后的節(jié)點時更為顯著。說明高復(fù)雜度的節(jié)點為筆畫拆解過程提供了更為豐富的信息。掩蓋處于更大的筆畫空間中的復(fù)雜節(jié)點, 窮舉出的筆畫組合方式會多于簡單節(jié)點, 更多的計算量將損害整字的識別績效。這為貝葉斯產(chǎn)生式模型所預(yù)測的節(jié)點復(fù)雜度效應(yīng)提供了初步證據(jù)。

        節(jié)點復(fù)雜度效應(yīng)在第1 節(jié)點上比較弱, 可能存在兩方面原因: 一是部件的特性削弱了節(jié)點復(fù)雜度的影響。合體字的第1 節(jié)點通常位于部首上, 部首具有多為形旁、構(gòu)字能力較強(qiáng)、筆畫相對其他部件更少等特性, 其在整字識別中的權(quán)重較低, 掩蓋此處的節(jié)點對整字識別的干擾有限。二是節(jié)點的產(chǎn)生方式影響了節(jié)點的復(fù)雜度。節(jié)點由筆畫交叉或相接所產(chǎn)生, 在筆畫數(shù)量一定的前提下, 筆畫交叉所產(chǎn)生的節(jié)點區(qū)域(如“十”字的節(jié)點), 相比筆畫相交但不穿過的區(qū)域(如“廠”字的節(jié)點), 前者潛在的筆畫組合方式更多, 掩蓋該類節(jié)點會對筆畫拆解和整字識別產(chǎn)生更大干擾。

        4 實驗3: 節(jié)點復(fù)雜度效應(yīng)的再檢驗

        本實驗?zāi)康氖沁M(jìn)一步檢驗節(jié)點復(fù)雜度效應(yīng)。由于聲旁和形旁在合體字識別中的作用具有特異性(Lee et al., 2006), 且節(jié)點產(chǎn)生方式可能會影響節(jié)點復(fù)雜程度, 因此本實驗將部件類型和節(jié)點產(chǎn)生方式作為兩個自變量進(jìn)行操縱。

        4.1 被試

        26 位浙江大學(xué)學(xué)生(10 男, 19 女)參與正式實驗,年齡范圍18 至25 歲(M= 21.50,SD= 2.02)。所有被試第一語言均為漢語, 視力或者矯正視力正常。

        4.2 實驗設(shè)計

        實驗采用2 (掩蓋復(fù)雜節(jié)點和掩蓋簡單節(jié)點)× 2 (掩蓋聲旁上的節(jié)點和掩蓋形旁上的節(jié)點) ×2 (節(jié)點由筆畫交叉所產(chǎn)生和節(jié)點由筆畫相接但不穿過所產(chǎn)生)三因素被試內(nèi)設(shè)計。240 個刺激在60 ms 呈現(xiàn)時間下均出現(xiàn)一次, 每個被試共完成240 個試次。刺激的呈現(xiàn)順序完全隨機(jī)。因變量為字判別任務(wù)的正確率和反應(yīng)時。

        4.3 實驗材料

        本實驗以單個節(jié)點被掩蓋的合體字作為實驗材料。實驗分為練習(xí)階段和正式實驗階段, 練習(xí)階段的刺激是5 個真字和5 個假字, 正式實驗的刺激使用另外的120 個真字和120 個假字。

        簡單節(jié)點和復(fù)雜節(jié)點的定義同實驗2。正式實驗材料包含120 個真字刺激和120 個假字刺激。真字均為左形右聲結(jié)構(gòu)的形聲字(符合實驗要求的左聲右形漢字?jǐn)?shù)量稀少, 故不采用), 分為8 組, 每組15 個目標(biāo)刺激。假字組對應(yīng)真字也分為8 組, 每個假字由對應(yīng)的真字替換一個部件制得, 且替換的部件不含被掩蓋的節(jié)點。8 組真字在筆畫數(shù)、字頻、部件數(shù)、形旁筆畫數(shù)、形旁頻率、形旁結(jié)合律、聲旁筆畫數(shù)、聲旁頻率和聲旁結(jié)合律上均加以匹配(見表2), 真假字材料均使用手寫字體。本實驗所使用字樣如圖7 所示。

        表2 實驗3 材料的各種屬性

        圖7 實驗3 的實驗材料示意圖

        4.4 實驗裝置及流程

        實驗裝置與實驗2 相同。由于實驗2 中刺激呈現(xiàn)時間達(dá)到60 ms 時已可觀察到節(jié)點復(fù)雜度效應(yīng),因此本實驗中刺激的呈現(xiàn)時間均采用60 ms, 其他條件與實驗2 一致。

        4.5 實驗結(jié)果

        本實驗對真字組的正確率, 以及真字組內(nèi)正確試次和錯誤試次的反應(yīng)時加以分析。

        4.5.1 正確率

        數(shù)據(jù)的整體平均值為72%, 標(biāo)準(zhǔn)差為18%。字判別任務(wù)正確率如圖8 所示。方差分析發(fā)現(xiàn), 節(jié)點復(fù)雜度的主效應(yīng)顯著,F1(1, 200) = 8.32,p= 0.004,;F2(1, 112) = 5.69,p= 0.019,,掩蓋復(fù)雜節(jié)點的正確率(M= 68%,SD= 19%)顯著低于掩蓋簡單節(jié)點的正確率(M= 76%,SD= 16%)。部件類型的主效應(yīng)不顯著,F1(1, 200) = 0.01,p=0.911;F2(1, 112) = 0.02,p= 0.902。節(jié)點產(chǎn)生方式的主效應(yīng)不顯著,F1(1, 200) = 1.70,p= 0.193;F2(1,112) = 1.42,p= 0.236。

        圖8 字判別任務(wù)的正確率

        基于被試的分析發(fā)現(xiàn), 復(fù)雜度和節(jié)點產(chǎn)生方式的交互作用顯著8鑒于節(jié)點附近筆畫識別機(jī)制的研究剛起步, 在部件和筆畫層次的常規(guī)控制變量之外, 可能存在未經(jīng)控制的與節(jié)點產(chǎn)生方式有關(guān)的未知變量, 致使項目分析未能顯著。將來的工作應(yīng)尋找影響筆畫拆分的關(guān)鍵因素。,F1(1, 200) = 3.87,p= 0.050,;F2(1, 112) = 1.96,p= 0.165,。復(fù)雜度和部件類型之間的交互作用不顯著,F1(1, 200) =0.01,p= 0.908;F2(1, 112) = 0.00,p= 1.000。部件類型和節(jié)點產(chǎn)生方式之間的交互作用不顯著,F1(1,200) = 0.08,p= 0.092;F2(1, 112) = 1.42,p= 0.236。三因素之間的交互作用亦不顯著,F1(1, 200) = 3.24,p= 0.073;F2(1, 112) = 1.326,p= 0.252。

        進(jìn)一步分析表明, 對于筆畫相接所產(chǎn)生的節(jié)點,掩蓋復(fù)雜節(jié)點的正確率(M= 68%,SD= 18%)顯著低于掩蓋簡單節(jié)點(M= 80%,SD= 16%),t(102) =?3.67,p< 0.001, Cohen’sd= 0.73, 差異的95% CI =[?19%, ?6%]。對于筆畫交叉產(chǎn)生的節(jié)點, 掩蓋復(fù)雜節(jié)點的正確率(M= 69%,SD= 19%)與掩蓋簡單節(jié)點(M= 72%,SD= 16%)無顯著差異,t(102) = ?0.89,p= 0.378。

        4.5.2 反應(yīng)時

        數(shù)據(jù)的整體平均值為1240 ms, 標(biāo)準(zhǔn)差為386 ms。字判別任務(wù)反應(yīng)時見圖9。方差分析未發(fā)現(xiàn)任何主效應(yīng)(節(jié)點復(fù)雜度,F1(1, 200) = 0.17,p= 0.678;F2(1, 112) = 0.93,p= 0.338。部件類型,F1(1, 112) =0.21,p= 0.651;F2(1, 112) = 0.86,p= 0.357。節(jié)點產(chǎn)生方式,F1(1, 200) = 0.40,p= 0.527;F2(1, 112) =1.45,p= 0.231)。

        圖9 字判別任務(wù)的反應(yīng)時

        未發(fā)現(xiàn)任何交互作用(節(jié)點復(fù)雜度和部件類型之間的交互作用不顯著,F1(1, 200) = 0.01,p=0.909;F2(1, 112) = 0.18,p= 0.676。節(jié)點復(fù)雜度和節(jié)點產(chǎn)生方式的交互作用不顯著,F1(1, 200) = 0.06,p= 0.804;F2(1, 112) = 0.52,p= 0.474。部件類型和節(jié)點產(chǎn)生方式的交互作用不顯著,F1(1, 200) = 0.85,p= 0.356;F2(1, 112) = 3.13,p= 0.08。三因素之間的交互作用亦不顯著,F1(1, 200) = 0.10,p= 0.751;F2(1, 112) = 0.75,p= 0.390)。

        從差異方向上看, 反應(yīng)時模式與正確率是基本一致的(正確率高的反應(yīng)時短), 不存在反應(yīng)時?正確率權(quán)衡。

        4.6 討論

        本實驗發(fā)現(xiàn)掩蓋復(fù)雜節(jié)點比簡單節(jié)點對整字識別產(chǎn)生的干擾更大, 即識別正確率更低。該效應(yīng)在掩蓋筆畫相接但不穿過所產(chǎn)生的節(jié)點時更為顯著。

        節(jié)點復(fù)雜度和節(jié)點產(chǎn)生方式存在交互作用。當(dāng)掩蓋筆畫交叉產(chǎn)生的節(jié)點時, 簡單和復(fù)雜節(jié)點的正確率均較低, 可能是交叉這一幾何形式擴(kuò)充了潛在的筆畫組合方案, 增加了掩蓋簡單節(jié)點時認(rèn)知計算的難度。該交互作用的項目分析結(jié)果并不顯著, 表明可能存在未經(jīng)控制的與節(jié)點產(chǎn)生方式有關(guān)的未知變量, 提示下一步研究可探尋筆畫拆分的關(guān)鍵影響因素; 節(jié)點復(fù)雜度和部件類型不存在交互作用,可能是由于實驗材料均為左形右聲的形聲字, 掩蓋形旁和聲旁節(jié)點分別意味著干擾順序在前和在后筆畫的表征, 即筆畫順序效應(yīng)和聲旁優(yōu)勢效應(yīng)相互抵消。以往研究為此提供了佐證: 相比形旁, 形聲字的聲旁在整字識別中的作用更為明顯; 而相比順序靠后的筆畫, 順序在前的筆畫對整字識別更為重要(閆國利 等, 2013)。因此, 兩種因素相平衡后, 節(jié)點復(fù)雜度在聲旁和形旁上的影響沒有明顯差異。

        本實驗通過更加嚴(yán)格的實驗控制, 進(jìn)一步說明高復(fù)雜度的節(jié)點提供了更為豐富的筆畫拆解信息,掩蓋處于更大的筆畫空間中的復(fù)雜節(jié)點會顯著增加認(rèn)知過程的計算難度。可見, 人的漢字識別過程具有貝葉斯產(chǎn)生式模型所預(yù)測的節(jié)點復(fù)雜度效應(yīng)。

        5 總討論

        本研究基于字符識別的貝葉斯規(guī)劃學(xué)習(xí)模型,認(rèn)為漢字字形識別是一個產(chǎn)生式的反向推理過程,提出并驗證了節(jié)點數(shù)效應(yīng)和節(jié)點復(fù)雜度效應(yīng)的預(yù)測。三個實驗說明節(jié)點提供給貝葉斯推斷過程的信息量越多, 整字越容易識別。以上結(jié)果為漢字字形識別產(chǎn)生式過程提供了證據(jù), 表明對節(jié)點的加工是識別過程的基礎(chǔ)。

        5.1 節(jié)點分析是獲得筆畫表征的前提

        本研究的結(jié)果表明, 筆畫表征的獲得依賴于節(jié)點提供的信息量增益。實驗1 發(fā)現(xiàn), 整字包含的節(jié)點數(shù)量越多, 識別績效越好, 從數(shù)量的角度表明節(jié)點為筆畫分割提供了引導(dǎo)信息。實驗2、3 發(fā)現(xiàn), 掩蓋的節(jié)點越復(fù)雜, 整字識別績效越差, 從性質(zhì)的角度表明不同類型的節(jié)點提供的引導(dǎo)信息存在差異。漢字字形是二維平面中線條的集合, 獲得筆畫表征需要經(jīng)歷從線條中分離、抽取的過程, 且不存在唯一解。因此, 節(jié)點為獲得恰當(dāng)合理的筆畫表征提供了自下而上的筆畫分離線索。

        節(jié)點為筆畫分割過程提供的引導(dǎo)信息, 本質(zhì)上可能是節(jié)點蘊(yùn)含的筆畫運動信息, 即有關(guān)該節(jié)點和鄰近筆畫是如何由漢字書寫所“產(chǎn)生”的。筆畫是由自左向右、自上而下兩條運動規(guī)則產(chǎn)生的單向線段。沒有線段交錯的部分, 筆畫的產(chǎn)生方式幾乎是確定的。只有在線段交錯的節(jié)點處, 筆畫在不違背產(chǎn)生規(guī)則的前提下具有多種可能的運動方向。因此分割線段的重點是在節(jié)點處, 此處的筆畫運動信息最為豐富。這與經(jīng)成分分析理論認(rèn)為筆畫曲折、交接的地方具有更多的非偶然性特征相一致(Huang& Wang, 1992)。筆畫運動信息經(jīng)由漢字書寫訓(xùn)練習(xí)得, 先前大量研究發(fā)現(xiàn)書寫能力與閱讀能力存在正相關(guān)關(guān)系(朱朝霞 等, 2019)。認(rèn)知神經(jīng)科學(xué)的證據(jù)表明, 兩者共享左側(cè)梭狀回和左側(cè)額下回等神經(jīng)網(wǎng)絡(luò), 閱讀過程中書寫相關(guān)的運動功能區(qū)也會激活。行為學(xué)研究也發(fā)現(xiàn), 漢字書寫中的運動規(guī)劃能夠促進(jìn)漢字的長時動作記憶的形成(Tan et al., 2005), 人們可以在書寫漢字的過程中學(xué)習(xí)到筆畫運動方向的知識, 該類知識會自上而下影響對筆畫的識別(Tse & Cavanagh, 2000)。因此, 節(jié)點蘊(yùn)含的筆畫運動信息是視覺系統(tǒng)能從靜態(tài)整字圖像中拆分出筆畫組合的重要線索之一。

        就漢字加工的時間進(jìn)程而言, 節(jié)點的表征與分析可能是漢字識別的初始環(huán)節(jié)。實驗1 發(fā)現(xiàn), 在刺激呈現(xiàn)時間較短(小于40 ms)時, 節(jié)點信息尚未充分提取, 即多節(jié)點字和少節(jié)點字的識別績效未表現(xiàn)出差別, 整字識別的正確率并未超出隨機(jī)水平(50%)。呈現(xiàn)時間達(dá)到40 ms 后, 節(jié)點獲得較好表征, 整字識別正確率開始超過隨機(jī)水平??梢? 整字能被有效識別時對應(yīng)的刺激呈現(xiàn)時長與節(jié)點數(shù)量效應(yīng)出現(xiàn)時的呈現(xiàn)時長一致。因此, 節(jié)點可能是整字識別刺激輸入后較早獲得的基礎(chǔ)特征, 利用節(jié)點信息后才能執(zhí)行筆畫分離過程, 從而有效識別整字。

        本研究支持筆畫分割以并行加工的方式進(jìn)行。實驗1 發(fā)現(xiàn)識別多節(jié)點字的識別績效更好, 表明節(jié)點越多, 視覺系統(tǒng)可以同時利用的節(jié)點也越多。節(jié)點多帶來的信息量增益可以在不消耗更多時間的前提下使識別的后驗概率更快達(dá)到閾值, 從而表現(xiàn)出更好的整字識別績效。這種并行加工的特性, 高效利用了節(jié)點提供的筆畫分割信息, 從而更容易找到包容所有節(jié)點的整字產(chǎn)生方式。這符合前人發(fā)現(xiàn)的視覺系統(tǒng)可以對單一刺激維度的多個項目做并行加工的特性(Cave & Wolfe, 1990; Treisman &Gelade, 1980; Treisman, 1982)。該特性使視覺系統(tǒng)在整字范圍內(nèi)搜索和提取線段交錯點, 進(jìn)而利用冗余節(jié)點提供的信息促進(jìn)整字識別。圖形識別的相關(guān)研究也支持冗余信息量的促進(jìn)效應(yīng): 中等復(fù)雜度的圖形因其具有相對更高的冗余度, 識別速度比簡單圖形更快(Lockhead & Pomerantz, 1991)。

        5.2 節(jié)點是客體識別的通用特征

        本研究發(fā)現(xiàn), 節(jié)點是視覺系統(tǒng)加工漢字刺激的重要特征, 掩蓋節(jié)點會對合體字的識別產(chǎn)生干擾。先前曾有漢字節(jié)點的相關(guān)研究發(fā)現(xiàn), 掩蓋節(jié)點后整字識別的正確率降低, 反應(yīng)時增加, 提示漢字節(jié)點可能是類似物體輪廓線交點的關(guān)鍵特征(駱非凡,2020)。然而該研究未涉及節(jié)點的信息量內(nèi)涵。拼音文字相關(guān)研究的結(jié)果與之類似: 有實驗采用掩蔽啟動范式, 發(fā)現(xiàn)包含筆畫節(jié)點特征的啟動刺激會促進(jìn)被試對英文字母的命名(Petit & Grainger, 2002);另有實驗發(fā)現(xiàn), 去除英文字母中線段的節(jié)點比掩蓋線段中間部分對字母命名造成的干擾更大(Lanthier et al., 2009)。一些研究認(rèn)為, 圖像中輪廓線條的節(jié)點不單在字符識別中起作用, 對客體識別均有重要意義(Dehaene et al., 2005; Dehaene, 2009)。例如, 掩蓋物體輪廓線的交點比掩蓋輪廓線的中點對識別的干擾更大(Biederman, 1987), 保留輪廓線交點的圖形命名正確率更高(Szwed et al., 2011)。以上證據(jù)表明, 節(jié)點在客體識別中廣泛發(fā)揮作用, 這意味著節(jié)點可能是客體識別的一種通用特征。

        節(jié)點在字符識別中的作用可能來源于視覺系統(tǒng)早期已具備的客體識別機(jī)制。神經(jīng)回路回收假設(shè)(Neuronal recycling hypothesis)認(rèn)為, 在進(jìn)化早期,人類的文字閱讀能力并不存在先天的專門功能區(qū),而是重塑功能較為適合的、但原本用于其他功能的腦區(qū), 使之適應(yīng)文字閱讀這一新功能(Dehaene et al.,2005)。節(jié)點之所以在字符識別中起重要作用, 是源于人類對物體的識別依賴于節(jié)點。該假說獲得了實證研究的支持: 有研究分別以掩蓋和保留線段節(jié)點的字母、物體作為實驗材料, 發(fā)現(xiàn)被試觀看時保留節(jié)點的材料時梭狀回激活程度更高(Szwed et al.,2011); 另有研究發(fā)現(xiàn), 恒河猴顳下皮層的部分神經(jīng)元會對含有線段節(jié)點的圖形產(chǎn)生明顯的響應(yīng)(Brincat & Connor, 2004)。此外, 從文字符號產(chǎn)生的歷史看, 大多數(shù)文明使用的文字符號均是線條的排布組合(Changizi et al., 2006)。這些文字系統(tǒng)以這一形式誕生, 可能是視覺系統(tǒng)已經(jīng)具備了編碼這些圖形的能力, 因此選擇這些圖形來創(chuàng)造文字系統(tǒng)??傊? 漢字識別中的節(jié)點特征加工機(jī)制可能源于客體識別的相應(yīng)機(jī)制。

        5.3 本研究對漢字字形識別過程的啟示

        本研究驗證了節(jié)點數(shù)量效應(yīng)和節(jié)點復(fù)雜度效應(yīng), 其結(jié)果僅為產(chǎn)生式識別過程的早期階段提供了證據(jù)。識別系統(tǒng)后續(xù)會利用先驗的筆畫關(guān)系知識,從多種筆畫拆分方案中推斷哪一種最可能產(chǎn)生當(dāng)前的輸入字。根據(jù)貝葉斯規(guī)劃學(xué)習(xí)模型的計算特性預(yù)測, 上述識別過程還會表現(xiàn)出筆畫概率自主學(xué)習(xí)效應(yīng)和高頻筆畫組合優(yōu)勢效應(yīng)。

        筆畫概率自主學(xué)習(xí)效應(yīng)即實現(xiàn)概率推斷的前提是識別系統(tǒng)具備筆畫概率自主學(xué)習(xí)模塊, 筆畫關(guān)系概率知識可以通過對字符樣例的統(tǒng)計學(xué)習(xí)自主掌握。一些研究為上述預(yù)測提供了支持: 有實驗發(fā)現(xiàn)整字中同一筆畫所占的比例可以作為正字法知識通過內(nèi)隱學(xué)習(xí)獲得(王菲, 2015); 另有研究在高強(qiáng)度練習(xí)和正確反饋條件下, 發(fā)現(xiàn)在完成筆畫維度特征分類任務(wù)時內(nèi)隱學(xué)習(xí)有效(侯偉康, 奏啟庚,1996)。以上結(jié)果說明存在專門學(xué)習(xí)筆畫相關(guān)概率的認(rèn)知模塊。

        高頻筆畫組合優(yōu)勢效應(yīng)是指由于高頻率的筆畫組合具有較高的先驗概率, 識別系統(tǒng)面對含有高頻筆畫組合的字有計算優(yōu)勢。已有大量研究支持漢字家族的促進(jìn)效應(yīng), 形旁構(gòu)字能力大的漢字更容易被辨認(rèn)(張積家, 姜敏敏, 2008; Su & Weekes, 2007),特別是促進(jìn)高頻字的識別, 同時抑制低頻字的識別(錢怡 等, 2015)。上述結(jié)果說明高頻的筆畫組合具有促進(jìn)效應(yīng)??梢? 現(xiàn)有研究一定程度為產(chǎn)生式識別過程的后期階段提供了佐證。

        本研究也表明, 合體字的字形識別建立在獨體字識別的產(chǎn)生式過程之上, 筆畫是合體字加工的層次之一。一些研究認(rèn)為部件是合體字識別的基本單元, 其作用主要表現(xiàn)在部件數(shù)、部件頻率、部件位置、部件類型等維度(韓布新, 1998; 張積家, 姜敏敏, 2008; Chen & Yeh, 2017)。實驗2 和3 發(fā)現(xiàn)掩蓋合體字中復(fù)雜節(jié)點比掩蓋簡單節(jié)點對整字識別產(chǎn)生的干擾更大, 說明節(jié)點在合體字識別中同樣發(fā)揮作用, 經(jīng)節(jié)點拆分出的筆畫也是合體字識別所需的表征單元。上述結(jié)果支持筆畫和部件均是合體字加工單元的理論, 且符合大多數(shù)經(jīng)典模型(羅艷琳 等,2008; 彭聃齡, 王春茂, 1997; 閆國利 等, 2013;Taft & Zhu, 1997)。近期有研究發(fā)現(xiàn), 部件間具有層級關(guān)系(張瑞, 2017), 合體字的識別可能是先依據(jù)獨體字識別的產(chǎn)生式過程識別出淺層級的部件, 然后以同樣的過程識別出深層級的部件(沈模衛(wèi) 等,1997, 1998)。本研究主要關(guān)注筆畫拆分過程, 未能闡釋部件如何參與識別過程, 未來可以依托產(chǎn)生式思想展開探索, 以建立系統(tǒng)的漢字字形識別模型。

        作為模擬人類認(rèn)知過程的計算模型, 字形識別產(chǎn)生式過程反映了人類智能擁有組成性、因果關(guān)系和自學(xué)習(xí)三種特性(Lake et al., 2015), 分別對應(yīng)于:(1)計算主體對漢字的表征具有層級結(jié)構(gòu)。筆畫構(gòu)成了整字, 整字可以由節(jié)點拆解為筆畫; (2)筆畫之間存在因果聯(lián)系。兩個連續(xù)筆畫之間具有共同出現(xiàn)的概率和具備特定空間關(guān)系的概率, 前一筆畫不僅規(guī)定了后一筆畫可能是什么, 也規(guī)定了后一筆畫可能的空間位置, 后一筆是前一筆的“果”; (3)計算主體可以從字符中學(xué)習(xí)到筆畫關(guān)系的概率分布, 并根據(jù)觀察到的新樣本更新已有先驗。這三種特性使人類可以實現(xiàn)基于少量樣本的學(xué)習(xí), 大幅壓縮計算空間,從而表現(xiàn)出人類智能相對于當(dāng)前人工智能的優(yōu)越性(唐寧 等, 2018)。

        6 小結(jié)

        本研究發(fā)現(xiàn)漢字包含的節(jié)點數(shù)量越多, 整字越容易識別, 且被掩蓋的節(jié)點越復(fù)雜, 對整字識別的干擾越大。說明視覺系統(tǒng)以并行加工方式按照線段節(jié)點分離筆畫, 筆畫表征的獲得依賴于節(jié)點提供的筆畫分離信息, 信息越豐富整字識別績效越好。研究增進(jìn)了對漢字字形識別早期視覺過程的認(rèn)識, 為字形識別產(chǎn)生式過程提供了證據(jù)。

        猜你喜歡
        效應(yīng)實驗
        記一次有趣的實驗
        微型實驗里看“燃燒”
        鈾對大型溞的急性毒性效應(yīng)
        懶馬效應(yīng)
        場景效應(yīng)
        做個怪怪長實驗
        應(yīng)變效應(yīng)及其應(yīng)用
        NO與NO2相互轉(zhuǎn)化實驗的改進(jìn)
        實踐十號上的19項實驗
        太空探索(2016年5期)2016-07-12 15:17:55
        偶像效應(yīng)
        国产成人v爽在线免播放观看| 国产精品国产传播国产三级| 隔壁的日本人妻bd高清中字| 国产精品三区四区亚洲av| 亚洲av丰满熟妇在线播放| 熟女少妇精品一区二区| 欧妇女乱妇女乱视频| 99re6热在线精品视频播放6| 欧美又粗又长又爽做受| 97人人超碰国产精品最新| 内射精品无码中文字幕| 日日猛噜噜狠狠扒开双腿小说| 伊人久久成人成综合网222| 亚洲专区一区二区在线观看| 亚洲一区二区国产精品视频| 国产av一啪一区二区| 国产极品少妇一区二区| 男人的天堂无码动漫av| 丰满少妇三级全黄| 爽爽午夜影视窝窝看片| 精选麻豆国产AV| 久久精品这里就是精品| 一区二区三区四区黄色av网站| 中国免费看的片| 日本一卡2卡3卡4卡无卡免费网站| 99久久国产综合精品女图图等你| 亚洲丁香五月激情综合| 久久精品性无码一区二区爱爱| 亚洲素人日韩av中文字幕| 极品夫妻一区二区三区| 亚洲成a∨人片在线观看无码| 亚洲一区 日韩精品 中文字幕 | 激情文学婷婷六月开心久久| 免费av一区二区三区无码| 草草久久久无码国产专区| 日韩免费小视频| 日本精品国产1区2区3区| 日本免费久久高清视频| 成人a级视频在线播放| 男女啪啪免费体验区| 中文字幕Aⅴ人妻一区二区苍井空 亚洲中文字幕久久精品蜜桃 |