馬瑞祾
(西南民族大學 中國語言文學學院,四川 成都 610041)
在“互聯(lián)網(wǎng)+教育”的時代語境下,信息技術(shù)在教育領域的普及和應用推動了國際中文教育向智慧教育的方向發(fā)展[1]。教學資源的數(shù)字化、教學環(huán)境的網(wǎng)絡化、教學模式的智慧化、教學管理的自動化等已成為未來漢語教學發(fā)展的顯著趨勢。同時,我國頒布的《教育信息化“十三五”規(guī)劃》[2]和《教育信息化2.0行動計劃》[3]兩份文件中均提出利用信息化手段對學習者開展差異化、精細化、智能化教學和管理的要求,這為漢語教學的新一輪變革指明了方向。1991年由Johns和King提出的DDL(Data-Driven Learning)即“數(shù)據(jù)驅(qū)動學習”理論,近年來被廣泛應用于二語詞匯教學,特別是同義詞辨析和多義詞教學。該理論主張學習者運用教師篩選、編制的語料庫工具進行自主學習,通過探索、輸入、分析大量真實的語料,從而完成對規(guī)則的掌握和意義的建構(gòu)。這種運用數(shù)據(jù)庫技術(shù)進行自主化、探索式的詞匯學習模式有效貼合了漢語教學智慧化的需要。
日本與中國有著深遠的歷史淵源,在長期的文明互鑒和語言接觸中,日語詞匯系統(tǒng)中保留了大量的漢字詞。此外,在漢、日兩種語言中都存有“AB—BA”式特殊構(gòu)詞現(xiàn)象,漢語稱之為“同素逆序詞”,日語則稱為“二字逆順語”或“鏡像語”。張博(2008)指出,漢字文化圈的學生易受到本民族語言的負遷移影響,在漢語表達中出現(xiàn)“徑用母語詞”的現(xiàn)象,特別是日、韓學生對漢字詞的混用[4]。相反,若以同素逆序詞為切入,抽繹兩種語言間的對應關系,可作為對日詞匯教學的重要“抓手”。鑒于此,本文以《漢語水平詞匯與漢字等級大綱》(以下簡稱《等級大綱》)、《新HSK大綱詞匯(1-6級)》(以下簡稱《詞匯大綱》)和《新實用漢語課本》《博雅漢語》為漢語語料藍本,以《新明解國語辭典》(第七版)為日語語料藍本,窮盡式統(tǒng)計出498個漢日同素逆序詞,并運用Microsoft Access 2016數(shù)據(jù)庫管理系統(tǒng)建立“漢日同素逆序詞庫”,進一步探析DDL理論在創(chuàng)新對日詞匯教學模式中的具體應用。
語料庫是指“機器可讀的大量的自然語言素材的有序集合,這些語言素材是書面文本、言語錄音或其轉(zhuǎn)寫”[5]。漢日同素逆序詞庫既是雙語語料庫,也是為教學服務的專用語料庫。
1.滿足二語教學中本體研究的需要:在語言教學中,本體研究能夠幫助教學者達到“知本”的目的。首先,建庫過程需對漢、日語言中的同素逆序詞進行全面梳理,有助于進一步明晰同素逆序詞的定義。其次,漢日同素逆序詞的數(shù)據(jù)庫化能將兩種語言間的對應關系以二維關系表的形式表征和存儲。再次,詞庫設計與字段標注有助于教師和科研人員快捷地檢索、查詢到所需詞語的義項分布、句法功能和語用實例等信息,有助于定量研究的開展。
2.滿足學習者探索式學習的需要:傳統(tǒng)的詞匯學習模式,學生只能依靠教材、詞典和老師課堂教學,學生難以根據(jù)自身需求學習新詞語。在“以學生為中心”理念的驅(qū)動下,詞庫的建成有助于學習者根據(jù)自身需求針對性地開展詞匯學習,并通過例句構(gòu)建的近乎真實的語境幫助學習者完成詞義的識解。
3.滿足學習詞典和教材編撰的需要:現(xiàn)下,學習詞典和二語教材迎來了從紙質(zhì)件向電子化發(fā)展的趨勢。教材和詞典的編撰愈發(fā)依靠大規(guī)模、高精度的語料庫。詞庫能為教材和詞典的編寫提供釋義、詞性、用例等信息,提高編修速率。詞庫的動態(tài)管理能幫助編寫者快速捕捉詞目義項的演變和隱退,從而及時更新教材和詞典。
4.滿足跨文化視域下語際對比的需要:詞匯是民族文化信息的重要載體,是不同民族認知心理、社會習俗、審美情趣等文化因素在語言上的映射[6]。漢日同素逆序詞的差異反映了兩個民族的異質(zhì)文化特征。若學習者無法對詞匯間的差異進行準確把握,就容易造成詞義識解的偏差。依托詞庫的對比查詢功能,師生可對漢日同素逆序詞進行句法、語義等不同界面的辨析,進而幫助學習者掌握目的語。
1. 規(guī)范性原則:該詞庫是服務留學生自主習得同素逆序詞的教學庫,規(guī)范的語料是首要的建庫要求。數(shù)據(jù)表中詞目的詞形、拼音、詞性需嚴格按照《現(xiàn)代漢語詞典》(第七版)和《新明解國語詞典》(第七版)兩部規(guī)范詞典進行標注。例句均選自北京語言大學漢語語料庫(BCC),且嚴格按照現(xiàn)代漢語的語法規(guī)范和漢民族的語用習慣進行挑選,避免使用含有文言或方言詞匯、句式的例句,為學習者提供真實的目的語日常交際實例。
2. 多樣性原則:與教材、詞典相比,詞庫最大的優(yōu)勢在于所提供的語料量不受篇幅和紙張的限制。為幫助學習者全面掌握漢日同素逆序詞的句法、語義、語用等角度的差異,滿足其個性化需求,詞庫既要不斷拓寬語料來源,又要保證用例的平衡性和多樣性。受同素逆序詞標準的限制,詞庫的詞目總量有限。但各詞條包含的例句數(shù)量卻較為龐大,語例總量達3280句。每個詞的不同義項均保證有2個及以上的語例,且盡量涵蓋不同語體、話題和語境。
3. 實用性原則:為適配學生自主學習的要求,庫中用例應保證除目標詞外其他的詞語和句式基本上貼合學習者的漢語水平和學習進度,實現(xiàn)語言的可理解性輸入。在標示詞義時,還需綜合參考《漢語8000詞詞典》等多部外向型學習詞典,從中選出學習者最易理解的釋義內(nèi)容,并注重展示詞語的搭配情況。在選用語例時,用例需圍繞目標詞的語義和用法,并注意補足例句中省略的語義和語境信息,使例句更利于學習者理解和掌握。
入庫語料的選定是建庫的關鍵,語料篩選需對同素逆序詞進行準確把握。目前,學界對于“AB-BA”這類特殊的詞匯現(xiàn)象的界說尚存爭議,表現(xiàn)為命名的眾說紛紜?!巴之愋蛟~”“同形逆序詞”等別稱大行其道。本文所采用的“同素逆序詞”既高度概括了該類現(xiàn)象的特征,又較好貼合了漢、日詞匯的實際情況。首先,“同素”而非“同字”?!巴亍奔磪?gòu)語素的音、義相同。漢字的本質(zhì)是符號的符號,且字的義項不唯一,而語素的義項唯一?;谡Z言的可比性,在進行語際對比時僅要求語素義相同,忽略音位系統(tǒng)不同造成的語音差異。其次,“逆序”而非“異序”。異序是指標記語素的漢字順序不同,是逆序的上位概念。在雙音節(jié)詞中異序僅有逆配列一種情況,而在三音節(jié)詞語中則有多種排列組合情況,如“讀好書”的異序形式可以為“讀書好”“好讀書”等。最后,“詞”需為復合構(gòu)詞。同素逆序詞是由兩個詞根語素復合成詞,并非單純詞。此外,當詞對中有一方為短語時則不屬于同素逆序詞的范疇,如雪白(詞)—白雪(短語)。
為使得語料更加貼合二語學習者的學習需求和實際情況,數(shù)據(jù)庫的漢語語料主要采自《等級大綱》《詞匯大綱》《新實用漢語課本》《博雅漢語》4份文本。兩份大綱文件是我國對留學生漢語水平考察的重要憑依和參考,所收詞匯均為留學生必須掌握的。兩套教材是當下高校對外漢語教學較常使用的系列教材。在已檢索出的漢語詞(對)基礎上從《新明解國語詞典》(第七版)中找出相對應的日語詞(對)。由于漢、日書寫符號系統(tǒng)演變路徑不同,在收詞時忽略了同一漢字在語際間的異寫現(xiàn)象,如“介紹—紹介”。
在上文詞匯觀的指導下,通過機器和人工相結(jié)合的方式遍歷來源文本,共采集出符合標準的詞目498條。下文以《詞匯大綱》為例展示語料的檢索和遴選。首先,將《詞匯大綱》導入Access中,命名為“HSK”表。運用LEFT和RIGHT函數(shù)分別查詢表中各詞的左、右第一個漢字,并用LEN函數(shù)將詞長限定為2,生成“HSKz1”和“HSKy1”兩個查詢。其后,將兩表中的漢字所在字段進行合并,拼接成反序組合“FXZH”表。通過“FXZH”和“HSK”進行關聯(lián)查詢,通過對比詞目字段相同的即為反序詞[5]。最后,對生成詞表進行人工篩查,刪除疊音詞、重疊式合成詞及語素義無關的同形逆序詞,最終所得即為《詞匯大綱》中的同素逆序詞對。
語料的預處理環(huán)節(jié)主要包括語料降噪和分類。本文對同素逆序詞分類標準以詞形為主:首先,根據(jù)兩種語言中正、逆序詞的對應分布情況分為對稱型和不對稱型。其次,根據(jù)兩種語言中構(gòu)成同素逆序關系的詞語數(shù)量細分為四個小類。
1. 1:1對稱型:漢語和日語中各有一個由相同語素構(gòu)成的詞,且兩詞互為逆序關系。如:“伴隨—隨伴”。該類詞共63對,126個詞目,占比約25.3%。
2. 2:2對稱型:漢語和日語中各有一對互為同素逆序關系的詞對。如:“感情、情感—感情、情感”。該類詞共30對,120個詞目,占比約24.1%。
3. 2:1不對稱型:漢語中有一對互為同素逆序關系的詞對,日語中僅有單個對應的同素詞。如:“演講、講演—講演”。該類詞共32對,96個詞目,占比約19.3%。
4. 1:2不對稱型:漢語中僅有單個對應的同素詞,日語中有一對互為同素逆序關系的詞對。如:“運氣—気運、運気”。該類詞共52對,156個詞目,占比約31.3%。
漢日同素逆序詞庫按照概念單一化原則創(chuàng)建數(shù)據(jù)表,即每張表僅描述一個實體或?qū)嶓w間的聯(lián)系。為使不同主題的信息分散在不同表中,從而提高數(shù)據(jù)組織和維護工作的便捷性,該詞庫由詞對總表、漢語詞表、日語詞表3份數(shù)據(jù)表構(gòu)成。圖1數(shù)據(jù)庫的管理系統(tǒng)選用的是關系型數(shù)據(jù)庫。詞對總表與漢語詞表、日語詞表間通過“詞對序號”分別建立一對多的關系。漢語詞表和日語詞表間通過“詞對序號”建立多對多的關系。
圖1 漢日同素逆序詞庫的結(jié)構(gòu)模型
表結(jié)構(gòu)創(chuàng)建是詞庫建設的基礎和核心,是用二維表的形式表征漢日同素逆序詞間的對應關系,并通過在不同表間建立關系將多個表的數(shù)據(jù)聯(lián)系起來的過程。受文章篇幅限制,本文僅以詞對總表為例展示數(shù)據(jù)表的設計思路及字段的規(guī)定說明,如下表所示:
表1 詞對總表(CDZB)表結(jié)構(gòu)
漢日同素逆序詞庫主要面向?qū)θ諠h語教師,以及母語為日語的漢語學習者開放的。詞庫包含用戶查詢和詞庫管理兩大功能。目標用戶可依托詞庫進行語料的檢索、查詢等。詞庫管理員負責定期對詞庫進行更新和維護。詞庫的詞目檢索流程及例詞的前端查詢界面如圖2、3所示。同時,用戶也可利用數(shù)據(jù)庫的查詢窗體功能進行同素逆序詞不同維度的對比。本文以“收買”一詞的詞義對比為例建立查詢窗體,如圖4所示。
圖3 “加倍”一詞的前端檢索界面
圖4 “收買”一詞的詞義對比查詢窗體
DDL模式的教學應用理據(jù)與建構(gòu)主義強調(diào)“情境”對意義建構(gòu)的作用具有一致性。詞庫的教學應用主要涉及環(huán)境、對象和課型問題。
在漢語智慧課堂環(huán)境中,語言技術(shù)和語言知識教學良性互動,教學過程的參與者迭變?yōu)榻處?、學生和機器共同組成的三元關系。DDL模式下的同素逆序詞教學,教師可以利用詞庫完成生詞展示、詞匯釋義、造句練習等教學環(huán)節(jié)。學習者可利用詞庫輸入豐富、真實的語料,利用各項功能制定個性化的學習方案,實現(xiàn)自下而上的歸納式學習。同時,結(jié)合AI技術(shù)完成對學習者學習行為的動態(tài)監(jiān)測,及時掌握其對詞匯的習得情況,針對性提供學習資源。詞庫在智慧課堂中的應用有助于教師打通虛擬網(wǎng)絡與現(xiàn)實生活的屏障,延伸課堂。學習者也不再受限于時空,可以自由、自主地獲取語言知識。
DDL模式主要適用于中、高級階段的二語學習者。該類學習者正處在擴容詞匯儲備量和知識面的階段,所具備的詞匯基礎和學習經(jīng)驗可以幫助他們完成自主學習任務,且不會因接觸的語料量過大而對詞匯學習形成干擾[7]。通過對《詞匯大綱》中同素逆序詞等級分布情況的考察發(fā)現(xiàn),漢語同素逆序詞主要分布在4至6級,少數(shù)為3級。由此進一步確定中、高級學習者為主要適用對象。此外,詞庫對年輕、學習動機較強的學習者較為適用。該類學習者大多有良好的信息素養(yǎng)和技術(shù)適應性,且更愿意利用課余時間拓展自己的詞匯知識。
由于詞匯學習貫穿于漢語二語教學的所有課型中,賦予了DDL模式廣泛的教學適用性。在各類課型中,讀寫課是學習者接觸、掌握生詞的重要課型,也是詞庫主要的應用課型。讀寫課中,教師受課程時長和教學任務的限制,無法過多擴充詞匯知識。而課外的時間相對寬裕、靈活,學習者可隨時利用詞庫進行學習。因此,教師在課堂中可優(yōu)先講解重點詞匯、語法點和課文。把依托詞庫開展探索式學習留到課后的生詞鞏固和拓展環(huán)節(jié)。
隨著大數(shù)據(jù)時代的到來和智慧漢語國際教育的興起,現(xiàn)代教育技術(shù)在漢語二語教學中發(fā)揮著不容忽視的作用。在“數(shù)據(jù)的驅(qū)動學習”理論的視角下,本文依托數(shù)據(jù)庫管理系統(tǒng)搭建了內(nèi)含498條記錄的“漢日同素逆序詞庫”,為對日詞匯教學提供新的教學模式參考。