張瑞國(guó) 萬(wàn) 禮
(青島農(nóng)業(yè)大學(xué),山東 青島 266109)
自20世紀(jì)70年代美國(guó)制作了Brown Corpus以來(lái),世界各國(guó)都開(kāi)始研制語(yǔ)料庫(kù),種類(lèi)和規(guī)模越來(lái)越大?,F(xiàn)在語(yǔ)料庫(kù)的制作不再限于國(guó)家研究項(xiàng)目或是某個(gè)大學(xué)的研究項(xiàng)目,個(gè)人只要有足夠資金和時(shí)間,也可以制作出相當(dāng)規(guī)模的語(yǔ)料庫(kù)。特別是針對(duì)于日語(yǔ)專(zhuān)業(yè)在校學(xué)生,針對(duì)于課堂使用教材,由學(xué)生動(dòng)手制作適合學(xué)生自己的中日對(duì)譯語(yǔ)料庫(kù),可以更有效地學(xué)習(xí)日語(yǔ)并且能夠綜合地運(yùn)用日語(yǔ)。中日對(duì)譯語(yǔ)料庫(kù)即為儲(chǔ)存各類(lèi)日語(yǔ)文章的大型文字倉(cāng)庫(kù),旨在根據(jù)各種需要對(duì)語(yǔ)料庫(kù)內(nèi)儲(chǔ)存的語(yǔ)言信息進(jìn)行檢索,抽取所需信息。是外語(yǔ)學(xué)習(xí)中必不可少的一項(xiàng)學(xué)習(xí)工具,具備省時(shí)、易得等特點(diǎn)。
該研究主要針對(duì)不同階段的日語(yǔ)學(xué)習(xí)者在日常學(xué)習(xí)中,對(duì)于生僻復(fù)雜語(yǔ)言現(xiàn)象難以根據(jù)自己以往的知識(shí)積累加以判斷解決的狀況,需要借助既定語(yǔ)境下大量語(yǔ)料數(shù)據(jù)進(jìn)行學(xué)習(xí)分析的需求,進(jìn)行了中日對(duì)譯語(yǔ)料庫(kù)的研究與開(kāi)發(fā)。在以我校各語(yǔ)言學(xué)習(xí)階段學(xué)生為調(diào)查對(duì)象,對(duì)于其需求獲得大量反饋之后,開(kāi)始了語(yǔ)料庫(kù)的開(kāi)發(fā)工作。
該語(yǔ)料庫(kù)主要面向初中級(jí)學(xué)習(xí)者的語(yǔ)料學(xué)習(xí)工具,因此在內(nèi)容上我們以教材中的重點(diǎn)文章、日語(yǔ)新聞板塊(天聲人語(yǔ)等)、日本文學(xué)名著等為主要內(nèi)容。學(xué)習(xí)者在遇到生僻復(fù)雜語(yǔ)言現(xiàn)象時(shí)可借助語(yǔ)料庫(kù)中的語(yǔ)料內(nèi)容進(jìn)行搜索,通過(guò)對(duì)比、分析、判斷破除所遇到的復(fù)雜生僻語(yǔ)言瓶頸,滿(mǎn)足了學(xué)習(xí)者需要借助既定語(yǔ)境下大量語(yǔ)料數(shù)據(jù)進(jìn)行學(xué)習(xí)分析的需求。
具體內(nèi)容包括將單詞模塊化、文章化并挑選出經(jīng)典日語(yǔ)文章,經(jīng)典日語(yǔ)例句,讓每一個(gè)初學(xué)者使用者都可以輕松查詢(xún)到單詞相關(guān)聯(lián)的例句、文章。通過(guò)單詞理解記憶文章和例句,通過(guò)文章例句反饋學(xué)習(xí)單詞,加深理解,并有助于區(qū)分意義相近的重難點(diǎn)詞匯,使用者在使用的過(guò)程中改變以往一成不變的死記硬背的單詞學(xué)習(xí)方式,在閱讀、理解中記憶單詞,用單詞記句子、文章。語(yǔ)料全部實(shí)現(xiàn)了句段對(duì)齊和詞性標(biāo)注,全部摘錄于著名作品的經(jīng)典語(yǔ)句。本語(yǔ)料庫(kù)可以提供一般日語(yǔ)學(xué)習(xí)、語(yǔ)言及翻譯研究等多種目的的應(yīng)用。
在制作方法上我們參考于康(2013),首先針對(duì)我們的設(shè)定用戶(hù),選取了相應(yīng)能力階段所需要的日語(yǔ)文獻(xiàn)資料進(jìn)行篩選,確定為初期語(yǔ)料。之后對(duì)篩選后的語(yǔ)料進(jìn)行掃描,將掃描后的PDF格式文件轉(zhuǎn)化為文字,通過(guò)日語(yǔ)文字編輯處理軟件秀丸進(jìn)行文字整理。之后建立并調(diào)試Java運(yùn)行環(huán)境,將整理好的語(yǔ)料通過(guò)Edamame軟件進(jìn)行轉(zhuǎn)換建庫(kù),最后通過(guò)語(yǔ)言檢索軟件Himawari進(jìn)行檢索,并調(diào)試運(yùn)行,之后進(jìn)行制作標(biāo)簽,標(biāo)簽分類(lèi)等進(jìn)一步細(xì)化功能的開(kāi)發(fā),梳理和完善。在初期完善之后我們將軟件投放給學(xué)生進(jìn)行試用,對(duì)于學(xué)生提出的重復(fù)句,語(yǔ)料轉(zhuǎn)換過(guò)程中出現(xiàn)的亂碼錯(cuò)別字,空格等問(wèn)題進(jìn)行了修改,并根據(jù)同學(xué)不斷增長(zhǎng)的日語(yǔ)學(xué)習(xí)需求進(jìn)行了新語(yǔ)料的收集生成,并成立語(yǔ)料發(fā)展小組,貼合同學(xué)的需求不斷增加新語(yǔ)料的開(kāi)發(fā),建立語(yǔ)料開(kāi)發(fā)長(zhǎng)效機(jī)制,及時(shí)淘汰模糊、曖昧語(yǔ)料。讓語(yǔ)料庫(kù)不斷開(kāi)源,繼續(xù)長(zhǎng)流,不斷為同學(xué)的日語(yǔ)學(xué)習(xí)服務(wù)。
經(jīng)過(guò)一年的研究開(kāi)發(fā),最終開(kāi)發(fā)出能為日語(yǔ)專(zhuān)業(yè)學(xué)習(xí)者所實(shí)用的語(yǔ)料庫(kù),彌補(bǔ)了大語(yǔ)料庫(kù)費(fèi)用門(mén)檻高小語(yǔ)料庫(kù)不能完全滿(mǎn)足需要以及錯(cuò)誤較多的短板。從本校日語(yǔ)學(xué)習(xí)者的實(shí)際需要出發(fā),建立和不斷豐富語(yǔ)料素材。經(jīng)過(guò)研究發(fā)現(xiàn)并非只有少納言等大型語(yǔ)料庫(kù),學(xué)習(xí)者可根據(jù)自己需要建立屬于自己的語(yǔ)料庫(kù),使外語(yǔ)學(xué)習(xí)者根據(jù)自己的需要和學(xué)習(xí)方向擁有自己“專(zhuān)向?qū)S谩钡恼Z(yǔ)料庫(kù)成為可能。
參考文獻(xiàn):
[1]戴寶玉.基于語(yǔ)料庫(kù)的日語(yǔ)研究[M].上海學(xué)林出版社,2012.
[2]徐一平,曹大峰.中日對(duì)譯語(yǔ)料庫(kù)的研制與應(yīng)用論文集[M].北京外語(yǔ)教學(xué)與研究出版社,2002.
[3]于康.語(yǔ)料庫(kù)的制作與日語(yǔ)研究[M].浙江工商大學(xué)出版社,2013.