摘要:語料庫(kù)基于實(shí)例收集語言數(shù)據(jù),可以作為一種方便的研究方法用于各種語言研究,并具有機(jī)器可讀的優(yōu)點(diǎn)。此外,在日語教育中,由于日語學(xué)習(xí)者人數(shù)的增加和需求的多樣化,可以通過語料庫(kù)制作學(xué)習(xí)者需要的教學(xué)大綱、教材開發(fā)、詞典編纂等。本文從詞典編纂的角度描述了語料庫(kù)在面向日語學(xué)習(xí)者的詞典中的應(yīng)用。在此基礎(chǔ)上,基于對(duì)使用語料庫(kù)的專業(yè)術(shù)語的研究成果,我們將考慮如何使用語料庫(kù)來編寫學(xué)術(shù)術(shù)語詞典。
關(guān)鍵詞:語料庫(kù);日語學(xué)習(xí)詞典匯編;專業(yè)術(shù)語;學(xué)術(shù)專業(yè)術(shù)語詞典
一、研究動(dòng)機(jī)
語料庫(kù)語言學(xué)記載描述了語言運(yùn)用中大量的個(gè)別語言。此外,強(qiáng)調(diào)經(jīng)驗(yàn)和習(xí)慣,并使用定量語言模型方法。換句話說,就是將某個(gè)語言社區(qū)的數(shù)據(jù)作為樣本進(jìn)行定量收集。
近年來,日本已經(jīng)發(fā)布了各類各式的語料庫(kù),但仍然存在各種問題。日本國(guó)立國(guó)語研究所設(shè)計(jì)了“現(xiàn)代日本語書き言葉均衡コーパス(BCCWJ)”(正在建設(shè)中),以解決之前無法均衡整體地反映日語本身的問題。以BCCWJ為代表,可以說日本的語料庫(kù)研究已經(jīng)發(fā)展到世界一流水平。
使用這些語料庫(kù),可以進(jìn)行例如習(xí)得研究、詞匯研究和語法研究等范圍廣泛的研究。使用語料庫(kù)來搜索語法研究所必需的例句等雖然不能說是語料庫(kù)語言學(xué),但對(duì)于發(fā)現(xiàn)新的語言現(xiàn)象,或者做出某種發(fā)現(xiàn),開發(fā)語料庫(kù)分析工具也是相當(dāng)重要的。
2. 使用語料庫(kù)編譯詞典的背景和類型
實(shí)際上,語料庫(kù)的使用研究早已應(yīng)用于詞典編纂。從例句卡的使用時(shí)期到現(xiàn)在,詞典編纂的歷史相當(dāng)悠久。隨著科學(xué)的發(fā)展和計(jì)算機(jī)處理能力的提高,語料庫(kù)的使用與詞典編纂的關(guān)系更加密切。
當(dāng)前的詞典編纂不同于以前的詞典編纂,使用通過語料庫(kù)來收集詞匯句子,并分析其含義和用法的方法。此外,發(fā)現(xiàn)目前的詞典編纂在材料質(zhì)量、收集材料的效率、新發(fā)現(xiàn)的可能性和客觀性方面更具優(yōu)勢(shì)。
基于以往的研究,研究人員正在嘗試使用語料庫(kù)創(chuàng)建各種類型的詞典。田野 (2010) 描述了使用語料庫(kù)和編譯搭配詞典的可能性。奧村等 (2003) 提出了一種使用語料庫(kù)自動(dòng)構(gòu)建擬聲詞概念詞典的方法。除此之外,還有許多使用語料庫(kù)選取專業(yè)術(shù)語的建議。
3. 專業(yè)術(shù)語詞典的應(yīng)用及學(xué)術(shù)專業(yè)術(shù)語詞典的構(gòu)想
杉本等(2010) 在女性研究領(lǐng)域進(jìn)行了一項(xiàng)專業(yè)用詞提取實(shí)驗(yàn)。具體而言,他們提出了一種新的專業(yè)術(shù)語提取方法,該方法考慮了目標(biāo)領(lǐng)域語料庫(kù)和其他領(lǐng)域語料庫(kù)之間候選術(shù)語出現(xiàn)率的差異。通過比較MDP提議方法和三種現(xiàn)有方法的各前25個(gè)詞提取結(jié)果,發(fā)現(xiàn)兩種類型的提取錯(cuò)誤。(1)提取了學(xué)術(shù)論文特有的術(shù)語。 (2)提取了一些常用詞語。從實(shí)驗(yàn)結(jié)果來看,與常規(guī)專業(yè)術(shù)語提取方法相比較,顯示了所提方法的有效性。
本文采用杉本等人提出的MDP方法,將前10位的術(shù)語按照專業(yè)術(shù)語提取量表的值降序排列。得出以下10個(gè), “woman,feminist,gender,feminism,self,movement,article,feminist theory,way,lesbian”。正如杉本等人所指出的,傳統(tǒng)術(shù)語詞典的創(chuàng)建和更新是由專家手動(dòng)完成的,需要大量成本比如時(shí)間。使用計(jì)算機(jī)自動(dòng)提取專業(yè)術(shù)語是一種有助于快速創(chuàng)建和更新專業(yè)術(shù)語詞典的技術(shù)。語料庫(kù)的使用提供了快速創(chuàng)建專業(yè)詞典的潛力,對(duì)于有利于平衡減少詞典編譯的數(shù)據(jù)偏向方面的缺點(diǎn)。
從日語教育的角度來看,日語學(xué)習(xí)者的人數(shù)逐年增加(砂川 2009),根據(jù)學(xué)習(xí)者的需要高效地制作必要的詞典與語料庫(kù)的使用密切相關(guān)。此外,在日本實(shí)施30萬留學(xué)生計(jì)劃的現(xiàn)在,對(duì)于在日本大學(xué)和研究生院就讀的國(guó)際留學(xué)生而言,學(xué)習(xí),理解和掌握學(xué)術(shù)專業(yè)術(shù)語是非常有必要的。
4、在學(xué)術(shù)術(shù)語詞典編纂中的應(yīng)用
石澤(2013)中提到,“學(xué)術(shù)通用基本詞匯”在大學(xué)的各種講座中被普遍使用。因此,紙質(zhì)教材「語彙ドン!―講義理解のために學(xué)んでおきたい語彙―」的試用版已經(jīng)完成。石澤通過詞性分類進(jìn)行了整理,本文僅展示其中的一部分。名詞有「共同,共有,効果,交換,向上,構(gòu)造,公平,効率,試み」,動(dòng)詞有「関する,加える,超える,生み出す,導(dǎo)く」等。
此類教材的創(chuàng)作被認(rèn)為對(duì)在日學(xué)習(xí)的日語學(xué)習(xí)者非常有用。然而,在課堂上學(xué)習(xí)教材以外的時(shí)間里,或者課堂上沒有時(shí)間學(xué)習(xí)這些教材的情況下,有必要編纂一本學(xué)術(shù)術(shù)語詞典以便日語學(xué)習(xí)者自學(xué)。
在本文中,我們使用語料庫(kù),參考杉本等人提出的專業(yè)術(shù)語提取方法,基于教材、論文、書籍等研究,提取了與石澤定義相同的學(xué)術(shù)術(shù)語,可以認(rèn)為對(duì)于在日留學(xué)生而言,學(xué)術(shù)專業(yè)術(shù)語詞典的編纂具有一定的意義。
參考文獻(xiàn)
[1].石澤澈(2013)《利用日本語學(xué)術(shù)共同詞匯數(shù)據(jù)庫(kù)進(jìn)行的詞匯教材開發(fā)-針對(duì)在大學(xué)學(xué)習(xí)的詞匯習(xí)得-》 漢字日本語教育研究第3號(hào)
[2].奧村敦史,齋藤豪,奧村學(xué)(2003)《基于Web文本語料庫(kù)自動(dòng)構(gòu)建擬聲概念詞典》自然語言處理154?10
[3].砂川百合子(2009)《利用語料庫(kù)的日語教育與研究》日本人工智能學(xué)會(huì)會(huì)刊 24
[4].田野村(2010)《日本語語料庫(kù)和常見搭配——關(guān)于詞典應(yīng)用的可能性》 日本語言學(xué)會(huì)語言研究(138),1-23.
[5].久保順,辻慶太,杉本重雄(2010)《使用不同學(xué)術(shù)領(lǐng)域的語料庫(kù)提取專業(yè)術(shù)語方法的提案》 日本信息和知識(shí)學(xué)會(huì)雜志第20卷,第1期
作者簡(jiǎn)介:魏達(dá)因,1995年3月出生,女,漢族,河南省開封市人,碩士研究生,助教,日語教育學(xué)專業(yè),現(xiàn)任廣東外語外貿(mào)大學(xué)南國(guó)商學(xué)院東方語言學(xué)院日語系日語教師。
廣東省哲學(xué)社會(huì)科學(xué)“十三五”規(guī)劃2020年度學(xué)科共建項(xiàng)目“日源外來詞的回流研究”,批準(zhǔn)號(hào):GD20XWY09。7DD25BAC-E525-4444-BDDE-59A637356A41