梁迪 梁爽
摘 要:本文以2年以來(lái)基于語(yǔ)料庫(kù)的現(xiàn)代漢語(yǔ)研究的文獻(xiàn)為依托,從基于標(biāo)記語(yǔ)料庫(kù)、靜態(tài)語(yǔ)料庫(kù)、自建語(yǔ)料庫(kù)三方面的研究,分析了現(xiàn)代漢語(yǔ)研究借助的語(yǔ)料庫(kù)類型,并據(jù)此分析了目前該研究方法存在的問(wèn)題。
關(guān)鍵詞:語(yǔ)料庫(kù);現(xiàn)代漢語(yǔ);研究方法;問(wèn)題
作者簡(jiǎn)介:梁迪,1995年10月生,女,漢族,河北省廊坊市永清縣人,本科在讀,研究方向?yàn)闈h語(yǔ)言文學(xué)專業(yè);梁爽,1992年9月生,女,漢族,河北省廊坊市永清縣人,研究生在讀,研究方向?yàn)樗囆g(shù)設(shè)計(jì)。
[中圖分類號(hào)]:H109 [文獻(xiàn)標(biāo)識(shí)碼]:A
[文章編號(hào)]:1002-2139(2016)-12--01
一、緒論
正如Sinclair所言:“語(yǔ)料庫(kù)所提供的海量語(yǔ)料使研究者系統(tǒng)地對(duì)大量文本語(yǔ)料進(jìn)行審視,使我們有可能發(fā)現(xiàn)一些新的未發(fā)現(xiàn)的語(yǔ)言事實(shí)”。語(yǔ)料庫(kù)在語(yǔ)言研究中能提供空前廣泛的語(yǔ)言資料,使得對(duì)語(yǔ)言多方面、多層次的研究成為可能。本文以2000年以來(lái)基于語(yǔ)料庫(kù)的現(xiàn)代漢語(yǔ)研究的文獻(xiàn)為依托,深入分析文獻(xiàn)中基于語(yǔ)料庫(kù)的研究方法,并從借助的語(yǔ)料庫(kù)類型進(jìn)行具體綜述,據(jù)此對(duì)研究中存在的問(wèn)題進(jìn)行了分析。
二、借助的語(yǔ)料庫(kù)類型
“語(yǔ)料庫(kù)為語(yǔ)言描述提供了豐富的數(shù)據(jù)資源,在基于語(yǔ)料庫(kù)的語(yǔ)言研究中,語(yǔ)言學(xué)家利用機(jī)儲(chǔ)數(shù)據(jù)庫(kù)去描寫(xiě)語(yǔ)言的詞匯和語(yǔ)法”。基于語(yǔ)料庫(kù)的研究方法,方便研究者統(tǒng)計(jì)數(shù)據(jù),并在已有成果基礎(chǔ)上,深化對(duì)某一類詞群的研究。
然而,語(yǔ)料庫(kù)種類眾多,現(xiàn)代漢語(yǔ)研究方向也是多方面的,選擇與研究?jī)?nèi)容相適應(yīng)的語(yǔ)料庫(kù)類型才能更好地提高研究效率,取得更佳的研究成果。筆者通過(guò)歸納2000年以來(lái)基于語(yǔ)料庫(kù)的現(xiàn)代漢語(yǔ)研究的文獻(xiàn),總結(jié)以下幾種常用的語(yǔ)料庫(kù)類型。
(一)基于標(biāo)注語(yǔ)料庫(kù)的研究
標(biāo)注就是使語(yǔ)料的某些單位(詞、句、段等)和表示對(duì)這些單位的某種層次的“理解”的知識(shí)信息(標(biāo)記符)相關(guān)聯(lián)。標(biāo)記語(yǔ)料庫(kù)即含有這些加工者添加其對(duì)語(yǔ)料的理解信息的語(yǔ)料庫(kù)。這樣的語(yǔ)料庫(kù)可以作為句法規(guī)律研究的重要參考。
孫建功等,基于標(biāo)記語(yǔ)料庫(kù)對(duì)單句句型句模對(duì)應(yīng)關(guān)系進(jìn)行研究,歸納總結(jié)出現(xiàn)代漢語(yǔ)單句句型和句模對(duì)應(yīng)關(guān)系的主要特點(diǎn)。杜婷借助《國(guó)家語(yǔ)委現(xiàn)代漢語(yǔ)通用平衡語(yǔ)料庫(kù)》的“標(biāo)注語(yǔ)料庫(kù)”(在線提供免費(fèi)檢索的語(yǔ)料約2000萬(wàn)字),對(duì)現(xiàn)代漢語(yǔ)中小類詞口部動(dòng)詞的頻度進(jìn)行了統(tǒng)計(jì),進(jìn)而發(fā)現(xiàn)其語(yǔ)法語(yǔ)用規(guī)律。
對(duì)語(yǔ)料庫(kù)的標(biāo)注工作,既是語(yǔ)料庫(kù)建設(shè)中的一個(gè)重要環(huán)節(jié),也豐富了語(yǔ)料庫(kù)的利用價(jià)值,使其在句型、詞匯等方面的研究中可以發(fā)揮出更大的作用。
(二)基于靜態(tài)語(yǔ)料庫(kù)的研究
靜態(tài)語(yǔ)料庫(kù)是收集某一固定時(shí)期的共時(shí)語(yǔ)言使用樣本構(gòu)成的語(yǔ)料庫(kù),屬于共時(shí)語(yǔ)料庫(kù)的一種?,F(xiàn)有的許多類型的詞典,被眾多語(yǔ)言研究者運(yùn)用到語(yǔ)言學(xué)研究中,形成基于靜態(tài)語(yǔ)料庫(kù)的現(xiàn)代漢語(yǔ)研究范式。
亢世勇在進(jìn)行現(xiàn)代漢語(yǔ)謂賓動(dòng)詞分類統(tǒng)計(jì)研究時(shí),即利用《現(xiàn)代漢語(yǔ)詞典》等靜態(tài)語(yǔ)料庫(kù)作為語(yǔ)料源,利用計(jì)算機(jī)進(jìn)行窮盡性檢索,根據(jù)動(dòng)詞所帶賓語(yǔ)類型對(duì)動(dòng)詞分類。針對(duì)外來(lái)詞的研究,駱牛牛在《漢語(yǔ)經(jīng)濟(jì)外來(lái)詞研究》中,以多部具有代表性的外來(lái)詞詞典為語(yǔ)料庫(kù),從中窮盡性檢索出符合條件的經(jīng)濟(jì)類詞條作為研究對(duì)象,以對(duì)其進(jìn)行分析、總結(jié)規(guī)律。
基于以詞典為主的靜態(tài)語(yǔ)料庫(kù)的研究,有利于更好地把握現(xiàn)代漢語(yǔ)發(fā)展演變過(guò)程中某一時(shí)段的共時(shí)特征,對(duì)歷時(shí)發(fā)展規(guī)律的研究有很好的基礎(chǔ)性作用。
(三)基于自建語(yǔ)料庫(kù)的研究
現(xiàn)代漢語(yǔ)中的詞匯也是在人際接觸交往中不斷更新的。漢語(yǔ)詞匯的日漸豐富,使得語(yǔ)料庫(kù)的發(fā)展速度達(dá)不到詞匯發(fā)展要求,因而出現(xiàn)研究者根據(jù)真實(shí)文本資料自建語(yǔ)料庫(kù),用于自己的研究,也為后來(lái)的研究者提供借鑒意義。
薛松蕙人,通過(guò)在《現(xiàn)代漢語(yǔ)詞典》和《新華新詞語(yǔ)詞典》等辭書(shū)中檢索對(duì)應(yīng)詞條,建立了一個(gè)舊詞新義詞語(yǔ)語(yǔ)料庫(kù)來(lái)佐證自己的研究,為舊詞新義語(yǔ)料庫(kù)補(bǔ)充了新語(yǔ)料。盧海濱、王曉娟等分別自建了外來(lái)詞語(yǔ)料庫(kù)和派生詞語(yǔ)料庫(kù),為他們的對(duì)比和實(shí)證研究提供重要參考依據(jù)。
這些自建的語(yǔ)料庫(kù)一方面可以方便研究者開(kāi)展自己的研究論題,另一方面,它們也是已有的靜態(tài)語(yǔ)料庫(kù)的動(dòng)態(tài)補(bǔ)充。研究者在自建語(yǔ)料庫(kù)的過(guò)程中提出的全新的建庫(kù)標(biāo)準(zhǔn)原則,為以后語(yǔ)料庫(kù)的豐富完善提供了指導(dǎo)性意義。
三、研究中存在的問(wèn)題
基于語(yǔ)料庫(kù)的現(xiàn)代漢語(yǔ)研究雖已得到進(jìn)一步發(fā)展,研究方法也在逐步完善并廣泛應(yīng)用于各個(gè)方向的研究。然而,基于語(yǔ)料庫(kù)的研究方法在運(yùn)用時(shí)候仍然存在著一些問(wèn)題:
(一)規(guī)模不夠大
我國(guó)現(xiàn)已建成的語(yǔ)料庫(kù)數(shù)目較多,涉及到的類型也較為豐富,但在規(guī)模上并不占優(yōu)勢(shì)。我國(guó)的大規(guī)模語(yǔ)料庫(kù)雖已存在破億的語(yǔ)料庫(kù),國(guó)家語(yǔ)委現(xiàn)代漢語(yǔ)通用平衡語(yǔ)料庫(kù)全庫(kù)約為1億字符,但這樣大規(guī)模的語(yǔ)料庫(kù)也只是少數(shù),和國(guó)外的語(yǔ)料庫(kù)規(guī)模相比仍存在差距,需要進(jìn)一步擴(kuò)大規(guī)模。
(二)研究方向不全面
基于語(yǔ)料庫(kù)的現(xiàn)代漢語(yǔ)研究涉及到的領(lǐng)域很多,然而主要集中于詞匯,語(yǔ)法,語(yǔ)義等方面的研究,且利用的標(biāo)注語(yǔ)料庫(kù)、靜態(tài)語(yǔ)料庫(kù)、自建語(yǔ)料庫(kù)等,都是書(shū)面語(yǔ)語(yǔ)料庫(kù),基于口語(yǔ)語(yǔ)料庫(kù)的研究甚少。因此,我國(guó)基于語(yǔ)料庫(kù)的研究并不全面,有很多研究角度有待開(kāi)發(fā)。在跨學(xué)科研究領(lǐng)域仍有很長(zhǎng)的路要去探索。
四、結(jié)論
2000年以來(lái)的基于語(yǔ)料庫(kù)的現(xiàn)代漢語(yǔ)研究方法,對(duì)于現(xiàn)代漢語(yǔ)有著較為全面廣泛的研究,在歸納分析現(xiàn)代漢語(yǔ)的詞匯、語(yǔ)法等方面的發(fā)展演變規(guī)律發(fā)揮著重要作用,進(jìn)而推動(dòng)了現(xiàn)代漢語(yǔ)的發(fā)展。同時(shí),這一方法在現(xiàn)代漢語(yǔ)研究中的廣泛應(yīng)用,對(duì)于完善現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)的建設(shè)也有著重要意義。但是,這一研究方法也存在著語(yǔ)料庫(kù)規(guī)模不夠大,技術(shù)不成熟,研究方向不全面等問(wèn)題。因此,擴(kuò)大語(yǔ)料庫(kù)規(guī)模,完善研究技術(shù),拓寬研究領(lǐng)域,是推進(jìn)我國(guó)語(yǔ)料庫(kù)發(fā)展的重要方向。
參考文獻(xiàn):
[1]黃昌寧,李涓子.語(yǔ)料庫(kù)語(yǔ)言學(xué)[M].商務(wù)印書(shū)館,2002.
[2]亢世勇.現(xiàn)代漢語(yǔ)謂賓動(dòng)詞分類統(tǒng)計(jì)研究[J].遼寧師范大學(xué)學(xué)報(bào)(社科版),2000(1).