石立國 李 娥(武昌工學(xué)院 湖北 武漢 430065)
VOICE語料庫中隱性同意用語的調(diào)查研究
石立國李娥(武昌工學(xué)院湖北武漢430065)
作為一種全新研究方法,語料庫語言學(xué)開辟了一個新的研究領(lǐng)域,它的數(shù)據(jù)有別于以往研究中采用的直覺數(shù)據(jù),而是對實際使用的語言事實進(jìn)行定性定量的描寫和概括,使研究更科學(xué)和準(zhǔn)確。本文以VOICE語料庫為研究對象,數(shù)據(jù)統(tǒng)計語料庫的構(gòu)成和數(shù)據(jù)庫中的同意用語的收錄情況,提取出同意用語和隱性同意用語的全部數(shù)據(jù)并加以分類。
語料庫VOICE隱性同意用語
語料庫(corpus)即存放語言材料的倉庫或數(shù)據(jù)庫。這一術(shù)語常被語言學(xué)家用于描述大量的可用于語言研究的自然出現(xiàn)的語言數(shù)據(jù)。構(gòu)成數(shù)據(jù)庫的樣本可以是書面語也可以是口語,或是兩者相結(jié)合。語料庫語言學(xué)在20世紀(jì)50年代喬姆斯基(Chomsky)主義以前就誕生了,Boas和隨后的許多結(jié)構(gòu)主義語言學(xué)家從事過基于語料庫的科學(xué)研究。隨著計算機(jī)科技和網(wǎng)絡(luò)技術(shù)的發(fā)展和應(yīng)用,基于網(wǎng)絡(luò)的電子數(shù)據(jù)語料庫開始蓬勃發(fā)展起來,由于計算機(jī)具有無可比擬的儲存和檢索能力,開始出現(xiàn)了超大規(guī)模的網(wǎng)絡(luò)語料庫,詞庫收錄高達(dá)一億詞次,同時各種詞庫檢索軟件也相繼出現(xiàn),供使用者更好地利用數(shù)據(jù)庫開展相關(guān)學(xué)術(shù)研究。
1996年,為了慶賀語料庫語言學(xué)的主要奠基人和倡導(dǎo)者里奇(Leech)六十誕辰,托馬斯(Thomas)等人啟動編纂關(guān)于語料庫語言學(xué)的研究論文集時說,“語料庫語言學(xué)已經(jīng)成為語言研究的主流?;谡Z料庫的研究不再是計算機(jī)專家的獨有領(lǐng)域,它正在對語言研究的許多領(lǐng)域產(chǎn)生愈來愈大的影響”。近年來,有關(guān)語料庫語言學(xué)的相關(guān)研究在逐年增加。
以喬姆斯基轉(zhuǎn)換生成語法的起始為節(jié)點,可將語料庫語言學(xué)的發(fā)展分為三個階段,即早期階段(20世紀(jì)50年代中期以前)、喬姆斯基的轉(zhuǎn)換生成語法階段(20世紀(jì)50年代中-70年代)和復(fù)蘇階段(20世紀(jì)80年代以后)。早期的語料庫語言學(xué)被廣泛應(yīng)用于研究語言習(xí)得、方言、語義、句法和音系研究。喬姆斯基的《句法理論》(1957)及隨后的一系列研究成果的發(fā)表從根本上革新了語料庫語言學(xué)的早期研究狀況,完全否定了當(dāng)時以笛卡爾經(jīng)驗主義為基礎(chǔ)建立的數(shù)據(jù)庫。20世紀(jì)80年代以來,語料庫語言學(xué)在相對沉寂了近20年后,開始復(fù)蘇,并得到迅速發(fā)展。表1為國外語料庫的發(fā)展?fàn)顩r。
表1
筆者選取了2006-2015年發(fā)表在國內(nèi)10種外語類核心期刊上的關(guān)于語料庫的科研文章共366篇,這些期刊具有權(quán)威性、前沿性,研究成果能夠代表國內(nèi)外語界對語料庫的研究現(xiàn)狀。參考Biber(2000)和Kennedy(2000)提出的兩種分類方法,結(jié)合國內(nèi)研究的實際,將研究領(lǐng)域分為五大類:詞匯、語法、語篇、語用與話語分析和語域變異。以“語料庫”和上述五種分類為關(guān)鍵詞在中國知網(wǎng)上進(jìn)行檢索,結(jié)果見表2。
表2
相比較李偉霞、宋岳禮(2010)針對上述期刊(1999-2009)所統(tǒng)計出的174篇文章來看,國內(nèi)關(guān)于語料庫的研究已經(jīng)有了長足的發(fā)展。對于語料庫在詞匯方面的應(yīng)用研究仍是重點,這與現(xiàn)代計算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展密切相關(guān),緊隨其后的是針對語法和語篇的研究,針對語用和語域變異的研究相對較少。因此,本文以不斷更新中的VOICE語料庫為研究對象,調(diào)查語用及話語分析中的同意用語。
VOICE(Vienna-OxfordInternationalCorpus ofEnglish)語料庫由奧地利維也納大學(xué)英語及應(yīng)用語言學(xué)教授BarbaraSeidlhofer創(chuàng)立,該語料庫記錄了以英語為母語的使用者之間的自然、非腳本的面對面語言活動,致力于提供一個語言學(xué)平臺將英語作為混合語。于2013年1月更新的VOICE2.0版本容量達(dá)到1,023,196詞次,可以通過登錄網(wǎng)址http://www.univie.ac.at/voice/,免費使用,該語料庫還在不斷更新豐富中。
本文所選VOICE語料庫的數(shù)據(jù)來自五個語音類型。他們分別是交談(con)、討論(wsd)、會議(mtg)、小組討論(wgd))和專題討論(sed)。在這些語音類型中,交談類詞條有11,435個,討論類詞條有8991個,會議22,113個,小組討論5,621個,專題討論4,173個,共計52,333個詞條,分別來自14個語音文檔,語音錄音總時長為5小時20分11秒。
表3
我們對VOICE的5個子語料庫中的同意用語進(jìn)行數(shù)據(jù)采集,并分別篩選出同意用語和隱性同意用語。表3中列出所選擇的14個語音文檔中的同意用語和隱性同意用語的詞頻。括號中的數(shù)字為隱性同意用語詞頻。
從表3中我們發(fā)現(xiàn),yeah作為同意用語和隱性同意用語共出現(xiàn)913次,其中可以確認(rèn)為是同意用語的復(fù)現(xiàn)次數(shù)為439次,而且可以確定,Yeah在交談中出現(xiàn)頻率最高,很明顯yeah是最常見的表達(dá)贊同的用語。此外,排名前4的同意用語分別是:yeah,yes,right,exactly。
通過以上分析可以看出,國內(nèi)關(guān)于基于語料庫的研究已經(jīng)取得了很大的發(fā)展,但是對于話語分析還有待深入研究。對于母語為漢語的英語學(xué)習(xí)者而言,學(xué)習(xí)者接觸最多的就是各類英語教材,因此教材編寫的質(zhì)量,教材中的素材能否反映出以英語為母語的國家的人們在實際生活、工作和學(xué)習(xí)中使用英語的狀況就顯得十分重要。本文針對VOICE數(shù)據(jù)庫中同意用語和隱性同意用語的調(diào)查結(jié)果可為教材編寫者在編寫、修訂和完善教材時作參考,真正讓學(xué)生成為研究的受益者。
【責(zé)任編輯:桂靜】
[1]BiberD,ConradS&ReppenR.CorpusLinguistics:InvestigatingLanguageStructureandUse[M].北京:外語教學(xué)與研究出版社,2000.
[2]‘CorpusDescription’.TheVienna-OxfordInternationalCorpusofEnglish,accessedon10April2011,http://www.univie.ac.at/ voice/page/corpus_description
[3]KennedyG.AnIntroductiontoCorpusLinguistics[M].北京:外語教學(xué)與研究出版社,2000.
[4]何中清,彭宣維.英語語料庫研究綜述:回顧、現(xiàn)狀與展望[J].外語教學(xué),2011(1).
[5]李偉霞,宋岳禮.近十年國內(nèi)外語語料庫實證研究回顧與思考[J].中國電力教育,2010(35).
[6]梁燕,馮友,程良坤.近十年我國語料庫實證研究綜述[J].解放軍外國語學(xué)院學(xué)報,2004(6).
【中國分類號】G64A
1008-8784(2016)03-100-3
2016-03-20
本文系湖北省教育科學(xué)“十二五”規(guī)劃課題2013年度立項課題“基于Voice語料庫的大學(xué)英語教材中同意用語研究”(項目編號:2013B208)的研究成果。
石立國(1984—),男,江蘇邳州人,武昌工學(xué)院講師,研究方向:跨文化交際、英語教學(xué)法;李娥(1982—),女,湖南岳陽人,碩士,武昌工學(xué)院外國語學(xué)院講師,研究方向:英語教育、英美文學(xué)。