■張 馳/揚州大學(xué)
“corpus(語料庫)”來自于拉丁語,與法語單詞“corps(身體)”為同一詞源。根據(jù)《新編小羅貝爾法法詞典》的定義,“‘語料庫’在語言學(xué)上意為‘針對某一語言現(xiàn)象研究而匯集的有限的話語集合’”。
美國布朗大學(xué)于1961年建成了當今最早的機讀語料庫——布朗語料庫。在此期間,法國的語料庫也迅猛發(fā)展起來了。法國最早使用機器對詞匯進行編譯的語料庫是五十年代初期由貝納爾·克馬達在法國貝桑松建造的。
1971年至1995年間,法國全國科研中心決定召集語言學(xué)家和詞典編纂專家,編纂一部旨在反映20世紀法國語言研究水平的大型語文詞典——“法語寶典”,共計十六卷,每卷約一千四百頁,收錄九萬詞條。該大型詞典是世界上最早運用計算機技術(shù)編成的。
1992年,法國語言研究所為輔助了“法語寶典”的編纂工作,也為了給查詢作品原文和摘錄例句提供便利,建立了法國最大的語庫——法蘭西語庫。這個大型語料庫的建立經(jīng)過幾十年不斷地完善,目前已建成了三個資料庫,分別是:文本庫、詞語庫和書目庫。
但在國內(nèi),法語語料庫語言學(xué)還是一門相對年輕而陌生的學(xué)科,相關(guān)的研究非常少,更沒有規(guī)模稍大的法語語料庫。在中國知網(wǎng)上搜索主題為“法語+語料庫”的論文僅27篇;而搜索關(guān)鍵詞為“法語+語料庫”的論文,僅有3篇,分別為:《基于語料庫的法語語言能力評價》、《產(chǎn)出導(dǎo)向法在詞匯教學(xué)中的研究與實踐——以漢法語物量詞為例》、《一類基于平行語料統(tǒng)計的漢法機譯解決方案》。因此,法語教學(xué)面臨的問題是如何建立用于課堂教學(xué)目的的語料庫。自建法語新聞?wù)Z料庫不僅可以充分考慮教學(xué)對象的需求;還能適應(yīng)新聞的發(fā)展,及時更新。何安平教授也指出“建設(shè)大型語料庫已經(jīng)不再是困難的事,接下來的是如何建立各種有地域、語體乃至語篇特色的大型語料庫……?!?/p>
法語新聞?wù)Z料庫的建立應(yīng)依托于主流法語新聞報刊,能反映真實的法語世界。新聞?wù)Z言相較于文學(xué)語言能最快速、最忠實地展現(xiàn)法語語言發(fā)展的潮流,尤其法語詞匯的變化。新聞報道的主題涉及各個領(lǐng)域,具有極大的研究價值,是最好的語料來源。為輔助法語新聞教學(xué),可建立一個小型的法語新聞?wù)Z料庫,為判斷學(xué)生的語言水平提供研究工具。法語新聞?wù)Z料庫的建立要遵循以下原則:
采集語料是語料庫建立的第一步,也是最為重要的一步,因此,語料庫的采集和篩選工作要遵守一個基本原則:語料應(yīng)具有代表性。由于本次建立語料庫的目的是檢測法語學(xué)生的法語新聞領(lǐng)域的語言能力,所以要選取法語報刊。因此,本次抽樣的范圍來自以下法語主流報刊:《世界報》、《費加羅報》、《法蘭西晚報》、《解放報》、《巴黎人報》;主要周刊如《快報》、《觀點》、《新觀察家》、《巴黎競賽畫報》等。法語新聞題材廣泛,涉及到眾多的領(lǐng)域,為保證語料具有較高的代表性,在建設(shè)語料庫時,主要采用了具有代表性的主流報刊上的頭條新聞,并將其分為政治、經(jīng)濟、歷史、地理、文化、科技、社會和娛樂共8個領(lǐng)域。再通過分層抽樣和等距抽樣的方式確保語料具有代表性。
新聞是一種時效性很強的語言,每年都會出現(xiàn)大量的新詞。因此,為適應(yīng)語言的變化,保證語料庫的代表性,必須不斷地更新,每個季度需重新收集新的語料,每年刪除已失去語言活力的語料,確保該語料庫具有使用價值。
AntConc3.3.4w等分析統(tǒng)計軟件是目前大家普遍使用的數(shù)據(jù)分析軟件,適用于法語語料庫的研究。通過此軟件,將新建的小型法語新聞?wù)Z料庫進行法語詞頻統(tǒng)計,總結(jié)出法語新聞中常用的詞匯和搭配習(xí)慣等,建立詞匯表。之后,將詞匯表中的詞匯和固定搭配按使用頻率和難易程度分為四個等級。在分析學(xué)生語言能力時,可參考詞級分布率判斷學(xué)生的語言能力。
該語料庫可從以下幾個方面輔助法語教學(xué):
(1)詞匯教學(xué):將統(tǒng)計得到的詞匯表逐級教給學(xué)生,擴大學(xué)生在新聞領(lǐng)域的詞匯量。
履職活動在“家”中。定期舉行住泰全國人大代表小組和市直省人大代表小組代表經(jīng)驗交流會、履職研討會、專題座談會,為代表相互溝通交流搭建平臺;建立代表履職檔案,進一步增強代表履行職責(zé)的責(zé)任感和使命感。
(2)語篇教學(xué):通過軟件分析,找出語言使用較好、題材具有代表性的新聞,作為法語新聞教學(xué)的素材。
(3)評估學(xué)生:通過對比學(xué)生的新聞稿和分級詞匯表,客觀且準確地評估學(xué)生法語新聞的撰寫能力。
為評估學(xué)生的法語新聞撰寫能力,利用通過自建小型法語語料庫得到的分級詞匯表和計算機程序提供的詞匯總量、實際詞匯量、詞頻和詞級分布率等信息,來分析學(xué)生的語言能力。為準確定位來自不同班級學(xué)生的法語水平和同一學(xué)生的語言能力提高情況,可通過橫向和縱向兩種組合方式,對相同的學(xué)生或班級在不同時期所寫的法語新聞稿進行比較、以及不同的學(xué)生或班級在同時期所寫的法語新聞稿,對新聞稿中使用的詞匯進行測量,評價學(xué)生掌握和運用法語詞匯的能力。
在研究過程中,僅僅只考慮詞匯總量、實際詞匯量、詞頻和詞級分布率等信息是不夠的,為保證詞匯量測量的信度和效度,在采集學(xué)生的新聞稿時,還應(yīng)統(tǒng)一新聞稿的題材、體裁、字數(shù)等詞匯量以外的因素。以下是幾個研究實例:
實例1:兩屆學(xué)生同一時期的新聞稿對比
兩組學(xué)生各8名,新聞稿各40篇,分別選自14級和15級學(xué)生大三下學(xué)期所寫的新聞稿。從實際詞匯量分析,15級學(xué)生新聞稿中的一級詞匯分布率比14級低1%,二級詞匯分布率比14級高2%;而三級四級詞匯分布率,兩組學(xué)生同為7%和10%。由此推測,關(guān)于已習(xí)得的新聞詞匯,14級和15級學(xué)生在他們大三下學(xué)期的水平是持平的。
實例2:同班同學(xué)同時期的新聞稿對比
A同學(xué)和B同學(xué)同時15級法語班的學(xué)生,在大三下學(xué)期各寫了5篇新聞稿。A的新聞稿不僅詞匯總量高于B,而卻實際詞匯量也高于前者,A新聞稿中的一級詞匯分布率比B低7%,二級詞匯分布率比B高1%;而三級四級詞匯比B高2%和3%。由此推測,關(guān)于已習(xí)得的新聞詞匯,A和比B水平略高。
實例3:同班同學(xué)不同時期的新聞稿對比
樣本是15級20名學(xué)生分別在17年5月和17年11月的法語新聞社撰寫的。第二篇新聞稿(1711)的詞匯總量明顯高于第一篇(1705);相反1705的實際詞匯量卻比1711高;而且二級詞匯和四級詞匯分布率比1711高出1%和2%。因此,可以得出結(jié)論:同班同學(xué)不同時期的在新聞領(lǐng)域的語言能力是不同的。
實例4:同一學(xué)生不同時期的新聞稿對比
樣本是15級B同學(xué)每三個月所寫的新聞稿。這三篇新聞稿的二級、三級和四級詞匯分布率都在逐篇遞增,而一級詞匯分布率卻逐漸降低,這些數(shù)據(jù)表明同學(xué)法語新聞稿的撰寫能力在9個月中是持續(xù)增長的。
綜上所述,我們可以得出以下結(jié)論:
(1)詞匯量:尤其是實際詞匯量是語言能力的代表性因素之一,如果詞匯量越大,那么就表明語言水平越高。
(2)詞級分布率:學(xué)生對不同詞級詞匯的使用情況基本能反映出學(xué)生的詞匯習(xí)得能力,通常高級詞匯使用率高的學(xué)生擁有和掌握了更多的活躍詞匯。
(3)分析統(tǒng)計軟件:法語詞匯的分析統(tǒng)計軟件為法語水平的量化提供了便捷、客觀的工具,利用這些軟件可以對法語新聞教學(xué)做定期監(jiān)測,了解學(xué)生法語新聞稿撰寫能力的提高情況,甚至可以有針對性的進行法語新聞教學(xué),查漏補缺。
英國著名語言學(xué)家、語料庫語言學(xué)專家約翰·辛克萊曾經(jīng)說過:“語料庫語言學(xué)已經(jīng)成為英語語言學(xué)的重要方面……不僅如此,語料庫也為語言教學(xué)帶來許多的思想和方法。”而這一闡釋也同樣適用于法語語料庫,建立法語新聞?wù)Z料庫有利于教師及時掌握學(xué)生的水平變化,在教學(xué)中有的放矢的提高學(xué)生的語言能力。