亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        留學生漢語中介語語料庫的建立與研究

        2015-04-29 02:09:17王蘭
        現(xiàn)代語文 2015年1期

        摘 要:留學生漢語中介語語料庫的建立與研究,有三個意義:第一,有利于對外漢語教學的多方面研究。第二,有利于全方位探索漢語學習者的語言特征。第三,有利于對外漢語的學科建設。漢語中介語語料庫建設的基本思路如下:1.搜集各階段留學生漢語學習者的語料,同時完整記錄每份語料的背景信息,以及語料提供者的詳細信息。2.對語料進行加工,包括偏誤標注和基礎標注。3.將加工后的語料分別存入錯別字語料庫和語句語料庫這兩個子庫。每個子庫包括生語料庫、熟語料庫、背景信息庫三個部分。漢語中介語語料庫建設的構(gòu)成原則有三個:第一,語料的真實性原則;第二,語料的平衡性原則;第三,信息的完備性原則。

        關鍵詞:漢語 ?中介語 ?語料庫

        中介語(interlanguage)概念由美國學者Selinker于1969年提出,并于1972年在論文《中介語》中進行了詳細論述。Selinker認為中介語是由不同心理過程生成的規(guī)則構(gòu)成的一個單一語言系統(tǒng)。中介語理論在20世紀80年代引入我國,對對外漢語教學及相關研究領域發(fā)展產(chǎn)生了極大的促進作用。1984年,魯健驥先生發(fā)表論文首次引進“偏誤”與“中介語”兩個概念,并分析了外國人學習漢語過程中產(chǎn)生語音偏誤的五個原因。魯先生認為,中介語是學習外語的人在學習過程中對于目的語規(guī)律所做的不正確的歸納和推論而產(chǎn)生的一個語言系統(tǒng),這個語言系統(tǒng)既不同于學習者的母語,也區(qū)別于他所學的目的語(魯健驥,1984)。[1]魯先生的文章在國內(nèi)學術界產(chǎn)生了巨大影響,此后越來越多的學者開始這方面的研究,使得偏誤分析和中介語研究成為第二語言習得研究領域的主要課題。

        一、漢語中介語語料庫建立與研究的現(xiàn)狀

        語料是中介語研究的基本材料。而語料的搜集與整理是很繁瑣費時的工作,因此,中介語語料庫的建設就成了研究者迫切所需。針對留學生漢語學習的語料庫是漢語中介語語料庫,它是為研究母語非漢語的學生在學習漢語過程中的中介語現(xiàn)象而制作的專門用途語料庫。按照國家標準術語的界定,語料庫是“……文本的有序集合。各種分類、檢索、綜合、比較的基礎?!盵2]

        隨著計算機技術的發(fā)展,我國在20世紀90年代開始有了漢語中介語語料庫的建設。第一個建成的是北京語言學院的漢語中介語語料庫檢索系統(tǒng),該語料庫對語料進行了分詞和詞性標注(儲誠志、陳小荷,1993),收入經(jīng)過處理的語料約104萬字,內(nèi)容為成篇成段的漢語作文或練習材料。隨后有暨南大學留學生漢語中介語語料庫,規(guī)模達300萬字;中山大學留學生中介語語料庫,初期收入語料近70萬字(張舸,2008),該語料庫收錄2003年以來留學生的字句練習和作文資料,前期主要進行字、詞、句加工標注,后期重點建設漢字偏誤標注的語料庫,目前語料總數(shù)達到約200萬字(張瑞朋,2013);南京師范大學外國學生漢語中介語偏誤信息語料庫,收入作文、練習90萬字(周文華、肖奚強,2009);北京語言大學的HSK動態(tài)作文語料庫,2006年建成,該語料庫從1992年至2005年期間兩萬多份留學生HSK考試試卷中選取了11569名考生的HSK作文答卷,總計424萬字,并從字、詞、句、篇以及標點符號等角度進行全面標注,是目前漢語中介語語料庫中規(guī)模最大的語料庫。上述語料庫除北京語言大學的HSK動態(tài)作文語料庫面向全社會開放外,其他都只供內(nèi)部人員使用,外人難以了解實情,因而造成了這樣的局面:一方面許多人想用卻沒法用,另一方面語料庫的使用率并不高(任海波,2010)。而面對日益增長的對外漢語教學的多方面研究需求,已建成的五個漢語中介語語料庫數(shù)量相對較少(張寶林,2010),遠遠不能滿足需求。

        目前我們能見到并且可以使用的僅有北京語言大學的HSK動態(tài)作文語料庫。該語料庫只收入?yún)⒓痈叩瓤荚嚨目忌魑模ǔ?、中等沒有寫作考試),因而只能對高級階段學習者的習得情況進行橫向的斷面考察,而無法對初級和中級學習者的情況進行考察,更無法對學習者的整個學習過程進行縱向的全面研究。其次,HSK動態(tài)作文語料庫只收入文本語料,偏重的是詞匯和句法的偏誤標注,對漢字偏誤處理較簡單,對于漢字習得的研究也缺乏足夠的語料支持。再次,HSK動態(tài)作文語料庫雖然從字、詞、句、篇以及標點符號等角度對全部語料中存在的偏誤現(xiàn)象進行了標注,但對語料中正確的語言現(xiàn)象并未標注,也就是只有偏誤標注而沒有基礎標注,這就會導致研究中出現(xiàn)某些尷尬的現(xiàn)象,比如查到了學生的偏誤,卻查不到學生相應的正確語言表達,從而使得全面考察學習者的語言習得情況受到較大限制。上述問題都給基于語料庫的相關研究造成了諸多困難。

        鑒于此,我們設想建立昆明理工大學的留學生漢語中介語語料庫。首先,本語料庫基于本校教育在線網(wǎng)絡教育平臺建立,面向全社會開放,以便資源共享。其次,本語料庫將收入零起點、初級、中級、高級各階段漢語學習者的語料。再次,本語料庫將分設錯別字語料庫和語句語料庫。雖然目前我校留學生規(guī)模尚不足以支持建立大型語料庫,但我們可以先建立一個語料種類齊全,樣本較多,標注內(nèi)容較全面,能夠反映各階段漢語學習者的學習過程與特征的小型語料庫。將來如果條件成熟,本語料庫可以與其他兄弟院?;驀掖笮驼Z料庫實行對接,甚至共建語料庫網(wǎng),充分實現(xiàn)資源共享。

        二、漢語中介語語料庫建立與研究的意義

        漢語中介語的研究離不開大量真實的中介語語料。而真實的留學生漢語中介語語料的收集,必須依據(jù)中介語理論和語料庫語言學理論,建立專門針對留學生的漢語中介語語料庫?;诶ッ骼砉ご髮W留學生的規(guī)模,我們考慮建立針對本校留學生的小型漢語中介語語料庫。漢語中介語語料庫的建立與研究,有如下幾點意義:

        第一,有利于對外漢語教學的多方面研究。本語料庫是母語非漢語的漢語學習者學習漢語的中介語語料庫,依據(jù)本語料庫可以對留學生漢語學習者的大量語言樣本進行量化分析,為漢語中介語研究、漢語二語習得研究以及偏誤分析提供真實可靠的語言數(shù)據(jù)。運用本語料庫中的錯別字、語句等語料來考察漢語學習者在漢字、詞匯、語法等方面的習得情況,可以進行對外漢語教學的多方面研究,例如漢語中介語研究、第二語言習得研究、對外漢語教學理論研究、對外漢語教材研究、漢語水平考試研究以及從中介語的角度來進行漢語本體研究等等。

        第二,有利于全方位探索漢語學習者的語言特征。漢語中介語語料庫將比較全面地搜集能反映漢語學習者的各種語言屬性、個體特征等信息,如姓名、性別、年齡、國籍、是否華裔、第一語言、文化程度、入校時間、年級、學習階段、學習漢語年限、語料提供時間、語料來源、語料類別等,為全方位探索漢語學習者的語言特征提供參考依據(jù)。

        第三,有利于對外漢語的學科建設。漢語中介語語料庫的建設可以為用戶提供一個考察和研究的基礎平臺,為對外漢語教學和研究服務。將漢語中介語語料庫引入對外漢語教學課堂,可以使學生和教師得到豐富的語料資源和在線幫助,增加了漢語學習中的“真實材料”和真實交際,提高了學習的交互性?;诶ッ骼砉ご髮W教育在線網(wǎng)絡教育平臺,我們還能夠以此平臺為依托,加強與外界的溝通,促進昆明理工大學對外漢語學科建設的發(fā)展。

        三、漢語中介語語料庫建設思路與構(gòu)成原則

        漢語中介語語料庫建設的主要應用是為對外漢語教學的一線教師提供教學和研究服務,以及為外國留學生的漢語學習提供輔助,因此語料庫的建設主要注重以上兩類服務對象的應用需求?;诖朔N要求,我們對漢語中介語語料庫的建設做了以下幾點考慮:

        第一,漢語中介語語料庫是為研究母語非漢語的學生在學習漢語過程中的中介語現(xiàn)象而制作的專門用途語料庫。

        第二,中介語語料包括書面語料和口語語料,由于技術層面的原因,口語語料的搜集與加工操作比較困難,我們現(xiàn)階段只搜集書面語料。

        第三,對語料的加工采取人工為主,計算機為輔的方式。具體操作是,在語料分詞和詞性標注上采用人機互助標注方式,其他語言學方面的標注則采用人工標注方式。

        漢語中介語語料庫建設的基本思路如下:

        (一)搜集零起點、初級、中級、高級、本科各階段留學生漢語學習者的語料,包括來自平時作業(yè)、練習、測試和學期課程考試、漢語水平考試的不同語料。同時完整記錄每份語料的背景信息,以及語料提供者的詳細信息,如姓名、性別、年齡、國籍、是否華裔、第一語言、文化程度、入校時間、年級、學習階段、學習漢語年限、語料提供時間、語料來源、語料類別等。

        (二)對語料進行加工,包括偏誤標注和基礎標注。

        (三)將加工后的語料分別存入錯別字語料庫和語句語料庫這兩個子庫。每個子庫包括生語料庫、熟語料庫、背景信息庫三個部分。生語料庫用于存放掃描的原始圖片或語音材料,熟語料庫用于存放經(jīng)過各種加工處理的語料,背景信息庫用于存放學習者背景信息和語料信息。

        漢語中介語語料庫建設的構(gòu)成原則有如下三個:

        第一,語料的真實性原則。語料的真實性主要包含兩個層面的意義,第一個方面是指語言水平的真實性,即收入的語料必須是外國留學生真實語言能力的產(chǎn)物,是留學生漢語學習過程中的原始語料,能真正反映留學生的語言水平狀況。因此,我們選取的語料主要是留學生在課堂上的隨堂練習、課后作業(yè)、平時測驗和期末考試、漢語水平考試的材料。語料的真實性第二個方面是指語料的忠實性,即收入的語料必須不經(jīng)任何篡改,要忠于語料的原始面貌,并且對字、詞、標點、格式等錯誤均原樣錄入,后期對語料的標注也要盡量忠實于其本來面貌,對錯誤的保存和呈現(xiàn)要能體現(xiàn)出錯誤特征。

        第二,語料的平衡性原則。語料的平衡性主要包含兩個層面的意義,第一個方面是指語料來源國別的平衡性,即提供語料的留學生國別比例要盡量平衡。目前來華留學生中學習漢語的韓國、日本學生數(shù)量遠超其他國家,因而,國內(nèi)最大規(guī)模的語料庫,北京語言大學HSK動態(tài)作文語料庫收錄韓、日學生語料數(shù)最多。盡管如此,語料庫收錄語料仍然要確保在一定規(guī)模下達到一種分布的平衡。昆明理工大學留學生以東南亞國家,如泰國、老撾、越南等國居多,歐美和非洲國家相對較少。因此,我們在選取語料時要盡量考慮保持語料來源國別的平衡性。語料的平衡性第二個方面是指層級的平衡性,即提供語料的留學生漢語水平分類要合適、比例要盡量平衡。我們對留學生漢語水平的分類按學生自然班級進行,包括“零起點、初級Ⅰ、初級Ⅱ、中級Ⅰ、中級Ⅱ、高級Ⅰ、高級Ⅱ、本科上、本科下”這九個層級。盡管隨著學生的漢語水平不同和語言產(chǎn)出能力不同,所能提供的語料數(shù)量肯定不等,但在選取語料時我們也要盡量考慮保持各層級比例的平衡性。

        第三,信息的完備性原則。信息的完備性主要包含兩個層面的意義,一方面是指提供語料的留學生背景信息要全面完整。我們在語料庫建設過程中,注重搜集能反映漢語學習者的各種語言屬性、個體特征等信息,包括如姓名、性別、年齡、國籍、是否華裔、第一語言、文化程度、入校時間、年級、學習階段、學習漢語年限、語料提供時間、語料來源、語料類別等,力求能全面覆蓋語料提供者背景各方面細節(jié)。另一方面是指搜集的語料信息要全面完整,即保證每一篇語料能和學生背景信息一一對應,并且最好能隨著學生階段和水平的提升采集跟蹤信息,使語料信息能覆蓋語料提供者的各個學習階段和不同水平層次。

        四、結(jié) 語

        留學生漢語中介語語料庫的建立是個復雜的工程,要建成大規(guī)模的語料庫,需要一個大型團隊的力量和各方面技術的支撐。限于人員和技術的因素,目前我們僅能建設小型的漢語中介語語料庫。但是在語料庫的建設過程中,我們積累了寶貴的經(jīng)驗,對于整個語料庫的建設流程有了深切的親身體驗,對于語料庫建設過程中的一些困難與問題也有了體會和克服的經(jīng)驗,盡管由于能力所限,我們只能說是在語料庫建設方面做了一些嘗試,但這些有益的嘗試為今后的進一步研究打下了良好的基礎。

        (本文為昆明理工大學人才培養(yǎng)基金項目,項目編號[KKZ3201253001]。)

        參考文獻:

        [1]魯健驥.中介語理論與外國人學習漢語的語音偏誤分析[J].語言

        教學與研究,1984,(3).

        [2]國家標準總局.漢語信息處理詞匯01部分:基本術語[M].北京:中

        國標準出版社,1997.

        [3]儲誠志,陳小荷.建立“漢語中介語語料庫系統(tǒng)”的基本設想

        [J].世界漢語教學,1993,(3).

        [4]張舸.程度副詞結(jié)構(gòu)作狀語、謂語和補語的語義及句法差異[A].

        “第二屆中青年學者漢語教學國際學術研討會”資料匯編[C].北京,2008.

        [5]張瑞朋.三個漢語中介語語料庫若干問題的比較研究[J].語言文

        字應用,2013,(3).

        [6]周文華.基于語料庫的外國學生兼語句習得研究[J].語言教學與

        研究,2009,(3).

        [7]任海波.關于中介語語料庫建設的幾點思考——以“HSK動態(tài)作

        文語料庫”為例[J].語言教學與研究,2010,(6).

        [8]張寶林.漢語中介語語料庫建設的現(xiàn)狀與對策[J].語言文字應用,

        2010,(3).

        (王蘭 云南昆明 昆明理工大學國際文化交流學院 650093)

        国产欧美日韩一区二区三区| 中文亚洲第一av一区二区| 久久99精品久久只有精品| 欧美丰满老熟妇aaaa片| 午夜成人精品福利网站在线观看| 国产精品高清视亚洲乱码有限公司 | 老熟女重囗味hdxx70星空| 亚洲欧美日韩综合中文字幕| 91麻豆精品一区二区三区| 人妻少妇满足中文字幕| 中文字幕aⅴ人妻一区二区| 亚洲综合无码| 国产三级av在线播放| 日本不卡在线视频二区三区| 中出人妻中文字幕无码| 高h小月被几个老头调教 | 蜜臀av一区二区| 东京热无码人妻中文字幕| 你懂的视频网站亚洲视频| 久久久久成人精品无码中文字幕 | 亚洲中字幕日产av片在线| 国产av电影区二区三区曰曰骚网| 毛片av在线播放亚洲av网站| 亚洲精品久久麻豆蜜桃| 亚洲色大成网站www永久| 欧美孕妇xxxx做受欧美88| 国产v精品成人免费视频400条| 国产精品久久久黄色片| 曰韩无码无遮挡a级毛片| 欧美亚洲国产精品久久高清| 国产在线一区二区视频免费观看| 亚洲精品综合久久中文字幕| 久久精品成人一区二区三区| 亚州少妇无套内射激情视频| 亚洲日日噜噜噜夜夜爽爽| 久久精品亚洲熟女av麻豆| 在线观看热码亚洲av每日更新 | 亚洲av无码一区二区三区观看| 日韩欧美国产自由二区| 白色白色白色在线观看视频| 成人免费无码大片a毛片抽搐色欲|