亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        建立“語言教材素材庫”的設(shè)想

        2008-01-01 00:00:00
        現(xiàn)代語文 2008年3期

        摘要:語言教材編寫中素材收集的工作量大而繁瑣,本文提出了使用計算機管理素材的設(shè)想。設(shè)計了教材素材庫的基本結(jié)構(gòu),并給出了具體可實現(xiàn)的建議:使用XML文件格式,Oracle或Access數(shù)據(jù)庫來管理素材。

        關(guān)鍵詞:語言教材 素材 數(shù)據(jù)庫

        一、引言

        教材在語言教學(xué)中的的地位很重要,編寫一套優(yōu)秀教材的工作量是非常大的。在教材編寫中要兼顧結(jié)構(gòu)、功能、文化等各種要素。其中,有些工作如收集整理素材比較繁瑣。根據(jù)李泉(2002)統(tǒng)計,“教材的數(shù)量以異乎尋常的速度增長,尤其是20世紀(jì)90年代以來。迄今已有數(shù)百種各類教材問世”,“從1980年算起到2000年近20年的時間,已經(jīng)出版的各類教材應(yīng)該有400~500種?!睆慕滩氖褂蒙峡?,要選擇一本合適的教材是一件十分困難的事,總體上人們對現(xiàn)行教材不滿意的聲音遠(yuǎn)高于對教材滿意的聲音”(王金銘2004)。這其中的原因有很多,教材內(nèi)容方面的缺陷是重要的原因之一。孫德坤(1996)指出,教材編寫必須考慮兩個因素:一是內(nèi)容選擇上必須以學(xué)習(xí)者的需求、學(xué)習(xí)者的當(dāng)前水平為依據(jù);二是內(nèi)容的安排必須以學(xué)習(xí)者的學(xué)習(xí)特點、學(xué)習(xí)過程為依據(jù)。另外,傳統(tǒng)的教材編寫周期長,更新慢,難以適應(yīng)時代的需要。如何解決這些問題,我們認(rèn)為需要改進(jìn)工作方式。以往編寫語言教材,少數(shù)課文由編者直接編寫,多數(shù)課文來自現(xiàn)有的已出版作品。如何在浩如煙海的作品中選擇課文是一件很困難的事情,受制于編者的閱讀量,選擇作品有很大隨機性。我們認(rèn)為使用計算機來管理素材將會是一個有效的解決問題的方法。趙金銘(2004)論述了建設(shè)對外漢語教材素材庫的作用與意義,他指出國內(nèi)已有一些單位開始建設(shè)教材素材庫。但是我們還沒有看到相關(guān)的文獻(xiàn)報告。

        二、教材素材庫概述

        教材素材庫與為普通語言學(xué)研究而設(shè)計的語料庫不同。素材庫根據(jù)編寫教材的實際需要來設(shè)計,是積累素材和選擇素材的一種便捷的工具,可以取代原有的卡片式工作方法。編寫語言教材通常需要課文、練習(xí)、注釋等文字材料以及圖片、音頻、視頻等多媒體資料。一部分資料是現(xiàn)成的,還有一部分資料是在編寫過程中創(chuàng)作的,比如針對課文中某個詞所做的注釋或者課文朗讀音頻。我們這里的素材主要是指現(xiàn)成的資料。首先我們通過各種途徑收集素材,然后對素材加工整理,把素材加入素材庫中,然后在需要的時候在素材庫中檢索符合我們指定條件的素材。比如設(shè)定檢索條件為內(nèi)容關(guān)于旅游的、難度為中級的文章,系統(tǒng)可以給出素材庫中所有符合條件的文章。

        素材庫系統(tǒng)具有以下特點:

        1.素材類型多樣,屬性豐富

        在素材庫中可以加入文本(課文、練習(xí))、圖片、錄音、錄象等。所以素材都具有關(guān)鍵詞、來源和版權(quán)信息。課文的屬性還應(yīng)當(dāng)包括以下屬性:題材(經(jīng)濟、旅游、問候、就餐等)、體裁(對話、小說、散文、議論文等)、來源、原文、語法點、文化項目、功能項目、難度等級等。錄音和錄像素材有以下屬性:關(guān)鍵詞、時間長度、來源、配文等。

        2.檢索方便。以上屬性字段都可以作為檢索條件。

        3.引入比較成熟的中文信息處理技術(shù),部分工作可以實現(xiàn)完全或部分自動處理,比如分詞。同時提供一個友好的用戶界面,能夠方便地加工素材和更新素材。

        4.素材庫系統(tǒng)各模塊相互獨立,系統(tǒng)具有良好的開放性和可維護(hù)性。

        三、素材庫系統(tǒng)基本結(jié)構(gòu)

        (一)素材處理模塊

        素材處理包括素材登錄、素材屬性登錄、語料加工等幾個部分。下面分別敘述這幾個部分的功能。

        1.素材登錄

        素材登錄就是將原始素材輸入進(jìn)計算機。文字型的素材可以通過以下幾種方式輸入計算機:鍵盤輸入、直接提交電子文檔、光學(xué)掃描后進(jìn)行文字自動識別、語音輸入。

        2.素材屬性登錄

        在素材登錄的同時登錄素材的屬性信息。

        3.語料加工

        語料加工主要針對文字型素材。針對語言教學(xué)的需要,利用中文信息處理技術(shù)進(jìn)行必要的加工。比如分詞、詞性標(biāo)注(多義詞消歧)、難度分析等。在分詞過程中生成該素材的字表、詞表。有些素材屬性可以由機器自動分析獲得,比如使用文本自動分類的技術(shù)登錄題材屬性。準(zhǔn)確率通??梢赃_(dá)到70%,如果需要比較高的準(zhǔn)確率,那么自動分析后的結(jié)果仍然需要人工校對。

        (二)數(shù)據(jù)庫

        數(shù)據(jù)庫存放素材和對素材加工處理的結(jié)果。

        (三)用戶檢索模塊

        這部分模塊是面向用戶的,提供一個用戶界面,接受用戶的檢索條件,輸出符合條件的檢索結(jié)果。首先選擇素材類型,不同的素材類型屬性不同,檢索入口也不同。所有素材都具有關(guān)鍵詞、來源兩個檢索入口。

        課文類型檢索的檢索入口比較多??梢栽O(shè)置題材、體裁、難度、文化項目、功能項目、語法項目的檢索條件。為了方便用戶在教材編寫或再版時替換課文,用戶可以提供一個詞表,系統(tǒng)檢索出用詞最接近這個詞表或包含這個詞表的文章。

        圖片、錄音、錄像主要使用關(guān)鍵詞檢索,檢索符合要求的素材。錄音、錄像素材在登錄時應(yīng)該同時登錄配文,對配文的加工處理和檢索類似于課文。

        四、系統(tǒng)實現(xiàn)

        1.數(shù)據(jù)庫系統(tǒng)概述

        人們借助計算機進(jìn)行數(shù)據(jù)管理是近30年的事。在應(yīng)用需求的推動下,在計算機硬件、軟件發(fā)展的基礎(chǔ)上,數(shù)據(jù)管理技術(shù)經(jīng)歷了人工管理、文件系統(tǒng)、數(shù)據(jù)庫管理三個階段。

        用數(shù)據(jù)庫系統(tǒng)來管理數(shù)據(jù)比文件系統(tǒng)有明顯的優(yōu)點,主要有以下幾個方面:

        (1)數(shù)據(jù)結(jié)構(gòu)化

        數(shù)據(jù)庫系統(tǒng)實現(xiàn)整體數(shù)據(jù)的結(jié)構(gòu)化,不同的記錄之間可以通過相同的數(shù)據(jù)項建立聯(lián)系。存取數(shù)據(jù)的方式也很靈活,可以存取數(shù)據(jù)庫中的某一個數(shù)據(jù)項、一組數(shù)據(jù)項、一個記錄或一組記錄。

        (2)數(shù)據(jù)的共享性高,冗余度低,易擴充

        數(shù)據(jù)可以被多個用戶、多個應(yīng)用共享使用。隨著計算機網(wǎng)絡(luò)快速發(fā)展和普及,這一特點尤為重要。

        (3)數(shù)據(jù)由DBMS(數(shù)據(jù)庫管理系統(tǒng))統(tǒng)一管理和控制

        DBMS提供以下幾方面的數(shù)據(jù)控制功能:數(shù)據(jù)安全性保護(hù)、數(shù)據(jù)完整性檢查、多用戶使用時進(jìn)行并發(fā)控制、數(shù)據(jù)庫恢復(fù)。

        目前應(yīng)用的數(shù)據(jù)庫系統(tǒng)主要是關(guān)系型數(shù)據(jù)庫,直觀地看,數(shù)據(jù)庫由許多二維表格組成。隨著XML技術(shù)的發(fā)展和流行,XML數(shù)據(jù)庫也開始發(fā)展并廣泛應(yīng)用。現(xiàn)有的關(guān)系型數(shù)據(jù)庫都在一定程序上支持XML。

        2.XML概述

        國外建設(shè)的英語語料庫通常采用純文本格式,使用ASCII編碼。我國大陸建設(shè)的漢語語料庫也多使用純文本格式,使用GB碼。語料需要標(biāo)注,具體實現(xiàn)時有多種方法。一種方法是使用自定義的格式,一種方法是使用SGML、XML、TEI等標(biāo)準(zhǔn)化的置標(biāo)語言。國外的文本語料庫都已普遍采用了SGML標(biāo)準(zhǔn)(馮志偉 1999)。XML是SGML的一種應(yīng)用。使用標(biāo)準(zhǔn)化置標(biāo)語言的優(yōu)點是:標(biāo)注類型比較容易擴充和修改;文檔格式容易轉(zhuǎn)換,方便不同語料庫的共享;有一些免費的開發(fā)工具可以使用。

        3.素材庫的具體實現(xiàn)方式

        孫德坤(1996)論證了建設(shè)課文素材庫的可行性和選材標(biāo)準(zhǔn)。但是他沒有給出具體的實現(xiàn)形式。我們打算采用比較成熟的關(guān)系型數(shù)據(jù)庫系統(tǒng)來建設(shè)素材庫。原因如下:

        (1)素材庫包含有文本、錄音、圖片等多種類型。現(xiàn)有的關(guān)系型數(shù)據(jù)庫系統(tǒng)都有豐富的數(shù)據(jù)類型。

        (2)關(guān)系型數(shù)據(jù)庫技術(shù)比較成熟,檢索效率也比較高。相當(dāng)多的任務(wù)可以由DBMS完成,不需要另外編寫代碼,開發(fā)速度快,成本低。

        目前使用比較廣泛的關(guān)系型數(shù)據(jù)庫有Oracle,Visual Foxpro,Access 等。如果需要網(wǎng)絡(luò)應(yīng)用,比如需要通過網(wǎng)絡(luò)多人共同建設(shè)使用素材庫,那么需要選擇Oracle,MYSQL等支持網(wǎng)絡(luò)應(yīng)用的數(shù)據(jù)庫系統(tǒng)。如果只是單機使用,可以選擇Access。

        關(guān)系模型如下:(關(guān)系的碼用下劃線標(biāo)出)

        素材(素材號,類型,來源,版權(quán))

        課文(素材號,原文,難度,長度,題材,體裁)

        詞匯(素材號,詞語)

        多媒體素材(素材號,時長,配文)

        配文(素材號,原文,難度,長度)

        關(guān)鍵詞(素材號,關(guān)鍵詞)

        語法項目(素材號,語法點)

        文化項目(素材號,文化描述詞)

        另外根據(jù)檢索的需要,需要建立多個索引。需要使用VB、VC++等開發(fā)工具設(shè)計用戶界面等。這里不詳細(xì)展開。

        五、結(jié)語

        建設(shè)素材語料庫的軟件系統(tǒng)比較容易,但是充實素材庫將是一個長期的過程。素材語料庫的優(yōu)勢在于可以快捷方便地管理大量素材,如果素材庫規(guī)模小,難以看出計算機管理素材的優(yōu)勢,這意味著需要轉(zhuǎn)變教材編寫中素材管理的工作方式。

        參考文獻(xiàn):

        [1]李泉.近20年對外漢語教材編寫和研究的基本情況述評[J].語言文字應(yīng)用,2002,(3).

        [2]薩師煊,王 珊.數(shù)據(jù)庫系統(tǒng)概論(第3版)[M].北京:高等教育出版社,2000,(2).

        [3]孫德坤.組合式——教材編寫的另一種思路[J].世界漢語教學(xué),1996,(1).

        [4]王建新.計算機語料庫的建設(shè)和應(yīng)用[M].北京:清華大學(xué)出版社,2005,(9).

        [5]趙金銘.跨越與會通——論對外漢語教材研究與開發(fā)[J].語言文字應(yīng)用,2004,(2).

        (陳鋒,南京師范大學(xué)文學(xué)院)

        久久精品re| 久久无码高潮喷水抽搐| 又爽又黄又无遮挡网站| 国产成人无码av在线播放dvd| 欧美成人精品福利在线视频| 在线亚洲精品一区二区三区| 国产极品裸体av在线激情网| 精品无码国产一区二区三区av| 韩国19禁主播深夜福利视频| 国语精品视频在线观看不卡| 区一区二区三免费观看视频| 中文字幕日韩欧美一区二区三区| 成人欧美一区二区三区a片| 欧美黑人xxxx性高清版| 国产专区亚洲专区久久| 欧美激情综合色综合啪啪五月 | 亚洲xx视频| 国产熟女自拍av网站| 亚洲av永久无码天堂网小说区| 色一乱一伦一图一区二区精品 | 日产乱码一二三区别免费l| 日本少妇被黑人xxxxx| 麻豆AⅤ精品无码一区二区| 亚洲中文字幕免费精品| 成人丝袜激情一区二区| 在线播放无码高潮的视频| 欧洲人体一区二区三区| 亚洲av色av成人噜噜噜| 99精品国产一区二区三区不卡 | 一级二级三一片内射视频| 女人无遮挡裸交性做爰| 亚洲av无码av制服丝袜在线 | 未满十八18禁止免费无码网站| 18成人片黄网站www| 国产精品久久中文字幕第一页| 久久久精品国产三级精品 | 免费99精品国产自在在线| 亚洲精品成人av一区二区| 黑丝美腿国产在线观看| 樱桃视频影院在线播放| 国产一区a|