亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        瀕危少數(shù)民族語言的檔案編制工作探究

        2017-03-27 21:35:24饒敏
        科教導(dǎo)刊 2017年4期
        關(guān)鍵詞:數(shù)字化

        饒敏

        摘 要 本文基于筆者長(zhǎng)期的語言田野調(diào)查實(shí)踐,以四川省甘孜州康定縣麥崩鄉(xiāng)的少數(shù)民族瀕危藏緬語貴瓊語為例,結(jié)合瀕危語言研究的最新理論,探討瀕危少數(shù)民族語言的檔案編制(language documentation)工作。本文將細(xì)化瀕危語言檔案編制工作的五個(gè)步驟,既口語語料的錄制、口語語料的數(shù)字化、口語語料的分析、口語語料的留存及口語語料的傳播,并探究這五步驟中所涉及的問題及應(yīng)對(duì)。

        關(guān)鍵詞 瀕危語言 語言檔案 貴瓊語 錄制 數(shù)字化

        中圖分類號(hào):D633 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/j.cnki.kjdks.2017.02.066

        Abstract This paper takes Guiqiong language as example for discussing language documentation of endangered minority languages. Guiqiong is a Tibeto-Burman language of Dar.rtse.mdo County of Dkar.mdzes Prefecture, in Sichuan province, China. We have chosen to study Guiqiong spoken in Maibeng Canton. There are five procedures in language documentation. In this article, we will discuss measures and strategies about record, digitalization, analyze, archive and diffusion of Guiqiong language.

        Keywords endangered language; language documentation; Guiqiong; record; digitalization

        瀕危語言的消失是當(dāng)今世界語言發(fā)展演變的一個(gè)大趨勢(shì),是對(duì)語言多樣性及文化多樣性的一種嚴(yán)重破壞,是人類文化財(cái)富的重要損失。國(guó)際語言學(xué)界從20世紀(jì)60年代起開始關(guān)注瀕危語言問題,從80年代末起對(duì)瀕危語言的研究開始不斷升溫。直至2003年2月,一部支持語言保護(hù)和搶救重要文獻(xiàn)《語言活力與語言瀕?!芬约啊缎袆?dòng)計(jì)劃建議書》終于在法國(guó)巴黎聯(lián)合國(guó)教科文組織總部舉行的瀕危語言專家會(huì)議上通過。其后在聯(lián)合國(guó)教科文組織2006 年的《保護(hù)非物質(zhì)文化遺產(chǎn)公約》的鼓勵(lì)下,催生了一系列關(guān)于保護(hù)及留存非物質(zhì)文化遺產(chǎn)的研究工作,其中包括對(duì)瀕危語言的保護(hù)及留存,也就是本文要探究的瀕危語言檔案編制工作(language documentation)。

        我國(guó)是一個(gè)多民族的語言資源及其豐富的國(guó)家,記錄并留存瀕危語言的原生態(tài)面貌和信息,既是當(dāng)務(wù)之急的任務(wù)更是一個(gè)長(zhǎng)期且有意義的研究方向。我們?cè)陂L(zhǎng)期的田野調(diào)查實(shí)踐和理論研究中發(fā)現(xiàn),貴瓊語作為一門瀕危的少數(shù)民族語言,在研究及保護(hù)搶救方面急需展開相關(guān)工作。本文將首先介紹作者前期對(duì)貴瓊語的田野調(diào)查工作,然后再以此為基礎(chǔ),結(jié)合瀕危語言研究的最新理論,通過瀕危語言檔案編制工作的五個(gè)步驟,既口語語料的錄制、口語語料的數(shù)字化、口語語料的分析、口語語料的留存及口語語料的傳播,來探究這五步驟中所涉及的問題及其應(yīng)對(duì)。

        1貴瓊語簡(jiǎn)介

        貴瓊語在學(xué)術(shù)界普遍被認(rèn)為是屬于藏緬語族羌語支的一門語言(孫宏開 1983; 黃布凡 1991)。說貴瓊語的人主要分布在四川省西部地區(qū),這一區(qū)域被稱為“川西民族走廊”(孫宏開 1983)或“藏彝走廊”(費(fèi)孝通 1982),其間分布著藏、彝、羌等幾十個(gè)少數(shù)民族。確切地說,說貴瓊語的人主要分布在甘孜藏族自治州康定縣境內(nèi)大渡河沿岸的四鄉(xiāng)一鎮(zhèn),即時(shí)濟(jì)鄉(xiāng)、舍聯(lián)鄉(xiāng)、前溪鄉(xiāng)、麥崩鄉(xiāng)和姑咱鎮(zhèn),如圖1所示。

        語言學(xué)家們從上個(gè)世紀(jì)80年代起開始對(duì)貴瓊語進(jìn)行研究,但是能看到的相關(guān)文獻(xiàn)也為數(shù)不多。孫宏開(1983)在《六江流域的民族語言及其系屬分類》中談到了貴瓊語的語音系統(tǒng)及語法概況;宋伶俐(2011)出版專著《貴瓊語研究》以及姜麗(2015)《A grammar of Guiqiong》都對(duì)貴瓊語的語音及語法進(jìn)行了描述。

        2貴瓊語的田野調(diào)查概況

        貴瓊語是一門口頭語言,所以必須通過數(shù)據(jù)采錄從而建立起可供學(xué)習(xí)和研究這門語言的素材。采集數(shù)據(jù)的工作主要通過田野調(diào)查來實(shí)現(xiàn)。除此之外,如果條件允許的話也通過電話調(diào)查的方式來進(jìn)行補(bǔ)充調(diào)查,這時(shí)主要涉及的就是一些核對(duì)的工作和補(bǔ)充信息的獲得。

        2.1 前期調(diào)查

        我們從2006年-2016年先后深入康定縣故咱鎮(zhèn)、麥崩鄉(xiāng)、前溪鄉(xiāng)等地做貴瓊語的田野調(diào)查,共計(jì)八次,累計(jì)超過15個(gè)月,主要采集的是數(shù)據(jù)是詞匯、長(zhǎng)篇傳統(tǒng)故事錄音及部分山歌、酒曲子等。

        2006年的4月:我們開始了首次對(duì)貴瓊語的田野調(diào)查,調(diào)查為期一個(gè)月。首次調(diào)查主要以社會(huì)語言學(xué)的調(diào)查為主,也下到了不同的鄉(xiāng)鎮(zhèn)進(jìn)行走訪調(diào)查,調(diào)查對(duì)象的選擇主要參考變化了以下幾個(gè)因素:性別、年齡、居住、對(duì)藏語的熟知度以及對(duì)漢語的熟知度。這次的調(diào)查主要使我們獲得了大量的社會(huì)語言學(xué)的數(shù)據(jù),從而可以研究語言的使用現(xiàn)狀及其瀕危狀態(tài)。同時(shí)我們也記錄了一些詞匯,開始熟悉并學(xué)習(xí)這門口傳語言,對(duì)它的音位系統(tǒng)也有了自己初步的認(rèn)識(shí)。

        2007年1-4月:我們又深入魚通地區(qū),對(duì)貴瓊語做了三個(gè)月的田野調(diào)查。這次的調(diào)查主要在故咱鎮(zhèn)進(jìn)行。我們用一個(gè)1500詞的詞表,對(duì)不同年齡、不同性別、不同居住地及不同藏漢語認(rèn)知度的發(fā)音人進(jìn)行了分別的調(diào)查、記錄和核查。在這次的調(diào)查中,我們還采集記錄了一位貴瓊/西南官話雙語的78歲阿婆唱的兩首酒曲子和10首山歌。本次調(diào)查的發(fā)音人大部分來自麥崩鄉(xiāng),其他的還有來自前溪鄉(xiāng)的,剩下的均來自姑咱鎮(zhèn)。

        2008-2015年間:我們又先后又對(duì)貴瓊語做過六次田野調(diào)查。這些調(diào)查主要是有征對(duì)性地和主要發(fā)音人合作,以記錄、轉(zhuǎn)寫和翻譯長(zhǎng)篇故事語料為主。通過自然語料來研究并整理貴瓊語的語法系統(tǒng)。對(duì)發(fā)現(xiàn)的問題,也會(huì)通過啟發(fā)式的直接問詢調(diào)查(elicitation)來進(jìn)行核對(duì)和補(bǔ)充。另外也有專門為研究聲調(diào)而進(jìn)行的專項(xiàng)實(shí)驗(yàn)調(diào)查。

        2.2 主要調(diào)查方法

        我們?cè)谔镆罢{(diào)查過程中所使用的方法隨著我們對(duì)該語言的認(rèn)知程度以及調(diào)查內(nèi)容的不同而變換。

        被動(dòng)的啟發(fā)式調(diào)查法(Controlled elicitation):利用這樣的所謂被動(dòng)的啟發(fā)式調(diào)查法,我們可以進(jìn)行以下的田野調(diào)查:比如為了收集貴瓊語的詞匯、獨(dú)立的句子我們會(huì)使用到詞表或者調(diào)查問卷CASSQ(由中國(guó)社會(huì)科學(xué)院民族與人類學(xué)研究所所編著的《中國(guó)語言資料有聲數(shù)據(jù)庫(kù)》問卷);為了調(diào)查貴瓊語的時(shí)-式-體,我們會(huì)采用Dahl (1985) Tense-Mood-Aspect Questionnaire (時(shí)-式-體問卷TMAQ)。另外我們?cè)谔镆罢{(diào)查中還會(huì)用到刺激物(stimuli)通常是照片、視頻、音頻等來誘使發(fā)音人說出我們想要的語音材料。

        半被動(dòng)的啟發(fā)式調(diào)查法(Semi-Controlled elicitation):這個(gè)調(diào)查方法主要用來收集和分析長(zhǎng)篇傳統(tǒng)故事語料,或者是即時(shí)的對(duì)話語料等。有的時(shí)候我們也會(huì)兼容并用被動(dòng)的啟發(fā)式調(diào)查法和半被動(dòng)的啟發(fā)式調(diào)查法。

        3貴瓊語的語言檔案編制工作

        為了能做到一個(gè)好的語言檔案的編制(language documentation),Austin (2006:89) 將語言檔案編制工作劃分為主要的五個(gè)步驟。我們將以貴瓊語為例,在接下來的五個(gè)小節(jié)中講述我們?cè)谶@五個(gè)步驟中的所做與缺失: 錄制、數(shù)字化、分析、留存以及傳播。

        3.1 貴瓊語的口語語料的錄制(record)

        語言檔案編制的第一步是數(shù)據(jù)的采錄。這個(gè)步驟必須要求使用高質(zhì)量的錄音設(shè)備、高質(zhì)量的話筒、監(jiān)聽耳機(jī)以及存儲(chǔ)設(shè)備。錄制的過程我們一直嚴(yán)格恪守以下兩條:(1)永遠(yuǎn)不錄制壓縮格式例如mp3格式的音頻文件。(2)不直接將數(shù)據(jù)錄制在計(jì)算機(jī)的硬盤上,以免意外丟失數(shù)據(jù)。

        我們?cè)谫F瓊語的口語語料采集中,使用的錄音設(shè)備隨著技術(shù)的不斷更新也在不斷變化,堅(jiān)持的原則一直是不錄制壓縮格式的音頻數(shù)據(jù)。目前我們一直使用的是索尼的PCM D100錄音棒(如圖2所示)。

        這款設(shè)備因具有便攜且錄音質(zhì)量高的特點(diǎn),所以一直為我們所用。其特點(diǎn)如下:

        (1)支持1-bit audio DSD錄音格式,音質(zhì)自然流暢、貼近原聲,與SACD格式相當(dāng)。忠實(shí)錄制原聲且音質(zhì)十分清晰,錄音接近原聲且空間感優(yōu)于線性PCM。

        (2)支持192kHz/24bit無損壓縮線性PCM錄音格式。清晰度優(yōu)于錄音的標(biāo)準(zhǔn)格式96kHz/24bit。

        (3)其100dB信噪比模式,降低內(nèi)部噪聲,錄制細(xì)小聲音時(shí)能達(dá)到高清晰度。

        (4)采用DSD(直接數(shù)字流編碼)編碼技術(shù)。DSD是一種前沿編碼技術(shù),常用于SACD。眼下,CD、DVD和電腦聲音等數(shù)字音頻使用的仍是PCM格式,而DSD是一種與PCM截然不同的數(shù)字音頻格式。不同大小的音頻信號(hào)用1-bit數(shù)字脈沖集中表示,音質(zhì)得到進(jìn)一步提高。DSD格式消除了傳統(tǒng)PCM格式所具有的“數(shù)字感”。能讓人們?cè)跀?shù)字技術(shù)下也能聽到模擬技術(shù)才還原的音質(zhì)質(zhì)感。兼具模擬錄音的流暢度和數(shù)字錄音的清晰度。

        (5)配備新開發(fā)的大直徑定向麥克風(fēng),針對(duì)DSD錄音格式進(jìn)行優(yōu)化。新開發(fā)的15毫米直徑麥克風(fēng)采用駐極體電容麥克風(fēng),具有出色的信噪比,可將鳥叫聲等細(xì)小聲音如實(shí)錄制下來,且不帶多余噪聲。通過細(xì)心設(shè)計(jì)麥克風(fēng)組件的安裝位置甚至細(xì)節(jié)的間隙部分,麥克風(fēng)的內(nèi)部空間得到優(yōu)化且達(dá)到約31dB/Pa 1KHz的高靈敏度。超過20kHz的頻率特性,可以有效發(fā)揮DSD錄音格式的優(yōu)勢(shì)??赏ㄟ^改變麥克風(fēng)角度來適應(yīng)采集聲音所在的區(qū)域。例如,當(dāng)麥克風(fēng)距離聲源較近時(shí),如單人表演或兩至三人的會(huì)議場(chǎng)合,可選擇“X-Y位置”來錄制音頻,如此便能錄制出富有空間感的自然立體聲;對(duì)于管弦樂隊(duì)、合唱團(tuán)或其他有很多人表演的大型場(chǎng)所,錄音時(shí)可選擇“寬立體聲位置”,如此便能采集到具有廣闊空間感的高保真飽滿聲音(如圖3所示)。

        (6)REC音量旋鈕:此裝置可同時(shí)調(diào)節(jié)左聲道和右聲道的錄制音量??梢酝ㄟ^小幅調(diào)整左右聲道的差異實(shí)現(xiàn)錄音音量水平的調(diào)整。

        (7)內(nèi)置內(nèi)存最多可錄制約10小時(shí)50分鐘的DSD格式音頻,可將錄制的音頻復(fù)制到存儲(chǔ)卡中并立刻與親友分享。還可使用SD XC存儲(chǔ)卡(48GB 或以上容量)。

        3.2 貴瓊語的口語語料的數(shù)字化(digitalization)

        口語語料的數(shù)字化涉及到將所有語言材料轉(zhuǎn)化成信息化的電子版本。這里面除了音頻及視頻資料外,還包括我們?cè)谔镆罢{(diào)查過程中所做的所有手寫的記錄。在數(shù)字化保存這些數(shù)據(jù)時(shí)我們尤其注意到要將一些重要的信息和電子文件聯(lián)系在一起。這些重要的信息叫做元數(shù)據(jù)“metatdata”。關(guān)于語料的元數(shù)據(jù)格式存在有一些國(guó)際標(biāo)準(zhǔn),我們主要參照的是OLAC(Open Language Archive Community)和 IMDI(ISLE Metadata Initiative) 。

        對(duì)于我們的每個(gè)錄音,我們都至少做到了提及以下信息(Himmelmann 2006:11-12):

        (1)錄制章節(jié)的題目,這樣可以方便我們?cè)谡Z料庫(kù)查找識(shí)別這段音頻的對(duì)應(yīng)部分。

        (2)錄制的地點(diǎn)和日期。

        (3)錄音人的名字和其他在場(chǎng)人姓名(不管其是否參與了對(duì)話)。

        (4)錄制人姓名及所使用的器材設(shè)備。

        (5)關(guān)于錄音質(zhì)量的指示(錄音環(huán)境、發(fā)音人的能力水平等)。

        (6)對(duì)錄制內(nèi)容的簡(jiǎn)短描述:題目,話語類型——對(duì)話、獨(dú)白等。

        (7)涉及同一內(nèi)容的不同媒質(zhì)間的聯(lián)系也一并提及出來(比如這段錄音對(duì)應(yīng)的是哪段筆記、哪段對(duì)應(yīng)這個(gè)錄音的文本)。

        (8)關(guān)于這段錄音的詳細(xì)的可使用性accessibility。

        (9)發(fā)音人的社會(huì)語言學(xué)特性(性別、年齡、出生地、所說語言、受教育程度等)。

        (10)如果記錄轉(zhuǎn)寫錄音的人不是錄制者本人還會(huì)提及到轉(zhuǎn)寫人的社會(huì)語言學(xué)特性、轉(zhuǎn)寫的日期和地點(diǎn)( Austin 200:94)。

        3.3 貴瓊語的口語語料的分析(analyze)

        語料分析這部分是最復(fù)雜的,也是最難以預(yù)估所需花費(fèi)時(shí)間的部分。Schultze-Berndt (2006?: 216) 估計(jì)過1分鐘的錄音根據(jù)所想要達(dá)到的分析的詳盡程度所花費(fèi)的時(shí)間能從1小時(shí)跨度到150小時(shí)。為了更好地做語料分析,業(yè)內(nèi)的標(biāo)準(zhǔn)操作是將語料文本以行間注釋(interlineation)的形式來進(jìn)行呈現(xiàn)。比如一個(gè)貴瓊語的例子(表1):

        (1)分析數(shù)據(jù)的第一行是音頻數(shù)據(jù)的轉(zhuǎn)寫記錄。轉(zhuǎn)寫要盡可能忠實(shí)地反映錄音里面所講的,包括停頓、錯(cuò)誤、糾正、重復(fù)和其他的音韻細(xì)節(jié)。我們對(duì)貴瓊語的轉(zhuǎn)寫采用IPA國(guó)際音標(biāo)并遵循貴瓊語的音位系統(tǒng)來書寫。這樣更便于文本被更多的人看懂并會(huì)讀。記錄的文本我們也會(huì)拿給發(fā)音人看。

        (2)第二行是語素分解。按照預(yù)先分析的最小語義單位來進(jìn)行劃分,這樣的劃分能分出最小的語義單元(比如組合詞的不同語素)、詞干及其前后綴等。這一行和第三行注釋行(gloss)是緊密聯(lián)系的,因?yàn)樗鼪Q定了我們所有需要加注釋的單元。關(guān)于注釋學(xué)界存在有很多慣例,比如The Leipzig Glossing Rules (Bickel, Comerie & Haspelmath 2004), Lehmann (2005)。我們?cè)诘谌胁捎玫木褪荰he Leipzig Glossing Rules的注釋規(guī)則,這樣更便于資料的流通和易懂性。

        (3)第四-六行是翻譯。一般我們會(huì)選擇發(fā)音人的所在國(guó)家的官方語言首先來進(jìn)行翻譯,然后再將其翻譯成一門廣泛被識(shí)別的語言比如英語,這樣可以讓全世界的人都有機(jī)會(huì)能讀懂。翻譯我們會(huì)先給個(gè)字到字的翻譯,第二個(gè)翻譯才給出按照官方語言慣用表達(dá)翻譯的流暢版。這樣能讓意思更易于理解。

        有不少可以用于語料分析的軟件,可以讓我們?cè)谝粋€(gè)界面里實(shí)現(xiàn)所有信息的整合。歷史最久和最被人使用的多的是Toolbox。這也正是我們?cè)谫F瓊語的調(diào)查和研究中一直采用的。Toolbox可以允許我們實(shí)現(xiàn)文本編輯和對(duì)語料進(jìn)行行間注釋同時(shí)能自建一個(gè)詞庫(kù)。但是這個(gè)軟件沒法讓我們實(shí)現(xiàn)分析、注釋與音頻、視頻文件的對(duì)齊。由荷蘭的心理語言學(xué)學(xué)院Max Planck開發(fā)的軟件ELAN(EUDICO Linguistic Annotator)能實(shí)現(xiàn)直接對(duì)視頻及音頻文件的注釋。Toolbox和ELAN兩個(gè)軟件都可以實(shí)現(xiàn)文件輸出成xml格式,這是很多進(jìn)行語言檔案編制的機(jī)構(gòu)都很推行的文檔格式。

        3.4 貴瓊語的口語語料的留存(archive)

        傳統(tǒng)的存檔主要集中于具體物件的留存,比如歷史文化、古籍的收藏與保存?,F(xiàn)代的技術(shù)已經(jīng)開始顛覆這個(gè)領(lǐng)域的傳統(tǒng)概念。許多數(shù)字檔案館應(yīng)運(yùn)而生,使我們的數(shù)據(jù)能實(shí)現(xiàn)更長(zhǎng)期的留存。所有的語言檔案都應(yīng)該提交數(shù)字檔案庫(kù),首先實(shí)現(xiàn)短期應(yīng)用,比如制作語言教材或者是信息再添加補(bǔ)充,以便最終實(shí)現(xiàn)長(zhǎng)期保存,讓這些語言的錄音可供大家使用即使是這門語言不再有發(fā)音者。目前比較有名的語料庫(kù):

        (1)The Berkeley Linguistic Archives, University of California, Berkeley

        (2)AILLA (Archive of the Indigenous Languages of Latin America), The University of Texas

        (3)ELAR (Endangered Languages Archive), University of London

        (4)PARADISEC (Pacific And Regional Archive for Digital Sources in Endangered Cultures),The University of Sydney

        (5)les archives du LACITO (Langues et Civilisations €?Tradition Orale) du Centre national de recherche scientifique en France. (法國(guó)口傳語言及文化實(shí)驗(yàn)室的數(shù)據(jù)庫(kù))

        (6)First Voices Language Archive,Canada

        然后這些數(shù)據(jù)庫(kù)都沒有實(shí)現(xiàn)我們之前提到的開放存取。經(jīng)常的狀況是,鑒于各種安全原因而無法通過互聯(lián)網(wǎng)進(jìn)入這些數(shù)據(jù)庫(kù)。其實(shí)現(xiàn)在的安全手段可以實(shí)現(xiàn)數(shù)據(jù)庫(kù)訪問權(quán)限的分級(jí),有了安全的保證也就能更大程度地開放類似的語言數(shù)據(jù)庫(kù)以便更多人使用。比如ELAR就有四種訪問權(quán)限的設(shè)置:

        (1)全公開。

        (2)僅對(duì)研究人員及說本語言的群體成員開放。

        (3)僅對(duì)說本語言的群體成員開放。

        (4)請(qǐng)求授權(quán)才能進(jìn)入。

        我們國(guó)家2015年開始啟動(dòng)的語保工程,在我國(guó)提供了語言資源庫(kù)存的可能。在這樣大政策的背景下,我們自己的田野調(diào)查數(shù)據(jù)也應(yīng)當(dāng)盡可能地按照規(guī)范化來留存,以便日后可以更兼容地融入一些大型的數(shù)據(jù)庫(kù)來進(jìn)行保護(hù),實(shí)現(xiàn)資源共享。我們目前在貴瓊語的語語料留存中做到了遵循以下的原則:

        (1)使用.XML(Extensible Markup Language)(可擴(kuò)展標(biāo)記語言)文件形式來留存??蓴U(kuò)展標(biāo)記語言XML是一種簡(jiǎn)單的數(shù)據(jù)存儲(chǔ)語言,使用一系列簡(jiǎn)單的標(biāo)記描述數(shù)據(jù),而這些標(biāo)記可以用方便的方式建立,雖然XML占用的空間比二進(jìn)制數(shù)據(jù)要占用更多的空間,但XML極其簡(jiǎn)單易于掌握和使用。

        (2)使用Unicode的字體,以避免不識(shí)別出現(xiàn)亂碼的情況。

        (3)視頻文件按照無壓縮的 MPEG2形式保存。

        (4)音頻文件按照wav格式(44kHz, 16bits)保存。

        (5)所有的田野調(diào)查紙質(zhì)筆記也會(huì)保存。

        (6)所有錄制有數(shù)據(jù)的CD\DVD及mini-disc也將被保存,多形式多介質(zhì)的保存錄制資料能最大程度地降低信息丟失的可能性。

        3.5 貴瓊語的口語語料的傳播(diffusion)

        口傳語言語料收集留存后,其傳播也應(yīng)當(dāng)是我們少數(shù)民族語言的檔案編制工作中的一個(gè)不可忽視的環(huán)節(jié)。傳統(tǒng)的語言語料傳播的手段有出版專著、語法書、字典、詞匯集、論文集等,雖然也很有用,但是這些出版的作品無法讓人身臨其境地感受到語言的真實(shí)性?,F(xiàn)在借助科技的手段,我們可以實(shí)現(xiàn)如下的語料傳播模式:(1)提供可交互式語料資源,界面做的簡(jiǎn)介、易懂、易查找使用,這樣使用者不會(huì)被大量數(shù)據(jù)所瞬間吞噬而迷失方向。(2)實(shí)現(xiàn)語料的網(wǎng)上傳播。將語料放置于互聯(lián)網(wǎng)上,即可方便語言學(xué)家的查閱,也可利于大眾的了解。但是對(duì)于不方便上網(wǎng)的來自村落發(fā)音人來說,還是應(yīng)該為其提供紙質(zhì)的版本、多媒體媒介的材料(CD-ROM, DVD-ROM)(Csato & Nathan 2003; Morey 2010)。關(guān)于貴瓊語的語料傳播,目前我們所做到的有出版發(fā)表相關(guān)文章,將語料以CD-ROM, DVD-ROM等形式回饋說貴瓊語言群體。

        4結(jié)論

        一個(gè)好的語言研究的素材或者資料庫(kù)應(yīng)該具備以下的特征(Woodbury, 2003:12-13) : 多樣(diverse)—語料應(yīng)該多樣化,比如發(fā)音人的不同年齡和性別的變化、話語形式的多樣性(獨(dú)白、敘述、對(duì)話、多人交談等);大量(large) –現(xiàn)代技術(shù)已經(jīng)能夠允許我們儲(chǔ)存量大的驚人的數(shù)據(jù)了;持續(xù)、共享、充滿機(jī)會(huì) (onging, distributed, and opportunistic)–能夠讓參與者/發(fā)音者連續(xù)地在已有數(shù)據(jù)庫(kù)里加入新數(shù)據(jù); 透明易懂(transparent)– 注釋清晰且至少要翻譯成一門大眾語言;可保存的、可攜帶的 (preservable, ethical and portable)– 錄制數(shù)據(jù)的形式要便于日后隨著技術(shù)的發(fā)展轉(zhuǎn)變成新的形式實(shí)現(xiàn)可保存課攜帶;和情理(ethical) – 著作權(quán)和當(dāng)?shù)卣Z言群體的意愿都要同時(shí)兼顧。針對(duì)這些特征檢視我們所做過的工作,會(huì)發(fā)現(xiàn)還有很多的有待改進(jìn)的地方,比如缺少大量視頻數(shù)據(jù)的采集。音頻數(shù)據(jù)的信息含量要遠(yuǎn)遠(yuǎn)低于視頻數(shù)據(jù)。視頻數(shù)據(jù)能夠讓我們捕捉到語言使用的更多維信息,但是也隨之帶來了處理和分析的復(fù)雜性。對(duì)視頻的分析處理涉及到復(fù)雜軟件的使用,而且視頻資料的存儲(chǔ)需要很大的空間。不過,組合并同步錄制音頻和視頻的方法依然是語言檔案編制所希望的中最理想的方法。在以后的研究調(diào)查中,我們盡最大可能地?cái)U(kuò)大口語交流的數(shù)據(jù)錄制的種類。隨著技術(shù)的發(fā)展,數(shù)據(jù)容量再大也不再是問題。能獲取的語言資料容量越大,越能為我們提供更多的關(guān)于語言本身、語言使用及語言發(fā)音者相關(guān)的信息。

        瀕危少數(shù)民族語言的檔案編制工作是一項(xiàng)急需我們?nèi)ブ值墓ぷ?,同時(shí)也是一項(xiàng)紛繁復(fù)雜的工作。相關(guān)的工作者和研究者務(wù)必要在整個(gè)語言檔案編制的過程中采取相應(yīng)的措施以確保做好一個(gè)完美的語言檔案庫(kù)存工作。

        參考文獻(xiàn)

        [1] 孫宏開.六江流域的民族語言及其系屬分類.民族學(xué)報(bào),1983.3:99-274.

        [2] 宋伶俐.貴瓊語研究[M].民族出版社,2011.

        [3] BICKEL, B., B. COMRIE ET M. HASPELMATH (2004). The Leipzig Glossing Rules. Conventions for Interlinear Morpheme by Morpheme Glosses, Leipzig, Max Planck Institute for Evolutionary Anthropology.

        [4] Croft, William.2003.Typology and universals. 2nd ed. Cambridge: Cambridge University Press, pp. xix-xxv.

        [5] CSAT€? €? et D. NATHAN (2003). Spoken Karaim, Institute for the Study of the Languages and Cultures of African and Asia, HRELP, Tokyo University of Foreign Studies, School of Oriental and African Studies.

        [6] Jiang, Li. 2015.A grammar of guiqiong : a language of Sichuan. Brill Academic Publishers.

        [7] Lehmann,Christian. 1982. "Directions for interlinear morphemic translations". Folia Linguistica 16:199-224.

        [8] LEHMANN, C. (2005). Interlinear morphemic glossing , in G. Booij & al., Morphology : An International Handbook on In?ection and Word-Formation, Berlin/New York, Walter de Gruyter, p. 1834-1857.

        [9] MOREY, S.D. (2010). Turung : A Variety of Singpho Language Spoken in Assam, Canberra, Paci?c Linguistics.

        [10] SCHULTZE-BERNDT, E.(2006). 《Linguistic annotation 》, in J. Gippert, N.P. Himmelmann & U. Mosel (dir.), Essentials of Language Documentation, Berlin/New York, Mouton de Gruyter, p.213-251.

        猜你喜歡
        數(shù)字化
        數(shù)字化:讓夢(mèng)想成為未來
        家紡業(yè)亟待數(shù)字化賦能
        論經(jīng)濟(jì)學(xué)數(shù)字化的必要性
        英語文摘(2019年9期)2019-11-26 00:56:32
        高中數(shù)學(xué)“一對(duì)一”數(shù)字化學(xué)習(xí)實(shí)踐探索
        高中數(shù)學(xué)“一對(duì)一”數(shù)字化學(xué)習(xí)實(shí)踐探索
        數(shù)字化電鍍生產(chǎn)流程構(gòu)建
        數(shù)字化制勝
        數(shù)字化博物館初探
        倍壓Boost PFC變換器的改進(jìn)及數(shù)字化研究
        關(guān)于“萬方數(shù)據(jù)——數(shù)字化期刊群”簡(jiǎn)介
        国产精东一区二区三区| 日韩在线一区二区三区免费视频 | 亚洲高清精品一区二区| 国产午夜激无码av毛片不卡| 国产精品免费精品自在线观看| 久热这里只有精品99国产| 日韩精品一区二区三区四区五区六| 国产饥渴的富婆一凶二区| 亚洲乱亚洲乱妇| 亚洲国产精品无码久久电影| 激情综合网缴情五月天| 美女扒开内裤让我捅的视频| 国产亚洲一本大道中文在线| 欧美色图中文字幕| 国产精品农村妇女一区二区三区| 久久久国产精品123| 国产麻豆精品一区| 在线无码国产精品亚洲а∨| 一区二区三区四区国产亚洲| 优优人体大尺大尺无毒不卡| a级国产乱理论片在线观看| 亚洲国产剧情在线精品视| 日韩av水蜜桃一区二区三区| 少妇高潮无套内谢麻豆传| 久久福利青草精品免费| 国产精品国产三级国av在线观看 | 精品亚洲乱码一区二区三区| av在线观看一区二区三区| 少妇高潮尖叫黑人激情在线| 中文字幕有码一区二区三区| 国产人妖伦理视频在线观看| 日韩人妻无码一区二区三区久久| 久久ri精品高清一区二区三区| 亚洲毛片av一区二区三区| 久久久国产精品123| 又污又爽又黄的网站| 亚洲加勒比无码一区二区在线播放| 中文字幕亚洲一二三区| 亚洲av无码一区二区三区人| 国产精品美女白浆喷水| 亚洲国产精品久久性色av|