【摘要】:設(shè)計構(gòu)建中國少數(shù)民族瀕危語言語音語料庫,根本上是為了以一種系統(tǒng)的方式將頻臨消失的少數(shù)民族語言的聲音永久地保存下來。這其實是一種無比珍貴的民族文化的見證,語音語料庫的建立更能為相關(guān)的研究學者提供重要的參考,讓他們得以以更加便捷地方式完成對相關(guān)語言資料的查詢、檢索與統(tǒng)計工作,兼具文化與研究價值。因此,本文就從對瀕危語言語音語料庫特點與價值的闡述出發(fā),具體闡述了語音語料庫的設(shè)計策略,希望能給相關(guān)的工作人員提供一些建議和幫助,讓我國少數(shù)民族瀕危的語言語音得到更好地保護與傳承。
【關(guān)鍵詞】:中國少數(shù)民族語音;瀕危語言;語言語料庫;設(shè)計策略分析
一、引言
語音語料庫與傳統(tǒng)的純文本語料庫具有很大區(qū)別,語音語料庫的表達形式有三種,它對文本、語音以及聲學參數(shù)進行了融合。我們構(gòu)建中國少數(shù)民族瀕危語言語音語料庫,不僅是為了系統(tǒng)而永久地保存那些瀕臨消失的少數(shù)民族語言的聲音,也是為了給相關(guān)學者的研究提供便利。當前,構(gòu)建大型語料庫并基于它來開展相關(guān)研究,已然成為了國內(nèi)外語言學研究工作的一個重要趨勢。
二、瀕危語言語音語料庫建設(shè)的實際價值分析
計算機技術(shù)的應(yīng)用使得語言學的研究機械工作量大大降低,那么相應(yīng)的研究效率也就得到了很大的提升。近年來,我國在語音語料庫建設(shè)工作方面取得了長足的進步,建立并完善了許多新的語音語料庫。它們?yōu)檎Z言研究及技術(shù)處理工作提供了許多重要的語料與技術(shù)參數(shù),使得相關(guān)研究所取得的成功更加客觀可靠,也更具實際應(yīng)用價值。
我們建立瀕危語言語音語料庫不僅僅是為了給相關(guān)研究提供便捷條件,這同時也是對人類非物質(zhì)文化遺產(chǎn)的必要保護。隨著經(jīng)濟的發(fā)展,全球化、城鎮(zhèn)化等進程的不斷深入,世界范圍內(nèi)使用非主體語言的人數(shù)銳減,逐漸地走到瀕臨消失的境地。近年來,無論是政府相關(guān)部門還是一些民間團體,都開始為這些語言的保護工作付諸努力??梢钥吹?,許多的少數(shù)民族語言其實并沒有具體的文字與書面語,對于這些語言的保護困難重重。在意識到語言瀕危的嚴重性,對語言多樣性保護的重要性后,我國語言學界達成了共識,必須盡快采取更加多樣化、系統(tǒng)化的形式與手段來幫助記錄、保存那些瀕臨消失的語言。因此,建立瀕危語言語音語料庫成為了一項刻不容緩的重要任務(wù)。國家也建立相應(yīng)的項目,即“中國少數(shù)民族瀕危語言語音語料庫”,該項目就是為了對中國境內(nèi)那些瀕危語言,通過語言、國際音標、錄像等多樣化的形式進行可能是最后一次的搶救性記錄工作。
三、瀕危語言語音語料庫的具體設(shè)計策略
語言語音語料庫的構(gòu)建工作不僅具有復雜性,還具有艱巨性,需要耗費大量的人力物力,在進行具體操作前要做好充分的準備工作,進行良好的整體規(guī)劃,明確策略,規(guī)范步驟,從而有效減少返工與浪費問題的次數(shù),提高工作效率。
(一)確定數(shù)據(jù)庫建設(shè)的目的語言與發(fā)音人
建設(shè)語音語料庫,首先要確定好目的語言。其次是要選擇適宜的發(fā)音人,要求其口齒清晰、語速適中,是熟練的母語發(fā)音人,并且要能夠主動配合調(diào)查工作。首要因素是對母語的掌握程度,我們必須注意到一個問題,根據(jù)語言瀕危程度的不同,有些民族的年輕人的語言其實已經(jīng)出現(xiàn)了不同程度的變化,實際上只有該民族中的那些老年人才能真正掌握完整的母語。例如仡佬語中強調(diào)鼻冠音,但五六十歲的人的鼻冠音其實就開始缺乏系統(tǒng)與穩(wěn)定性,吟哦最終我們選擇了一位年逾八十的老人作為發(fā)音人。
(二)做好發(fā)音素材的選擇與編制工作
其次,發(fā)音素材的選擇與編制工作也是數(shù)據(jù)庫構(gòu)建的關(guān)鍵環(huán)節(jié)之一。數(shù)據(jù)庫是對瀕危語言的記錄,我們應(yīng)當盡可能的以更加系統(tǒng)的方式將相關(guān)語言的全貌記錄下來。因此,在選擇與編制發(fā)言素材時應(yīng)注意五個方面:首先是語音,應(yīng)選擇記錄那些能夠全面反映包括音質(zhì)、超音質(zhì)特點等在內(nèi)的目的語語音特點的相關(guān)詞語,如果存在一些具有鮮明特色的語言現(xiàn)象,還可以通過增加例詞從而充分反映其特征。第二是詞匯,四千詞詞表是基礎(chǔ),可以在此基礎(chǔ)上進行拓展,當然對于那些無法很好譯成漢語的少數(shù)民族語詞也可以進行相應(yīng)增減。一個詞語應(yīng)當重復錄制三遍,采集的詞語發(fā)音樣本應(yīng)當在一萬個以上。第三是句子,提前根據(jù)語言的語法特點編制了一個總數(shù)在800左右的句子調(diào)查表,每個句子重復錄制兩遍,在具體錄制過程中可以根據(jù)具體情況對句子的敘述方式與內(nèi)容進行一定的調(diào)整。第四是自然對話,大多選擇日常生活為題,以問題回答、自由談話這兩種形式為主。最后是長篇話語材料,盡可能收集多的民間故事、詩歌以及民歌等內(nèi)容。
(三)在錄音過程中選取適宜的說話方式
由于錄音過程中選取的說話方式將直接影響語料庫的用途,因此必須進行謹慎選擇。主要有兩種方式,其一是具有提示文本的朗讀,發(fā)音人將漢語提示轉(zhuǎn)換成母語進行朗讀,其二是自然語音,由發(fā)音人不受限制地進行自我介紹,也可以闡述民族的生活狀況或是講述一些民間故事。通過將兩種說話方式相結(jié)合,可以大大拓展語料庫的應(yīng)用領(lǐng)域與實際價值。
(四)確保操作人員的工作專業(yè)性
為了提升語料庫的質(zhì)量,我們必須確保操作人員具有很高的工作專業(yè)性,確保錄音、記音、記音材料整理等方面的工作高效、高質(zhì)量。因此,可以由相關(guān)語言的研究專家直接親自負責記音工作,并結(jié)合事先準備、邊錄音邊補充以及錄音后核音等多道程序確保記音的準確性。在錄音工作完成后,要對原始語音進行完整保存,在運用副本來完成對語音的切割整理以及核音工作。
建立數(shù)據(jù)庫系統(tǒng)需要儲存四個方面的素材,它們分別是:發(fā)音人屬性素材、發(fā)音文本素材、實際語音素材以及存儲部分聲學分析數(shù)據(jù)。構(gòu)建的語料庫應(yīng)當不僅可以為從事語言研究的相關(guān)技術(shù)人員提供數(shù)據(jù),還能為普通用戶提供便捷的查詢與檢索通道。因此,我們要盡可能提升后臺數(shù)據(jù)庫管理系統(tǒng)與前臺用戶使用界面結(jié)合的有機與順暢度。
結(jié)語:綜上所述我們可以看到,中國少數(shù)民族瀕危語言語音語料庫它其實是一個具有開放性的數(shù)據(jù)庫,我們可以對其語料規(guī)模進行不斷地擴展。此外,根據(jù)不同的研究目的,我們可以對語料信息進行相應(yīng)的加層標注。但是,要想以更加高效高質(zhì)量的完成瀕危語言語音語料的記錄與保存工作,僅僅依賴有限的工程技術(shù)人員與實驗室錄音資料難度極大。我們希望所有關(guān)心我國瀕危語言搶救、保護以及少數(shù)民族瀕危語言語音語料庫建設(shè)工作的仁人志士,都能真正參與到這項工作中,通過多方努力,共同探索這一大有發(fā)展前途的研究領(lǐng)域,以實現(xiàn)更大的突破。
參考文獻:
[1]文化的傳承與少數(shù)民族瀕危語言的保護研究[J]. 吳坤湖. 貴州民族研究. 2016(10)
[2]科學理智地深入開展瀕危語言保護的研究[J]. 戴慶廈. 北方民族大學學報(哲學社會科學版). 2015(03)
[3]少數(shù)民族瀕危語言的保護研究[J]. 許娥. 貴州民族研究. 2012(04)