王成平 沈紫陽 孫某姑
摘要:論文研究首先在文獻整理、田野調查等基礎上完成了涼山州木里縣屋腳鄉(xiāng)彝族民歌、故事、克智等口頭經典的文本與語音收集,其次參考語言信息處理、多媒體、數據庫等技術路線開展語料素材的整理與建庫,最后借助網頁編程與語料庫技術,完成木里縣屋腳鄉(xiāng)彝族口傳經典資源庫的建設,以在線資源庫的形式展現彝族口傳經典,為保護、展示、弘揚民族語言傳統(tǒng)口傳文化的研究與創(chuàng)新提供了新的途徑與實踐探索。
關鍵詞:木里縣屋腳鄉(xiāng);彝族;口傳經典;資源庫
一、前言
口傳經典作為民族傳統(tǒng)經典的精髓,借助民俗活動的平臺,以口耳相傳的形式傳播和傳承下來,是傳統(tǒng)民俗活動的重要組成部分,因此完整保存優(yōu)秀傳統(tǒng)經典,具有深遠意義。彝族口傳經典具有較高的文學研究價值,能夠全面系統(tǒng)地展現彝族人民在生產生活中創(chuàng)造的民族傳統(tǒng)經典文化;2005年聯合國教科文組織通過了《保護與促進經典表現形式多樣性公約》,受其推動,21世紀初,我國實施了“非物質經典遺產保護工程”,中國社會科學院成立“口承傳統(tǒng)研究中心”,積極開展對少數民族口傳經典遺產現狀和發(fā)展態(tài)勢的調查、鑒別、研究、保護和宣傳。
彝族民間的口傳經典大致由民俗與宗教經典(如:畢摩經等)、民間口傳文學(如:故事、諺語等)、思想教育(如:瑪木特依等)、民歌民謠(如:婚嫁歌、山歌等)等四部分組成,這些口傳經典是國內外眾多學者研究彝族文學藝術、文化民俗、歷史發(fā)展的重要文獻與素材。
彝族口傳經典語庫就是“將彝族的零星散落在民間的彝族口傳經典收集并轉換成文本資料后,按照語料庫存儲結構的要求建立存儲以及管理口傳經典資料,以便于查閱及使用的倉庫”,在研究內容上:通過收集和整理彝族口傳經典資料,可以探尋彝族經典在這多民族聚居區(qū)域的歷史傳承,探究民族經典的異同和相融等;在實現手段上:利用網頁編程與語料庫技術展示彝族口傳經典文化,主要分為信息采集和語料庫的建設兩部分,前期以信息采集為主,整理、記錄生活中樸實、純正的口傳經典;后期以語言的研究和語料庫的建設為主,利用信息技術來建立包含民歌、克智等文本語料,采用語料庫、多媒體等多維展現口傳經典資源庫,論文研究思路結構如圖1所示:
二、屋腳鄉(xiāng)彝族口傳經典資源庫語料的收集整理
(一)屋腳鄉(xiāng)及其彝族口傳經典概況
屋腳蒙古族鄉(xiāng)位于涼山州木里藏族自治縣境內南部邊緣地帶,1984年四川省人民政府批準建立屋腳蒙古族鄉(xiāng),其轄內面積約307平方公里,轄內2個行政村,是木里的五個民族鄉(xiāng)之一;“屋腳”系蒙古語音譯,意為“有牛的地方”,藏語稱“仁江”,居住著蒙古族、彝族、藏族、漢族、納西等5個少數民族,還原汁原味的留存著神秘而偉大的母系氏族文化,這里的母系氏族文化被美譽為“最后神奇的母系村落”;彝語北部方言圣乍話目前廣泛應用于屋腳鄉(xiāng)片區(qū)彝族同胞的日常交流和生活生產當中,當地的藏族、蒙古族同胞中絕大多數都會簡單的彝語交流。
屋腳鄉(xiāng)彝族口傳經典主要是以彝語北部方言所屬區(qū)域下的彝族史詩、民間故事(????)、妞妞(??)、克智(??)等經典傳承為主,主要靠展演與吟誦的模式來表現出來,口傳經典多為民俗活動、婚喪嫁娶、節(jié)慶聚會中所運用到的 “妞妞哄”(???)、“克智”(??)和“阿依阿支”(????)等,除所傳承的彝族民俗經典(包括婚俗、宗教信仰、喪俗、食俗、服飾經典等)基本上與涼山其他地方大同小異,在遷徙和傳承時在民俗經典活動中所表達出的口傳經典有部分創(chuàng)新和演變。
(二)口傳經典文本語料的選取
屋腳蒙古族鄉(xiāng)的彝族口傳經典具有濃厚的多民族色彩以及地域特征,因此既要考慮當地口傳經典傳承人的民族和語言使用情況,而且還要考慮其在當地的居住時間等綜合因素進行篩選發(fā)音人。
屋腳鄉(xiāng)彝族口傳經典資源庫是由選取的彝文文本、漢語翻譯、彝語拼音三部分內容構成的:第一個部分涉及到彝文字3000個句子涵蓋33000個字符;第二部分是對以上彝文字的漢語翻譯,包括3000個句子涵蓋42900個字符;第三個部分是對彝文字的國際音標標注,涵蓋彝文國際音標15733個涵蓋33000個字符數據量,合計完成10萬多個字符數據規(guī)模語料的整理。
(三)口傳經典調查與數據采集
口傳經典調查內容,主要包括調查人員、調查時間、調查地點、調查內容等,2017年11月3日,調查人員一行4人從成都出發(fā),最終于11月5日上午10點到達調查點屋腳蒙古族鄉(xiāng),11月4日至11日開展了為期7天的彝族口傳經典的實地調研與語料采集。
傳承人的選定主要遵從以下幾個原則,首先選擇的對象是土生土長的當地人,對當地的自然和人文環(huán)境相當熟悉,能夠以地道的當地民族語言進行說和唱;其次特別是對當地的彝族口傳經典有濃厚的感情,可以有效還原口傳經典的真實和原生態(tài)。最后發(fā)音傳承人需口齒伶俐、思維清晰,具備勝任口傳經典表述,符合口傳經典采集工作開展的相關規(guī)范和要求。
彝族口傳經典收集、整理的主要內容為:流傳在屋腳蒙古族鄉(xiāng)的民歌、故事和克智;調研主體是藏族自治縣下蒙古族鄉(xiāng)流傳的彝族口傳經典,從音頻、圖像、視頻等多維角度開展語料數據采集,做到有圖、有音有畫面,完成90段音頻資料的錄制,存儲量達到7.97GB,時長500分鐘;音頻資料基本呈現出:雜音少、音質清晰的特征;視頻資料方面,共拍攝16段視頻,原視頻存儲量達到106.95GB,時長320分鐘;拍攝、整理照片資源2000余張。
(四)語料數據標注與整理
語料數據標注整理主要從語料文本提取、文本翻譯、歸納整理等三個方面來開展。
文本提取上獲取信息主要是音頻資料中攝取內容,然后將音頻逐字逐句進行提取轉化文本;文本翻譯上文本的翻譯有兩個過程,通過文字性的翻譯,文字性翻譯是將彝語口傳經典的音頻資料經過翻譯成漢語之后,以彝文和漢字的形式出現;歸納整理上將提取出來的彝語文本進行歸納,具體分為民歌、故事和克智三個模塊。
文本標注內容包括彝文拼音標注、漢文翻譯,標注采用“漢語(譯文)+彝語+彝語拼音”的方案模式,通過標注,完成語料庫進行文本內容的展示,實現真正意義上的高“辨識度”的語料展示,如下表所示:
三、屋腳蒙古族鄉(xiāng)彝族口傳經典資源庫的建設
(一)資源庫結構
資源庫設計主要是對選取文本、制作音頻文件、視頻文件、圖片材料等資料的設計。在語料結構上,內容層次分明、布局合理,表現出當地口經典面貌。
資源庫內部結構,主要通過研究和發(fā)掘,挖掘出針對文本、圖像、語音、視頻等各個構成成分的分析和展示,主要圍繞著:在收集第一手資料時,選擇的具有代表性的語料進行采集;語料數據庫的研究和用于表現的方面主要體現在彝語口傳經典經典上面,目標是實現以交互式多媒體的形式展現語料,通過分析屋腳鄉(xiāng)當前留存的彝族口傳經典的種類、數量、規(guī)模、演變和使用人群等,旨在研究當地口傳經典語料的特色性,豐富的彝族語言及文化資源資源庫。
資源庫具有存儲信息量大、表現形式多樣化、實時存取和多路并發(fā)等特點,在建設進程中,采用層次模型、網狀模型(超文本)、關系模型及對象模型來進行組織。
研究成果為涵蓋文本、音頻、視頻、圖像的交互式的多媒體語料庫,通過人工的標注和機器語言結合的方式,有助于使用者快捷方便檢索瀏覽語料庫,通過資源庫可以直觀的查詢和探訪到需要研究查看到屋腳鄉(xiāng)彝族經典口傳內容的多維度展示。
(二)資源庫文本音頻模塊
資源庫的文本音頻語料即為文本資料結合音頻文件,用以同步展示文本、語音介質的語料集合,實現對屋腳鄉(xiāng)彝族口傳經典的文本、語音材料的運用和展示。
論文研究主要運用JS腳本語言實現對資源庫的拓展運用。在JS語言中主要運用Json和Ajax、Jquery技術功能相結合,實現資源庫文本表格的查詢功能,即為分類檢索查詢功能;通過JS語言的連續(xù)的代碼運用,即用ajax語句的get指令來獲取數據,獲的語料庫data數據資料,然后通過目標地址的調取,功能上實現對資源庫的數據內容的提取查詢和檢索的功能。其中,根據語料語料的呈現方式,將語料通過表格的模式分成獨立的多個單句,從而在檢索查詢中,以獨立的詞條形式整條的進行、查詢,如圖3所示:
資源庫中的語料是以單獨的篇章為個體進行劃分,如圖3所示,資源庫以彝族口傳經典阿依阿支進行檢索、查詢、展示,語料庫數據表將以單句進行編號進行條目的劃分,通過片段的分類方式,可便捷的進行查詢,完成編號、漢譯、彝文、拼音等內容的整齊對應的內容展示,如圖4所示:
資源庫綜合運用jquery、json、ajax等技術方案,并融合多種內容提取方式,通過多次實驗獲得了一種簡便又快速的檢索查詢方法,具有實用性和便捷性的特點,方便語料檢索與查詢;語音播放模塊,用該模塊可以實現對語音模塊的播放控制,可實現在線操作。
(三)資源庫視頻模塊
資源庫視頻語料主要是運用網頁技術實現對彝族口傳經典的視頻材料的播放和展示,主要通過外鏈式視頻播放模塊管控播放功能,直接實現對資源庫視頻的在線播放與管理,如圖5所示:
圖5界面功能可直觀便捷的找到需要播放的視頻文件,通過滑動圖像的風格,附加視頻文件外部實現彝漢雙語的標注,可便捷、快速實現視頻的查找,并可直觀實現播放、暫停、音量加減、視頻進度拖動乃至全屏播放等功能;同時資源庫還具有語料信息生成數據表功能,這是資源庫的一個特色亮點,通過該功能可以方便進行有效的下載和修改校對等操作,具體實現的步驟:首先安插JS插件;其次,將靜態(tài)網頁的table標簽的編號設置為classical_table;最后給按鈕賦予點擊事件指令,導出為Excel格式文件,如圖6所示:
(四)資源庫圖像模塊
資源庫的圖像模塊主要是運用網頁技術將統(tǒng)一圖像格式為.jpg進行歸類、在線查詢與展示,豐富了口傳經典語料庫的內容,用該模塊可以實現對圖像模塊的預覽控制,通過分類的管理模式,運用<div>分類化技術實現對圖片的單獨整理和查詢預覽,如圖7所示:
四、結語
傳承和保護民族傳統(tǒng)經典是世界非物質經典遺產保護的重要部分,語言與文化資源庫的實現為民族口傳經典的數字化建設、為民族文化的多元性展示,為民族文化傳承的多維度創(chuàng)新研究提供了新的視角;論文研究運用現代的信息處理技術收集散落在民間的傳統(tǒng)與口傳經典,參考語言信息處理、多媒體、數據庫等技術路線開展語料素材的整理與建庫,借助網頁編程與語料庫技術,完成10萬多字符數據量的木里縣屋腳鄉(xiāng)彝族口傳經典資源庫的建設,實現了以在線資源庫的形式來展現彝族口傳經典,為信息化、數字化時代民族語言與傳統(tǒng)文化的傳播、發(fā)展與創(chuàng)新研究提供了新的實踐探索。
參考文獻:
[1]沙馬打各.論口傳文學書面化過程中經典要素的遺失——兼談彝族克智的收集與整理[J].西南民族大學學報(人文社科版),2008(08):45-48.
[2]楊正文.經典遺產保護的關聯話語意義解析[J].西南民族大學學報(人文社會科學版),2014(7).
[3]王美英.涼山彝族口傳經典保護發(fā)展困境與對策研究[J].西南民族大學學報(人文社科版),2015,36(12):51-57.
[4]蘇連科.彝族有聲語言與口傳經典保護和傳承的數字化方法及其基礎理論研究[J].玉溪師范學院學報,2015,31(01):18-22.
[5]王成平.彝語言語料語料數據庫的設計與共享的實現[J].中文信息學報,2016,30(01):129-132+139.
[6]那書琦.彝族經典在彝區(qū)城鎮(zhèn)化過程中的傳承與保護研究[D].成都:西華大學,2016.
[7]黃行.中國語言語料多樣性及其創(chuàng)新與保護規(guī)劃[J].語言學研究,2017(01):17-24.
[9]曹志耘.跨越鴻溝——尋找語保最有效的方式[J].語言文字應用,2017(2).
[9]丁石慶.中國語言資源保護工程語料資源的質量、價值和效用——以少數民族語言材料為例[J].暨南學報(哲學社會科學版),2018.
項目名稱:教育部人文社會科學研究項目,項目編號:17YJA740051;西南民族大學中央高校基本科研業(yè)務費專項資金項目;項目編號:2016NGJPY07;民族語言文字信
息處理重點實驗室建設的研究成果。