亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        西北花兒語音語料庫管理系統(tǒng)設(shè)計(jì)研究

        2014-01-01 03:05:22
        渭南師范學(xué)院學(xué)報 2014年23期
        關(guān)鍵詞:數(shù)據(jù)庫用戶系統(tǒng)

        曹 靜

        (渭南師范學(xué)院期刊管理中心,陜西渭南714099)

        語言學(xué)名詞審定委員會在《語言學(xué)名詞》中,將語料庫定義為:“為語言研究和應(yīng)用而收集的,在計(jì)算機(jī)中存儲的語言材料,由自然出現(xiàn)的書面語或口語的樣本匯集而成,用來代表特定的語言或語言變體.”[1]自20世紀(jì)80年代以來,計(jì)算機(jī)語料庫的建設(shè)與應(yīng)用,引起了許多國家信息技術(shù)領(lǐng)域和語言學(xué)界濃厚的興趣;計(jì)算機(jī)語料庫對自然語言處理的不同方面(如話語識別、人機(jī)對話、信息提取、網(wǎng)頁分類、機(jī)器翻譯、文檔處理等)的重要性和蘊(yùn)藏的潛力,得到了國際計(jì)算語言學(xué)界的廣泛認(rèn)可.[2]在這期間,語音語料庫作為言語技術(shù)的研究與開發(fā)而建立的語音數(shù)據(jù)及其標(biāo)注的集合,其研究、開發(fā)與應(yīng)用在計(jì)算機(jī)技術(shù)的有力支撐下亦獲得了長足進(jìn)展.

        “花兒”,是流行于青海、甘肅、寧夏、新疆等省區(qū)的民歌,深受漢、回、藏、土、東鄉(xiāng)、保安、撒拉、裕固及蒙古等民族群眾的喜愛,眾口傳唱,經(jīng)久不絕.[3]2006年,“花兒”被確定為首批國家級非物質(zhì)文化遺產(chǎn)保護(hù)項(xiàng)目;2009年,“花兒”被列為世界非物質(zhì)文化遺產(chǎn)保護(hù)名錄.到目前為止,在對西北花兒研究的各個領(lǐng)域中,語料庫的研究還是一個空白.因此,設(shè)計(jì)一個語料豐富、能夠統(tǒng)一管理、查詢能力強(qiáng)、可視界面良好的語音語料庫管理系統(tǒng)勢在必行.

        1 花兒語音語料庫設(shè)計(jì)

        1.1 語音語料庫的相關(guān)規(guī)范

        為了快速有序以及有效地建設(shè)花兒語音語料庫,保證語音語料庫的質(zhì)量,在語音語料庫建庫之前,首先要研究制定好一系列適合花兒語音處理的規(guī)范標(biāo)準(zhǔn),主要包括發(fā)音人規(guī)范、語料設(shè)計(jì)規(guī)范、錄音規(guī)范、數(shù)據(jù)存儲技術(shù)規(guī)范等.[4]制作語音語料庫的一般規(guī)范如表1所示.

        表1 語音語料庫的一般規(guī)范[4]

        1.2 語料庫樣本選擇

        花兒曲調(diào)極為豐富,據(jù)統(tǒng)計(jì),僅青海的河湟地區(qū)就有上百種.不同的曲調(diào)有著不同的“令”.按流行地區(qū)分為“河州令”“湟源令”“川口令”“循化令”等;按照演唱民族劃分為“土族令”“撒拉令”“保安令”等;按照花兒的襯詞又分為“白牡丹令”“尕馬爾令”“花花尕妹令”等.[5]因此,在挑選語音語料時,要根據(jù)收集的原始語料并結(jié)合花兒語料本身的特點(diǎn),采用民間藝人和專業(yè)演唱者結(jié)合的方法,使所選語料盡可能覆蓋花兒的所有曲調(diào),如實(shí)反映花兒的基本面貌.語料唱本以民間采集的口語文本為主,同時兼顧各種已經(jīng)匯編出版的著作.[6]語料選擇還要考慮民間演唱者和專業(yè)演唱者的平衡,不僅要采集當(dāng)?shù)卦鷳B(tài)花兒,而且也要采集一些新創(chuàng)作的花兒民歌.

        1.3 演唱錄制語音語料

        花兒演唱是詞隨令行,即興編唱.本系統(tǒng)的演唱者有專業(yè)演唱者和民間藝人兩種角色.在建設(shè)語音語料庫時,盡量邀請知名花兒專業(yè)演唱者演唱語料文本或根據(jù)花兒詞令即興編唱.對于民間藝人,盡量選擇青海、甘肅、寧夏、新疆等省區(qū)的花兒演唱“把式”,因?yàn)樗麄兇蠖喽寄苷莆栈▋呵?,且擅長即興編詞,屬于真正意義上原生態(tài)的民間藝人.

        由于收集語料的特殊性,根據(jù)不同的研究目的,采用兩種方式:一種是演唱者登錄系統(tǒng)在線演唱錄音,另一種是人工補(bǔ)充語料,即系統(tǒng)導(dǎo)入語音語料.

        1.3.1 演唱者在線演唱錄制

        在安靜的環(huán)境下,演唱者登錄系統(tǒng)后,利用配制完善的錄音設(shè)備和專業(yè)的錄音軟件,選擇演唱語料文本,或者即興編唱,錄音保存后,上傳至服務(wù)器等待系統(tǒng)管理員審核.錄音軟件須在錄音之前設(shè)置錄音參數(shù),主要以wav文件存儲路徑.

        1.3.2 系統(tǒng)導(dǎo)入演唱錄音文件

        花兒因其特殊的傳承機(jī)制,決定了原生態(tài)花兒往往存在于條件相對落后的偏遠(yuǎn)地區(qū),那些民間花兒“把式”沒有條件上網(wǎng),因此這些人們極力保護(hù)和推崇的原生態(tài)型花兒要進(jìn)入語音語料庫并獲得傳承,就需要花兒語料采集者實(shí)地去采風(fēng)完成.系統(tǒng)導(dǎo)入演唱錄音文件適合于以下兩種情況:

        (1)實(shí)地采集原生態(tài)花兒語音語料

        原生態(tài)的花兒飽含著對時、地、景、情的抒發(fā),它由感而起、由情而生,沒有刻意的雕琢,與生活緊密相關(guān),更是濃縮和經(jīng)典化了所要表現(xiàn)的內(nèi)容和現(xiàn)象.花兒在幾百年來的傳承過程中,因其口授心記的特殊方式,逐漸形成了大大小小的“花兒會”“花兒劇場”“花兒大賽”“花兒演唱會”等,[7]在采集原生態(tài)花兒語料時,為了得到真正能反映原生態(tài)花兒全貌的語料,就需要花兒語料采集者到青海、甘肅、寧夏、新疆等省區(qū),實(shí)地參加各地舉行的具有代表性的“花兒會”,征得舉辦機(jī)構(gòu)以及演唱者的同意,將其中的優(yōu)秀作品進(jìn)行現(xiàn)場錄制,所錄制的音頻通過系統(tǒng)管理員導(dǎo)入花兒語音語料庫.

        (2)與網(wǎng)絡(luò)媒體機(jī)構(gòu)合作,錄制花兒語音語料

        隨著現(xiàn)代計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)花兒、手機(jī)花兒通過新型媒介大放異彩,因此,在建設(shè)語音庫語料時,可考慮與網(wǎng)絡(luò)媒體機(jī)構(gòu),如優(yōu)酷網(wǎng)等合作,選取具有傳承意義的優(yōu)秀作品的語音文件,通過系統(tǒng)管理員導(dǎo)入花兒語音語料庫.

        2 花兒語音語料庫管理系統(tǒng)的設(shè)計(jì)

        建立西北花兒語音語料庫的目的在于使花兒永久而系統(tǒng)地保存下來,并能夠使國內(nèi)外花兒學(xué)習(xí)者、研究者方便地進(jìn)行大規(guī)模語音資料的查詢、檢索和統(tǒng)計(jì).

        2.1 系統(tǒng)的結(jié)構(gòu)設(shè)計(jì)

        為了提高系統(tǒng)的開發(fā)效率,根據(jù)系統(tǒng)需求分析,將花兒語音語料管理系統(tǒng)劃分為五個模塊,即用戶注冊模塊、用戶/管理員登錄模塊、演唱模塊、語音庫維護(hù)模塊、查詢/下載模塊.用戶通過主界面訪問本系統(tǒng),各級別系統(tǒng)管理員根據(jù)自己的權(quán)限執(zhí)行相應(yīng)的操作,具體如圖1所示.

        圖1 系統(tǒng)模塊圖

        五個模塊的功能分別為:

        (1)用戶注冊模塊:主要用于登記普通用戶和演唱者的姓名、性別、年齡、職業(yè)、籍貫等個人信息.普通用戶沒有演唱錄制的權(quán)限.

        (2)用戶/管理員登錄模塊:主要用于驗(yàn)證已經(jīng)注冊的用戶和管理員的賬號、密碼,確保其以合法的身份登錄,獲取相應(yīng)的權(quán)限.

        (3)演唱模塊:主要是針對演唱者,即有條件使用網(wǎng)絡(luò)、計(jì)算機(jī)等設(shè)備的專業(yè)演唱者、民間藝人等進(jìn)行演唱錄音,并上傳至服務(wù)器.

        (4)語音維護(hù)模塊:主要用于系統(tǒng)管理員對用戶進(jìn)行添加、修改、刪除等管理工作;對語料文本進(jìn)行添加、刪除、更新等管理工作;對語音文件進(jìn)行審核、添加、刪除、更新等管理工作.

        (5)査詢/下載模塊:主要用于用戶通過一定條件,如演唱者姓名、語料曲目、檢索詞等信息查找到自己所需要的數(shù)據(jù),進(jìn)行在線播放或者下載.

        圖2 系統(tǒng)流程圖

        2.2 系統(tǒng)業(yè)務(wù)流程圖分析

        花兒語音語料管理系統(tǒng)采用了ASP語言和SQL Server 2005數(shù)據(jù)庫平臺的設(shè)計(jì)方法,五個功能模塊都被設(shè)計(jì)成獨(dú)立組件,分別完成一項(xiàng)功能,這些獨(dú)立組件組合成一個整體,協(xié)同工作,實(shí)現(xiàn)整個系統(tǒng)的功能.系統(tǒng)的流程圖如圖2所示.

        用戶注冊完成后,系統(tǒng)管理員在后臺管理系統(tǒng)審核已經(jīng)注冊的用戶信息,并分配相應(yīng)權(quán)限.用戶登錄系統(tǒng)成功即可根據(jù)自己的權(quán)限進(jìn)行相關(guān)操作.普通用戶只能查看、修改自己的個人信息;也可查詢/下載語音庫里的語料.演唱者用戶分為專業(yè)演唱者和民間藝人,他們根據(jù)系統(tǒng)管理員賦予的權(quán)限,演唱錄音,并上傳所演唱的語音文件至服務(wù)器;也可查看、修改自己的個人信息;查詢/下載語音庫里的語料.系統(tǒng)管理員根據(jù)自身角色擁有相應(yīng)的權(quán)限,可審核、查看用戶資料;維護(hù)語音庫所有資料.

        3 系統(tǒng)數(shù)據(jù)庫設(shè)計(jì)

        花兒有很多種基本調(diào)式和旋律,其變體甚多,又因曲調(diào)詞令極為豐富,大多都是即興編唱,為了使采集到的花兒語料盡可能地反映花兒全貌,就要求所選擇的數(shù)據(jù)庫必須有很大的容量.在花兒語音語料數(shù)據(jù)庫中不僅要存儲大量的語音波形文件,而且要存儲對應(yīng)的演唱者信息和語料文本,對事務(wù)的處理和網(wǎng)絡(luò)的支持也有一定的要求,又根據(jù)系統(tǒng)實(shí)際需要,選取MS SQL Server 2005作為數(shù)據(jù)庫管理系統(tǒng).

        3.1 數(shù)據(jù)庫分析

        針對西北花兒語音語料庫管理系統(tǒng)的設(shè)計(jì)需求,系統(tǒng)所設(shè)計(jì)的數(shù)據(jù)庫要具備以下的數(shù)據(jù)訪問功能:

        (1)用戶信息保存和維護(hù):這類數(shù)據(jù)主要通過保存用戶賬號、密碼、姓名等信息來區(qū)分不同的用戶和管理員.數(shù)據(jù)在注冊時向系統(tǒng)數(shù)據(jù)庫中添加,用戶登錄系統(tǒng)時系統(tǒng)提供驗(yàn)證過程,進(jìn)行登錄人員身份的核對,確保登錄用戶身份的合法性和數(shù)據(jù)的安全性.

        (2)花兒語料文本的保存與更新:這類數(shù)據(jù)主要通過語料編號、語料名稱等信息保存文本語料.普通用戶可以通過查詢系統(tǒng)訪問這類數(shù)據(jù),演唱者可以根據(jù)語料文本錄制語音語料,管理員可以對語料文本進(jìn)行添加、刪除、修改、更新等維護(hù)操作.

        (3)語音波形文件的保存與更新:這類數(shù)據(jù)主要通過語音文件編號、語音錄制文本信息、演唱者信息、語音文件存儲位置信息等方式進(jìn)行保存.演唱者錄音完成后,可以上傳本次錄音的波形文件,系統(tǒng)自動對該文件進(jìn)行保存.普通用戶可以通過查詢訪問這類數(shù)據(jù).管理員可以對數(shù)據(jù)庫中存在的文件進(jìn)行審核、發(fā)布、刪除等操作;對于語料采集者采集到的原生態(tài)花兒語音語料和通過合作錄制的花兒語音語料進(jìn)行審核后添加操作.

        3.2 概念數(shù)據(jù)模型設(shè)計(jì)

        概念設(shè)計(jì)的目標(biāo)[8]是準(zhǔn)確描述應(yīng)用領(lǐng)域的信息模式,支持用戶的各種應(yīng)用.概念數(shù)據(jù)模型是一種面向用戶的模型,主要用來描述實(shí)體與實(shí)體之間的關(guān)系,實(shí)體與屬性之間的關(guān)系.它是按照用戶的觀點(diǎn)出發(fā),對數(shù)據(jù)和信息進(jìn)行建模,主要用于數(shù)據(jù)庫設(shè)計(jì).[9]在概念數(shù)據(jù)模型中最常用的是 E-R模型,主要用實(shí)體—聯(lián)系方法(Entity-relationship Approach)表示,簡稱E-R模型.E-R圖是由實(shí)體、屬性、聯(lián)系三個部分組成的.限于篇幅,這里只給出語音語料的E-R模型,如圖3所示.

        圖3 語音波形文件實(shí)體圖

        3.3 數(shù)據(jù)表設(shè)計(jì)

        數(shù)據(jù)庫邏輯設(shè)計(jì)的目標(biāo)[8]是滿足用戶的完整性和安全性要求,能在邏輯級上高效地支持各種數(shù)據(jù)庫事務(wù)的運(yùn)行.根據(jù)上述E-R實(shí)體圖可相應(yīng)地設(shè)計(jì)出用戶信息表、管理員信息表、語料文本信息表、語音波形文件信息表.限于篇幅,這里只給出語音波形文件信息表,其設(shè)計(jì)如表2所示.[10]

        表2 語音波形文件信息表

        4 結(jié)語

        西北花兒語音語料庫是首個專門為花兒語言民俗研究設(shè)計(jì)的完全開放性的語音語料庫管理系統(tǒng),為國內(nèi)外花兒的學(xué)習(xí)研究提供了新的科學(xué)技術(shù)手段,也為花兒語音技術(shù)的研究提供了寶貴的數(shù)據(jù)資源.構(gòu)建西北花兒語音語料管理系統(tǒng),為花兒的搜集整理、理論研究、開發(fā)創(chuàng)新注入新的活力,將為花兒語言民俗等研究提供豐富的、有價值的資料,對弘揚(yáng)非物質(zhì)遺產(chǎn)文化,保護(hù)和傳承花兒有積極的促進(jìn)作用.

        [1]語言學(xué)名詞審定委員會.語言學(xué)名詞[M].北京:商務(wù)印書館,2011.

        [2]王建新.計(jì)算機(jī)語料庫的建設(shè)與應(yīng)用[M].北京:清華大學(xué)出版社,2005.

        [3]曹強(qiáng).基于問題意識的“花兒”語言研究[J].青海民族研究,2010,21(2):85-88.

        [4]熱依曼·吐爾遜,依皮提哈爾·買買提.維吾爾語語音語料庫管理軟件的研究與實(shí)現(xiàn)[J].新疆大學(xué)學(xué)報(自然科學(xué)版),2011,28(2):242-247.

        [5]陳秉智,次多.青藏建筑與民俗[M].天津:百花文藝出版社,2004.

        [6]張統(tǒng)宣.陜北民歌語料庫構(gòu)建及WEB管理系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)與數(shù)字工程,2010,38(12):128-129.

        [7]趙宗福.西北花兒的文化形態(tài)與文化傳承——以青?;▋簽槔跩].西北民族研究,2011,(1):117-127.

        [8]苑森淼,康輝.數(shù)據(jù)庫系統(tǒng)教程[M].北京:清華大學(xué)出版社,2008.

        [9]陳偉.SQL Server 2005數(shù)據(jù)庫應(yīng)用與開發(fā)教程[M].北京:清華大學(xué)出版社,2007.

        [10]鄒法欣.語音語料庫的設(shè)計(jì)與實(shí)現(xiàn)[D].桂林:廣西師范大學(xué)碩士學(xué)位論文,2012.

        猜你喜歡
        數(shù)據(jù)庫用戶系統(tǒng)
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無人機(jī)系統(tǒng)
        ZC系列無人機(jī)遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        国产综合无码一区二区色蜜蜜| 国产亚洲中文字幕久久网| 日韩中文字幕一区二区二区| 97人妻人人做人碰人人爽| 中国丰满大乳乳液| 在线无码精品秘 在线观看| 在线不卡精品免费视频| 精品久久久久久无码专区| 无码综合天天久久综合网| 日本口爆吞精在线视频| 操国产丝袜露脸在线播放| 视频一区视频二区制服丝袜| 国产亚洲精品久久久久婷婷瑜伽| 色狠狠一区二区三区香蕉蜜桃| 国产日本精品一区二区| 国产精品亚洲精品日韩已方| 人妻少妇精品中文字幕av蜜桃| 91精品久久久久含羞草| 99视频一区二区日本| 成人免费看aa片| 白嫩少妇激情无码| 国产亚洲av手机在线观看| av黄页网国产精品大全| 国产精品欧美福利久久| 亚洲国产精品久久久久久网站| 亚洲小少妇一区二区三区| 成人午夜高潮a∨猛片| 福利视频一二三在线观看| 国产精品久久久久免费a∨不卡| 午夜蜜桃视频在线观看| 日本少妇高潮喷水xxxxxxx| 双腿张开被9个黑人调教影片| 国产毛片三区二区一区| 人妻少妇中文字幕在线观看| 国产情侣久久久久aⅴ免费| 国产美女高潮流白浆在线观看| 日韩精品一区二区亚洲专区| 成人无码av一区二区| 久久免费国产精品| 亚洲产在线精品亚洲第一页| 无遮挡1000部拍拍拍免费|