亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        維吾爾語元音的聲頻特性分析和識(shí)別

        2010-10-15 01:38:08王昆侖張貫虹吐爾洪江阿布都克力木
        中文信息學(xué)報(bào) 2010年2期
        關(guān)鍵詞:維語維吾爾語元音

        王昆侖,張貫虹,吐爾洪江?阿布都克力木

        (1.合肥學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系網(wǎng)絡(luò)與智能信息處理重點(diǎn)實(shí)驗(yàn)室,安徽合肥230601,2.新疆師范大學(xué)數(shù)理信息學(xué)院,新疆烏魯木齊830001)

        1 引言

        現(xiàn)代維吾爾語(以下簡(jiǎn)稱維語)屬阿爾泰語系突厥語族,維語語音音節(jié)由元音和輔音構(gòu)成,每個(gè)音節(jié)必須且只能有一個(gè)元音,維語語音的八個(gè)元音分別是/i、e、ε、a、o、?、u、y/ 。由于單元音可構(gòu)成音節(jié),因此在語音識(shí)別技術(shù)中常對(duì)元音進(jìn)行精密的聲學(xué)測(cè)量。

        隨著計(jì)算機(jī)多媒體技術(shù)的發(fā)展,各種語言的語音識(shí)別研究工作在深入展開。呼和[1]、伊?達(dá)瓦[2]對(duì)蒙古語的元音進(jìn)行了定量和定性分析;李凈[3]等以擴(kuò)展聲韻母為漢語連續(xù)語音識(shí)別的聲學(xué)建模識(shí)別基元,識(shí)別性能有了很大提高;曹劍芬[4]等采用聲學(xué)和生理實(shí)驗(yàn)以及感知實(shí)驗(yàn)相結(jié)合的方法,探討了漢語“2”與“8”的區(qū)別性語音學(xué)特征及其在二者識(shí)別中的作用。在缺乏聲調(diào)信息的情況下,第三共振峰(F3)的差異是決定性的區(qū)別特征。他們認(rèn)為在自動(dòng)語音識(shí)別中,加強(qiáng)對(duì)語音學(xué)特征知識(shí)的了解是個(gè)迫在眉睫的任務(wù),在系統(tǒng)中充分地綜合利用這些區(qū)別性特征信息,是提高識(shí)別率的有效途徑。張家騄[5]等根據(jù)漢語普通話語音知覺混淆的群集分析結(jié)果,建立了聲韻調(diào)體系的區(qū)別特征系統(tǒng)。易斌[6]對(duì)維語的/i/元音進(jìn)行了聲學(xué)特征分析,結(jié)合聲學(xué)分析結(jié)果對(duì)該元音的音值進(jìn)行了討論;陶梅[7]等根據(jù)維吾爾語的特點(diǎn),分析設(shè)計(jì)了維吾爾語語音識(shí)別系統(tǒng)的總體結(jié)構(gòu),討論了維吾爾語最佳識(shí)別基元的選擇方法,提出建立基于決策樹聚類的上下文相關(guān)模型,并采用混合高斯分布(GMD)擬合觀測(cè)概率分布,優(yōu)化維吾爾語連續(xù)語音中HMM模型系統(tǒng)以提高識(shí)別性能。王昆侖[8-9]在維語語音識(shí)別和識(shí)別基元問題上做了初步的探討。更多的維語語音學(xué)的研究在元音、輔音的性質(zhì)、發(fā)音部位、發(fā)音方法等方面做了大量的工作,維語的實(shí)驗(yàn)語音學(xué)方面有許多基礎(chǔ)性問題需要研究。本文運(yùn)用實(shí)驗(yàn)語音學(xué)的基本理論和方法,對(duì)維吾爾語八個(gè)元音進(jìn)行聲頻特性統(tǒng)計(jì)分析和識(shí)別驗(yàn)證。

        2 聲學(xué)資料

        本文實(shí)驗(yàn)所采用的聲學(xué)資料來源于新疆師范大學(xué)建立的維吾爾語綜合語音數(shù)據(jù)庫(kù)[10]。發(fā)音人的選擇以標(biāo)準(zhǔn)音為準(zhǔn),年齡在18~30歲之間,同時(shí)兼顧各地區(qū)的特點(diǎn),對(duì)發(fā)音人沒有地域方言限制,可以帶方言,常態(tài)自然發(fā)音。錄音環(huán)境為與實(shí)用環(huán)境相近的辦公室,噪音<45db。錄音工作以PC(386)機(jī)為主體,配以Sound Blaster—16位聲卡和駐極電容式話筒進(jìn)行錄制,采樣頻率為22050Hz,采樣精度為16bits,多音節(jié)語料的錄音語速約4個(gè)音節(jié)/秒。錄音使用自編的錄音工具軟件進(jìn)行,語音數(shù)據(jù)采用WAV文件格式存儲(chǔ)。同組發(fā)音人之間實(shí)行實(shí)時(shí)監(jiān)聽、監(jiān)控。語音數(shù)據(jù)庫(kù)以一個(gè)音節(jié)或詞為單位存儲(chǔ),加上包含該語音數(shù)據(jù)有關(guān)參數(shù)的文件頭,參數(shù)包括發(fā)音人信息,語料信息和切分標(biāo)注信息。

        3 維吾爾語元音的共振峰頻率分析

        3.2 實(shí)驗(yàn)數(shù)據(jù)

        為了使實(shí)驗(yàn)具有一定的代表性,實(shí)驗(yàn)從維吾爾語綜合語音數(shù)據(jù)庫(kù)[10]里任意抽取了男、女聲各10名共160個(gè)元音語音語料,我們分男聲、女聲和男女混合三組測(cè)量了八個(gè)元音的五個(gè)共振峰頻率值(F1、F2、F3、F4和F5)。全部樣點(diǎn)在元音共振峰的相對(duì)穩(wěn)定段選取,對(duì)所測(cè)得的共振峰數(shù)據(jù)進(jìn)行了統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果見附錄A。其中離散度是標(biāo)準(zhǔn)差與平均值的比值,用來衡量各個(gè)體距平均值的遠(yuǎn)近。

        共振峰頻率是語音信號(hào)的一個(gè)很重要的特征參數(shù),它的配置和時(shí)間模式反映出語音音色的重要特征,在語音的分析、識(shí)別、合成等研究中被廣泛的利用。

        3.1 分析方法

        在語音信號(hào)的共振峰分析的眾多方法中,線性預(yù)測(cè)編碼(Linear Prediction Coding,LPC)[11]是一種常用的分析方法,LPC模型中,數(shù)字濾波器傳遞函數(shù)H(z)為公式(1)。

        表1 維吾爾語元音共振峰頻率統(tǒng)計(jì)表

        續(xù)表

        根據(jù)表1的數(shù)據(jù),繪制的JOSS型聲學(xué)元音圖見圖1、圖2和圖3。每個(gè)元音音位的外圈以平均值為中心,半徑按“平均值±標(biāo)準(zhǔn)差”值大小繪制。這樣繪制成的聲學(xué)元音圖與元音舌位圖有很好的對(duì)應(yīng)性,元音外圈的大小反映該音位的離散度。

        圖 1 維吾爾語八個(gè)元音 F1-F2分布(男性發(fā)音10人)

        圖 2 維吾爾語八個(gè)元音 F1-F2分布(女性發(fā)音10人)

        圖3 維吾爾語八個(gè)元音F1-F2分布(男女混合發(fā)音20人)

        3.3 實(shí)驗(yàn)分析及結(jié)果

        Delatrre[12]對(duì)舌位和共振峰的關(guān)系進(jìn)行的研究認(rèn)為,用口腔開度(上、下門齒之間的距離)與F1相聯(lián)系,用舌頭整體的后縮前伸與F2相關(guān)聯(lián)。他的結(jié)論是:F1頻率增加同開口度直接相關(guān),頻率值越高開口度越大,頻率值越低開口度越小;F2降低同舌頭后縮直接相關(guān),頻率越低舌位越后,頻率越高舌位越前;另外F2與圓唇度有關(guān),唇越圓,F2也越低。

        由本文實(shí)驗(yàn)所得數(shù)據(jù)(表1、圖1、圖 2、圖3)分析得出:

        1)維語的男聲和女聲兩類發(fā)音人的八個(gè)元音相對(duì)位置是完全一致的,在圖1、圖2和圖3上的排列是合理的。/i/、/y/是等高的前高元音,/e/和/?/是等高的的前次元音,/ε/是前次低元音;從后元音看,/u/是高元音,/o/是次高元音。/a/元音是所有元音中最低的元音,而且是居于中間位置。

        2)/a/音位是最低的一個(gè)元音,其F1位于543~918Hz的區(qū)域內(nèi)。

        3)/ε/元音音位相對(duì)集中,是維語元音中舌位最低的前元音,兩類發(fā)音人的F2均值分別為1905Hz、1640Hz。/ε/ 音位從總體上看,在高緯度(F1)上與/a/相當(dāng),在前后緯(F2)上,/ε/和/a/分得比較清楚,/ε/在前而/a/在后。

        4)/e/、/?/元音在維語中的發(fā)音比較集中,離散度較小。這兩個(gè)元音都屬于前元音,但/?/的F2比/e/的降低了535Hz(女發(fā)音人)和409Hz(男發(fā)音人)。這種F2的降低、表明了該兩類元音發(fā)音的相對(duì)圓唇度和相對(duì)舌位后縮度。

        5)/u/、/o/是彼此獨(dú)立又相互靠近的兩個(gè)后元音,它們的F2的離散度都大于10%,發(fā)音的舌位靠后。

        6)/y/、/i/ 元音的F1、F2的離散度較大,因此在聲學(xué)元音圖上所占范圍較大。/y/與/i/相比,高度(F1)相當(dāng),但/y/的F2比/i/的小,這是因?yàn)?y/圓唇的影響。

        7)從圖1、圖2和圖3中可以看出維吾爾語各個(gè)元音有較獨(dú)立的共振峰頻率分布,因此在通常的會(huì)話中各元音的音色聽起來比較清楚。

        8)從表1中還可知維吾爾語各個(gè)元音的共振峰頻率F1、F2具有較大的差別,這表明各個(gè)元音具有不同的聲學(xué)特性,在用計(jì)算機(jī)進(jìn)行維吾爾語元音的語音識(shí)別時(shí),應(yīng)該有較高的正確識(shí)別率。

        3.4 維語、漢語元音對(duì)比

        我們參照吳宗濟(jì)[13]漢語普通話元音共振峰頻率數(shù)據(jù)(見表2和圖4),把漢語普通話10個(gè)元音和8個(gè)維語元音的共振峰頻率數(shù)據(jù)進(jìn)行對(duì)比,可以看出:

        1)漢、維語中都有前、半低、不圓唇元音/ε/、/er/,但維語/ε/比漢語/er/舌位略低,開口度略大,維語/ε/的 F1、F2值分別比漢語/er/ 降低了50Hz和 150Hz。

        2)漢語中獨(dú)有的音位有/i/(資)、/i/(知)、/r/ 、/e/,維語中獨(dú)有的音位有/e/ 、/?/ 。

        3)除了以上完全不同的音位外,漢維語中其他元音的音位大致上相對(duì)應(yīng),F1、F2共振峰頻率值相差不大。

        表2 漢語普通話10個(gè)元音共振峰頻率數(shù)據(jù)表

        圖4 漢語普通話十個(gè)元音聲學(xué)元音圖

        圖5 維吾爾語八個(gè)元音聲學(xué)元音圖

        4 維語元音語音識(shí)別及分析

        本文使用隱馬爾可夫模型工具集[14](Hidden Markov Model ToolKit,HTK)對(duì)維語八個(gè)元音進(jìn)行語音識(shí)別實(shí)驗(yàn),并分析實(shí)驗(yàn)結(jié)果驗(yàn)證維語八個(gè)元音共振峰頻率分布規(guī)律的正確性。

        4.1 HTK及模型參數(shù)

        聲學(xué)模型是識(shí)別系統(tǒng)的底層模型,和語言發(fā)音特點(diǎn)密切相關(guān),并且是語音識(shí)別系統(tǒng)中最關(guān)鍵的一部分[3-4]。通過概率密度函數(shù)計(jì)算語音參數(shù)對(duì)HMM模型的輸出概率,經(jīng)搜索最佳狀態(tài)序列,以最大后驗(yàn)概率得到識(shí)別結(jié)果。對(duì)以上共振峰頻率的分析結(jié)果,用H TK進(jìn)行元音識(shí)別實(shí)驗(yàn)以確認(rèn)分析結(jié)果的正確性。實(shí)驗(yàn)數(shù)據(jù)所用的特征向量是39維的 MFCC(Mel-Frequency Cepstrum Coefficients),其中包括20階倒譜系數(shù)?;贖TK的語音識(shí)別流程見圖6,其中:

        1)數(shù)據(jù)準(zhǔn)備。準(zhǔn)備訓(xùn)練及待識(shí)別語音文件(.wav),訓(xùn)練語音的特征文件(.mfc、.plp)。

        2)創(chuàng)建模型及學(xué)習(xí)。首先構(gòu)建Proto文件,定義模型拓?fù)浣Y(jié)構(gòu),構(gòu)建單音素模型。使用HComp V工具統(tǒng)計(jì)訓(xùn)練數(shù)據(jù)全局均值、方差,HInit估計(jì)出初始模型參數(shù)。然后通過多次使用HERest工具重估模型參數(shù),進(jìn)行模型學(xué)習(xí)。

        3)識(shí)別及評(píng)估。使用HVite工具進(jìn)行識(shí)別,H Results工具進(jìn)行評(píng)估。

        圖6 基于HTK的語音識(shí)別流程

        4.2 實(shí)驗(yàn)及結(jié)果分析

        由于男聲語音和女聲語音在聲學(xué)特征上有比較明顯的區(qū)分,為了得到更明顯的實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)分四組進(jìn)行。實(shí)驗(yàn)數(shù)據(jù)同3.2節(jié)所述,分別用10名男發(fā)音人語音和10名女發(fā)音人語音訓(xùn)練得到識(shí)別模型M 1和M2,從中任取3男3女語料作為集內(nèi)識(shí)別語音M-in-Set和F-in-Set,另外從文獻(xiàn)[10]中任取3男3女元音語料作為集外識(shí)別語音M-out-Set和F-out-Set。在識(shí)別模型M1和M 2中分別測(cè)試男、女聲和集內(nèi)、外的交叉語音識(shí)別結(jié)果如表3。

        表3 維語八個(gè)元音的識(shí)別結(jié)果(識(shí)別率%)

        實(shí)驗(yàn)結(jié)果分析:

        1)從表3中可知,維語八個(gè)元音具有很高的識(shí)別率,幾乎為百分之百的識(shí)別,其原因和前面3.3節(jié)所述是相同的。維吾爾語各個(gè)元音的共振峰頻率F1、F2具有較大的差別,這表明各個(gè)元音具有不同的聲學(xué)特性,在用計(jì)算機(jī)進(jìn)行維吾爾語元音的語音識(shí)別時(shí),具有很高的識(shí)別正確率,驗(yàn)證了3.3節(jié)的分析結(jié)論。

        2)表3中元音/?/,/y/在M 1模型下女聲識(shí)別集外識(shí)別率和元音/e/,/i/在M 2模型下男聲識(shí)別集外識(shí)別率略有下降。對(duì)實(shí)驗(yàn)語料分析后,元音/?/,/y/在M1模型下女聲識(shí)別集外識(shí)別率略有下降的主要原因是個(gè)別男聲實(shí)驗(yàn)語料的發(fā)音清晰度不夠,有4人的發(fā)音存在一定的混濁發(fā)音現(xiàn)象,另外,實(shí)驗(yàn)語料存在男、女聲發(fā)音音強(qiáng)差別較大的問題;元音/e/,/i/在M 2模型下男聲識(shí)別集外識(shí)別率略有下降的主要原因除了上面的原因之外,我們還發(fā)現(xiàn)男聲集外識(shí)別集中的一男聲發(fā)音/e/的F2共振峰值發(fā)生了跳躍,如圖5所示,影響了語音識(shí)別的結(jié)果。所以,影響識(shí)別率的主要原因來自于第2節(jié)介紹的語料數(shù)據(jù)庫(kù),如發(fā)音者發(fā)音狀態(tài)、方言和語料采集環(huán)境等因素。

        圖7 男聲元音/e/的共振峰圖

        5 結(jié)論

        通過對(duì)維吾爾語八個(gè)元音進(jìn)行的物理聲學(xué)分析,在維吾爾語綜合語音數(shù)據(jù)庫(kù)的實(shí)驗(yàn)數(shù)據(jù)條件下,給出了維吾爾語八個(gè)元音的共振峰分布參數(shù)和實(shí)驗(yàn)分析,同時(shí)通過元音識(shí)別實(shí)驗(yàn)驗(yàn)證了本次實(shí)驗(yàn)結(jié)果的正確性??梢钥闯鼍S吾爾語的八個(gè)元音具有比較強(qiáng)的可區(qū)分聲頻特性,在進(jìn)行語音識(shí)別時(shí)能夠獲取很高的識(shí)別率,因此對(duì)于維吾爾語元音語音信息傳送接受的估計(jì)正確性會(huì)比較高。

        對(duì)于維吾爾語輔音聲頻特性及其分析以及在連續(xù)語音條件下,基于維吾爾語語言的構(gòu)詞規(guī)律以及發(fā)音規(guī)律的特殊性和特殊現(xiàn)象,將更為復(fù)雜,此方面的實(shí)驗(yàn)結(jié)果我們將另文闡述。

        附錄A 維吾爾語元音共振峰頻率統(tǒng)計(jì)表

        續(xù)表

        [1]呼和.蒙古語元音的聲學(xué)分析[J].民族語文,1999,(4):58-60.

        [2]伊?達(dá)瓦,大川茂村,白井克彥.蒙古語七個(gè)元音聲頻特性計(jì)算機(jī)分析[J].聲學(xué)學(xué)報(bào),1999,24(1):94-97.

        [3]李凈,鄭方,張繼勇,吳文虎.漢語連續(xù)語音識(shí)別中上下文相關(guān)的聲韻母建模[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,44(1):61-64.

        [4]曹劍芬,李愛軍,胡方,張利剛.語音學(xué)知識(shí)在語音識(shí)別中的應(yīng)用[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,S1:748-753.

        [5]張家騄.漢語普通話區(qū)別特征系統(tǒng)[J].聲學(xué)學(xué)報(bào),2005,30(6):506-514.

        [6]易斌.現(xiàn)代維吾爾語元音/i/的實(shí)驗(yàn)分析[J].語言與翻譯(漢文),2008,(1):20-24.

        [7]陶梅,吾守爾?斯拉木,那斯?fàn)柦?吐爾遜.基于HTK的維吾爾語連續(xù)語音聲學(xué)建模[J].中文信息學(xué)報(bào),2008,22(5):56-59.

        [8]王昆侖.維吾爾語音節(jié)語音識(shí)別基元的研究[J].計(jì)算機(jī)科學(xué),2003,30(7):182-184.

        [9]王昆侖.基于CDCPM的維吾爾語非特定人語音識(shí)別[J].計(jì)算機(jī)研究與發(fā)展,2001,38(10):1242-1246.

        [10]王昆侖,樊志錦,吐爾洪江,方曉華,徐紹瓊,吾買爾.維吾爾語綜合語音數(shù)據(jù)庫(kù)系統(tǒng)[C]//第五屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集,1998.

        [11]楊行駿.語音信號(hào)與數(shù)字處理[M].電子工業(yè)出版社,1995.

        [12]Delattre,P.The physiological interpretation of sound spectrogram[M].PLM A,Vol LXVI(5),1951.

        [13]吳宗濟(jì).普通話單音節(jié)語圖冊(cè)[M].中國(guó)社會(huì)科學(xué)出版社,1986.

        [14]http://htk.eng.cam.ac.uk/.

        猜你喜歡
        維語維吾爾語元音
        對(duì)比語言學(xué)視野下的維吾爾語與朝鮮語音義相近詞比較初探
        元音字母和元音字母組合的拼讀規(guī)則
        淺析維語口語技能的影響因素和提升路徑
        元音字母和元音字母組合的拼讀規(guī)則
        統(tǒng)計(jì)與規(guī)則相結(jié)合的維吾爾語人名識(shí)別方法
        維吾爾語話題的韻律表現(xiàn)
        維吾爾語詞重音的形式判斷
        語言與翻譯(2015年4期)2015-07-18 11:07:45
        Playing with “ar”
        現(xiàn)代維吾爾語中“-0wat-”的進(jìn)行體特征
        語言與翻譯(2014年3期)2014-07-12 10:32:09
        試析否定詞綴在漢維語中的不同表現(xiàn)
        語言與翻譯(2014年3期)2014-07-12 10:31:56
        日本一区二区三区亚洲| 久久狠色噜噜狠狠狠狠97| 亚洲天堂无码AV一二三四区| 久久成人精品国产免费网站| 亚洲av日韩av激情亚洲| 久久国产精品精品国产色婷婷| 国产午夜在线观看视频播放| 二区三区视频在线观看| 一本大道道久久综合av| 国产精品无码久久久久成人影院| 亚洲综合无码| 一本大道综合久久丝袜精品| 虎白女粉嫩粉嫩的18在线观看 | 国产精品麻豆一区二区三区| 中文字幕人乱码中文字幕| 五十路熟妇高熟无码视频| 亚欧乱色束缚一区二区三区| 日本高清一区二区不卡| 欧美日韩精品一区二区视频| 曰本女人与公拘交酡免费视频| 久久精品国产成人午夜福利| 国产一区白浆在线观看| 377p日本欧洲亚洲大胆张筱雨 | 黄 色 成 年 人 网 站免费| 伊人久久大香线蕉av不变影院 | 青青草原综合久久大伊人| 在线观看国产精品91| av免费在线播放观看| 国产片精品av在线观看夜色| 久久亚洲国产精品成人av秋霞 | 中文字幕午夜精品一区二区三区 | 强行无套内谢大学生初次| 国产精品女同一区二区久久| 中文字幕文字幕一区二区| 99无码精品二区在线视频| 国产一在线精品一区在线观看 | 日本一区二区免费看片| 曰本女人与公拘交酡| 波多野结衣视频网址| 91中文字幕精品一区二区| 成人无码一区二区三区|