亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        上下文無關文法在孤立詞識別中的應用

        2011-10-25 08:02:24李玉萍
        關鍵詞:喬姆斯基文法字符串

        李玉萍

        (商丘師范學院,河南 商丘476000)

        上下文無關文法在孤立詞識別中的應用

        李玉萍

        (商丘師范學院,河南 商丘476000)

        在孤立詞識別的過程中引入了非遞歸上下文無關文法。針對語音識別中的多個變量問題需要進行多次訓練,根據(jù)樣本中表達特征的字符串集在訓練模式中為每個孤立詞構造一個上下無關文法。在識別的過程中,對輸入的字符串進行分析,符合該文法輸出該字符串,并說明該字符串符合該文法。

        上下文無關文法;孤立詞;識別

        語音識別是一門結合了計算機技術和計算機語言學等多種學科的交叉學科。孤立詞識別是語音識別的一種,語音識別模型如圖1所示。孤立詞識別系統(tǒng)對人的發(fā)聲間隔中的詞進行單獨識別的一個系統(tǒng),同時語音識別也是一種模式識別的實例。孤立詞識別系統(tǒng)通常由特征抽取和識別器兩部分組成。特征抽取把語音信號轉(zhuǎn)換成字符串符號;識別器考察該字符串是否在詞匯表,如果在則輸出,不在輸出錯誤信號。傳統(tǒng)的識別方法大都是建立在模式識別的基礎上,本文引入上下文無關文法對識別器進行構造,并對輸入串進行識別。

        一、相關定義

        定義1:設G=(VN,VT,P,S)為一文法,其中VN為非終結符號,VT為終結符,P為文法的產(chǎn)生式集合,若P中的每個產(chǎn)生式α→β均滿足:α是一非終結符,β∈(VN UVT)*,則此文法稱為2型的或上下文無關文法。

        定義2:任何非空,并且不含ε的上下文無關文法G,如果G中所有的產(chǎn)生式的形式為下列兩個形式之一:

        (1)A-->BC

        (2)A-->a

        其中,A,B,C∈VN,a∈VT,

        那么,我們稱這種形式的文法G為喬姆斯基范式文法或者喬姆斯基范式 (Chomsky Normal Form),簡記為:CNF。

        二、上下文無關文法的應用

        上下文無關文法(CFG)是這樣的一種文法:它所定義的語法范疇(或語法單位)完全獨立于這種范疇可能出現(xiàn)的環(huán)境。其特點是在對非終結符進行替換時不需要聯(lián)系上下文,并且可以替換成空串。上下文無關文法的識別問題,就是對給定的一個上下文無關文法G,和一個串α(α∈VT*),確定是否存在推導:S=>*α的問題。在上下文無關文法中,喬姆斯基范式是經(jīng)常使用的特殊文法。并且所有的上下文無關文法都可以轉(zhuǎn)換成喬姆斯基范式。

        在孤立詞識別系統(tǒng)中,假設特征抽取出的符號是有限數(shù)量的,每個孤立詞產(chǎn)生的字符串長度也是有限的。在設計識別器時可以分成兩部分工作,如圖2所示,首先構造能夠生成樣本符號串的上下文無關文法,這個過程可以看成一個編碼過程;然后利用該文法模型對任意輸入的字符串進行分析識別,看是否符合該文法,該過程可以看成一個解碼過程。

        在文法構造的過程中,詞匯中的每個單詞聲音由特征抽取轉(zhuǎn)換成符號串,該符號串由識別器自動生成上下文無關文法,通常該文法在構造的過程中采用喬姆斯基范式的形式,存儲到計算機中供以后使用。經(jīng)過多次訓練,反復重寫,為樣本字符串集構造相應的上下文無關文法,每個模型可以描述相似的字符串。具體的構造算法:首先為第一個字符串構造文法G1,該文法目前只能生成該字符串,然后對其他的字符串進行考察,如果能夠被識別,則考察其他字符串,不能識別則生成G2,依次對樣本中的所有字符串進行考察,直到文法規(guī)則不再擴大為止。構造好的上下文無關文法模型對以后的輸入串進行識別分析,從而判斷該輸入串是否符合該文法,符合則輸出,不符合則拒絕。

        三、基于上下文無關文法的孤立詞識別算法

        在識別過程中,被輸入的字符串采用上下文無關文法識別字符串的算法進行識別,常用的分析方法有自上而下分析法、自下而上分析法、CYK算法等。由于語音信息具有噪音信息,轉(zhuǎn)換成的字符串符號針對該文法具有二義性,因此我們采用三層分析方式。第一層對輸入的字符串進行分析,如果只能采用一個文法,則輸出該字符串,如果不能采用第二層分析,第二層采用近似匹配的原則對可以由兩個以上的文法所能識別的字符串進行分析,采用最優(yōu)的文法。第三層對采用近似匹配策略仍有多個文法可以生成該字符串,采用隨機算法進行分析,從而選取最合適的文法進行輸入串識別,然后輸出。

        上下文無關文法為孤立詞識別提供了一個非常好的分類和描述方法。用上下文無關文法規(guī)則來表達樣本字符串代替直接存儲樣本字符串,從而節(jié)省了大量的存儲空間,提高了訪問效率,對語音識別技術的發(fā)展提供一個很好的模型,上下文無關文法在孤立詞識別中的應用具有重要的理論和實踐意義。

        [1]吳哲輝,吳振寰.形式語言與自動機[M].北京:北京機械工業(yè)出版社,2007:40-42.

        [2]陳火旺,劉春林,譚慶平等.程序設計編譯原理[M].北京:國防工業(yè)出版社,2003:51-53.

        H02

        A

        1673-0046(2011)05-0174-01

        猜你喜歡
        喬姆斯基文法字符串
        關于1940 年尼瑪抄寫的《托忒文文法》手抄本
        Similarity measurement method of high-dimensional data based on normalized net lattice subspace①
        Teaching methods in a Chinese Classroom
        A nearest neighbor search algorithm of high-dimensional data based on sequential NPsim matrix①
        文法有道,為作文注入音樂美
        學生天地(2016年26期)2016-06-15 20:29:39
        Comments on Chomsky
        一種新的基于對稱性的字符串相似性處理算法
        依據(jù)字符串匹配的中文分詞模型研究
        一種針對Java中字符串的內(nèi)存管理方案
        跨越政治批評與學術研究的疆界——喬姆斯基訪談錄
        日韩成人极品在线内射3p蜜臀| 人妻少妇偷人精品视频| 亚洲av色福利天堂久久入口| 亚洲精品国产第一综合色吧| 人妻精品久久无码区| 无码国产精品一区二区高潮 | 国产精品 视频一区 二区三区| 国产成人综合久久精品推荐免费| 国产亚洲精品视频在线| 性生大片免费观看性少妇| 中国女人内谢69xxxxxa片| 乱人伦中文无码视频在线观看| 亚洲综合免费| 夫妻一起自拍内射小视频| 日本av不卡一区二区三区| 亚洲日韩成人无码| 人妻av鲁丝一区二区三区| 国产亚洲精品成人无码精品网站| 日本女同伦理片在线观看| 精品国产一区二区三区a| 婷婷四虎东京热无码群交双飞视频 | 国产在线精品一区二区| 亚洲Va中文字幕无码毛片下载| 亚洲中文字幕乱码免费看| 亚洲乱码中文字幕在线播放 | 亚洲性啪啪无码av天堂| 亚洲综合五月天欧美| 男女啪啪免费视频网址| 人妻中文字幕在线中文字幕| 亚洲加勒比久久88色综合| 老熟妇高潮喷了╳╳╳| av熟女一区二区久久| 亚洲最大一区二区在线观看| 国产欧美成人一区二区a片 | 亚洲 日韩 激情 无码 中出| 亚洲人成网站18禁止久久影院| 国产又黄又爽又无遮挡的视频| 激情网色图区蜜桃av| 青青草骚视频在线观看| 久久久国产精品免费a片3d| 亚洲成av人在线观看无堂无码|