亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        上下文無關文法在孤立詞識別中的應用

        2011-10-25 08:02:24李玉萍
        關鍵詞:喬姆斯基文法字符串

        李玉萍

        (商丘師范學院,河南 商丘476000)

        上下文無關文法在孤立詞識別中的應用

        李玉萍

        (商丘師范學院,河南 商丘476000)

        在孤立詞識別的過程中引入了非遞歸上下文無關文法。針對語音識別中的多個變量問題需要進行多次訓練,根據(jù)樣本中表達特征的字符串集在訓練模式中為每個孤立詞構造一個上下無關文法。在識別的過程中,對輸入的字符串進行分析,符合該文法輸出該字符串,并說明該字符串符合該文法。

        上下文無關文法;孤立詞;識別

        語音識別是一門結合了計算機技術和計算機語言學等多種學科的交叉學科。孤立詞識別是語音識別的一種,語音識別模型如圖1所示。孤立詞識別系統(tǒng)對人的發(fā)聲間隔中的詞進行單獨識別的一個系統(tǒng),同時語音識別也是一種模式識別的實例。孤立詞識別系統(tǒng)通常由特征抽取和識別器兩部分組成。特征抽取把語音信號轉(zhuǎn)換成字符串符號;識別器考察該字符串是否在詞匯表,如果在則輸出,不在輸出錯誤信號。傳統(tǒng)的識別方法大都是建立在模式識別的基礎上,本文引入上下文無關文法對識別器進行構造,并對輸入串進行識別。

        一、相關定義

        定義1:設G=(VN,VT,P,S)為一文法,其中VN為非終結符號,VT為終結符,P為文法的產(chǎn)生式集合,若P中的每個產(chǎn)生式α→β均滿足:α是一非終結符,β∈(VN UVT)*,則此文法稱為2型的或上下文無關文法。

        定義2:任何非空,并且不含ε的上下文無關文法G,如果G中所有的產(chǎn)生式的形式為下列兩個形式之一:

        (1)A-->BC

        (2)A-->a

        其中,A,B,C∈VN,a∈VT,

        那么,我們稱這種形式的文法G為喬姆斯基范式文法或者喬姆斯基范式 (Chomsky Normal Form),簡記為:CNF。

        二、上下文無關文法的應用

        上下文無關文法(CFG)是這樣的一種文法:它所定義的語法范疇(或語法單位)完全獨立于這種范疇可能出現(xiàn)的環(huán)境。其特點是在對非終結符進行替換時不需要聯(lián)系上下文,并且可以替換成空串。上下文無關文法的識別問題,就是對給定的一個上下文無關文法G,和一個串α(α∈VT*),確定是否存在推導:S=>*α的問題。在上下文無關文法中,喬姆斯基范式是經(jīng)常使用的特殊文法。并且所有的上下文無關文法都可以轉(zhuǎn)換成喬姆斯基范式。

        在孤立詞識別系統(tǒng)中,假設特征抽取出的符號是有限數(shù)量的,每個孤立詞產(chǎn)生的字符串長度也是有限的。在設計識別器時可以分成兩部分工作,如圖2所示,首先構造能夠生成樣本符號串的上下文無關文法,這個過程可以看成一個編碼過程;然后利用該文法模型對任意輸入的字符串進行分析識別,看是否符合該文法,該過程可以看成一個解碼過程。

        在文法構造的過程中,詞匯中的每個單詞聲音由特征抽取轉(zhuǎn)換成符號串,該符號串由識別器自動生成上下文無關文法,通常該文法在構造的過程中采用喬姆斯基范式的形式,存儲到計算機中供以后使用。經(jīng)過多次訓練,反復重寫,為樣本字符串集構造相應的上下文無關文法,每個模型可以描述相似的字符串。具體的構造算法:首先為第一個字符串構造文法G1,該文法目前只能生成該字符串,然后對其他的字符串進行考察,如果能夠被識別,則考察其他字符串,不能識別則生成G2,依次對樣本中的所有字符串進行考察,直到文法規(guī)則不再擴大為止。構造好的上下文無關文法模型對以后的輸入串進行識別分析,從而判斷該輸入串是否符合該文法,符合則輸出,不符合則拒絕。

        三、基于上下文無關文法的孤立詞識別算法

        在識別過程中,被輸入的字符串采用上下文無關文法識別字符串的算法進行識別,常用的分析方法有自上而下分析法、自下而上分析法、CYK算法等。由于語音信息具有噪音信息,轉(zhuǎn)換成的字符串符號針對該文法具有二義性,因此我們采用三層分析方式。第一層對輸入的字符串進行分析,如果只能采用一個文法,則輸出該字符串,如果不能采用第二層分析,第二層采用近似匹配的原則對可以由兩個以上的文法所能識別的字符串進行分析,采用最優(yōu)的文法。第三層對采用近似匹配策略仍有多個文法可以生成該字符串,采用隨機算法進行分析,從而選取最合適的文法進行輸入串識別,然后輸出。

        上下文無關文法為孤立詞識別提供了一個非常好的分類和描述方法。用上下文無關文法規(guī)則來表達樣本字符串代替直接存儲樣本字符串,從而節(jié)省了大量的存儲空間,提高了訪問效率,對語音識別技術的發(fā)展提供一個很好的模型,上下文無關文法在孤立詞識別中的應用具有重要的理論和實踐意義。

        [1]吳哲輝,吳振寰.形式語言與自動機[M].北京:北京機械工業(yè)出版社,2007:40-42.

        [2]陳火旺,劉春林,譚慶平等.程序設計編譯原理[M].北京:國防工業(yè)出版社,2003:51-53.

        H02

        A

        1673-0046(2011)05-0174-01

        猜你喜歡
        喬姆斯基文法字符串
        關于1940 年尼瑪抄寫的《托忒文文法》手抄本
        Similarity measurement method of high-dimensional data based on normalized net lattice subspace①
        Teaching methods in a Chinese Classroom
        A nearest neighbor search algorithm of high-dimensional data based on sequential NPsim matrix①
        文法有道,為作文注入音樂美
        學生天地(2016年26期)2016-06-15 20:29:39
        Comments on Chomsky
        一種新的基于對稱性的字符串相似性處理算法
        依據(jù)字符串匹配的中文分詞模型研究
        一種針對Java中字符串的內(nèi)存管理方案
        跨越政治批評與學術研究的疆界——喬姆斯基訪談錄
        少妇高潮喷水正在播放| 一区二区在线观看视频亚洲| 人妻av中文字幕精品久久| 免费看草逼操爽视频网站| 东风日产车是不是国产的| 四虎国产成人永久精品免费| 波多野结衣乳巨码无在线| 国产成人午夜福利在线小电影 | 极品夫妻一区二区三区| 国产成人精品日本亚洲专区61| 亚洲精品久久一区二区三区777| 撕开奶罩揉吮奶头视频| 亚洲成在人线av| 日韩中文字幕一区二区高清| 中文字幕精品亚洲二区| 男女激情视频网站在线| 亚洲 欧美 偷自乱 图片| 真人新婚之夜破苞第一次视频| 欧美亚洲高清日韩成人| 午夜婷婷国产麻豆精品| 精品无码一区二区三区的天堂| 国语对白做受xxxxx在| 亚洲乱码av中文一区二区| 国产在线手机视频| 国产一区二区欧美丝袜 | 亚洲综合久久中文字幕专区一区 | 日韩av一区二区蜜桃| 激情亚洲一区国产精品久久| 亚洲日韩国产一区二区三区在线| 成人精品一级毛片| 最新日本免费一区二区三区| 日本第一影院一区二区| 中文字幕人乱码中文字幕| 亚洲国产成人va在线观看天堂| 99久久久精品免费香蕉| 亚洲美女性生活一级片| 国产流白浆视频在线观看| 国产精品亚洲色婷婷99久久精品| 国产95在线 | 欧美| 精品国产日韩无 影视| a级三级三级三级在线视频|