亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語音信號(hào)處理中的識(shí)別技術(shù)

        2020-11-06 06:05:55王雯婕
        科學(xué)與財(cái)富 2020年22期
        關(guān)鍵詞:概率統(tǒng)計(jì)語音識(shí)別機(jī)器學(xué)習(xí)

        王雯婕

        摘要:隨著機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究,以及大數(shù)據(jù)語料的積累,語音識(shí)別技術(shù)得到突飛猛進(jìn)的發(fā)展,開始從實(shí)驗(yàn)室走向市場(chǎng)。語音識(shí)別技術(shù)已經(jīng)逐漸進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。本文主要分析和總結(jié)了當(dāng)前幾種具有代表性的語音識(shí)別方法,介紹了其中關(guān)鍵的語音信號(hào)處理和語言模型建立的方法,最后總結(jié)了目前語音識(shí)別技術(shù)領(lǐng)域的研究成果及進(jìn)展。

        關(guān)鍵詞:語音識(shí)別;信號(hào)處理;機(jī)器學(xué)習(xí);人工智能;概率統(tǒng)計(jì)

        1研究背景

        語音信號(hào)處理,主要包括三項(xiàng)技術(shù),即語音識(shí)別、語音編碼和語音合成。本文所研究的自動(dòng)語音識(shí)別技術(shù),就是讓機(jī)器通過識(shí)別和理解把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。70年代,語音識(shí)別技術(shù)有了重大突破,動(dòng)態(tài)時(shí)間規(guī)整技術(shù)基本成熟,使語音變得可以等長,另外,矢量量化和隱馬爾科夫模型理論也不斷完善,為之后語音識(shí)別的發(fā)展做了鋪墊;80年代對(duì)語音識(shí)別的研究更為徹底,各種語音識(shí)別算法被提出,其中的突出成就包括HMM模型人工神經(jīng)網(wǎng)絡(luò);目前許多國內(nèi)外知名研究機(jī)構(gòu),如微軟、訊飛、Google、IBM都積極開展對(duì)深度學(xué)習(xí)的研究。現(xiàn)在,國內(nèi)有不少語音識(shí)別系統(tǒng)已研制成功。這些系統(tǒng)的性能各具特色——在孤立字大詞匯量語音識(shí)別方面,最具代表性的要數(shù)92年清華大學(xué)電子工程系與中國電子器件公司合作研制成功的THED-919特定人語音識(shí)別與理解實(shí)時(shí)系統(tǒng)[4]? 。

        2語音識(shí)別技術(shù)

        2.1? 語音信號(hào)采集

        語音信號(hào)采集是語音信號(hào)處理的前提。語音通常通過話筒輸入計(jì)算機(jī)。話筒將聲波轉(zhuǎn)換為電壓信號(hào),然后通過A/D裝置(如聲卡)進(jìn)行采樣,從而將連續(xù)的電壓信號(hào)轉(zhuǎn)換為計(jì)算機(jī)能夠處理的數(shù)字信號(hào)。目前多媒體計(jì)算機(jī)已經(jīng)非常普及,聲卡、音箱、話筒等已是個(gè)人計(jì)算機(jī)的基本設(shè)備。其中聲卡是計(jì)算機(jī)對(duì)語音信號(hào)進(jìn)行加工的重要部件,它具有對(duì)信號(hào)濾波、放大、A/D和D/A轉(zhuǎn)換等功能。而且,現(xiàn)代操作系統(tǒng)都附帶錄音軟件,通過它可以驅(qū)動(dòng)聲卡采集語音信號(hào)并保存為語音文件。

        2.2? 語音信號(hào)預(yù)處理

        語音信號(hào)號(hào)在采集后首先要進(jìn)行濾波、A/D變換,預(yù)加重和端點(diǎn)檢測(cè)等預(yù)處理,然后才能進(jìn)入識(shí)別、合成、增強(qiáng)等實(shí)際應(yīng)用。濾波的目的有兩個(gè):一是抑制輸入信號(hào)中頻率超出FS/2的所有分量(FS為采樣頻率),以防止混疊干擾;二是抑制50Hz的電源工頻干擾。因此,濾波器應(yīng)該是一個(gè)帶通濾波器。A/D變換是將語音模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)。A/D變換中要對(duì)信號(hào)進(jìn)行量化,量化后的信號(hào)值與原信號(hào)值之間的差值為量化誤差,又稱為量化噪聲。預(yù)加重處理的目的是提升高頻部分,使信號(hào)的頻譜變得平坦,保持在低頻到高頻的整個(gè)頻帶中,能用同樣的信噪比求頻譜,便于頻譜分析。

        2.3? 語音信號(hào)的特征參數(shù)提取

        1、短時(shí)平均能量En和短時(shí)平均幅度

        短時(shí)平均能量和的短時(shí)平均幅度主要用途如下:

        (1)???? 可以作為區(qū)分清音和濁音的特征參數(shù)。

        (2)???? 在信噪比較高的情況下,短時(shí)能量還可以作為區(qū)分有聲和無聲的依據(jù)。

        (3)???? 可以作為輔助的特征參數(shù)用于語音識(shí)別中。

        2、短時(shí)平均過零率

        短時(shí)平均過零率的應(yīng)用:可以作為區(qū)分清音和濁音的特征參數(shù)。清音過零率高,濁音過零率低。用兩級(jí)判決法進(jìn)行語音端點(diǎn)檢測(cè)。

        短時(shí)平均過零率的局限性:濁音和清音重疊區(qū)域只根據(jù)短時(shí)平均過零率不可能明確地判別清、濁音。

        3、短時(shí)自相關(guān)分析

        4、短時(shí)平均幅度差函數(shù)

        5、基音周期估值

        語音的濁音信號(hào)具有準(zhǔn)周期性,其自相關(guān)函數(shù)在基音周期的整數(shù)倍處取最大值。計(jì)算兩相鄰最大峰值間的距離,就可以估計(jì)出基音周期。為了突出反映基音周期的信息,同時(shí)壓縮其他無關(guān)信息,減小運(yùn)算量,自相關(guān)計(jì)算之前需要對(duì)語音信號(hào)進(jìn)行適當(dāng)預(yù)處理。

        6、線性預(yù)測(cè)系數(shù)

        在語音識(shí)別中,常用線性預(yù)測(cè)編碼技術(shù)抽取語音特征。線性預(yù)測(cè)編碼的基本思想是:語音信號(hào)采樣點(diǎn)之間存在相關(guān)性,可用過去的若干采樣點(diǎn)的線性組合預(yù)測(cè)當(dāng)前和將來的采樣點(diǎn)值。線性預(yù)測(cè)系數(shù)是以通過使預(yù)測(cè)信號(hào)和實(shí)際信號(hào)之間的均方誤差最小來唯一確定。語音線性預(yù)測(cè)系數(shù)作為語音信號(hào)的一種特征參數(shù),已經(jīng)廣泛應(yīng)用于語音處理各個(gè)領(lǐng)域。

        2.4? 語音識(shí)別的主要方法

        語音識(shí)別所采用的方法一般有模板匹配法、隨機(jī)模型法和概率語法分析法三種。這三種方法都是建立在最大似然決策貝葉斯(Bayes)判決的基礎(chǔ)上的。

        (1)模板(template)匹配法

        在訓(xùn)練階段,用戶將詞匯表中的每一個(gè)詞依次說一遍,并且將其特征向量作為模板存入模板庫。在識(shí)別階段,將輸入語音的特征向量序列,依次與模板庫中的每個(gè)模板進(jìn)行相似度比較,將相似度最高者作為識(shí)別結(jié)果輸出。

        (2)?? 隨機(jī)模型法

        隨機(jī)模型法是目前語音識(shí)別研究的主流。其突出的代表是隱馬爾可夫模型。語音信號(hào)在足夠短的時(shí)間段上的信號(hào)特征近似于穩(wěn)定,而總的過程可看成是依次相對(duì)穩(wěn)定的某一特性過渡到另一特性。隱馬爾可夫模型則用概率統(tǒng)計(jì)的方法來描述這樣一種時(shí)變的過程。

        (3)?? 概率語法分析法

        這種方法是用于大長度范圍的連續(xù)語音識(shí)別。語音學(xué)家通過研究不同的語音語譜圖及其變化發(fā)現(xiàn),雖然不同的人說同一些語音時(shí),相應(yīng)的語譜及其變化有種種差異,但是總有一些共同的特點(diǎn)足以使他們區(qū)別于其他語音,也即語音學(xué)家提出的“區(qū)別性特征”。

        除了上面的三種語音識(shí)別方法外,還有許多其他的語音識(shí)別方法。例如,基于人工神經(jīng)網(wǎng)絡(luò)的語音識(shí)別方法,是目前的一個(gè)研究熱點(diǎn)。目前用于語音識(shí)別研究的神經(jīng)網(wǎng)絡(luò)有BP神經(jīng)網(wǎng)絡(luò)、Kohcmen特征映射神經(jīng)網(wǎng)絡(luò)等,特別是深度學(xué)習(xí)用于語音識(shí)別取得了長足的進(jìn)步。

        3結(jié)束語

        本文簡要介紹了語音識(shí)別的主要方法以及語音識(shí)別領(lǐng)域的發(fā)展與現(xiàn)狀,將語音識(shí)別的各個(gè)過程進(jìn)行了詳細(xì)介紹和概括總結(jié),分析了各種語音識(shí)別方法的特點(diǎn)和實(shí)現(xiàn)方式。語音識(shí)別是一門交叉學(xué)科,它涉及到信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等方面的知識(shí),所以它的發(fā)展依賴于各個(gè)領(lǐng)域的技術(shù)創(chuàng)新進(jìn)步。相信在不久的將來,語音識(shí)別技術(shù)一定會(huì)在語音交互、語音檢索、命令控制、自動(dòng)客戶服務(wù)、機(jī)器自動(dòng)翻譯等領(lǐng)域得到廣闊的應(yīng)用。

        參考文獻(xiàn):

        [1]?? 趙力.語音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社,2011.

        [2]?? George Dahl、俞棟等.基于預(yù)訓(xùn)練的上下文相關(guān)深層神經(jīng)網(wǎng)絡(luò)的大詞匯語音識(shí)別.2012

        王雯婕

        摘要:隨著機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究,以及大數(shù)據(jù)語料的積累,語音識(shí)別技術(shù)得到突飛猛進(jìn)的發(fā)展,開始從實(shí)驗(yàn)室走向市場(chǎng)。語音識(shí)別技術(shù)已經(jīng)逐漸進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。本文主要分析和總結(jié)了當(dāng)前幾種具有代表性的語音識(shí)別方法,介紹了其中關(guān)鍵的語音信號(hào)處理和語言模型建立的方法,最后總結(jié)了目前語音識(shí)別技術(shù)領(lǐng)域的研究成果及進(jìn)展。

        關(guān)鍵詞:語音識(shí)別;信號(hào)處理;機(jī)器學(xué)習(xí);人工智能;概率統(tǒng)計(jì)

        1研究背景

        語音信號(hào)處理,主要包括三項(xiàng)技術(shù),即語音識(shí)別、語音編碼和語音合成。本文所研究的自動(dòng)語音識(shí)別技術(shù),就是讓機(jī)器通過識(shí)別和理解把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。70年代,語音識(shí)別技術(shù)有了重大突破,動(dòng)態(tài)時(shí)間規(guī)整技術(shù)基本成熟,使語音變得可以等長,另外,矢量量化和隱馬爾科夫模型理論也不斷完善,為之后語音識(shí)別的發(fā)展做了鋪墊;80年代對(duì)語音識(shí)別的研究更為徹底,各種語音識(shí)別算法被提出,其中的突出成就包括HMM模型人工神經(jīng)網(wǎng)絡(luò);目前許多國內(nèi)外知名研究機(jī)構(gòu),如微軟、訊飛、Google、IBM都積極開展對(duì)深度學(xué)習(xí)的研究?,F(xiàn)在,國內(nèi)有不少語音識(shí)別系統(tǒng)已研制成功。這些系統(tǒng)的性能各具特色——在孤立字大詞匯量語音識(shí)別方面,最具代表性的要數(shù)92年清華大學(xué)電子工程系與中國電子器件公司合作研制成功的THED-919特定人語音識(shí)別與理解實(shí)時(shí)系統(tǒng)[4]? 。

        2語音識(shí)別技術(shù)

        2.1? 語音信號(hào)采集

        語音信號(hào)采集是語音信號(hào)處理的前提。語音通常通過話筒輸入計(jì)算機(jī)。話筒將聲波轉(zhuǎn)換為電壓信號(hào),然后通過A/D裝置(如聲卡)進(jìn)行采樣,從而將連續(xù)的電壓信號(hào)轉(zhuǎn)換為計(jì)算機(jī)能夠處理的數(shù)字信號(hào)。目前多媒體計(jì)算機(jī)已經(jīng)非常普及,聲卡、音箱、話筒等已是個(gè)人計(jì)算機(jī)的基本設(shè)備。其中聲卡是計(jì)算機(jī)對(duì)語音信號(hào)進(jìn)行加工的重要部件,它具有對(duì)信號(hào)濾波、放大、A/D和D/A轉(zhuǎn)換等功能。而且,現(xiàn)代操作系統(tǒng)都附帶錄音軟件,通過它可以驅(qū)動(dòng)聲卡采集語音信號(hào)并保存為語音文件。

        2.2? 語音信號(hào)預(yù)處理

        語音信號(hào)號(hào)在采集后首先要進(jìn)行濾波、A/D變換,預(yù)加重和端點(diǎn)檢測(cè)等預(yù)處理,然后才能進(jìn)入識(shí)別、合成、增強(qiáng)等實(shí)際應(yīng)用。濾波的目的有兩個(gè):一是抑制輸入信號(hào)中頻率超出FS/2的所有分量(FS為采樣頻率),以防止混疊干擾;二是抑制50Hz的電源工頻干擾。因此,濾波器應(yīng)該是一個(gè)帶通濾波器。A/D變換是將語音模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)。A/D變換中要對(duì)信號(hào)進(jìn)行量化,量化后的信號(hào)值與原信號(hào)值之間的差值為量化誤差,又稱為量化噪聲。預(yù)加重處理的目的是提升高頻部分,使信號(hào)的頻譜變得平坦,保持在低頻到高頻的整個(gè)頻帶中,能用同樣的信噪比求頻譜,便于頻譜分析。

        2.3? 語音信號(hào)的特征參數(shù)提取

        1、短時(shí)平均能量En和短時(shí)平均幅度

        短時(shí)平均能量和的短時(shí)平均幅度主要用途如下:

        (1)???? 可以作為區(qū)分清音和濁音的特征參數(shù)。

        (2)???? 在信噪比較高的情況下,短時(shí)能量還可以作為區(qū)分有聲和無聲的依據(jù)。

        (3)???? 可以作為輔助的特征參數(shù)用于語音識(shí)別中。

        2、短時(shí)平均過零率

        短時(shí)平均過零率的應(yīng)用:可以作為區(qū)分清音和濁音的特征參數(shù)。清音過零率高,濁音過零率低。用兩級(jí)判決法進(jìn)行語音端點(diǎn)檢測(cè)。

        短時(shí)平均過零率的局限性:濁音和清音重疊區(qū)域只根據(jù)短時(shí)平均過零率不可能明確地判別清、濁音。

        3、短時(shí)自相關(guān)分析

        4、短時(shí)平均幅度差函數(shù)

        5、基音周期估值

        語音的濁音信號(hào)具有準(zhǔn)周期性,其自相關(guān)函數(shù)在基音周期的整數(shù)倍處取最大值。計(jì)算兩相鄰最大峰值間的距離,就可以估計(jì)出基音周期。為了突出反映基音周期的信息,同時(shí)壓縮其他無關(guān)信息,減小運(yùn)算量,自相關(guān)計(jì)算之前需要對(duì)語音信號(hào)進(jìn)行適當(dāng)預(yù)處理。

        6、線性預(yù)測(cè)系數(shù)

        在語音識(shí)別中,常用線性預(yù)測(cè)編碼技術(shù)抽取語音特征。線性預(yù)測(cè)編碼的基本思想是:語音信號(hào)采樣點(diǎn)之間存在相關(guān)性,可用過去的若干采樣點(diǎn)的線性組合預(yù)測(cè)當(dāng)前和將來的采樣點(diǎn)值。線性預(yù)測(cè)系數(shù)是以通過使預(yù)測(cè)信號(hào)和實(shí)際信號(hào)之間的均方誤差最小來唯一確定。語音線性預(yù)測(cè)系數(shù)作為語音信號(hào)的一種特征參數(shù),已經(jīng)廣泛應(yīng)用于語音處理各個(gè)領(lǐng)域。

        2.4? 語音識(shí)別的主要方法

        語音識(shí)別所采用的方法一般有模板匹配法、隨機(jī)模型法和概率語法分析法三種。這三種方法都是建立在最大似然決策貝葉斯(Bayes)判決的基礎(chǔ)上的。

        (1)模板(template)匹配法

        在訓(xùn)練階段,用戶將詞匯表中的每一個(gè)詞依次說一遍,并且將其特征向量作為模板存入模板庫。在識(shí)別階段,將輸入語音的特征向量序列,依次與模板庫中的每個(gè)模板進(jìn)行相似度比較,將相似度最高者作為識(shí)別結(jié)果輸出。

        (2)?? 隨機(jī)模型法

        隨機(jī)模型法是目前語音識(shí)別研究的主流。其突出的代表是隱馬爾可夫模型。語音信號(hào)在足夠短的時(shí)間段上的信號(hào)特征近似于穩(wěn)定,而總的過程可看成是依次相對(duì)穩(wěn)定的某一特性過渡到另一特性。隱馬爾可夫模型則用概率統(tǒng)計(jì)的方法來描述這樣一種時(shí)變的過程。

        (3)?? 概率語法分析法

        這種方法是用于大長度范圍的連續(xù)語音識(shí)別。語音學(xué)家通過研究不同的語音語譜圖及其變化發(fā)現(xiàn),雖然不同的人說同一些語音時(shí),相應(yīng)的語譜及其變化有種種差異,但是總有一些共同的特點(diǎn)足以使他們區(qū)別于其他語音,也即語音學(xué)家提出的“區(qū)別性特征”。

        除了上面的三種語音識(shí)別方法外,還有許多其他的語音識(shí)別方法。例如,基于人工神經(jīng)網(wǎng)絡(luò)的語音識(shí)別方法,是目前的一個(gè)研究熱點(diǎn)。目前用于語音識(shí)別研究的神經(jīng)網(wǎng)絡(luò)有BP神經(jīng)網(wǎng)絡(luò)、Kohcmen特征映射神經(jīng)網(wǎng)絡(luò)等,特別是深度學(xué)習(xí)用于語音識(shí)別取得了長足的進(jìn)步。

        3結(jié)束語

        本文簡要介紹了語音識(shí)別的主要方法以及語音識(shí)別領(lǐng)域的發(fā)展與現(xiàn)狀,將語音識(shí)別的各個(gè)過程進(jìn)行了詳細(xì)介紹和概括總結(jié),分析了各種語音識(shí)別方法的特點(diǎn)和實(shí)現(xiàn)方式。語音識(shí)別是一門交叉學(xué)科,它涉及到信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等方面的知識(shí),所以它的發(fā)展依賴于各個(gè)領(lǐng)域的技術(shù)創(chuàng)新進(jìn)步。相信在不久的將來,語音識(shí)別技術(shù)一定會(huì)在語音交互、語音檢索、命令控制、自動(dòng)客戶服務(wù)、機(jī)器自動(dòng)翻譯等領(lǐng)域得到廣闊的應(yīng)用。

        參考文獻(xiàn):

        [1]?? 趙力.語音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社,2011.

        [2]?? George Dahl、俞棟等.基于預(yù)訓(xùn)練的上下文相關(guān)深層神經(jīng)網(wǎng)絡(luò)的大詞匯語音識(shí)別.2012

        猜你喜歡
        概率統(tǒng)計(jì)語音識(shí)別機(jī)器學(xué)習(xí)
        通話中的語音識(shí)別技術(shù)
        對(duì)概率統(tǒng)計(jì)有效教學(xué)的幾點(diǎn)認(rèn)識(shí)
        亞太教育(2016年31期)2016-12-12 20:53:16
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
        概率統(tǒng)計(jì)在高中數(shù)學(xué)中的應(yīng)用
        學(xué)生對(duì)翻轉(zhuǎn)課堂綜合評(píng)價(jià)的調(diào)查研究
        前綴字母為特征在維吾爾語文本情感分類中的研究
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        數(shù)學(xué)概率統(tǒng)計(jì)在實(shí)際生活重要領(lǐng)域的應(yīng)用
        考試周刊(2016年79期)2016-10-13 22:14:12
        面向移動(dòng)終端的語音簽到系統(tǒng)
        精品乱色一区二区中文字幕| 精品免费人伦一区二区三区蜜桃| A亚洲VA欧美VA国产综合| 在线观看国产激情免费视频| 久久精品网站免费观看| 精品无码日韩一区二区三区不卡| 特黄aa级毛片免费视频播放| 久久精品国产亚洲av高清蜜臀| 一区二区三区四区草逼福利视频| 亚洲av无码国产精品永久一区| 在线永久看片免费的视频| 亚洲成a人片在线观看高清| 日韩女优视频网站一区二区三区| 男女性爽大片视频| 亚洲国产精品久久久久秋霞1| WWW拍拍拍| 国产精品亚洲一区二区三区在线| 特黄大片又粗又大又暴| 亚洲人成网站在线观看播放| 午夜天堂精品一区二区| 丰满的少妇av一区二区三区| 丁字裤少妇露黑毛| 2021国产精品视频| 国产一区二区三区蜜桃| 女人的精水喷出来视频| 少妇寂寞难耐被黑人中出| 久久丁香花综合狼人| 亚洲黄色av一区二区三区| 久久精品国产亚洲av无码娇色| 欧美国产小视频| 白白白色视频在线观看播放| 欧美性白人极品1819hd| 亲子乱aⅴ一区二区三区下载| yy111111少妇影院| 日韩人妻系列在线观看| 麻豆影视视频高清在线观看| 国产福利酱国产一区二区| 成年男女免费视频网站点播| 国产婷婷色一区二区三区| 国产香蕉一区二区三区在线视频| 亚洲综合精品在线观看中文字幕|