亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隱馬爾科夫模型的語音識別技術(shù)實(shí)現(xiàn)

        2019-12-17 03:32:08陳煥澤中南大學(xué)軟件學(xué)院
        數(shù)碼世界 2019年12期
        關(guān)鍵詞:聲學(xué)百度語音

        陳煥澤 中南大學(xué)軟件學(xué)院

        關(guān)鍵字:語音識別 聲學(xué)模型 隱馬爾科夫模型

        1. 引言

        智能語音技術(shù),是一種完成人機(jī)通過語言進(jìn)行類似于人與人之間交互的技術(shù),其中的核心技術(shù)包括語音識別技術(shù)和語音合成技術(shù)。20世紀(jì)50年代,智能語音技術(shù)已經(jīng)在語音識別領(lǐng)域開展了研究。而在人機(jī)交互中,語音識別這一環(huán)節(jié)也處于第一個環(huán)節(jié),也是核心環(huán)節(jié)。

        2. 語音識別的相關(guān)基礎(chǔ)概念

        2.1. 語音識別的定義和原理

        2.1.1. 定義

        語音識別技術(shù)即將語音轉(zhuǎn)化為有意義的文字內(nèi)容的技術(shù)。

        2.1.2. 基本實(shí)現(xiàn)原理

        從原始語音信號中提取某次語音識別所要分析的信號后,利用特征處理將所提取的信號從時域轉(zhuǎn)變?yōu)轭l域,從而為聲學(xué)模型提供適當(dāng)?shù)妮斎胂蛄?,聲學(xué)模型根據(jù)其本身模型所訓(xùn)練而得的參數(shù),計算每一個輸入向量在其該模型上的得分;而語言模型則根據(jù)語言學(xué)相關(guān)的知識,計算出各種不同文本序列搭配的可能性;最后由已有的數(shù)據(jù)字典,對文本序列進(jìn)行解碼操作,得到可能性最高的文本內(nèi)容。

        而該過程中,如何將每一幀中的音素對應(yīng)于某個狀態(tài)是個難題,這里利用概率論的知識,通過訓(xùn)練聲學(xué)模型,得到相應(yīng)的概率分布,在其中選擇概率最高的,即所求幀對應(yīng)的狀態(tài)。

        輸入語音數(shù)據(jù):o=o1...om

        各種可能的文本序列組成的集合:W=w1,...,wk

        語音識別:根據(jù)輸入語音數(shù)據(jù)o以及各種可能的文本序列集合W中找到最可能的那個文本序列:

        其中,聲學(xué)模型負(fù)責(zé)獲得P[o|w],語言模型負(fù)責(zé)獲得P[w]。

        3. 語音識別核心組件介紹

        3.1. 聲學(xué)模型

        3.1.1. 定義

        給定語言學(xué)單元,計算輸入語音匹配的可能性,進(jìn)行對P[o|w]的概率估計;

        3.1.2. 發(fā)展歷史

        表1:聲學(xué)模型的發(fā)展

        3.1.3. 各個主要聲學(xué)模型優(yōu)缺點(diǎn)比較

        HMM-DNN聲學(xué)模型

        優(yōu)點(diǎn):

        ①前后各自擴(kuò)充n幀,從而利用幀的上下文信息

        ②與HMM-GMM相比,可以學(xué)習(xí)深度非線性特征轉(zhuǎn)換缺點(diǎn):

        無法利用歷史信息來進(jìn)行操作

        HMM-LSTM聲學(xué)模型

        優(yōu)點(diǎn):

        ①是一個單向時序模型,具有長短時記憶能力

        ②更契合時序建模問題

        ③減輕了RNN的梯度消散和梯度爆炸的影響

        缺點(diǎn):

        計算復(fù)雜度大幅增加,且由于遞歸鏈接的影響使得并行操作難度加大

        HMM-BLSTM聲學(xué)模型

        優(yōu)點(diǎn):

        相比HMM-LSTM,增添了反向時序信息,使模型的建模能力更強(qiáng)缺點(diǎn):

        ①計算復(fù)雜度加大

        ②GPU的顯存需求增大從而降低了并行度,最終導(dǎo)致模型訓(xùn)練變慢

        ③實(shí)際應(yīng)用中的實(shí)時性問題

        3.2. 語言模型

        3.2.1. 定義

        由聲學(xué)模型提供的發(fā)音序列,計算各種不同文本序列搭配的可能性。

        對于某一句話s:

        其中wi是統(tǒng)計單元,可以是字、單詞、短語等。

        則句子s的概率可以表示為:

        但若按此方法計算句子的概率存在兩個缺陷:

        ②數(shù)據(jù)過于稀疏:在語料庫中沒有出現(xiàn)的多詞對組合,由最大似然估計得到概率將為0.

        4. 語音識別發(fā)展現(xiàn)狀

        4.1. 語音識別詞錯率的突破

        2016年,Microsoft的語音識別技術(shù)在產(chǎn)業(yè)標(biāo)準(zhǔn) Switchboard 語音識別基準(zhǔn)測試中詞錯率已降低至5.9%,達(dá)到與專業(yè)速記員同等水平。而在2017年,詞錯率更是達(dá)到了驚人的5.1%。從90年代到2010年左右,由于上一代聲學(xué)模型發(fā)展碰到瓶頸,語音識別的詞錯率實(shí)際上沒有太大的變化。在2010年后,由于DNN的提出與深度網(wǎng)絡(luò)的提出與研究,語音識別的詞錯率開始大幅減小。

        4.2. 語音助手上的暗戰(zhàn)

        4.2.1 Apple Siri

        2011年,在iPhone 4s的發(fā)布會上,以智能語音助手身份亮相的Apple Siri成為當(dāng)時全場最大的亮點(diǎn)。但由于當(dāng)時粗糙的技術(shù),使得Siri反應(yīng)慢,出錯率高,不被大眾看好。而如今,具備人工智能特性的Siri已經(jīng)會說36個國家的21種語言。而在智能汽車方面,Siri目前已經(jīng)整合進(jìn)奧迪、寶馬、克萊斯勒等全球9家知名汽車中。

        4.2.2 Mircrosoft Cortana

        2014年7月30日,微軟在Windows Phone 8.1 Update中國區(qū)發(fā)布會上正式發(fā)布了中文版Cortana,其中文命名為“微軟小娜”。

        2016年12月,微軟在舊金山宣布,開放Cortana,使其能夠集成到智能音響、智能汽車、智能家電等硬件平臺上。

        2018年8月,亞馬遜與微軟雙方各自完成了語音助手Alex和Cortana的整合。

        4.2.3 百度小度

        2015年9月,百度官方在百度世界大會發(fā)布了語音助手度秘。

        2017年3月,百度官方在百度世界大會發(fā)布小度系統(tǒng)1.0(DuerOS1.0)。

        在與第三方合作上,百度已經(jīng)與中興、小米、聯(lián)想、索尼、網(wǎng)易游戲、比亞迪、特斯拉等企業(yè)建立了長久的合作關(guān)系。

        5. 結(jié)論

        借助云計算和大數(shù)據(jù)的發(fā)展,人工智能近年來發(fā)展迅猛。而在語音識別領(lǐng)域,研究者們也已經(jīng)取得了不少成果,其背后潛在的巨大經(jīng)濟(jì)效益也吸引了各國互聯(lián)網(wǎng)企業(yè)的注意,如今的語音識別技術(shù)雖然日趨成熟與完善,但仍然存在一定的難題,這就需要相關(guān)科研人員的努力。在計算機(jī)計算能力的進(jìn)一步提升和5G通信普及的趨勢下,未來智能語音識別技術(shù)將會有令人意想不到的表現(xiàn)。

        猜你喜歡
        聲學(xué)百度語音
        愛的就是這股Hi-Fi味 Davis Acoustics(戴維斯聲學(xué))Balthus 70
        Robust adaptive UKF based on SVR for inertial based integrated navigation
        魔力語音
        基于MATLAB的語音信號處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價廉物美的酒駕語音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        Acoustical Treatment Primer:Diffusion談?wù)劼晫W(xué)處理中的“擴(kuò)散”
        Acoustical Treatment Primer:Absorption談?wù)劼晫W(xué)處理中的“吸聲”(二)
        對方正在輸入……
        小說界(2018年5期)2018-11-26 12:43:42
        Acoustical Treatment Primer:Absorption 談?wù)劼晫W(xué)處理中的“吸聲”
        百度年度熱搜榜
        青年與社會(2018年2期)2018-01-25 15:37:06
        日韩日本国产一区二区 | 高潮内射双龙视频| 国产女人高潮视频在线观看 | 国产麻豆放荡av激情演绎| 亚洲白嫩少妇在线喷水 | 久久麻豆精亚洲av品国产蜜臀| 国产91精品一区二区麻豆亚洲| 国产av在线观看久久| 亚洲精品v欧洲精品v日韩精品| 亚洲精品久久国产高清情趣图文| 国产成人久久蜜一区二区| 国产一级黄色性生活片| 国产91成人精品高潮综合久久| 大地资源高清在线视频播放| 精品国产乱码久久久久久1区2区| 国产AⅤ无码久久丝袜美腿| 婷婷开心五月综合基地| 久久精品国产亚洲av一般男女| 日韩精品无码一区二区三区四区 | 欧美午夜精品久久久久久浪潮| 日本最新一区二区三区免费看| 亚洲av少妇一区二区在线观看| 亚洲av无码偷拍在线观看| 男人激烈吮乳吃奶视频免费 | 少妇人妻av一区二区三区| 国产欧美综合一区二区三区| 人妻聚色窝窝人体www一区| 久久久久亚洲av无码尤物| 精品日本韩国一区二区三区| 中文字幕一区二区三区日日骚| 疯狂做受xxxx高潮视频免费| 在线va免费看成| 超清无码AV丝袜片在线观看| 一个人午夜观看在线中文字幕| 色综合久久久久综合体桃花网| 国产精品爽黄69天堂a | 久久久www成人免费精品| 精品人妻中文av一区二区三区| 久久色悠悠亚洲综合网| 中文字幕有码人妻在线| 国产成人无码精品久久二区三区 |