亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于人工智能的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)與研究

        2022-06-07 07:42:00范永超韓佳南
        數(shù)字通信世界 2022年5期
        關(guān)鍵詞:人工智能分析

        范永超,韓佳南

        (1.武漢烽火信息集成技術(shù)有限公司,湖北 武漢 430000;2.烽火通信科技股份有限公司,湖北 武漢 430073)

        0 引言

        本文所涉及的語(yǔ)音識(shí)別技術(shù)是一種對(duì)聲音信息進(jìn)行匹配和辨別的技術(shù),同時(shí)也是利用生物識(shí)別技術(shù)對(duì)聲音信號(hào)進(jìn)行分析的技術(shù)。從個(gè)體器官的角度進(jìn)行分析,發(fā)生控制器在聲帶、口腔、舌頭、嘴唇、軟腭、咽腔、肺容、鼻腔、牙齒等影響下,其發(fā)音頻率以及音色、音高等也有所不同,以此來(lái)實(shí)現(xiàn)一種具有獨(dú)特形式的個(gè)體語(yǔ)音特色。一般均是由90多種不同特征組成了這些要素,使其對(duì)頻率、節(jié)奏、波長(zhǎng)、強(qiáng)度等都有著充分的表現(xiàn)。在世界上沒(méi)有完全相同的兩種聲音,仔細(xì)觀(guān)察可以發(fā)現(xiàn),每種聲紋都有其不同的特點(diǎn),因此,在語(yǔ)音識(shí)別技術(shù)中,最為重要的就是需要對(duì)這些微小的差異進(jìn)行識(shí)別和辨析。

        1 語(yǔ)音識(shí)別技術(shù)分析

        語(yǔ)音識(shí)別技術(shù)已經(jīng)廣泛地應(yīng)用在我國(guó)各項(xiàng)生產(chǎn)生活之中,它是繼指紋識(shí)別和DNA識(shí)別技術(shù)之后應(yīng)用最為廣泛的生物識(shí)別技術(shù)之一。針對(duì)目前的實(shí)際應(yīng)用情況進(jìn)行分析,我國(guó)科研機(jī)構(gòu)在進(jìn)行語(yǔ)音檢索中,已經(jīng)在十億級(jí)庫(kù)容中實(shí)現(xiàn)了對(duì)“1:N”級(jí)別的檢索,一些關(guān)鍵性的詞語(yǔ)識(shí)別準(zhǔn)確率已經(jīng)達(dá)到了95%以上。從應(yīng)用的角度來(lái)看,語(yǔ)音是人體的一項(xiàng)基本生理功能,而且具有鮮明的特異性,在語(yǔ)音識(shí)別技術(shù)中,需要對(duì)不同生物體的語(yǔ)音進(jìn)行采集與識(shí)別,同時(shí)開(kāi)展數(shù)據(jù)庫(kù)的建模工作,在獲取較大的樣本之后,才能把全樣本的語(yǔ)音集合與個(gè)體的語(yǔ)音進(jìn)行比對(duì)和分析,實(shí)現(xiàn)快速確定身份的效果。

        2 語(yǔ)音識(shí)別系統(tǒng)

        2.1 工作原理

        從唯一以及不可復(fù)制性方面進(jìn)行分析,與人體的其他生物特征相比,語(yǔ)音具有十分相似的特征,但世界上的任何兩個(gè)個(gè)體之間,不可能出現(xiàn)相同語(yǔ)音。如圖1所示,從個(gè)體中提取相關(guān)的語(yǔ)音信號(hào),采用建模和數(shù)字化的方式對(duì)其進(jìn)行分析,應(yīng)用自動(dòng)化方式對(duì)全樣本語(yǔ)音集合以及個(gè)體語(yǔ)音機(jī)械能對(duì)比,并以此實(shí)現(xiàn)對(duì)身份信息的識(shí)別,這一過(guò)程就是語(yǔ)音識(shí)別。

        圖1 語(yǔ)音識(shí)別系統(tǒng)的四個(gè)模塊

        2.2 語(yǔ)音識(shí)別系統(tǒng)的四個(gè)模塊

        (1)預(yù)處理模塊。對(duì)語(yǔ)音進(jìn)行識(shí)別的第一步就是針對(duì)所采集到的語(yǔ)音信號(hào)進(jìn)行轉(zhuǎn)變,使其由模擬語(yǔ)音信號(hào)變?yōu)閿?shù)字語(yǔ)音信號(hào)。同時(shí)在預(yù)處理模塊中,最為重要的一項(xiàng)功能就是對(duì)語(yǔ)音信號(hào)進(jìn)行采集和A/D(模/數(shù))轉(zhuǎn)換,可以看出,波形編輯處理功能以及(D/A轉(zhuǎn)換)回放功能等都屬于語(yǔ)音識(shí)別系統(tǒng)處理模塊的功能。

        (2)參數(shù)分析模塊。為了對(duì)個(gè)體的發(fā)音特征進(jìn)行準(zhǔn)確反應(yīng),語(yǔ)音參數(shù)的提取是最為重要的一個(gè)方面。在對(duì)個(gè)體語(yǔ)音辨識(shí)率的有效性進(jìn)行辨識(shí)的基礎(chǔ)上,需要對(duì)不同的語(yǔ)音參數(shù)進(jìn)行對(duì)比和分析,并將音調(diào)曲線(xiàn)、偏相關(guān)以及音長(zhǎng)參數(shù)應(yīng)用在參數(shù)分析模塊的TDSI系統(tǒng)中,將其看作個(gè)體語(yǔ)音參數(shù),從個(gè)體語(yǔ)音的角度進(jìn)行分析,將正交線(xiàn)性預(yù)測(cè)參數(shù)以及長(zhǎng)時(shí)間平均頻譜應(yīng)用到參數(shù)分析模塊的TISI系統(tǒng)中所形成的特征就是特征參數(shù)。

        (3)訓(xùn)練模塊。為了有效建立相關(guān)的訓(xùn)練模塊,應(yīng)對(duì)語(yǔ)音參數(shù)進(jìn)行提取,并將其作為一個(gè)單獨(dú)的個(gè)體進(jìn)行建立。受到測(cè)試語(yǔ)音以及訓(xùn)練語(yǔ)音時(shí)間長(zhǎng)度差異的影響,在訓(xùn)練模塊的TDSI系統(tǒng)中,本文將線(xiàn)性壓括技術(shù)應(yīng)用到其中,并對(duì)訓(xùn)練語(yǔ)音進(jìn)行相應(yīng)的調(diào)整,使其可以達(dá)到15幀(0.02秒/幀);并將長(zhǎng)時(shí)間平均技術(shù)應(yīng)用到TISI訓(xùn)練模塊系統(tǒng)中,確保其訓(xùn)練語(yǔ)音可以達(dá)到1幀(0.02秒/幀)。

        (4)識(shí)別模塊。對(duì)比模板庫(kù)中語(yǔ)音模板和被測(cè)試語(yǔ)音的區(qū)別,并將模板匹配技術(shù)應(yīng)用其中,在與測(cè)試語(yǔ)音相同的個(gè)體進(jìn)行鎖定的過(guò)程中,應(yīng)依據(jù)“最佳鄰近準(zhǔn)則”[1]。在本文中主要是將參數(shù)加權(quán)歐氏距離聚類(lèi)法應(yīng)用在語(yǔ)音識(shí)別系統(tǒng)模塊中,并對(duì)被測(cè)語(yǔ)音和模板語(yǔ)音中的距離進(jìn)行計(jì)算,將多階段識(shí)別策略應(yīng)用在TISI識(shí)別模塊系統(tǒng)中,并在庫(kù)中進(jìn)行優(yōu)先識(shí)別,對(duì)相似度較高的個(gè)體語(yǔ)音進(jìn)行選擇,并對(duì)這些個(gè)體進(jìn)行細(xì)致的識(shí)別,將相似度最高的語(yǔ)音篩選出來(lái)。

        2.3 語(yǔ)音識(shí)別技術(shù)現(xiàn)存難題

        在目前對(duì)人工智能進(jìn)行研究的過(guò)程中,最為重要且最為先進(jìn)的一項(xiàng)技術(shù)就是人工神經(jīng)網(wǎng)絡(luò)技術(shù),但在目前的實(shí)際應(yīng)用中,為了真正實(shí)現(xiàn)人工智能,神經(jīng)網(wǎng)絡(luò)以及深度學(xué)習(xí)還需要進(jìn)一步優(yōu)化。在對(duì)人工智能的真實(shí)語(yǔ)音進(jìn)行識(shí)別的過(guò)程中,還有許多的問(wèn)題需要解決。比如,在對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行構(gòu)建的過(guò)程中,所需備份的數(shù)據(jù)不僅較大,而且在機(jī)器人學(xué)習(xí)中的學(xué)習(xí)方式也有一定的區(qū)別;在對(duì)特定的事物進(jìn)行學(xué)習(xí)的過(guò)程中,對(duì)人類(lèi)來(lái)說(shuō)僅僅需要幾個(gè)簡(jiǎn)單的例子就可以很好地掌握,但對(duì)于機(jī)器人來(lái)說(shuō),為了可以充分掌握相關(guān)知識(shí),需要運(yùn)用大量的例子;在對(duì)信息進(jìn)行語(yǔ)音識(shí)別的過(guò)程中,受到大數(shù)據(jù)和云計(jì)算中局限性的影響,往往由于語(yǔ)音識(shí)別算法能力較低,進(jìn)一步影響到智能機(jī)器人的正常運(yùn)行。現(xiàn)如今,華為移動(dòng)機(jī)器人、百度助手、阿里智能機(jī)器人等在各大企業(yè)中實(shí)現(xiàn)了廣泛的應(yīng)用,所有的一切智能操作都與人工智能密切相關(guān),同時(shí)在人工智能機(jī)器人中應(yīng)用語(yǔ)音識(shí)別技術(shù)也最為重要的一個(gè)方面,因此,要更好地達(dá)到人機(jī)交互的效果,就必須克服技術(shù)的局限性。

        3 基于人工智能的語(yǔ)音識(shí)別系統(tǒng)及應(yīng)用分析

        3.1 語(yǔ)音識(shí)別系統(tǒng)總設(shè)計(jì)

        針對(duì)人類(lèi)語(yǔ)言進(jìn)行識(shí)別,并在實(shí)際執(zhí)行的過(guò)程中創(chuàng)造出一定的交互量,這一目的就是所謂的人工智能,在此基礎(chǔ)上,必須要按照相關(guān)的原則和要求對(duì)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行整體設(shè)計(jì)[2]。針對(duì)人工智能技術(shù)進(jìn)行分析,人工智能在語(yǔ)音識(shí)別方面還存在一些問(wèn)題,在對(duì)人工智能機(jī)器人進(jìn)行音頻信號(hào)的處理過(guò)程產(chǎn)生影響的同時(shí),還會(huì)在很大程度上影響到人機(jī)交互體驗(yàn),并出現(xiàn)算法混亂的情況。一方面,要將語(yǔ)音指令檢測(cè)以及預(yù)處理運(yùn)用在語(yǔ)音控制終端中,并具備相應(yīng)的轉(zhuǎn)換工具,以便可以更好分析所輸入的語(yǔ)音算法,并對(duì)其語(yǔ)言進(jìn)行轉(zhuǎn)化,使得機(jī)器人也可以很好地理解;另一方面,必須將一個(gè)主要的語(yǔ)音控制系統(tǒng)運(yùn)用到機(jī)器人控制中,對(duì)輸入聲音的交互性能有充足的了解,主要是分析和設(shè)計(jì)其中較為高效的算法。因此,算法分析和設(shè)計(jì)是語(yǔ)音識(shí)別的首要任務(wù),需要選擇編譯語(yǔ)言,設(shè)計(jì)適合機(jī)器人實(shí)際性能的算法。

        3.2 特征參數(shù)的提取

        (1)采用語(yǔ)音頻譜技術(shù)進(jìn)行提取。語(yǔ)音頻譜技術(shù)主要是以生物體的基礎(chǔ)性發(fā)聲器官如氣管、聲道以及鼻腔等為主,利用人體的基礎(chǔ)發(fā)聲器來(lái)提取相關(guān)的參數(shù),然后將提取到的參數(shù)進(jìn)行分類(lèi),在語(yǔ)音比對(duì)的過(guò)程中,可以通過(guò)這些參數(shù)來(lái)找到發(fā)聲人體的特殊生理結(jié)構(gòu),從而快速定位發(fā)聲人。

        (2)線(xiàn)性預(yù)測(cè)提取。在語(yǔ)音識(shí)別系統(tǒng)中,提取到的語(yǔ)音樣本是屬于“過(guò)去”的聲音,而需要匹配的是“當(dāng)前”的語(yǔ)音內(nèi)容。

        (3)小波特征提取分析[3]。該提取方式主要是利用小波技術(shù)來(lái)完成的,小波技術(shù)的優(yōu)勢(shì)就是能夠接受分辨率的改變,但是該技術(shù)在應(yīng)用的過(guò)程中要求語(yǔ)音參數(shù)實(shí)現(xiàn)穩(wěn)定性的交叉,同時(shí)還具有能夠和時(shí)頻域兼容的表征,在當(dāng)前的應(yīng)用過(guò)程中,小波技術(shù)已經(jīng)相當(dāng)成熟,而且與人工智能技術(shù)的結(jié)合也日益緊密。

        3.3 模式匹配識(shí)別過(guò)程分析

        完成特征提取后,需要進(jìn)行下一步的深度分析,完成精確的匹配過(guò)程。模式匹配識(shí)別從本質(zhì)上來(lái)說(shuō)是一種比對(duì)化的操作過(guò)程,對(duì)比分析沒(méi)有識(shí)別的語(yǔ)音特征參數(shù)以及數(shù)據(jù)庫(kù)中的語(yǔ)音特征參數(shù),并從其相似度方面按照由高到低的方法將最終的對(duì)比結(jié)果呈現(xiàn)出來(lái),并用表格或是樹(shù)狀圖將相似度的距離顯現(xiàn)出來(lái),在識(shí)別的過(guò)程中需要限定一個(gè)相似度距離的值。在目前的具體應(yīng)用中,模式匹配識(shí)別有兩種模型。

        (1)矢量化模型。在實(shí)際應(yīng)用該模型的過(guò)程中,第一步是要實(shí)現(xiàn)對(duì)語(yǔ)音參數(shù)的矢量化,并將矢量化處理的方式應(yīng)用在個(gè)體語(yǔ)音的檢測(cè)過(guò)程中[4]。在實(shí)際應(yīng)用中,為了有效地表示出個(gè)人信息的語(yǔ)音矢量,應(yīng)對(duì)被檢測(cè)人的個(gè)體語(yǔ)音特征進(jìn)行收集,并對(duì)其特征參數(shù)進(jìn)行處理,然后提出與之相對(duì)應(yīng)的語(yǔ)音規(guī)范標(biāo)準(zhǔn)。

        (2)構(gòu)建隨機(jī)化模型。在日常生活中,雖然語(yǔ)音特征是每一個(gè)個(gè)體獨(dú)特的生理特征,但是一個(gè)人的語(yǔ)音在不同環(huán)境、不同狀態(tài)下的表現(xiàn)也不一樣,而且人體的語(yǔ)音在變化范圍以及變化的概率方面不確定性非常大[5],在該模型的構(gòu)建中,尤其需要考慮到轉(zhuǎn)移的概率、傳輸?shù)男逝c概率等方面的因素。為了使得隨機(jī)化模型在應(yīng)用過(guò)程中更加可靠與精確,需要在訓(xùn)練過(guò)程中獲取狀態(tài)轉(zhuǎn)移概率的矩陣以及符號(hào)輸出概率矩陣等方面的內(nèi)容。在外界環(huán)境發(fā)生變化的同時(shí),被測(cè)個(gè)體的語(yǔ)音信息也在隨之發(fā)生一定的變化,在對(duì)語(yǔ)音信息進(jìn)行識(shí)別的過(guò)程中,該系統(tǒng)可以進(jìn)行快速有效的識(shí)別,同時(shí)針對(duì)語(yǔ)音信息在狀態(tài)轉(zhuǎn)移時(shí)的概率可以在最大程度上對(duì)語(yǔ)音進(jìn)行識(shí)別,然后利用數(shù)據(jù)庫(kù)的相關(guān)樣本內(nèi)容來(lái)對(duì)被檢測(cè)人的語(yǔ)音模型做出更深層次的分析與判斷。

        4 結(jié)束語(yǔ)

        在“互聯(lián)網(wǎng)+”環(huán)境下,人工智能技術(shù)得到了飛速的發(fā)展,為了對(duì)語(yǔ)音信號(hào)進(jìn)行高效的識(shí)別與處理,加強(qiáng)和創(chuàng)新人工智能和語(yǔ)音識(shí)別系統(tǒng)的結(jié)合已成為時(shí)代發(fā)展的趨勢(shì)。在利用計(jì)算機(jī)進(jìn)行演算的過(guò)程中,對(duì)識(shí)別度高的聲學(xué)特征數(shù)據(jù)進(jìn)行提取和分析,有效提高語(yǔ)音識(shí)別的準(zhǔn)確度及精確度。在未來(lái)發(fā)展中,應(yīng)進(jìn)一步實(shí)現(xiàn)語(yǔ)音系統(tǒng)和人工智能系統(tǒng)的有效結(jié)合,并對(duì)語(yǔ)音識(shí)別系統(tǒng)的功能以及兼容性進(jìn)行有效的擴(kuò)展?!?/p>

        猜你喜歡
        人工智能分析
        我校新增“人工智能”本科專(zhuān)業(yè)
        隱蔽失效適航要求符合性驗(yàn)證分析
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        下一幕,人工智能!
        下一幕,人工智能!
        中西醫(yī)結(jié)合治療抑郁癥100例分析
        av天堂手机在线看片资源| 精品欧洲av无码一区二区| 男女做爰猛烈啪啪吃奶动| 无码成人aaaaa毛片| 又污又黄又无遮挡的网站| 最新国产拍偷乱偷精品| 亚洲AⅤ樱花无码| 日本黄色一区二区三区| 变态另类手机版av天堂看网| 天天做天天摸天天爽天天爱| 久久久www成人免费精品| www国产精品内射熟女| 最新国产三级| 色人阁第四色视频合集网| 亚洲一区二区三区精品久久av| 偷拍色图一区二区三区| 久久精品国产99国产精偷| 少妇太爽了在线观看免费视频| 99久久精品国产成人综合| 高清无码精品一区二区三区| 国产三级精品美女三级| 国产无遮挡又黄又爽无VIP| 国产一区二区三区免费在线播放| 三级日韩视频在线观看| 精品免费国产一区二区三区四区| 精品人妻伦九区久久aaa片| 亚洲综合无码一区二区| 久久精品国产亚洲一区二区| 亚洲AV无码日韩综合欧亚| 日本高清一区二区三区不卡| av黄色在线免费观看| 成人网站在线进入爽爽爽| 色五月丁香五月综合五月4438| 91精品一区国产高清在线gif| 日韩欧美在线观看成人| 亚洲美女av二区在线观看| 美女扒开内裤让我捅的视频| 4hu四虎永久免费地址ww416| 亚洲av无码一区二区三区人妖| 少妇三级欧美久久| 中文天堂一区二区三区|