亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        對通信終端智能語音處理技術的研究

        2014-12-31 00:00:00趙宏洲李陽張強
        數(shù)字化用戶 2014年7期

        【摘 要】隨著科學技術的快速發(fā)展,現(xiàn)代通信也得到大力的發(fā)展,特別是趨向于數(shù)字化方向發(fā)展,由此現(xiàn)代通信終端趨于高性能、智能化的發(fā)展是新的挑戰(zhàn)和更高的要求。本文作者結合自己的工作經驗對通信終端智能化語音處理技術進行分析和研究,具體的從終端智能化的語音接口、語音合成、語音門戶等技術方面著手,進一步提高語音技術的發(fā)展。

        【關鍵詞】通信終端 智能化 語音 技術

        智能化的終端是當代通信技術的發(fā)展方向,實現(xiàn)視覺、聽覺、語言、思維、推理的功能,通信功能不斷趨于人性化、擬人化的人機接口,核心的關鍵技術主要是語音處理。智能化的語音處理技術,主要是對語言、文字的識別和合成技術,通過實際操作過程的經驗總結,不斷的完善語音處理功能。

        一、智能化語音接口技術

        所謂的智能接口就是模擬人的行為功能,建立起來的人機交互環(huán)境,語音是人類最基本的通信手段,智能化的語音接口,利用通信、計算機科學、電子、語言識別等技術的結合來實現(xiàn)擬人化的信息交流。世界上有70%的人通過語音通信實現(xiàn)信息交流,這也是最為普遍的通信方式。由此通信終端的主體結構是基于語音通信來實現(xiàn)的。

        1.1語音識刪。通信終端是基于語音建立的,由此語音識別是智能化通信終端的關鍵技術之一。早期的語音識別僅限于模版識別,詞匯量偏少、有特定限制,不能夠進行連續(xù)語音識別,無法滿足人們對詞匯量的需要。智能通信技術的不斷發(fā)展,也是對語音識別技術提出更高的要求。

        (1)電話語音識別。電話語音處理技術是計算機中文信息處理領域的一項關鍵技術,它是把語音信號轉換成數(shù)字信號,然后進行壓縮存儲,或把壓縮的數(shù)字信號解壓還原成語音信號.在當代高速數(shù)據通信環(huán)境中,我們利用傳統(tǒng)的電話語音處理技術,然而由于各種環(huán)境因素的影響,干擾數(shù)字信號傳輸,產生了電話語音信號的變化。因此,我們在打電話時,不論處于那種嘈雜的環(huán)境中,電話語音識別都不會被影響.由此噪聲背景下的語音識別也是我們將要解決的重要問題。

        (2)語音識別的增強性。對語音系統(tǒng)使用環(huán)境進行測試,我們可以分析發(fā)現(xiàn)電話背景噪聲的干擾,導致電話信號產生信道和編碼噪聲干擾,噪聲干擾是識別原始語音信號的一大干擾因素,且此類干擾是隨機發(fā)生。所以,我們需要對每一種噪聲干擾環(huán)境進行識別和增強技術。目前,針對我國用戶群隨機的情況,需要建立普適度更高的模型或對不同口音自動適應性。

        1.2語音合成。語音合成技術是使電腦或通信終端具有類似于人一樣的說話能力,是當今時代信息產業(yè)的重要研究領域。和語音識別相比,語音合成技術更成熟一些。是最有希望首先在智能通信終端中得到普遍應用并形成帶動作用的一項關鍵技術。目前。語音合成有高自然度、芯片級、多語種、分步式和口語式的語音合成等發(fā)展方向。按照智能化程度的不同層次,語音合成可分為三個層次:從文字到語音;概念到語音;意向到語音的合成。為合成出高質量的語音,除依賴于各種規(guī)則,還必須對文字內容進行很好的理解。文字,語音的轉換系統(tǒng)。

        (1)文本分析。對文本的格式、詞語、句子進行分析識別,確定每一個字的發(fā)音。具體的文本分析主要是通過分詞、識別、發(fā)音處理等環(huán)節(jié)實現(xiàn)。

        (2)語音合成器。目前,最流行的語音合成器是采用基音同步的重疊相加(PSOLA)方法來實現(xiàn)波形拼接。PSOLA算法的基本思想是以語音信號基音周期為分析對象,在基音同步基礎上對信號聲調和時長進行修改。

        二、智能終端與語音門戶

        語音門戶,是指基于互聯(lián)網平臺。應用語音識別、合成和轉換技術,為固定和移動電話用戶提供用語音訪問互聯(lián)網并獲取網上信息的門戶,是全球互聯(lián)網發(fā)展的最新趨勢之一。語音門戶應用計算機網絡、語音、Web、電信、等技術,建立為語音識別服務的網絡平臺。為更多的用戶提供各類通信終端服務,同時此項技術也為企業(yè)的發(fā)展,帶來了新的機遇和業(yè)務。隨著近年來語音識別技術的發(fā)展和廣泛應用,主要有以上所提到的自動語音識別(AsR)、文本轉語音、口語對話等人機交互技術、信息處理技術的發(fā)展,以及像語音瀏覽器、嵌入式語音瀏覽器等Voice Web技術的成熟.為用戶終端服務提供了保障,并且語音門戶在通信終端的應用種類也得到了增多,確保了語音門戶在通信終端的有效作用。

        2.1分布式語音處理:(1)分布式語音識別在智能通信終端中。語音識別的主要目標是實現(xiàn),廣大用戶利用語音既可以訪問計算機服務系統(tǒng),便于操作和使用。當前我們將語音識別系統(tǒng)的分布使用在移動通信端,通過預處理、提取有效參數(shù),隨之通過數(shù)據信道將其傳輸?shù)秸Z音識別系統(tǒng)的遠程端。這樣就完成了語音識別系統(tǒng)的傳輸,并且不會干擾語音識別的正確率,從而實現(xiàn)信道不變形的目的?;谡Z音識別系統(tǒng)的應用,主要是用于網絡分布式的語音識別。如當前的呼叫中心,并在基于包交換的VOIP網絡進行了測試;(2)分布式語音合成在基于網絡應用。當前,分布式語音服務的模式主要是客戶機,在服務端和終端之間總是存在差異,加之信道和用戶體驗功能的綜合影響。語音合成分布式主要是將傳統(tǒng)的合成環(huán)節(jié)轉化為標準的模塊(語音合成、文本分析)。

        2.2語音瀏覽器。所謂的語音游覽器,就是不用接觸鍵盤運用語音進行語言識別游覽,也是基于XML國際標準的語音可擴展標識語言.像HTML定義圖形化網頁界面一樣定義了語音界面內容,并通過Transcoder服務器直接瀏覽網上HTML格式的內容。它主要包括Voice XML、電話語音接人、TIS/AsR資源及Transcoder服務器。

        2.3嵌入式語音瀏覽器。嵌人式語音瀏覽器支持WAP等傳輸協(xié)議及Javascript、擴展XML、Vdcc XML等標記語言,可完成網頁潮覽功能;適合在非PC的嵌人式信息設備中存在、運行。并完整實現(xiàn)通信傳輸協(xié)議、標記語言所規(guī)定的功能;根據嵌入式設備的多樣性需求進行裁減和修改。并滿足信息設備使用者方便地獲取文字、圖像、聲音、視頻等信息;可廣泛應用到各種非PC設備或通信終端,如電視上的機頂盒、交互式數(shù)字電視、手持上網設備(移動電話、掌上電腦、個人數(shù)字助理等)、互聯(lián)網電話、網絡終靖、電子圖書閱讀器、公共信息查詢系統(tǒng)等。

        三、結語

        簡單來看,通信終端智能語音處理技術的不斷發(fā)展,在一定程度上可以滿足人們對于信息交流的需求,不斷的研究創(chuàng)新更多的語音處理技術。未來智能通信終端語音處理技術不再局限于一種語言,將向著多種語言通信發(fā)展。

        參考文獻:

        [1]王廣科.Wang Guangke 幾種常用的音頻處理方法-物理教學探討2011,29(4)

        [2]徐波 海量音頻處理及嵌入式語音交互-2011

        [3]隋文紅 論數(shù)字技術與電影聲音空間感的建立-現(xiàn)代電影技術2011(11)

        免费大片黄国产在线观看| 一区在线播放| 蜜桃在线观看视频在线观看| 日本免费一区二区在线视频播放| 欧美日韩亚洲中文字幕二区| √天堂中文官网8在线| 国产激情视频在线| 中文字幕综合一区二区| 狼狼综合久久久久综合网| 久久丫精品国产亚洲av| 无码精品国产午夜| 国产情侣亚洲自拍第一页| 国产熟女内射oooo| 亚洲福利视频一区| 亚洲福利第一页在线观看| 青青草国产手机观看视频| 欧美乱妇高清无乱码在线观看| 视频一区欧美| 超短裙老师在线观看一区二区| 日本少妇又色又爽又高潮| 柠檬福利第一导航在线| 久久一区二区三区四区| 在线免费观看毛视频亚洲精品| 国产精品无码素人福利| 精品国产一区二区三区久久狼 | 少妇仑乱a毛片| 日中文字幕在线| 少妇一区二区三区精选| 无码国内精品人妻少妇蜜桃视频| 白嫩人妻少妇偷人精品| 男女裸交无遮挡啪啪激情试看| 国产97色在线 | 免| 色综合久久人妻精品日韩| 国产成人午夜福利在线观看| 比比资源先锋影音网| 精品人妻一区二区三区蜜桃| 视频在线观看国产自拍| 幻女bbwxxxx在线视频| 99久久精品一区二区三区蜜臀| 国产老熟女伦老熟妇露脸| 国产日产精品一区二区三区四区的特点 |