亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        通用碼本語音矢量編碼算法研究

        2019-06-15 03:31:35楊超劉云飛徐向旭劉傳輝朱弘
        現(xiàn)代電子技術(shù) 2019年12期

        楊超 劉云飛 徐向旭 劉傳輝 朱弘

        摘 ?要: 基于預(yù)測編碼、SOM自主神經(jīng)網(wǎng)絡(luò)矢量編碼和Huffman編碼的聯(lián)合編碼算法(PV算法)壓縮效果雖然較好,但它在對每段語音編碼時,都需要利用該段語音信號,通過SOM自主神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到碼本,算法復(fù)雜、耗時。為此文中提出從具有一般特征的多段語音信號中通過SOM自主神經(jīng)網(wǎng)絡(luò)訓(xùn)練提取碼本,所有的語音信號段PV編碼都統(tǒng)一用該碼本,不需要對每一段語音信號編碼都做一次提取碼本的運(yùn)算,這樣不僅節(jié)省了每段語音PV編碼時用于訓(xùn)練碼本的時間,也節(jié)省了需要編碼的專用碼本的信息,減小了碼率。實(shí)驗(yàn)結(jié)果顯示,通用碼本的PV編碼算法在保證一定語音質(zhì)量的條件下,是可行的。文中提出的編碼算法在語言壓縮編碼方面具有較高的研究價值和很好的應(yīng)用前景。

        關(guān)鍵詞: PV編碼; 矢量編碼; 語音信號編碼; 神經(jīng)網(wǎng)絡(luò)訓(xùn)練; 通用碼本; 專用碼本

        中圖分類號: TN911.3?34 ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)12?0165?03

        Abstract: The joint encoding algorithm based on the predictive coding, SOM autonomous neural network vector coding and Huffman coding (PV algorithm) has a good combination effect, but is complex and time?consuming when used to obtain the codebook by means of the SOM autonomous neural network training since the speech signal segment needs to be used during the encoding of each speech segment. Therefore, the SOM autonomous neural network training is proposed in this paper to extract the codebook from multiple speech signal segments with general features. The codebook is used for PV coding of all speech signal segments. There is no need to perform a codebook extraction operation for encoding of each speech signal segment, which not only saves the codebook training time for PV coding of each speech segment, but also saves the information of specific codebooks that need to encode, and reduces the bit rate. The experimental results show that the PV coding algorithm of the general codebook is feasible under the condition of guaranteeing a certain speech quality, and the coding algorithm proposed in this paper has a high research value and good application prospect in the aspect of language compression coding.

        Keywords: PV coding; vector coding; speech signal coding; neural network training; general codebook; specific codebook

        0 ?引 ?言

        語音編碼的目的是減少表示語音信號的碼元數(shù)量[1],早在1972年,ITU?T發(fā)布A/μ率 64 Kb/s,脈沖編碼調(diào)制語音編碼標(biāo)準(zhǔn)G.711 [2]。目前語音編碼的基本算法主要有波形編碼、混合編碼和參數(shù)編碼[3]。一種基于預(yù)測編碼、SOM自主神經(jīng)網(wǎng)絡(luò)[4?7]矢量編碼[8?10]和Huffman編碼的聯(lián)合編碼算法(以下簡稱PV編碼算法)屬于波形編碼[11],其碼率達(dá)到12.8 Kb/s,小于采用ADPCM編碼算法的波形編碼標(biāo)準(zhǔn)G.72的碼率32 Kb/s(波形編碼的最小碼率)。但是PV算法中的SOM自主神經(jīng)網(wǎng)絡(luò)矢量的訓(xùn)練樣本采用的是待傳輸?shù)男盘枺秉c(diǎn)是每傳送一段語音信號,就需要對SOM自主神網(wǎng)絡(luò)進(jìn)行一次訓(xùn)練,工作量比較大。本文提出PV算法中的SOM神經(jīng)網(wǎng)絡(luò)的矢量量化的碼矢(本)采用通用碼矢(本),這樣不需要每傳輸一段語音就對SOM神經(jīng)網(wǎng)絡(luò)訓(xùn)練一次,文中將研究PV編碼算法中矢量量化采用通用碼本的編解碼效果,旨在找到碼率變化范圍較小的條件下,減少PV編碼算法的運(yùn)算量和運(yùn)算時間的算法。

        1 ?PV算法

        圖1為2維PV算法編碼部分程序流程圖。以此類推,n維PV算法是將一列語音信號轉(zhuǎn)變?yōu)閚列,然后進(jìn)行線性預(yù)測和n維矢量量化。

        圖1 ?2維PV算法編碼程序流程圖

        2 ?通用矢量碼本PV算法實(shí)驗(yàn)結(jié)果與分析

        專用碼本PV編碼算法中,對SOM自主神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本源自待傳輸?shù)恼Z音信號,這樣的碼本只對待傳輸?shù)男盘柫炕`差小。通用碼本的SOM神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本源自眾多的常用的語音信號,這樣從統(tǒng)計(jì)意義上來說,通用碼本對一般語音信號的矢量量化誤差小。

        實(shí)驗(yàn)中,先選取了男聲、女聲和男聲音樂混合聲音3段信號。因?yàn)?維64碼矢PV語音編碼具有較小的碼率,這里按照8維PV編碼算法的編碼原理,對3段信號分別進(jìn)行8列線性預(yù)測并計(jì)算誤差,得到3個長度分別是5 000,6 017,5 016的8列(維)的誤差矩陣,將三段誤差矢量拼在一起形成了一個16 033的8維矩陣,送入到SOM自主神經(jīng)網(wǎng)絡(luò)訓(xùn)練。為了得到64個碼本,神經(jīng)網(wǎng)絡(luò)的輸出設(shè)定為64。據(jù)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)果,得到8維PV編碼算法的64碼矢的通用碼本。壓縮率和信噪比的計(jì)算公式為: [壓縮率=編碼后二進(jìn)制碼總位數(shù)初始信號二進(jìn)制碼總位數(shù)×100%] (1)

        式中:原始信號的功率為[Ps];語音信號的噪聲功率[Pn]。

        圖2為用8維PV編碼算法的64碼矢的通用碼本對一段語音信號編譯碼的情況。從圖中可以看出,譯碼恢復(fù)信號在時域和頻域都保持了原始語音信號的基本特征和形狀。播放還原聲音,仍能較為清楚地聽清語音內(nèi)容,音色變化不大,存在少量噪聲。信噪比為6.14 dB,壓縮率為8.58%。

        圖2 ?通用碼本語音信號恢復(fù)情況

        表1為用5段聲音做為訓(xùn)練樣本,將它們拼接成長度為26 843的8維預(yù)測誤差矩陣,通過SOM自主神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到64個通用碼本,并用該通用碼本對10段聲音做8維64碼矢的PS編譯碼后恢復(fù)的聲音情況。

        表1 ?通用碼本8維64碼矢PV算法譯碼聲音恢復(fù)情況

        由表1可見,專用碼本恢復(fù)的10段聲音質(zhì)量較通用碼本的好,10段用通用碼本恢復(fù)的語音中有8組樣本恢復(fù)聲音質(zhì)量為良,語音內(nèi)容能清楚辨別,音色變化較小;2組恢復(fù)聲音質(zhì)量較差,內(nèi)容勉強(qiáng)聽清,音色有變化,噪聲較大較差。所以,雖然通用碼本譯碼恢復(fù)的聲音質(zhì)量較專用碼本差,但仍然可行。

        3 ?結(jié) ?論

        雖然適當(dāng)?shù)倪x擇參數(shù)可使PV算法編碼碼率值很小,但是,對每段語音編碼時,都需要利用該段語音信號,通過SOM自主神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到碼本,算法復(fù)雜、耗時。本文提出從具有一般特征的多段語音信號中通過SOM自主神經(jīng)網(wǎng)絡(luò)訓(xùn)練提取碼本,所有的語音信號段PV編碼都用該碼本,不需要對每一段語音信號編碼都做一次提取碼本的運(yùn)算,這樣不僅節(jié)省了每段語音PV編碼時用于訓(xùn)練碼本的時間,而且節(jié)省了需要編碼的專用碼本的信息,從而減少了碼率。實(shí)驗(yàn)結(jié)果顯示,通用碼本的PV編碼算法在保證一定語音質(zhì)量的條件下,是可行的。

        注:本文通訊作者為徐向旭。

        參考文獻(xiàn)

        [1] 肖東,莫福源,陳庚,等.低碼率語音編碼中過渡幀對合成語音的影響[J].應(yīng)用聲學(xué),2016,35(1):77?83.

        XIAO Dong, MO Fuyuan, CHEN Geng, et al. Effects of transition frame on synthesized speech in low bit rate speech coding [J]. Journal of applied acoustics, 2016, 35(1): 77?83.

        [2] 李曉明.語音與音頻信號的通用編碼方法研究[D].北京:北京工業(yè)大學(xué),2014.

        LI Xiaoming. Research on universal coding method for speech and audio signals [D]. Beijing: Beijing University of Technology, 2014.

        [3] 梁冬蕾.音頻語音聯(lián)合編碼算法研究[D].西安:西安電子科技大學(xué),2010.

        LIANG Donglei. Research on joint coding algorithm for audio speech [D]. Xian: Xidian University, 2010.

        [4] 錢海軍.基于BP神經(jīng)網(wǎng)絡(luò)的圖像壓縮的Matlab實(shí)現(xiàn)[J].電腦開發(fā)與應(yīng)用,2011,24(12):77?79.

        QIAN Haijun. Image compression based on neural network using Matlab [J]. Computer development & applications, 2011, 24(12): 77?79.

        [5] 王龍,杜敦偉,白艷萍.SOM網(wǎng)絡(luò)在雷達(dá)目標(biāo)識別中的應(yīng)用[J].科技視界,2015(16):52?53.

        WANG Long, DU Dunwei, BAI Yanping. Application of SOM network in radar target recognition [J]. Science & technology vision, 2015(16): 52?53.

        [6] 楊晨,閆薇.利用SOM網(wǎng)絡(luò)模型進(jìn)行聚類研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(2):44?45.

        YANG Chen, YAN Wei. Research on the clustering by using SOM network model [J]. Network security technology & application, 2014(2): 44?45.

        [7] 鄒瑜,帥仁俊.基于改進(jìn)的SOM神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像分割算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2016,37(9):2533?2537.

        ZOU Yu, SHUAI Renjun. Improved segmentation algorithm of medical images based on SOM neural network [J]. Computer engineering and design, 2016, 37(9): 2533?2537.

        [8] 楊超,賀一君,任建存,等.碼本均衡矢量編碼算法[J].現(xiàn)代電子技術(shù),2016,39(13):38?40.

        YANG Chao, HE Yijun, REN Jiancun, et al. Codebook equilibrium algorithm for vector coding [J]. Modern electronics technique, 2016, 39(13): 38?40.

        [9] 楊超,董世錕.矢量量化圖像壓縮方法[J].海軍航空工程學(xué)院學(xué)報(bào),2011,26(1):11?14.

        YANG Chao, DONG Shikun. Image compression method based on vector quantization [J]. Journal of Naval Aeronautical and Astronautical University, 2011, 26(1): 11?14.

        [10] MAKHOUL J, ROUCOS S, GISH H. Vector quantization in speech coding [J]. Proceeding of the IEEE, 1985, 73(11): 1551?1588.

        [11] 楊超,劉云飛,徐向旭,等.基于預(yù)測編碼和矢量編碼的語音信號編碼算法[J].現(xiàn)代電子技術(shù),2018,41(24):128?131.

        YANG Chao, LIU Yunfei, XU Xiangxu, et al. Speech signal coding algorithm based on predictive coding and vector coding [J]. Modern electronics technique, 2018, 41(24): 128?131.

        日韩在线中文字幕一区二区三区| 99热久久精里都是精品6| 97久久久久人妻精品专区| 国产精品日日摸夜夜添夜夜添| 人妻少妇被猛烈进入中文| 国产人妻高清国产拍精品| 男女啪啪永久免费观看网站| 午夜亚洲国产理论片亚洲2020| 中文天堂一区二区三区| 日韩精品视频久久一区二区| 中文字幕+乱码+中文字幕一区| 久久亚洲国产中v天仙www| 亚洲处破女av一区二区| 国产精品会所一区二区三区| 国产麻豆成人精品av| 美国黄色片一区二区三区| 国产99久久久国产精品免费| 亚洲国产精品无码一线岛国| 亚洲人成电影在线观看天堂色| 亚州无线国产2021| 中文字幕日韩精品亚洲精品| 强开小婷嫩苞又嫩又紧视频韩国| 综合无码一区二区三区| 国产真实乱XXXⅩ视频| 精品人妻在线一区二区三区在线| 一本色道久久综合狠狠躁篇| 四虎国产精品永久在线无码| 亚洲av噜噜狠狠蜜桃| 中文字幕有码人妻在线| 伊人久久大香线蕉av网禁呦| 精品少妇大屁股白浆无码| 日韩一区二区中文字幕视频| 中文人妻av久久人妻水蜜桃| 最近中文字幕在线mv视频在线| 亚洲无码激情视频在线观看| 精品国产亚洲第一区二区三区| 成人美女黄网站色大免费的| 国产精品久久无码不卡黑寡妇| 亚洲人妻精品一区二区三区| 欧美黑人又粗又大xxxx| 又爽又黄禁片视频1000免费|