亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        不確定信號(hào)源個(gè)數(shù)的語(yǔ)音分離

        2008-04-12 00:00:00董優(yōu)麗謝勤嵐
        現(xiàn)代電子技術(shù) 2008年3期

        摘 要:介紹了兩種語(yǔ)音分離的算法——獨(dú)立成分分析(ICA)方法和稀疏混合模型方法。在信號(hào)源個(gè)數(shù)小于或等于觀察信號(hào)個(gè)數(shù)的情況下,使用獨(dú)立成分分析方法;在信號(hào)源個(gè)數(shù)大于觀察信號(hào)個(gè)數(shù)的情況下,使用稀疏混合模型方法。在各種情況下,進(jìn)行了大量實(shí)驗(yàn),結(jié)果表明,在信號(hào)源個(gè)數(shù)不確定的情況下能較好地分離出原始的語(yǔ)音信號(hào)。

        關(guān)鍵詞:獨(dú)立成分分析;稀疏分解;語(yǔ)音分離;盲信號(hào)分離

        中圖分類號(hào):TN912.3 文獻(xiàn)標(biāo)識(shí)碼:B

        文章編號(hào):1004373X(2008)0312503

        Speech Signal Separation for the Undetermined Number of Source Signals

        DONG Youli,XIE Qinlan

        (Department of Electronics and Information Engineering,South Central University for Nationalities,Wuhan,430074,China)

        Abstract:The paper introduces two methods of speech signal separation:Independent Component Analysis (ICA) and sparse mixture model.In the case of the number of source signals is not more than that of the observed signals,we use the first method,while we use the second one.The experiments further prove that the rules can well separated the original speech signals under the case of the number of unknown source signals.

        Keywords:independent component analysis;sparse decompose;speech signal separation;blind source separation

        1 引 言

        語(yǔ)音分離是為了解決類似雞尾酒會(huì)問(wèn)題,如在嘈雜的或多個(gè)人同時(shí)說(shuō)話的環(huán)境中,將每個(gè)人單獨(dú)的語(yǔ)音信息分離出來(lái)。這個(gè)問(wèn)題涉及到同時(shí)說(shuō)話的人的個(gè)數(shù),以及記錄的混合語(yǔ)音信號(hào)的個(gè)數(shù)。在實(shí)際環(huán)境中,有時(shí)無(wú)法知道有多少個(gè)人在同時(shí)講話,也就是獨(dú)立信號(hào)源的個(gè)數(shù)不確定。本文就是針對(duì)在獨(dú)立信號(hào)源的個(gè)數(shù)不確定的情況下的語(yǔ)音分離的研究。

        對(duì)于不確定信號(hào)源,首先需要確定信號(hào)源個(gè)數(shù)與混合信號(hào)個(gè)數(shù)的關(guān)系,進(jìn)而確定信號(hào)源的個(gè)數(shù),然后才能針對(duì)各個(gè)情況采取不同的算法。方法為:首先對(duì)N個(gè)混合信號(hào)X求秩,記為M。如果M

        確定信號(hào)源個(gè)數(shù)以后,根據(jù)不同情況使用相應(yīng)的分離算法。在信號(hào)源個(gè)數(shù)小于或等于觀察信號(hào)個(gè)數(shù)時(shí),使用獨(dú)立成分分析方法;在信號(hào)源個(gè)數(shù)大于觀察信號(hào)個(gè)數(shù)時(shí),使用稀疏混合模型方法。

        2 獨(dú)立成分分析

        獨(dú)立成分分析(Independent Component Analysis,ICA)問(wèn)題可簡(jiǎn)單描述為:假定從N個(gè)通道獲得N個(gè)觀測(cè)信號(hào)Xi,i=1,2,…,N,每個(gè)觀測(cè)信號(hào)是M個(gè)獨(dú)立源信號(hào)Si,i=1,2,…,M的線性混合,即X=A#8226;S。其中,X=[x1,x2,…,xN]T和S=[s1,s2,…,sM]T是觀測(cè)信號(hào)矢量和源信號(hào)矢量;A是M×N 的未知混合矩陣。并且要滿足兩個(gè)假設(shè)條件[1]:

        (1) 各源信號(hào)Si之間是統(tǒng)計(jì)獨(dú)立的;

        (2) 獨(dú)立成分是服從非高斯分布的。

        問(wèn)題就是在獨(dú)立源S和混合矩陣A都是未知的情況下,從觀測(cè)到的混合信號(hào)中估計(jì)出獨(dú)立源信號(hào)。

        2.1 負(fù)熵判據(jù)

        在ICA中,尋找獨(dú)立和非高斯的獨(dú)立成分,常用的判據(jù)有:負(fù)熵判據(jù)、信息極大化判據(jù)、極大似然判據(jù)等。其中,負(fù)熵判據(jù)具有不需要計(jì)算信號(hào)的高階累積量且計(jì)算量小的優(yōu)勢(shì),即使獨(dú)立成分的先驗(yàn)信息不對(duì),負(fù)熵判據(jù)也很少給出完全錯(cuò)誤的結(jié)果,因此具有很好的穩(wěn)健性。

        將密度為py(η)的隨機(jī)向量y的熵H定義為:

        采用負(fù)熵來(lái)檢測(cè)混合信號(hào)的非高斯性,負(fù)熵J定義如下:

        其中ygauss是與y有相同相關(guān)(協(xié)方差)矩陣的高斯隨機(jī)向量。具有相同方差的隨機(jī)變量中,高斯分布的隨機(jī)變量具有最大的信息熵,即非高斯性越強(qiáng),信息熵越小。為了方便計(jì)算,Hyvarinen給出了負(fù)熵的一種近似表達(dá)式[2—4]:

        其中,1≤a1≤2,G(#8226;)是非二次函數(shù)[2,3],可以選擇G1(y)=1a1log cosh a1y,G2(y)=-exp(-y2/2)等非線性函數(shù),v是標(biāo)準(zhǔn)高斯隨機(jī)變量。

        2.2 基于負(fù)熵的快速定點(diǎn)算法

        快速定點(diǎn)算法也稱為在線學(xué)習(xí)算法,每次更新不需要一批數(shù)據(jù)參與運(yùn)算,而是每接受一個(gè)新樣本時(shí)就更新網(wǎng)絡(luò)權(quán)值,因而計(jì)算速度快?;谪?fù)熵的快速ICA算法,綜合了定點(diǎn)迭代的計(jì)算速度快的性質(zhì)和負(fù)熵的計(jì)算量小且穩(wěn)健性好的統(tǒng)計(jì)性質(zhì),因而使用廣泛。

        對(duì)于快速定點(diǎn)算法,在進(jìn)行ICA處理前,對(duì)觀測(cè)信號(hào)要進(jìn)行白化處理。設(shè)混合信號(hào)為X,則白化后的信號(hào)Z為:

        Z=VX=(D-1/2ET)X[JY](4)

        其中,V稱為白化矩陣,D=diag(d1,…,dn)為協(xié)方差矩陣Cx=E{xxT}的特征值構(gòu)成的對(duì)角矩陣,E=(e1,…,en)的每一列為Cx的單位模的特征向量。

        ICA的處理過(guò)程就是尋找分離矩陣W以提取獨(dú)立成分。分離過(guò)程是一個(gè)逐步迭代逼近的過(guò)程,令w表示分離矩陣W中與某個(gè)獨(dú)立成分對(duì)應(yīng)的某一行向量,w的迭代公式為[2]:

        每次迭代后都要對(duì)w進(jìn)行歸一化處理w←w/‖w‖。對(duì)多個(gè)獨(dú)立成分,可重復(fù)使用上面的分離過(guò)程。但每提出一個(gè)獨(dú)立成分后,要從混合信號(hào)中減去這一獨(dú)立成分,如此重復(fù)直到所有的獨(dú)立成分完全分離。

        標(biāo)準(zhǔn)ICA方法要求信號(hào)源個(gè)數(shù)少于或等于混合信號(hào)個(gè)數(shù)。在確定了信號(hào)源的個(gè)數(shù)以后,就能使用式(5)逐個(gè)迭代出分離向量。

        在信號(hào)源個(gè)數(shù)少于觀察信號(hào)個(gè)數(shù)的情況下,未知信號(hào)源個(gè)數(shù)與混合信號(hào)數(shù)據(jù)矩陣X[WTBZ]的秩數(shù)相等;有噪聲時(shí),未知信號(hào)源個(gè)數(shù)與混合信號(hào)數(shù)據(jù)矩陣X[WTBZ]的主奇異值數(shù)相等。

        所以,在信號(hào)源個(gè)數(shù)少于或等于混合信號(hào)個(gè)數(shù)的情況下,可以直接使用標(biāo)準(zhǔn)ICA算法得到分離出的獨(dú)立成分。

        3 稀疏混合模型

        為了解決信號(hào)源個(gè)數(shù)大于混合信號(hào)個(gè)數(shù)的情況,Lewick[5—7]等學(xué)者提出超完備表示(overcomplete representations)方法,他是一個(gè)梯度算法,允許基向量的維數(shù)更大。為了改善算法的收斂性質(zhì),提出用稀疏分解方法來(lái)進(jìn)行盲源分離。利用數(shù)據(jù)沿混合矩陣的列方向集中的現(xiàn)象,可以使用聚類方法來(lái)進(jìn)行盲源分離。

        為了確定數(shù)據(jù)集中的方向,將數(shù)據(jù)從直角坐標(biāo)系映射到極坐標(biāo)系下,先將數(shù)據(jù)投影到單位球面上:

        然后,將數(shù)據(jù)點(diǎn)移至一個(gè)半空間,例如使第一個(gè)坐標(biāo)x1(t)的符號(hào)為正,再利用其他坐標(biāo)數(shù)據(jù)來(lái)計(jì)算數(shù)據(jù)α=(α1,…,αT)。在二維情況下,通過(guò)x2(t)=sin(αt)來(lái)計(jì)算;在三維情況下,αt=(α1(t),α2(t))T,通過(guò)x3(t)=sin(α1(t)),x2(t)=cos(α1(t))sin(α2(t)),x1(t)=cos(α1(t))cos(α2(t))來(lái)計(jì)算,依此類推。從數(shù)據(jù)α=(α1,…,αT)的直方圖,可以看出數(shù)據(jù)α是由幾個(gè)聚類分布組成,也對(duì)應(yīng)著獨(dú)立信號(hào)源的個(gè)數(shù)。數(shù)據(jù)α的聚類中心對(duì)應(yīng)混合信號(hào)的不同的聚類方向,且聚類中心的坐標(biāo)決定了混合矩陣的列向量。在二維情況下,聚類中心的坐標(biāo)是b1,b2,…,bT,可由下式來(lái)計(jì)算混合矩陣A:

        在多維情況下,依此類推。

        所以,只需要找到聚類中心,就可以計(jì)算出混合矩陣A,從而估計(jì)出獨(dú)立成分。

        實(shí)際中的語(yǔ)音信號(hào)都是超高斯的,可以用稀疏密度分布來(lái)模擬語(yǔ)音信號(hào)的密度函數(shù),典型代表即Laplacian密度函數(shù):

        其中,bk是聚類中心,βk是寬度參數(shù)。通過(guò)極大化似然函數(shù)得到一個(gè)梯度上升迭代學(xué)習(xí)算法,如下:

        參數(shù)θk={βk,bk}是隨機(jī)初始化的,迭代到一定的次數(shù)后,對(duì)數(shù)似然漸進(jìn)穩(wěn)定于某一個(gè)值,這就是所求的聚類中心,再計(jì)算出混合矩陣A。

        4 實(shí)驗(yàn)及結(jié)論

        從4種不同語(yǔ)言的語(yǔ)音信號(hào)中,截取了樣本率為44 100 b/s、長(zhǎng)度為10 s的數(shù)據(jù),使用Matlab采樣處理后,得到4段數(shù)據(jù)長(zhǎng)度為4 000的語(yǔ)音信號(hào)作為實(shí)驗(yàn)對(duì)象。分別在信號(hào)源個(gè)數(shù)等于、小于和大于觀察信號(hào)個(gè)數(shù)的3種情況下使用本文所提出的方法進(jìn)行分離,以下是實(shí)驗(yàn)結(jié)果:

        (1) 信號(hào)源個(gè)數(shù)等于觀察信號(hào)個(gè)數(shù)的情況下,直接使用ICA算法。圖1(a)中的4段語(yǔ)音信號(hào)作為信號(hào)源S,圖1(b)是信號(hào)源經(jīng)過(guò)隨機(jī)混合矩陣A混合后得到混合信號(hào)X,圖1(c)是使用該算法分離出的獨(dú)立成分,可見(jiàn)分離效果很好。

        (2) 信號(hào)源個(gè)數(shù)少于觀察信號(hào)個(gè)數(shù)的情況下,取圖1(a)中的3個(gè)原始語(yǔ)音信號(hào)為信號(hào)源S,用5×3的隨機(jī)矩陣進(jìn)行混合,得到5個(gè)混合信號(hào)X。求得秩rank(X)=3,再使用ICA算法進(jìn)行分離,如圖2所示,可見(jiàn)分離效果良好。

        圖1 信號(hào)源個(gè)數(shù)等于觀察信號(hào)個(gè)數(shù)

        圖2 信號(hào)源個(gè)數(shù)少于觀察信號(hào)個(gè)數(shù)

        (3) 信號(hào)源個(gè)數(shù)大于觀察信號(hào)個(gè)數(shù)的情況下,使用圖2(a)中的3個(gè)原始語(yǔ)音信號(hào)為信號(hào)源S,用2×3的隨機(jī)矩陣進(jìn)行混合,得到2個(gè)混合信號(hào)X。以混合信號(hào)X1,X2分別為橫軸和縱軸,得到混合信號(hào)X1對(duì)X2的分散點(diǎn)圖,如圖3所示,從該圖中可看出分散點(diǎn)圖呈現(xiàn)3個(gè)不同的方向,即有3個(gè)獨(dú)立信號(hào)源,分別對(duì)應(yīng)于混合矩陣的列向量,是可視化的。

        使用第3節(jié)中的方法,得到這兩個(gè)混合信號(hào)映射到極坐標(biāo)下的數(shù)據(jù)α的直方圖,如圖4所示,可以看到數(shù)據(jù)α由3個(gè)不同的聚類分布組成,對(duì)應(yīng)于在直角坐標(biāo)下的3個(gè)聚類方向。數(shù)據(jù)α的密度函數(shù)可以由3個(gè)稀疏密度函數(shù)的線形組合來(lái)表示。使用式(9),式(10)可以估計(jì)出每個(gè)稀疏密度函數(shù)的聚類中心bk和寬度參數(shù)βk。聚類中心點(diǎn)的直角坐標(biāo)就對(duì)應(yīng)混合矩陣的列,從而可以估計(jì)出獨(dú)立成分,如圖5(c)所示,分離出的獨(dú)立成分有些噪聲,但基本上可識(shí)別出來(lái)。

        圖3 兩個(gè)混合信號(hào)X1對(duì)X2的分散點(diǎn)圖

        圖4 數(shù)據(jù)α的直方圖

        圖5 信號(hào)源個(gè)數(shù)大于觀察信號(hào)個(gè)數(shù)

        5 結(jié) 語(yǔ)

        源信號(hào)個(gè)數(shù)未知的盲源分離是盲信號(hào)分離的難題之一,本文針對(duì)各種情況進(jìn)行分離,并提出了可行的方法。特別是在超完備情況下,用稀疏密度分布來(lái)模擬語(yǔ)音信號(hào)的密度函數(shù),采用了稀疏混合模型對(duì)語(yǔ)音信號(hào)進(jìn)行有效的分離。但是該算法的穩(wěn)定性也受初值和混合矩陣的影響,因此進(jìn)一步提高該算法的穩(wěn)定性將是下一步的研究工作。

        參考文獻(xiàn)

        [1]Hyvarinen A.Survey on Independent Component Analysis[J].Neural Computing Surveys,1999,1(2):94—128.

        [2]Hyvarinen A.Independent Component Analysis:Algorithms and Applications [J].IEEE Trans.on Neural Network,2000,13(5):411—430.

        [3]Hyvarinen A.Fast and Robust Fixed—point Algorithms for Independent Component Analysis[J].IEEE Trans.on Neural Networks,1999,10(3):626—634.

        [4]Hyvarinen A.Gaussian Moments for Noisy Independent Component Analysis [J].IEEE Signal Processing Letters,1999,6(6):145—147.

        [5]Te—Won Lee,Michael Lewicki S,Mark Girolami.Blind Source Separation of More Sources Than Mixtures Using Overcomplete Representations[J].IEEE Signal Process,1999,6(4):87—90.

        [6]Michael Lewicki S,Bruno Olshausen A.Probabilistic Framework for the Adaptation and Comparison of Image Codes.1999,16(7):1 587—1 601.

        [7]Lewicki M S,Sejnowski T J.Learning Overcomplete Representations[J].Neural Comput.,2000,12(2):337—365.

        [8]http://www.cnl.salk.edu/~tewon.

        作者簡(jiǎn)介

        董優(yōu)麗 女,1984年出生,湖北武漢人,碩士研究生。從事模式識(shí)別方向的研究。

        謝勤嵐 男,1968年出生,湖北武漢人,副教授,碩士生導(dǎo)師。

        注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。

        亚洲AV无码乱码1区久久| 国产最新地址| 久热这里只有精品99国产| 午夜无码亚| av天堂在线免费播放| 国产色视频在线观看了| 最好看的亚洲中文字幕| 干出白浆视频在线观看| 国产高颜值女主播在线| 高清精品一区二区三区| 天堂8中文在线最新版在线| 国内精品久久久影院| 国产一起色一起爱| 亚洲一区二区三区ay| 国产免费观看久久黄av麻豆| 无码人妻精品一区二区三区蜜桃| 亚洲另类欧美综合久久图片区| 精品人妻无码一区二区色欲产成人| 亚洲aⅴ无码日韩av无码网站| 中文字幕日韩精品美一区二区三区| 国产午夜激情视频在线看| 久久精品女人av一区二区| 欧美肥婆性猛交xxxx| 日本一卡2卡3卡四卡精品网站| 国产女人成人精品视频| 亚洲高清精品50路| 国产精品熟女视频一区二区三区| 国语自产精品视频在线看| 无码人妻av免费一区二区三区| 澳门毛片精品一区二区三区| 精品久久久亚洲中文字幕| 手机在线免费观看的av| 亚洲精品无码av人在线观看国产| 精品国产一二三产品区别在哪 | 亚洲第一网站免费视频| 熟女无套内射线观56| 老熟女多次高潮露脸视频| 免费视频成人 国产精品网站| 亚洲中文字幕一区高清在线| 亚洲综合av大全色婷婷| 东京热人妻无码一区二区av|