亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)多樣性密度的性別識(shí)別

        2015-04-11 14:05:38顧明亮張世形
        關(guān)鍵詞:識(shí)別率示例類別

        顧明亮 ,張世形 ,鮑 薇

        1.江蘇師范大學(xué) 物理與電子工程學(xué)院,江蘇 徐州 221116

        2.江蘇師范大學(xué) 語言科學(xué)學(xué)院,江蘇 徐州 221116

        1 引言

        20世紀(jì)90年代,Dietterich等[1]在對藥物活性預(yù)測問題的研究中,提出了多示例學(xué)習(xí)的概念,其目的是通過對已知適合或不適合制藥的分子進(jìn)行分析來構(gòu)建一個(gè)學(xué)習(xí)系統(tǒng),以盡可能準(zhǔn)確地預(yù)測某種分子是否適合制造藥物。此后,國內(nèi)外很多學(xué)者對該問題進(jìn)行了研究,并應(yīng)用于其他領(lǐng)域:Maron[2]將多示例學(xué)習(xí)應(yīng)用于股票投資中的個(gè)股選擇問題;Ruffo[3]將多示例學(xué)習(xí)應(yīng)用于數(shù)據(jù)挖掘;Andrews[4]、Huang[5]、Yang[6]、Zhang 等[7]分別將多示例學(xué)習(xí)用于圖像檢索;Chevaleyre等[8]用多示例學(xué)習(xí)研究了Mutagenesis問題并取得了理想成果。在多示例學(xué)習(xí)中,訓(xùn)練樣本的歧義性比較特殊,使得多示例學(xué)習(xí)模型與傳統(tǒng)的機(jī)器學(xué)習(xí)模型有很大差別。多示例學(xué)習(xí)的這種獨(dú)特性質(zhì)和良好的應(yīng)用前景,使得多示例學(xué)習(xí)被稱為與監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)并列的第四種機(jī)器學(xué)習(xí)框架。

        多示例學(xué)習(xí)(multi-instance learning)問題可描述為:假設(shè)訓(xùn)練數(shù)據(jù)集中的每個(gè)數(shù)據(jù)是一個(gè)包(bag),每個(gè)包是一組示例(instances)集合,有一個(gè)訓(xùn)練標(biāo)記,而包中的示例沒有標(biāo)記。如果一個(gè)包被標(biāo)記為負(fù)包(negative bag),即用戶不感興趣的訓(xùn)練樣本,則包中的每一個(gè)示例為負(fù)例;如果包被標(biāo)記為正包(positive bag),即用戶感興趣的樣本,則包中至少一個(gè)示例為正例。學(xué)習(xí)算法通過對多個(gè)包組成的訓(xùn)練數(shù)據(jù)集進(jìn)行學(xué)習(xí),生成一個(gè)分類器,以盡可能正確地對訓(xùn)練集外的未知包(unseen bag)進(jìn)行預(yù)測。多示例學(xué)習(xí)框架可以用圖1來表示。

        圖1 多示例學(xué)習(xí)框架示意圖

        多示例學(xué)習(xí)提出后,國內(nèi)外很多學(xué)者對該問題進(jìn)行了研究,并提出了很多有效的算法:Maron等[9]提出了多樣性密度(Diverse Density,DD)算法;Zhang等[10]將多樣性密度算法與EM算法結(jié)合起來,提出了EM-DD算法;Ramon等[11]構(gòu)造了多示例神經(jīng)網(wǎng)絡(luò);Zhou等[12]通過使用特殊的誤差函數(shù),提出了BP-MIP算法。

        多樣性密度算法對后來的研究影響很大,很多學(xué)者都在此算法的基礎(chǔ)上進(jìn)行了研究。戴宏斌[13]、王春燕[14]、陳綿書等[15]以及龍哲[16]分別運(yùn)用多樣性密度算法進(jìn)行了圖像檢索方法的創(chuàng)新與應(yīng)用。目前,還沒有學(xué)者將多樣性密度算法應(yīng)用于語音識(shí)別中。本文利用多樣性密度算法能夠有效發(fā)掘語音信號(hào)內(nèi)在規(guī)律和分布的特點(diǎn),并提出Instances-k近鄰分類算法,探索了一種語音性別識(shí)別的方法。

        2 多樣性密度算法及其改進(jìn)

        2.1 多樣性密度算法

        1998年,Maron等[9]提出了多樣性密度算法。在該算法中,給出了多樣性密度的概念,并規(guī)定在屬性空間中某點(diǎn)周圍出現(xiàn)的正包數(shù)越多,且負(fù)包示例出現(xiàn)得越遠(yuǎn),則該點(diǎn)的多樣性密度越大。多樣性密度點(diǎn)示意圖如圖2所示。

        圖2 多樣性密度點(diǎn)示意圖

        令代表第i個(gè)正包,代表第i個(gè)負(fù)包,則代表第i個(gè)正包中第j個(gè)示例的第k個(gè)屬性,代表第i個(gè)負(fù)包中第j個(gè)示例的第k個(gè)屬性。對于特征空間內(nèi)的任一點(diǎn)t,假設(shè)目標(biāo)概念點(diǎn)的概率為:

        假設(shè)各包是條件獨(dú)立的,根據(jù)貝葉斯定理,上式可化為:

        在實(shí)際應(yīng)用中,Maron使用了“noisy-or”模型,上式可化為:

        其中:

        Zhang和Goldman提出了EM-DD算法[10],他們將DD算法與EM算法相結(jié)合來求解目標(biāo)特征t。EM-DD算法首先假設(shè)一個(gè)初始目標(biāo)特征h;然后E步從訓(xùn)練集的每個(gè)示例包中選出最靠近h的示例組成一個(gè)集合;再在M步中,采用梯度搜索法對E步中獲得的集合進(jìn)行計(jì)算,得到一個(gè)新的使多樣性密度最大的特征點(diǎn)h′,用h′代替h。重復(fù)E步和M步到算法收斂為止。由于DD算法要進(jìn)行多次梯度下降搜索來求解多樣性密度點(diǎn),計(jì)算時(shí)間比較長,效率不高,而EM-DD算法將多示例轉(zhuǎn)變?yōu)閱我皇纠岣吡怂阉餍省?/p>

        2.2 多樣性密度算法的改進(jìn)

        2.2.1 雙類別多樣性密度

        雙類別多樣性密度的定義:在多類別訓(xùn)練樣本集合中,將A類訓(xùn)練樣本包標(biāo)記為正,其他類別樣本包標(biāo)記為負(fù),通過EM-DD算法計(jì)算,得到A類樣本的正最大多樣性密度點(diǎn)PA;反之,將A類樣本包標(biāo)記為負(fù),其他類樣本包標(biāo)記為正,則得到A類樣本的負(fù)最大多樣性密度點(diǎn)NA。如果待測未知包為A類樣本包,則未知包中包含距離點(diǎn)PA最近和距離點(diǎn)NA最遠(yuǎn)的示例。

        雙類別多樣性密度的基本思想是對多類別訓(xùn)練樣本集進(jìn)行兩類多次標(biāo)記,以獲取訓(xùn)練樣本集的內(nèi)在規(guī)律與分布特點(diǎn)。假設(shè)樣本集合包含A、B、C三類數(shù)據(jù),以{A,B,C}樣本集合為例,PA、PB、PC分別代表A、B、C的正最大多樣性密度點(diǎn),NA、NB、NC分別代表A、B、C的負(fù)最大多樣性密度點(diǎn),則各最大多樣性密度點(diǎn)的標(biāo)記方式如表1。

        表1 A、B、C的雙類別多樣性密度點(diǎn)的標(biāo)記方式

        假設(shè)男性最大正、負(fù)多樣性密度點(diǎn)為PM、NM,女性最大正、負(fù)多樣性密度點(diǎn)為PF、NF,則男、女信號(hào)的最大正、負(fù)多樣性密度點(diǎn)通過圖3表示方式得到。

        圖3 男、女信號(hào)的最大正、負(fù)多樣性密度點(diǎn)

        語音信號(hào)中只包含男、女兩類信號(hào),男性信號(hào)的最大正多樣性密度點(diǎn)PM也是女性信號(hào)的最大負(fù)多樣性密度點(diǎn)NF,同樣,點(diǎn)PF和點(diǎn)NM也為同一點(diǎn)。在語音識(shí)別技術(shù)中提取的語音特征往往是多維的:如32維、64維甚至是128維,因此很難在平面上描繪出樣本數(shù)據(jù)在空間中的具體分布。為了既形象又簡便地描繪多樣性密度算法原理,本文在繪圖時(shí)將多維數(shù)據(jù)“降維”至二維數(shù)據(jù),此時(shí)在樣本空間中點(diǎn)PM和點(diǎn)PF組成的雙點(diǎn)語言模型如圖4。

        圖4 雙點(diǎn)模型下的分類判決

        需要說明的是:在實(shí)際樣本空間中,圖4中虛線圓并不是一個(gè)平面圓,而是一個(gè)多屬性球,屬性數(shù)與提取的語音特征的維數(shù)相同。圖5和圖6采用同樣的描述方式。

        圖5 k近鄰分類算法

        圖6 Instance-k近鄰分類算法

        在傳統(tǒng)的單點(diǎn)模型中,對未知包進(jìn)行分類判決時(shí),首先需要大量計(jì)算示例空間中最近示例到多樣性密度點(diǎn)的距離作為參考數(shù)據(jù),然后人為地設(shè)置閾值θ。假設(shè)未知包中示例到男性樣本的多樣性密度點(diǎn)的最小Hausdorff距離為distance1,則判決公式如下:

        在雙點(diǎn)模型下進(jìn)行分類判決時(shí),首先計(jì)算出示例空間中未知包中示例到兩類別多樣性密度點(diǎn)的最小Hausdorff距離distance1、distance2,然后比較距離的大小關(guān)系,具體判決準(zhǔn)則如下:

        雙點(diǎn)模型下的判決不需要進(jìn)行大量實(shí)驗(yàn)來人為設(shè)置閾值θ,減小了系統(tǒng)的運(yùn)算次數(shù),節(jié)省了時(shí)間,提高了系統(tǒng)的效率。

        2.2.2 Instance-k近鄰分類算法

        Instance-k近鄰算法的思想來自于理論上比較成熟的k近鄰分類算法。在k近鄰分類算法中,如果一個(gè)樣本在特征空間中的k個(gè)最鄰近樣本中的大多數(shù)屬于某一類別,則該樣本也屬于這個(gè)類別。圖5為k近鄰分類算法示意圖。

        Instance-k近鄰分類算法:在示例空間中,選取未知包中距離各多樣性密度點(diǎn)最近的k個(gè)示例,計(jì)算這k個(gè)示例到各點(diǎn)的Hausdorff距離并求和,未知包屬于Hausdorff距離之和最小的那一類。圖6為Instance-k近鄰分類算法示意圖。

        假設(shè)示例空間中存在三個(gè)多樣性密度點(diǎn)Pa、Pb、Pc,未知包中最近k個(gè)示例到各多樣性密度點(diǎn)的距離表示如下:

        未知包類別屬于距離最小的多樣性密度點(diǎn)所屬類別:

        當(dāng)Instance-k近鄰分類算法中k=1時(shí),其實(shí)就是示例最近鄰分類算法。由圖5可以知道,在示例空間中,如果未知包中存在野點(diǎn)示例,最近鄰分類算法會(huì)受到野點(diǎn)示例的影響而錯(cuò)誤分類。Instance-k近鄰分類算法可以有效地減小示例野點(diǎn)對分類判決的影響,從而盡可能正確地對未知包進(jìn)行預(yù)測。

        3 實(shí)驗(yàn)設(shè)計(jì)與分析

        本實(shí)驗(yàn)語音全部采用國際標(biāo)準(zhǔn)OGI(Oregon Graduate Institute)語音數(shù)據(jù)庫。OGI語音數(shù)據(jù)庫包含11種國家的語言,每種語言都包含男女語音信號(hào),本實(shí)驗(yàn)只選取普通話。訓(xùn)練集共80人,其中男性42人,女性38人;訓(xùn)練語音時(shí)長約3 840 s,其中男性約1 920 s,女性1 920 s;測試集時(shí)長約500 s,男女性各250 s。訓(xùn)練集和測試集不交叉,采樣頻率為8 kHz,量化比為16 bit。訓(xùn)練集用于多樣性密度點(diǎn)的訓(xùn)練,測試集用于系統(tǒng)的測試。

        3.1 語音包的生成

        在多示例學(xué)習(xí)中,包的生成至關(guān)重要,本文語音包的生成分為三個(gè)步驟:首先,計(jì)算機(jī)讀取語音信號(hào)后進(jìn)行預(yù)處理和特征提??;然后將特征集均勻切分為n段,其中n即為包的個(gè)數(shù);最后,采用k-means算法將每段特征向量集聚類為k個(gè)特征向量作為包中示例,k即為包中示例個(gè)數(shù)。圖7是包生成的原理框圖。

        圖7 包生成原理圖

        其中,預(yù)處理中所用的預(yù)加重濾波器為1-0.95z-1,窗函數(shù)為Hamming窗,語音信號(hào)幀長取256點(diǎn),幀移為128點(diǎn);由于MFCC特征是性別分類中最具區(qū)別性的參數(shù)之一,特征提取時(shí)提取語音信號(hào)的42維MFCC特征,包括對數(shù)能量、倒譜系數(shù)、一階差分系數(shù)和二階差分。訓(xùn)練包集由所有訓(xùn)練語音連接組成,包的最優(yōu)個(gè)數(shù)n和包中示例數(shù)k將通過實(shí)驗(yàn)進(jìn)行選擇;每一測試包由持續(xù)時(shí)長2.5 s的測試語音生成,示例數(shù)與訓(xùn)練包中的示例數(shù)相等。

        3.2 實(shí)驗(yàn)結(jié)果與分析

        在尋找最優(yōu)數(shù)量的包數(shù)和示例數(shù)時(shí),首先固定示例為32,比較不同包數(shù)對性別識(shí)別系統(tǒng)的影響。圖8表明當(dāng)訓(xùn)練包的數(shù)目不足200時(shí),同一類別的最大多樣性密度點(diǎn)不容易被發(fā)現(xiàn),識(shí)別率不高;當(dāng)訓(xùn)練包數(shù)為200時(shí),識(shí)別率最高,分別為男性93%、女性94%;當(dāng)訓(xùn)練包數(shù)大于200時(shí),系統(tǒng)識(shí)別精度略有下降且趨于穩(wěn)定。綜合考慮計(jì)算成本與識(shí)別率,訓(xùn)練包數(shù)目設(shè)為200。

        圖8 包數(shù)對性別識(shí)別系統(tǒng)的影響

        考察示例數(shù)對性別識(shí)別系統(tǒng)的影響時(shí),固定包數(shù)為200,改變示例的數(shù)量。觀察圖9可以知道,隨著示例數(shù)的增加,識(shí)別率會(huì)先提高后下降,且系統(tǒng)對示例數(shù)非常敏感。當(dāng)示例數(shù)設(shè)為32時(shí),系統(tǒng)的平均識(shí)別率最高。

        圖9 示例數(shù)對性別識(shí)別系統(tǒng)的影響

        確定了訓(xùn)練包數(shù)目為200,示例數(shù)為32后,考察Instance-k近鄰分類算法中k的選擇對系統(tǒng)的影響。從圖10可以看出,隨著k的增加,識(shí)別率先提高后下降。當(dāng)k等于3時(shí),系統(tǒng)識(shí)別率達(dá)到最高值:男性97%,女性98%,提高了系統(tǒng)的識(shí)別率。但是,隨著k值的增加,識(shí)別率也在不斷下降。

        圖10 k值對性別識(shí)別系統(tǒng)的影響

        Instance-k近鄰分類算法的作用是減小野點(diǎn)示例對分類判決的影響,但隨著k值的增加,即參與計(jì)算的示例數(shù)增加,與多示例學(xué)習(xí)中利用未知包中單一示例進(jìn)行判決的差異性變大,判決結(jié)果可能會(huì)出現(xiàn)錯(cuò)誤,圖10證明了這一點(diǎn)。

        4 結(jié)束語

        利用雙類別多樣性密度算法構(gòu)造了一個(gè)雙點(diǎn)語言模型,并在分類階段提出了Instance-k近鄰分類算法,進(jìn)行了語音性別識(shí)別。實(shí)驗(yàn)結(jié)果表明:采用改進(jìn)多樣性密度算法的多示例學(xué)習(xí)在語音性別識(shí)別上是可行的,系統(tǒng)的平均識(shí)別率最終達(dá)到了97%。

        另外,在多示例學(xué)習(xí)問題中,包的生成方法非常關(guān)鍵,將直接影響學(xué)習(xí)算法的分類結(jié)果。因此,在今后的研究學(xué)習(xí)中,將繼續(xù)探究語音信號(hào)的包生成問題,將作為多示例學(xué)習(xí)應(yīng)用于其他語音信號(hào)處理中。

        [1]Dietterich T G,Lathrop R H,Lozano P T.Solving the multiple-instance problem with axisparallel rectangles[J].Artificial Intelligence,1997,89(1/2):31-71.

        [2]Maron O,Ratan A L.Multiple-instance learning for natural scene classification[C]//Proceedings of ICML,Madison,USA,1998:341-349.

        [3]Ruffo G.Learning single and multiple instance decision tree for computer security applications[D].Torino:University of Turin,2000.

        [4]Andrews S,Hofman T,Tsochantaridis I.Multiple instance learning with generalized support vector machines[C]//ProceedingsofAAAI/IAAI,Edmonton,Canada,2002:943-944.

        [5]Huang X,Chen S C,Shy M L,et al.User concept pattern discovery using relevance feedback and multiple instance learning for content-based image retrieval[C]//Proceedings of MDM/KDD2002 Workshop,Edmomton,Canada,2002:100-108.

        [6]Yang C,Lozano P T.Image database retrieval with multipleinstance learning techniques[C]//Proceedings of ICDE,San Diego,USA,2000:233-243.

        [7]Zhang Q,Goldman S A,Yu W,et al.Content-based image retirveal using multiple-instance learning[C]//Proceedings of ICML,Sydney,Australian,2002:682-689.

        [8]Chevaleyre Y,Zucker J D.Solving multiple-instance and multiple-part learning problems with decision trees and decision rules:application to the mutagenesis problem[C]//Proceedings of LNAI,Berlin,German,2001:204-214.

        [9]Maron O,Ratan A L.A framework for multiple-instance learning[C]//Proceedings of NIPS,Cambridge,USA,1998:570-576.

        [10]Zhang Q,Goldman S A.EM-DD:an improved multipleinstance learning technique[C]//Proceedings ofNIPS,Cambridge,USA,2001:1073-1080.

        [11]Ramon J,Raedt L D.Multi-instance neural networks[C]//Proceedings of ICML,Stanford,USA,2000:53-60.

        [12]Zhou Z H,Zhang M L.Neural networks for multi-instance learning[C]//Proceedings of ICIIT,Beijing,2002:455-459.

        [13]戴宏斌,張靈敏,周志華.一種基于多示例學(xué)習(xí)的圖像檢索方法[J].模式識(shí)別與人工智能,2006,19(2):179-185.

        [14]王春燕,袁津生.一種結(jié)合多示例學(xué)習(xí)的圖像檢索方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010,19(6):212-215.

        [15]陳綿書,楊樹媛,趙志杰,等.多點(diǎn)多樣性密度算法及其在圖像檢索中的應(yīng)用[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2011(5):1456-1460.

        [16]龍哲.基于多樣性密度的多示例學(xué)習(xí)方法[J].工業(yè)控制計(jì)算機(jī),2012,25(7):73-74.

        猜你喜歡
        識(shí)別率示例類別
        大還是小
        基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
        2019年高考上海卷作文示例
        常見單位符號(hào)大小寫混淆示例
        山東冶金(2019年5期)2019-11-16 09:09:22
        基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識(shí)別率的關(guān)系
        “全等三角形”錯(cuò)解示例
        提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
        高速公路機(jī)電日常維護(hù)中車牌識(shí)別率分析系統(tǒng)的應(yīng)用
        服務(wù)類別
        新校長(2016年8期)2016-01-10 06:43:59
        論類別股東會(huì)
        商事法論集(2014年1期)2014-06-27 01:20:42
        а√天堂资源官网在线资源 | 日本五月天婷久久网站| 精品在免费线中文字幕久久| 国产日韩午夜视频在线观看| 久久久国产精品首页免费| 亚洲国产精品久久久久秋霞1| 精品亚洲国产探花在线播放| 青青草视频国产在线观看| 尤物精品国产亚洲亚洲av麻豆| 人与人性恔配视频免费| 国产色无码精品视频国产| 亚洲乱妇老熟女爽到高潮的片| 天天澡天天揉揉AV无码人妻斩 | 亚洲蜜臀av一区二区三区漫画| 国产一区二区三区免费av| 亚洲婷婷久悠悠色悠在线播放| 人人妻人人澡人人爽精品日本| 亚洲精品无码永久在线观看| 国产精品无码aⅴ嫩草| 欧美野外疯狂做受xxxx高潮| 亚洲av无码一区二区乱子伦| 中文字幕无码免费久久99| 日韩肥熟妇无码一区二区三区| 午夜一区二区在线视频| 亚洲性av少妇中文字幕| 日韩极品在线观看视频| 精品人妻av区乱码色片| 色多多性虎精品无码av| 人人妻人人爽人人澡欧美一区| 在线观看午夜亚洲一区| 亚洲AV无码一区二区三区天堂网 | 人与动牲交av免费| 真人直播 免费视频| 国产成人无码A区在线观| 无码免费午夜福利片在线| 一区二区三区在线观看视频免费| 亚洲一区二区免费日韩| 亚洲日本国产一区二区三区| 小池里奈第一部av在线观看| 免费a级毛片高清在钱| 少妇激情一区二区三区视频|