亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于模糊綜合評(píng)價(jià)法的情感語(yǔ)音數(shù)據(jù)庫(kù)的建立

        2016-04-12 00:00:00宋靜張雪英孫穎暢江
        現(xiàn)代電子技術(shù) 2016年13期

        摘 要: 為建立一個(gè)真實(shí)、自然、豐富的情感語(yǔ)音數(shù)據(jù)庫(kù),研究選擇高興、驚奇、悲傷、生氣四種情感類型,利用截取廣播劇的方式獲得初選階段的情感語(yǔ)音數(shù)據(jù)庫(kù)。通過(guò)模糊綜合評(píng)價(jià)與層次分析法、熵權(quán)法相結(jié)合建立情感語(yǔ)音的模糊綜合評(píng)價(jià)模型,利用該模型對(duì)初選階段的數(shù)據(jù)庫(kù)進(jìn)行模糊評(píng)價(jià),篩選得到最終高質(zhì)量的情感語(yǔ)音數(shù)據(jù)庫(kù)。將三種類型的數(shù)據(jù)庫(kù)用于情感語(yǔ)音識(shí)別實(shí)驗(yàn),對(duì)比分析了不同類型數(shù)據(jù)庫(kù)的差異,同時(shí)也驗(yàn)證了本數(shù)據(jù)庫(kù)的有效性。

        關(guān)鍵詞: 情感語(yǔ)音數(shù)據(jù)庫(kù); 模糊綜合評(píng)價(jià); 層次分析法; 熵權(quán)法; 情感語(yǔ)音識(shí)別

        中圖分類號(hào): TN912?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)13?0051?04

        Abstract: To establish a real, natural and abundant emotional speech database, four emotion types of happy, surprise, sad and angry are chosen. The way of radio drama intercepting is used to obtain the emotional speech database in primary stage. The fuzzy comprehensive evaluation model of emotional speech was established in combination with fuzzy comprehensive evaluation, analytic hierarchy process and entropy weight method. The fuzzy evaluation for the database in primary stage was conducted with the model to obtain the final emotional speech database with high quality. Three kinds of speech databases were applied to the emotional speech recognition experiment. The differences of different databases are compared and analyzed. The effectiveness of this database was verified.

        Keywords: emotional speech database; fuzzy comprehensive evaluation; analytic hierarchy process; entropy method; emotional speech recognition

        語(yǔ)言是人類交換信息最方便、最快捷的一種方式。在高速發(fā)達(dá)的信息社會(huì)中,情感語(yǔ)音技術(shù)的發(fā)展為實(shí)現(xiàn)人與機(jī)器的情感交流提供可能[1]。情感語(yǔ)音數(shù)據(jù)庫(kù)是情感語(yǔ)音識(shí)別的基礎(chǔ),語(yǔ)音庫(kù)的質(zhì)量決定著情感語(yǔ)音識(shí)別系統(tǒng)性能的優(yōu)劣。高質(zhì)量的情感語(yǔ)音數(shù)據(jù)庫(kù)有利于情感語(yǔ)音特征的分析提取,有利于情感語(yǔ)音識(shí)別系統(tǒng)判斷說(shuō)話人的情感狀態(tài),因此如何構(gòu)建一個(gè)真實(shí)、自然、可靠的情感語(yǔ)音數(shù)據(jù)庫(kù)就顯得尤為重要。而語(yǔ)音數(shù)據(jù)庫(kù)質(zhì)量高低要從情感準(zhǔn)確度、噪聲影響、自然度等角度綜合評(píng)判。本文利用模糊綜合評(píng)價(jià)結(jié)合層次分析法(Analytic Hierarchy Process,AHP)、熵權(quán)法構(gòu)建模糊綜合評(píng)價(jià)模型,將定性分析轉(zhuǎn)化為定量分析,為數(shù)據(jù)庫(kù)的有效性提供了保障。最后,本文將表演型數(shù)據(jù)庫(kù)、激勵(lì)型數(shù)據(jù)庫(kù)和摘引型數(shù)據(jù)庫(kù)應(yīng)用于情感識(shí)別研究中,對(duì)比分析不同類型的數(shù)據(jù)庫(kù)之間的差異,同時(shí)也驗(yàn)證了本數(shù)據(jù)庫(kù)的有效性。

        1 初選階段情感語(yǔ)音數(shù)據(jù)庫(kù)的建立

        目前,在國(guó)內(nèi)外語(yǔ)音研究領(lǐng)域,由于研究需求、獲取途徑、情感分類、語(yǔ)種等差異,情感語(yǔ)音數(shù)據(jù)庫(kù)種類繁多(如Maribor數(shù)據(jù)庫(kù)、CASIA數(shù)據(jù)庫(kù)、VAM[2])。按照獲取方式的不同,情感語(yǔ)音數(shù)據(jù)庫(kù)大致可分為四類[3]:表演型、激勵(lì)型、啟發(fā)型和摘引型。摘引型情感語(yǔ)音數(shù)據(jù)庫(kù)有著較高的情感真實(shí)度,情感表達(dá)直接由心理狀態(tài)觸發(fā)而成,并且在多媒體素材中有上下文內(nèi)容,為以后的研究提供關(guān)聯(lián)信息。因此選擇構(gòu)建摘引型情感語(yǔ)音數(shù)據(jù)庫(kù)。為了截取并建立高質(zhì)量的情感語(yǔ)音庫(kù),多媒體素材需要在語(yǔ)種、語(yǔ)義、規(guī)模、情感、信噪比方面符合一定的要求[4]。廣播劇是一種戲劇形式,通過(guò)聲音進(jìn)行傳播,能給聽(tīng)眾創(chuàng)造無(wú)限的想象空間[5]。廣播劇中語(yǔ)料來(lái)源于專業(yè)演員,所用語(yǔ)言為標(biāo)準(zhǔn)普通話,貼近生活,符合日常表達(dá)習(xí)慣,有著豐富的情感成分,并且對(duì)人物語(yǔ)言精確性、表現(xiàn)力要求高,語(yǔ)音質(zhì)量好。基于以上特點(diǎn),考慮到情感豐富性、人物多樣性、情節(jié)多變性等因素,選取廣播劇作為截取語(yǔ)音庫(kù)的媒體素材。

        參考Rusell等人運(yùn)用情感理論構(gòu)建情緒二維模型[6],本文選擇高興、驚奇、悲傷和憤怒四種情感粒度大、混淆度低的情感類別構(gòu)建數(shù)據(jù)庫(kù)。使用Cool Edit Pro 2.0從中剪輯屬于上述4類情感的情感語(yǔ)音共837句,保存為單聲道wav文件,建立初選階段的情感語(yǔ)音數(shù)據(jù)庫(kù)。

        2 情感語(yǔ)音的模糊綜合評(píng)價(jià)模型

        目前,模糊綜合評(píng)價(jià)被廣泛地應(yīng)用到了各個(gè)領(lǐng)域。郭德勇利用模糊綜合評(píng)判法建立了煤與瓦斯突出預(yù)測(cè)模型[7],預(yù)測(cè)結(jié)果與實(shí)際突出情況相符,表明該方法具有應(yīng)用價(jià)值。劉玉紅提出了模糊綜合評(píng)價(jià)方法來(lái)評(píng)估水下機(jī)器人的運(yùn)動(dòng)性能[8],并通過(guò)試驗(yàn)表明,評(píng)價(jià)結(jié)果可以客觀、全面地反映水下機(jī)器人的性能。金赟利用AHP和模糊綜合評(píng)價(jià)建立了耳語(yǔ)音情感數(shù)據(jù)庫(kù)[9],但是AHP在確定指標(biāo)權(quán)重時(shí)并沒(méi)有考慮到人的主觀判斷、喜好對(duì)決策結(jié)果的影響,因此本文通過(guò)AHP和熵權(quán)法主客觀相結(jié)合確定指標(biāo)權(quán)重,建立改進(jìn)的模糊綜合評(píng)價(jià)模型,運(yùn)用該模型對(duì)初選階段的情感語(yǔ)音數(shù)據(jù)庫(kù)進(jìn)行模糊評(píng)價(jià)、篩選建立最終的情感語(yǔ)音數(shù)據(jù)庫(kù)。

        2.1 建立綜合評(píng)價(jià)模型

        建立合理有效的評(píng)價(jià)模型是高質(zhì)量情感語(yǔ)音數(shù)據(jù)庫(kù)的前提,本文通過(guò)模糊綜合評(píng)價(jià)結(jié)合AHP、熵權(quán)法辨聽(tīng)篩選情感語(yǔ)音數(shù)據(jù)庫(kù),模糊綜合評(píng)價(jià)模型如圖1所示[10]。首先構(gòu)造綜合指標(biāo)評(píng)價(jià)體系,包括被評(píng)價(jià)語(yǔ)音的指標(biāo)集和評(píng)語(yǔ)集;利用AHP和熵權(quán)法確定各個(gè)指標(biāo)的綜合權(quán)重,將綜合權(quán)重和模糊評(píng)價(jià)矩陣進(jìn)行模糊合成,得到綜合模糊評(píng)價(jià)矩陣;最后把綜合模糊評(píng)價(jià)矩陣量化得到語(yǔ)音的綜合得分,這樣就可以判斷情感語(yǔ)音的優(yōu)劣。

        2.2 構(gòu)造綜合指標(biāo)評(píng)價(jià)體系

        2.2.1 確定評(píng)價(jià)指標(biāo)集

        根據(jù)廣播劇演播其獨(dú)有的特點(diǎn),建立情感語(yǔ)音數(shù)據(jù)庫(kù)評(píng)價(jià)指標(biāo)體系。評(píng)價(jià)指標(biāo)集為。其中,分別代表情感準(zhǔn)確度、背景噪聲影響、清晰度、自然度、現(xiàn)場(chǎng)感五個(gè)指標(biāo)。

        情感準(zhǔn)確度指標(biāo):主要反映該條語(yǔ)音是否為所要求的情感語(yǔ)音,情感把握是否準(zhǔn)確。

        背景噪聲影響指標(biāo):由于語(yǔ)音數(shù)據(jù)庫(kù)是從廣播劇中截取所得,為避免摻雜背景音、噪聲等其他影響,因此需要從背景噪聲角度對(duì)語(yǔ)音庫(kù)進(jìn)行篩選評(píng)價(jià)。

        清晰度指標(biāo):主要反映該條語(yǔ)音咬字是否清晰。

        自然度指標(biāo):主要反映該語(yǔ)音的情感表現(xiàn)是否過(guò)于夸張,廣播劇中表演出的情感與日常生活中正常流露出的情感是否偏差過(guò)大,確保根據(jù)廣播劇所得語(yǔ)音的情感分析方法可用于日常交流中的語(yǔ)音。

        現(xiàn)場(chǎng)感指標(biāo):主要反映廣播劇是否達(dá)到了聞其聲見(jiàn)其人的藝術(shù)效果,是否具有感染力、表現(xiàn)力。

        2.2.2 建立評(píng)價(jià)評(píng)語(yǔ)集

        建立情感語(yǔ)音數(shù)據(jù)庫(kù)的評(píng)價(jià)評(píng)語(yǔ)集,其中,分別表示優(yōu)、良、中、差、劣。并規(guī)定。

        2.3 確定指標(biāo)綜合權(quán)重

        為了使模糊評(píng)價(jià)的結(jié)果更加準(zhǔn)確,克服主觀確定權(quán)重的缺點(diǎn),通過(guò)將主觀賦權(quán)的AHP和客觀賦權(quán)的熵權(quán)法相結(jié)合的方法計(jì)算出各個(gè)語(yǔ)音指標(biāo)的權(quán)重。

        2.3.1 AHP確定主觀權(quán)重

        AHP是數(shù)字化表示主觀判斷的一種方法。它把復(fù)雜問(wèn)題分解為各個(gè)組成因素,通過(guò)主觀兩兩比較的方式確定各因素的相對(duì)重要程度,然后計(jì)算得到各因素的權(quán)重,最后通過(guò)一致性檢驗(yàn)得到較為合理的權(quán)重[11]。其具體步驟如下:

        (1) 構(gòu)造各指標(biāo)的判斷矩陣:首先利用1~9比例標(biāo)度法,把各項(xiàng)評(píng)價(jià)指標(biāo)的相對(duì)重要性進(jìn)行定性表示,構(gòu)建兩兩比較的判斷矩陣,其中用表示第個(gè)指標(biāo)對(duì)第個(gè)指標(biāo)的相對(duì)重要性,從而求出各個(gè)指標(biāo)的權(quán)重。因此5個(gè)指標(biāo)相互比較后可以用下面的判斷矩陣表示為:

        (2) 計(jì)算判斷矩陣的最大特征值及其對(duì)應(yīng)的特征向量,經(jīng)過(guò)歸一化,得到即為同一子集中的各指標(biāo)的權(quán)重向量[12]。

        (3) 根據(jù)表1中隨機(jī)性指標(biāo)計(jì)算一致性比率:其中為判斷矩陣的最大特征根,為判斷矩陣的階數(shù)。當(dāng)時(shí),可以認(rèn)為判斷矩陣的一致性滿足要求,可以接受分析結(jié)果,否則需重新構(gòu)建判斷矩陣,直到滿足一致性標(biāo)準(zhǔn)。

        2.3.2 熵權(quán)法確定客觀權(quán)重

        熵權(quán)法是一種基于信息熵的客觀賦權(quán)法。熵是熱力學(xué)的概念,后被香農(nóng)引入到信息論中,可用來(lái)度量信息量的大小。在進(jìn)行評(píng)價(jià)時(shí),如果某個(gè)指標(biāo)的熵值越大,說(shuō)明該指標(biāo)對(duì)評(píng)價(jià)結(jié)果提供的信息量越少,則對(duì)應(yīng)的指標(biāo)權(quán)重應(yīng)越小;反之,權(quán)重越大[13]。熵權(quán)法能使評(píng)價(jià)結(jié)果更符合實(shí)際情況,避免因主觀賦權(quán)所造成的權(quán)重偏差。其具體方法如下:

        2.3.3 主客觀結(jié)合確定綜合權(quán)重

        AHP確定的指標(biāo)權(quán)重是查閱大量文獻(xiàn)、結(jié)合實(shí)際情況所得,熵權(quán)法得到的指標(biāo)權(quán)重來(lái)源于數(shù)據(jù)本身,客觀地反映了實(shí)際情況。為了科學(xué)客觀地確定權(quán)重,故將AHP得到的主觀權(quán)重和熵權(quán)法得到的客觀權(quán)重相結(jié)合,得到各情感語(yǔ)音指標(biāo)的綜合權(quán)重本文根據(jù)情感語(yǔ)音的實(shí)際情況,將綜合權(quán)重設(shè)定為主觀權(quán)重的40%和客觀權(quán)重的60%,從而得到各個(gè)評(píng)價(jià)指標(biāo)的綜合權(quán)重,即:。

        2.4 模糊合成——辨聽(tīng)篩選

        根據(jù)實(shí)際情況設(shè)定閾值分?jǐn)?shù)如果語(yǔ)音最終得分大于等于則保留;否則,此條語(yǔ)音不符合要求,刪除該語(yǔ)音。

        通過(guò)以上步驟,利用改進(jìn)的模糊綜合評(píng)價(jià)法,分別從情感準(zhǔn)確度、背景噪聲影響、清晰度、自然度、畫(huà)面感五個(gè)方面對(duì)截取的情感語(yǔ)音庫(kù)進(jìn)行評(píng)價(jià)篩選,最終建立了情感語(yǔ)音數(shù)據(jù)庫(kù)TYUT 2.0共678句,如表2所示。篩選后的情感語(yǔ)音數(shù)據(jù)庫(kù)符合以上五個(gè)指標(biāo)的研究要求,四種情感表達(dá)更加準(zhǔn)確自然,貼近現(xiàn)實(shí)生活,無(wú)噪聲影響,有利于情感語(yǔ)音的進(jìn)一步研究。

        本文采用截取廣播劇的方式構(gòu)建初選階段的情感語(yǔ)音數(shù)據(jù)庫(kù),利用改進(jìn)的模糊綜合評(píng)價(jià)對(duì)初選階段的數(shù)據(jù)庫(kù)進(jìn)行了篩選,得到高質(zhì)量的摘引型情感語(yǔ)音數(shù)據(jù)庫(kù)。由于是從廣播劇中截取獲得,因此該數(shù)據(jù)庫(kù)情感類型豐富,人物多樣(涵蓋多個(gè)年齡段),生活場(chǎng)景豐富,情感語(yǔ)音更加貼近現(xiàn)實(shí)生活,符合日常表達(dá)習(xí)慣,具有較好的實(shí)用性。并且本文將AHP和熵權(quán)法主客觀相結(jié)合確定指標(biāo)權(quán)重,建立了改進(jìn)的模糊綜合評(píng)價(jià)模型,由10位大學(xué)生對(duì)初選階段語(yǔ)音庫(kù)的五個(gè)指標(biāo)進(jìn)行打分篩選,確保所得到的語(yǔ)音情感表達(dá)自然、清晰,具有較好的表現(xiàn)力。

        3 實(shí) 驗(yàn)

        3.1 情感語(yǔ)音數(shù)據(jù)庫(kù)

        本實(shí)驗(yàn)采用表演型、激勵(lì)型、摘引型三類情感語(yǔ)音數(shù)據(jù)庫(kù)分別進(jìn)行情感語(yǔ)音識(shí)別,對(duì)比研究不同類型的情感語(yǔ)音數(shù)據(jù)庫(kù)的差異。表演型數(shù)據(jù)庫(kù)要求表演者用不同的情感來(lái)朗讀指定的內(nèi)容,進(jìn)行錄制獲取數(shù)據(jù)。激勵(lì)型數(shù)據(jù)庫(kù)指在錄制前,通過(guò)文字、圖片、電影等手段來(lái)誘發(fā)說(shuō)話人特定情感狀態(tài)。本實(shí)驗(yàn)選擇CASIA漢語(yǔ)情感數(shù)據(jù)庫(kù)、eNTERFACE′05數(shù)據(jù)庫(kù)、TYUT 2.0數(shù)據(jù)庫(kù)三種類型的數(shù)據(jù)庫(kù)用于情感語(yǔ)音識(shí)別。三個(gè)情感語(yǔ)音數(shù)據(jù)庫(kù)簡(jiǎn)介如表3所示。

        CASIA漢語(yǔ)情感數(shù)據(jù)庫(kù)屬于表演型數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)是中科院自動(dòng)化所錄制,由4位錄音人(2男2女)在6種不同情感狀態(tài)下(高興、悲傷、生氣、驚奇、恐懼、中性)對(duì)500句文本進(jìn)行表演朗讀得到的,總共有9 600句情感語(yǔ)音。

        eNTERFACE′05數(shù)據(jù)庫(kù)是激勵(lì)型數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)包含了6段簡(jiǎn)短的有情感傾向的場(chǎng)景文本,通過(guò)文本的內(nèi)容誘發(fā)表演者的情感狀態(tài)。每個(gè)表演者在每段場(chǎng)景中分別帶有情感地朗讀特定文本,分別對(duì)應(yīng)6種基本情感(憤怒、厭惡、恐懼、高興、悲傷、驚奇)。最后得到42名表演者的1 166段視頻片段。本實(shí)驗(yàn)通過(guò)提取視頻中的語(yǔ)音片段進(jìn)行情感語(yǔ)音識(shí)別。

        考慮到樣本平衡性問(wèn)題,選擇245句TYUT 2.0數(shù)據(jù)庫(kù)情感語(yǔ)音、248句CASIA數(shù)據(jù)庫(kù)情感語(yǔ)音和248句eNTERFACE′05數(shù)據(jù)庫(kù),每組實(shí)驗(yàn)使用大約的句子訓(xùn)練,的句子測(cè)試。

        3.2 實(shí)驗(yàn)結(jié)果及分析

        將三個(gè)數(shù)據(jù)庫(kù)用于情感語(yǔ)音識(shí)別,提取MFCC前12階的最大值、最小值、平均值、中值、方差共60維統(tǒng)計(jì)特征,使用SVM作為識(shí)別網(wǎng)絡(luò),所得到的識(shí)別結(jié)果如表4所示。

        從表4可以得出:

        三個(gè)情感語(yǔ)音數(shù)據(jù)庫(kù)的平均識(shí)別率由大到小是:eNTERFACE′05數(shù)據(jù)庫(kù)、TYUT 2.0數(shù)據(jù)庫(kù)、CASIA數(shù)據(jù)庫(kù)。TYUT 2.0數(shù)據(jù)庫(kù)的平均識(shí)別率為72.15%,略低于eNTERFACE′05數(shù)據(jù)庫(kù)的72.50%,高于CASIA數(shù)據(jù)庫(kù)的64.56%。這與數(shù)據(jù)庫(kù)的構(gòu)建方式有關(guān),不同類型的數(shù)據(jù)庫(kù)在情感表達(dá)上是有差異的。三種數(shù)據(jù)庫(kù)的真實(shí)度由高到低依次為:摘引型數(shù)據(jù)庫(kù)、激勵(lì)型數(shù)據(jù)庫(kù)、表演型數(shù)據(jù)庫(kù)。CASIA數(shù)據(jù)庫(kù)是由錄音人員表演獲得,錄音人員對(duì)情感表現(xiàn)的把握不同會(huì)影響語(yǔ)音的情感準(zhǔn)確度;eNTERFACE′05數(shù)據(jù)庫(kù)屬于激勵(lì)型數(shù)據(jù)庫(kù),符合人類情感產(chǎn)生的過(guò)程,但是錄音人員對(duì)刺激材料存在個(gè)體差異性,無(wú)法確認(rèn)環(huán)境對(duì)錄音人員刺激的有效性及刺激所起的作用程度;摘引型數(shù)據(jù)庫(kù)TYUT 2.0情感表達(dá)直接由心理狀態(tài)觸發(fā)獲得,情感表達(dá)更加準(zhǔn)確自然,表達(dá)方式更加貼近現(xiàn)實(shí)生活。此外,CASIA數(shù)據(jù)庫(kù)和eNTERFACE′05數(shù)據(jù)庫(kù)是由定量人員錄制獲得的情感語(yǔ)音,而TYUT 2.0是從多媒體材料中獲得,語(yǔ)音來(lái)源于不定量人員。

        從識(shí)別結(jié)果來(lái)看,TYUT 2.0數(shù)據(jù)庫(kù)的平均識(shí)別率達(dá)到72.15%,可以用于情感語(yǔ)音識(shí)別研究中。TYUT 2.0數(shù)據(jù)庫(kù)屬于摘引型情感語(yǔ)音數(shù)據(jù)庫(kù),所得到的語(yǔ)音符合現(xiàn)實(shí)生活中的表達(dá)。而表演型數(shù)據(jù)庫(kù)和激勵(lì)型數(shù)據(jù)庫(kù)中的情感語(yǔ)音與現(xiàn)實(shí)生活中的語(yǔ)音還存在偏差,影響以后的研究應(yīng)用。因此將摘引型數(shù)據(jù)庫(kù)TYUT 2.0用于情感語(yǔ)音研究所獲得的研究方法可以更好地用于日常的交流中,具有更多的實(shí)用價(jià)值。

        4 結(jié) 語(yǔ)

        本研究根據(jù)實(shí)驗(yàn)室的研究需求,通過(guò)對(duì)廣播劇的截取獲得了包含高興、驚奇、悲傷、憤怒(共678句)4種基本情感類型的TYUT 2.0數(shù)據(jù)庫(kù)。將基于主觀的AHP和基于客觀的熵權(quán)法相結(jié)合,科學(xué)地確定指標(biāo)的綜合權(quán)重,建立了改進(jìn)的模糊綜合評(píng)價(jià)模型,然后從情感準(zhǔn)確度、背景噪聲影響、清晰度、自然度、現(xiàn)場(chǎng)感五個(gè)方面建立情感語(yǔ)音數(shù)據(jù)庫(kù)評(píng)價(jià)指標(biāo)體系,運(yùn)用該模型對(duì)初選階段的情感語(yǔ)音數(shù)據(jù)庫(kù)進(jìn)行模糊評(píng)價(jià)、篩選出真實(shí)可靠的高質(zhì)量情感語(yǔ)音數(shù)據(jù)庫(kù)。本文還將表演型數(shù)據(jù)庫(kù)、激勵(lì)型數(shù)據(jù)庫(kù)和摘引型數(shù)據(jù)庫(kù)用于情感語(yǔ)音識(shí)別,分析對(duì)比了不同類型數(shù)據(jù)庫(kù)的差異,同時(shí)也驗(yàn)證了本情感語(yǔ)音數(shù)據(jù)庫(kù)的有效性,為接下來(lái)的情感語(yǔ)音特征、情感語(yǔ)音識(shí)別、合成研究奠定了基礎(chǔ)。

        參考文獻(xiàn)

        [1] 張雪英.數(shù)字語(yǔ)音處理及Matlab仿真[M].北京:電子工業(yè)出版社,2010:1?9.

        [2] GRIMM M, KROSCHEL K, NARAYANNAN S. The Vera am Mittag German audio?visual emotional speech database [C]// 2008 International Conference on Multimedia and Expo. Hannover: IEEE, 2008: 865?868.

        [3] 趙力,黃程韋.實(shí)用語(yǔ)音情感識(shí)別中的若干關(guān)鍵技術(shù)[J].數(shù)據(jù)采集與處理,2014,29(2):157?170.

        [4] 謝波.普通話語(yǔ)音情感識(shí)別關(guān)鍵技術(shù)研究[D].杭州:浙江大學(xué),2006.

        [5] 羅莉.文藝作品演播教程[M].北京:北京大學(xué)出版社,2010:113?134.

        [6] LIEBERMAN P, MICHAELS S B. Some aspects of fundamental frequency and envelop amplitude as related to the emotional content of speech [J]. Journal of the Acoustical Society of America, 1962, 34(7): 922?927.

        [7] 郭德勇,范金志,馬世志,等.煤與瓦斯突出預(yù)測(cè)層次分析?模糊綜合評(píng)判方法[J].北京科技大學(xué)學(xué)報(bào),2007,29(7):660?664.

        [8] LIU Y H, FANG P P, BIAN D D, et al. Fuzzy comprehensive evaluation for the motion performance of autonomous underwater vehicles [J]. Ocean engineering, 2014, 88(5): 568?577.

        [9] 金赟,趙艷,黃程韋,等.耳語(yǔ)音情感數(shù)據(jù)庫(kù)的設(shè)計(jì)與建立[J].聲學(xué)技術(shù),2010,29(1):63?68.

        [10] PAUL S, SARKAR B, BOSE P K. Eclectic decision for the selection of tree borne oil (TBO) as alternative fuel for internal combustion engine [J]. Renewable and sustainable energy reviews, 2015, 48: 256?263.

        [11] 高平,張延軍,方靜濤,等.淺層巖土室內(nèi)、外熱物性測(cè)試的相關(guān)性[J].吉林大學(xué)學(xué)報(bào)(地球科學(xué)版),2014,44(1):259?267.

        [12] 劉海燕,龐小平.利用GIS和模糊層次分析法的南極考察站選址研究[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2015,40(2):249?252.

        [13] 焦松,李偉,楊明,等.基于經(jīng)驗(yàn)?zāi)B(tài)分解和灰色關(guān)聯(lián)度分析的仿真模型驗(yàn)證方法[J].系統(tǒng)工程與電子技術(shù),2013,35(12):2613?2618.

        [14] 任鵬輝,張雪英,孫穎.面向語(yǔ)音情感計(jì)算的數(shù)據(jù)庫(kù)的構(gòu)建與應(yīng)用研究[J].電視技術(shù),2012,36(21):89?92.

        日本免费一二三区在线| 欧美性xxxx极品高清| 幻女bbwxxxx在线视频| 午夜免费福利在线观看| 国产精品麻豆A在线播放| 高清国产国产精品三级国产av| 天天爽夜夜爽夜夜爽精品视频| 最近中文字幕国语免费| 久久久久久免费毛片精品| 亚洲综合偷自成人网第页色| 久久国产精品99精品国产987| 国产剧情亚洲一区二区三区| 麻豆文化传媒精品一区观看| 偷国产乱人伦偷精品视频| 亚洲成人小说| 欧美在线播放一区二区| 日本久久精品国产精品| 亚洲av综合av一区| 亚洲av永久无码精品一福利| 不卡高清av手机在线观看| 无码中文字幕加勒比一本二本| 亚洲免费不卡| 91久久国产情侣真实对白| 激情五月开心五月av| 在办公室被c到呻吟的动态图| 国产精品久久久久久人妻精品| 欧美人与物videos另类| 99久久久人妻熟妇精品一区二区| 国产精品永久免费| 热久久久久久久| 国产三级一区二区三区在线观看 | 亚洲高清国产一区二区| 国产又a又黄又潮娇喘视频| 四虎成人在线| 狠狠色丁香婷婷久久综合2021| 超短裙老师在线观看一区二区 | 国产日韩欧美视频成人| 天堂丝袜美腿在线观看| 玩弄丰满奶水的女邻居| 亚洲男女免费视频| 午夜一区二区三区在线观看|