[摘 要] 情感聲學(xué)特征在語(yǔ)音情感識(shí)別過(guò)程中扮演非常重要的角色,本文擬定的研究普通話的語(yǔ)音情感識(shí)別方式分為以下幾個(gè)步驟:優(yōu)先選擇、序列前向、序列后向以及逐步判別分析。由此針對(duì)說(shuō)話人與文本無(wú)關(guān)人、說(shuō)話人兩組呈現(xiàn)出的普通話情感語(yǔ)音做出特征性的選擇,并將實(shí)際效果進(jìn)行分析與對(duì)比。
[關(guān)鍵詞] 普通話;語(yǔ)音情感;識(shí)別;特征選擇;情感聲學(xué)特征
一、普通話的語(yǔ)音情感特征及選取
在本文研究過(guò)程中需要結(jié)合普通話情感語(yǔ)料內(nèi)容,首先普通話語(yǔ)音情感特征的選擇與提取應(yīng)從收集與錄制普通話語(yǔ)料中獲??;其次將普通話的情感語(yǔ)料分為兩組,分別為說(shuō)話人與文本無(wú)關(guān)、說(shuō)話人;之后分別從兩組中對(duì)比得出語(yǔ)音中質(zhì)量與韻律特征。下文中將采用不同的方式對(duì)普通話的語(yǔ)音情感特征進(jìn)行逐一選擇與分析,力圖通過(guò)實(shí)驗(yàn)結(jié)果的分析得出普通話語(yǔ)音情感識(shí)別的最有效措施。
1、普通話的語(yǔ)音情感語(yǔ)料收集
普通話語(yǔ)音情感語(yǔ)料收集的方式分為剪輯與錄音兩種,在收集的過(guò)程中比較注重高興、悲傷、憤怒、害怕以及中性這五種基礎(chǔ)情感類別,本文將選擇1185句普通話形式的語(yǔ)音情感語(yǔ)料。在實(shí)驗(yàn)過(guò)程中采用490句由電影與廣播剪輯中獲取的定向語(yǔ)音情感語(yǔ)料,其中包括高興、害怕、憤怒以及悲傷這四個(gè)類型,并將這一組普通話的語(yǔ)音情感語(yǔ)料數(shù)據(jù)命名為說(shuō)話人與文本無(wú)關(guān),其余696句普通話的語(yǔ)言情感語(yǔ)料是通過(guò)專業(yè)級(jí)別錄制的有效情感語(yǔ)音語(yǔ)料,并將這一組普通話的語(yǔ)音情感語(yǔ)料命名為說(shuō)話人相關(guān)組。
2、普通話的語(yǔ)音情感特征獲取
普通話語(yǔ)音情感中韻律特征可以通過(guò)基頻、能量、對(duì)數(shù)能量以及時(shí)間長(zhǎng)短進(jìn)行對(duì)比試驗(yàn),而語(yǔ)音質(zhì)量可以通過(guò)共振峰得出情感聲學(xué)特征。在實(shí)驗(yàn)過(guò)程中可以將短時(shí)過(guò)零率以及短時(shí)能量幅度兩種方式作為普通話語(yǔ)音情感識(shí)別的端點(diǎn)檢測(cè)依據(jù),同時(shí)截取有效的普通話語(yǔ)音情感語(yǔ)料,并確定從中獲取的語(yǔ)音幀長(zhǎng)為5ms。最后將獲取的每一幀語(yǔ)音中基頻(F0)、能量(Eng)、共振峰(F1/F2/F3)以及寬帶進(jìn)行數(shù)值統(tǒng)計(jì)。
3、普通話的語(yǔ)音情感特征選擇
普通話的語(yǔ)音情感特征識(shí)別要通過(guò)系列的特定預(yù)料選取以及對(duì)比,普通話的語(yǔ)音情感特征選擇方法分為經(jīng)典與多元統(tǒng)計(jì)兩種,其中經(jīng)典方法中包括PFS,SFS和SBS;多元統(tǒng)計(jì)中比較常用的方式為SDA。
PFS:利用這種方式選擇語(yǔ)音情感特征,首先要將語(yǔ)音中各個(gè)情感的原是特征進(jìn)行逐一對(duì)比與評(píng)價(jià),同時(shí)將對(duì)比評(píng)價(jià)得到的結(jié)果按照錯(cuò)誤率的升序進(jìn)行有效排列。其次將按照序列升降順序?qū)为?dú)語(yǔ)音情感特征歸納到目標(biāo)特征組,并將選入的特征進(jìn)行逐一對(duì)比與評(píng)價(jià),待對(duì)所有語(yǔ)音中特征都在目標(biāo)特征組進(jìn)行比較之后選擇出最有特征組。
SFS:利用這種方式選擇語(yǔ)音情感特征,首先要講這一系列中目標(biāo)特征組設(shè)為空白,之后將普通話語(yǔ)音語(yǔ)料原是特征組中內(nèi)容選擇并增加到目標(biāo)特征組,并使其與目標(biāo)特征組中特征組合之后能夠保證其對(duì)比與評(píng)價(jià)過(guò)程中是本輪錯(cuò)誤率最低的,按照這種形式逐一將原是特征組與目標(biāo)特征組進(jìn)行組合與對(duì)比。最后選擇出原始特征組作為新特征增加到目標(biāo)特征組時(shí),評(píng)價(jià)與對(duì)比結(jié)果最優(yōu)的一組特征。SBS與SFS在普通話的語(yǔ)音情感特征選擇過(guò)程中措施方式是相反的。
二、普通話的語(yǔ)音情感識(shí)別措施分析
本文就說(shuō)話人與文本無(wú)關(guān)人一組進(jìn)行實(shí)驗(yàn)比較,普通話語(yǔ)音情感語(yǔ)料特征從1逐漸增加到10,這一過(guò)程中語(yǔ)音情感特征增長(zhǎng)率占特征總數(shù)的30%,同時(shí)增漲的是特征組合的準(zhǔn)確率,已從40%升至70%,上升了三個(gè)百分點(diǎn);實(shí)驗(yàn)過(guò)程中繼續(xù)增加語(yǔ)音特征到28,此時(shí)得出的平均準(zhǔn)確率由70%上升到74%,這一遞增過(guò)程中僅上升0.4個(gè)百分點(diǎn)。另一組實(shí)驗(yàn)將說(shuō)話人普通話的語(yǔ)音情感特征作為主要參考對(duì)象,這一實(shí)驗(yàn)需要特定人的語(yǔ)音情感語(yǔ)料作為對(duì)比內(nèi)容,同時(shí)選取特定語(yǔ)音的基頻平均值、共振峰(F1)平均值、對(duì)數(shù)能量平均值等9-12個(gè)基礎(chǔ)特征,實(shí)驗(yàn)結(jié)果以各項(xiàng)特征平均準(zhǔn)確率的最大值為有效參考數(shù)據(jù)。通過(guò)實(shí)驗(yàn)結(jié)果可以看出所選擇的十個(gè)說(shuō)話人分別持有的十個(gè)最優(yōu)特征中是涵蓋二十四個(gè)不同特征的,也就是占有原是特征比例的77.4%,這一數(shù)據(jù)說(shuō)明十個(gè)特定人的最優(yōu)語(yǔ)音情感特征也是存在差異的。所以實(shí)驗(yàn)過(guò)程中要獲取最高的準(zhǔn)確性,必不可少的是將語(yǔ)音特征進(jìn)行對(duì)比,以此來(lái)獲取這十個(gè)特定人的語(yǔ)音情感最優(yōu)特征組合。
三、結(jié)論
綜上所訴,本文采用PFS,SFS,SBS以及SDA等方式對(duì)普通話的情感語(yǔ)音特征進(jìn)行的比較與實(shí)驗(yàn),在說(shuō)話人與文本無(wú)關(guān)一組中所選擇的特征對(duì)比結(jié)果可以表明,在情感識(shí)別過(guò)程中主要的影響因素是第一共振峰、基頻基礎(chǔ)范圍、對(duì)數(shù)能量以及語(yǔ)速;而在說(shuō)話人相關(guān)這一組實(shí)驗(yàn)過(guò)程中,普通話的語(yǔ)音情感特征影響因素主要由基頻平均值、對(duì)數(shù)能量平均值、第一共振峰平均值以及語(yǔ)速等組成,與此同時(shí)特定說(shuō)話人的不同也將影響語(yǔ)音情感特征的最終對(duì)比結(jié)果。在采用LDA和SVM進(jìn)行情感語(yǔ)音識(shí)別實(shí)驗(yàn)過(guò)程中,注重考慮了平均值的準(zhǔn)確性問(wèn)題,由此能夠看出SDA相教育其他三種方式是具有一定優(yōu)勢(shì)的,針對(duì)普通話的語(yǔ)音情感識(shí)別也是非常重要的。
參考文獻(xiàn):
[1]蔣丹寧,蔡蓮紅.基于韻律特征的漢語(yǔ)情感語(yǔ)音分類.第一界中國(guó)情感計(jì)算及智能交互學(xué)術(shù)會(huì)議論文集,217-220, 2013.
[2]王治平,趙力,鄒采榮.利用模糊嫡進(jìn)行參數(shù)有效性分析的語(yǔ)音情感識(shí)別.電路與系統(tǒng)學(xué)報(bào),Vol. 8, 109-112, 2013.
[3]袁志發(fā),周靜芋.多元統(tǒng)計(jì)分析.科學(xué)出版社,2012.
作者簡(jiǎn)介:趙軻(1982—)女,民族:土家,籍貫:湖北武漢,學(xué)歷:碩士,職稱:講師,職位:教師,研究方向:藝術(shù)表演、播音主持。