亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于自動(dòng)機(jī)器學(xué)習(xí)的電網(wǎng)客戶語(yǔ)音情感分類方法

2022-06-07 02:13:02王慶娟金良峰

浙江電力 2022年5期

沈然，王慶娟，金良峰，丁麒

（國(guó)網(wǎng)浙江省電力有限公司營(yíng)銷服務(wù)中心，杭州 311121）

0 引言

在電力運(yùn)營(yíng)過(guò)程中，電力客戶服務(wù)平臺(tái)為企業(yè)與海量用戶之間的溝通提供一種有效的方式［1］。公司電力客服業(yè)務(wù)存在坐席人員流動(dòng)性大、業(yè)務(wù)水平參差不齊、部分人員對(duì)電力客服業(yè)務(wù)領(lǐng)域知識(shí)儲(chǔ)備有所不足等問題，可能導(dǎo)致其解答用戶訴求精準(zhǔn)度低、時(shí)效性差，無(wú)法及時(shí)解決用戶問題，增加了用戶的投訴。為了解決這些問題，提升電網(wǎng)客服服務(wù)質(zhì)量，電網(wǎng)客服系統(tǒng)需要量化客戶訴求中的情感因素，以便快速了解客戶的訴求焦點(diǎn)，并根據(jù)客戶情感反饋來(lái)評(píng)估具體事項(xiàng)的實(shí)施效果，這對(duì)電力企業(yè)具有十分重要的意義［2］。

語(yǔ)音情感識(shí)別是人工智能算法核心應(yīng)用之一，在語(yǔ)音信號(hào)處理和情感分析等方面具有重要的應(yīng)用價(jià)值，也是當(dāng)下學(xué)術(shù)界熱門的研究方向［3］。將語(yǔ)音情感識(shí)別應(yīng)用到電力運(yùn)營(yíng)過(guò)程中的客戶語(yǔ)音情感識(shí)別，可以為電網(wǎng)公司提供有價(jià)值的客戶情感反饋，為后續(xù)決策提供數(shù)據(jù)支持。相關(guān)研究表明，人的情感會(huì)影響到發(fā)音器官的運(yùn)動(dòng)，當(dāng)人的心情是積極的時(shí)候，聲音是清脆、高昂的；而當(dāng)人的心情是消極的時(shí)候，聲音則是沉悶、無(wú)力的。在學(xué)術(shù)研究中［4］，語(yǔ)音情感識(shí)別是通過(guò)語(yǔ)音信號(hào)來(lái)分析和推測(cè)用戶情感的方法，它能夠根據(jù)采集到的語(yǔ)音信號(hào)，判斷人在發(fā)聲過(guò)程中的情感。經(jīng)典的語(yǔ)音情感識(shí)別方法一般先從語(yǔ)音信號(hào)中提取特征表示，然后訓(xùn)練分類算法完成情感分類。在語(yǔ)音情感識(shí)別任務(wù)中，語(yǔ)音信號(hào)的特征選擇具有重要的作用，常用的語(yǔ)音信號(hào)特征包括基音、語(yǔ)速、強(qiáng)度（韻律特征）、線性預(yù)測(cè)倒譜系數(shù)、梅爾頻率倒譜系數(shù)（頻譜特征）等［5］。然而，這些特征都是領(lǐng)域?qū)＜彝ㄟ^(guò)個(gè)人經(jīng)驗(yàn)設(shè)計(jì)的，這些人工設(shè)計(jì)的特征在通用的語(yǔ)音任務(wù)上取得了較好的效果，但是在特定的語(yǔ)音情感分類任務(wù)上面往往表現(xiàn)不佳。因此學(xué)術(shù)界開始研究使用以神經(jīng)網(wǎng)絡(luò)等為代表的端到端的語(yǔ)音情感分類方法，以此從數(shù)據(jù)中自動(dòng)學(xué)習(xí)語(yǔ)音數(shù)據(jù)的特征表示。

近年來(lái)，機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法得到了快速發(fā)展，并由此產(chǎn)生了包括CNN（卷積神經(jīng)網(wǎng)絡(luò)）、LSTM（長(zhǎng)短期記憶網(wǎng)絡(luò)）等在內(nèi)的一大批優(yōu)秀的算法，基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)在語(yǔ)音情感識(shí)別任務(wù)中表現(xiàn)出優(yōu)異的性能［6］。相對(duì)于傳統(tǒng)的利用手工特征訓(xùn)練分類模型的語(yǔ)音情感識(shí)別方法，該方法可以將特征自主學(xué)習(xí)融合到模型訓(xùn)練過(guò)程中，并達(dá)到很好的識(shí)別效果。然而，傳統(tǒng)的基于神經(jīng)網(wǎng)絡(luò)等學(xué)習(xí)方法需要專家根據(jù)任務(wù)和經(jīng)驗(yàn)預(yù)先設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)模型，這些模型都是由專家通過(guò)大量的試錯(cuò)過(guò)程手動(dòng)設(shè)計(jì)的，這意味著即使是專家也需要大量的資源和時(shí)間來(lái)創(chuàng)建性能良好的模型，這限制了神經(jīng)網(wǎng)絡(luò)在語(yǔ)音情感分類任務(wù)上的應(yīng)用［7］。

為了簡(jiǎn)化算法流程，將人類從機(jī)器學(xué)習(xí)模型設(shè)計(jì)的過(guò)程解放出來(lái)，讓模型設(shè)計(jì)過(guò)程更加智能，學(xué)術(shù)界一直在探索讓算法自動(dòng)尋找最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)的方法［8］。自動(dòng)機(jī)器學(xué)習(xí)是指將深度神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)和訓(xùn)練進(jìn)行自動(dòng)化端到端流程的過(guò)程，并應(yīng)用適當(dāng)?shù)臄?shù)據(jù)預(yù)處理、特征工程、模型選擇和模型評(píng)估來(lái)解決特定任務(wù)。這一概念的思路就是在智能搜索和算法優(yōu)化的基礎(chǔ)上，由算法本身去尋找特定任務(wù)的具體數(shù)據(jù)處理與識(shí)別算法和方案，從而代替專家進(jìn)行網(wǎng)絡(luò)模型設(shè)計(jì)和算法求解，并且這種方法設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)模型能在應(yīng)用效果上超過(guò)大部分專家。自動(dòng)機(jī)器學(xué)習(xí)技術(shù)對(duì)于降低構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)的人力和時(shí)間成本具有十分重要的價(jià)值，得到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注［9］。

為了根據(jù)電網(wǎng)客戶語(yǔ)音情感分類任務(wù)需求提供的數(shù)據(jù)，靈活使用最先進(jìn)的深度學(xué)習(xí)模型，自動(dòng)確定最適合特定應(yīng)用的模型架構(gòu)和學(xué)習(xí)策略，解決算法應(yīng)用過(guò)程中過(guò)多依賴人工算法設(shè)計(jì)的問題，本文利用自動(dòng)機(jī)器學(xué)習(xí)算法進(jìn)行語(yǔ)音情感分類自動(dòng)識(shí)別研究。從而簡(jiǎn)化了算法使用邏輯，提升電網(wǎng)客戶服務(wù)的智能便捷化和響應(yīng)水平，降低人工智能的落地難度，提升客戶服務(wù)的智能便捷化響應(yīng)水平，為企業(yè)級(jí)客戶服務(wù)AI（人工智能）中臺(tái)奠定基礎(chǔ)［10］。

1 神經(jīng)網(wǎng)絡(luò)搜索空間構(gòu)建

人工設(shè)計(jì)的網(wǎng)絡(luò)如DenseNet（密集連接卷積網(wǎng)絡(luò)）、VGG、ResNet（深度殘差網(wǎng)絡(luò)）等結(jié)構(gòu)，是通過(guò)卷積、池化、全連接等網(wǎng)絡(luò)層搭建出來(lái)的。自動(dòng)機(jī)器學(xué)習(xí)算法為了得到最終神經(jīng)網(wǎng)絡(luò)框架，也需要預(yù)先定義類似的操作集合來(lái)構(gòu)成待求解模型的搜索空間［11］。為了完成對(duì)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)的建模和自動(dòng)化，通過(guò)搜索的方法得到最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)，結(jié)合過(guò)去研究過(guò)程中對(duì)經(jīng)典問題進(jìn)行模型設(shè)計(jì)的經(jīng)驗(yàn)，通?？梢詼p小所設(shè)計(jì)的搜索空間、簡(jiǎn)化搜索過(guò)程，并且能夠提高模型的性能。

為了針對(duì)電網(wǎng)客戶語(yǔ)音情感分類任務(wù)獲得更好的性能效果，本文采用基于細(xì)胞神經(jīng)結(jié)構(gòu)和元架構(gòu)的方式進(jìn)行模型搜索［12］。與常用的鏈?zhǔn)剿阉鞑煌摲椒ㄊ紫仍谛〉臄?shù)據(jù)集上搜索出最合適的細(xì)胞結(jié)構(gòu)，然后將其遷移到大數(shù)據(jù)集的細(xì)胞上。這就可以避免在大數(shù)據(jù)集上不斷訓(xùn)練搜索而給網(wǎng)絡(luò)帶來(lái)巨大的計(jì)算量，利用有限的計(jì)算資源達(dá)到最好的效果，同時(shí)盡可能將更多的步驟自動(dòng)化。同時(shí)，為了提高效率，會(huì)引入歷史上模型的設(shè)計(jì)經(jīng)驗(yàn)來(lái)指導(dǎo)搜索過(guò)程。

1）為了實(shí)現(xiàn)神經(jīng)結(jié)構(gòu)細(xì)胞和元架構(gòu)的搜索，首先需要解決神經(jīng)結(jié)構(gòu)細(xì)胞的搜索空間設(shè)計(jì)問題。為了快速獲得合適的細(xì)胞結(jié)構(gòu)，只搜索簡(jiǎn)單的單層搜索結(jié)構(gòu)。為此，假設(shè)每個(gè)細(xì)胞由一個(gè)輸入節(jié)點(diǎn)和一個(gè)輸出節(jié)點(diǎn)組成，而一個(gè)細(xì)胞的輸出可以通過(guò)一個(gè)結(jié)合操作對(duì)所有中間節(jié)點(diǎn)的輸出進(jìn)行整合。針對(duì)處理語(yǔ)音信號(hào)的神經(jīng)網(wǎng)絡(luò)的細(xì)胞結(jié)構(gòu)，其基本組成單位如表1所示。

表1 CNN搜索空間設(shè)計(jì)

2）細(xì)胞搜索的范圍確定后，就可以設(shè)計(jì)與之對(duì)應(yīng)的元架構(gòu)空間。為了方便大規(guī)模的數(shù)據(jù)集處理以及不同尺度的特征要求，本文引入了2種細(xì)胞單元架構(gòu)，一種保留輸入數(shù)據(jù)的維度，另一種降低輸入數(shù)據(jù)的維度。元架構(gòu)構(gòu)建采用固定元架構(gòu)的方式。每個(gè)細(xì)胞結(jié)構(gòu)將重復(fù)多次，但是他們的具體權(quán)值參數(shù)將通過(guò)具體數(shù)據(jù)進(jìn)行訓(xùn)練得到。

在具體應(yīng)用中，對(duì)于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的第l層，記其中的基本操作結(jié)構(gòu)集合為每個(gè)基本操作都有唯一的輸入和數(shù)據(jù)節(jié)點(diǎn)，定義操作的神經(jīng)網(wǎng)絡(luò)圖模型的鄰接矩陣為Gl=其中，=k表示數(shù)據(jù)節(jié)點(diǎn)i和j之間的操作為k。那么網(wǎng)絡(luò)的構(gòu)建可以采用層次化的構(gòu)建完成，即第l層的結(jié)構(gòu)為第l-1 層的結(jié)構(gòu)組裝產(chǎn)生，具體過(guò)程通過(guò)ASSEM函數(shù)實(shí)現(xiàn)：

通過(guò)該網(wǎng)絡(luò)結(jié)構(gòu)，數(shù)據(jù)節(jié)點(diǎn)i的特征圖xi為它的所有前驅(qū)數(shù)據(jù)節(jié)點(diǎn)的特征圖xj組合得到，具體過(guò)程通過(guò)merge函數(shù)實(shí)現(xiàn)：

2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索策略定制

在自動(dòng)機(jī)器學(xué)習(xí)算法中，神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索策略主要研究使用什么樣的算法能夠高效準(zhǔn)確地從搜索空間中找到最優(yōu)的模型結(jié)構(gòu)和超參數(shù)［13］。制定搜索策略一般化的過(guò)程是：根據(jù)基本的策略規(guī)則創(chuàng)建初始網(wǎng)絡(luò)；然后對(duì)其進(jìn)行訓(xùn)練，并在驗(yàn)證集合上進(jìn)行測(cè)試；最后根據(jù)網(wǎng)絡(luò)測(cè)試結(jié)果和性能的反饋來(lái)優(yōu)化這些策略規(guī)則。這3個(gè)步驟是一個(gè)更新迭代的過(guò)程，通過(guò)不斷地優(yōu)化策略可以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)模型進(jìn)行迭代更新。最新學(xué)術(shù)研究發(fā)現(xiàn)，強(qiáng)化學(xué)習(xí)、梯度優(yōu)化和貝葉斯優(yōu)化等搜索策略在自動(dòng)機(jī)器學(xué)習(xí)模型搜索中具有出色表現(xiàn)，3種方法在實(shí)驗(yàn)中的表現(xiàn)始終優(yōu)于隨機(jī)搜索［14］。

在這3種方法中，梯度優(yōu)化具有較高的求解效率，但是求解過(guò)程中，需要將離散的模型參數(shù)進(jìn)行連續(xù)化表示，在此過(guò)程中會(huì)帶來(lái)性能損失。貝葉斯優(yōu)化利用高斯過(guò)程來(lái)估計(jì)模型的參數(shù)，建模時(shí)需要對(duì)參數(shù)的先驗(yàn)分布進(jìn)行假設(shè)，但是因?yàn)槟Ｐ蛥?shù)的復(fù)雜性，往往難以對(duì)參數(shù)分布設(shè)計(jì)合理的先驗(yàn)。強(qiáng)化學(xué)習(xí)是更為常用的自動(dòng)機(jī)器學(xué)習(xí)求解算法，它不依賴于參數(shù)的先驗(yàn)分布，得到的模型也能達(dá)到較好的性能。因此，本文利用強(qiáng)化學(xué)習(xí)［15］進(jìn)行模型求解。由于機(jī)器學(xué)習(xí)的推理模型的映射和連接性通?？梢酝ㄟ^(guò)變長(zhǎng)字符串表示，因此基于NASNet 算法［16］，通過(guò)一個(gè)RNN（循環(huán)神經(jīng)網(wǎng)絡(luò)）［17］作為控制器來(lái)生成這個(gè)字符串，進(jìn)而對(duì)應(yīng)到特定的網(wǎng)絡(luò)結(jié)構(gòu)。

算法如圖1 所示，通過(guò)RNN 控制器采樣得到某一個(gè)特定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，并在該神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)下利用語(yǔ)音情感分類數(shù)據(jù)訓(xùn)練模型，然后得到相應(yīng)的驗(yàn)證集上的準(zhǔn)確率。使用該準(zhǔn)確率來(lái)表征本次搜索得到的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的好壞，進(jìn)而將此作為信號(hào)來(lái)訓(xùn)練RNN 控制器。RNN 控制器每次的輸出結(jié)果為一個(gè)特定的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，把RNN控制器中每一步輸出的結(jié)果看作是強(qiáng)化學(xué)習(xí)中的行動(dòng)，對(duì)應(yīng)的狀態(tài)就是控制器到第t步為止生成的網(wǎng)絡(luò)結(jié)構(gòu)。該強(qiáng)化學(xué)習(xí)問題在一個(gè)軌跡結(jié)束之后會(huì)給出一個(gè)反饋R，也就是該神經(jīng)網(wǎng)絡(luò)結(jié)果對(duì)應(yīng)的驗(yàn)證集上的損失。這樣就可以使用強(qiáng)化學(xué)習(xí)方法來(lái)更新RNN控制器權(quán)重，即通過(guò)最大化反饋期望的方式來(lái)優(yōu)化控制器RNN。

圖1 基于強(qiáng)化學(xué)習(xí)的自動(dòng)機(jī)器學(xué)習(xí)搜索算法

式中：a為RNN 控制器預(yù)測(cè)得到的超參數(shù)；T為其長(zhǎng)度；θ為RNN 控制器的參數(shù)；(·)為1到T時(shí)刻反饋值R的期望；模型的訓(xùn)練過(guò)程為最大化J(θ)的過(guò)程。

對(duì)于強(qiáng)化學(xué)習(xí)生成的神經(jīng)網(wǎng)絡(luò)，利用語(yǔ)音情感分類數(shù)據(jù)進(jìn)行訓(xùn)練，并且記錄得到的這個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)果在驗(yàn)證集上的誤差，以此誤差更新RNN控制器的權(quán)重。此外，算法還使用了啟發(fā)式方法輔助網(wǎng)絡(luò)結(jié)構(gòu)的搜索，即根據(jù)空間激活的大小靈活調(diào)整卷積核的個(gè)數(shù)，以使得隱藏狀態(tài)的維度保持在一個(gè)相對(duì)穩(wěn)定的范圍。

在算法求解過(guò)程中，首先定義強(qiáng)化學(xué)習(xí)的操作空間為前文中得到的元架構(gòu)，強(qiáng)化學(xué)習(xí)的狀態(tài)空間為根據(jù)現(xiàn)有架構(gòu)的參數(shù)序列，記t時(shí)刻狀態(tài)為st。為了得到最優(yōu)的網(wǎng)絡(luò)模型并以此訓(xùn)練客戶情感分類模型，該問題等價(jià)于最大化以下的目標(biāo)函數(shù)：

式中：P(at|a1：(t-1)；θ)為當(dāng)前狀態(tài)下，選取下一個(gè)動(dòng)作at的概率。

在強(qiáng)化學(xué)習(xí)中，式（4）存在不同的表達(dá)方法。本文中利用Q-learning（Q學(xué)習(xí)粒子群算法）進(jìn)行函數(shù)的求解，則式（4）等價(jià)于：

式中：Q值為通過(guò)強(qiáng)化學(xué)習(xí)得到的模型在情感分類任務(wù)上得到較高準(zhǔn)確率的概率，通過(guò)構(gòu)建的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)得到；β和γ分別為不同損失的權(quán)重系數(shù)；R值為利用得到的模型在情感分類任務(wù)中的準(zhǔn)確率，通過(guò)函數(shù)Lval(·)求得；A為動(dòng)作集合。

式中：Xtrain和Ytrain分別為情感分類任務(wù)中的語(yǔ)音數(shù)據(jù)和相應(yīng)的標(biāo)簽；w為構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型參數(shù)。

整個(gè)算法的求解過(guò)程如表2所示。

表2 基于強(qiáng)化學(xué)習(xí)的情感分類模訓(xùn)練過(guò)程

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)

為了驗(yàn)證本文提出的自動(dòng)機(jī)器學(xué)習(xí)客戶語(yǔ)音情感分類算法的有效性，利用浙江省電力公司客戶服務(wù)中心電話客服平臺(tái)現(xiàn)有系統(tǒng)，收集客戶語(yǔ)音片段共計(jì)2 799 段。這些片段人工劃分為兩類，一類是2 000 段中性情感的語(yǔ)音，另一類是799 段憤怒的語(yǔ)音。這些片段都被裁剪到固定長(zhǎng)度，使得每個(gè)語(yǔ)音樣本均能用一個(gè)等長(zhǎng)的序列表示，從而得到預(yù)處理后的語(yǔ)音序列。對(duì)每個(gè)語(yǔ)音片段利用開源預(yù)訓(xùn)練語(yǔ)音模型VGGish［18］，作為主干網(wǎng)絡(luò)提取每個(gè)語(yǔ)音片段的矢量表示。

3.2 實(shí)驗(yàn)步驟

整個(gè)實(shí)驗(yàn)過(guò)程在Ubuntu18.04 操作系統(tǒng)下的TensorFlow2.0平臺(tái)上進(jìn)行，自動(dòng)機(jī)器學(xué)習(xí)算法庫(kù)采用AutoKeras。每次實(shí)驗(yàn)過(guò)程中，從第1 個(gè)類別中隨機(jī)選取799 個(gè)語(yǔ)音片段，與第2 個(gè)類別的799個(gè)片段合并，作為此情感分類任務(wù)的數(shù)據(jù)集，并按照0.7、0.2、0.1 的比例劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集。在嘗試的所有模型上分別迭代100次，選出最優(yōu)的模型作為最終結(jié)果。

實(shí)驗(yàn)過(guò)程中，除了模型結(jié)構(gòu)外，對(duì)分類模型的其他參數(shù)進(jìn)行了如下嘗試：

1）全連接層輸出維度的選擇：對(duì)于不同的全連接層，嘗試64、128、256、512、1 024 等不同維度。

2）全連接層的層數(shù)：對(duì)于模型中全連接層的層數(shù)，嘗試2、3、4、5、6、7、8 等不同的層數(shù)（不包括最后的分類全連接層）。

3）dropout 的使用：主要測(cè)試了使用dropout（x，p=0.5）、dropout（x，p=0.2）以及不使用dropout這3種策略。

4）歸一化選擇：嘗試BatchNorm 和Layer-Norm這2種歸一化方法［19］。

3.3 實(shí)驗(yàn)結(jié)果

訓(xùn)練得到的模型的實(shí)驗(yàn)結(jié)果采用分類準(zhǔn)確率進(jìn)行評(píng)價(jià)，其計(jì)算公式為：

即測(cè)試集合上，模型預(yù)測(cè)正確數(shù)量所占總量的比例。

通過(guò)自動(dòng)機(jī)器學(xué)習(xí)算法，得到的最終模型為：

1）BatchNorm層。

2）3×1普通卷積層。

3）細(xì)胞結(jié)構(gòu)1：3×1 普通卷積層；3×1 平均池化層；3×1普通卷積層；全連接層。

4）細(xì)胞結(jié)構(gòu)2：3×1 普通卷積層；5×1 普通卷積層；全連接層；3×1普通卷積層。

5）輸出通道數(shù)為1的1×1普通卷積層。

6）輸出維度為512 的全連接層加ReLU 激活函數(shù)。

7）最后通過(guò)一個(gè)全連接層以及softmax函數(shù)得到模型的分類預(yù)測(cè)輸出。

通過(guò)搜索算法得到的模型類似經(jīng)典分類任務(wù)的卷積神經(jīng)網(wǎng)絡(luò)。它首先采用BatchNorm 操作對(duì)數(shù)據(jù)進(jìn)行歸一化，利用帶池化的操作細(xì)胞結(jié)構(gòu)1對(duì)數(shù)據(jù)進(jìn)行相關(guān)性分析和降維，然后利用細(xì)胞結(jié)構(gòu)2進(jìn)行進(jìn)一步特征提取，再利用輸出通道數(shù)為1 的1×1卷積降低輸入通道，并利用兩層全連接層提取特征，最終利用softmax函數(shù)完成分類任務(wù)。

從所有模型中選出驗(yàn)證集上準(zhǔn)確率最高的模型，并最終在測(cè)試集上進(jìn)行測(cè)試。訓(xùn)練過(guò)程中得到的最好的模型在測(cè)試集上的準(zhǔn)確率為90.93%。結(jié)果相應(yīng)的混淆矩陣如表3所示，可見實(shí)現(xiàn)了一個(gè)比較高的識(shí)別率。

表3 分類結(jié)果混淆矩陣

為了驗(yàn)證自動(dòng)機(jī)器學(xué)習(xí)在模型搜索上的優(yōu)越性，將自動(dòng)搜索得到的模型和其他常用語(yǔ)音分類算法進(jìn)行了對(duì)比，實(shí)驗(yàn)結(jié)果如表4所示。其中包括了MFCC（梅爾倒譜系數(shù)）+SVM（支持向量機(jī)）和LPCC（線性預(yù)測(cè)倒譜系數(shù)）+SVM 為經(jīng)典的手工特征分類方法［5］，ResNet_1D為根據(jù)經(jīng)典分類網(wǎng)絡(luò)模型ResNet18 設(shè)計(jì)的語(yǔ)音分類網(wǎng)絡(luò)，其中的二維卷積改成了適合語(yǔ)音信號(hào)的一維卷積，LSTM+softmax 是利用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行語(yǔ)音分類的方法。表4實(shí)驗(yàn)結(jié)果表明，利用自動(dòng)機(jī)器學(xué)習(xí)算法得到的神經(jīng)網(wǎng)絡(luò)，具有更好的情感分類性能。

表4 不同分類算法準(zhǔn)確率

此外，不同的搜索策略對(duì)最終的神經(jīng)網(wǎng)絡(luò)模型具有較大影響。在實(shí)驗(yàn)過(guò)程中，利用強(qiáng)化學(xué)習(xí)、梯度優(yōu)化和貝葉斯優(yōu)化3種搜索策略進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)搜索。梯度優(yōu)化和貝葉斯優(yōu)化得到的網(wǎng)絡(luò)結(jié)構(gòu)和本文采用的強(qiáng)化學(xué)習(xí)得到的結(jié)構(gòu)較為類似，但是梯度優(yōu)化算法得到的結(jié)構(gòu)缺少BatchNorm 層，貝葉斯優(yōu)化算法得到的結(jié)構(gòu)中部分卷積為3×1深度分離卷積。3個(gè)方法得到的模型經(jīng)訓(xùn)練后在最終的測(cè)試集上得到的分類準(zhǔn)確率如表5所示。實(shí)驗(yàn)結(jié)果表明，利用強(qiáng)化學(xué)習(xí)在該問題上得到的模型具有更高的準(zhǔn)確率。

表5 不同搜索策略的模型分類準(zhǔn)確率

4 結(jié)語(yǔ)

對(duì)電網(wǎng)客戶語(yǔ)音中隱含的情感信息進(jìn)行深度挖掘是提高電力企業(yè)客戶滿意度及客服主動(dòng)服務(wù)意識(shí)的有效手段。實(shí)現(xiàn)量化客戶訴求情感分析，有利于快速了解客戶的關(guān)注焦點(diǎn)，減少投訴的發(fā)生。為了實(shí)現(xiàn)采用最新的人工智能算法對(duì)客戶語(yǔ)音進(jìn)行準(zhǔn)確情感識(shí)別的目的，本文提出了一種基于自動(dòng)機(jī)器學(xué)習(xí)的電網(wǎng)客戶情感自動(dòng)分類算法。該算法通過(guò)構(gòu)建神經(jīng)網(wǎng)絡(luò)搜索空間和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索2個(gè)模塊完成神經(jīng)網(wǎng)絡(luò)模型的設(shè)計(jì)。算法在國(guó)網(wǎng)浙江省電力有限公司客戶服務(wù)中心收集的數(shù)據(jù)集上進(jìn)行了驗(yàn)證。驗(yàn)證結(jié)果表明，該算法具有較高的識(shí)別率。