摘要:由于電網(wǎng)客服數(shù)據(jù)實體在業(yè)務(wù)邏輯、用戶行為或系統(tǒng)交互等方面存在較高的關(guān)聯(lián)性,導(dǎo)致生成的數(shù)據(jù)本體模型維度較高,這不僅加大了計算資源的消耗,還可能引入信息冗余和干擾,進而降低了客服語音監(jiān)測的效率和準(zhǔn)確性。為此,本文提出基于知識圖譜的電網(wǎng)客服智能語音監(jiān)測方法。通過創(chuàng)建客服語音數(shù)據(jù)屬性的三元數(shù)組,識別語料中的關(guān)鍵實體,并對實體的關(guān)聯(lián)性進行消解處理,由此生成低維度數(shù)據(jù)本體模型,進而構(gòu)建電網(wǎng)客服服務(wù)領(lǐng)域的知識圖譜,在此基礎(chǔ)上,求取語音信號的矢量函數(shù),通過知識更新和知識補全確定圖譜的頂點集,從而抽取語音序列的語義信息,結(jié)合自然語言處理技術(shù)和機器學(xué)習(xí)算法對語音數(shù)據(jù)進行智能分析和監(jiān)測,從而實現(xiàn)電網(wǎng)客服智能語音高質(zhì)量的監(jiān)測。通過實際數(shù)據(jù)集的實驗,驗證了所提方法在提升客服語音監(jiān)測效率和準(zhǔn)確性方面的有效性。
關(guān)鍵詞:知識圖譜;電網(wǎng)客服;語音;監(jiān)測分析;實體屬性
中圖分類號:TN912.34;TP277文獻標(biāo)識碼:A文章編號:1001-5922(2025)04-0152-04
Intelligent voice monitoring method for power grid customer service based on knowledge graph
ZHANG Wei,GENG Chaoran,HU Songyin,ZHANG Guoxing,WANG Mu
(Southern Power Grid Supply Chain Group Co.,Ltd.,Guangzhou 511458,China)
Abstract:Due to the high correlation of grid customer service data entities in business logic,user behavior or sys?tem interaction,the generated data ontology model has a high dimension,which not only increases the consumption of computing resources,but also introduces information redundancy and interference,thus reducing the efficiency and accuracy of customer service voice monitoring.Therefore,this paper proposes an intelligent voice monitoring method for power grid customer service based on knowledge graph.By creating a ternary array of customer service voice data attributes,the key entities in the corpus are identified,and the relevance of the entities is digested to generate a low-dimensional data ontology model,and then the knowledge graph in the field of power grid customer service is constructed.On this basis,the vector function of the voice signal is obtained,and the vertex set of the graph is determined by knowledge update and knowledge completion,so as to extract the semantic information of the voice sequence.Combined with natural language processing technology and machine learning algorithm,the voice data is intelligently analyzed and monitored,so as to realize the high-quality monitoring of the intelligent voice of the power grid customer service.The effectiveness of the proposed method in improving the efficiency and accuracy of customer service voice monitoring has been demonstrated through experimental verification on actual datasets.
Keywords:knowledge graph;power grid customer service;voice;monitoring and analysis;entity attributes
電網(wǎng)客服智能語音監(jiān)測主要是利用語音識別技術(shù),將外部環(huán)境中的音頻信號(如人類說話、設(shè)備運行聲音等)轉(zhuǎn)換為計算機可讀的輸入形式,隨后進行智能識別、分析和應(yīng)用。傳統(tǒng)的電網(wǎng)客服語音監(jiān)控模式多依賴人工監(jiān)控和標(biāo)注,不僅僅進程緩慢,還容易受到操作者主觀意識干擾,導(dǎo)致監(jiān)控結(jié)果出現(xiàn)偏差且缺乏一致性。因此,研究智能語音監(jiān)控對電網(wǎng)客戶服務(wù)具有重要的現(xiàn)實意義和應(yīng)用價值。
黃曉園等[1]通過構(gòu)建物聯(lián)網(wǎng)語音監(jiān)控設(shè)備,實現(xiàn)了語音的智能監(jiān)測。Kaur等[2]引入鯨魚優(yōu)化算法實現(xiàn)對語音信號的高效監(jiān)測和分析。Mirheidari等[3]利用深度學(xué)習(xí)和機器學(xué)習(xí)等算法,提取過濾后的語音信號中特征,并據(jù)此訓(xùn)練模型,實現(xiàn)語音辨識、分類或監(jiān)測。段昌淼[4]實現(xiàn)受控語音的準(zhǔn)確識別,并利用數(shù)字監(jiān)控技術(shù),對識別結(jié)果進行實時分析和顯示。
為切實提高電網(wǎng)客服語音監(jiān)測的效率與準(zhǔn)確性,本研究旨在探索一種基于知識圖譜的電網(wǎng)客戶服務(wù)智能語音監(jiān)測方法。通過對電網(wǎng)客服語音數(shù)據(jù)的深入分析和處理,可以實現(xiàn)對語音內(nèi)容的監(jiān)測,為提高電網(wǎng)客服系統(tǒng)的智能化水平和服務(wù)質(zhì)量提供有力支撐。
1電網(wǎng)客服智能語音監(jiān)測方法設(shè)計
1.1電網(wǎng)客服服務(wù)領(lǐng)域知識圖譜構(gòu)建
知識圖譜[5]是一種結(jié)構(gòu)化的知識表示方法,它能夠整合和表示電網(wǎng)客服領(lǐng)域中的各種實體、屬性和關(guān)系。通過構(gòu)建電網(wǎng)客服語音數(shù)據(jù)知識圖譜,可以提取并整合關(guān)鍵信息,結(jié)合圖譜中的節(jié)點和連接,能夠?qū)崿F(xiàn)對客服語音內(nèi)容的深入理解和解釋,為后續(xù)的語音監(jiān)測提供準(zhǔn)確、全面的數(shù)據(jù)支撐。
電網(wǎng)客服智能語音數(shù)據(jù)通常包括結(jié)構(gòu)化和非結(jié)構(gòu)化兩類,其分類依據(jù)基于完整性、規(guī)則性和是否能夠用關(guān)系型數(shù)據(jù)庫進行表示和存儲來決定,不同的客服語音數(shù)據(jù)類別應(yīng)采用不同的本體模型[6]。
根據(jù)電網(wǎng)客服語音監(jiān)測的目標(biāo),從電網(wǎng)企業(yè)客服中心收集語音數(shù)據(jù),創(chuàng)建數(shù)據(jù)屬性三元組,對數(shù)據(jù)屬性進行處理[7]。利用命名實體識別技術(shù)從文本中識別出客戶、設(shè)備故障類型等關(guān)鍵實體,并對實體的關(guān)聯(lián)性進行消解處理,由此生成低維度的數(shù)據(jù)本體模型,表達(dá)式為M= s0*βt,式中s0表示數(shù)據(jù)維度;βt表示數(shù)據(jù)字段長度。
接下來利用知識映射原理建立數(shù)據(jù)結(jié)構(gòu)模型Ν= ,式中a0表示分詞數(shù)量;gt表示實體與語義之間的相似度。
進而對本體模型和數(shù)據(jù)結(jié)構(gòu)進行整合,生成知識圖譜[8]。具體如圖1所示。
根據(jù)電網(wǎng)客服語音數(shù)據(jù)屬性,創(chuàng)建數(shù)據(jù)本體模型與結(jié)構(gòu)模型,并通過模型整合生成包括本體-實體-屬性三元組的電網(wǎng)客服服務(wù)領(lǐng)域的知識圖譜,為后續(xù)語音語義信息抽取奠定基礎(chǔ)。
1.2語音語義信息抽取
由于不同的語音語料具有不同的上下文表示,且字詞、語法存在多樣性的特點,會對語音監(jiān)測結(jié)果造成影響。因此,利用構(gòu)建的知識圖譜中實體與屬性的關(guān)系,抽取和標(biāo)記問題中的語義信息[9]。
對于原始語音數(shù)據(jù)中的一個短語,其輸入表示可以通過段落嵌入,關(guān)鍵詞嵌入和位置嵌入3個部分的疊加來組成[10]。對于存儲的語音數(shù)據(jù),其信號矢量函數(shù)可表示為
f(x) = Ν(1)
式中:n表示本體類型數(shù)量;αk表示輸入矩陣;t1、t2分別表示本體層與實體層、實體層與屬性層的映射系數(shù)。
由于句子中不同詞匯的重要性各不相同,每個向量都承載著該句子中所有字的獨特信息[11]。因此,為保證任意提取的關(guān)鍵詞都能夠表征句子的整體語義,利用實體消歧方法進行知識更新與補全[12],公式為
í???(ì??)X(X)2(1)(2)
式中:?0表示樣本生成規(guī)模;gt表示嵌入?yún)?shù)數(shù);kp表示低維詞嵌入空間維度;X1、X2分別表示知識更新樣本和補全樣本。
完善后的知識圖譜會將語音字序列轉(zhuǎn)換成輸入向量序列,從而增強語音數(shù)據(jù)的語義理解[13]?;诖耍捎眯蛄兄丿B法利用片段信息求取圖譜的頂點集,即:
wp= A 2
式中:m表示圖譜邊數(shù);As表示向量矩陣。進而采用下式完成對語音語義的信息抽取,
「= b0(wp)(4)
式中:τs表示字序列位置信息編碼;b0表示語義標(biāo)簽序列;m''表示加權(quán)系數(shù)。
根據(jù)建立的電網(wǎng)客服語音數(shù)據(jù)知識圖譜,求取語音信號的矢量函數(shù),通過知識更新和知識補全確定圖譜的頂點集,從而抽取語音序列的語義信息,便于后期實現(xiàn)語音監(jiān)測。
1.3電網(wǎng)客服語音監(jiān)測
根據(jù)提取的電網(wǎng)客服語音語義信息,對電網(wǎng)客服進行語音檢測。假設(shè)一段客服語音的開始時間為T1,結(jié)束時間為T2,則語音序列的短時平均過零率可表示為
「(T1+ T2)
式中:「表示語義信息;κc表示矩形窗函數(shù);υ0表示滑動窗口幅度。
通過對語音包的存儲時間進行分析,求取數(shù)據(jù)包的正向時延[14],計算公式為dt= ,式中σh表示時刻t的人工請求量;xt表示接通請求量;hj表示客服服務(wù)的統(tǒng)計周期。
假設(shè)語音數(shù)據(jù)的隨機實驗服從高斯分布,引入機器學(xué)習(xí)算法和自然語言處理技術(shù)提取語音的聲振特征[15],表達(dá)式為Q= ,式中?m表示注意機制的加權(quán)聚合向量;Dh表示分詞聚合系數(shù)。
則M'次同步測量后,建立語義信息的似然函數(shù),表達(dá)式為F(t) = Q′ bn′ sp/fr,式中bn表示語義置信度得分;Dh表示計算矩陣。
根據(jù)客戶語音意圖類型的數(shù)量,利用解碼器對意圖進行識別,得到語音節(jié)點額定時隙信息,即J= Q·μ0,式中:μ0表示編碼函數(shù)。
進一步運用智能技術(shù)對客服語音進行深入監(jiān)測,以全面評價客服人員的服務(wù)效果,表達(dá)式為
Λ= J′ ξexp- (6)
式中:ξ表示客戶意圖狀態(tài);G表示意圖模態(tài)函數(shù);p表示上下文信息的時間步總和;Λ表示客服服務(wù)質(zhì)量評分。
依據(jù)求得的客服服務(wù)質(zhì)量分?jǐn)?shù)可以對電網(wǎng)客服語音進行評估,確定目標(biāo)語音語料的服務(wù)水平。至此,完電網(wǎng)客服智能語音監(jiān)測方法的設(shè)計。
2實例驗證分析
為驗證本文設(shè)計的基于知識圖譜的電網(wǎng)客服智能語音監(jiān)測方法在實際應(yīng)用中的效果,將本文方法應(yīng)用在某電網(wǎng)企業(yè)客服語音監(jiān)測中,并根據(jù)實驗結(jié)果分析該方法的監(jiān)測效果。
2.1實驗準(zhǔn)備
本次實驗的數(shù)據(jù)來自某電網(wǎng)客戶服務(wù)中心的記錄數(shù)據(jù)、電力服務(wù)熱線的記錄以及通過在線渠道(如電網(wǎng)企業(yè)官網(wǎng)、移動應(yīng)用程序等)收集的用戶語音反饋。這些數(shù)據(jù)涵蓋了不同場景下的用戶語音,能夠全面反映電網(wǎng)客服的實際情況。
實驗數(shù)據(jù)集涵蓋了各種類型的語音數(shù)據(jù),主要包括以下幾類。正常咨詢語音:用戶對電費、停電通知、電力設(shè)施維修等正常咨詢問題的語音記錄;投訴語音:用戶對電網(wǎng)服務(wù)不滿意或遇到問題時發(fā)出的投訴;建議和反饋語音:用戶為電網(wǎng)服務(wù)提供建議和對電力產(chǎn)品使用情況的反饋;其他類型的語音:無關(guān)語音、噪聲、無法識別的語音等。
電網(wǎng)客服語音知識圖譜的構(gòu)建分為2部分,第一部分是對采集的初始語音數(shù)據(jù)進行分析,并通過數(shù)據(jù)增強的方式進行樣本生成;第二部分是對樣本進行數(shù)據(jù)預(yù)處理,將其轉(zhuǎn)換為文本形式,并進行標(biāo)注,由此建立知識圖譜,其中標(biāo)注文件描述如表1所示。
實驗采用基于云計算的實驗平臺,可以支持大規(guī)模電網(wǎng)客服語音數(shù)據(jù)的處理和分析。設(shè)置音頻處理參數(shù)的采樣率為16 kHz,幀長為25 ms,幀移為10 ms。機器學(xué)習(xí)算法參數(shù)的學(xué)習(xí)率0.001,批量32,訓(xùn)練輪次100。注意力機制的權(quán)重被初始化為平均值為0、標(biāo)準(zhǔn)偏差為0.1的正態(tài)分布。
實驗過程如下。從電網(wǎng)客服處收集語音數(shù)據(jù)并進行預(yù)處理,包括將其轉(zhuǎn)錄成文本和去除無關(guān)噪聲,共計得到10 000條語音記錄,每條語音記錄持續(xù)時間在1~5 min之間;利用知識圖譜構(gòu)建工具,從經(jīng)過預(yù)處理的文本數(shù)據(jù)中提取實體和關(guān)系,構(gòu)建電網(wǎng)客戶服務(wù)領(lǐng)域的知識圖譜,并提取電網(wǎng)客服語音數(shù)據(jù)的相關(guān)特征,利用機器學(xué)習(xí)框架實現(xiàn)基于注意力的機器學(xué)習(xí)算法,完成對客服語音的智能監(jiān)測。
2.2電網(wǎng)客服語音監(jiān)測效率分析
基于以上實驗準(zhǔn)備與相關(guān)參數(shù)的設(shè)置,將本文設(shè)計的方法應(yīng)用于客服中心的語音智能監(jiān)測中,并引入局部相位量化方法(方法1)、特征空間軌跡信息方法(方法2)作為本文方法的對比分析可知,基于相同監(jiān)測時間,應(yīng)用本文方法對電網(wǎng)客服語音數(shù)據(jù)進行智能監(jiān)測,得到的語音監(jiān)測規(guī)模顯著高于方法1和方法2,說明本文方法在語音智能進行方面具有較高的監(jiān)測效率。而方法1和方法2監(jiān)測效率低下的原因主要是由于無法有效覆蓋原始語音中的背景噪音、語速等特性,導(dǎo)致在語義特征提取時易丟失構(gòu)建信息,從而使得監(jiān)測效果不好。通過實驗結(jié)果可以證明本文方法在電網(wǎng)客服語音監(jiān)測中的有效性。
2.3電網(wǎng)客服語音監(jiān)測準(zhǔn)確性分析
為驗證本文所提智能語音監(jiān)控方法的可行性,開展了針對對照組方法與本文方法在電網(wǎng)客服語音監(jiān)測準(zhǔn)確性方面的對比測試,采用監(jiān)測結(jié)果的服務(wù)質(zhì)量評分與實際得分的匹配度這一指標(biāo)對3種方法的應(yīng)用性能進行評估。實驗結(jié)果如表2所示。
根據(jù)表2中的數(shù)據(jù)可以看出,與其他兩種方法相比,利用所提方法對客服語音進行監(jiān)測,監(jiān)測出的客服服務(wù)質(zhì)量評分和實際得分的匹配度更高,在50-300s的語音長度監(jiān)測中,本文方法的評分匹配度始終在95%以上,由此證明了本文方法具有較高的監(jiān)測準(zhǔn)確性,可以為提高服務(wù)質(zhì)量提供依據(jù)。
3結(jié)語
基于知識圖譜的電網(wǎng)客服智能語音監(jiān)測方法集成了自然語言處理、機器學(xué)習(xí)、知識圖譜構(gòu)建等多項技術(shù)。通過對電網(wǎng)客戶服務(wù)語音數(shù)據(jù)進行預(yù)處理和提取特征,并使用知識圖譜構(gòu)建技術(shù)將語音中的關(guān)鍵信息映射到圖中的實體和關(guān)系,以此實現(xiàn)對電網(wǎng)客服語音的智能監(jiān)測。本研究成果不僅能夠提高電網(wǎng)客戶服務(wù)的服務(wù)質(zhì)量和效率,而且能夠為電力企業(yè)的決策提供有力的支持。
【參考文獻】
[1]黃曉園,廖潤生,吳澤海,等.基于物聯(lián)網(wǎng)的智慧工廠空氣環(huán)境智能語音監(jiān)測平臺設(shè)計[J].現(xiàn)代信息科技,2022,6(22):159-162.
[2]Kaur B,Rathi S,Agrawal R K.Enhanced depression detec?tion from speech using Quantum Whale Optimization Algo?rithm for feature selection[J].Computers in Biology and Medicine,2022,150:106122.
[3]Mirheidari B,Bittar,André,Cummins N,et al.Automatic detection of expressed emotion from five-minute speech samples:Challenges and Opportunities[J].PLoS One,2024,19(3):e0300518
[4]段昌淼.基于管制語音識別的數(shù)字化監(jiān)測技術(shù)研究與應(yīng)用[J].網(wǎng)絡(luò)安全和信息化,2022(10):82-85.
[5]田穎慧,賀前華,鄭若偉,等.基于特征空間軌跡信息的語音關(guān)鍵詞檢測方法[J].電子學(xué)報,2023,51(10):2915-2924.
[6]王振乾.IT服務(wù)臺BP神經(jīng)網(wǎng)絡(luò)模型智能服務(wù)機器人個性化情感研究[J].粘接,2021,48(12):79-82.
[7]吾買爾江·麥麥提,阿布都熱孜克·熱孜克.基于調(diào)制頻譜的廣播信號監(jiān)測方法[J].廣播電視信息,2022,29(7):54-56.
[8]王師琦,曾慶寧,龍超,等.語音增強與檢測的多任務(wù)學(xué)習(xí)方法研究[J].計算機工程與應(yīng)用,2021,57(20):197-202.
[9]杜晗,張維維,張巧靈,等.基于常Q變換與深度神經(jīng)網(wǎng)絡(luò)的VDR語音端點檢測[J].大連海事大學(xué)學(xué)報,2022,48(2):128-135.
[10]梁超,高勇.一種利用SE-Res2Net的合成語音檢測系統(tǒng)[J].無線電工程,2022,52(9):1560-1565.
[11]王錦陽,華光,黃雙.基于注意力機制的端到端合成語音檢測[J].信號處理,2022,38(9):1975-1987.
[12]張洪德,韓鑫怡,柳林,等.基于譜減與自適應(yīng)子帶對數(shù)能熵積的端點檢測[J].兵器裝備工程學(xué)報,2022,43(2):267-273.
[13]房鑫坤.基于Arduino的環(huán)境監(jiān)測設(shè)備語音識別功能設(shè)計[J].電子技術(shù)與軟件工程,2021(22):99-101.
[14]蘇兆品,張羚,張國富,等.基于多特征融合和BiLSTM的語音隱寫檢測算法[J].電子學(xué)報,2023,51(5):1300-1309.
[15]李卓,顏少偉,符樹雄,等.基于自然語言處理的電力調(diào)控智能搜索引擎關(guān)鍵技術(shù)研究[J].粘接,2021,46(5):85-87.
(責(zé)任編輯:李睿)