亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于ResNet-BiLSTM 模型的電力客服工單分類研究

        2022-11-18 14:01:46黃秀彬許世輝何學東
        電子設(shè)計工程 2022年22期
        關(guān)鍵詞:工單客服語義

        黃秀彬,許世輝,趙 陽,居 強,何學東

        (1.國家電網(wǎng)有限公司客戶服務中心,天津 300306;2.北京中電普華信息技術(shù)有限公司,北京 100031)

        電力系統(tǒng)客服是供電企業(yè)和電力客戶間的溝通橋梁,可為電力客戶提供高效便利的服務。電力客服工單數(shù)據(jù)能夠記錄電力客戶在用電過程中的需求、建議和意見,分析工單數(shù)據(jù)能夠有效地定位用戶類別,并且有利于提升用戶體驗。目前的工單數(shù)據(jù)分類方法,主要由專業(yè)的調(diào)查人員對工單數(shù)據(jù)進行數(shù)據(jù)分析,從而判別工單數(shù)據(jù)對應的服務類別。但是這種方法在分析大量的工單數(shù)據(jù)時存在效率偏低的問題,這會影響到電力系統(tǒng)的高效運轉(zhuǎn)和快速發(fā)展。因此,找到一種智能,高效和準確的工單分析方法對于電力客服系統(tǒng)十分關(guān)鍵。

        近年來,電力客服工單分析任務得到了許多研究人員的關(guān)注,并取得了一些成果。湯寧[1]通過提取詞頻特征并建立了基于K 最近鄰(K-Nearest Neighbor,KNN)及支持向量機(Support Vector Machine,SVM)的工單分類模型。林溪橋及其團隊[2]提出一種基于主成分分析的工單分類方法。楊柳林及其團隊[3]使用TF-IDF(Term Frequency-Inverse Document Frequency)算法得到詞頻特征,再通過K-means 聚類算法得到工單分類的結(jié)果。武光華等[4]提出一種改進 的TF-IDF 算 法SI-TFIDF(Semantic Influence-Term Frequency Inverse Document Frequency),通過構(gòu)建LDA(Latent Dirichlet Allocation)模型獲得詞向量的權(quán)重。以上基于淺層機器學習的工單分類方法雖然具有易于實現(xiàn)和訓練快速的優(yōu)點,但這些模型的特征學習能力和泛化能力往往欠缺。

        為解決淺層機器學習模型存在的問題,研究者采用了基于深度學習的神經(jīng)網(wǎng)絡模型對分類任務進行研究。目前卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)[5]和雙向長短時記憶網(wǎng)絡(Bilateral Long-Short-Term Memory network,BiLSTM)[6]被廣泛應用于文本識別[7]、語音識別[8]和情感識別[9]。CNN 的優(yōu)勢在于強大的局部信息提取與學習能力,但其在全局信息學習上存在缺陷[10]。深層的CNN 能夠更好地挖掘樣本包含的信息,但深層卷積網(wǎng)絡較難獲得有效的訓練[11]。殘差網(wǎng)絡(Residual Convolutional Network,ResNet)可以在提升網(wǎng)絡模型深度的同時保證訓練效率。BiLSTM 的優(yōu)勢在于能夠?qū)μ卣鏖g的上下文關(guān)聯(lián)信息進行學習,能夠挖掘文本信息中的深層語義信息,提升識別性能[12]。因此,該文提出了一種基于ResNet-BiLSTM 的電力客服工單分類模型,該模型利用殘差網(wǎng)絡學習句內(nèi)的細節(jié)特征,再通過BiLSTM 學習句間的上下文關(guān)聯(lián)信息,最終得到工單的類別預測結(jié)果。

        1 算法概述

        1.1 Word2Vec詞嵌入算法

        文本的稀疏編碼可將眾多的單詞映射到一個共享空間,但是當詞庫中的單詞類別很多時,會導致“維數(shù)災難”。為此,Mikolov 及其團隊[13]提出了Word2Vec 框架來對單詞進行編碼,如圖1 所示。假設(shè)當前單詞的上下文表示為V=[v1,v2,…,vc]∈R^(c×D),其中D表示詞向量的稀疏表示的維度,c表示上下文單詞的數(shù)量。Word2Vec 利用共享的線性映射得到低維的隱含表示Vh∈R^(c×V),其中V表示降維后的詞向量維度。最終在Vh的數(shù)量維度上進行平均得到Vo∈R^V,即降維后的當前單詞的詞向量表示。Word2Vec 不僅是一種有效的降維方法,而且考慮了單詞間的上下文關(guān)聯(lián),因此Word2Vec 不僅能夠避免“維數(shù)災難”問題而且還可以減輕語義鴻溝帶來的問題。

        1.2 殘差卷積網(wǎng)絡(ResNet)

        何凱明及其團隊在2016 年機器視覺頂會CVPR上提出ResNet[14],用以解決網(wǎng)絡層數(shù)增加帶來的梯度爆炸、梯度消失以及隨網(wǎng)絡層數(shù)增加正確率退化的問題[15]。ResNet 的殘差連接形式如圖2 所示,輸出的期望映射H(x)被表示為殘差F(x)與恒等映射x的和。模型學習殘差的收斂速率要比傳統(tǒng)網(wǎng)絡結(jié)構(gòu)更快且訓練誤差更小。因此,選擇ResNet結(jié)構(gòu)能夠使模型更高效地學習到魯棒性強的深層語義特征。ResNet-18 是ResNet 的經(jīng)典架構(gòu)之一,其網(wǎng)絡結(jié)構(gòu)如圖3 所示。ResNet-18 網(wǎng)絡中的第一個卷積層采用了64 個7×7 卷積核的結(jié)構(gòu),階段1 至階段4 采用了3×3 卷積核的結(jié)構(gòu),并且階段1 至階段4 的卷積核數(shù)量分別為64、128、256 和512,每經(jīng)歷一個階段后會經(jīng)過一個2×2 的池化層來縮小特征圖的大小。ResNet-18 網(wǎng)絡中的激活函數(shù)全部采用Relu 函數(shù),并且Batch Normalization 應用于每個卷積層之后。

        1.3 雙向長短時記憶網(wǎng)絡(BiLSTM)

        長短時記憶網(wǎng)絡(Long-Short-Term Memory network,LSTM)的門控制和記憶細胞有效改善了循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)的梯度消失和梯度爆炸問題[16]。但是LSTM 只能利用過去和當前的信息來對此時間進行預測,無法利用后續(xù)的信息進行預測。對于文本分類任務,文本的上下文關(guān)聯(lián)對于分類結(jié)果至關(guān)重要。因而,可以學習雙向語義相關(guān)信息的BiLSTM 被廣泛應用于文本語義識別[13]。BiLSTM 的輸入門、遺忘門、輸出門和記憶細胞的更新公式可表示為:

        其中,式(1)、(2)和(3)對應于輸入門、遺忘門和輸出門的公式,σ(·)表示sigmoid 激活函數(shù),tanh(·)表示tanh激活函數(shù),Wi、Wf、Wo對應于每個門的權(quán)重,bi、bf、bo為每個門的偏置項,Yt-1表示(t-1)時間步的輸出,Xt表示t時間步的輸入,C'表示狀態(tài)變量,Ct-1表示(t-1)時間步的記憶細胞,Ct表示t時間步的記憶細胞。

        其中,Yt表示t時間步的輸出。BiLSTM 將雙向的最后一個時間步的輸出Yleft和Yright進行拼接,并進行最后的輸出預測。

        其中,Y為對Yleft和Yright拼接后的輸出,表示經(jīng)過激活層后BiLSTM 的最終輸出結(jié)果。

        2 模型框架與算法設(shè)計

        該文針對電力客服工單分類設(shè)計的ResNet-BiLST 模型主要包括三個部分:Word2Vec 詞嵌入、ResNet 語義學習網(wǎng)絡和BiLSTM 上下文關(guān)聯(lián)學習網(wǎng)絡,如圖4 所示。每個工單中的N個語句,分別經(jīng)過Word2Vec 對句內(nèi)的每個單詞進行詞嵌入處理,并將句中每個單詞的詞向量拼接成語義矩陣X=[X1,X2,…,XN]。每個句子對應的語義矩陣分別輸入至ResNet來學習深層次的語義特征。然后將每句提取的深層語義特征輸入至BiLSTM 的不同時間步,通過BiLSTM 學習句間的上下文關(guān)聯(lián)信息。最后,將BiLSTM 的兩個方向特征[Xleft,Xright]進行拼接,得到最終預測結(jié)果。

        3 模型框架與算法設(shè)計

        3.1 實驗環(huán)境

        網(wǎng)絡的實現(xiàn)是通過pytorch 深度學習框架實現(xiàn),運行環(huán)境為CPU Intel Core i7-9700F、GPU NIVIDA GTX1060 以及Windows10 64 位操作系統(tǒng)。

        3.2 數(shù)據(jù)預處理

        實驗數(shù)據(jù)全部來源于電網(wǎng)客服中心記錄的數(shù)據(jù),該數(shù)據(jù)記錄了客戶對電網(wǎng)的需求、建議和意見。并且每條工單以文本的形式記錄,共分為咨詢(C1)、故障報修(C2)、服務申請(C3)、舉報(C4)、表揚(C5)和意見與建議(C6)六類。所有的數(shù)據(jù)進行了句停頓劃分和數(shù)據(jù)清洗等預處理操作。最終將全部數(shù)據(jù)按比例9∶1 劃分為訓練集和測試集,并進行十折交叉驗證。

        3.3 網(wǎng)絡的超參數(shù)設(shè)置

        Word2Vec 詞嵌入算法的隱含層神經(jīng)元個數(shù)設(shè)置為100,詞向量的維度設(shè)置為200。ResNet 網(wǎng)絡的架構(gòu)選取為ResNet-18,BiLSTM 隱含層為2,每層的神經(jīng)元個數(shù)分別為64 和32。另外訓練參數(shù)設(shè)置如表1 所示,正確率和宏-F1 分數(shù)將用來評價客服工單多分類任務的性能。

        表1 訓練超參數(shù)設(shè)置

        3.4 實驗結(jié)果與分析

        所提出的ResNet-BiLSTM 在測試集上六類工單分類的正確率和宏-F1 分數(shù)如表2 所示。根據(jù)表2的實驗結(jié)果ResNet-BiLSTM 取得了90.8%的平均正確率和0.889 的宏-F1 分數(shù),證明了所提出的模型能夠準確地對工單數(shù)據(jù)進行分類,并且對于表揚(C5)類別的識別正確率最高,達到96.5%,但是對于舉報(C4)識別正確率最低,只有84.0%。這可能是由于舉報(C4)容易被誤分類至咨詢(C1)或故障報修(C2)等反饋中。

        表2 ResNet-BiLSTM的工單分類結(jié)果

        在對比實驗中,將所提出的模型與TextCNN,BiLSTM 和ResNet 模型在分類性能上進行對比,其結(jié)果如表3 所示。通過表3 的結(jié)果可知,所提出的ResNet-BiLSTM 取得最高的分類性能,相較于其他三種模型分別提升了1.6%,6.2%和10.6%。這是由于所提出的模型,不僅使用ResNet 學習句內(nèi)的語義信息,還使用了BiLSTM 對句間的上下文關(guān)聯(lián)信息進行了有效地學習,進而提升了模型對工單分類性能。

        表3 不同網(wǎng)絡模型的性能比較

        最終,對上述四種模型的訓練及測試的時間復雜度進行對比,結(jié)果如表4 所示。所提出的模型雖然在訓練時間上速度慢,但是其在測試階段仍要優(yōu)于主流的文本分類模型TextCNN,說明所提出的模型在實時性能方面存在一定的優(yōu)勢。

        表4 所有網(wǎng)絡模型的時間復雜度對比

        4 結(jié)束語

        該文對電力客服工單數(shù)據(jù)的分類進行了研究,所提出的ResNet-BiLSTM 對工單數(shù)據(jù)的句內(nèi)語義和句間上下文關(guān)聯(lián)信息進行了有效地建模。通過Word2Vec 得到詞向量并將每一句中的詞向量拼接成語義矩陣,再通過ResNet 對句內(nèi)的語義特征進行學習,并將得到的深層次語義特征輸入至BiLSTM 來進行句間上下文關(guān)聯(lián)的表征。所提出的模型在真實電力客服工單數(shù)據(jù)上的分類準確度達到90.8%,高于對比模型。且ResNet-BiLSTM 相較于對比模型在分類性能和時間復雜度方面都具有一定的優(yōu)勢,能夠保證其在線性能的穩(wěn)定。在下一階段的研究中,將重點關(guān)注模型的輕量化,提升工單分類模型的在線性能。

        猜你喜歡
        工單客服語義
        基于量化考核的基層班組管理系統(tǒng)的設(shè)計與應用
        電子測試(2022年7期)2022-04-22 00:13:16
        基于transformer的工單智能判責方法研究
        語言與語義
        語音推銷
        敬業(yè)的客服
        基于HANA的工單備件采購聯(lián)合報表的研究與實現(xiàn)
        中國核電(2017年1期)2017-05-17 06:09:55
        “上”與“下”語義的不對稱性及其認知闡釋
        電力95598熱線全業(yè)務集中后的工單預警機制
        基于廣東“一張網(wǎng)”對內(nèi)客服模式的探討
        認知范疇模糊與語義模糊
        无码人妻av免费一区二区三区| 少妇人妻出水中文字幕乱码| 日本97色视频日本熟妇视频| 亚洲色图专区在线视频| 亚洲va久久久噜噜噜久久天堂| 超级碰碰色偷偷免费视频| 成人无码区免费a片www| 日本韩国三级aⅴ在线观看| 漂亮人妻被强中文字幕乱码| 国产女同va一区二区三区| 国产精品久久久久高潮| 欧美大黑帍在线播放| av少妇偷窃癖在线观看| 中文字幕视频二区三区| 久久婷婷综合激情五月| 色欲综合一区二区三区| 亚洲永久精品ww47| 麻豆人妻无码性色AV专区| 国产日产高清一区二区三区| 国产午夜激无码av毛片不卡| 久久综合给合综合久久| 99精品成人片免费毛片无码| 一本久久综合亚洲鲁鲁五月夫| 一本久久精品久久综合| 久久精品国产精品亚洲| 亚洲精品国偷自产在线99正片| www.av在线.com| 在线亚洲精品中文字幕美乳色| 男人吃奶摸下挵进去啪啪软件| 看av免费毛片手机播放| 思思99热| 日本av第一区第二区| 天堂av在线美女免费| 国产精品视频露脸| 中文字幕无码日韩欧毛| 青青草视频在线免费视频| 国产精品会所一区二区三区| 久久精品国产亚洲av麻豆| 午夜短无码| 精品久久人妻一区二区| 亚洲av片无码久久五月|