王敏輝,趙東明,石 理,槐秋媛,吳 娜
(中國移動通信集團天津有限公司人工智能實驗室 天津 300020)
隨著中國移動業(yè)務(wù)復(fù)雜度的不斷提升,在應(yīng)對營業(yè)廳、渠道等一線人員的服務(wù)請求時會遇見各種各樣的系統(tǒng)問題,一線人員多使用投訴工單或問題工單方式派發(fā),需后端智能處理系統(tǒng)以知識圖譜技術(shù)進行分析和處理,并半自動化生成問題解決方案[1],幫助投訴工單處理人員等服務(wù)團隊進行快速響應(yīng),優(yōu)化客戶感知,進而提升內(nèi)部滿意度。
當(dāng)前投訴工單分析處理存在的問題包括如下4點:①問題定位不夠準(zhǔn)確,由于處理人員經(jīng)驗不足,可能會造成定位不準(zhǔn)確的問題,進而形成有偏差的處理方案,這不但無助于解決問題,還進一步降低了客戶體驗,增加了系統(tǒng)運行風(fēng)險[2];②工單分類準(zhǔn)確度低,投訴工單需要轉(zhuǎn)發(fā)到相應(yīng)的一線處理人員進行處理,再向客服返回處理結(jié)果,首要環(huán)節(jié)就是工單的有效分派,如果出現(xiàn)工單分派錯誤的情況就會影響工單的順利流轉(zhuǎn);③無法快速匹配歷史工單,相似的投訴工單重復(fù)出現(xiàn),是投訴工單處理工作中的常見現(xiàn)象,有經(jīng)驗的處理人員能很快找到類似的歷史工單,并參照歷史處理方案進行處理,確保處理高效率,但新的人員無法在短期內(nèi)具備這種能力,造成了低效的重復(fù)勞動;④工單數(shù)據(jù)價值亟待挖掘,公司發(fā)展積累了海量的歷史投訴工單數(shù)據(jù),然而工單往往以非結(jié)構(gòu)化文本數(shù)據(jù)的形式存儲,這嚴重制約了工單數(shù)據(jù)中關(guān)鍵信息的提取分析工作和價值發(fā)揮[3]。
因此,亟需構(gòu)建基于工單處理日志的專用知識圖譜,向投訴工單處理機制開放接口能力,通過對工單內(nèi)容進行實體提取和語義理解,并與知識圖譜模板的匹配獲取解決方案合并后形成處理意見,自動推送到工單處理人待辦進行決策輔助,進而實現(xiàn)“人-機”協(xié)同的投訴工單的自動分析、自動處理和自動回復(fù)。
基于機器閱讀理解技術(shù)的工單分析知識圖譜系統(tǒng),從場景化應(yīng)用出發(fā),服務(wù)于企業(yè)工單一線提單人員、工單處理人員和工單分析人員。
通過工單知識圖譜系統(tǒng)實現(xiàn)工單的自動化流轉(zhuǎn)和分析功能,解決了一線營業(yè)人員無法快速獲取解決方案的問題,同時也服務(wù)于一線運維人員,在減少一線營業(yè)人員的提單量與咨詢量的同時也降低了運維人員對同類問題的人力成本投入。工單分析圖譜受眾面比較廣,可通過消息申請和返回機制應(yīng)用在任何信息交互系統(tǒng),并幫助應(yīng)用人員在海量的歷史數(shù)據(jù)中快速檢索想要獲取的數(shù)據(jù)。
工單分析知識圖譜主要面向內(nèi)部用戶提供幫助,如工單一線提單人員。在接受到客戶訴求時,工單分析圖譜為內(nèi)部用戶提供異常問題解決方案、解釋口徑等查詢;提供語義搜索及可視化,體現(xiàn)在內(nèi)部用戶的系統(tǒng)運維知識庫上,進行面向知識語義的智能搜索,并提供搜索決策過程的可視化能力;可以根據(jù)圖譜中已構(gòu)建的工單處理經(jīng)驗自動分析下一步工單處理動作、處理人或回復(fù)口徑,輔助工單處理人員進行快速業(yè)務(wù)處理。
工單分析知識圖譜主要用于投訴工單智能分析場景。通過對工單內(nèi)容進行實體提取和語義理解并與知識圖譜模板的匹配實現(xiàn)“人-機”協(xié)同的投訴工單的智能處理,如圖1所示。
圖1 知識圖譜系統(tǒng)服務(wù)場景Fig.1 Knowledge graph system service scenario
2.2.1 工單內(nèi)容分析
構(gòu)建知識圖譜將提供統(tǒng)一對外接口,同步待辦工單內(nèi)容進行后續(xù)處理。
2.2.2 故障現(xiàn)象分類
依托知識圖譜中構(gòu)建的故障分類模型,對工單內(nèi)容文本進行現(xiàn)象分類和定位用戶問題類別。
2.2.3 故障原因預(yù)測
根據(jù)故障現(xiàn)象類別在知識圖譜中查找針對問題的故障原因內(nèi)容,并按關(guān)系強弱依次排列。
2.2.4 解決方案預(yù)測
根據(jù)故障現(xiàn)象類別在知識圖譜中查找針對問題的故障解決方案內(nèi)容,并按關(guān)系強弱依次排列。
2.2.5 處理意見生成
根據(jù)模板將“故障現(xiàn)象-故障原因-故障解決方案”的內(nèi)容進行有機整合,并生成一段處理意見文本,然后返回前臺業(yè)務(wù)工單系統(tǒng)。
工單分析知識圖譜的數(shù)據(jù)源為用戶咨詢歷史、工單處理記錄等,均能清晰體現(xiàn)工單的問題描述、處理解決方案和業(yè)務(wù)要素之間的關(guān)系,并在工單分析等場景進行智能推薦。
模式是知識圖譜的概念模型和邏輯基礎(chǔ),其借助實體關(guān)系的規(guī)則定義來約束知識圖譜的數(shù)據(jù)。面向內(nèi)部運維場景的模式設(shè)計是知識圖譜構(gòu)建的基礎(chǔ),具體來說,從工單場景的服務(wù)訴求出發(fā),基于工單數(shù)據(jù)設(shè)計出一套行業(yè)領(lǐng)域的知識圖譜。為圖譜自動抽取的框架進行語義分析,面向故障的模式包括故障現(xiàn)象、故障原因、解決方案、工單動作、處理人及其電話、關(guān)鍵詞、投訴類別、關(guān)聯(lián)問題單、關(guān)聯(lián)需求單等。
根據(jù)工單自動化處理和分析需求設(shè)計適合場景的圖譜結(jié)構(gòu) Schema,以“實體-關(guān)系-實體”方式進行連接,運行過程如圖2所示。以故障現(xiàn)象類別為中心,其代表了用戶可能咨詢的問題,故障原因類別代表了發(fā)生相關(guān)故障現(xiàn)象的原因,解決方案代表故障現(xiàn)象應(yīng)該如何解決,工單動作和處理人則代表當(dāng)前故障現(xiàn)象的后續(xù)處理建議,如表1所示。
圖2 工單分析知識圖譜運行過程Fig.2 Operation process of work-order analysis knowledge graph
表1 工單分析圖譜的實體類型Tab.1 Entity type of work-order analysis graph
輸入輸出參數(shù)具體為:①輸入數(shù)據(jù),在訓(xùn)練過程中輸入投訴處理工單、用戶問題記錄等信息,包括故障內(nèi)容描述、故障原因、故障解決方案、工單工作、工單處理人、投訴類別、關(guān)聯(lián)問題單、需求單等關(guān)鍵信息,在應(yīng)用過程中輸入為客戶的一種問題表述“故障現(xiàn)象”、待獲取對應(yīng)的“故障原因”、“問題解決方案”或工單下一步動作、處理人等信息,知識圖譜訓(xùn)練數(shù)據(jù)以 RDF(資源描述框架)方式存入關(guān)系數(shù)據(jù)庫,即 Neo4j;②輸出數(shù)據(jù),根據(jù)輸入的問題在知識圖譜關(guān)系型數(shù)據(jù)庫Neo4j中查詢對應(yīng)的故障原因、解決方案、下一步動作、處理人信息,并反饋到請求方。
實體識別是知識圖譜語義分析的關(guān)鍵,采用機器學(xué)習(xí)技術(shù)自動或半自動地從多源數(shù)據(jù)中提取知識圖譜的實體、關(guān)系、屬性等要素。知識抽取包含實體抽取、關(guān)系抽取和屬性抽取。
實體識別是知識圖譜語義分析的關(guān)鍵步驟。具體為:①清洗后源業(yè)務(wù)數(shù)據(jù),去除惡意詞匯,進行句法分析后形成明確語義文本;②對長文本分詞形成斷句和詞語,依據(jù)的分詞數(shù)據(jù)庫包括術(shù)語詞典、業(yè)務(wù)詞典和停用詞典;③置入文本分析模型結(jié)構(gòu),采用向量空間進行詞句的建模,以最大程度保留詞句的上下文關(guān)系;④通過 LSTM(長短期記憶)網(wǎng)絡(luò)的處理得到了好的對輸入數(shù)據(jù)的表示方法,然后將 LSTM 與 CRF(條件隨機場)結(jié)合,即在輸出端將 softmax與 CRF結(jié)合起來,使用 LSTM 解決提取序列特征的問題和CRF有效利用句子級別的標(biāo)記信息;⑤輸出實體列表,如網(wǎng)易定向流量權(quán)益包、花卡等。
多實體識別的聚類特殊處理機制:在傳統(tǒng)的知識圖譜中,實體往往是相對確定的一個名詞,而在運維領(lǐng)域中的實體名稱往往是一句話甚至是幾句話的描述。因此,輸出實體過程中還需要考慮對相近實體進行聚類,以提升系統(tǒng)感知。
關(guān)系識別是對非結(jié)構(gòu)化文檔處理的重要環(huán)節(jié),自然語言中對事件的描述往往會以多個子句的形式存在,且多句之間具有相關(guān)性。關(guān)系識別需要對投訴工單數(shù)據(jù)的上下文進行依存句法相關(guān)性分析,進而找出實體間存在哪種關(guān)系和關(guān)系周邊的實體分別是什么,如運維場景中“A導(dǎo)致了 B”“C的故障原因是 D”“E的變更產(chǎn)生了 F現(xiàn)象”,面向運維場景的關(guān)系識別是構(gòu)建RDF三元組的基礎(chǔ)。
具體構(gòu)建方法為:①故障現(xiàn)象,可以將申告類型作為故障現(xiàn)象類別,同時抽取申告內(nèi)容的“業(yè)務(wù)內(nèi)容”文本來構(gòu)建文本分類模型,實現(xiàn)將長文本映射到申告類別的能力,訓(xùn)練出的模型可以對新入工單的申告內(nèi)容進行分析,并自動得到申告類別信息;②故障原因和解決方案,對回復(fù)口徑的長文本內(nèi)容進行分析,通過機器閱讀理解模型進行目標(biāo)文本位置識別。
抽取完成后還需要對多類故障原因的描述文本進行聚類或分類操作,并屏蔽描述的不確定性。系統(tǒng)完成實體提取和關(guān)系提取后,通過歷史工單的操作記錄對工單文本構(gòu)建文本分類模型,根據(jù)文本描述不同預(yù)測可能的工單操作,并給出置信度,如圖3所示。
圖3 工單分析知識圖譜在工單處理的應(yīng)用示例Fig.3 Application of work-order analysis knowledge graph in work-order processing
該項目實施以來,重點關(guān)注了業(yè)務(wù)運營執(zhí)行中的客戶滿意度,先進管理手段的實施使安全風(fēng)險、故障、異常、投訴等情況出現(xiàn)的頻率大幅降低。通過智能服務(wù)輔助能力對客戶進行精細化服務(wù)大幅提升了通信行業(yè)內(nèi)的市場份額、客戶滿意度和客戶保有率,服務(wù)能力提升也避免了客戶離網(wǎng)。
通過AI和大數(shù)據(jù)分析的工單智能處理可滿足大部分工單處理服務(wù)請求,單個客戶服務(wù)時長縮短為之前的10%,系統(tǒng)平均在10s內(nèi)能準(zhǔn)確定位客戶需求,并完成答案反饋,通過迅速、準(zhǔn)確匹配客戶問題將用戶問題匹配率提升到目前的 87.2%。服務(wù)效率極高,問題解決率達到98%,客戶滿意度上升到96%,客戶感知良好。
在認知智能時代,機器閱讀理解引領(lǐng)了自然語言理解的研究,以知識圖譜技術(shù)打造了面向運營商運維領(lǐng)域的機器閱讀理解系統(tǒng),將其陸續(xù)拓展到服務(wù)工作中各個領(lǐng)域和場景,并積累了體系化的技術(shù)方案與業(yè)務(wù)實踐,使得機器閱讀理解技術(shù)也從最初的單一模型成長為圍繞著公司運維、運營、投訴處理全生命周期管理的解決方案。通過引入 BERT預(yù)訓(xùn)練模型和Dureader模型,并基于 B域運維標(biāo)注數(shù)據(jù)進行個性化微調(diào),形成了個性化機器閱讀引擎;通過對接幫助臺和工單系統(tǒng)使客服系統(tǒng)在業(yè)務(wù)規(guī)則、需求規(guī)則和運維管理中具備了對非結(jié)構(gòu)化文章的閱讀和問答能力;通過引入需求管理平臺中的需求規(guī)格說明書文檔和OA系統(tǒng)的業(yè)務(wù)管理文檔,在 B域運維、投訴、服務(wù)等多個業(yè)務(wù)領(lǐng)域落地了機器閱讀技術(shù),重點解決了機器閱讀在大規(guī)模業(yè)務(wù)應(yīng)用中碰到的難題,包括百萬級規(guī)模的多文檔、長文檔、多語言、多模態(tài)、多輪次等問題,并逐漸完成了領(lǐng)域數(shù)據(jù)、算法模型、解決方案的沉淀。工單分析知識圖譜和機器閱讀理解結(jié)合的分析引擎可以實現(xiàn)面向工單系統(tǒng)的業(yè)務(wù)知識推送,自動從歷史知識中閱讀核心語義,并輔助工單處理人員進行快捷問題的處理與回復(fù)。
本文開發(fā)了一套基于機器閱讀理解技術(shù)的工單分析知識圖譜系統(tǒng),從場景化應(yīng)用出發(fā),服務(wù)于企業(yè)工單一線提單人員、工單處理人員和工單分析人員。通過系統(tǒng)實現(xiàn)了工單的智能分析與自動應(yīng)答能力,解決了一線營業(yè)人員無法快速獲取工單處理方案的問題,在減少一線營業(yè)人員的提單量與咨詢量的同時也降低了運維人員對同類問題的人力成本投入,有效提升了內(nèi)部用戶的服務(wù)感知。