梅巧玲,王思宇,馬 杰
(中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081)
隨著人工智能及機(jī)器學(xué)習(xí)等技術(shù)的不斷進(jìn)步,智能應(yīng)答和智能推送技術(shù)及系統(tǒng)日臻成熟,達(dá)到了商用的水平。微軟、阿里巴巴、騰訊、移動(dòng)、小i、蘋果、谷歌等國(guó)內(nèi)外的公司都對(duì)該領(lǐng)域進(jìn)行了深入的研究,發(fā)展了自己的產(chǎn)品線,逐步向個(gè)人助理方向演進(jìn)[1-3]。中國(guó)高鐵正處于一個(gè)發(fā)展關(guān)鍵期,隨著高速鐵路“四縱四橫”規(guī)劃基本實(shí)現(xiàn),高速鐵路的發(fā)展影響并改變著人們的生活節(jié)奏和出行方式,廣大旅客對(duì)鐵路業(yè)務(wù)咨詢的需求也日益增長(zhǎng)。
目前,鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)(簡(jiǎn)稱:12306)客服熱線客服人員1 232人,日均服務(wù)量7.25萬(wàn)人次,節(jié)假日日均服務(wù)量8.9萬(wàn)人次,寒暑假和節(jié)假日服務(wù)需求突增。隨著客票業(yè)務(wù)種類的增多,客服工作遇到了很多問(wèn)題,比如客服人員與服務(wù)需求嚴(yán)重失衡,熱線一對(duì)一服務(wù)效率低,常見(jiàn)性問(wèn)題占比大,人力耗費(fèi)過(guò)多,制度類變更需及時(shí)讓全體客服人員重新學(xué)習(xí),整理回復(fù)模板,確??头藛T回復(fù)口徑一致,回復(fù)模板、規(guī)章制度檢索效率低等。微信公眾號(hào)和小程序雖然提供了部分自動(dòng)應(yīng)答的功能,但只能解決少量的咨詢問(wèn)題。鐵路12306線上智能客服系統(tǒng)的引入可以顯著增加旅客服務(wù)的承載量,輔助客服人員快速準(zhǔn)確地處理應(yīng)答,在提高客服人員并發(fā)處理能力的同時(shí)替代部分客服人員,減輕人工客服的壓力,為旅客提供更優(yōu)質(zhì)、更完善的體驗(yàn)和個(gè)性化服務(wù)。
隨著信息系統(tǒng)智能化水平的不斷提高,以及傳感技術(shù)、智能技術(shù)、網(wǎng)絡(luò)技術(shù)和云計(jì)算技術(shù)的持續(xù)突破,智能客服系統(tǒng)逐漸興起。在應(yīng)用場(chǎng)景、應(yīng)用模式方面更為多元便捷,已成為智能時(shí)代客服發(fā)展的新趨勢(shì)。鐵路12306線上智能客服系統(tǒng)較傳統(tǒng)的客服系統(tǒng)而言,具有更為靈活的智能化特征和服務(wù)特性,能夠?qū)崿F(xiàn)感知、決策、執(zhí)行等系列功能,是一種新型的智能信息系統(tǒng)。該系統(tǒng)的架構(gòu)層級(jí)主要分為接入層、應(yīng)用層和數(shù)據(jù)層3部分,如圖1所示。
圖1 系統(tǒng)架構(gòu)圖
接入層主要包括基礎(chǔ)構(gòu)件和接入管理2部分:基礎(chǔ)構(gòu)件主要由語(yǔ)義識(shí)別引擎和需求預(yù)測(cè)引擎組成;接入管理的作用是對(duì)請(qǐng)求進(jìn)行分類、排隊(duì),并根據(jù)當(dāng)前的系統(tǒng)情況進(jìn)行合理請(qǐng)求分發(fā),主要包括智能排隊(duì)、分發(fā)策略和負(fù)載均衡3個(gè)子模塊。
應(yīng)用層主要包括后臺(tái)管理和智能客服應(yīng)用2部分:后臺(tái)管理包括知識(shí)庫(kù)管理、數(shù)據(jù)采集及分析和問(wèn)題庫(kù)管理;智能客服應(yīng)用包含客服機(jī)器人、定制服務(wù)、智能規(guī)則引擎、營(yíng)銷推送、需求預(yù)測(cè)和語(yǔ)音語(yǔ)義識(shí)別等子模塊,各子模塊的具體功能如下。
(1)客服機(jī)器人:通過(guò)搭建知識(shí)庫(kù),形成智能問(wèn)答系統(tǒng),解決用戶的問(wèn)題。系統(tǒng)支持文字和語(yǔ)音信息類型,滿足不同用戶的需求[4-5]。
(2)定制服務(wù):收集用戶需求(如感興趣的主題、喜好等),根據(jù)歷史記錄數(shù)據(jù)深入分析挖掘,為用戶提供全方位、全行程定制化服務(wù)。
(3)智能規(guī)則引擎:常見(jiàn)問(wèn)題可以在線申請(qǐng)反饋,處理問(wèn)題。后臺(tái)引擎對(duì)出現(xiàn)的問(wèn)題進(jìn)行歸類統(tǒng)計(jì)分析,輔助客票系統(tǒng)升級(jí)優(yōu)化問(wèn)題答案。
(4)營(yíng)銷推送:根據(jù)旅客行程信息,給旅客推送相關(guān)城市的天氣、酒店、熱點(diǎn)新聞、景點(diǎn)、當(dāng)?shù)靥禺a(chǎn)等信息。
(5)需求預(yù)測(cè):通過(guò)對(duì)歷史出行記錄、最新搜索目的地等信息的大數(shù)據(jù)分析,結(jié)合地域、年齡、出行成員等信息,分析用戶的出行需求,實(shí)現(xiàn)主動(dòng)服務(wù)。
(6)語(yǔ)音語(yǔ)義識(shí)別:支持對(duì)語(yǔ)音語(yǔ)義的高準(zhǔn)確率識(shí)別,從問(wèn)題庫(kù)中快速匹配出相應(yīng)的問(wèn)題。
數(shù)據(jù)層包含知識(shí)庫(kù)、問(wèn)題庫(kù)和知識(shí)索引3部分,同時(shí)提供與客票業(yè)務(wù)系統(tǒng)、外部系統(tǒng)的數(shù)據(jù)接口。
知識(shí)庫(kù)和問(wèn)題庫(kù)涵蓋全路、全渠道的多媒體應(yīng)答,包含規(guī)章制度、通告等知識(shí),基于預(yù)采編的知識(shí)數(shù)據(jù),自動(dòng)生成語(yǔ)義標(biāo)簽,可快速對(duì)知識(shí)進(jìn)行結(jié)構(gòu)化組織。數(shù)據(jù)層和客票業(yè)務(wù)系統(tǒng)交互的數(shù)據(jù)包括列車基礎(chǔ)數(shù)據(jù)和旅客出行軌跡等;與外部系統(tǒng)交互的數(shù)據(jù)包括天氣、美食、旅游、航空等。
鐵路12306線上智能客服系統(tǒng)以自然語(yǔ)言處理技術(shù)為基礎(chǔ),通過(guò)多媒體網(wǎng)關(guān)統(tǒng)一接入電話、郵件、短信、微信、支付寶等多種渠道,處理語(yǔ)音、文本、視頻、圖片等信息。多媒體網(wǎng)關(guān)通過(guò)媒體適配器屏蔽和卸載各種接口、加密串、協(xié)議等,并進(jìn)行信息過(guò)濾篩選和預(yù)處理,統(tǒng)一傳送到集中的排隊(duì)服務(wù)器中;同時(shí),與后臺(tái)機(jī)器人引擎相結(jié)合,通過(guò)擬人化的方式與用戶進(jìn)行實(shí)時(shí)交互,為用戶提供智能化的應(yīng)答服務(wù)。
系統(tǒng)以用戶屬性數(shù)據(jù)、歷史提問(wèn)內(nèi)容、業(yè)務(wù)數(shù)據(jù)為基礎(chǔ),自動(dòng)采用結(jié)構(gòu)化與非結(jié)構(gòu)化分析方法。用戶在各渠道(網(wǎng)站、微信、手機(jī)APP、支付寶)獲取在線服務(wù)時(shí),系統(tǒng)自動(dòng)對(duì)接各業(yè)務(wù)接口,發(fā)現(xiàn)用戶關(guān)注點(diǎn),依據(jù)條件觸發(fā)營(yíng)銷推送,主動(dòng)向用戶推送營(yíng)銷信息,如:天氣、景點(diǎn)、土特產(chǎn)、列車最新正晚點(diǎn)信息、列車停運(yùn)通知、失物招領(lǐng)、突發(fā)事件公告等,讓旅客第一時(shí)間了解最新資訊,獲取更好的服務(wù)。
該功能模塊對(duì)用戶交互數(shù)據(jù)進(jìn)行業(yè)務(wù)分類、聚類、熱詞統(tǒng)計(jì)并提供報(bào)表,利用語(yǔ)義解析功能識(shí)別用戶意圖,將關(guān)鍵信息傳遞給業(yè)務(wù)系統(tǒng),用于支撐完善知識(shí)庫(kù),對(duì)客票系統(tǒng)的業(yè)務(wù)優(yōu)化具有參考意義。
智能應(yīng)答最早應(yīng)用于電話的語(yǔ)音、短信增值業(yè)務(wù),后來(lái)發(fā)展到在線客服接入網(wǎng)站等?,F(xiàn)在無(wú)論是網(wǎng)站還是移動(dòng)APP,例如微信、支付寶等各類有服務(wù)咨詢功能的應(yīng)用,均采用統(tǒng)一的在線客服智能應(yīng)答服務(wù)引擎。智能應(yīng)答服務(wù)引擎提供多種形式的接口,例如,SDK、API、嵌入頁(yè)面等,并根據(jù)不同的渠道進(jìn)行適配改造,實(shí)現(xiàn)接入。
智能應(yīng)答流程有3個(gè)環(huán)節(jié):開(kāi)始環(huán)節(jié),包括觸發(fā)場(chǎng)景條件、場(chǎng)景開(kāi)始提取信息規(guī)則;動(dòng)態(tài)環(huán)節(jié),包括進(jìn)入環(huán)節(jié)條件、如何詢問(wèn)用戶、環(huán)節(jié)內(nèi)提取信息規(guī)則;結(jié)束環(huán)節(jié),包括退出場(chǎng)景條件、成功時(shí)系統(tǒng)動(dòng)作、失敗時(shí)系統(tǒng)動(dòng)作。系統(tǒng)對(duì)已有的大量數(shù)據(jù)進(jìn)行特征提取,分析得出表示具有情感傾向性的特征詞,再通過(guò)機(jī)器學(xué)習(xí)方法,對(duì)大量數(shù)據(jù)進(jìn)行建模,判斷當(dāng)前用戶的情感傾向性,再對(duì)用戶進(jìn)行針對(duì)性的回答,從而實(shí)現(xiàn)智能應(yīng)答。系統(tǒng)還提供驗(yàn)證集回歸測(cè)試機(jī)制,可以直觀體現(xiàn)系統(tǒng)升級(jí)優(yōu)化對(duì)應(yīng)答的影響情況。該功能需要事先定義好由模擬問(wèn)題和目標(biāo)知識(shí)組成的驗(yàn)證集,在系統(tǒng)版本升級(jí)和知識(shí)變化后或定期巡查過(guò)程中,由系統(tǒng)自動(dòng)模擬測(cè)試,得到準(zhǔn)確率優(yōu)化建議,這樣可以不斷優(yōu)化智能應(yīng)答的結(jié)果。
鐵路12306線上智能客服系統(tǒng)是12306與用戶之間重要的溝通渠道,通過(guò)信息交流完成業(yè)務(wù)服務(wù)。自然語(yǔ)言信息的非結(jié)構(gòu)化特點(diǎn)造成大量問(wèn)題不能及時(shí)反饋處理,不能有效提高用戶體驗(yàn)度,要解決這一問(wèn)題,需要實(shí)現(xiàn)對(duì)語(yǔ)言信息的智能化和自動(dòng)化處理,將原來(lái)主要由人工完成的工作交給系統(tǒng)自動(dòng)完成,人工只需要進(jìn)行輔助處理,這樣既能減少人力資源的投入,又能提高客服處理效率和智能化水平,改善客戶體驗(yàn)。
語(yǔ)義識(shí)別技術(shù)可以分析網(wǎng)頁(yè)、文件、社交媒體中的大量數(shù)據(jù),通過(guò)接口技術(shù)應(yīng)用于機(jī)器人、智能家居、智能語(yǔ)音交互等領(lǐng)域,涉及醫(yī)療、教育、金融、交通等行業(yè)[6-7]。在鐵路12306線上智能客服系統(tǒng)中,語(yǔ)義識(shí)別作為接入層的重要組成部分,承擔(dān)著與用戶交互的工作。
語(yǔ)義識(shí)別可以分為自然語(yǔ)言處理(NLP,Natural Language Processing)技術(shù)層和底層數(shù)據(jù)層。NLP技術(shù)層主要分為詞法句法分析和語(yǔ)義分析2部分,用于從給定數(shù)據(jù)中抽取重要信息。底層數(shù)據(jù)層是語(yǔ)義識(shí)別算法模型的基礎(chǔ),包括詞典、數(shù)據(jù)集、語(yǔ)料庫(kù)、知識(shí)圖譜以及外部世界常識(shí)性知識(shí)等。本系統(tǒng)利用知識(shí)庫(kù)和問(wèn)題庫(kù)提供底層數(shù)據(jù),建立語(yǔ)義識(shí)別算法模型[8-9]。
準(zhǔn)確地掌握旅客出行特征是獲取鐵路出行需求,優(yōu)化鐵路運(yùn)行圖,構(gòu)建市場(chǎng)化鐵路運(yùn)營(yíng)體系的基礎(chǔ),有助于規(guī)劃管理部門制定科學(xué)決策。同時(shí)隨著鐵路交通網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大和延伸,數(shù)據(jù)采集的深度和廣度也不斷增加。鐵路系統(tǒng)在運(yùn)營(yíng)過(guò)程中積累了海量的數(shù)據(jù),這為提取旅客的出行鏈和出行規(guī)律奠定了數(shù)據(jù)基礎(chǔ),為進(jìn)行旅客出行特征分析提供了新的思路。大數(shù)據(jù)分析技術(shù)在數(shù)據(jù)量大、數(shù)據(jù)迭代快的場(chǎng)景下,對(duì)鐵路系統(tǒng)在運(yùn)營(yíng)過(guò)程中積累的海量數(shù)據(jù)進(jìn)行管理和分析,充分挖掘數(shù)據(jù)潛藏的價(jià)值。
知識(shí)圖譜又稱為科學(xué)知識(shí)圖譜,主要以知識(shí)抽取、知識(shí)表示、知識(shí)融合、知識(shí)推理技術(shù)為基礎(chǔ)。知識(shí)圖譜是知識(shí)的元素組合和邏輯聯(lián)系結(jié)構(gòu),每一個(gè)知識(shí)圖譜包括對(duì)象、條件、屬性、參數(shù)4個(gè)元素。其中,對(duì)象與屬性可以決定一個(gè)知識(shí)圖譜的結(jié)構(gòu),條件和參數(shù)可決定一個(gè)知識(shí)圖譜的實(shí)例化。一個(gè)知識(shí)圖譜可以有多個(gè)實(shí)例化結(jié)果,實(shí)例化結(jié)果與傳統(tǒng)知識(shí)庫(kù)的知識(shí)概念相似,每個(gè)實(shí)例化結(jié)果對(duì)應(yīng)一個(gè)標(biāo)準(zhǔn)答案,這就將各個(gè)實(shí)體進(jìn)行了關(guān)聯(lián)。
傳統(tǒng)的客服系統(tǒng)以中文分詞和關(guān)鍵詞為核心,通過(guò)語(yǔ)句相似度計(jì)算來(lái)實(shí)現(xiàn)自動(dòng)問(wèn)答,這種系統(tǒng)雖然在客戶服務(wù)中起到不錯(cuò)的效果,但是存在準(zhǔn)確率低、效率低、維護(hù)難等問(wèn)題。在大數(shù)據(jù)、機(jī)器學(xué)習(xí)等新技術(shù)的影響下,鐵路12306線上智能客服系統(tǒng)利用知識(shí)圖譜技術(shù)構(gòu)建一個(gè)龐大而精細(xì)的知識(shí)庫(kù),為每條知識(shí)設(shè)計(jì)足夠多的相似問(wèn)法,并完成關(guān)鍵詞重要性標(biāo)記,通過(guò)對(duì)海量數(shù)據(jù)的分析、標(biāo)記,不斷完善、優(yōu)化知識(shí)庫(kù),使其成為智能客服的最強(qiáng)大腦。
鐵路12306線上智能客服系統(tǒng)的智能搜索技術(shù)通過(guò)使用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)對(duì)列車運(yùn)行數(shù)據(jù)、鐵路出行數(shù)據(jù)、用戶個(gè)性化數(shù)據(jù)進(jìn)行綜合分析建模,針對(duì)每一名旅客分別建立個(gè)性化的數(shù)據(jù)模型。系統(tǒng)在接收到旅客提出的問(wèn)題時(shí),會(huì)結(jié)合問(wèn)題庫(kù)中當(dāng)前熱點(diǎn)問(wèn)題,智能分析旅客的真實(shí)意圖,返回個(gè)性化的智能搜索結(jié)果,提高返回結(jié)果的相關(guān)性和正確性。智能搜索實(shí)現(xiàn)的具體流程如下:
(1)將鐵路旅客多維特征(如年齡、出行規(guī)律、地域)進(jìn)行抽取和統(tǒng)計(jì);
(2)對(duì)出行數(shù)據(jù)進(jìn)行聚類分析,按出行特征將旅客分為不同類型的旅客群體,屬于一個(gè)類型的用戶群體具有相似的屬性,對(duì)鐵路出行有相似的關(guān)注主題;
(3)系統(tǒng)分析計(jì)算各旅客群體對(duì)每個(gè)主題的關(guān)注度,獲得用戶群體和各信息主題相關(guān)性;
(4)根據(jù)問(wèn)題類別、參與人數(shù)對(duì)當(dāng)前旅客關(guān)注的熱點(diǎn)進(jìn)行動(dòng)態(tài)計(jì)算,提取熱度較高的主題形成熱點(diǎn)主題,利用關(guān)聯(lián)規(guī)則挖掘,將熱點(diǎn)主題相關(guān)的熱點(diǎn)問(wèn)題提取出來(lái),顯著提高系統(tǒng)準(zhǔn)確率。
本文結(jié)合當(dāng)前鐵路客票服務(wù)的現(xiàn)狀,提出了鐵路12306線上智能客服系統(tǒng)方案,系統(tǒng)以自然語(yǔ)言處理技術(shù)為基礎(chǔ),接入方式由單一接入向集電話、短信、微信、支付寶等多種方式接入轉(zhuǎn)變,搭建了具有多方式接入、多渠道協(xié)同、多方位智能化應(yīng)用的智能客服系統(tǒng)??蛻裟茈S時(shí)隨地、便捷快速地獲得豐富的產(chǎn)品信息和全面的業(yè)務(wù)指導(dǎo),真正做到用用戶喜歡的方式為用戶進(jìn)行服務(wù)。鐵路12306線上智能客服系統(tǒng)方案的研究滿足了移動(dòng)互聯(lián)網(wǎng)環(huán)境下用戶和企業(yè)變革的需求,統(tǒng)一了服務(wù)內(nèi)容和服務(wù)流程,提高了客服人員工作效率,為后續(xù)系統(tǒng)功能的進(jìn)一步深化研究奠定了基礎(chǔ)。