[肖軍 陳震原]
在運(yùn)營商服務(wù)客戶的過程中,有許多來自客戶的需求會最終形成各類工單,再由專業(yè)的服務(wù)人員進(jìn)行施工或者受理,有些是客戶對業(yè)務(wù)的咨詢和投訴,有些是客戶購買寬帶服務(wù)后的施工或維護(hù)業(yè)務(wù)。在更為廣泛的客戶服務(wù)業(yè),無論是電力、銀行、煤氣還是政務(wù),都有著各式各樣的服務(wù)型工單,例如在12345 政務(wù)服務(wù)熱線,每天都有群眾來電或留言,形成各種業(yè)務(wù)工單。這些工單由于需求內(nèi)容不同,客戶標(biāo)簽不同,需要由不同的單位,不同的個體來提供服務(wù)。讓合適的人來服務(wù)是確保服務(wù)滿意度的第一步。否則,由于派錯了人,由于不專業(yè),帶來客戶的二次服務(wù)會大大降低客戶的服務(wù)滿意度。因此派單準(zhǔn)確率是確保服務(wù)滿意度的第一道關(guān)。
在傳統(tǒng)的派單流程中,客服人員接到客戶的需求后,一般都是由人工來判斷、審核、分析后再做出決策,將這個工單流轉(zhuǎn)到下一個處理環(huán)節(jié)。由于人工操作,需要投入大量的人員進(jìn)行調(diào)度安排,這也會逐年增加企業(yè)服務(wù)的開支。另外,有些業(yè)務(wù)例如政務(wù)熱線服務(wù)需要掌握的調(diào)度規(guī)則非常復(fù)雜,處理的去向單位非常多,有時候會超出座席人員的學(xué)習(xí)和處理能力,這也會導(dǎo)致座席人員的學(xué)習(xí)成本非常高,最終也會導(dǎo)致派單準(zhǔn)確率和效率降低,客服滿意度下降。
在大數(shù)據(jù)技術(shù)和AI 賦能的數(shù)字化改革浪潮中,如何用AI 技術(shù)形成智能派單,建立派單模型,人工輔助AI 訓(xùn)練,逐步替代人開展工單的智能調(diào)度,將是客服領(lǐng)域派單調(diào)度場景的未來趨勢。這需要我們根據(jù)大量的歷史數(shù)據(jù),找出關(guān)鍵特征項(xiàng),利用有效的決策樹和隨機(jī)森林等算法,再結(jié)合各種場景實(shí)際的規(guī)則,綜合實(shí)現(xiàn)智能派單和智能調(diào)度功能。
在派單調(diào)度場景中,有一些是可以基于規(guī)則進(jìn)行派單的,只要根據(jù)工單中出現(xiàn)的特定關(guān)鍵詞組合,或者一些條件參數(shù)計算后符合某些業(yè)務(wù)規(guī)則,就可以精準(zhǔn)派送到相關(guān)的處理人員或單位。這種情況可以基于場景進(jìn)行規(guī)則梳理,建立和開發(fā)規(guī)則引擎,就可以實(shí)現(xiàn)派單的自動化了。當(dāng)然,實(shí)際工作中還有一些工單就比較模糊了,往往依賴人的判斷,去分析工單以及基于該工單關(guān)聯(lián)的其它系統(tǒng)提供的更多特征項(xiàng)進(jìn)行判斷分析,再決定派往何處。那這個思考的過程就比較個性化了。這種情況我們就需要針對歷史數(shù)據(jù)進(jìn)行建模訓(xùn)練。這類算法在智能派單應(yīng)用中會更好地擬合真實(shí)場景,彌補(bǔ)規(guī)則引擎的不足。
2.1.1 什么是規(guī)則引擎
顧名思義,規(guī)則引擎[1]是針對業(yè)務(wù)規(guī)則的一個管理系統(tǒng),實(shí)際生產(chǎn)實(shí)踐中,由于各種場景對應(yīng)的業(yè)務(wù)規(guī)則很復(fù)雜,如果程序定制開發(fā),那么代碼復(fù)雜度太高,不便于閱讀,也不便于管理和修改。因此,從業(yè)務(wù)和開發(fā)的角度來看,都需要建立一個業(yè)務(wù)和規(guī)則管理系統(tǒng)代碼隔離的機(jī)制[2],這就是規(guī)則引擎引入的原因,規(guī)則引擎原理結(jié)構(gòu)如圖1所示。
圖1 規(guī)則引擎
2.1.2 如何建立規(guī)則引擎
如何建規(guī)則引擎[3]有許多不同的方法。一般來說,步驟如下:
(1)設(shè)計規(guī)則。這一步包括定義規(guī)則的格式、語法和結(jié)構(gòu)。
(2)定義數(shù)據(jù)模型。規(guī)則引擎需要知道你的數(shù)據(jù)模型是什么樣的,才能夠處理數(shù)據(jù)。
(3)編寫規(guī)則代碼。
(4)編寫測試用例。為了確保規(guī)則引擎正常工作,需要編寫測試用例來測試它。
(5)運(yùn)行規(guī)則引擎。使用測試用例運(yùn)行規(guī)則引擎,并根據(jù)測試結(jié)果調(diào)整規(guī)則代碼。
2.2.1 什么是決策樹
決策樹(Decision Tree)[4]是在已知各種情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹來尋找最終最優(yōu)決策的一種預(yù)測模型[5],一般決策樹是if-else 邏輯。
2.2.2 如何構(gòu)建決策樹
決策樹的構(gòu)建包括兩個關(guān)鍵部分:樣本和特征[6]。
樣本:對于給定的總體訓(xùn)練集T,T 中包含N 個樣本。在構(gòu)建決策樹時,我們使用有放回地隨機(jī)選擇N 個樣本進(jìn)行訓(xùn)練。
特征:假設(shè)訓(xùn)練集中的特征總數(shù)為d,在構(gòu)建決策樹的過程中,每次僅從中選擇k 個特征(其中k<d)。
決策樹的構(gòu)建過程:
第一步:從總體訓(xùn)練集T 中隨機(jī)選擇N 個樣本,作為決策樹的根節(jié)點(diǎn)[7]。
第二步:對于每個需要分裂的節(jié)點(diǎn),在節(jié)點(diǎn)的M 個屬性中隨機(jī)選擇m 個屬性(滿足條件m<<M)。然后,使用某種策略(例如信息增益)從這m 個屬性中選擇最佳屬性,作為該節(jié)點(diǎn)的分裂屬性[8]。
第三步:重復(fù)進(jìn)行步驟2,直到無法再進(jìn)行分裂為止。在整個決策樹的構(gòu)建過程中,沒有進(jìn)行剪枝[9]操作。
2.2.3 隨機(jī)森林
將多個決策樹結(jié)合在一起,每次數(shù)據(jù)集是隨機(jī)有放回的選出,同時隨機(jī)選出部分特征作為輸入,從而構(gòu)成了隨機(jī)森林[10],如圖2 所示。
圖2 隨機(jī)森林算法
基于以上技術(shù),以下以廣州電信客服部智能派單功能為實(shí)踐應(yīng)用案例:
在客戶通過10000 號或其它渠道投訴到電信后,有些復(fù)雜的投訴問題需要本地網(wǎng)去解決,第一步就涉及到投訴工單的派單問題,因?yàn)樯婕暗降耐对V工單業(yè)務(wù)比較復(fù)雜,有些是資費(fèi)問題,有些是一線營銷人員營銷解釋口徑問題,有些屬于創(chuàng)新業(yè)務(wù)問題,那么就涉及到這些工單該如何派發(fā)到對應(yīng)的人去解決。在投訴處理高質(zhì)量服務(wù)的要求下,各地運(yùn)營商都需要降低重復(fù)投訴率,對重要客戶提供更高等級的客戶服務(wù)。這就要求對原有的派單提出了新的要求,讓專家來處理高等級客戶和重復(fù)投訴客戶,降低客戶越級投訴風(fēng)險,讓合適的人做合適的事,智能派單的功能需求就至關(guān)重要。資源調(diào)度的合理性也決定了整體客戶服務(wù)質(zhì)量的起點(diǎn)。
在傳統(tǒng)的派單場景下,以廣州電信為例,座席人員平均5 分鐘可以處理一次派單任務(wù),座席人員需要根據(jù)來單的基本信息,以及客戶留言信息,再查詢電信CRM、BSS等各類業(yè)務(wù)支撐系統(tǒng),全面分析后再做出派單去向。針對每天數(shù)千工單任務(wù),需要大量派單人員人工決策并派單,效率低,耗費(fèi)人工較多,因此,建立基于規(guī)則和AI 算法的智能派單是客戶投訴處理服務(wù)的一個基礎(chǔ)場景功能。
3.2.1 技術(shù)路線
我們將工單按難易情況、重要情況、敏感情況等考慮因素將工單分成了危險度、重復(fù)度、星級度、難易度、敏感度五個維度,每個維度設(shè)置其權(quán)值[11],如圖3 所示。同時將處理坐席按能力因素分成了專家座席、高時效座席、中時效座席、低時效座席及新人座席,每個座席維度設(shè)置其權(quán)值,如圖4 所示。再對實(shí)時生產(chǎn)因素,例如:座席當(dāng)天出勤情況、當(dāng)天工單超時情況及工單二次釋放情況等多個因素進(jìn)行多重計算決策[12],應(yīng)用相應(yīng)制定的溢出法則、爆單法則等異常法則[13]對非正常進(jìn)行決策,從而構(gòu)建出智能派單規(guī)則引擎,如圖5 所示。
圖3 工單數(shù)據(jù)集
圖4 座席數(shù)據(jù)集
圖5 規(guī)則引擎派單原理
我們將工單的危險度、重復(fù)度、星級度、難易度、敏感度五個維度組成工單數(shù)據(jù)集,將處理坐席專家座席、高時效座席、中時效座席、低時效座席及新人座席組成座席數(shù)據(jù)集,及將生產(chǎn)實(shí)時因素,例如:座席當(dāng)天出勤情況、當(dāng)天工單超時情況等組成生產(chǎn)數(shù)據(jù)集[14]。將工單數(shù)據(jù)集、座席數(shù)據(jù)集及生產(chǎn)數(shù)據(jù)集輸入到?jīng)Q策樹與隨機(jī)森林算法架構(gòu)中,經(jīng)過決策森林的計算,從而得出理想的派單路徑,智能派單的功能技術(shù)路線如圖6 所示。
圖6 技術(shù)路線
3.2.2 模型構(gòu)建
本文所研究的客服智能派單模型基于隨機(jī)森林算法來構(gòu)建,是因?yàn)殡S機(jī)森林算法模型一種集成算法(Ensemble Learning),它通過組合多個弱分類器,最終結(jié)果通過投票或取均值,使得整體模型的結(jié)果具有較高的精確度和泛化性能。而其可以取得不錯成績,主要?dú)w功于“隨機(jī)”和“森林”,一個使它具有抗過擬合能力,一個使它更加精準(zhǔn)。
(1)數(shù)據(jù)集:我們通過全量提取最近半年人工派單歷史記錄共558 720 宗,作為原始數(shù)據(jù)集。
(2)生成訓(xùn)練樣本:在原始數(shù)據(jù)集上通過有放回抽樣重新選出30 個新數(shù)據(jù)集來訓(xùn)練分類器,每組訓(xùn)練樣本數(shù)量為18 624 宗。
(3)分類器構(gòu)建[15]:我們所構(gòu)建的模型中分類器使用的是CART 樹,CART 樹又稱分類回歸樹。當(dāng)數(shù)據(jù)集的因變量為連續(xù)性數(shù)值時,該樹算法就是一個回歸樹,可以用葉節(jié)點(diǎn)觀察的均值作為預(yù)測值;當(dāng)數(shù)據(jù)集的因變量為離散型數(shù)值時,該樹算法就是一個分類樹,可以很好的解決分類問題。
(4)特征選擇[16]:我們對工單數(shù)據(jù)信息、座席數(shù)據(jù)信息及生產(chǎn)數(shù)據(jù)信息使用基尼系數(shù)進(jìn)行特征選擇。基尼系數(shù)的選擇的標(biāo)準(zhǔn)就是每個子節(jié)點(diǎn)達(dá)到最高的純度,即落在子節(jié)點(diǎn)中的所有觀察都屬于同一個分類,此時基尼系數(shù)最小,純度最高,不確定度最小。結(jié)合我們所使用的CART樹分類器,特征選擇基尼系數(shù)公式如下:
(5)最終模型使用訓(xùn)練出來的分類器的集合來對新樣本進(jìn)行分類,然后用多數(shù)投票或者對輸出求均值的方法統(tǒng)計所有分類器的分類結(jié)果,結(jié)果最高的類別即為最終標(biāo)簽。我們所構(gòu)建的模型結(jié)構(gòu)如圖7 所示。
圖7 模型結(jié)構(gòu)
我們所構(gòu)建的模型具有抗過擬合的特點(diǎn),可以有效降低bias,并能夠降低variance。首先,每個樹選取使用的特征時,都是從全部m 個特征中隨機(jī)產(chǎn)生的,本身已經(jīng)降低了過擬合的風(fēng)險和趨勢。模型不會被特定的特征值或者特征組合所決定,隨機(jī)性的增加,將控制模型的擬合能力不會無限提高。其次,與決策樹不同,模型對決策樹的建立做了改進(jìn),對于普通的決策樹,我們會在節(jié)點(diǎn)上所有的m 個樣本特征中選擇一個最優(yōu)的特征來做決策樹的左右子樹劃分。但是模型的每個樹,其實(shí)選用的特征是一部分,在這些少量特征中,選擇一個最優(yōu)的特征來做決策樹的左右子樹劃分,將隨機(jī)性的效果擴(kuò)大,進(jìn)一步增強(qiáng)了模型的泛化能力。
3.2.3 模型實(shí)現(xiàn)
本文所研究的客服智能派單模型在代碼實(shí)現(xiàn)過程中我們基于sklearn 的python 機(jī)器學(xué)習(xí)代碼框架來實(shí)現(xiàn),關(guān)鍵代碼如下所示。
基中關(guān)鍵參數(shù)說明如下:
n_estimators=100,隨機(jī)森林中決策樹的數(shù)量,取值為100;
criterion='gini',純度衡量指標(biāo),取值為基尼系數(shù);
bootstrap=True,控制抽樣技術(shù)的參數(shù),取值為True。采用有放回的隨機(jī)抽樣數(shù)據(jù)來形成訓(xùn)練數(shù)據(jù);
oob_score=True,是否采用袋外樣本來評估模型的好壞,True 代表是,袋外樣本誤差是測試數(shù)據(jù)集誤差的無偏估計;
n_jobs=5,并行任務(wù)數(shù),取值為5,這個在集成算法中非常重要,可以并行從而提高性能;
random_state=10,隨機(jī)率,控制生成隨機(jī)森林的模式,隨機(jī)性越大,模型效果越好,我們?nèi)≈禐?0;
warm_start=False,熱啟動,取值為False,不使用上次調(diào)用該類的結(jié)果。
經(jīng)過半年的實(shí)踐和模型訓(xùn)練,從實(shí)踐結(jié)果來看,自從廣州電信客服部智能派單功能上線以來,機(jī)器人自動派單到座席日均約3 000 單,自動派單率達(dá)92.56%,12 位派單工作人員減少到3 位,大幅度節(jié)約了人工成本。剩下的三位主要是由監(jiān)督地訓(xùn)練模型,使得智能派單模型準(zhǔn)確率更高。而且由于工單與座席的能力相匹配而派單,座席績效也得到了提升,實(shí)現(xiàn)了合適的人做合適工單,能者多勞,多勞多得,讓客服生產(chǎn)更公平、更高效。實(shí)際廣州電信客服部智能派單界面如圖8 所示。
圖8 廣州電信客服部智能座席看板
智能派單在廣州電信客服領(lǐng)域的成功應(yīng)用,可以推廣到電信需要派單場景的各個領(lǐng)域,例如在電信裝維場景,可以根據(jù)裝維師傅的地址定位、網(wǎng)格劃分、自身能力信息等再結(jié)合客戶裝和維的需求信息、客戶的星級、客戶的投訴信息、以及客戶的地址信息等進(jìn)行匹配,利用規(guī)則引擎和決策樹隨機(jī)森林算法給出更為合理的智能調(diào)度引擎。一方面可以大量節(jié)約裝維輔助調(diào)度支撐人員,另一方面也可以大幅度提高裝維響應(yīng)效率,提升客戶服務(wù)感知。
站在更為廣義的角度分析,智能派單可以應(yīng)用在各種涉及到任務(wù)單派發(fā)的場景中,基于規(guī)則引擎和決策樹隨機(jī)森林算法的智能調(diào)度和派單,是企業(yè)數(shù)字化轉(zhuǎn)型的重要一環(huán)。從源頭上開始業(yè)務(wù)流程的數(shù)字化,可以確保工作任務(wù)的公開、公平、公正,更可以提高企業(yè)運(yùn)營效率。