金郁 張建坤 范海華 施衛(wèi)國 浙江省嘉興市公安局經(jīng)濟開發(fā)區(qū)(國際商務區(qū))分局
公安服務與群眾生活息息相關,隨著公安“放管服”改革持續(xù)深化,便民新舉措不斷落地落實,使得群眾滿意度不斷提升。便民服務的提升,不僅依賴機制的改革,更加依賴蓬勃發(fā)展的新技術(shù),正是新型技術(shù)的不斷引入,使得便民服務的革新存在新的可能。
人機對話技術(shù)是近年來人工智能技術(shù)的熱點之一,其可以讓機器理解人類語言并和人自由對話[1],這與公安便民服務的大量場景匹配度非常高。但是傳統(tǒng)人機對話平臺存在交互呆板和程式化問題,極度影響群眾使用體驗。
針對上述問題,本文利用新一代人機對話技術(shù),以突出的多輪對話能力、大規(guī)模預訓練對話模型帶來的快速冷啟動、低成本知識構(gòu)建、自訓練的語義模型等技術(shù)優(yōu)勢,借助在公安便民服務豐富場景下積累的領域經(jīng)驗和應用,創(chuàng)新探索新型智能便民服務模式,進一步提高為民辦事的成效力度,降低警務人員工作強度,為公安“放管服”改革的持續(xù)深化提供相關參考。
人機對話技術(shù)一直以來被認為是人工智能領域的核心挑戰(zhàn)。國內(nèi)外較多專家學者對此進行了相關深度研究。如XU J在2020年研究了開放領域中多回合對話策略的學習框架問題,LI R在2018年發(fā)表的論文中創(chuàng)新性采用人工標注構(gòu)建出真實的對話推薦數(shù)據(jù),使得人機對話系統(tǒng)可提供建議等[2]。然而遺憾的是,傳統(tǒng)的人機對話平臺大部分只能局限特定場景,很難適應復雜多變的公安便民服務需求??偨Y(jié)來說,傳統(tǒng)人機對話技術(shù)的技術(shù)難點主要集中在如下幾個方面:
要讓機器聽懂并理解人所說的話,那前提是機器要像人一樣預先具備大量的知識,這些知識也需要是結(jié)構(gòu)化的[3]。這里的結(jié)構(gòu)化知識主要包括兩類:以特定目標為中心的對話流程知識和知識圖譜。要構(gòu)建圍繞給定場景的較完備的對話邏輯流程(動態(tài)知識)預計需要花費1~2周的人力,構(gòu)建給定場景的Schema和知識圖譜(靜態(tài)知識)預計需要2周左右的人力,因此知識構(gòu)建的成本是非常高的。
機器人從啟動到符合上線標準需要進行多批次的優(yōu)化打磨,每一批次都需要收集真實情況下的對話數(shù)據(jù)、標注數(shù)據(jù)、訓練模型、調(diào)試模型、測試對話效果、分析問題背后的原因,然后再進行下一輪次的優(yōu)化,前后預計需要2~3月;類似的,知識圖譜問答效果迭代優(yōu)化需要2周。
機器人在成熟場景下由于有較多的真實對話數(shù)據(jù)可供加工和利用,對話體驗是可以不斷優(yōu)化的。但遷移到小樣本和新場景后的對話體驗就有非常明顯的效果下降。比如目前電商的在線機器人、快遞電話機器人等運用都不錯,但在公安便民服務小場景下,傳統(tǒng)的機器人會出現(xiàn)較差的對話體驗[4]。
鑒于上文所述技術(shù)難點,新一代人機對話技術(shù)平臺主要從如下三個層面進行突破:
(1)從知識層面,采用結(jié)構(gòu)化知識的半自動構(gòu)建技術(shù),降低知識構(gòu)建的成本;
(2)從對話模型層面,融入知識的預訓練對話模型,從而縮短機器人從啟動到符合上線標準的優(yōu)化周期;
(3)從對話引擎層面,采用具備拓展和增強對話能力的引擎,使其具備不斷學習演進能力。
新一代人機對話技術(shù)平臺技術(shù)框架的其核心主要是5層(如圖1所示):數(shù)據(jù)層、知識層、預訓練對話問答模型層、引擎層、平臺層。其中核心3層,分別為知識層提供可擴展性的知識圖譜構(gòu)建;預訓練對話問答模型層包括預訓練對話模型、預訓練圖譜問答模(KGBert)、預訓練表格問答模型(TableBert);引擎層包括Dialog Studio多輪對話引擎、KBQA圖譜問答引擎、TableQA表格問答引擎、FAQ問答引擎、MRC機器閱讀引擎。
國1 平臺技術(shù)架構(gòu)國
知識來源主要分為兩類,一類是人人對話日志,另一類是工作文檔。相對應的知識構(gòu)建也分兩個方面,一方面是基于人人對話日志的對話流進行構(gòu)建,從傳統(tǒng)的手工配置升級為自動挖掘意圖,從人工標注變成自動的挖掘和半自動標注;另一方面是基于文檔的知識圖譜構(gòu)建。文檔本身就具備一定的結(jié)構(gòu)化信息,做了結(jié)構(gòu)化后可以讓問答更加精準。圍繞基于文檔的知識圖譜構(gòu)建,筆者采用半結(jié)構(gòu)化長文檔的預訓練文檔模型、基于文檔的粗粒度三元組抽取、針對文本的細粒度三元組抽取,設計了一套可擴展性的知識圖譜構(gòu)建方案,如圖2所示。
圖2 可拓展性的知識圖滑構(gòu)建
(1)文檔預訓練模型,將文檔表示分為物理結(jié)構(gòu)、邏輯結(jié)構(gòu)和語義結(jié)構(gòu)三個層次,使用百萬級的無標文檔數(shù)據(jù),基于其文本語義、版面信息、視覺特征來構(gòu)建自監(jiān)督學習任務,使得模型能夠更好地理解文檔語義和結(jié)構(gòu)信息;
(2)粗粒度三元組抽取,通過輸入整篇文檔的物理組件的有序序列,再將其物理組件如標題、正文識別出來,再根據(jù)這些信息生成文檔樹,最終根據(jù)一些簡單的規(guī)則即可得到文檔的所有粗粒度三元組;
(3)細粒度三元組抽取,基于雙線性三維稀疏、損失函數(shù)等技術(shù)的細粒度三元組知識抽取,降低了模型復雜性,提高了魯棒性。
設計了半監(jiān)督預訓練的方式來解決對話策略的建模難題,將對話動作預測任務改造成半監(jiān)督學習任務,并設計出預訓練模型。
(1)對于理解能力,采用回復選擇作為預訓練目標,即給定對話上下文和候選回復處進行二分類判決是否是正確的回復;
(2)對于生成能力,則使用常見的回復生成目標,即給定對話上下文生成正確回復語句;
(3)對于策略部分,采用半監(jiān)督學習中十分高效的一致性正則方法來建模對話動作。
最終對于模型的預訓練,筆者將整個模型的理解、策略、生成目標加在一起進行優(yōu)化,整體提升對話策略的建模效率。
主要包括針對流程型知識的對話引擎,針對表格知識的問答引擎,針對知識圖譜的圖譜問答引擎等。其中,表格問答通過將自然語言直接轉(zhuǎn)換為SQL查詢語言,允許用戶使用自然語言與表格知識直接交互,從而拓展了對話機器人的能力邊界。針對表格的表格問答引擎,主要開拓并打造了從單輪到多輪的問答和從單表到多表的問答能力。
(1)關于多輪的表格問答,筆者提出了一種基于動態(tài)上下文模式圖的框架,刻畫多輪場景下的自然語言和表格之間復雜的語義鏈接關系。
(2)多表的問答,筆者利用句法關系建模了自然語言問題內(nèi)部的關系,在句法距離的度量下,數(shù)據(jù)和數(shù)據(jù)的關系將被拉近,從而生成正確的SQL。
經(jīng)過大量調(diào)研和分析,對人機對話技術(shù)有較大需求的便民服務場景包括如下兩個方面;
1. 便民熱線場景
當前較多地區(qū)熱線服務電話分散,基層公安缺少統(tǒng)一的呼叫中心坐席人員支持,熱線服務電話一般直接轉(zhuǎn)給了窗口服務的警務人員,一方面給窗口警務人員帶來了更大的壓力,另一方面群眾在非工作時間段的咨詢不能有效的承接。
2. 疫情流調(diào)場景
近年來隨著疫情常態(tài)化,各地公安民警都需要做好疫情的防范和控制。當疫情突發(fā)時,需要進行大量的流調(diào)來對相關人員進行摸排。然而常規(guī)流調(diào)的方式主要基于人工電話來實現(xiàn),一方面耗費大量寶貴的人力資源,另一方面在在時效方面無法保障快速的摸排需求。
根據(jù)上文所述便民服務場景的聚焦,結(jié)合新一代人機對話技術(shù)平臺,確定如下三條技術(shù)融合路徑,即警務智能在線機器人、警務智能熱線導航機器人和警務智能外呼機器人。
1. 警務智能在線機器人
智能在線機器人基于NLP和AI技術(shù)提供智能在線對話能力,可集成到網(wǎng)站、APP、小程序/微信/微博等渠道中,支持7x24小時提供智能在線服務,實現(xiàn)在線問答、在線智能導服、業(yè)務知識庫等能力,如圖3所示。
圖3 警務在線機器人業(yè)務邏輯圖
2. 警務智能熱線導航機器人
在熱線電話人工受理方面,需考慮智能語音交互功能。通過自助語音導航能力,分流一部分人工坐席的壓力。
研究基于語音的人機交互應用,開發(fā)警務智能熱線導航機器人,如圖4所示,當群眾電話呼入后,通過系統(tǒng)中的語音引導,以自由說的方式提交咨詢要求,如群眾提問“我身份證丟失了怎們辦?”,機器人可識別理解用戶表達的語義并作為正確的語音引導。
圖4 警務智能熱線導航機器人業(yè)務邏輯圖
在出入境、戶籍、交警等方面,熱線導航機器人可將各個熱線座機的統(tǒng)一集成,由機器人提供智能化的服務指引及問題解答,同時也能支持將機器人無法解答的問題轉(zhuǎn)接到對應的窗口警務服務人員。在方便群眾快速咨詢問題的同時,也可以有效幫助減輕窗口警務服務人員的工作壓力。
3. 警務智能外呼機器人
警務智能外呼機器人具備自動呼出能力的智能語音能力,能夠根據(jù)業(yè)務方需求,在指定時間范圍內(nèi),對指定的用戶發(fā)起主動電話外呼任務。在外呼過程中,結(jié)合運用ASR、TTS語音引擎和機器人NLP能力,能夠?qū)崿F(xiàn)包含疫情流調(diào)、反詐預警、滿意度調(diào)研回訪等在內(nèi)的各種復雜場景的外呼智能問答任務,同時還需支持將外呼過程中收集的信息和數(shù)據(jù)回流到工單或者其他應用系統(tǒng),形成統(tǒng)計數(shù)據(jù)和日志。該機器人可以在應急時快速增加同時外呼的并發(fā)路數(shù),從而進一步提升疫情流調(diào)的摸排效率,如圖5所示。
圖5 警務智能外呼機器人業(yè)務邏輯圖
在網(wǎng)絡承載方面,考慮到公安應用場景數(shù)據(jù)的敏感性等,該系統(tǒng)建議在公安信息網(wǎng)內(nèi)進行部署。
在部署資源設計方面,資源需要在滿足日常使用的基礎上,預留一定的資源支撐疫情防控等高峰場景使用需求。
在業(yè)務擴展方面,系統(tǒng)需要能支持一定的擴展性,在后續(xù)業(yè)務量增加時進行擴展;
在業(yè)務打通方面,系統(tǒng)需要與公安信息網(wǎng)內(nèi)其他業(yè)務系統(tǒng)之前具備打通的條件,實現(xiàn)外呼自動觸發(fā)等場景的連通。
在某地實踐中,基于上文的技術(shù)路徑,根據(jù)各個場景的應用訴求進行統(tǒng)一的平臺規(guī)劃,以新一代人機對話技術(shù)構(gòu)建公安便民服務場景中警務智能在線機器人、警務熱線導航機器人、警務智能外呼機器人,并以支付寶、微信小程序的形式作為面向群眾、企業(yè)、警民的用戶界面,實現(xiàn)智能化在線辦事、警務熱線導航、電話熱線服務以及在防疫、群眾滿意度等場景下的智能外呼等需求。
本節(jié)重點闡述各模塊分階段落地實施設計。
(1)建設警務智能外呼平臺,并先后落地實現(xiàn)了引導申報外呼、實名申報外呼、滿意度回訪外呼、出警通知外呼、反詐通知外呼和疫情調(diào)研外呼等。實現(xiàn)了常用外呼通知業(yè)務的自動化和智能化,以及疫情調(diào)研類應急外呼能力的搭建,并溝通了應急智能外呼能力的擴展機制。
(2)落地警務智能在線機器人以及智能知識庫。智能知識庫主要是為滿足智能在線機器人的知識管理需求,而搭建的一整套半自動知識構(gòu)建、知識錄入、知識編輯、知識運營的系統(tǒng),能夠幫助業(yè)務人員實現(xiàn)高效的知識管理和知識運營。知識庫中涵蓋戶籍類、出入境、流動人口、治安、小程序申報、法律咨詢等數(shù)百條公安政務知識,以及大量通用政務知識來滿足群眾日常咨詢需求。智能在線機器人的前端是基于H5技術(shù)搭建的頁面,如圖6所示,可以方便的集成到網(wǎng)站、APP、小程序等渠道中,通過流程引導提供對于戶籍類、出入境、流動人口、治安、小程序申報、法律咨詢等公安政務知識的智能服務,用戶可以通過直接點擊圖標按照分類查找自己想要咨詢的問題,或者直接通過文字和語音的方式向機器人進行咨詢。機器人會理解用戶輸入的問題,并給出解答,對于答案部分還能支持語音播報。
圖6 警務智能在線機器人對外服務界面
(3)建設警務智能熱線導航機器人,一方面實現(xiàn)多個派出所出入境、戶籍等多個服務大廳電話號碼的統(tǒng)一,實現(xiàn)一號通辦,方便群眾記錄,同時基于智能導航機器人實現(xiàn)了對常見業(yè)務的智能咨詢支持,目前建設覆蓋的業(yè)務場景主要包括治安、戶籍、出入境、流動人口幾大場景。
該地通過上文所述的分布建設模式,有效的構(gòu)建了基于新一代人機對話技術(shù)的公安便民服務平臺,實踐成效如下:
(1)大幅降低疫情流調(diào)等場景下警務人員的人工資源消耗量;
(2)通過智能導航機器人和辦事窗口警務服務人員的有效協(xié)同,實現(xiàn)群眾咨詢100%響應或接聽,服務好評率95%以上;
(3)真正實現(xiàn)了7×24小時不間斷提供熱線、在線等多渠道智能服務能力;
(4)提升服務效率,降低行政成本,節(jié)約辦公成本,更有效引導群眾“掌上辦”“網(wǎng)上辦”,實現(xiàn)公安政務服務全方位提升群眾辦事獲得感和滿意度。
本研究將下一代人機對話技術(shù)應用于公安便民服務場景中,通過對警務智能在線機器人、警務智能熱線導航機器人、警務智能外呼機器人三種技術(shù)路徑的探索,構(gòu)建出體系化的公安便民服務平臺,實現(xiàn)了新一代人機對話技術(shù)在公安工作中的真正落地,提升了公安便民服務的智能化和在線化水平,切實為基層民警工作減負提供了有效的技術(shù)支撐。
在可預見的未來,人機對話會逐步從受限場景拓展到半開放場景,從單模態(tài)升級到“語音+語言+視覺+情感融合”的多模態(tài),對話能力從預定義跨越到具備一定終身學習的對話機器人[5]。筆者將繼續(xù)研究其與反電信詐騙、案件偵辦等場景高效結(jié)合,進一步提升數(shù)字化轉(zhuǎn)型對基層工作的賦能力度。