韓 輝
(訊飛智元信息科技有限公司, 安徽 合肥 230088)
近年來,以人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)為代表的第四次信息科技浪潮爆發(fā)式發(fā)展,正在深刻地影響與改變?nèi)祟惖纳a(chǎn)生活方式。智能語音技術(shù)作為人工智能的重要組成部分,也被廣泛運(yùn)用于各行各業(yè)。
公共服務(wù)中道路交通事故的應(yīng)急處理能力是社會治理水平高低的重要體現(xiàn),關(guān)系著人民的生命與財產(chǎn)安全以及道路交通設(shè)施的利用效率,是交通管理工作中的重要內(nèi)容。提高道路交通事故應(yīng)急處理能力,一方面可以縮短道路交通事故的處置時間,另一方面可以快速消除路障,保障道路交通運(yùn)輸?shù)捻槙?。影響交通事故處置效率的主要有三點(diǎn),一是事故處置時間,二是路程花費(fèi)時間,三是現(xiàn)場處理時間?;诖?,本文研究了智能語音技術(shù)在忙時輔助接警、智能指揮調(diào)度、出警預(yù)案指導(dǎo)等四個方面的應(yīng)用,并探索通過搭建道路交通事故處理指揮調(diào)度平臺來提升交通事故處理效率。
目前關(guān)于智能語音技術(shù)的應(yīng)用領(lǐng)域逐漸增多,施唯佳等[1]提出智能語音機(jī)頂盒的軟硬件實(shí)現(xiàn)方案將智能語音技術(shù)應(yīng)用到通信技術(shù)上,詹新生等通過智能語音技術(shù)設(shè)計了聯(lián)合收割機(jī)多功能智能終端,何雋等將智能語音技術(shù)運(yùn)用到金融領(lǐng)域,段維軍等利用語音識別技術(shù)進(jìn)行多媒體信息檢索的仿真應(yīng)用,劉一鳴等將智能語音技術(shù)應(yīng)用到出版領(lǐng)域?qū)崿F(xiàn)了數(shù)字出版的有聲讀物功能,宋歌提出人工智能語音分析系統(tǒng)在帕金森病診斷中的一項(xiàng)探索性臨床研究,將智能語音技術(shù)應(yīng)用到醫(yī)學(xué)領(lǐng)域,王留芳等提出智能語音技術(shù)在蓄電池充電系統(tǒng)中的應(yīng)用,實(shí)現(xiàn)了電池充電系統(tǒng)的智能化,肖安琪等將智能語音技術(shù)應(yīng)用到傳統(tǒng)廣播領(lǐng)域,鄭杰慧等將智能語音技術(shù)應(yīng)用到水務(wù)客服領(lǐng)域,艾文偉等將智能語音技術(shù)應(yīng)用到城市軌道交通客運(yùn)服務(wù)中,本文基于語音通信技術(shù)來實(shí)現(xiàn)道路交通警情場景的智能化,提升出警效率。
智能語音技術(shù)屬于多學(xué)科交叉的邊緣學(xué)科,涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、計算機(jī)科學(xué)等領(lǐng)域,主要針對語音識別技術(shù)(ASR)、語音合成技術(shù)(TTS)和語義理解技術(shù)(NLP)等開展研究,實(shí)現(xiàn)讓機(jī)器人一樣“能聽會說”、“能理解會思考”。
語音識別技術(shù)的探索經(jīng)歷了從孤立詞識別系統(tǒng)向大詞匯量連續(xù)語音識別系統(tǒng)發(fā)展階段,并開始轉(zhuǎn)向端到端神經(jīng)網(wǎng)絡(luò)及針對實(shí)際應(yīng)用中的算法優(yōu)化研究。目前,機(jī)器的語音識別準(zhǔn)確率已達(dá)到人類平均水平。
語音合成技術(shù)的探索經(jīng)歷了人工參數(shù)合成法和可訓(xùn)練的參數(shù)合成法兩個主要階段,并開始聚焦于提高合成語音的自然度和表現(xiàn)力、擴(kuò)展多語種文語合成、降低語音合成技術(shù)的復(fù)雜度等方面研究。目前,機(jī)器的語音合成質(zhì)量已超過人類水平。
交通事故的報警和求助,受限于各種客觀條件,如早晚高峰、節(jié)假日、惡劣天氣等情況,在報警量陡增的情況下,無法及時有效的接通。為提高忙時報警電話的處理效率,避免耽誤重大警情,在不增加現(xiàn)有人工電話坐席數(shù)量和工作強(qiáng)度下,可通過建設(shè)忙時智能機(jī)器人輔助接警系統(tǒng),實(shí)現(xiàn)話務(wù)量有效分流。
接警過程為接處警員手工詳細(xì)記錄市民口述的關(guān)于地理位置、事發(fā)場地、現(xiàn)狀、聯(lián)系人等信息,轉(zhuǎn)警員處理,忙時接通率下降、信息記錄時間較長。針對此問題,可通過自然語義理解的轉(zhuǎn)寫技術(shù),在市民與接處警的交互中自動記錄關(guān)鍵信息,實(shí)現(xiàn)智能填單,并將關(guān)鍵信息準(zhǔn)確發(fā)送給出警人員。
目前,道路交通事故處理采用接處警的方式,根據(jù)事故報警位置,通知所屬轄區(qū)交警中隊調(diào)配警力進(jìn)行處理,這種方式處理效率低下,存在信息傳遞丟失。為解決此困境,可采用基于路況的智能派警技術(shù),對出警的警員、警車的數(shù)據(jù)進(jìn)行匯聚,實(shí)時更新他們的位置以及全市監(jiān)控設(shè)備的位置數(shù)據(jù)進(jìn)行融合,一旦有案情發(fā)生,基于位置區(qū)域中心算法,可以快速查找出周邊的警員、警車、攝像頭,可以快速、便捷的給附近的警員、警車下達(dá)指令,而且還可以給與附近的警員、警車推薦最短距離到達(dá)或者最短時間到達(dá)案發(fā)現(xiàn)場,同時在指揮中心大屏上,可以調(diào)度周邊范圍的攝像頭,查看現(xiàn)場的情況以及警員在現(xiàn)場的處置情況。
基于對當(dāng)前道路交通事故警情處理的現(xiàn)狀分析,本文提出構(gòu)建交通事故處理智能指揮調(diào)度平臺,下設(shè)電話機(jī)器人輔助接處警系統(tǒng)及語音大屏指揮調(diào)度系統(tǒng),使用“人機(jī)”結(jié)合的方式,降低人工服務(wù)壓力,應(yīng)對報警忙時及突發(fā)事件導(dǎo)致的呼叫量激增,提高報警電話接通率,同時為處警員帶來更高效、便捷的自然語音交互服務(wù),及時聯(lián)動協(xié)同指揮調(diào)度,提升指揮調(diào)度效率,在重大警情和各類突發(fā)事件的應(yīng)急指揮中,將智能語音技術(shù)應(yīng)用到地圖操作,視頻監(jiān)控區(qū),應(yīng)急預(yù)案和人員通訊錄查詢等方面,操作更加快捷準(zhǔn)確。
(1)人機(jī)交互技術(shù)
忙時智能接警機(jī)器人的核心是人機(jī)交互對話管理,對話管理首先需要創(chuàng)建話術(shù),機(jī)器人按照話術(shù)設(shè)定的邏輯進(jìn)行服務(wù)。系統(tǒng)支持可視化的方式動態(tài)編輯話術(shù),從而實(shí)現(xiàn)話術(shù)的快速修改和發(fā)布。
(2)自然語言理解技術(shù)
智能填單的核心是基于對自然語言的理解,根據(jù)報警人意圖與反饋的各實(shí)體間關(guān)系,進(jìn)行歸類并自動形成工單,道路交通事故警情場景下,主要涉及地址識別與意圖分類。
地址識別,運(yùn)用語音識別+語義理解技術(shù)將用戶說出的地址準(zhǔn)確提供出來,語音識別采用HybridCNN+CTC算法,語義理解采用基于Bert+CRF預(yù)訓(xùn)練算法模型,采用上述模型對20億條全國地址數(shù)據(jù)進(jìn)行訓(xùn)練完成。
意圖分類及語義提槽,運(yùn)用LSTM與Bert算法相結(jié)合的模式,實(shí)現(xiàn)自動化語義編譯、解析和訓(xùn)練方案,快速提高正確率。
(3)全渠道富媒體融合技術(shù)
全渠道富媒體融合技術(shù),打通傳統(tǒng)的話音渠道與網(wǎng)頁、微信、短信、H5、APP等新興渠道的數(shù)據(jù)壁壘,支持文字、語音、圖片、視頻等富媒體交互方式,所有渠道由統(tǒng)一一個智能大腦進(jìn)行支配。應(yīng)用場景上,接處警民警可隨時了解市民多渠道交互歷史軌跡,案情的脈絡(luò)流程一目了然,輔助處警決策,提高處警效率。智能大腦由后臺統(tǒng)一能力平臺支撐,包括語音識別、語義理解、知識庫等AI能力以及多渠道接入管理。
該平臺的系統(tǒng)結(jié)構(gòu)自下而上,可以分為四部分——基礎(chǔ)設(shè)施層、數(shù)據(jù)層、服務(wù)層、應(yīng)用層。在基礎(chǔ)設(shè)施層完成了網(wǎng)絡(luò)基礎(chǔ)、電話平臺、計算機(jī)終端、大屏控制、存儲設(shè)施等基礎(chǔ)設(shè)施的建設(shè),為平臺提供了良好的基礎(chǔ)物理支撐;在數(shù)據(jù)層完成了基礎(chǔ)數(shù)據(jù)、錄音數(shù)據(jù)、語音數(shù)據(jù)模型、語義數(shù)據(jù)、POI地址數(shù)據(jù)、預(yù)案數(shù)據(jù)的設(shè)計及規(guī)整,并同時為數(shù)據(jù)搭建了相應(yīng)的存儲平臺,基于平臺的需求,加入路況數(shù)據(jù)、報警人行為數(shù)據(jù)的整體設(shè)計及規(guī)劃;在服務(wù)層,基于平臺的語音合成、語音識別、語義理解、語音導(dǎo)航、POI地址定位、數(shù)據(jù)搜索引擎、實(shí)時轉(zhuǎn)寫、統(tǒng)一排隊、離線地圖、地址搜索引擎等服務(wù),將進(jìn)一步拓展交通導(dǎo)航能力、熱力分析、IM通信、路況分析、圖層定制等服務(wù)的提供;在應(yīng)用層建設(shè)內(nèi)容統(tǒng)一規(guī)劃為智能機(jī)器人輔助接處警系統(tǒng)、智能指揮調(diào)度系統(tǒng)。如圖1所示。
圖1 道路交通事故處理智能指揮調(diào)度平臺系統(tǒng)架構(gòu)設(shè)計Fig.1 system architecture design of intelligent command and dispatching platform for road traffic accident handling
四層結(jié)構(gòu)設(shè)計的系統(tǒng)具有較好的擴(kuò)展性。隨著業(yè)務(wù)的拓展,可以很方便的在必要的層面中添加相應(yīng)的應(yīng)用,實(shí)現(xiàn)系統(tǒng)功能的擴(kuò)展。四層架構(gòu)將業(yè)務(wù)邏輯分布到應(yīng)用服務(wù)器上,數(shù)據(jù)庫上不再具有業(yè)務(wù)邏輯處理單元,而只負(fù)責(zé)基礎(chǔ)業(yè)務(wù)數(shù)據(jù)的管理,主要的計算任務(wù)由應(yīng)用服務(wù)器完成,從而充分利用了應(yīng)用服務(wù)器在并發(fā)處理和邏輯計算方面的優(yōu)勢,解決了三層結(jié)構(gòu)體系下當(dāng)請求并發(fā)量巨大時,數(shù)據(jù)庫性能迅速下降的問題。
(1)忙時智能機(jī)器人輔助接警
根據(jù)情況分析交通事故接警的結(jié)果及語料集,設(shè)計交通事故接警電話機(jī)器人交互界面,根據(jù)交互方案設(shè)計,進(jìn)行交通事故智能接警電話機(jī)器人原型搭建,包含提示音錄制、語義庫完善,上線后組織用戶進(jìn)行可用性測試,根據(jù)測試結(jié)果進(jìn)行聲學(xué)模型優(yōu)化及語音模式優(yōu)化,包含數(shù)據(jù)設(shè)計、數(shù)據(jù)收集、數(shù)據(jù)標(biāo)注、數(shù)據(jù)訓(xùn)練、測試優(yōu)化等過程,最終完成交通事故智能自助交互全流程。
(2)智能填單
通過先進(jìn)的語音識別技術(shù),將接警人語音信息實(shí)時轉(zhuǎn)成文字信息,根據(jù)案發(fā)時間、地點(diǎn)、警情內(nèi)容等字段選擇性錄入,根據(jù)報警人意圖與反饋的各實(shí)體間關(guān)系,進(jìn)行歸類并自動形成工單,有效提高接警效率,提升單位時間接警量。根據(jù)歷史工單數(shù)據(jù),在云端后臺可檢索相同類型事件、相同人物、車輛或公司等聚合數(shù)據(jù)。
(3)智能派警
智能派警主要包含出警預(yù)案指導(dǎo)和語音指揮調(diào)度。
出警預(yù)案指導(dǎo):在警務(wù)通終端上引入全新的智能出警預(yù)案指導(dǎo)APP,實(shí)現(xiàn)實(shí)時進(jìn)行預(yù)案語音提醒,構(gòu)建警情處置預(yù)案知識庫,梳理散亂的警情信息并作規(guī)整分類。當(dāng)案件發(fā)生時,系統(tǒng)自動搜索相關(guān)案件指導(dǎo)及法律條款,通過自然的合成語音播報給出警民警,規(guī)范出警流程。同時,當(dāng)有案件發(fā)生后,警務(wù)通可查詢相應(yīng)案件發(fā)生在地圖上地點(diǎn)和當(dāng)前自己所在的位置??赏ㄟ^界面操作進(jìn)行地圖導(dǎo)航,路徑規(guī)劃。
語音指揮調(diào)度:以智能語音融合交互為核心,通過統(tǒng)一業(yè)務(wù)管理平臺、媒體處理服務(wù)平臺、接入網(wǎng)關(guān)及對外互聯(lián)設(shè)備,構(gòu)建分布式、分層統(tǒng)一的通信系統(tǒng)。系統(tǒng)整合語音、視頻監(jiān)控/會議、指揮調(diào)度、集群對講、警情數(shù)據(jù)、警力資源、GIS業(yè)務(wù)、應(yīng)急預(yù)案等子系統(tǒng),建立集語音、視頻、數(shù)據(jù)三位于一體的全面綜合指揮調(diào)度系統(tǒng),實(shí)現(xiàn)語音、視頻、數(shù)據(jù)的融合與調(diào)度功能。顛覆以往需要多人、多系統(tǒng)協(xié)調(diào)工作的模式,實(shí)現(xiàn)全新一代的智能語音指揮調(diào)度方式。
本項(xiàng)目可廣泛運(yùn)用于城市的道路交通事故警情處理中,通過本項(xiàng)目的建設(shè),以機(jī)器人(7×24小時)和坐席互助的方式,預(yù)計可實(shí)現(xiàn)忙時電話接通率提升17%,分流人工話務(wù)量20%,早釋率穩(wěn)定控制在1%以下,報警電話接通率保持在99%以上,整體出警時間縮短1分鐘左右,從而提升坐席人員對于警情錄入、地址錄入的速度,從而提升接警服務(wù)效率,促進(jìn)接處警之間的溝通交流更加快速化、直觀化。
通過智能派警技術(shù)可以更加迅速的處理報警案情,很大程度上提升了各個環(huán)節(jié)和部門之間的溝通效率,極大的節(jié)約警力資源,同時讓市民在使用過程中體驗(yàn)到高新技術(shù)的便捷與科技感,從而進(jìn)一步提升道路交通事故處理的服務(wù)效率和市民滿意度。
通過搭建交通事故處理指揮調(diào)度平臺,將先進(jìn)的智能語音技術(shù)運(yùn)用在道路交通事故警情處理中,實(shí)現(xiàn)忙時輔助接警、智能填單、智能派警等多種功能,解決了交通事故警情處理的痛點(diǎn),帶來了較大的經(jīng)濟(jì)效益和社會效益。
當(dāng)前,人工智能技術(shù)已經(jīng)賦能各行各業(yè)取得了很多階段性的突破成果,智能及人工與行業(yè)的深度融合是下一步的發(fā)展趨勢,在智能化方向,關(guān)于報警地址與車牌的語音交互識別還需要進(jìn)一步的創(chuàng)新與數(shù)據(jù)積累,在人機(jī)融合方向,開放自主靈活的運(yùn)維運(yùn)營將帶來更好的服務(wù)體驗(yàn)。后續(xù),筆者將在這兩個方向上繼續(xù)探索項(xiàng)目的架構(gòu)優(yōu)化和策略機(jī)制創(chuàng)新,用人工智能建設(shè)美好世界。