亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        AI語音關(guān)鍵技術(shù)與業(yè)務(wù)實踐研究

        2021-03-13 10:19:36
        郵電設(shè)計技術(shù) 2021年2期

        0 前言

        當(dāng)前,在云計算、大數(shù)據(jù)、AI 技術(shù)的賦能下,原有以電話為主要手段進(jìn)行客戶聯(lián)絡(luò)與營銷的傳統(tǒng)呼叫中心,正在向云化、數(shù)據(jù)化、智能化為特征的全渠道多媒體客戶服務(wù)中心及營銷中心轉(zhuǎn)變。尤其是以AI 語音技術(shù)為特色的“云+網(wǎng)+呼叫中心”的智能呼叫中心產(chǎn)品,解決了行業(yè)內(nèi)部現(xiàn)存各類問題,提升客戶服務(wù)效率,優(yōu)化客戶體驗。而以AI質(zhì)檢為代表的運營管理工具,在輔助客服人員服務(wù)過程的同時,對坐席通話行為與內(nèi)容進(jìn)行分析抽查,進(jìn)而營造出良性發(fā)展、更有秩序、更加規(guī)范的語音業(yè)務(wù)生態(tài)。綜上所述,AI 語音技術(shù)破除了政企語音市場規(guī)模化發(fā)展所遇到的障礙。

        1 AI語音關(guān)鍵技術(shù)

        2017年9月6日,微軟小冰給人類打出第1個全雙工電話,2018 年5 月10 日,Google 在I/O 大會首次做了AI 電話Duplex。此后AI 語音技術(shù)在商業(yè)價值的驅(qū)動下開始了飛速發(fā)展。一個完整的利用電話進(jìn)行人機對話的流程如圖1 所示,通過語音識別(ASR)、語音合成(TTS)、自然語言處理(NLP)、聲紋識別(VPR)、文本分析(TA)等技術(shù)手段,依托語音信號處理、深度學(xué)習(xí)、模式識別、數(shù)據(jù)挖掘等算法,實現(xiàn)人機溝通、信息傳遞、意圖表達(dá)、情感交流等行為。

        圖1 基于電話的人機對話流程

        1.1 ASR技術(shù)演進(jìn)

        語音識別即機器理解和識別人類語音信號并轉(zhuǎn)成文本的技術(shù),基本流程有3 個環(huán)節(jié):語音預(yù)處理數(shù)字化、特征提取、訓(xùn)練/識別,通用的語音識別算法是通過模式匹配與統(tǒng)計模型相結(jié)合的方式來實現(xiàn),先對已有的音素數(shù)據(jù)構(gòu)建參考模板;再構(gòu)建參考模板和未知數(shù)據(jù)提取的模板之間測度函數(shù),最終用最佳準(zhǔn)則來識別決策。

        第1 代的通用算法是HMM-GMM 混合高斯隱形馬爾科夫模型,該算法可以將聲學(xué)和句法集成在單一框架中,并使得連續(xù)語音識別成為可能,在業(yè)內(nèi)最早實現(xiàn)商用化,并持續(xù)商用了近30年。隨著深度學(xué)習(xí)理論下深度神經(jīng)網(wǎng)絡(luò)(DNN)的成熟,受限玻爾茲曼機(RBM)所堆疊出的深度置信網(wǎng)絡(luò)(DBN)替代了混合高斯模型(GMM),基于DNN-HMM 模型成為第2 代語音識別的主流算法,顯著降低了誤識別率,并激發(fā)了基于深度神經(jīng)網(wǎng)絡(luò)的語音識別研究熱潮。新的深度神經(jīng)網(wǎng)絡(luò)層出不窮,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)與傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)相比,網(wǎng)絡(luò)結(jié)構(gòu)更有優(yōu)勢更能成功地應(yīng)用到語音識別任務(wù)中,而長短時記憶網(wǎng)絡(luò)(LSTM)作為RNN 的一種典型網(wǎng)絡(luò),將識別準(zhǔn)確率較之前提高了6%~8%,成為第3代語音識別技術(shù)主體。近2年來,研究者們發(fā)現(xiàn)RNN 的另一種典型網(wǎng)絡(luò)連接時序分類器(CTC)網(wǎng)絡(luò)不必再針對每一幀對語音進(jìn)行對齊的預(yù)處理操作,省去了耗時的反復(fù)多次迭代,徹底擺脫HMM 的框架,預(yù)測時的速度更快,識別速度更快,且更換識別語言體系時可以利用相同的框架結(jié)構(gòu)訓(xùn)練,實現(xiàn)了端到端的語音輸入到文字識別。該算法模型為語音識別第四代算法模型,稱為E2E 模型。目前該技術(shù)識別率處于國內(nèi)領(lǐng)先地位,16K 語音識別率超97%,8K 語音識別率超85%;識別速度實時率可以達(dá)到0.2~0.3;且支持英語等外語種、維藏蒙彝朝等少數(shù)民族語、粵語四川話閩南話等方言的識別。

        1.2 TTS技術(shù)

        語音合成即將文本轉(zhuǎn)成語音的過程,基本流程有4 個環(huán)節(jié):語義表示、語言編碼、發(fā)聲編碼、語音產(chǎn)生,實現(xiàn)了從意向到概念到聲碼器控制信號再到語音波形的轉(zhuǎn)化。

        早期的語音合成是用最基本的語音單元,如音素、雙音素、半音節(jié)、音節(jié)作為合成單元,建立語音庫,通過合成單元拼接而達(dá)到無限詞匯的合成,并通過聲碼器(如串并聯(lián)混合型共振峰合成器)來模擬發(fā)音過程中的聲道共振(串聯(lián)通道產(chǎn)生元音和濁輔音,并聯(lián)通道產(chǎn)生清輔音)。從20 世紀(jì)90 年代末,主流技術(shù)開始使用存放大量真人語音樣本的語音庫,通過選擇合適的拼接語音片段來實現(xiàn)高質(zhì)量的合成語音。2000 年以來語音合成是基于統(tǒng)計建模和機器學(xué)習(xí)的方法,通過建模加訓(xùn)練快速構(gòu)建合成系統(tǒng),構(gòu)成了第1 代語音合成算法的基石,即HMM 參數(shù)合成方法。和語音識別技術(shù)類似,深度神經(jīng)網(wǎng)絡(luò)的統(tǒng)計聲學(xué)建模方法也迅速成為語音合成的技術(shù)核心,第2 代基于DNN 的方法由于對高維聲學(xué)特征中各個維度相關(guān)性和輸入輸出復(fù)雜映射關(guān)系能夠更為精細(xì)化的建模,大大改進(jìn)了合成語音的音質(zhì)。而最新的第3 代基于端到端的模型預(yù)測,將神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和聲碼器的訓(xùn)練過程合二為一,不再需要人工錄音、標(biāo)注,通過機器自主訓(xùn)練具備與真人高相似度的音色,發(fā)音連接順暢,更貼近自然人發(fā)音。第三代的語音合成技術(shù)可基于應(yīng)用場景的不同,調(diào)整合成的語速、音色、音量等特征,匹配各場景需求,同時在語音素材庫中,擁有男聲、女聲、童聲等多種音色,每種音色均有不同發(fā)音人,無需重新進(jìn)行訓(xùn)練,使用同一個模型即可全面滿足各種應(yīng)用場景多樣需求。

        1.3 NLP技術(shù)

        自然語言處理是指在人機交互中機器理解自然語言,并做出響應(yīng)的技術(shù),解決人工智能完備性上的認(rèn)知智能問題,具體技術(shù)手段仍為馬爾可夫統(tǒng)計學(xué)建模與機器學(xué)習(xí)、深度學(xué)習(xí)相結(jié)合的方法。自然語言處理在分析對象上分為詞匯級、句子級和段落篇章級,包含的功能要點有語法分析、語義表示、語義關(guān)系、語句生成以及單文本/多文本分析;在分析內(nèi)容上分為詞法分析、語法分析、語義分析、語用分析等。近10 年來,自然語言處理都是基于神經(jīng)網(wǎng)絡(luò)來實現(xiàn)的。第1代自然語言處理利用淺層神經(jīng)網(wǎng)絡(luò),基于詞向量技術(shù),將用戶輸入問題進(jìn)行分詞,利用關(guān)鍵詞的詞頻及詞權(quán)重進(jìn)行關(guān)鍵詞賦值,實現(xiàn)了詞匯級的理解;第2代自然語言處理基于深度學(xué)習(xí)和強化學(xué)習(xí)技術(shù),從詞向量擴展到句向量,進(jìn)而支持基于上下文的語義理解和多輪對話,目前是AI 機器人主流應(yīng)用技術(shù);第3 代自然語言處理基于更先進(jìn)的ELMo 算法,支持篇章級的語義抽取,對上下文的語義理解和多輪對話有了更進(jìn)一步的提升。隨著網(wǎng)絡(luò)深度的不斷增加和機器學(xué)習(xí)自主化的深入,自然語言處理系統(tǒng)一方面能夠應(yīng)用歷史積累的數(shù)據(jù),只需少量人工給出頭部結(jié)論,便可自主學(xué)習(xí)進(jìn)行知識歸類及認(rèn)知;另一方面能夠應(yīng)用歷史積累處理失敗數(shù)據(jù),無需人工參與,自主進(jìn)行無監(jiān)督聚類,挖掘出新的知識點,并對舊的知識點進(jìn)行優(yōu)化。

        通過ASR、TTS、NLP的技術(shù)演進(jìn)來看,技術(shù)的更新迭代周期是指數(shù)型的而非線性的,且最終都是通過AI領(lǐng)域最為核心的深度學(xué)習(xí)理論來實現(xiàn)。

        2 AI語音產(chǎn)品

        整合前文所述業(yè)界領(lǐng)先的語音識別、語音合成與自然語言理解算法,結(jié)合運營商的語音能力開放,再運用數(shù)據(jù)挖掘、知識圖譜、數(shù)據(jù)可視化等相關(guān)輔助技術(shù),可打造一系列新型的AI語音產(chǎn)品,提供智能化語音服務(wù)與人工坐席的智能化支撐服務(wù),實現(xiàn)高效率、低成本的營銷、客服、質(zhì)檢工作。作為運營商傳統(tǒng)語音業(yè)務(wù)的增值功能,可突破呼叫中心人工坐席各類瓶頸,提升企業(yè)的溝通效率,擴大企業(yè)的銷售成果、品牌影響及市場地位。

        2.1 架構(gòu)設(shè)計

        AI語音產(chǎn)品的系統(tǒng)軟件架構(gòu)如圖2所示。

        圖2 AI語音產(chǎn)品系統(tǒng)架構(gòu)圖

        從軟件架構(gòu)來看,業(yè)務(wù)管理層面向不同應(yīng)用場景,對其業(yè)務(wù)進(jìn)行統(tǒng)一運營管理,滿足客戶預(yù)測式外呼、人機切換、純AI機器人3類需求場景;業(yè)務(wù)服務(wù)層整合引擎基礎(chǔ)能力,執(zhí)行具體業(yè)務(wù)邏輯處理,滿足客戶整體AI語音能力調(diào)用需求場景;能力引擎層提供AI語音的原子能力,當(dāng)前ASR 準(zhǔn)確率對于電話信道可達(dá)85%,ASR+話術(shù)訓(xùn)練后的NLP整體交互準(zhǔn)確率可達(dá)92%,滿足客戶語音識別高準(zhǔn)確性需求場景;基礎(chǔ)服務(wù)層對計算資源、存儲資源、線路資源進(jìn)行管理、監(jiān)控與災(zāi)備,滿足客戶電信級保障的高可用需求場景。

        從產(chǎn)品功能來看,AI語音產(chǎn)品可以分為AI坐席產(chǎn)品與AI質(zhì)檢產(chǎn)品。AI坐席產(chǎn)品提供智能電話營銷、智能問卷調(diào)查、信息通知、活動推薦、客服接待等服務(wù)。AI 質(zhì)檢產(chǎn)品基礎(chǔ)功能包括語音轉(zhuǎn)寫、話者分離、關(guān)鍵詞檢出;核心功能包括話術(shù)規(guī)范分析、靜默分析、語速語調(diào)分析、意圖識別分析、禁語檢測、全文檢索、自動定位問題錄音、人工復(fù)檢、錄音回溯;管理功能包括結(jié)果報表生成、配置管理、詞庫管理、規(guī)則管理、監(jiān)控管理、計劃管理以及系統(tǒng)內(nèi)的權(quán)限管理、資源監(jiān)控和日志管理。下面分別介紹2個產(chǎn)品的功能特色。

        2.2 功能特色

        2.2.1 AI坐席特色

        AI 坐席產(chǎn)品的外呼功能主要定位于營銷或回訪的應(yīng)用場景,有3 個優(yōu)勢特色:一是賦能電話呼叫業(yè)務(wù),實現(xiàn)高效率低成本轉(zhuǎn)化,完成客戶精準(zhǔn)篩選;二是支持預(yù)測式外呼(多并發(fā)),外呼事半功倍效率更高;三是通過客戶無感知的人機切換,能夠在發(fā)現(xiàn)重要商機的第一時間人工跟進(jìn)。

        AI 坐席產(chǎn)品的呼入功能主要定位于投訴接待、業(yè)務(wù)咨詢等呼入場景,有3個優(yōu)勢特色:一是幫助客戶自助解決問題,讓客戶享受菜單導(dǎo)航式的咨詢體驗,二是通過情感分析來提升人工客服質(zhì)量,通過分析負(fù)面情緒對應(yīng)的消息內(nèi)容,精準(zhǔn)定位服務(wù)存在的問題,預(yù)先或有效及時解決訴求共性問題、突發(fā)性事件或苗頭性問題;三是結(jié)合大數(shù)據(jù)的輿情智能分析,可以統(tǒng)計出用戶的熱點問題,準(zhǔn)確掌握用戶需求,及時了解社會熱點及用戶的狀況,尤其在政府機關(guān)、事業(yè)單位對熱門事件分析、地區(qū)輿情分析、市民咨詢與投訴熱點分析的場景中,優(yōu)勢最為明顯。

        在外呼場景下,與人工坐席相比AI 坐席可提升3倍的客戶意向篩選效率,平均節(jié)省50%以上人力成本。同時AI 坐席產(chǎn)品的呼入功能可大幅提升客服工作效率與客戶滿意度,并為客戶節(jié)省45%以上的人力成本,如表1所示。

        表1 AI坐席與人工坐席對比

        2.2.2 AI質(zhì)檢特色

        AI質(zhì)檢主要定位于企業(yè)自用和運營商監(jiān)管場景。

        針對企業(yè)自用場景,AI 質(zhì)檢即可完成通話內(nèi)容的質(zhì)檢以及語音特征的質(zhì)檢,其中通話內(nèi)容的質(zhì)檢是根據(jù)質(zhì)檢規(guī)則加工和NLU 算法識別結(jié)果進(jìn)行比較,對通話內(nèi)容中的話術(shù)、關(guān)鍵詞、意向進(jìn)行分析與檢測,并從大量語音中提取語調(diào)、語速、能量等多種特征,經(jīng)過多重神經(jīng)網(wǎng)絡(luò)訓(xùn)練,能夠判斷對話者的情緒,并做出簡單的推理。進(jìn)而檢驗人工坐席的客服人員話術(shù)是否規(guī)范統(tǒng)一,是否存在濫用;同時甄別客戶情緒,當(dāng)識別到客戶投訴意圖時,可進(jìn)行后續(xù)的補償措施。

        針對運營商監(jiān)管場景,AI 質(zhì)檢用于對雙方通話的行為、話術(shù)等進(jìn)行統(tǒng)一抽查分析,查驗是否有違規(guī)業(yè)務(wù)的開展。這一過程需要人機協(xié)作來進(jìn)行質(zhì)檢,即根據(jù)不同角色的工作職責(zé),自動質(zhì)檢后臺系統(tǒng)為業(yè)務(wù)人員提供相對應(yīng)的人機協(xié)作質(zhì)檢功能。

        由于AI質(zhì)檢+人工復(fù)檢覆蓋率與效率遠(yuǎn)超過人工抽檢質(zhì)檢,解決普通質(zhì)檢覆蓋面小、對精準(zhǔn)服務(wù)能力提高支撐不足的問題,規(guī)避了坐席主觀記錄導(dǎo)致的工單的真實性和完善性存疑問題,快速提升精準(zhǔn)服務(wù)能力,降低人工話務(wù)壓力。結(jié)合后端對垂直行業(yè)的深度數(shù)據(jù)挖掘分析,更能充分利用呼入電話中蘊藏的海量用戶行為數(shù)據(jù),為企業(yè)業(yè)務(wù)經(jīng)營提供強大的支撐手段,對垂直行業(yè)領(lǐng)域的銷售/服務(wù)模式產(chǎn)生深遠(yuǎn)影響。

        2.3 典型場景

        2.3.1 預(yù)測式外呼

        預(yù)測式外呼即呼叫中心系統(tǒng)通過自動撥號功能,對當(dāng)前空號、忙線與其他無效通話狀態(tài)進(jìn)行過濾,接通后再轉(zhuǎn)給坐席,減少用戶等待或坐席等待的情況發(fā)生。而結(jié)合AI外呼的預(yù)測式外呼,將通話接通后轉(zhuǎn)給AI 坐席,通過AI 的初步意向篩選再轉(zhuǎn)接給人工。過濾+初篩可以大幅減少人工坐席的工作量,提升人力資源的投入產(chǎn)出比,讓人工坐席解答更為專業(yè)的問題。同時根據(jù)呼叫接通率和意向初篩比例情況,可以動態(tài)調(diào)整AI坐席數(shù)量和人工坐席數(shù)量,合理配比優(yōu)化資源。如圖3 舉例,如每天外呼并發(fā)量是X,且接通率僅50%,那么AI坐席數(shù)量可設(shè)置為50%X,如果意向篩選大概50%才有意向,那么人工坐席數(shù)量可設(shè)置為25%X,圖4為一個信用卡營銷的實際案例數(shù)據(jù)。

        2.3.2 AI外呼智能回訪

        圖3 預(yù)測式外呼示意圖

        圖4 智能回訪示意圖

        智能回訪信息采集是AI 外呼另外一個重要應(yīng)用場景,設(shè)定回訪話術(shù)并將回訪人員名單導(dǎo)入系統(tǒng)后,系統(tǒng)按照需要調(diào)查的問題批量發(fā)起對被調(diào)查者的通話,并通過擬人對話、對被調(diào)查者的語音識別、采集被調(diào)者的按鍵反饋來實現(xiàn)回訪的數(shù)據(jù)收集。

        該應(yīng)用場景為2020 年的疫情防控提供了較大的幫助,社區(qū)通過AI 智能回訪與轄區(qū)人員電話溝通,并自動生成調(diào)查結(jié)果,當(dāng)識別到高危人士或調(diào)查發(fā)現(xiàn)高危情況,系統(tǒng)立刻實時在線將電話自動轉(zhuǎn)接人工,保證高危信息第一時間獲得處理和跟進(jìn)。所有通話中產(chǎn)生的調(diào)查結(jié)果自動形成標(biāo)簽分類統(tǒng)計,迅速形成報表,以便上報上級單位。

        2.3.3 AI客服政務(wù)大廳

        AI 客服所賦能的智慧政務(wù)是AI 語音技術(shù)的一個重要應(yīng)用場景。為了全面提升政務(wù)服務(wù)規(guī)范化、便利化水平,為群眾提供高效、便捷的政務(wù)服務(wù),國家指導(dǎo)各政務(wù)部門通過“12345”等政務(wù)服務(wù)熱線集中接受社會公眾的咨詢、求助、意見、建議和投訴,進(jìn)而整合現(xiàn)有政民互動渠道,提供政策法規(guī)、辦事程序、生活指南及查詢有關(guān)部門職能范圍等咨詢服務(wù)。與此同時,國家標(biāo)準(zhǔn)委制定了量化標(biāo)準(zhǔn),即每周7 天,每天24 h 工作制,電話受理時應(yīng)在15 s之內(nèi)接聽,連續(xù)24 h內(nèi)呼叫接通率應(yīng)大于等于95%。

        AI 客服恰恰契合智慧政務(wù)的一系列要求,依托電話、微信、app、網(wǎng)絡(luò)在線等眾多服務(wù)渠道,通過智能語音、文字、圖片、視頻等多種方式與公眾進(jìn)行遠(yuǎn)程多媒體交互,并且對外提供智能服務(wù)接待、業(yè)務(wù)導(dǎo)辦與辦理、智能外呼調(diào)研等服務(wù),支撐政府“不見面”服務(wù)的順利開展;對內(nèi)基于大數(shù)據(jù)和AI等技術(shù),提供輿情分析、決策輔助等服務(wù),利用智能化手段助力政務(wù)服務(wù)的高效開展,提高政府服務(wù)力、公信力,提升群眾滿意度。

        2.3.4 AI質(zhì)檢通信監(jiān)管

        通話監(jiān)管是AI質(zhì)檢產(chǎn)品一個較新的應(yīng)用場景,與面向客服水平提升的質(zhì)檢場景不同,此場景下的目標(biāo)是檢驗通話過程是否存在違規(guī)的紅線業(yè)務(wù),如互聯(lián)網(wǎng)金融推銷、詐騙等情況,以及號碼在使用過程中是否存在不符合登記用途的通話行為,并不關(guān)心業(yè)務(wù)邏輯和話術(shù)的匹配性以及語調(diào)語速的規(guī)范性。

        該場景的難點在于大多通話無標(biāo)準(zhǔn)話術(shù),故在質(zhì)檢流程上引入了2 個環(huán)節(jié),分類器初步分類與關(guān)鍵詞比對。分類器初步分類是指采用深度學(xué)習(xí)的方式,使用標(biāo)記好分類的大規(guī)模數(shù)據(jù)集對分類器進(jìn)行訓(xùn)練,將分類器訓(xùn)練成為能夠理解篇章級對話并能通過對話識別其所屬行業(yè)的分類器,再將此分類器對實際錄音進(jìn)行推斷。推斷分類后的錄音擁有了分類的標(biāo)簽,再根據(jù)分類標(biāo)簽對應(yīng)的關(guān)鍵詞庫進(jìn)行關(guān)鍵詞比對,對錄音進(jìn)行最終的違規(guī)性判別確認(rèn)。AI 質(zhì)檢和傳統(tǒng)質(zhì)檢的全量文本比對相比,引入了分類環(huán)節(jié),省去了關(guān)鍵詞庫每個詞匯要全文搜索的計算步驟,計算效率更高,誤報率與漏檢率更低,更適合于大話務(wù)量的語音平臺質(zhì)檢。

        3 AI語音產(chǎn)品與云呼叫中心對接方案

        在技術(shù)浪潮推動下,面向呼叫中心、客服中心的智能化升級是大勢所趨,但AI語音產(chǎn)品如何更好地內(nèi)嵌到已有的呼叫中心系統(tǒng)中,AI 語音技術(shù)如何更好地賦能呼叫中心業(yè)務(wù)場景是當(dāng)下智能化升級面臨的主要問題。

        一個數(shù)字化、云化的呼叫中心系統(tǒng)結(jié)構(gòu)通常分為接入管理、通信管理、基礎(chǔ)內(nèi)核、運營監(jiān)控管理、開放能力5部分,AI語音產(chǎn)品與呼叫中心系統(tǒng)在基礎(chǔ)內(nèi)核、運營監(jiān)控管理、開放能力3 個部分具有耦合關(guān)系(見圖5)。

        3.1 AI坐席與呼叫中心產(chǎn)品對接

        早期的AI 語音技術(shù)是通過媒體資源控制協(xié)議(MRCP)以語音識別(ASR)和語音合成(TTS)這種AI語音原子能力的方式,面向語音通信產(chǎn)品提供服務(wù)。該協(xié)議依賴會話發(fā)起協(xié)議(SIP)來協(xié)調(diào)和管理MRCP客戶端和服務(wù)端之間的會話,依賴會話描述協(xié)議(SDP)來描述、發(fā)現(xiàn)和進(jìn)行媒體交互,并依賴SIP 和SDP來與媒體服務(wù)端之間建立媒體會話交互。當(dāng)媒體通道建立后,客戶端可以通過SIP 會話控制語音資源服務(wù)端上的媒體處理資源。該協(xié)議最后一個版本定稿于2012 年,它的缺點在于未考慮到NLP 能力,也未考慮人機對話中常見的打斷、靜音等擬人化場景,故呼叫中心平臺要支持靜音檢測、打斷識別、語義分析、情緒識別等功能,并要維系多輪對話、處理話術(shù)邏輯、把握人機切換時機,對呼叫中心要求過高,AI 整體擬人化效果很低,并非主流方案。

        當(dāng)前AI 坐席是作為整體能力提供服務(wù)的,即ASR、NLP、TTS 集成在一起,其優(yōu)勢在于支持靜默提醒、打斷功能,擬人化程度非常高;可根據(jù)需求編輯跳轉(zhuǎn)人工坐席的話術(shù)節(jié)點,減少了對呼叫中心平臺的適配要求;話術(shù)可基于深度學(xué)習(xí)技術(shù)針對不同行業(yè)背景進(jìn)行訓(xùn)練與調(diào)優(yōu),話術(shù)制作可以通過錄音師錄音替代TTS 合成,進(jìn)一步提升了通話過程中的客戶體驗。整體能力調(diào)用有2 種具體實現(xiàn)方案,每種方案皆支持機器人意向篩選(AI 預(yù)測式外呼)、在線轉(zhuǎn)人工坐席(人機耦合)、坐席輔助(監(jiān)聽對話主動介入)的應(yīng)用場景。

        圖5 AI語音產(chǎn)品與呼叫中心產(chǎn)品耦合關(guān)系圖

        3.1.1 AI坐席API對接

        該對接方案是指呼叫中心使用AI 語音產(chǎn)品提供的Restful API對其能力進(jìn)行整體調(diào)用,步驟如下:

        a)呼叫中心平臺獲取APP_KEY 和APP_SE?CRET,配置信息回調(diào)地址,用于調(diào)用API 并接收AI 回傳的數(shù)據(jù)。

        b)呼叫中心平臺調(diào)用創(chuàng)建任務(wù)接口,選擇話術(shù)、設(shè)置AI 坐席數(shù)量,并將AI 坐席設(shè)置成呼入坐席狀態(tài);呼叫中心平臺調(diào)用客戶導(dǎo)入接口,將CRM 中的客戶名稱和電話號碼批量導(dǎo)入到任務(wù)中。

        c)呼叫中心平臺通過雙向回?fù)艿姆绞剑p呼)發(fā)起呼叫,其中AI 語音平臺需要將AI 坐席的狀態(tài)(如未呼通、對方忙線、對方掛斷)實時通知呼叫中心平臺。

        d)當(dāng)需要AI 坐席與人工坐席切換時,AI 語音平臺話術(shù)節(jié)點自動調(diào)用接口告知呼叫中心平臺,呼叫中心平臺將話務(wù)從AI 坐席和被叫的通話切換至人工坐席和被叫的通話。

        3.1.2 AI坐席SIP Trunk方式對接

        該對接方案是指呼叫中心向AI語音產(chǎn)品提供SIP中繼功能,由AI語音平臺借助呼叫中心的話務(wù)通道發(fā)起呼叫,步驟如下:

        a)呼叫中心提供人工坐席隊列呼入地址(SIP URI)供AI坐席轉(zhuǎn)接呼叫。

        b)在AI 話術(shù)中配置轉(zhuǎn)人工節(jié)點和轉(zhuǎn)接地址(SIP URI)。

        c)AI 語音平臺以SIP Trunk 形式與呼叫中心建立互聯(lián)互通,根據(jù)任務(wù)發(fā)起呼叫。

        d)AI坐席與客戶通話過程中觸發(fā)了轉(zhuǎn)人工節(jié)點,AI語音平臺通過SIP 協(xié)議將呼叫送到呼叫中心人工坐席隊列,同時將AI 與客戶的通話數(shù)據(jù)傳入呼叫中心,由人工坐席與客戶繼續(xù)通話。

        3.1.3 不同對接方式對比分析

        方式1 的主要調(diào)用方是呼叫中心平臺,優(yōu)勢在于整個呼叫流程由呼叫中心平臺進(jìn)行把控,呼叫頻次與業(yè)務(wù)處理并發(fā)能力配置比較靈活;劣勢在于呼叫中心平臺需要做一些適配開發(fā),且占用了2 個大網(wǎng)號碼與語音通道。

        基于多參數(shù)規(guī)劃的有源配電網(wǎng)分布式光伏容量評估方法//王宣定,吳文傳,劉鐳,劉海濤,潘東//(24):20

        方式2 的主要調(diào)用方是AI 語音平臺,其優(yōu)勢在于僅使用一個號碼與語音通道;劣勢在于并不是所有呼叫中心都支持SIP Trunk 方式對接,或呼叫中心的業(yè)務(wù)邏輯處理層無法感知通信層的請求,人工切換的業(yè)務(wù)回調(diào)無法實現(xiàn)。

        3.2 AI質(zhì)檢與呼叫中心產(chǎn)品對接

        AI 質(zhì)檢產(chǎn)品根據(jù)實時性的需求可分為離線質(zhì)檢與實時質(zhì)檢,離線質(zhì)檢的系統(tǒng)對接方式較為簡單,通過http或ftp的方式在呼叫中心平臺拉取或由呼叫中心平臺推送錄音文件與隨路數(shù)據(jù)即可,下文主要介紹實時質(zhì)檢系統(tǒng)對接方案。

        3.2.1 AI質(zhì)檢協(xié)議方式對接

        該方案使用MRCP 協(xié)議,將ASR 原子能力提供給呼叫中心平臺,但涉及到主被叫信息以及隨路數(shù)據(jù)的傳輸,需要對協(xié)議進(jìn)行修改,步驟如下:

        a)呼叫中心平臺呼出或呼入時,通過MRCP 協(xié)議調(diào)用AI語音平臺的AI實時轉(zhuǎn)寫能力。

        b)呼叫中心平臺將通話媒體數(shù)據(jù)與信令中的主被叫信息傳給AI語音平臺的質(zhì)檢系統(tǒng)進(jìn)行實時分析。

        c)將質(zhì)檢后信息以文本方式發(fā)至人工坐席所在PC,實現(xiàn)坐席彈屏的話務(wù)輔助。

        d)當(dāng)質(zhì)檢過程中識別到敏感詞時,AI語音平臺通知呼叫中心平臺進(jìn)行話路強制拆除。

        該方案通過交換機鏡像口獲取呼叫中心平臺的所有數(shù)據(jù),并通過協(xié)議分析的方式提取主被叫信息與媒體流,進(jìn)行解碼、轉(zhuǎn)寫與質(zhì)檢,步驟如下:

        a)AI 語音平臺的抓包服務(wù)器與呼叫中心平臺接到同一個交換機上,其中交換機需做鏡像口配置。

        b)AI 語音平臺質(zhì)檢系統(tǒng)通過抓包服務(wù)器將抓取通話媒體數(shù)據(jù)與信令中的主被叫信息,傳給AI語音平臺的質(zhì)檢系統(tǒng)進(jìn)行實時分析。

        c)將質(zhì)檢后信息以文本方式發(fā)至人工坐席所在PC,實現(xiàn)坐席彈屏的話務(wù)輔助。

        d)當(dāng)質(zhì)檢過程中識別到敏感詞時,AI語音平臺通知坐席,告警提示人工坐席手動拆除話路。

        3.2.3 不同對接方式對比分析

        方式1 主要通過協(xié)議方式實現(xiàn)系統(tǒng)對接,其優(yōu)勢在于通話數(shù)據(jù)在呼叫中心平臺進(jìn)行了復(fù)制,一路傳送至坐席,一路傳送至質(zhì)檢系統(tǒng)進(jìn)行分析,實時性較好,且可以通過告知呼叫中心平臺來進(jìn)行話路強拆;其劣勢在于協(xié)議標(biāo)準(zhǔn)沒有坐席、技能組等業(yè)務(wù)側(cè)的關(guān)鍵字段,呼叫中心平臺對于非標(biāo)準(zhǔn)字段需要做適配開發(fā)。

        方式2 主要通過抓包方式實現(xiàn)系統(tǒng)對接,其優(yōu)勢在于呼叫中心平臺無需做任何更改;劣勢在于需要網(wǎng)絡(luò)設(shè)備的配合,對抓包服務(wù)器的網(wǎng)絡(luò)吞吐性能要求較高;抓包與協(xié)議解析增加了處理時延;無法對話路進(jìn)行強拆僅能以文本形式告警給坐席端。

        4 思考與展望

        以AI坐席產(chǎn)品與AI質(zhì)檢產(chǎn)品為代表的AI語音產(chǎn)品實現(xiàn)了主流AI技術(shù)的快速產(chǎn)品化落地,短短幾年內(nèi)產(chǎn)品成熟度不斷提高,并幾乎在各個垂直行業(yè)都創(chuàng)造出極具價值的商業(yè)案例,突破了語音業(yè)務(wù)傳統(tǒng)技術(shù)帶來的瓶頸,產(chǎn)生了巨大的經(jīng)濟利益與社會效益。

        然而,AI 產(chǎn)品對人工的完全替代還是遙不可及的,在呼叫中心或客服中心,AI 坐席作為人工坐席入口的第一防線,這種輔助性地位仍將長期保持不變。隨著AI語音技術(shù)的進(jìn)一步演進(jìn),AI語音產(chǎn)品的技術(shù)指標(biāo)也會不斷提升,但如自然語言理解、機器學(xué)習(xí)中的自學(xué)習(xí)技術(shù)需有顛覆性的突破,AI 的理解力、回答力、執(zhí)行力才會有質(zhì)的飛躍。

        在可預(yù)期的未來,AI 語音能力將會與AI 視頻能力、文本信息的數(shù)據(jù)挖掘能力進(jìn)行進(jìn)一步整合,輸出一個感知智能與認(rèn)知智能相結(jié)合的完整AI能力,并支持渠道融合、數(shù)據(jù)融合的各類擴展,在對復(fù)雜語義、復(fù)雜情感的判斷上,對工單流轉(zhuǎn)、業(yè)務(wù)流程的理解上,對垂直行業(yè)細(xì)分領(lǐng)域的積累上,都會明顯優(yōu)于人工。屆時,圍繞AI語音技術(shù)的智能交互結(jié)合各類渠道,將觸及行業(yè)、企業(yè)、個人所有溝通關(guān)系,智能交互產(chǎn)品將以獨立自主營銷拓客、獨立自主解決用戶問題為根本導(dǎo)向,進(jìn)行主動聯(lián)絡(luò)、意圖判斷乃至管理決策,營造出嶄新的政企智能服務(wù)生態(tài)。

        中文亚洲一区二区三区| 日本免费不卡一区| 777久久| 亚洲精品国产主播一区二区| 女同一区二区三区在线观看 | 国产免费人成视频网站在线18| 乱码丰满人妻一二三区| 乌克兰少妇xxxx做受6| 国产精品爽爽VA吃奶在线观看| 国产乱子伦一区二区三区国色天香| 男女猛烈拍拍拍无挡视频| 九九视频在线观看视频6| 午夜无码亚| 国产精品亚洲一区二区三区16| 成人做受黄大片| 国产成人精品电影在线观看18| 国产激情视频免费观看| 91自拍视频国产精品| 久久综合国产乱子伦精品免费| 动漫在线无码一区| 久久99国产精品久久99密桃| 国产极品粉嫩福利姬萌白酱| 人妻影音先锋啪啪av资源| 在线无码精品秘 在线观看| 91精品人妻一区二区三区水蜜桃| 乱码丰满人妻一二三区| 日韩中文字幕中文有码| 精品人妻夜夜爽一区二区| 亚洲youwu永久无码精品| 免费人成视频在线观看网站| 亚洲AV无码乱码精品国产草莓| 亚洲精品久久蜜桃av| 人人色在线视频播放| 久久九九有精品国产尤物| 亚洲人妻精品一区二区三区| 色欲欲www成人网站| 香蕉人妻av久久久久天天| 日韩人妻中文字幕一区二区| 一个人看的视频在线观看| 99精品国产综合久久久久五月天| 在线看亚洲十八禁网站|