亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        運(yùn)維場(chǎng)景下的多功能對(duì)話機(jī)器人設(shè)計(jì)

        2024-12-31 00:00:00孫一凱
        中國(guó)信息化 2024年12期
        關(guān)鍵詞:用戶模型

        一、概述

        近年來(lái)隨著各行業(yè)的發(fā)展,企業(yè)的數(shù)字化轉(zhuǎn)型已經(jīng)成為大勢(shì)所趨。企業(yè)將自己的核心業(yè)務(wù)系統(tǒng)云化、容器化不僅能夠提高對(duì)客戶數(shù)據(jù)信息的利用率、創(chuàng)建以客戶為中心的業(yè)務(wù),還能夠有效節(jié)約成本、對(duì)市場(chǎng)進(jìn)行更精確的劃分。但與此同時(shí)也帶來(lái)了許多的運(yùn)維痛點(diǎn),比如云端設(shè)備告警量大、故障根因定位困難、容器環(huán)境故障診斷對(duì)運(yùn)維人員專(zhuān)業(yè)水平要求較高,因此如何輔助企業(yè)對(duì)云端設(shè)備進(jìn)行運(yùn)營(yíng)維護(hù)成為業(yè)內(nèi)研究的重點(diǎn)。

        隨著知識(shí)圖譜,自然語(yǔ)言處理等相關(guān)技術(shù)的發(fā)展,問(wèn)答系統(tǒng)已經(jīng)擴(kuò)展到了眾多領(lǐng)域,在運(yùn)維場(chǎng)景下,對(duì)話機(jī)器人同樣也可以幫助企業(yè)相關(guān)人員完成運(yùn)維工作。通過(guò)與運(yùn)維機(jī)器人進(jìn)行人機(jī)交互,工作人員可以獲取專(zhuān)家運(yùn)維知識(shí)、可以給機(jī)器人下發(fā)運(yùn)維作業(yè)任務(wù),也可以與機(jī)器人進(jìn)行閑聊,這樣會(huì)大幅度提高運(yùn)維人員工作效率,使運(yùn)維人員從繁雜的重復(fù)性工作中解放出來(lái),且運(yùn)維機(jī)器人可以全天候工作,好處眾多。

        為解決運(yùn)維人員在實(shí)際生產(chǎn)中遇到的相關(guān)問(wèn)題,構(gòu)建了一個(gè)具有4種功能的運(yùn)維機(jī)器人,包括圖譜問(wèn)答(KBQA),知識(shí)對(duì)問(wèn)答(FAQ),任務(wù)型問(wèn)答(Task)以及基礎(chǔ)閑聊問(wèn)答。KBQA和FAQ類(lèi)似,它們可以幫助運(yùn)維人員解決一些運(yùn)維知識(shí)類(lèi)的問(wèn)題,例如“Spark的啟動(dòng)命令是什么?” “與**同屬一個(gè)機(jī)架的節(jié)點(diǎn)有哪些?”。任務(wù)型問(wèn)答可以幫助運(yùn)維人員完成實(shí)際的運(yùn)維操作動(dòng)作,例如“請(qǐng)執(zhí)行**作業(yè)”,“創(chuàng)建**群組”等?;A(chǔ)閑聊問(wèn)答則讓運(yùn)維機(jī)器人具備基礎(chǔ)的功能描述性問(wèn)答,例如它可以回答用戶輸入的“你好” “你會(huì)干什么?” “誰(shuí)創(chuàng)造了你?”等問(wèn)題。

        現(xiàn)有的運(yùn)維機(jī)器人大多是某一獨(dú)立功能的問(wèn)答系統(tǒng),例如常見(jiàn)的客服機(jī)器人屬于基礎(chǔ)閑聊和FAQ問(wèn)答相結(jié)合,特定功能型機(jī)器人屬于Task和基礎(chǔ)閑聊相結(jié)合。如何高效地將多功能場(chǎng)景集合在一個(gè)機(jī)器人中是本文要解決的問(wèn)題。

        二、對(duì)話機(jī)器人系統(tǒng)的設(shè)計(jì)

        本方案的整體功能劃分可以分為4個(gè)部分,Task插件模塊(part1),知識(shí)庫(kù)QA模塊(part2),Rasa模型預(yù)測(cè)模塊(part3)和準(zhǔn)確率修正模塊(part4),我們的機(jī)器人定位是能夠?yàn)檫\(yùn)維人員提供一問(wèn)一答的運(yùn)維知識(shí)檢索、基礎(chǔ)的簡(jiǎn)單閑聊和基于多輪對(duì)話的運(yùn)維Task執(zhí)行,即前兩個(gè)任務(wù)都是一問(wèn)一答的形式,而第三個(gè)任務(wù)可以實(shí)現(xiàn)多輪對(duì)話的形式。

        (一)Task插件模塊(part1)

        作為運(yùn)維機(jī)器人使用最多的便是Task場(chǎng)景,這是一個(gè)基于專(zhuān)家規(guī)則的模塊,該部分我們?cè)O(shè)計(jì)了關(guān)鍵詞字典和正則表達(dá)式用來(lái)匹配Task場(chǎng)景的問(wèn)答語(yǔ)句。例如在“建立群聊”的Task場(chǎng)景中,我們可以配置相似關(guān)鍵詞的字典,如“創(chuàng)建聊天群、構(gòu)建群組、建立群組、拉建群聊”等,并通過(guò)正則表達(dá)式的形式進(jìn)行配置,如“(構(gòu)建|創(chuàng)建|拉建)(.+ )(群聊|群組|聊天群)”。該模塊通過(guò)配置文件或以前端界面工具的方式提供給后續(xù)開(kāi)發(fā)者,使得開(kāi)發(fā)人員很方便的可以根據(jù)實(shí)際情況調(diào)整專(zhuān)家規(guī)則,或在新增意圖時(shí)增加專(zhuān)家規(guī)則。

        我們通過(guò)對(duì)現(xiàn)場(chǎng)用戶真實(shí)的使用數(shù)據(jù)進(jìn)行了統(tǒng)計(jì),并通過(guò)part1模塊進(jìn)行相應(yīng)問(wèn)答記錄的分析,截取了80%左右的task問(wèn)答語(yǔ)料,被截留的語(yǔ)句無(wú)需在經(jīng)過(guò)后續(xù)的KBQA或者FAQ問(wèn)答模型的檢測(cè),而是直接前往part4中的Task場(chǎng)景進(jìn)行處理,明顯提升了機(jī)器人的意圖識(shí)別速度。

        其次,part1還用于檢測(cè)當(dāng)前是否處于多輪對(duì)話狀態(tài)中。多輪對(duì)話狀態(tài)的檢測(cè)我們依賴(lài)目前業(yè)界流行的Rasa開(kāi)源框架完成。Rasa開(kāi)源框架通過(guò)維護(hù)對(duì)話狀態(tài)跟蹤(DST)來(lái)實(shí)現(xiàn)對(duì)對(duì)話歷史、狀態(tài)等信息的記錄。如果處于多輪對(duì)話狀態(tài)中時(shí),根據(jù)我們的實(shí)際情況,多輪對(duì)話只存在于Task場(chǎng)景中。那么新來(lái)的句子就不需要重復(fù)進(jìn)行Task場(chǎng)景的匹配也不會(huì)進(jìn)入part2進(jìn)行知識(shí)檢索,而直接進(jìn)行多輪對(duì)話的操作。例如用戶輸入“拉建群聊”的指令后,機(jī)器人會(huì)智能分析意圖,并進(jìn)行追問(wèn)“請(qǐng)輸入需要?jiǎng)?chuàng)建的群聊名稱(chēng)”來(lái)引導(dǎo)用戶提供必要數(shù)據(jù),這時(shí)候用戶再輸入的群名稱(chēng)可能性就會(huì)很多,如用戶可以輸入“如何開(kāi)啟redis集群”,此時(shí)的輸入與我們知識(shí)庫(kù)存放的QA問(wèn)答的數(shù)據(jù)重合,如果沒(méi)有對(duì)話狀態(tài)的檢測(cè),機(jī)器人就會(huì)錯(cuò)誤的返回知識(shí)庫(kù)中存在的問(wèn)題答案了。

        (二)知識(shí)庫(kù)QA模塊(part2)

        當(dāng)part1部分沒(méi)有匹配到專(zhuān)家規(guī)則且不在多輪對(duì)話轉(zhuǎn)態(tài)中時(shí),數(shù)據(jù)流入part2。part2通過(guò)使用KBQA和FAQ模塊共同協(xié)作,實(shí)現(xiàn)對(duì)庫(kù)中存有的知識(shí)進(jìn)行相似度分析檢索,從而得到符合閾值的問(wèn)答對(duì)數(shù)據(jù)。

        KBQA模塊在本應(yīng)用中,主要采用基于答案排序的模式進(jìn)行處理。我們會(huì)首先對(duì)用戶輸入的內(nèi)容進(jìn)行命名實(shí)體識(shí)別(NER),然后對(duì)提取到的實(shí)體放入知識(shí)圖譜中,關(guān)聯(lián)查找所有相關(guān)的三運(yùn)組,繼而計(jì)算用戶問(wèn)題與三元組中內(nèi)容的相似度。

        FAQ模塊中我們引入ES進(jìn)行數(shù)據(jù)管理與相似問(wèn)題的檢索。問(wèn)答對(duì)數(shù)據(jù)存儲(chǔ)在ES中并對(duì)輸入的問(wèn)句進(jìn)行分詞,停用詞,建索引,向量化,相似度計(jì)算等操作。因?yàn)榈古潘饕旧淼南拗疲覀兺ㄟ^(guò)近義詞表的引入,加強(qiáng)ES的相似度檢索能力及效果。例如“怎么restart電腦”,用戶實(shí)際意圖是希望知道重啟電腦的操作步驟,即相似的問(wèn)法可以是“怎么重啟電腦”,因此在實(shí)際應(yīng)用中,可以將近義詞表、中英翻譯表放入ES中實(shí)現(xiàn)關(guān)聯(lián)加速查詢(xún)。

        Part2模塊可靈活并行調(diào)用KBQA和FAS兩個(gè)接口服務(wù),實(shí)現(xiàn)并行預(yù)測(cè),提升預(yù)測(cè)結(jié)果效率和質(zhì)量。在實(shí)際生產(chǎn)中這里需要設(shè)定優(yōu)先級(jí),定級(jí)標(biāo)準(zhǔn)可以依據(jù)2個(gè)模型的性能高低情況,知識(shí)圖譜和問(wèn)答對(duì)數(shù)據(jù)的質(zhì)量、大小等情況。

        (三)RASA模型預(yù)測(cè)模塊(part3)

        通過(guò)part2模塊后如果不滿足相似度閾值則會(huì)進(jìn)入 part3部分,例如“你好”等基礎(chǔ)閑聊部分語(yǔ)句。

        在我們的實(shí)現(xiàn)中,因?yàn)門(mén)ask場(chǎng)景和閑聊場(chǎng)景的語(yǔ)料數(shù)量較為均衡,因此借用Rasa框架采用一個(gè)多分類(lèi)模型進(jìn)行意圖識(shí)別。用戶輸入的語(yǔ)句經(jīng)過(guò)該模型后,如果滿足所設(shè)定的閾值,則直接給出模型回答語(yǔ)句,例如滿足閑聊的閾值,則進(jìn)行閑聊回答。如果part1中未過(guò)濾的Task語(yǔ)句來(lái)到part3,則會(huì)在part3進(jìn)行意圖識(shí)別執(zhí)行。如果不滿足閾值,例如用戶隨意輸入了一串隨機(jī)字符“asdasdasd”,則通過(guò)rasa框架的FallbackPolicy策略給出設(shè)定好的默認(rèn)回答,如“我還不理解您的意思,請(qǐng)換個(gè)說(shuō)法”。意圖識(shí)別采用Rasa框架可以很方便,快速的通過(guò)配置文件搭建起整個(gè)pipeline。

        例如我們選擇針對(duì)中文優(yōu)化的BERT-wwm模型,意圖識(shí)別網(wǎng)絡(luò)結(jié)構(gòu)選擇Rasa組織在2020年提出的DIET網(wǎng)絡(luò)結(jié)構(gòu)。其中“正則+字典”部分可以作為意圖識(shí)別的特征工程來(lái)設(shè)計(jì),對(duì)于一些意圖不容易識(shí)別的邊緣語(yǔ)句,例如用戶輸入語(yǔ)句“創(chuàng)建XX系統(tǒng)故障處理溝通群組”,這種屬于短文本分類(lèi)場(chǎng)景,語(yǔ)句中無(wú)效的詞槽會(huì)嚴(yán)重干擾語(yǔ)句本身的意圖,這里我們做了一些輔助提升分類(lèi)效果的特征工程。借助DIET模型的Sparse features輸入端設(shè)計(jì)特征工程。

        特征的設(shè)計(jì)思路可以依靠“端到端”的思想來(lái)展開(kāi),可以包含一些通用特征(Feature)以及定制化特征:比如:英文、數(shù)字、正則符號(hào)、IP正則、某字典等。

        隨著Feature數(shù)量的增加,像Feature1,F(xiàn)eature2這種通用類(lèi)型的特征逐漸不再需要增加,其它有針對(duì)性的Feature根據(jù)問(wèn)答語(yǔ)句的實(shí)際情況進(jìn)行設(shè)計(jì),實(shí)際的一條語(yǔ)句形成的稀疏矩陣,可以想象成一個(gè)坐標(biāo)軸,其中X軸(橫坐標(biāo))代表稀疏特征的個(gè)數(shù),以0~6來(lái)代表7個(gè)特性(Feature),Y軸(縱坐標(biāo))代表分詞后的輸入內(nèi)容,以0~13來(lái)代表14個(gè)Token。相應(yīng)的內(nèi)容為1則表示該Feature滿足調(diào)整,為0則表示不滿足。經(jīng)過(guò)特征工程的處理,DIET模型可以對(duì)邊緣語(yǔ)句的識(shí)別率有所提升,基本可以做到在所有待分類(lèi)別中,正確類(lèi)別的置信度排名第一。

        (四)準(zhǔn)確率修正模塊(part4)

        如果用戶輸入的數(shù)據(jù)滿足專(zhuān)家規(guī)則或者正在多輪對(duì)話中,則數(shù)據(jù)流入part4模塊進(jìn)行意圖識(shí)別和Task任務(wù)。如果正在多輪對(duì)話中,則通過(guò)Rasa框架完成下輪對(duì)話的生成。

        如果不在多輪對(duì)話中,接下來(lái)有一個(gè)重要的步驟:基于專(zhuān)家規(guī)則的準(zhǔn)確率修正。由于Rasa框架要進(jìn)行多輪對(duì)話管理,所以仍需要在經(jīng)過(guò)part1過(guò)濾后再用Rasa進(jìn)行意圖識(shí)別,設(shè)立該步驟的原因是為了解決用戶輸入的某些模型不容易識(shí)別的邊緣場(chǎng)景導(dǎo)致置信度低于我們所設(shè)定的意圖識(shí)別閾值的情況。識(shí)別得到的Task場(chǎng)景的置信度未必會(huì)超過(guò)我們?cè)O(shè)定的閾值,因此這里需要添加準(zhǔn)確率修正模塊,對(duì)Rasa進(jìn)行2次開(kāi)發(fā),主動(dòng)提升這些帶有固定句式的語(yǔ)句置信度,如將置信度人為設(shè)定為0.99。

        三、結(jié)語(yǔ)

        本文關(guān)注在實(shí)際運(yùn)維中如何提高運(yùn)維人員的運(yùn)維體驗(yàn)和減輕實(shí)地操作的工作量,提出了一種基于運(yùn)維場(chǎng)景的多功能對(duì)話機(jī)器人,采用一種高效率的結(jié)構(gòu)將四種對(duì)話功能集成在一起,在保證功能強(qiáng)大的同時(shí)還保持了高實(shí)時(shí)性、高準(zhǔn)確率和擴(kuò)展性,適合在各個(gè)行業(yè)的運(yùn)維工作中部署,可以有效減輕運(yùn)維人員的工作量,提高運(yùn)維體驗(yàn)。

        作者單位: 中國(guó)移動(dòng)通信集團(tuán)上海有限公司

        猜你喜歡
        用戶模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        關(guān)注用戶
        3D打印中的模型分割與打包
        關(guān)注用戶
        關(guān)注用戶
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        Camera360:拍出5億用戶
        100萬(wàn)用戶
        用力草我小逼视频在线播放| 亚洲av无码第一区二区三区| 亚洲色成人网站www观看入口| 激情综合五月天开心久久| 成人高清在线播放视频| 精品福利一区二区三区免费视频| 99精品免费久久久久久久久日本| 婷婷第四色| 视频一区中文字幕日韩| 成人av片在线观看免费| 国产精品一区二区无线| 亚洲熟妇一区无码| 一本大道加勒比东京热| 亚洲天堂一区av在线| 亚洲天堂av一区二区| 免费观看18禁无遮挡真人网站| 欧美亚洲国产精品久久高清| 国产裸体AV久无码无遮挡 | 日韩有码在线观看视频| 亚洲人成网77777色在线播放| 国产精品免费看久久久8| 亚洲日韩精品欧美一区二区三区不卡 | 久久夜色精品国产噜噜噜亚洲av | 在线观看午夜视频国产| 热久久美女精品天天吊色| 中文在线天堂网www| 激情五月婷婷六月俺也去| 亚洲一区二区国产激情| 欧洲多毛裸体xxxxx| 又黄又爽又高潮免费毛片| 性无码国产一区在线观看| 亚洲国产天堂久久综合网| 国产成人一区二区三区| 日韩高清无码中文字幕综合一二三区 | 小12箩利洗澡无码视频网站| 亚洲 国产 韩国 欧美 在线| 男男亚洲av无一区二区三区久久 | 欧美精品aaa久久久影院| 国产精品综合女同人妖| 国产国产裸模裸模私拍视频| 国产91成人精品亚洲精品|