袁方 馬瑞霞 任海玲 白云峰 李彬 郭學(xué)茹
1.銀川市第一人民醫(yī)院;2.寧夏醫(yī)科大學(xué)
針對現(xiàn)有智能導(dǎo)診機(jī)器人存在的知識庫不完善、功能單一無法在實際場景中發(fā)揮作用、智能問答系統(tǒng)在應(yīng)答過程中還存在答非所問,應(yīng)答場景有限;后臺管理平臺設(shè)計不合理、語音處理引擎效果不佳、人臉處理引擎不精準(zhǔn)、工作地點固定、機(jī)器人外觀形象設(shè)計不人性化等問題設(shè)計智能導(dǎo)診機(jī)器人。(1)基于KANO模型確定智能導(dǎo)診機(jī)器人的必備功能、魅力功能、期望功能、無差異功能;(2)搭建6大知識庫,涵蓋24000余條知識,通過4大引擎技術(shù)實現(xiàn)自動巡邏、醫(yī)院信息查詢、科室推薦、專家查詢、科室導(dǎo)航、帶路引導(dǎo)等14大功能;(3)提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的智能問答系統(tǒng)設(shè)計與優(yōu)化方法實現(xiàn)流暢的人機(jī)問答,將各項單點技術(shù)融會貫通;(4)完善機(jī)器人后臺管理平臺,實現(xiàn)實時監(jiān)控機(jī)器人工作問答狀態(tài)、增刪改知識庫、數(shù)據(jù)統(tǒng)計分析等功能;(5)基于環(huán)形6麥克風(fēng)陣列實現(xiàn)遠(yuǎn)場高精度識別、基于多模態(tài)視覺技術(shù)實現(xiàn)場景人物全感知。本研究研發(fā)的智能導(dǎo)診機(jī)器人基本能夠?qū)崿F(xiàn)自助分診,提升患者滿意度、減少醫(yī)療機(jī)構(gòu)在導(dǎo)醫(yī)工作中的人力資源投入。
隨著物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)、區(qū)塊鏈等信息科學(xué)技術(shù)的迅速發(fā)展,智慧醫(yī)療、智慧醫(yī)院建設(shè)已成為提高醫(yī)療質(zhì)量和患者滿意度的重要手段[1]。醫(yī)院導(dǎo)診工作是患者進(jìn)入醫(yī)院享受的第一道服務(wù),具有工作難度系數(shù)低、患者就醫(yī)滿意度影響系數(shù)大的特點[2]。然而信息科學(xué)技術(shù)對醫(yī)院導(dǎo)診工作的賦能作用不明顯,傳統(tǒng)醫(yī)院導(dǎo)診工作仍然在消耗大量的人力資源用于服務(wù)患者對科室導(dǎo)航、就醫(yī)流程、專家咨詢等問題的咨詢回答上,存在機(jī)械性、重復(fù)性、低難度性[3]。本研究對銀川市某三甲醫(yī)院隨機(jī)抽取2692名人員進(jìn)行了問卷調(diào)查(導(dǎo)醫(yī)436名、患者2256名),80%的導(dǎo)醫(yī)表示會因為同時接待太多患者而不能給予很好的服務(wù),見圖1;95.08%的導(dǎo)醫(yī)表示在導(dǎo)診服務(wù)中,患者問詢的問題是重復(fù)的,見圖2;100%的導(dǎo)醫(yī)表示在導(dǎo)診服務(wù)中會遇見自己無法回答的問題,見圖3;85.25%的導(dǎo)醫(yī)表示希望有一款智能導(dǎo)診機(jī)器人來輔助導(dǎo)診工作,見圖4。
圖1 服務(wù)情況Fig.1 Service situation
圖2 問題重復(fù)情況Fig.2 Duplicate problem
圖3 會遇見自己無法回答的問題Fig.3 Will encounter questions I can't answer
圖4 對智能導(dǎo)診機(jī)器人導(dǎo)診的看法Fig.4 Views on intelligent guiding robot
近年來,智能導(dǎo)診機(jī)器人、嵌入移動端的智能問答系統(tǒng)相繼問世,但未能被醫(yī)院及廣大患者使用,主要原因包括:
(1)知識庫不完善,不能覆蓋患者所有的問題;(2)功能單一,不能滿足患者需求[4];(3)基于知識庫的智能問答系統(tǒng)大多都只能實現(xiàn)簡單的功能,無法在現(xiàn)實場景中發(fā)揮作用,此外在應(yīng)答過程中還存在答非所問、應(yīng)答場景有限等缺陷;(4)機(jī)器人后臺管理平臺設(shè)計不合理,不具有對實時監(jiān)控機(jī)器人工作問答狀態(tài)、增刪改知識庫、數(shù)據(jù)統(tǒng)計分析等功能;(5)智能導(dǎo)診機(jī)器人的語音處理引擎效果不佳,在門診大廳嘈雜環(huán)境中不能高效準(zhǔn)確識別患者的語音;(6)人臉處理引擎不精準(zhǔn),不能同時從多人中結(jié)合語音引擎處理鎖定咨詢患者;(7)工作地點固定,不容易被患者發(fā)現(xiàn)并體驗,存在被動性;(8)機(jī)器人外觀形象設(shè)計不人性化,導(dǎo)致患者體驗度不好,例如高度、頭部靈活度等;(9)嵌入移動端的智能問答系統(tǒng),這類系統(tǒng)普遍嵌入移動端的微信公眾號或小程序,患者需要打開程序,再進(jìn)一步輸入要咨詢的問題,操作繁瑣、不直接,用戶體驗感不好。
2015年銀川市第一人民醫(yī)院積極探索互聯(lián)網(wǎng)+醫(yī)療健康,成立了“互聯(lián)網(wǎng)+醫(yī)療健康研究中心”,基于該平臺,針對以上問題,2015年銀川市第一人民醫(yī)院積極探索互聯(lián)網(wǎng)+醫(yī)療健康,成立了“互聯(lián)網(wǎng)+醫(yī)療健康研究中心”,本研究研發(fā)了智能導(dǎo)診機(jī)器人,基本能夠?qū)崿F(xiàn)自助分診,提升患者滿意度、減少醫(yī)療機(jī)構(gòu)在導(dǎo)醫(yī)工作中的人力資源投入。
基于KANO模型的智能導(dǎo)診機(jī)器人功能屬性分析,見表1。
表1 基于KANO模型的智能導(dǎo)診機(jī)器人功能屬性Tab.1 Functional attributes of intelligent guidance robot based on KANO model
基于KANO模型,對收取的2692份問卷調(diào)查(導(dǎo)醫(yī)436名、患者2256名)結(jié)果進(jìn)行了分析,收集患者及導(dǎo)醫(yī)對智能導(dǎo)診機(jī)器人的功能需求,其中必備屬性4個,包括:“智能問答”“預(yù)約掛號”“院內(nèi)地圖導(dǎo)航”“隱私保護(hù)”;期望屬性1個,為“體驗反饋”;魅力屬性3個,包括“最佳科室匹配”“就診百科”“方言識別”;無差異屬性1個,為“人臉識別”。按照功能/服務(wù)提供優(yōu)先級,滿足順序為:必備屬性>期望屬性>魅力屬性>無差異屬性。因此,在智能導(dǎo)診機(jī)器人的開發(fā)上,應(yīng)優(yōu)先滿足智能問答、預(yù)約掛號、院內(nèi)地圖導(dǎo)航、隱私保護(hù)4大功能;其次,滿足期望屬性:體驗反饋;再次,滿足魅力屬性,最佳科室匹配、就診百科、方言識別3大功能;最后,本研究結(jié)合其他智能導(dǎo)診機(jī)器人在應(yīng)用過程中存在的問題,實現(xiàn)主動迎賓、娛樂聊天、交通查詢、專家查詢、健康宣教、科普視頻天氣查詢等共計14大功能?;贙ANO模型的智能導(dǎo)診機(jī)器人功能屬性分析見表1。Better-Worse系數(shù)圖如圖5所示。
圖5 Better-Worse系數(shù)圖Fig.5 Better-Worse coefficient diagram
針對智能導(dǎo)診機(jī)器人知識庫不完善,不能覆蓋患者所有的問題;功能單一,不能有效提供患者所需信息問題,搭建了6大知識庫,并基于此6大知識庫利用4大引擎技術(shù),實現(xiàn)14大功能,全面覆蓋患者就醫(yī)可能涉及到的各種咨詢問題。6大知識庫具體包括醫(yī)院信息知識庫,涵蓋知識1600余條;醫(yī)院專家知識,涵蓋知識200余條;醫(yī)院導(dǎo)航知識庫,涵蓋知識386條;科普知識庫,涵蓋知識6000余余條視頻知識及8000余余條文本知識;疾病診斷知識庫包括6000余余條疾病科室知識庫及6000余余條癥狀科室知識,其他知識庫涵蓋語料知識、天氣情況、交通情況等知識。4的引擎技術(shù)包括語音處理、數(shù)據(jù)采集、人臉處理、知識處理。14大功能包括:醫(yī)院信息查詢、主動迎賓、科室推薦、娛樂聊天、交通查詢、預(yù)約掛號、就診流程、專家查詢、科室導(dǎo)航、健康宣教、就醫(yī)評價、科普視頻、帶路引導(dǎo)、天氣查詢等。具體系統(tǒng)架構(gòu)如圖6所示。
圖6 智能導(dǎo)診機(jī)器人系統(tǒng)架構(gòu)圖Fig.6 Architecture diagram of intelligent guidance robot system
針對智能導(dǎo)診機(jī)器人在應(yīng)答過程中還存在答非所問,應(yīng)答場景有限問題,基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計優(yōu)化智能問答系統(tǒng)。(1)預(yù)處理過程中,使用詞袋模型結(jié)合Skip-gram模型生成最終的詞向量;(2)優(yōu)化詞向量加權(quán)模塊,擯棄僅根據(jù)詞頻決定詞向量權(quán)重的傳統(tǒng)方法,使用詞頻逆文檔頻率加權(quán)方法來提高關(guān)鍵詞的權(quán)重,輸出詞語表達(dá)結(jié)果;(3)聯(lián)合使用檢索匹配模型和基于注意力機(jī)制的生成對話模型產(chǎn)生應(yīng)答,不僅可以回答語料庫中預(yù)定義的問題,還可以通過長短期記憶網(wǎng)絡(luò)的訓(xùn)練和預(yù)測真正理解句子的含義,回答開放域的問題。智能問答系統(tǒng)框架如圖7所示。訓(xùn)練階段邏輯劃分如圖8所示。
圖7 智能問答系統(tǒng)框架Fig.7 Intelligent question answering system framework
圖8 訓(xùn)練階段邏輯劃分Fig.8 Logical division of training phase
針對智能導(dǎo)診機(jī)器人機(jī)器人后臺管理平臺設(shè)計不合理,不具有對實時監(jiān)控機(jī)器人工作問答狀態(tài)、增刪改知識庫、數(shù)據(jù)統(tǒng)計分析等功能,搭建覆蓋后臺管理、機(jī)器人、用戶操作三大平臺。后臺管理平臺可以實現(xiàn):數(shù)據(jù)統(tǒng)計、知識庫維護(hù)、實時監(jiān)控、遠(yuǎn)程操控等功能;機(jī)器人平臺可實現(xiàn)語音識別、人臉識別、傳感器感知、定位導(dǎo)航等功能;用戶操作平臺可實現(xiàn)預(yù)約掛號、觸屏操控、語音咨詢等功能。機(jī)器人三大平臺功能架構(gòu)如圖9所示。
圖9 機(jī)器人三大平臺功能架構(gòu)圖Fig.9 Functional architecture diagram of the three robot platforms
針對智能導(dǎo)診機(jī)器人的語音處理引擎效果不佳,在門診大廳嘈雜環(huán)境中不能高效準(zhǔn)確識別患者的語音問題,基于環(huán)形6麥克風(fēng)陣列,通過語音增強(qiáng)、聲源定位技術(shù)、去混響技術(shù)、聲源信號提取等技術(shù),實現(xiàn)噪聲抑制、回聲抑制、去混響、單或多聲源定位、聲源數(shù)目估計、源分離等功能,支持360°范圍拾音,±10°聲源定位,5m遠(yuǎn)場交互識別率92%,喚醒率95%。環(huán)形6麥克風(fēng)陣列如圖10所示,語音交互流程如圖11所示。
圖10 環(huán)形6麥克風(fēng)陣列Fig.10 Ring 6 microphone array
圖11 語音交互步驟Fig.11 Voice interaction steps
針對人臉處理引擎不精準(zhǔn),不能同時從多人中結(jié)合語音引擎處理鎖定咨詢患者問題,本研究基于多模態(tài)視覺技術(shù)實現(xiàn)場景人物全感知、實現(xiàn)人臉跟隨、性別年齡分析、手勢識別、物體識別定位等以實現(xiàn)場景人物全感知。全感知視覺識別如圖12所示。
圖12 全感知視覺識別Fig.12 Full perception visual recognition
針對智能導(dǎo)診機(jī)器人工作地點固定,不容易被患者發(fā)現(xiàn)并體驗,存在被動性的缺點,基于結(jié)合視覺和激光雷達(dá)的多傳感器融合導(dǎo)航技術(shù),融合激光雷達(dá)可以獲得極高的角度、距離和速度分辨率、抗干擾的能力強(qiáng)、適于工作在日益復(fù)雜和激烈的信息戰(zhàn)環(huán)境中及視覺導(dǎo)航系統(tǒng)速度快、信息量大、功能多的優(yōu)勢,實現(xiàn)智能避障礙、精準(zhǔn)定位、自主巡邏、帶路指引、地圖構(gòu)建等功能。
系統(tǒng)基于6大知識庫20000余條導(dǎo)診相關(guān)數(shù)據(jù)問答對、4大引擎技術(shù)、為患者提供14大功能,基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計優(yōu)化智能問答系統(tǒng),利用環(huán)形6麥克風(fēng)陣列、視覺和激光雷達(dá)結(jié)合的多傳感器融合導(dǎo)航技術(shù),實現(xiàn)感知獲取,為患者提供及時高效智能的導(dǎo)診服務(wù)。人機(jī)交互界面如圖13所示。
圖13 機(jī)器人工作流程圖Fig.13 Robot work flow chart
智能導(dǎo)診機(jī)器人系統(tǒng)界面如圖14所示。
圖14 人機(jī)交互(a)Fig.14 Human-computer interaction (a)
圖14 人機(jī)交互(b)Fig.14 Human-computer interaction (b)
本研究針對現(xiàn)有智能導(dǎo)診機(jī)器人存在的問題,基于KANO模型確定了智能導(dǎo)診機(jī)器人的必備功能、魅力功能、期望功能、無差異功能;搭建6了大知識庫,涵蓋24000余條導(dǎo)診數(shù)據(jù)問答對,通過4大引擎技術(shù)實現(xiàn)了14大功能;基于深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)了智能問答系統(tǒng)的設(shè)計與優(yōu)化;完善了機(jī)器人后臺管理平臺,基于環(huán)形6麥克風(fēng)陣列實現(xiàn)遠(yuǎn)場高精度識別、基于多模態(tài)視覺技術(shù)實現(xiàn)場景人物全感知。本研究研發(fā)的智能導(dǎo)診機(jī)器人基本能夠?qū)崿F(xiàn)自助分診,提升患者滿意度、減少醫(yī)療機(jī)構(gòu)在導(dǎo)醫(yī)工作中的人力資源投入。
數(shù)字技術(shù)與應(yīng)用2021年11期