王 曦,曾廣平,喬 柱
(北京科技大學(xué) 計(jì)算機(jī)與通信工程學(xué)院,北京 100083)
心理健康越來(lái)越成為一個(gè)重要的社會(huì)關(guān)注熱點(diǎn)和國(guó)家文明進(jìn)步的重要內(nèi)容,而且采用新一代信息技術(shù)如何為心理健康提供科技支撐,是我們研究一個(gè)重要方向。正因?yàn)檫@種科學(xué)意義,本文選擇面向心理健康服務(wù),研究機(jī)器人的方法和技術(shù),力圖為心理健康服務(wù)提供智能化的數(shù)字化輔助工具和手段。
服務(wù)機(jī)器人領(lǐng)域現(xiàn)在依然存在許多尚未完全解決的科學(xué)問(wèn)題,同樣也涉及非常多的關(guān)鍵技術(shù)。比如:
1)具有過(guò)渡過(guò)程的多執(zhí)行器的情感控制模式研究;
2)心理健康服務(wù)產(chǎn)生的圖靈測(cè)試方法,做一個(gè)服務(wù)機(jī)器人,試看哪位心理咨詢考試員誰(shuí)能通過(guò)她的考試;
3)具有專業(yè)知識(shí)教育的情感服務(wù)機(jī)器人(教師,醫(yī)生,心理咨詢師)智能對(duì)話庫(kù)內(nèi)容研究(1、直接匹配對(duì)話庫(kù);2、數(shù)據(jù)庫(kù)形式化之后,用機(jī)器學(xué)習(xí)、知識(shí)圖譜等建立對(duì)話模式);
4)體現(xiàn)人工智能與人工心理健康服務(wù)的方法和技術(shù)水平。
這些都是服務(wù)機(jī)器人的重要研究方向,需要不斷地對(duì)其進(jìn)行研究。
本文面向心理健康服務(wù),研發(fā)一種具有表情、語(yǔ)音交互、內(nèi)容數(shù)據(jù)庫(kù)等功能的智能機(jī)器人。分析了服務(wù)機(jī)器人的頭部運(yùn)動(dòng)系統(tǒng)的基本結(jié)構(gòu),對(duì)如何通過(guò)控制基本參數(shù)來(lái)產(chǎn)生表情的原理進(jìn)行了研究;提出了將人工心理與情感計(jì)算等領(lǐng)域的方法應(yīng)用到心理健康服務(wù)之中的想法;并提出了一種心理健康服務(wù)計(jì)算的心理咨詢輔助推理模型。建立一種面向心理健康服務(wù)的機(jī)器人輔助系統(tǒng),希望可以為心理咨詢師及其相關(guān)人員提供智能輔助。
機(jī)器人基本動(dòng)作:
動(dòng)作表情功能(12個(gè)舵機(jī)、14個(gè)自由度)。
低頭(前屈)、抬頭(后伸)。
前屈、后伸最大活動(dòng)度如圖5所示。
左扭頭(左旋)、右扭頭(右旋)。
左旋、右旋最大活動(dòng)度如圖6所示。
左右擺頭:擺動(dòng)幅度為左右±25°。
張嘴動(dòng)作:頜關(guān)節(jié)最大張開(kāi)度25°。
眨眼動(dòng)作:左右眼瞼獨(dú)立控制,可同時(shí)眨眼,也可單獨(dú)眨眼。
眼球左右轉(zhuǎn)動(dòng):雙眼球聯(lián)動(dòng),左右轉(zhuǎn)動(dòng)幅度為±20°。
眼球上下轉(zhuǎn)動(dòng):雙眼球聯(lián)動(dòng),上下轉(zhuǎn)動(dòng)幅度為±20°。
微笑:左右側(cè)笑單獨(dú)控制,嘴角后拉最大幅度大約5mm。
眉毛上下挑眉,左右眉單獨(dú)控制,上挑最大幅度大約5mm。
眉毛向心皺眉,左右眉單獨(dú)控制,向心最大幅度大約5mm。
我們將下述的多種技術(shù)集成到心理健康服務(wù)機(jī)器人系統(tǒng)中。外形是一個(gè)人型機(jī)器人,內(nèi)嵌心理篩查和心理干預(yù)數(shù)據(jù)庫(kù)和知識(shí)庫(kù),面向?qū)嶋H應(yīng)用,研究驗(yàn)證心理健康服務(wù)計(jì)算研究的有效性和實(shí)用性。
圍繞心理健康和物聯(lián)網(wǎng)教育,我們搜集開(kāi)源數(shù)據(jù)庫(kù)并建立自己的數(shù)據(jù)庫(kù)把心理咨詢、老年生活照料作為對(duì)話服務(wù)主體內(nèi)容。建立一個(gè)面向健康生活服務(wù)的對(duì)話機(jī)器人助理。
目前,心理健康服務(wù)對(duì)話數(shù)據(jù)庫(kù)的建立主要分為:醫(yī)學(xué)、心理服務(wù)、日常對(duì)話?,F(xiàn)在已有10000多條對(duì)話條目,而且還可以增加。
醫(yī)藥類:主要包括該疾病的定義、病因、癥狀、治療、后遺癥、并發(fā)癥、護(hù)理與飲食,其中:腦梗死 19條數(shù)據(jù),高血壓 16條數(shù)據(jù),新冠肺炎 15條數(shù)據(jù),上呼吸道感染 23條數(shù)據(jù),糖尿病 18條數(shù)據(jù)等。
心理類:心理知識(shí)類308條數(shù)據(jù);心理咨詢的基本問(wèn)題對(duì)話庫(kù) 257條數(shù)據(jù);
日常對(duì)話類:日常對(duì)話 9600條數(shù)據(jù)。
我們的數(shù)據(jù)庫(kù)里,還有10000多家全國(guó)養(yǎng)老院數(shù)據(jù),以便于查詢各地的養(yǎng)老服務(wù)信息。
基于電機(jī)運(yùn)動(dòng)的控制指令,組合生成復(fù)雜、復(fù)合的機(jī)器人表情動(dòng)作,是表情機(jī)器人的基本研究問(wèn)題。
在如何理解人類的面部表情的設(shè)計(jì)方面,本文根據(jù)人體解剖學(xué)的理論知識(shí)來(lái)理解人類面部的組織結(jié)構(gòu),并學(xué)習(xí)了組織結(jié)構(gòu)各個(gè)部分的具體功能,以及每個(gè)部分具體如何實(shí)現(xiàn)表情的原理。同時(shí),通過(guò)學(xué)習(xí)人臉表情的面部運(yùn)動(dòng)編碼系統(tǒng)(FACS)的相關(guān)定義來(lái)進(jìn)行機(jī)器人面部表情的設(shè)計(jì)和理解,獲得了每個(gè)運(yùn)動(dòng)單元和肌肉之間存在的對(duì)應(yīng)關(guān)系。使用上述理論所獲得的機(jī)器人表情設(shè)計(jì)方案,使用機(jī)器人表情控制編輯軟件來(lái)進(jìn)行實(shí)現(xiàn)機(jī)器人表情的最終實(shí)現(xiàn),其編輯軟件界面如圖1所示。
圖1 機(jī)器人表情控制編輯界面
心理健康服務(wù)對(duì)話機(jī)器人以心理咨詢學(xué)習(xí)訓(xùn)練為應(yīng)用對(duì)象,需要建立對(duì)話的智能決策模型,以期望真正能夠做出心理咨詢機(jī)器人輔助系統(tǒng)。
1.5.1 心理健康服務(wù)計(jì)算的心理咨詢輔助推理模型
這里首先考慮心理咨詢理論在心理健康服務(wù)計(jì)算中的指導(dǎo)作用,建立一種心理健康服務(wù)計(jì)算的心理咨詢輔助推理模型。如圖2所示。
圖2 心理健康服務(wù)計(jì)算的心理咨詢輔助推理模型
模型推理過(guò)程如下:輸入來(lái)訪者的數(shù)據(jù)(語(yǔ)言、行為、參數(shù)、圖像、視頻等等),采用圖像處理技術(shù)和數(shù)據(jù)分析等技術(shù)提取特征,再根據(jù)相關(guān)心理咨詢理論使用機(jī)器學(xué)習(xí)算法得到分類結(jié)果;輸出為根據(jù)前述方法獲得的來(lái)訪者內(nèi)在心理狀態(tài)模型的評(píng)估和預(yù)測(cè),并以各種展示技術(shù)呈現(xiàn)給心理咨詢師和來(lái)訪者,進(jìn)而起到輔助心理咨詢過(guò)程的作用。
1.5.2 建立一種面向心理咨詢的輔助應(yīng)用系統(tǒng)
這里主要是應(yīng)用人工心理逆問(wèn)題研究的理論方法,進(jìn)行具體實(shí)現(xiàn)。
將來(lái)訪者的數(shù)據(jù)(語(yǔ)言、行為、參數(shù)、圖像、視頻等)通過(guò)使用自然語(yǔ)言理解、計(jì)算機(jī)視覺(jué)技術(shù)和情境感知計(jì)算等技術(shù)提取特征,再根據(jù)相關(guān)心理咨詢理論使用機(jī)器學(xué)習(xí)算法得到分類結(jié)果;進(jìn)而得到心理咨詢來(lái)訪者的心理評(píng)估,推薦給心理咨詢師,輔助其分析來(lái)訪者的心理狀態(tài),提高心理咨詢的準(zhǔn)確度和效率。
技術(shù)路線:首先建立一個(gè)人的心理狀態(tài)結(jié)構(gòu)—分析數(shù)據(jù)-推理計(jì)算—得到精準(zhǔn)心理問(wèn)題狀態(tài)—縮短心理咨詢過(guò)程。目的在于建立一種面向心理咨詢的人工心理輔助應(yīng)用系統(tǒng),為心理咨詢師及其相關(guān)人員提供專家輔助系統(tǒng),進(jìn)而驗(yàn)證本研究的有效性和正確性。
心理咨詢機(jī)器人不僅僅有動(dòng)作交互,還需要智能化的語(yǔ)音交互,以及后臺(tái)計(jì)算和數(shù)據(jù)的支持,是一個(gè)整體的系統(tǒng)服務(wù)。將機(jī)器人講話內(nèi)容+對(duì)應(yīng)語(yǔ)音+相應(yīng)表情有機(jī)融合,研究機(jī)器人的表情控制模式,建立一種豐富的機(jī)器人控制指令庫(kù),實(shí)現(xiàn)和諧人際交互模式,是我們的研究目標(biāo)。
2.1.1 主要功能描述
1)智能語(yǔ)音交互功能
智能語(yǔ)音交互功能,可以實(shí)現(xiàn)用戶和虛擬小人的聊天對(duì)話。包括閑聊,問(wèn)答,百科,生活常識(shí),數(shù)學(xué)計(jì)算,等多個(gè)數(shù)據(jù)庫(kù),可以滿足大多數(shù)人的溝通上的需要。并且通過(guò)建立知識(shí)庫(kù),能夠進(jìn)行一問(wèn)多答,多問(wèn)一答,實(shí)現(xiàn)智能化交互。
2)智能語(yǔ)音服務(wù)功能
智能語(yǔ)音服務(wù)功能通過(guò)語(yǔ)音接口來(lái)為用戶提供以下相關(guān)服務(wù):可以為用戶查詢?nèi)我獬鞘凶罱?天的天氣和空氣質(zhì)量;也可以設(shè)置定時(shí)提醒,準(zhǔn)時(shí)自動(dòng)提醒用戶要做什么事;它也能夠查詢一些常見(jiàn)疾病的相關(guān)知識(shí),進(jìn)而給老年人提出一些身體健康的知識(shí)普及和保健指導(dǎo);也能幫助用戶查詢?nèi)珖?guó)各地的養(yǎng)老院或養(yǎng)老相關(guān)服務(wù)機(jī)構(gòu)的信息。本工作擁有獨(dú)一無(wú)二的全國(guó)養(yǎng)老院以及各類老年人服務(wù)中心的數(shù)據(jù)庫(kù)。這是由本項(xiàng)目組的幾位研究生通過(guò)一年的工作搜集并建立起來(lái)的,包含了幾十萬(wàn)條詳細(xì)的信息。
2.1.2 安卓開(kāi)發(fā)
Eclipse安卓開(kāi)發(fā)環(huán)境下,開(kāi)發(fā)配套APP,集視頻播放,語(yǔ)音識(shí)別,語(yǔ)義理解,語(yǔ)音合成,語(yǔ)音喚醒,人臉檢測(cè)于一體,并能通過(guò)WiFi模塊與各種硬件功能模塊進(jìn)行通信,實(shí)現(xiàn)語(yǔ)音交互和控制。還要與云端服務(wù)器進(jìn)行數(shù)據(jù)交換,利用云計(jì)算和大數(shù)據(jù)實(shí)現(xiàn)智能化的語(yǔ)音交互。
視頻播放功能則使用安卓自帶控件。
語(yǔ)音識(shí)別等技術(shù),應(yīng)用科大訊飛平臺(tái)的離線SDK和在線API,將各個(gè)語(yǔ)音功能模塊整合在一起,在邏輯上符合用戶語(yǔ)音交互需求,性能上健壯穩(wěn)定。
人臉識(shí)別技術(shù)現(xiàn)已成熟,本文所做工作應(yīng)用了face++人臉識(shí)別平臺(tái)來(lái)進(jìn)行視頻流的人臉檢測(cè)并將其集成在APP中。
機(jī)器人軟件控制流程圖如圖3所示。
圖3 機(jī)器人軟件控制流程圖
機(jī)器人硬件構(gòu)成如圖4所示。
圖4 機(jī)器人硬件構(gòu)成圖
心理咨詢機(jī)器人內(nèi)置安卓操作系統(tǒng),內(nèi)部集成有APP,可以進(jìn)行語(yǔ)音交互,人臉識(shí)別。紅外傳感器則是,當(dāng)檢測(cè)到用戶的接近時(shí),通過(guò)WiFi通信對(duì)安卓主機(jī)進(jìn)行喚醒。智能家居遙控模塊其實(shí)就是通過(guò)WiFi和APP進(jìn)行通信,實(shí)現(xiàn)智能控制的交互功能,即人們可以用語(yǔ)音與機(jī)器人交互,控制電燈開(kāi)關(guān)、電視開(kāi)關(guān)等功能。
這里的心理咨詢對(duì)話庫(kù),主要是將機(jī)器人當(dāng)做是人類心理咨詢師的助手,通過(guò)對(duì)話,機(jī)器人對(duì)來(lái)訪者進(jìn)行基本情況收集、初步的心理狀態(tài)進(jìn)行評(píng)估,進(jìn)而為心理咨詢的判斷提供客觀依據(jù),可以大大縮短心理評(píng)估的進(jìn)程。
圖5所示為我們的心理健康服務(wù)機(jī)器人外形圖。
圖5 機(jī)器人外形圖
圖6所示為心理健康服務(wù)機(jī)器人對(duì)話的程序調(diào)試界面。
圖6 心理健康服務(wù)機(jī)器人對(duì)話界面
實(shí)驗(yàn)表明,由于充分利用了實(shí)物機(jī)器人技術(shù)的真實(shí)感和親切感的優(yōu)點(diǎn),應(yīng)用于心理咨詢和老年人的服務(wù)。并結(jié)合了語(yǔ)音技術(shù),智能家居服務(wù)技術(shù)等,使交互更加人性化,大大加強(qiáng)了機(jī)器人服務(wù)性,機(jī)器人功能更加豐富。
本文面向心理健康服務(wù),研發(fā)實(shí)現(xiàn)了一種具有表情、語(yǔ)音交互、內(nèi)容數(shù)據(jù)庫(kù)等功能的智能機(jī)器人。為該智能服務(wù)機(jī)器人能夠產(chǎn)生表情功能而研發(fā)了面部表情的控制系統(tǒng);分析了機(jī)器人的頭部運(yùn)動(dòng)系統(tǒng)結(jié)構(gòu)及其產(chǎn)生表情的結(jié)構(gòu)性原理;首次提出了將人工心理與情感計(jì)算等領(lǐng)域的方法應(yīng)用到心理健康服務(wù)之中的想法;并提出了一種心理健康服務(wù)計(jì)算的心理咨詢輔助推理模型。建立了一種面向心理健康服務(wù)應(yīng)用的智能輔助系統(tǒng),可以為心理咨詢師及其相關(guān)人員提供智能輔助。這在國(guó)內(nèi)目前的心理咨詢應(yīng)用領(lǐng)域還未見(jiàn)類似研究。開(kāi)發(fā)的智能機(jī)器人為心理健康服務(wù)增加了新的數(shù)字化輔助工具和手段。