馬藝珊 賓玉平 溫富先 伊加提·艾尼瓦
開發(fā)大學(xué)生情緒疏導(dǎo)機器人的重要性
據(jù)了解,我國高校大學(xué)生是抑郁癥高發(fā)的群體,他們因為課業(yè)、生活等種種問題導(dǎo)致抑郁。目前高校和國家針對青少年抑郁癥的全國范圍流行病學(xué)調(diào)查尚未完善,廣大群眾對于抑郁癥的了解仍浮于表面,通過“你是如何意識到自己可能有抑郁癥”的網(wǎng)絡(luò)調(diào)研可以發(fā)現(xiàn),患有抑郁癥的本人可能都未意識到自己患有抑郁癥,如圖1所示。
絕大多數(shù)抑郁癥患者都不愿意傾訴,因為他們害怕別人的不理解,擔(dān)心他人異樣的目光,而聊天機器人在一定程度上可以解決用戶的病恥感和不愿意誠實自我批露的問題,可以讓大學(xué)生們敞開心扉進(jìn)行傾訴。希望通過本項目能夠幫助大學(xué)生群體緩解焦慮、緊張、抑郁及失眠等狀況,將心理健康問題“遏制”在萌芽狀態(tài),不能任其發(fā)展到嚴(yán)重的心理問題或者危機問題。
具體方法
基于Python技術(shù)開發(fā)一款名為“傾心”的智能對話機器人,其非普通的人機對話系統(tǒng),而是面向心理健康領(lǐng)域的心理疏導(dǎo)工具,對用戶有著精神陪伴和情感慰藉等作用。
通過以下幾個步驟進(jìn)行開發(fā),可驗證其技術(shù)可行性:微信聊天機器人構(gòu)建、構(gòu)建知識圖譜、語義理解和對話生成四大核心模塊。
微信聊天機器人構(gòu)建
使用Python實現(xiàn)聊天機器人的方案有多種:AIML、chatterBot以及圖靈聊天機器人和微軟小冰等。考慮到本項目是面向心理健康領(lǐng)域,有很多專業(yè)的心理健康知識,可以選擇聊天機器人框架chatterBot。這是一款Python接口的,基于一系列規(guī)則和機器學(xué)習(xí)算法完成的聊天機器人。具有結(jié)構(gòu)清晰、可擴展性好、簡單實用等特點。chatterBot的工作流程如圖2所示。
首先,輸入模塊從終端或者API等輸入源獲取數(shù)據(jù)。輸入源會被指定的邏輯處理模塊分別處理,邏輯處理模塊會匹配訓(xùn)練集中已知的最接近輸入數(shù)據(jù)句子A,然后根據(jù)句子A去找到相關(guān)度最高的結(jié)果B,如果有多個邏輯處理模塊返回了不同的結(jié)果,會返回一個相關(guān)度最高的結(jié)果。
然后,輸出模塊(output adapter)將匹配到的結(jié)果返回給終端或者API。接入微信公眾號。首先在微信公眾號上開始服務(wù)器配置,填寫token和EncodingAESKey,選擇兼容模式,既有明文方便調(diào)試,又有信息加密。
構(gòu)建知識圖譜
要想實現(xiàn)針對心理健康特定領(lǐng)域的自動問答,需要在chatterbot中添加領(lǐng)域內(nèi)的訓(xùn)練數(shù)據(jù),chatterBot通過調(diào)用train函數(shù)訓(xùn)練。知識圖譜是訓(xùn)練數(shù)據(jù)中很重要的一部分。原始數(shù)據(jù),按照數(shù)據(jù)的結(jié)構(gòu)化程度來分,可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),根據(jù)數(shù)據(jù)的不同結(jié)構(gòu)化形式,采用不同的方法,將數(shù)據(jù)轉(zhuǎn)換為三元組的形式,抽取心理健康領(lǐng)域知識本體三元組(實體、關(guān)系、屬性),然后對三元組的數(shù)據(jù)進(jìn)行知識融合,主要是實體對齊以及和數(shù)據(jù)模型進(jìn)行結(jié)合,經(jīng)過融合之后,會形成標(biāo)準(zhǔn)的數(shù)據(jù)表示。為了發(fā)現(xiàn)新知識,可以依據(jù)一定的推理規(guī)則,產(chǎn)生隱含的知識,所有形成的知識經(jīng)過一定的質(zhì)量評估,最終進(jìn)入知識圖譜。知識圖譜的構(gòu)建過程如圖3所示。
語義理解
語義理解(NLU)是通過一系列的AI算法,將文本解析為結(jié)構(gòu)化的、機器可讀的意圖與詞槽信息,便于互聯(lián)網(wǎng)開發(fā)者更好地理解并滿足用戶需求。通常來說,語義理解一般分為基于統(tǒng)計的方法與基于規(guī)則的方法?;谝?guī)則的方法通過事先制定的各種各樣的規(guī)則進(jìn)行解析,并且不依賴數(shù)據(jù)量。同時基于規(guī)則的方法缺點也很明顯,由于語言的復(fù)雜性,解析自然語言就需要指定大量的解析規(guī)則。所以要將規(guī)則定義在心理健康領(lǐng)域,這方面需要大量的心理專業(yè)知識,無疑會增加很大難度?;诮y(tǒng)計的方法具有較強的魯棒性,一般來講,數(shù)據(jù)量越大訓(xùn)練出的模型的表現(xiàn)就會越好,其缺點就是需要大量訓(xùn)練模型,而大量優(yōu)質(zhì)數(shù)據(jù)的獲取有一定難度。
對話生成
對話生成是根據(jù)執(zhí)行一些語法以及語義規(guī)則生成自然語言的過程。通過自動化語義理解,將用戶對話映射到對應(yīng)的知識本體,使用自然語言文本生成技術(shù),給出自然、準(zhǔn)確的答復(fù)。對話生成在聊天機器人系統(tǒng)中起到至關(guān)重要的作用,相當(dāng)于人類的大腦,可以根據(jù)歷史對話內(nèi)容對當(dāng)前狀態(tài)進(jìn)行決策。將背景知識通過編碼融入到傳統(tǒng)模型中,可提高模型生成對話的豐富程度,在與人交互的過程中能夠記憶上下文話題語境。在生成答復(fù)時充分考慮語境,解決了目前聊天機器人中普遍存在的前后回復(fù)不一致、回復(fù)內(nèi)容與聊天語境大相徑庭等問題。
“傾心”的智能對話機器人特點和創(chuàng)新點
特點
本項目不同于其他心理健康機器人,是專門針對青少年群體的。利用與人工與智能相結(jié)合的方式對使用者進(jìn)行問答分析,拉近與用戶之間的距離,積極引導(dǎo)青少年群體進(jìn)行獨立思考,而非沉浸在自我情緒中,自我拉扯無法排解。通過如朋友般的聊天方式使用戶身心往健康樂觀的狀態(tài)發(fā)展,減少焦慮、抑郁情緒的產(chǎn)生。用戶在平臺上所傾訴的一些心理情緒、壓力等,軟件后端會定時刪除數(shù)據(jù)來保護(hù)用戶的隱私,不用擔(dān)心個人信息及情況泄露等問題,真正做到信息安全,用戶放心。
創(chuàng)新點
比起校內(nèi)開設(shè)的心理咨詢室,機器人更能使得青少年放下“戒備”,并且能集結(jié)專家的解答和疏導(dǎo),滿足大學(xué)生線上心理健康問題的咨詢需要。目前絕大部分來聊天機器人都是基于人工規(guī)則,“傾心”建立的心理知識問答庫,從語料庫和對話記錄中自動學(xué)習(xí),建立知識圖譜和實體關(guān)聯(lián)。運用深度學(xué)習(xí)技術(shù),對文本信息達(dá)到深層次的語義分析和理解,極大地降低了人力成本。整合多種深度學(xué)習(xí)、自然語言理解技術(shù),能夠準(zhǔn)確理解用戶意圖、快速察覺用戶情緒,從而生成相應(yīng)的答復(fù),進(jìn)一步降低“答非所問”的出現(xiàn)幾率。
利用Python技術(shù)進(jìn)行機器人開發(fā),除幫助緩解相關(guān)人群的病癥問題,還能夠有效推進(jìn)我國在此領(lǐng)域的相關(guān)研究,從而朝著更為人性化的社會前進(jìn)。相信在情緒疏導(dǎo)機器人的幫助下,終有一日,抑郁癥患者的癥狀會被大眾所接納,他們對于自己的情緒也會有個正向的排解,這才是研發(fā)情緒疏導(dǎo)機器人的根本意義。