亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向精準(zhǔn)交互的智能預(yù)問診模型研究

        2023-10-09 01:46:20王培培
        關(guān)鍵詞:詞匯文本智能

        余 騫 王培培 劉 煒,3*

        1(廣州科技貿(mào)易職業(yè)學(xué)院信息工程學(xué)院 廣東 廣州 511442)

        2(鄭州大學(xué)互聯(lián)網(wǎng)醫(yī)療與健康服務(wù)河南省協(xié)同創(chuàng)新中心 河南 鄭州 450052)

        3(鄭州大學(xué)軟件學(xué)院 河南 鄭州 450002)

        0 引 言

        2018年4月,國務(wù)院辦公廳發(fā)布《關(guān)于促進(jìn)“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展的意見》,對(duì)互聯(lián)網(wǎng)醫(yī)院提出多項(xiàng)鼓勵(lì)政策;2018年8月,國家衛(wèi)健委和中醫(yī)藥管理局聯(lián)合制定《互聯(lián)網(wǎng)診療管理辦法(試行)》《互聯(lián)網(wǎng)醫(yī)院管理辦法(試行)》《遠(yuǎn)程醫(yī)療服務(wù)管理規(guī)范(試行)》三大指導(dǎo)性文件,進(jìn)一步明確了互聯(lián)網(wǎng)遠(yuǎn)程醫(yī)療在實(shí)際運(yùn)行中的操作規(guī)范和辦法。2020年5月,國家衛(wèi)健委印發(fā)《關(guān)于進(jìn)一步完善預(yù)約診療制度加強(qiáng)智慧醫(yī)院建設(shè)》的通知,要求加強(qiáng)智慧醫(yī)院建設(shè),推動(dòng)互聯(lián)網(wǎng)診療與互聯(lián)網(wǎng)醫(yī)院發(fā)展,加快建立線上線下一體化的醫(yī)療服務(wù)新模式。至此,基于互聯(lián)網(wǎng)的在線診療服務(wù)進(jìn)入快速發(fā)展階段。

        然而,作為互聯(lián)網(wǎng)診療重要參與方的患者,存在醫(yī)學(xué)專業(yè)知識(shí)嚴(yán)重不足、對(duì)自身病情缺乏全面了解、在線自主選擇醫(yī)生時(shí)無從下手等諸多問題,這在很大程度上影響了患者的就醫(yī)體驗(yàn),制約了互聯(lián)網(wǎng)診療的推廣實(shí)施。

        本文基于對(duì)以上問題的深度分析及對(duì)某三甲醫(yī)院互聯(lián)網(wǎng)診療現(xiàn)狀的充分調(diào)研,從“優(yōu)化互聯(lián)網(wǎng)診療流程,提升以用戶為中心的個(gè)性化主動(dòng)醫(yī)療服務(wù)體驗(yàn)”的角度出發(fā),通過在互聯(lián)網(wǎng)診療中增設(shè)基于分詞和權(quán)值相似度算法實(shí)現(xiàn)的智能預(yù)問診模塊,創(chuàng)新性地改進(jìn)和提升互聯(lián)網(wǎng)診療的方式及效率。

        1 研究現(xiàn)狀

        圍繞智能預(yù)問診模塊及與其相關(guān)的中文分詞和相似度算法,研究者們從不同視角進(jìn)行了探究,研究方向主要基于以下三大層面:

        1) 智能預(yù)問診方向。穆雨涵[1]以智能預(yù)問診的發(fā)展為視角,闡述了智能預(yù)問診在導(dǎo)診過程的具體應(yīng)用;王若佳等[2]從機(jī)器學(xué)習(xí)的角度出發(fā),為問診后的智能分診提供了研究方向;張崇宇[3]提出了基于知識(shí)圖譜構(gòu)建與自動(dòng)問答的系統(tǒng)解決方案,完成了醫(yī)療輔助問診服務(wù);薛芹等[4]提供了以“微信公眾號(hào)”為載體的智能問診模型搭建;Nie等[5]從6家互聯(lián)網(wǎng)醫(yī)院的建設(shè)和運(yùn)營模式出發(fā),闡釋了互聯(lián)網(wǎng)診療的多元理念;陳志豪等[6]基于注意力機(jī)制和字嵌入的多尺度卷積神經(jīng)網(wǎng)絡(luò)建模方法,分析問答對(duì)語義關(guān)系,實(shí)現(xiàn)中文醫(yī)療問答的匹配,奠定預(yù)問診的底層結(jié)構(gòu)基礎(chǔ);孔鳴等[7]以人工智能為導(dǎo)向,分析了其在診療中的輔助作用;劉建華[8]以廣東省第二人民醫(yī)院互聯(lián)網(wǎng)醫(yī)院為實(shí)例,強(qiáng)調(diào)了AI問診系統(tǒng)在互聯(lián)網(wǎng)問診前的應(yīng)用。

        2) 中文分詞方向。成于思等[9]提出統(tǒng)計(jì)與詞典相結(jié)合的分詞方法,完善詞典構(gòu)建流程;Fu等[10]通過中醫(yī)術(shù)語詞庫的構(gòu)建及標(biāo)注,實(shí)現(xiàn)了對(duì)中文古籍分詞;Zhao等[11]提出條件隨機(jī)場(chǎng)分割模型,描述影響分詞的字符特征和條件熵特征,實(shí)現(xiàn)漢語分詞;Li等[12]利用膠囊滑動(dòng)窗口提取特征,構(gòu)建膠囊的中文分詞模型,開發(fā)了中醫(yī)古文分詞器。

        3) 相似度計(jì)算方向。紀(jì)明宇等[13]研究金融領(lǐng)域中智能客服的句子相似度,構(gòu)建詞性糾正模型,減少中文歧義詞及分詞錯(cuò)誤;徐鑫鑫等[14]利用訓(xùn)練好的詞和句向量構(gòu)建特征權(quán)重系數(shù),提出基于聯(lián)合詞句的文本相似度算法。

        以上不同視角的研究及案例并未將基于醫(yī)學(xué)專業(yè)詞典的智能預(yù)問診與在線診療結(jié)合,亦未區(qū)分專業(yè)詞匯的權(quán)值問題。本文將使用擴(kuò)充的中文醫(yī)學(xué)專業(yè)詞典,利用基于分詞和權(quán)值的相似度算法改進(jìn)智能預(yù)問診模型,驗(yàn)證改進(jìn)算法對(duì)智能預(yù)問診效果的提升,同時(shí)將預(yù)問診模型與互聯(lián)網(wǎng)診療實(shí)際場(chǎng)景融合,研究智能預(yù)問診的現(xiàn)實(shí)意義。

        2 智能預(yù)問診模型

        智能預(yù)問診模型以國家診療指南為內(nèi)核,模擬臨床醫(yī)生診療思維,在患者掛號(hào)后,醫(yī)生接診前,利用互聯(lián)網(wǎng)、自然語言處理和人工智能等相關(guān)技術(shù),通過智能引導(dǎo)式問診,幫助醫(yī)生規(guī)范、全面采集患者的癥狀、體征、病史等疾病信息,結(jié)合中文醫(yī)療對(duì)話問答對(duì)庫為患者提供診療意見和建議,實(shí)現(xiàn)診療流程的優(yōu)化配置。

        本研究匯集整理了近八萬條醫(yī)療咨詢問答對(duì),建立疾病診斷的知識(shí)圖譜,當(dāng)用戶輸入關(guān)鍵字、自然語言短語或者句子時(shí),智能預(yù)問診模型通過對(duì)中文醫(yī)療對(duì)話問答對(duì)庫自動(dòng)精準(zhǔn)搜索,進(jìn)行相關(guān)答疑與多輪交互,引導(dǎo)式地采集患病信息。如詢問患者的既往病史和過敏史等,詢問結(jié)束后,選擇最佳解決方案反饋給患者,匹配就診科室和專業(yè)醫(yī)生,并按照病歷書寫規(guī)范完成一份預(yù)問診報(bào)告,及時(shí)傳輸至互聯(lián)網(wǎng)醫(yī)院平臺(tái)。

        本文基于現(xiàn)實(shí)的互聯(lián)網(wǎng)診療場(chǎng)景,依托中文醫(yī)療對(duì)話庫匹配模塊、用戶自然語言處理模塊和問題輸入輸出模塊等,植入智能預(yù)問診模型,實(shí)現(xiàn)智能語義匹配,使智能預(yù)問診融合到互聯(lián)網(wǎng)在線診療的整個(gè)過程中,具體框架如圖1所示。

        圖1 模型框架

        智能預(yù)問診模型形成了“診前患者自檢-診中快速診斷-診后隨時(shí)跟進(jìn)”三位一體的互聯(lián)網(wǎng)診療模式,其基本實(shí)現(xiàn)過程為:

        1) 患者選擇科室并將個(gè)人信息錄入健康檔案。

        2) 患者通過聊天界面發(fā)送所咨詢的文本信息,對(duì)于患者在預(yù)問診過程中使用的通俗語,如患病時(shí)間、誘因、癥狀位置等信息,利用自然語言處理技術(shù)去理解,將其翻譯為標(biāo)準(zhǔn)的醫(yī)學(xué)語言。

        3) 對(duì)文本信息進(jìn)行分詞處理。

        4) 在問答對(duì)庫中尋找相匹配的答案作為回復(fù)。

        5) 患者根據(jù)預(yù)問診的情況,可選擇遠(yuǎn)程問診,與醫(yī)生進(jìn)行在線音視頻問診。

        6) 在患者進(jìn)入視頻房間之前,醫(yī)生查看該患者的智能預(yù)問診過程,了解基本情況,通過視頻面對(duì)面問診,明確診斷結(jié)果,開具電子處方、住院證等。

        具體流程如圖2所示。

        圖2 模型問診流程

        智能預(yù)問診模型的交互方式以及對(duì)患者問診語言處理的反饋正確度決定了模型的準(zhǔn)確性及核心價(jià)值。因此,本文提出的基于分詞和權(quán)值的相似度算法,用于處理患者提問文本和中文醫(yī)療問答對(duì)庫中文本的相似度,將最相關(guān)問答對(duì)反饋給患者。

        3 基于分詞和權(quán)值的相似度計(jì)算

        在英文文本中,單詞之間有空格作為分界,而在中文文本中,詞是最小的獨(dú)立成分,詞語之間沒有界限符。目前,常用的求兩文本之間的相似度算法是基于字符的字段匹配[15],該算法在求取英文文本單詞相似度上表現(xiàn)突出,但在中文場(chǎng)景下表現(xiàn)一般。因此,本文提出改進(jìn)的基于分詞和權(quán)值的相似度算法,主要解決在中文環(huán)境中,求取文本之間相似度的問題。主要流程可概括為三大步驟,即:

        1) 導(dǎo)入自定義醫(yī)學(xué)專業(yè)詞典完成詞典擴(kuò)充。

        2) 分詞并完成詞匯的加權(quán)。

        3) 利用基于分詞和權(quán)值的相似度算法,求得文本之間的相似度,有針對(duì)性地對(duì)外反饋。

        3.1 自定義醫(yī)學(xué)專業(yè)詞典擴(kuò)充

        實(shí)際場(chǎng)景中,由于中文醫(yī)療詞匯的特殊性,詞與詞之間沒有明顯的分隔符,精準(zhǔn)分詞的前提是需要有一個(gè)合適的詞典,詞典的完備性一直是制約分詞器分詞準(zhǔn)確的關(guān)鍵,所以首先進(jìn)行詞典的擴(kuò)充。

        本文所采用的“盤古分詞器”支持自定義詞庫,因此,詞典擴(kuò)充主要通過Dictionary Manager組件向自定義醫(yī)學(xué)專業(yè)詞典中導(dǎo)入常見的醫(yī)療專業(yè)名詞,如醫(yī)生常用專業(yè)術(shù)語、藥品名、常見的疾病名稱等來完成。

        其具體做法是:將醫(yī)療專業(yè)名詞調(diào)研和統(tǒng)計(jì)后形成數(shù)據(jù)集,而后利用算法提取數(shù)據(jù)集中詞頻高的短語進(jìn)行自定義詞典導(dǎo)入,這一過程的難點(diǎn)是對(duì)數(shù)據(jù)集中高詞頻短語的提取。

        本文采用了關(guān)聯(lián)范數(shù)估計(jì)式(Association Norm Estimation)(以下簡(jiǎn)稱“AE式”)來幫助判斷專業(yè)詞匯,進(jìn)而完成高詞頻短語的提取,其基本表達(dá)式為:

        (1)

        式中:f(x)、f(y)、f(z)分別指x、y、z在數(shù)據(jù)集中出現(xiàn)的頻率。若x由n個(gè)漢字組成,y是x的前n-1個(gè)漢字,z是x的后n-1個(gè)漢字,則x=x1x2…xn-1xn,y=x1x2…xn-1,z=x2x3…xn-1xn,其中,xi(i=1,2,…,n)指的是第i個(gè)漢字。

        如果AE(x)的值越大,那么文本x是一個(gè)詞或者一個(gè)詞的一部分的概率就越大,而當(dāng)AE(x)很大時(shí),字符串x不一定是一個(gè)完整的詞,還需要依次擴(kuò)充字符串。

        實(shí)驗(yàn)證明,AE式適用于識(shí)別三個(gè)字及三個(gè)字以上的詞匯,通過使用滑動(dòng)窗口,利用右邊緣法來確定該詞邊界,可以有效地識(shí)別出醫(yī)療專業(yè)詞匯。

        3.2 分詞并加權(quán)

        利用“盤古分詞器”對(duì)用戶的提問文本進(jìn)行分詞并計(jì)算詞匯的權(quán)值。

        詞匯的權(quán)值表示該詞匯占某個(gè)文本的比重,權(quán)值越大,表示對(duì)文本語義的貢獻(xiàn)率就越大,正常情況下,在文本中每個(gè)詞語的貢獻(xiàn)率均等。但是,由于中文語義的特殊性以及醫(yī)療專業(yè)詞匯和普通詞匯對(duì)相似度計(jì)算所帶來的不同貢獻(xiàn),相似度的準(zhǔn)確性會(huì)受到一定影響。

        因此,為更好地找出患者提問的相似文本,提高相似度的準(zhǔn)確性,本文主要基于普通詞匯和醫(yī)療專業(yè)詞匯進(jìn)行加權(quán)的操作。

        1) 普通詞匯加權(quán)。依據(jù):根據(jù)主題重心詞通常在后半部分的特定,選取自然語言同義詞處理技術(shù)中重心后移規(guī)律匹配法。

        操作:假設(shè)某一文本由N個(gè)詞匯組成,各個(gè)詞的權(quán)值ω(k)由詞k在文本中的位置確定,如式(2)所示,首詞為1,以此類推。

        (2)

        式中:k表示該詞在文本中所處的位置。文本中,所有詞匯的權(quán)值之和如式(3)所示。

        (3)

        2) 醫(yī)療專業(yè)詞匯加權(quán)。依據(jù):由于一個(gè)文本中,所有的詞匯的權(quán)值之和為1,若提高專業(yè)詞匯的權(quán)值,必定要減小無意義詞匯的權(quán)值。

        操作:因“盤古分詞器”包含詞名、詞性和詞頻信息,若判定詞匯來源于擴(kuò)充后的詞典,則增大醫(yī)療專業(yè)詞匯的詞頻,提高專業(yè)詞匯的權(quán)值。同時(shí),去掉“的”“了”信號(hào)詞、疑問詞、標(biāo)點(diǎn)符號(hào)、連詞、助詞等無意義的停用詞及一些詞頻過小詞的權(quán)值,并將其自身所帶權(quán)值轉(zhuǎn)至醫(yī)療專業(yè)詞匯上。

        3.3 基于分詞和權(quán)值計(jì)算相似度算法

        相似度亦稱匹配度,指兩個(gè)文本可轉(zhuǎn)換的程度,相似度越高,表明兩個(gè)文本越易相互替換[15]。計(jì)算相似度的數(shù)學(xué)模型可用集合來表示,如圖3所示。

        圖3 文本集合

        假設(shè):A為待匹配文本詞集合,B為匹配文本詞集合,C為兩文本相同詞的集合,匹配度即為C占A和B全部的比重,C越大,則相似度越高。

        A與B的相似度如式(4)所示。

        (4)

        式中:Sim(A,B)表示文本A和文本B的相似度。C占A的比重為x,C占B的比重為y,換言之,x為C在A中所有詞的權(quán)值之和,y為C在B中所有詞的權(quán)值之和。x、y如式(5)所示。

        (5)

        由式(4)和式(5)推導(dǎo)匹配度公式如式(6)所示。

        (6)

        式中:x、y不為0。當(dāng)x或y為0時(shí),無交集,相似度為0。

        算法流程如圖4所示。

        圖4 算法流程

        主要關(guān)鍵步驟如下:

        1) 詞典擴(kuò)充:獲取自定義醫(yī)學(xué)詞典,實(shí)現(xiàn)詞典擴(kuò)充。

        2) 智能分詞:使用基于asp.net的“盤古分詞器”對(duì)患者提問文本進(jìn)行自動(dòng)分詞,過濾無意義的停用詞。

        3) 提取關(guān)鍵詞:利用智能分詞模塊提供的分詞結(jié)果,提取關(guān)鍵詞,將結(jié)果存入關(guān)鍵詞列表。

        4) 索引相關(guān)問答對(duì):根據(jù)關(guān)鍵詞模糊查詢醫(yī)療對(duì)話的問題及答案,獲取最相關(guān)問答對(duì)。

        Step1建立臨時(shí)表。包括編號(hào)和相關(guān)問答對(duì)兩個(gè)字段,用于存放按關(guān)鍵詞檢索返回的結(jié)果。

        Step2索引問答對(duì)。用關(guān)鍵詞模糊查詢醫(yī)療對(duì)話數(shù)據(jù)庫,并將結(jié)果存入Step1中建立的臨時(shí)表。

        5) 計(jì)算相似度:計(jì)算患者提問文本與相關(guān)問答對(duì)中提問文本之間的相似度,選取相似度最大的問答對(duì),將結(jié)果返回給患者。具體方法如下:

        Step1分詞。用帶自定義醫(yī)學(xué)專業(yè)詞典的“盤古分詞器”對(duì)患者提問文本和相關(guān)問答對(duì)進(jìn)行分詞。

        Step2加權(quán)。對(duì)文本中的詞加權(quán)處理。

        Step3求相似度。利用相似度公式,求得患者提問文本和每一條相關(guān)問答對(duì)之間的相似度,選取相似度最大的問答對(duì),將對(duì)應(yīng)答案返回給患者。

        4 實(shí)驗(yàn)評(píng)估

        4.1 數(shù)據(jù)集與實(shí)驗(yàn)環(huán)境

        4.1.1數(shù)據(jù)集

        本文研究過程進(jìn)行了大量的實(shí)驗(yàn),這些實(shí)驗(yàn)的數(shù)據(jù)集來源于Toyhom發(fā)布的Chinese medical dialogue data中文醫(yī)療對(duì)話庫,其提供近80萬例問答對(duì)。具體如表1所示。

        表1 中文醫(yī)療對(duì)話數(shù)據(jù)集

        4.1.2實(shí)驗(yàn)環(huán)境

        實(shí)驗(yàn)所涉及的前置操作主要包括:對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,清洗有噪聲數(shù)據(jù),分析并處理數(shù)據(jù)格式?;经h(huán)境為:語言環(huán)境:C#語言;框架結(jié)構(gòu):asp.net框架;數(shù)據(jù)庫:SQL Server 2008數(shù)據(jù)庫。

        4.2 實(shí)驗(yàn)?zāi)康募胺椒ú襟E

        4.2.1實(shí)驗(yàn)?zāi)康?/p>

        本文研究?jī)?nèi)容所涉及實(shí)驗(yàn)的目的主要有三項(xiàng),第一,驗(yàn)證詞典擴(kuò)充后的“盤古分詞器”分詞效果是否高于未擴(kuò)增詞典的分詞器(以下簡(jiǎn)稱“實(shí)驗(yàn)1”);第二,驗(yàn)證本文提出的基于分詞和權(quán)值的相似度算法的準(zhǔn)確性(以下簡(jiǎn)稱“實(shí)驗(yàn)2”);第三,對(duì)基于分詞和權(quán)值的相似度算法的優(yōu)劣進(jìn)行評(píng)判,驗(yàn)證智能預(yù)問診模型的準(zhǔn)確性(以下簡(jiǎn)稱“實(shí)驗(yàn)3”)。

        4.2.2實(shí)驗(yàn)方法

        1) 實(shí)驗(yàn)1操作方法及步驟。準(zhǔn)確率(p):分詞結(jié)果中,切分正確的詞語數(shù)量與所有詞語數(shù)量的比值,如式(7)所示。

        (7)

        召回率(r):分詞結(jié)果中,切分正確的詞語的總數(shù)量與文本中所有標(biāo)準(zhǔn)詞語數(shù)量的比值,如式(8)所示。

        (8)

        方法:利用是否加入自定義醫(yī)學(xué)專業(yè)詞典的盤古分詞系統(tǒng)對(duì)中文醫(yī)療對(duì)話數(shù)據(jù)集文本進(jìn)行分詞,計(jì)算分詞結(jié)果的準(zhǔn)確率和召回率。

        具體步驟如下:

        Step1初始化詞典dict.dct,導(dǎo)入自定義醫(yī)學(xué)專業(yè)詞匯。

        Step2輸入患者提問文本,進(jìn)行結(jié)構(gòu)化處理。

        Step3調(diào)用“盤古分詞器”對(duì)文本進(jìn)行分詞,查詢?cè)~典,反饋查詢結(jié)果,若有未登錄詞,存入自定義詞典。

        Step4保存分詞結(jié)果。

        操作流程如圖5所示。

        圖5 分詞流程

        2) 實(shí)驗(yàn)2操作方法及步驟。

        方法:利用文獻(xiàn)[15]與本文的方法求取文本之間的相似度。

        具體步驟如下:

        Step1選取數(shù)據(jù)集中的問答對(duì)。

        Step2利用基于自定義醫(yī)學(xué)專業(yè)詞典的“盤古分詞器”對(duì)問答對(duì)進(jìn)行智能分詞。

        Step3利用分詞和權(quán)值計(jì)算詞語對(duì)文本的語義貢獻(xiàn)率,將其作為權(quán)值。

        Step4用兩種算法分別計(jì)算相似度。

        Step5比較計(jì)算結(jié)果。

        實(shí)驗(yàn)流程如圖6所示。

        圖6 求相似度流程示意圖

        3) 實(shí)驗(yàn)3操作方法及步驟。評(píng)價(jià)指標(biāo):該實(shí)驗(yàn)采用召回率、正確率和F-測(cè)度值三項(xiàng)指標(biāo)進(jìn)行驗(yàn)證判斷。召回率r反映了被正確判定為正例數(shù)占總正例數(shù)的比率;正確率p反映了被正確判定為正例數(shù)占被判定為正例數(shù)的比率;F-測(cè)度值f綜合了召回率和正確率的結(jié)果,用于綜合反映整體指標(biāo)。具體如式(9)所示。

        (9)

        式中:a表示被正確判定為正例的個(gè)數(shù);b表示被錯(cuò)誤判定為正例的個(gè)數(shù);c表示將正例排除在外的個(gè)數(shù)。

        方法:首先,利用本文算法選取最優(yōu)Threshold值,Threshold值作為是否正確判定正例的標(biāo)準(zhǔn)。然后,在最優(yōu)Threshold值下,分別將文獻(xiàn)[13]和文獻(xiàn)[15]與本文方法在數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),計(jì)算各評(píng)價(jià)指標(biāo)的結(jié)果。最后,在現(xiàn)有的互聯(lián)網(wǎng)醫(yī)院系統(tǒng)上,利用中文醫(yī)療對(duì)話數(shù)據(jù)集對(duì)智能預(yù)問診模型的問答功能進(jìn)行測(cè)試,主要測(cè)試模塊回答患者問題的流暢度及能否正確識(shí)別的問題。

        具體步驟如下:

        Step1讀取患者輸入的提問文本。

        Step2對(duì)Step1中文本分詞,提取關(guān)鍵詞。

        Step3用Step2中關(guān)鍵詞模糊查詢問答對(duì)所在的數(shù)據(jù)庫,將結(jié)果存入臨時(shí)表Table中。

        Step4利用本文算法選取最優(yōu)Threshold值。

        Step5在最優(yōu)Threshold值下,用3種算法分別求取Step1文本與Step3臨時(shí)表Table中每條記錄的相似度,計(jì)算召回率、正確率和F-測(cè)度值。

        Step6利用中文醫(yī)療數(shù)據(jù)集,驗(yàn)證問答模型回復(fù)的準(zhǔn)確性和及時(shí)性。

        實(shí)驗(yàn)算法及模型的準(zhǔn)確性驗(yàn)證流程如圖7所示。

        圖7 準(zhǔn)確性驗(yàn)證流程示意圖

        4.3 實(shí)驗(yàn)結(jié)果及分析

        4.3.1實(shí)驗(yàn)1

        實(shí)驗(yàn)結(jié)果:如表2所示,詞典中加入自定義的醫(yī)學(xué)專業(yè)詞后,準(zhǔn)確率和召回率分別提高了2.6百分點(diǎn)和1.3百分點(diǎn)。

        表2 分詞對(duì)比實(shí)驗(yàn)結(jié)果(%)

        實(shí)驗(yàn)結(jié)果表明詞典擴(kuò)充后能夠在一定程度上提高中文詞語切分的準(zhǔn)確率。但需要注意的是,由于詞的定義不統(tǒng)一,漢語的分詞還未形成一個(gè)公認(rèn)的標(biāo)準(zhǔn),詞的具體判定問題還未完全解決,可能對(duì)分詞的結(jié)果有一定的影響。

        4.3.2實(shí)驗(yàn)2

        通過對(duì)實(shí)驗(yàn)數(shù)據(jù)結(jié)果的分析,本文方法求取的相似度能更好地反映文本匹配的相關(guān)度,但不同情況,相似度表現(xiàn)形式及效果不同,如表3所示。

        對(duì)于語義相似的文本,本文方法較文獻(xiàn)[15]提高了5.72百分點(diǎn),提高幅度一般,因此需要對(duì)計(jì)算機(jī)理解文本語義的邏輯進(jìn)行進(jìn)一步研究;對(duì)于醫(yī)療關(guān)鍵詞不同的文本,文獻(xiàn)[15]算法是按相同字求取的,而本文方法按詞語的權(quán)值求得,相似度明顯降低;對(duì)于一般的文本,本文方法的效果提升明顯。

        4.3.3實(shí)驗(yàn)3

        本文算法的準(zhǔn)確度取決于Threshold值,為了得到最優(yōu)的Threshold值,利用本文算法在不同Threshold值下求取數(shù)據(jù)集中文本相似度,并計(jì)算召回率、正確率和F-測(cè)度值,變化趨勢(shì)如圖8所示。

        圖8 不同Threshold值下的評(píng)價(jià)指標(biāo)值

        根據(jù)圖8實(shí)驗(yàn)結(jié)果可知:隨著Threshold值增大,召回率呈下降趨勢(shì),正確率呈上升趨勢(shì),F-測(cè)度值呈先上升后下降趨勢(shì)。由于F-測(cè)度值可綜合反映整體指標(biāo),因此,當(dāng)F-測(cè)度值最大時(shí),可得最優(yōu)Threshold值為0.23。

        當(dāng)Threshold值為0.23時(shí),利用本文方法和文獻(xiàn)[13]和文獻(xiàn)[15]方法求得的召回率、正確率和F-測(cè)度值的結(jié)果如表4所示。

        表4 中文醫(yī)療對(duì)話數(shù)據(jù)集的評(píng)價(jià)指標(biāo)對(duì)比(%)

        由表4可知,本文方法得到的召回率、正確率和F-測(cè)度值均比文獻(xiàn)[13]和文獻(xiàn)[15]方法高,本文方法在計(jì)算中文文本相似度上的準(zhǔn)確率更高,能更好地實(shí)現(xiàn)中文文本最相關(guān)問答對(duì)的匹配。該算法利用分詞縮短了匹配字段的長(zhǎng)度,減少了循環(huán)空間,節(jié)省了算法時(shí)間。

        從圖9可知,智能預(yù)問診模型能根據(jù)患者所咨詢的問題來處理問題,并反饋大致符合患者要求的答案,總體符合預(yù)期。但值得注意和需要進(jìn)一步研究的是如何降低準(zhǔn)確率對(duì)問答對(duì)庫的依賴。

        圖9 智能問答

        5 結(jié) 語

        現(xiàn)階段的智能預(yù)問診在互聯(lián)網(wǎng)診療過程中充當(dāng)著先頭兵的角色,智能預(yù)問診所采集用戶信息的優(yōu)劣直接影響后續(xù)診療效果,而關(guān)鍵在于對(duì)所采集信息處理算法的設(shè)計(jì)和優(yōu)化。本文提出基于分詞和權(quán)值的相似度算法,通過添加智能分詞、自動(dòng)匹配最大相關(guān)問答對(duì),實(shí)現(xiàn)了智能預(yù)問診模型的搭建及與互聯(lián)網(wǎng)現(xiàn)實(shí)診療場(chǎng)景的有機(jī)融合,為智能預(yù)問診模型搭建提供了一種新方法、新思路。

        本文搭建的智能預(yù)問診模型,在用戶交互的準(zhǔn)確率上有待進(jìn)一步提高。一方面,由于診療的專業(yè)性和復(fù)雜性,自然語言技術(shù)雖然有一定發(fā)展,但在醫(yī)療領(lǐng)域還有很大的進(jìn)步空間,基于文本相似度算法實(shí)現(xiàn)的導(dǎo)診或預(yù)問診,還無法做到像醫(yī)生一樣用經(jīng)驗(yàn)和專業(yè)醫(yī)學(xué)知識(shí)解決患者的問題;另一方面,由于診療過程用戶提問問題的不確定性和龐大性,用于用戶問題應(yīng)答的標(biāo)準(zhǔn)問答對(duì)庫還未建設(shè)完畢,這是一個(gè)動(dòng)態(tài)累積的過程,需要結(jié)合診療活動(dòng)同步開展。因此,下一步應(yīng)重點(diǎn)研究醫(yī)療領(lǐng)域的自然語言處理以及標(biāo)準(zhǔn)問答對(duì)庫的建設(shè),從而使互聯(lián)網(wǎng)診療的過程更快捷、更高效、更準(zhǔn)確。

        猜你喜歡
        詞匯文本智能
        本刊可直接用縮寫的常用詞匯
        一些常用詞匯可直接用縮寫
        在808DA上文本顯示的改善
        本刊可直接用縮寫的常用詞匯
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        草青青视频手机免费观看| 99这里只有精品| 在线免费欧美| 淫秽在线中国国产视频| 99e99精选视频在线观看| 免费观看又色又爽又湿的视频| 日韩A∨精品久久久久| 国产综合一区二区三区av| 国产一区二区三区视频在线观看| 欧美黑寡妇特a级做爰| 蜜臀aⅴ国产精品久久久国产老师 国产精品久久婷婷六月丁香 | 亚洲七久久之综合七久久| 2021久久最新国产精品| 开心五月婷婷综合网站| 99国产精品久久一区二区三区| 啦啦啦www在线观看免费视频| 精品久久久久久久久午夜福利| 精品人妻av一区二区三区不卡| 日本视频一中文有码中文| 337p日本欧洲亚洲大胆精品| 国产羞羞视频在线观看| 亚洲一区二区三区在线观看| 久久九九精品国产av| 亚洲综合国产一区二区三区| 欧美亚洲国产人妖系列视| 日本二区三区视频在线观看| 亚洲 另类 小说 国产精品| 国产精品人妻一码二码尿失禁| 对白刺激的老熟女露脸| 日韩精品中文字幕第二页 | 国产精品久色婷婷不卡| 久久久久久亚洲av无码蜜芽| 国产高潮精品久久AV无码 | 亚洲综合色区另类av| 男人j进女人p免费视频| 中文亚洲一区二区三区| 欧洲多毛裸体xxxxx| 欧美性受xxxx黑人xyx性爽| 在线免费观看视频播放| 精品国产一区二区三区三级| 亚洲av之男人的天堂网站|