亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向在線問診平臺的三支推薦方法

        2022-11-13 12:17:30梁建樹葉曉慶
        關(guān)鍵詞:文本用戶信息

        梁建樹,葉曉慶,劉 盾

        (1.西南交通大學(xué) 經(jīng)濟管理學(xué)院,四川 成都 610031;2.西南交通大學(xué) 計算機與人工智能學(xué)院,四川 成都 611756)

        隨著“互聯(lián)網(wǎng)+”的推廣和快速發(fā)展,就醫(yī)模式逐漸開始從線下往線上模式傾斜[1-2]。同時,自2020年新冠疫情爆發(fā)以來,線下就醫(yī)的渠道受到極大的阻礙,“足不出戶”的線上問診模式得到更多人青睞。好大夫、丁香醫(yī)生、春雨醫(yī)生、阿里健康、京東健康等在線醫(yī)療平臺能夠為用戶提供線上疾病咨詢服務(wù)。作為線下醫(yī)療的補充,在線醫(yī)療一方面能合理利用全國各城市閑置的醫(yī)療資源; 另一方面, 能夠緩解線下醫(yī)院的診療負擔, 提高醫(yī)生的診療效率[3]。 在線醫(yī)療主要有在線問診、 醫(yī)藥零售、 在線掛號等功能, 其中在線問診是解決民眾就醫(yī)需求的重要渠道。Ranard等研究發(fā)現(xiàn)在線問診平臺可以彌補傳統(tǒng)線下就醫(yī)模式帶來的反饋信息匱乏問題, 平臺提供的信息對用戶了解和評估醫(yī)院的質(zhì)量提供了幫助[4]。不僅如此, 在線問診平臺還可以指導(dǎo)用戶就醫(yī), 讓用戶和醫(yī)生、 用戶和用戶之間得以互動, 進而提高用戶體驗[5-7]。

        然而,隨著在線問診平臺上用戶規(guī)模和醫(yī)療資源不斷增長,用戶想要從海量的醫(yī)療數(shù)據(jù)中尋找合適的醫(yī)生變得越發(fā)困難。一方面,在線問診平臺為用戶提供大量的醫(yī)生信息,用戶逐一通過科室、疾病等多層級的屬性篩選合適的醫(yī)生極其耗時;另一方面,用戶不一定具有專業(yè)的醫(yī)學(xué)知識,清楚自身的疾病狀況以及分辨自身疾病所屬的科室。基于此,作為一種解決數(shù)據(jù)過載問題的有效方法,個性化推薦技術(shù)能夠為用戶推薦符合其實際需求的醫(yī)生,不僅能夠提高在線問診平臺中用戶的就診效率,而且可以改善用戶的在線體驗[8]。一般而言,現(xiàn)有平臺主要為用戶推薦當前熱度高、較多人訪問的醫(yī)生。然而,基于熱度的推薦方法會造成馬太效應(yīng),使得熱門醫(yī)生的工作超負荷,而新醫(yī)生卻難以被關(guān)注和發(fā)現(xiàn)。

        為了滿足用戶需求,相關(guān)研究已開始將個性化推薦技術(shù)應(yīng)用到醫(yī)生推薦問題中,進而為用戶推薦滿足其需求的醫(yī)生。徐守坤和吳偉偉根據(jù)用戶咨詢文本,通過協(xié)同過濾的方法為用戶推薦滿足其個性化需求的醫(yī)生[9]。劉通將Word2Vec和Kmeans方法融合來解決用戶咨詢內(nèi)容與醫(yī)生聚類中心的相似度比較問題,并為用戶推薦高匹配度的專業(yè)醫(yī)生[10]。葉佳鑫等主要考慮了用戶與醫(yī)生的文本向量的相似度來推薦符合用戶實際需求的醫(yī)生[11]。潘有能和倪秀麗通過Labeled-LDA模型訓(xùn)練咨詢文本數(shù)據(jù),為用戶推薦關(guān)鍵詞相似度較高的醫(yī)生[12]。Huang等提出了一種基于協(xié)作的醫(yī)藥知識推薦方法,根據(jù)醫(yī)生在歷史就診文本中的醫(yī)藥評分來生成信任因子,并引入?yún)f(xié)同過濾的推薦算法進行醫(yī)生推薦[13]。Zhang等基于在線評論,利用矩陣分解技術(shù),預(yù)測醫(yī)生排名得分為用戶提供個性化的醫(yī)生推薦[14]。楊曉夫和秦函書則根據(jù)醫(yī)生所在科室進行精準推薦[15]。

        通過對文獻的分析和整理, 個性化推薦方法能夠有效地解決醫(yī)患信息過載問題。 然而, 現(xiàn)有研究方法主要從單一數(shù)據(jù)的視角對用戶進行醫(yī)生推薦, 忽略了醫(yī)患信息的多源性和多粒度性。 事實上, 用戶在實際的決策過程中往往會結(jié)合不同數(shù)據(jù), 從多粒度、 多維度的視角來篩選適合的醫(yī)生。 由于在線問診平臺中醫(yī)生信息來源眾多(包括用戶反饋、 醫(yī)生簡介、 醫(yī)院信息等), 這些數(shù)據(jù)從不同視角、 不同維度、 不同粒層描述醫(yī)生特征。 醫(yī)生特征的多粒度劃分可以有效幫助在線問診平臺構(gòu)建醫(yī)生和用戶之間的分級匹配, 是平臺實現(xiàn)分級診斷的前提。 其中, 用戶咨詢文本從較細的粒度描述了醫(yī)生擅長治療的病患特征, 用戶評價從較粗的粒度描述了醫(yī)生擅長的疾病領(lǐng)域特征, 而醫(yī)生簡介從更粗的粒度描述了醫(yī)生所在科室等方面特征。 因此, 平臺可以通過篩選相似疾病特征的咨詢文本, 為用戶推薦合適的醫(yī)生; 還可以通過比較用戶對醫(yī)生問診服務(wù)的評價和主頁簡介中醫(yī)生的專業(yè)領(lǐng)域, 為用戶推薦其他合適的醫(yī)生。

        基于上述分析,本文從醫(yī)患數(shù)據(jù)的多源性和多粒度兩個視角出發(fā),著重考慮推薦過程的不確定性,提出一種面向在線問診平臺的多步驟三支推薦方法。首先,針對現(xiàn)有研究中醫(yī)生推薦數(shù)據(jù)單一性問題,本文考慮醫(yī)患信息的多源性,通過Word2Vec和LDA等技術(shù)對多源數(shù)據(jù)進行學(xué)習(xí),挖掘醫(yī)生特征,構(gòu)建多粒度的醫(yī)患推薦信息。其次,考慮到推薦過程中的不確定性問題,引入三支決策思想,構(gòu)建三支醫(yī)生推薦方法。最后,將多粒度的醫(yī)患推薦信息和三支決策思想融合,實現(xiàn)面向多源數(shù)據(jù)的多步驟三支醫(yī)生推薦。

        1 相關(guān)工作

        1.1 在線醫(yī)生推薦

        已有關(guān)于在線醫(yī)生推薦的研究主要關(guān)注兩個方面:醫(yī)患特征挖掘以及醫(yī)生推薦。在醫(yī)患特征挖掘上,現(xiàn)有研究主要通過文本挖掘技術(shù)探究醫(yī)生用戶的潛在特征信息。Bekhui等利用NLP相關(guān)技術(shù),從在線醫(yī)療平臺論壇中提取醫(yī)生領(lǐng)域的關(guān)鍵詞[16]。Chen通過對醫(yī)患雙方進行聚類來獲取醫(yī)生和用戶特征[17]。Liu等通過注意力機制模型,構(gòu)建一種新的深度網(wǎng)絡(luò),用以學(xué)習(xí)中文醫(yī)療平臺中咨詢文本的語義特征[18]。在醫(yī)生推薦研究上,Abacha和Zweigenbaum基于醫(yī)療命名體識別方法,對醫(yī)學(xué)問題和文檔進行深入分析,給出了一種基于相似用戶特征的醫(yī)生推薦方法[19]。Naderi等通過使用統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)和自然語言處理技術(shù),提出一種基于醫(yī)生領(lǐng)域匹配的醫(yī)生推薦方法[20]。Yang等探討了一個基于用戶醫(yī)療信息需求、問答記錄內(nèi)容和醫(yī)生背景信息的深度學(xué)習(xí)問答推薦框架,來提高醫(yī)生推薦的精確度[21]。

        基于上述分析,當前研究存在一定的局限性。一方面,現(xiàn)有文獻大多通過單一的數(shù)據(jù)源進行特征提取,忽略了醫(yī)患數(shù)據(jù)的多源性和多粒度性;另一方面,現(xiàn)有方法主要關(guān)注推薦結(jié)果的精度和質(zhì)量,忽略了推薦的多樣性和覆蓋率。從用戶的角度來看,推薦系統(tǒng)應(yīng)推薦用戶需要的醫(yī)生;從平臺的角度來看,推薦系統(tǒng)也需要實現(xiàn)平臺資源的合理分配。因此,本文將基于醫(yī)患數(shù)據(jù)的多源性和多粒度性,以提高推薦質(zhì)量和推薦覆蓋率為研究目標,構(gòu)建在線醫(yī)生推薦模型。

        1.2 文本特征挖掘

        文本特征挖掘是從自然語言提取特征的過程,是各種語言處理任務(wù)的基礎(chǔ)。根據(jù)不同的研究方法,可以分為傳統(tǒng)的詞袋模型、主題模型和深度學(xué)習(xí)模型3類。相對于傳統(tǒng)的詞袋模型,基于主題模型更關(guān)注語言處理過程,它通過從文檔中發(fā)現(xiàn)的潛在主題并為其提供低維的特征表示,在文本特征提取中取得成功的應(yīng)用。LDA是一種經(jīng)典的層次概率主題模型[22],其核心思想是把主題中的詞作為文本的部分特征,每個主題都由這些詞組成。由于LDA模型能夠有效提高文本語義分析的準確性,因而被廣泛運用在提取醫(yī)療平臺中文本特征的工程中[23-24]?;谏疃葘W(xué)習(xí)的文本表示模型主要聚焦于人工神經(jīng)網(wǎng)絡(luò)的文本表示,其代表性方法為Word2Vec技術(shù)。Word2Vec生成詞向量的基本思想來自NNLM (神經(jīng)網(wǎng)絡(luò)語言模型,neural network language model),它通過使用稠密、低維的實數(shù)向量來表示1個單詞,每個維度代表了詞語所包含的某個方面的潛在特征,能夠表征有價值的句法和語義特征。此外,Word2Vec[25]使用具有單個隱藏層的神經(jīng)網(wǎng)絡(luò)來訓(xùn)練加權(quán)參數(shù),并將采樣窗口中單詞的貢獻率設(shè)置為目標函數(shù)。由于在線問診平臺中,醫(yī)患數(shù)據(jù)都以文本數(shù)據(jù)為主, 因此,Word2Vec被廣泛地應(yīng)用于醫(yī)患特征的挖掘中[10-11]。

        1.3 三支決策

        三支決策[26]理論是在決策粗糙集理論的基礎(chǔ)上發(fā)展而來的,主要被用于處理延遲決策的不確定性問題。由于傳統(tǒng)的二支決策可能會導(dǎo)致較高的誤分類成本。因此,三支決策在此基礎(chǔ)上提出了延遲決策策略[27],以規(guī)避在信息不足的情形下做出錯誤決策帶來的嚴重后果。在現(xiàn)實的決策過程中,信息的多粒度性會增加決策處理過程。基于此,本文引入序貫三支決策方法,從粒計算的視角處理和實現(xiàn)多粒度信息下的多步驟決策過程。具體而言,在每一步驟中,當現(xiàn)有信息充分時,可以直接做出接受或拒絕的決策;而當前信息無法支持其做出決策時,可以將對象劃分到邊界域中,在下一個步驟中獲得其他信息后再對其進行決策。

        一般而言,在傳統(tǒng)推薦問題上,推薦模型都是基于二支決策模型,即推薦和不推薦。為了處理推薦中的不確定性問題,三支決策的思想被引入推薦系統(tǒng)中,以解決傳統(tǒng)推薦過程“非好即壞”的不足。Zhang等將三支決策引入到協(xié)同過濾的推薦系統(tǒng)中,提出三支推薦規(guī)則制定方法,并將其應(yīng)用在智慧城市的推薦當中[28]。進一步地,考慮到多粒度信息下的多步驟推薦, Ye和Liu將序貫三支決策引入到推薦系統(tǒng)中,構(gòu)建了一種新的動態(tài)三支推薦系統(tǒng),以解決靜態(tài)的二支推薦的局限性[29]。可以看到,針對在線問診平臺中的醫(yī)生推薦,多步驟的三支決策推薦能夠解決多粒度信息下的推薦過程,并有效解決醫(yī)生推薦過程中面臨的實際問題。

        2 面向在線問診平臺的三支推薦方法

        下面,開始著手對多粒度的醫(yī)患推薦數(shù)據(jù)的清洗、整理和分析??紤]到在線問診平臺的數(shù)據(jù)整合過程需要爬取用戶咨詢文本和用戶評論、挖掘用戶需求、搜集醫(yī)生簡介信息,以及獲取醫(yī)生多粒度特征。因而,本小節(jié)從醫(yī)患數(shù)據(jù)的多源性和多粒度性出發(fā),提出一種面向在線問診平臺的多步驟三支醫(yī)生推薦方法,其總體研究框架如圖1所示。

        圖1 面向在線問診平臺的三支推薦方法的構(gòu)架圖

        2.1 基于多源數(shù)據(jù)的在線醫(yī)患特征挖掘

        (1)

        2.1.2 基于用戶評論的醫(yī)生特征挖掘 由于在線問診平臺允許用戶對已完成的醫(yī)療服務(wù)進行評價并形成歷史記錄,用戶通常會在眾多歷史評論中尋找自己關(guān)心的話題,進而選擇好評率高、專業(yè)能力強、服務(wù)態(tài)度好的醫(yī)生。因此,首先需要對用戶評論進行語言處理和主題提取。本文主要采用LDA方法來分析用戶評論的主題數(shù),并挖掘評論中的主題信息。為了更詳細地說明LDA,圖2給出了LDA的圖模型。假設(shè)有K個主題ζ=ζ1:k,每個主題都滿足Dirichlet分布,則每個用戶評論的文檔wn*的生成過程可表示為:

        圖2 LDA的圖模型

        1) 每個主題的分布θn滿足

        θn~Dirichlet()。

        2) 對于文檔wn*中的每個單詞wnv,

        a)主題分配zjv滿足znv~Multinomial(θn);

        b)詞滿足wnv~Multinomial(ζznv)。

        (2)

        (3)

        2.2 基于三支決策的多步驟推薦方法

        傳統(tǒng)的醫(yī)生推薦是二支決策模型,采用推薦和不推薦兩種策略。然而,在二支推薦過程中,錯誤的推薦可能會產(chǎn)生高昂的決策成本?;诖?本文引入三支決策的思想,對不確定的事件采取延遲推薦策略。給定兩個閾值α和β,三支推薦系統(tǒng)基本結(jié)構(gòu)如表1所示。

        表1 三支推薦系統(tǒng)

        相比于二支推薦模型,三支推薦模型對不確定的事件采用延遲推薦手段。具體而言,當已有推薦信息不充分,難以做出接受或拒絕判斷時,采用延遲推薦策略,等待收集更多有用的數(shù)據(jù)信息再進行推薦。這種通過加入更多的推薦信息進行延遲推薦的方法,使邊界域中的醫(yī)生逐漸被進一步劃分和推薦,進而實現(xiàn)了多步驟推薦。

        (4)

        (5)

        通過上述分析可以看到,面向多源數(shù)據(jù)的多步驟三支推薦方法適用于醫(yī)患信息來源眾多的在線問診平臺,從多粒度視角來看,隨著推薦信息的增加,醫(yī)生會被進一步劃分。推薦系統(tǒng)從多源的數(shù)據(jù)信息為用戶進行醫(yī)生推薦,隨著推薦信息的逐步加入,能夠推薦給用戶的醫(yī)生數(shù)量也會變得更多。

        2.3 面向在線問診平臺的三支推薦方法

        針對在線問診平臺中醫(yī)患信息的多源性和多粒度性及推薦過程中的不確定性,本文擬融合用戶咨詢文本、用戶評論和醫(yī)生簡介,挖掘醫(yī)生特征等數(shù)據(jù),構(gòu)建一種基于三支決策思想的多步驟醫(yī)生推薦方法(3WD-msDRec),其核心技術(shù)路線如圖3所示。

        圖3 基于三支決策思想的多步驟醫(yī)生推薦方法(3WD-msDRec)

        圖3考慮了用戶咨詢文本、用戶評論和醫(yī)生簡介3種不同信息源。由于每個階段考慮的信息源不同,隨著信息源的不斷增加,為用戶推薦的醫(yī)生也更為豐富。基于此,多步驟的三支醫(yī)生推薦可分為3個階段,其對應(yīng)的推薦信息集合分別記為G1,G2和G3。

        在第1階段中,通過對咨詢文本的語義挖掘獲取醫(yī)生特征記為G1。目標用戶un的咨詢文本dn和以往就診醫(yī)生vm的用戶文本dm通過Word2Vec向量化表示。這里,通過余弦相似度計算目標用戶和咨詢文本之間的語義相似度,將相似的以往用戶推薦給目標用戶,即

        (6)

        若兩個文本之間相似度較高,則可以為目標用戶推薦其就診過的醫(yī)生。進一步地,定義第1階段的醫(yī)生推薦得分為

        Score(P1|(un,vm))=sim(dn,dm)

        (7)

        (8)

        (9)

        基于上述分析,面向在線問診平臺的多階段三支推薦方法可以根據(jù)每個步驟中醫(yī)生推薦得分,并在給定的閾值(αl,βl)下對候選醫(yī)生集合進行如式(5)的推薦規(guī)則,最終形成對不同目標用戶的醫(yī)生推薦列表,具體的算法偽代碼如算法1所示。第1階段注重于從相似文本的角度進行考量,尋找與目標用戶有相似病征的以往用戶,并將他們咨詢過的醫(yī)生推薦給目標用戶。當?shù)?階段推薦的醫(yī)生數(shù)量小于N時,將繼續(xù)通過第2階段為用戶推薦醫(yī)生。而第2階段側(cè)重于從用戶評價、用戶滿意度的角度進行考量,向目標用戶推薦滿意度較高的醫(yī)生。第3階段則是在前面兩個階段推薦的醫(yī)生數(shù)不足的情況下,根據(jù)目標用戶的疾病標簽從醫(yī)生簡介中進行推薦。

        算法1多步驟的三支醫(yī)生推薦方法(3WD-msDRec)

        Input:用戶集U={u1,u2,…,un,…,uN},醫(yī)生集V={v1,v2,…,vm,…,vM},推薦信息G1,G2,…,Gl,…,Gh,醫(yī)生推薦得分Score(pl|(un,vm)),所需醫(yī)生推薦數(shù)量N,各階段閾值(αl,βl)且1≤l≤h-1;

        1:∥步驟1.初始化參數(shù)

        4:l=1

        5:∥步驟2.多步驟三支推薦過程

        13:else

        15:endif

        17:l=l+1

        18:endwhile

        19:∥步驟3.二支推薦過程

        23:endif

        3 實驗結(jié)果及分析

        3.1 數(shù)據(jù)收集

        為了驗證本文所提推薦方法的有效性,本文從好大夫在線網(wǎng)站(haodf.com)上爬取了從2016年到2020年心理咨詢科和內(nèi)科2個科室的用戶咨詢文本、用戶評論、醫(yī)生簡介等原始數(shù)據(jù),其具體信息如下:

        1) 心理咨詢科室數(shù)據(jù)集:包括咨詢文本共11萬條,320位醫(yī)生及其主頁簡介,醫(yī)生評論2.1萬條。經(jīng)過數(shù)據(jù)整理和清洗,刪除評論不足10條的醫(yī)生,且文本單詞數(shù)少于10個字的評論、簡介和咨詢文本,保留了89 000條咨詢文本,250位醫(yī)生以及10 699條評論。此外,通過統(tǒng)計分析得到心理咨詢的疾病標簽46個。

        2) 內(nèi)科數(shù)據(jù)集:與心理咨詢科室不同,內(nèi)科科室之中門類繁多,它由消化內(nèi)科、心血管科、內(nèi)分泌科、變態(tài)反應(yīng)科等子科室組成。因此,在爬取內(nèi)科科室數(shù)據(jù)時重點爬取了上述4個子科室中的咨詢文本、用戶評論、醫(yī)生簡介等數(shù)據(jù)。經(jīng)過數(shù)據(jù)清洗后,保留了113 255條咨詢文本,499位醫(yī)生以及19 888條評論。此外,通過統(tǒng)計分析得到內(nèi)科的疾病標簽88個。

        接下來,在實驗設(shè)計中將80%的咨詢文本作為訓(xùn)練集,用于訓(xùn)練Word2Vec模型和用于匹配文本的相似度,剩下20%的樣本作為測試集進行實驗分析。

        3.2 實驗評價指標

        這里,采用推薦精度、推薦平均精度、歸一化折損累計增益和推薦覆蓋率4個評價指標來驗證本文所提出推薦方法的有效性。

        1)推薦精度

        (10)

        2) 推薦平均精度

        平均精度反映了推薦系統(tǒng)中給用戶推薦相關(guān)項目排名的能力,平均精度越高,最終推薦的列表中醫(yī)生的排名也就越靠前。平均精度計算公式如式(11)~式(12)所示。

        (11)

        (12)

        考慮到每個用戶最終只與一個醫(yī)生成功匹配,因此,x=X=1。position(x)表示推薦成功的醫(yī)生在推薦列表中的位置,而沒有推薦成功的用戶AP(i)=0。

        3) 歸一化折損累計增益

        折損累計增益(DCG)主要考慮了推薦系統(tǒng)中排序的結(jié)果,排名靠前的項目增益更高,對排名靠后的項目進行折損。歸一化折損累計增益(nDCG)則是對不同用戶的指標進行歸一化,最后,對每個用戶取平均得到的最終分值,其計算公式如式(13)所示。

        (13)

        其中:ρ為推薦列表中醫(yī)生的排序位置;reli表示第i個醫(yī)生為某用戶的問診醫(yī)生。在醫(yī)生推薦的情境下,1個醫(yī)生就診1個用戶,即reli={0,1}。因此,理想的排序結(jié)果應(yīng)為就診醫(yī)生排在推薦列表的第1位,即IDCG=1。

        4) 推薦覆蓋率

        覆蓋率反映了推薦系統(tǒng)覆蓋項目的能力,覆蓋率越高,表明最終推薦的列表中能夠覆蓋的醫(yī)生越多,它由式(14)計算,其中V為醫(yī)生集合。

        (14)

        3.3 基準方法

        進一步地,為了驗證本文提出的醫(yī)生推薦系統(tǒng)(3WD-msDRec)的有效性,本文以下面3種方法作為基準算法。

        1) DP-bRec (doctor popularity based recommendation):基于醫(yī)生熱度的推薦方法是現(xiàn)存醫(yī)療網(wǎng)站上主要使用的推薦方法,該方法是將熱度排序高的醫(yī)生推薦給用戶。

        2) W2V-TextRec:該方法是以用戶咨詢文本為數(shù)據(jù)源,經(jīng)過Word2Vec訓(xùn)練,將與以往用戶文本咨詢過文本相似度最高的醫(yī)生推薦給目標用戶的推薦方法[11]。

        3) Labeled-LDADRec:該方法是以用戶咨詢文本為數(shù)據(jù)源,通過LDA主題模型把訓(xùn)練得出的關(guān)鍵詞作為醫(yī)生專業(yè)領(lǐng)域的標簽,并將標簽相似度較高的醫(yī)生推薦給目標用戶的推薦方法[30]。

        3.4 實驗結(jié)果分析

        3.4.1 算法比較分析 首先,為了驗證本文所提算法在4個評價指標的有效性,利用Word2Vec和LDA模型對在線問診平臺中的數(shù)據(jù)進行處理。一方面,在訓(xùn)練Word2Vec的過程中,將詞向量的維度設(shè)置為250,迭代次數(shù)設(shè)置為10次。另一方面,借鑒文獻[31]對醫(yī)生評論進行主題提取的結(jié)果,對用戶評論進行LDA主題模型訓(xùn)練,設(shè)定K=4。 進一步地, 假設(shè)所需醫(yī)生推薦數(shù)N=10,表2和表3展示了閾值α和β在不同組合變化下,推薦精度、覆蓋率、MAP和nDCG的實驗結(jié)果。

        通過表2和表3可以看出,推薦精度、MAP和nDCG隨著α和β的取值變小而表現(xiàn)更為有益。對于覆蓋度來說,α的取值區(qū)間位于0.65~0.85表現(xiàn)較好。為了兼顧4個指標的表現(xiàn),選取(α1,β1)=(0.65,0.3)。在第1階段推薦中,當文本的相似度≥0.65,將其歸到正域,并且向用戶推薦該文本咨詢的醫(yī)生;當文本相似度介于0.3~0.65時,將該醫(yī)生歸到邊界域,即延遲推薦;剩下的醫(yī)生便進入負域,不向用戶推薦。類似地,第2階段選取(α2,β2)=(0.8,0.4)。

        表2 α和β組合變化下推薦精度和覆蓋度的實驗結(jié)果(N=10)

        表3 α和β組合變化下MAP和nDCG的實驗結(jié)果(N=10)

        進一步地,在確定好閾值后,將本文提出的3WD-msDRec方法與3種基準方法進行實驗分析,相關(guān)比較結(jié)果如圖4和圖5所示。

        一方面,由圖4A可知,在心理咨詢數(shù)據(jù)集上,3WD-msDRec的推薦精度都優(yōu)于其他基準方法。由圖4B和圖4C可以看出,3WD-msDRec方法在MAP和nDCG兩個指標上的表現(xiàn)優(yōu)于其他基準方法。通過圖4D可以得到,當N≤25時,DP-bRec方法的覆蓋率最低,3WD-msDRec方法的覆蓋率最優(yōu)。當N≥30時,Labeled-LDADRec方法的推薦覆蓋率比3WD-msDRec方法表現(xiàn)更好,不過3WD-msDRec方法的覆蓋率也達到了90%以上,與最優(yōu)方法表現(xiàn)相差甚微。

        另一方面,通過圖5可以發(fā)現(xiàn),3WD-msDRec方法在兩個數(shù)據(jù)集上的表現(xiàn)是一致的。此外,綜合圖4和圖5發(fā)現(xiàn),3WD-msDRec方法在內(nèi)科數(shù)據(jù)集的推薦精度、MAP和nDCG的結(jié)果表現(xiàn)比心理咨詢數(shù)據(jù)集的表現(xiàn)要高出10%左右??偠灾?本文所提方法在推薦精度和覆蓋度上總體都優(yōu)于其他基準方法,而且從平均精度和nDCG兩個指標來看,3WD-msDRec方法具有良好的推薦質(zhì)量。

        圖4 與基準方法結(jié)果對比圖(心理咨詢科室)

        圖5 與基準方法結(jié)果對比圖(內(nèi)科科室)

        3.4.2 不同數(shù)據(jù)源組合比較分析 其次,為了探索所提方法使用多種數(shù)據(jù)源進行多粒度醫(yī)生推薦的優(yōu)異性,進一步將本文所提方法與不同數(shù)據(jù)源組合推薦方法做對比分析,使用單一數(shù)據(jù)源進行的醫(yī)生推薦為單粒度醫(yī)生推薦,使用兩個數(shù)據(jù)源則為兩個醫(yī)生粒度特征的醫(yī)生推薦,相關(guān)實驗結(jié)果如圖6和圖7所示。

        圖6 不同數(shù)據(jù)源結(jié)果比較圖(心理咨詢科室)

        圖7 不同數(shù)據(jù)源結(jié)果比較圖(內(nèi)科科室)

        通過圖6和圖7可以發(fā)現(xiàn),3WD-msDRec方法在各指標的表現(xiàn)都優(yōu)于其他數(shù)據(jù)源組合推薦的方法。相比其他數(shù)據(jù)源組合推薦進行的不同粒度醫(yī)生推薦方法,采取了3個不同數(shù)據(jù)源進行多粒度的3WD-msDRec方法在推薦精度、MAP和nDCG上優(yōu)勢明顯。此外,3WD-msDRec方法在覆蓋率的表現(xiàn)也優(yōu)于其他方法,這在一定程度上驗證了本文所提出方法的有效性。綜上所述,通過對推薦精度、MAP、nDCG和覆蓋率4個指標的分析,相比其他基準方法及其他數(shù)據(jù)源組合推薦方法,本文提出的方法在提高推薦精度的同時,還提高了推薦的覆蓋率。

        3.4.3 結(jié)果可視化分析 最后,為了清晰刻畫面向多源數(shù)據(jù)的多階段可視化推薦過程,分析采用多源數(shù)據(jù)進行推薦的合理性和有用性,本文從心理咨詢科室數(shù)據(jù)集中隨機選取10名用戶, 為他們推薦得分排名前50位的醫(yī)生(N=50)。 對于不同用戶, 為其推薦醫(yī)生的信息來源是不同的。 圖8統(tǒng)計并展示了10位用戶在咨詢文本、用戶評論和醫(yī)生簡介3種不同信息源的醫(yī)生推薦數(shù)量。

        圖8 10名用戶可視化推薦過程

        圖8中,綠色柱狀代表通過咨詢文本進行醫(yī)生推薦的數(shù)量,紅色柱狀代表通過用戶評論進行醫(yī)生推薦的數(shù)量,而藍色柱狀代表通過醫(yī)生簡介進行醫(yī)生推薦的數(shù)量。由圖8可以發(fā)現(xiàn),用戶6、用戶7和用戶9只需要利用咨詢文本來推薦就能滿足其需求,即經(jīng)過第1階段就終止推薦。用戶5和用戶8需要咨詢文本和用戶評論,第2階段就可以結(jié)束推薦。其他用戶則同時需要3個信息源的數(shù)據(jù),進行3個階段的推薦。圖8的結(jié)果證實了本文所提出研究方法的合理性和有用性,同時說明在問診平臺推薦中多信息源的重要性。

        4 結(jié)語

        考慮到在線問診平臺中醫(yī)患信息的多源性和多粒度性,以及推薦過程中的不確定性問題,本文提出了一種面向在線問診平臺的多步驟三支推薦方法,通過挖掘多源數(shù)據(jù)中的醫(yī)患特征,利用多粒度的推薦信息,構(gòu)建了一種多步驟三支醫(yī)生推薦方法。本文通過爬取好大夫網(wǎng)站上的醫(yī)患數(shù)據(jù)對所提方法進行有效性驗證。實驗結(jié)果表明,本文所提方法不僅能夠提高醫(yī)生推薦精度,同時還提高了推薦的覆蓋率,具有良好的應(yīng)用價值。而且,本文方法作為在線問診平臺中醫(yī)生推薦的方法,它從多個維度、多個角度以及多個粒度為用戶進行的推薦,有著良好的語義解釋性。此外,本文方法還能在一定程度上緩解醫(yī)生配置不均衡的問題,具有較好的理論價值和實際意義。在未來研究中,筆者會進一步探索將深度學(xué)習(xí)的技術(shù)引入到在線問診平臺中的相關(guān)模型與方法,通過數(shù)據(jù)處理和分析,將多源醫(yī)生特征進行融合,挖掘醫(yī)生的多粒度特征,實現(xiàn)醫(yī)患的精準匹配。

        猜你喜歡
        文本用戶信息
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        如何獲取一億海外用戶
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        如何快速走進文本
        語文知識(2014年1期)2014-02-28 21:59:13
        二区三区视频在线观看| 国产在线精品欧美日韩电影| 91久久青青草原线免费| 久久无码中文字幕东京热| 国产猛烈高潮尖叫视频免费| 亚洲福利视频一区二区三区 | 男人边做边吃奶头视频| 人妻少妇精品视中文字幕国语| 国产精品黄色片在线观看| 人妻少妇被猛烈进入中文| 97久久婷婷五月综合色d啪蜜芽| 欧美猛男军警gay自慰| 久久久久国产亚洲AV麻豆| 在线观看日本一区二区三区| 国产无套乱子伦精彩是白视频| 又爽又黄又无遮挡的激情视频| 亚洲V无码一区二区三区四区观看 久久精品国产亚洲综合色 | 国产婷婷色一区二区三区| 欧美日韩中文国产一区发布| 在线视频青青草猎艳自拍69| 日韩精品一区二区亚洲专区| 97久人人做人人妻人人玩精品| 亚洲av片不卡无码久久| 国产成人亚洲综合小说区| 精品国产一区二区三区香| 亚洲av无码久久精品色欲| 日韩毛片基地一区二区三区| 国产三级国产精品国产专区| 精品老熟女一区二区三区在线| 把女人弄爽特黄a大片| 欧美白人最猛性xxxxx| 人妖熟女少妇人妖少妇| 亚洲国产中文字幕在线视频综合| 国产精品无码一本二本三本色| 国产成人无码A区在线观| 日韩午夜三级在线视频| 欲求不満の人妻松下纱荣子| 九九99无码精品视频在线观看| 国产熟女自拍视频网站| 亚洲av不卡一区男人天堂 | 亚洲国产成人久久精品一区|