亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于診療知識(shí)庫(kù)和電子病歷的整合推薦方法研究

        2019-04-28 06:36:04胡德華方浩周宇葵羅愛靜
        關(guān)鍵詞:疾病診斷知識(shí)庫(kù)病歷

        胡德華,方浩,周宇葵,羅愛靜

        中南大學(xué)生命科學(xué)學(xué)院醫(yī)藥信息系,湖南長(zhǎng)沙410083

        前言

        隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展和大數(shù)據(jù)時(shí)代的到來,電子醫(yī)療信息的規(guī)模也日益龐大[1-2]。受限于精力和記憶能力,人類的信息存儲(chǔ)量有限,無法對(duì)所有信息進(jìn)行有效的存儲(chǔ)和利用,信息過載所帶來的壓力也越來越明顯。同時(shí)人們對(duì)自身健康的關(guān)注度不斷提高,對(duì)醫(yī)療信息的質(zhì)量和準(zhǔn)確性不斷提出新的要求。

        近年來醫(yī)療信息化在政府和市場(chǎng)的推動(dòng)下,已經(jīng)取得了一定的研究成果。但診療知識(shí)庫(kù)領(lǐng)域的研究方向多為診療知識(shí)庫(kù)的構(gòu)建和臨床輔助決策支持,研究如何為患者提供準(zhǔn)確且權(quán)威的疾病相關(guān)信息的文獻(xiàn)資料較少[3-5]。目前,患者自主了解自身疾病情況多采用互聯(lián)網(wǎng)檢索、詢問他人的方式,該方式雖然相對(duì)便捷,但無法保證獲取的疾病相關(guān)信息的準(zhǔn)確性和權(quán)威性,導(dǎo)致患者對(duì)自身健康情況的認(rèn)識(shí)產(chǎn)生偏差。因此,為保證患者獲取準(zhǔn)確的疾病知識(shí),開展基于臨床診療知識(shí)庫(kù)和電子病歷的整合推薦方法研究具有重要的現(xiàn)實(shí)意義。

        本文探討根據(jù)臨床診療知識(shí)庫(kù)和患者電子病歷信息,通過對(duì)癥狀分詞,探討基于內(nèi)容推薦和協(xié)同過濾的整合推薦方法,識(shí)別其診療信息,并映射到疾病診療知識(shí)庫(kù)中相應(yīng)的疾病、檢查、藥品信息上,為患者提供診療過程中疾病相關(guān)信息,滿足其對(duì)自身健康管理的需求。

        1 國(guó)內(nèi)外研究現(xiàn)狀

        疾病、藥物、檢查、癥狀等醫(yī)療信息作為診療知識(shí)庫(kù)的核心內(nèi)容,貫穿患者的整個(gè)健康檔案,是醫(yī)生、患者最為關(guān)心的內(nèi)容。臨床診療知識(shí)庫(kù)可以為患者提供全面且權(quán)威的臨床指南、醫(yī)療知識(shí),從而提高醫(yī)患整體的認(rèn)識(shí)水平。目前,國(guó)內(nèi)已構(gòu)建了許多診療知識(shí)庫(kù),且各個(gè)知識(shí)庫(kù)的特點(diǎn)和內(nèi)容存在或多或少的差異,如中國(guó)醫(yī)院知識(shí)總庫(kù)、中國(guó)疾病知識(shí)總庫(kù)主要收錄臨床文獻(xiàn);萬方臨床診療知識(shí)庫(kù)、中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所臨床醫(yī)學(xué)知識(shí)庫(kù)則以疾病、檢查、藥品、指南為基礎(chǔ)[6]。相比之下,國(guó)外診療知識(shí)庫(kù),如UpToDa 等,在臨床證據(jù)來源、規(guī)模、更新頻率、評(píng)價(jià)等方面更加完善,更注重臨床證據(jù)資源,加以整合分析,并對(duì)臨床診療證據(jù)的可信度進(jìn)行評(píng)估。UpToDa 等知識(shí)庫(kù)主要由知名出版機(jī)構(gòu)或者學(xué)術(shù)團(tuán)體創(chuàng)建和維護(hù),多為循證總結(jié)類的臨床知識(shí)庫(kù),對(duì)知識(shí)庫(kù)內(nèi)容的編輯和審核都較為嚴(yán)格,這得益于其以醫(yī)生作者和專業(yè)編輯團(tuán)隊(duì)為核心,依靠臨床經(jīng)驗(yàn),并且根據(jù)臨床證據(jù)不斷對(duì)診療知識(shí)庫(kù)進(jìn)行更新和完善。雖然國(guó)外臨床知識(shí)庫(kù)的質(zhì)量?jī)?yōu)于國(guó)內(nèi),但是礙于語言差異等因素,選擇國(guó)內(nèi)相對(duì)高質(zhì)量的知識(shí)庫(kù)作為臨床診療知識(shí)推薦的基礎(chǔ),實(shí)用性更強(qiáng)。因此,本文選擇同樣經(jīng)過臨床醫(yī)生編輯、審核構(gòu)建的萬方臨床診療知識(shí)庫(kù),其無論在知識(shí)數(shù)據(jù)支持還是實(shí)用性上,都更為合適,能更好地為患者提供疾病、藥品、檢查、癥狀等方面的信息。

        在CNKI和WOS兩大數(shù)據(jù)庫(kù)中檢索發(fā)現(xiàn),“臨床知識(shí)庫(kù)”和“電子病歷”相關(guān)研究文獻(xiàn)以探討如何實(shí)現(xiàn)有效的臨床輔助和決策支持為主,依靠臨床知識(shí)庫(kù)或電子病歷中的規(guī)則約束醫(yī)療過程中醫(yī)生和患者的行為,為臨床診斷和治療提供建議,從而降低醫(yī)療意外的發(fā)生率,提高整體醫(yī)療質(zhì)量[7-9]。聶麗麗等[10]利用臨床藥學(xué)知識(shí)庫(kù)加強(qiáng)抗菌藥物的管理,規(guī)范激素類藥物與抗腫瘤藥物的使用,并為臨床用藥提供輔助作用,以降低患者用藥損害,從而提高醫(yī)生用藥水平,顯著降低用藥錯(cuò)誤率,實(shí)現(xiàn)精準(zhǔn)化管理臨床用藥。尹梓名等[11]基于國(guó)際頭痛診斷標(biāo)準(zhǔn)構(gòu)建知識(shí)庫(kù),并以此為基礎(chǔ),開發(fā)了覆蓋頭痛診斷整個(gè)流程的原發(fā)性頭痛輔助決策系統(tǒng),對(duì)常見的原發(fā)性頭痛診斷具有較高的準(zhǔn)確率。Ohno 等[12]構(gòu)建臨床知識(shí)庫(kù),用于開發(fā)臨床決策支持系統(tǒng)和臨床數(shù)據(jù)的摘要,提出記錄的適當(dāng)參數(shù),并驗(yàn)證疾病、藥物和實(shí)驗(yàn)室結(jié)果。總之,臨床知識(shí)庫(kù)和電子病歷的相關(guān)研究從20 世紀(jì)90年代開始呈快速增長(zhǎng)趨勢(shì),并取得了一定的成果,主要面向醫(yī)療工作者,而針對(duì)患者群體,提供相應(yīng)醫(yī)療知識(shí)的研究較少。

        隨著人們生活水平的提高以及健康意識(shí)不斷加強(qiáng),對(duì)自我健康管理的需求也愈發(fā)強(qiáng)烈,而基于權(quán)威的臨床知識(shí)庫(kù)為患者推薦與其健康狀況相關(guān)的疾病知識(shí),有助于提高患者對(duì)自身狀況的認(rèn)識(shí),避免從其他渠道獲取錯(cuò)誤知識(shí)而導(dǎo)致患者認(rèn)知的偏差。另一方面,醫(yī)患信息不對(duì)稱、患者缺乏醫(yī)學(xué)知識(shí)也是導(dǎo)致醫(yī)患關(guān)系緊張的重要因素。為患者推薦相關(guān)的醫(yī)學(xué)知識(shí),有助于緩解醫(yī)患之間的緊張關(guān)系,推動(dòng)醫(yī)患關(guān)系的健康良性發(fā)展[13]。因此,探究個(gè)性化的疾病知識(shí)推薦,對(duì)滿足患者健康管理的需求,了解自身健康狀況,改善醫(yī)患關(guān)系具有重要的理論意義和實(shí)踐價(jià)值。

        2 整合推薦方法

        本文在基于診療知識(shí)庫(kù)的內(nèi)容過濾推薦方法以及基于電子病歷的患者和疾病診斷的協(xié)同過濾推薦方法基礎(chǔ)上,提出一種整合推薦方法。整合推薦方法模型如圖1所示。

        2.1 基于診療知識(shí)庫(kù)的內(nèi)容過濾

        基于診療知識(shí)庫(kù)的內(nèi)容過濾采用中文分詞、TF-IDF、倒排索引等技術(shù)算法來實(shí)現(xiàn)。以臨床診療知識(shí)庫(kù)內(nèi)容為疾病診斷元數(shù)據(jù),以患者電子病歷中主述為主相關(guān)字段表達(dá)患者特征,計(jì)算兩者之間的相似度,得到患者與相應(yīng)疾病相關(guān)度的評(píng)分。針對(duì)疾病診斷元數(shù)據(jù)和電子病歷中的文本信息,以Python中的Jieba包為主要工具,加載基于臨床診療知識(shí)庫(kù)構(gòu)建的專業(yè)術(shù)語詞典,以優(yōu)化分詞效果,對(duì)文本信息進(jìn)行分析處理。TF-IDF是“詞頻”與“逆文檔頻率”的乘積,其與詞在某一記錄中出現(xiàn)的次數(shù)成正比,與所有記錄中出現(xiàn)的次數(shù)成反比[14]。

        本文引入了疾病診斷元數(shù)據(jù)的基于診療知識(shí)庫(kù)內(nèi)容的推薦,提升了推薦結(jié)果的相關(guān)性,使得推薦結(jié)果可解釋,也更易于被患者所感知,但同時(shí),該評(píng)分結(jié)果缺乏個(gè)性化,且依賴于對(duì)疾病診斷元數(shù)據(jù)的深度分析。在此基礎(chǔ)上,引入患者屬性,可以構(gòu)建相應(yīng)的患者模型,分析其興趣需求,分析結(jié)果具有個(gè)性化,但推薦精度低,存在馬太效應(yīng)和因?yàn)榛颊逨 行為稀疏而導(dǎo)致覆蓋率低等問題[15]。

        圖1 整合推薦方法模型圖Fig.1 Diagram of hybrid recommendation model

        2.2 基于電子病歷的患者協(xié)同過濾(Patient-based Collaborative Filtering,PbCF)

        基于電子病歷的PbCF 是電子病歷中具有類似疾病診斷的其他患者給予測(cè)試疾病診斷的相似度來估計(jì)測(cè)試患者對(duì)測(cè)試疾病診斷的相似度的一種過濾方法,其相似度計(jì)算公式如式(1)所示:

        其中,SUij表示標(biāo)號(hào)為i、j的兩個(gè)患者的相似度,I(i,j)表示患者i、j同時(shí)患有的疾病診斷集合,Rui表示患者u對(duì)疾病診斷i的評(píng)分,λ為懲罰(平滑)參數(shù),避免出現(xiàn)除零的情況。PbCF 的實(shí)現(xiàn)基于兩個(gè)假設(shè):當(dāng)前患者對(duì)于其相似患者所涉及的疾病存在一定的患病風(fēng)險(xiǎn);具有相似疾病的患者在未來也具有相似性的疾病。與基于內(nèi)容的推薦相比,協(xié)同過濾的優(yōu)勢(shì)表現(xiàn)在充分利用群體的智慧,其推薦精度要高于基于內(nèi)容的推薦算法,更加利于挖掘患者或疾病診斷間的隱含相關(guān)性,但相應(yīng)的,協(xié)同過濾的推薦結(jié)果解釋性較差,對(duì)時(shí)效性較強(qiáng)的疾病診斷不適用,同時(shí)面臨冷啟動(dòng)問題[16]。冷啟動(dòng)主要涉及患者冷啟動(dòng)、疾病診斷冷啟動(dòng)、系統(tǒng)冷啟動(dòng)3個(gè)方面[17]。解決患者冷啟動(dòng)可利用患者提供的年齡、性別等數(shù)據(jù)做粗粒度個(gè)性化處理,要求患者對(duì)一些疾病診斷進(jìn)行反饋,然后給患者推薦相似的疾病診斷。疾病診斷冷啟動(dòng),多利用內(nèi)容信息,將疾病診斷推薦給具有相似疾病診斷的患者,同時(shí)可以采用基于內(nèi)容的推薦來解決該問題,頻繁更新相關(guān)數(shù)據(jù)。再者,系統(tǒng)冷啟動(dòng)需引入專家知識(shí),通過高效的方式迅速建立起疾病診斷相關(guān)性矩陣。

        2.3 基于電子病歷的疾病診斷協(xié)同過濾(Diagnosticbased Collaborative Filtering,DbCF)

        基于電子病歷的DbCF是電子病歷中被同一患者患有的其他疾病診斷對(duì)應(yīng)測(cè)試患者的相似度來估計(jì)測(cè)試患者對(duì)測(cè)試疾病診斷的相似度的一種過濾方法。其相似度計(jì)算公式如式(2)所示:

        其中,SIij表示標(biāo)號(hào)為i、j的兩個(gè)疾病診斷的相似度,U(i,j)表示同時(shí)對(duì)i、j有評(píng)分的患者集合,Rui表示患者u對(duì)疾病診斷i的評(píng)分,λ為懲罰(平滑)參數(shù)。DbCF 是建立在患者可能患有與該疾病相關(guān)的其他疾病以及疾病之間的相關(guān)性較為穩(wěn)定兩個(gè)假設(shè)之上。與基于內(nèi)容的協(xié)同過濾相比,DbCF適合疾病診斷豐富且患者個(gè)性化需求強(qiáng)烈的領(lǐng)域,當(dāng)患者有新疾病,可以推薦與該疾病診斷相關(guān)的其他疾病,但必須在離線更新疾病診斷相似度表的情況下將新疾病診斷推薦給患者。

        2.4 整合推薦算法

        本文以患者-疾病診斷的交互評(píng)分矩陣為原始評(píng)分矩陣,結(jié)合基于診療知識(shí)庫(kù)內(nèi)容過濾所產(chǎn)生的歸一化后結(jié)果,形成整合評(píng)分矩陣,可防止評(píng)分矩陣過于稀疏,也將患者屬性所表達(dá)的與疾病診斷相關(guān)的因素引入評(píng)分矩陣,使得評(píng)分矩陣更加客觀。整合評(píng)分矩陣分別由基于患者和基于疾病診斷的協(xié)同過濾預(yù)測(cè),再依據(jù)式(3)結(jié)合兩者評(píng)分得到最終預(yù)測(cè)結(jié)果:

        其中,Sij為最終預(yù)測(cè)結(jié)果,SUij和SIij分別為PbCF和DbCF的預(yù)測(cè)值,α和β分別表示PbCF和DbCF所對(duì)應(yīng)的權(quán)重值。α和β值采用線性規(guī)劃來確定最優(yōu)值[18]。本文采用的線性規(guī)劃模型如式(4)所示:

        該線性規(guī)劃模型為了求預(yù)測(cè)最終結(jié)果α·SUij+β·SIij和實(shí)際結(jié)果y之間差異最小時(shí)所對(duì)應(yīng)的α、β的值。其中yij代表患者i對(duì)疾病診斷j的實(shí)際評(píng)分值。本文采用十折交叉驗(yàn)證,將整合評(píng)分矩陣分為10 組訓(xùn)練集和測(cè)試集,分別計(jì)算PbCF 和DbCF 的預(yù)測(cè)值,代入線性規(guī)劃模型,求得各組α、β的最優(yōu)值,最后取10 組數(shù)據(jù)結(jié)果的平均值,作為α、β的最終最優(yōu)值。

        3 實(shí)驗(yàn)評(píng)估

        3.1 數(shù)據(jù)源

        本文所選取的數(shù)據(jù)源主要分為兩部分,分別是萬方臨床診療知識(shí)庫(kù)的高血壓相關(guān)數(shù)據(jù)和某醫(yī)院高血壓疾病患者的電子病歷數(shù)據(jù)。

        萬方臨床診療知識(shí)庫(kù)包含疾病庫(kù)、檢查庫(kù)、藥品庫(kù)、指南規(guī)范、循證文獻(xiàn)和病例報(bào)告等數(shù)據(jù)庫(kù),由國(guó)內(nèi)上千名臨床資深專家團(tuán)隊(duì)共同創(chuàng)作,確保了診療知識(shí)庫(kù)的可靠性,為本文研究基于診療知識(shí)庫(kù)實(shí)現(xiàn)知識(shí)推薦提供有力的數(shù)據(jù)支持。其中,本文所實(shí)現(xiàn)的智能推薦功能,以疾病為結(jié)果,以患者為研究對(duì)象,進(jìn)行實(shí)驗(yàn)評(píng)估。因此,在上述的6個(gè)數(shù)據(jù)庫(kù)中,選取與患者關(guān)系更為緊密的疾病數(shù)據(jù)庫(kù),作為知識(shí)推薦的基礎(chǔ),且以高血壓相關(guān)的疾病數(shù)據(jù)作為示范疾病診斷元數(shù)據(jù)。抽取某醫(yī)院10 000名高血壓患者的電子病歷信息,以患者的診斷信息作為原始評(píng)分矩陣構(gòu)建的依據(jù),設(shè)定若患者具有某一疾病診斷結(jié)果,則該患者對(duì)該疾病診斷評(píng)分為1。雖然臨床診斷中有主要診斷和次要診斷之分,但兩者的劃分主要依據(jù)當(dāng)前住院的主要原因,且就患者個(gè)體而言,主要診斷與次要診斷所對(duì)應(yīng)的疾病與患者密切相關(guān)程度不一定具有較大差異,所以診斷結(jié)果中出現(xiàn)的診斷結(jié)果都將評(píng)分設(shè)為1。在此基礎(chǔ)上,引入基于診療知識(shí)庫(kù)內(nèi)容過濾的評(píng)分,可解決原始評(píng)分矩陣中評(píng)分的無差異化和稀疏問題。

        3.2 實(shí)驗(yàn)結(jié)果和評(píng)估

        十折交叉驗(yàn)證后,取α,β各組數(shù)據(jù)結(jié)果的均值,得到α=0.61,β=0.39 ,因此,最終預(yù)測(cè)結(jié)果Sij=0.61·SUij+0.39·SIij。本文選取平均絕對(duì)百分誤差(MAPE)作為預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo),對(duì)PbCF、DbCF 和整合推薦方法3 種方法進(jìn)行評(píng)估對(duì)比,每個(gè)方法都針對(duì)6組K近鄰(K-Nearest Neighbor,KNN)進(jìn)行試驗(yàn),由于K值一般不超過50,所以K選擇10、20、30、40、50、60,其中K=60 作為觀察結(jié)果,與其他結(jié)果做對(duì)比,分析MAPE 值是否有明顯的優(yōu)化[19]。結(jié)果如表1所示。

        上述3 種方法的最小MAPE 值對(duì)比結(jié)果表明整合推薦方法的MAPE 最小值為0.143,比PbCF 和DbCF所對(duì)應(yīng)的最小值0.176和0.186要小,表明整合推薦方法的預(yù)測(cè)效果明顯優(yōu)于PbCF和DbCF。

        表1 PbCF、DbCF和整合推薦方法的平均絕對(duì)百分誤差值Tab.1 Mean absolute deviation of PbCF,DbCF and hybrid recommendation method

        4 結(jié)論

        本文提出一種在診療知識(shí)庫(kù)內(nèi)容過濾的基礎(chǔ)上,融合PbCF 和DbCF 整合推薦方法。以臨床診療知識(shí)庫(kù)和電子病歷中高血壓數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),對(duì)整合推薦方法進(jìn)行評(píng)估,為高血壓患者推薦診療知識(shí)庫(kù)中相關(guān)的疾病知識(shí)。結(jié)果表明,整合推薦方法比獨(dú)立的PbCF、DbCF 效果更好,為患者推薦疾病診療知識(shí),具有廣泛的應(yīng)用前景。但由于所選診療知識(shí)庫(kù)的高血壓疾病種類覆蓋面不及電子病歷中高血壓患者所涉及的疾病種類,所以擴(kuò)大診療知識(shí)庫(kù)疾病覆蓋面對(duì)推薦結(jié)果的影響仍需進(jìn)一步探討。

        猜你喜歡
        疾病診斷知識(shí)庫(kù)病歷
        強(qiáng)迫癥病歷簿
        趣味(語文)(2021年9期)2022-01-18 05:52:42
        超高頻超聲在淺表器官疾病診斷中的應(yīng)用
        “大數(shù)的認(rèn)識(shí)”的診斷病歷
        《呼吸疾病診斷流程與治療策略》已出版
        基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
        為何要公開全部病歷?
        基于Web及知識(shí)推理的寵物狗疾病診斷專家系統(tǒng)
        高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
        CD10表達(dá)在滋養(yǎng)葉細(xì)胞疾病診斷中的臨床意義
        基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
        圖書館研究(2015年5期)2015-12-07 04:05:48
        午夜性刺激免费看视频| 色婷婷久久免费网站| 日韩人妻有码中文字幕| 精品一级一片内射播放| 国产在线精品一区二区三区直播| 国产成人精品成人a在线观看| 极品诱惑一区二区三区| 少妇呻吟一区二区三区| 国内永久福利在线视频图片| 免费国产黄网站在线观看| 人妻丰满熟妇AV无码片| 91久久国产精品综合| 强奸乱伦影音先锋| 国产成人无码一区二区在线观看 | 日本在线观看三级视频| 内射人妻无套中出无码| 中文字幕熟妇人妻在线视频| 免费在线观看一区二区| 国产一区二区在线免费视频观看| 2019最新中文字幕在线观看| 亚洲国产区男人本色| 日韩偷拍视频一区二区三区| 精品国产自在现线看久久| 自愉自愉产区二十四区| 欧美a视频在线观看| 日本精品啪啪一区二区| 最美女人体内射精一区二区| 亚洲国产精品久久亚洲精品| 欧洲亚洲色一区二区色99| 风流熟女一区二区三区| 无码丰满熟妇一区二区| 久久久亚洲欧洲日产国产成人无码 | 国产精品视频久久久久| 国产一区二区三区在线观看免费版| 国内永久福利在线视频图片| 亚州少妇无套内射激情视频| 波多吉野一区二区三区av| 性感女教师在线免费观看| 国产精品自在线拍国产手机版| 国产精品网站夜色| 色婷婷av一区二区三区丝袜美腿|