亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        在線醫(yī)療社區(qū)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

        2024-04-29 00:00:00張霞邵芊芊顧加成
        無線互聯(lián)科技 2024年3期

        摘要:作為“互聯(lián)網(wǎng)+醫(yī)療”的重要產(chǎn)物,在線醫(yī)療社區(qū)迅速發(fā)展。在線醫(yī)療社區(qū)產(chǎn)生了大量的醫(yī)療問答信息,這些信息富含醫(yī)學(xué)知識(shí)和患者關(guān)切等內(nèi)容。因此,文章構(gòu)建了在線醫(yī)療社區(qū)分析系統(tǒng)的架構(gòu),再通過網(wǎng)絡(luò)爬蟲、數(shù)據(jù)清洗和存儲(chǔ)、文本分詞、數(shù)據(jù)可視化等技術(shù),設(shè)計(jì)并開發(fā)了一個(gè)醫(yī)患問答數(shù)據(jù)的分析系統(tǒng),通過折線圖、餅狀圖和生成詞云等數(shù)據(jù)分析,得到不同疾病的發(fā)病癥狀、治療常用藥物等有用知識(shí),為患者診斷和治療提供便利,也能為醫(yī)生了解患者關(guān)切提供依據(jù)。

        關(guān)鍵詞:在線醫(yī)療社區(qū);文本分詞;詞云分析

        中圖分類號(hào):TP391.1" 文獻(xiàn)標(biāo)志碼:A

        0 引言

        隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,“互聯(lián)網(wǎng)+醫(yī)療”蓬勃興起?;ヂ?lián)網(wǎng)和醫(yī)療的不斷結(jié)合,形成了一種新興的“在線醫(yī)療”輔助就醫(yī)模式。在線醫(yī)療主要通過網(wǎng)絡(luò)平臺(tái)為患者提供線上問診、預(yù)約掛號(hào)、就診咨詢等醫(yī)療服務(wù)。2016年以來,我國(guó)出臺(tái)了《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》等一系列政策法規(guī),推動(dòng)了“互聯(lián)網(wǎng)+醫(yī)療”應(yīng)用的飛速發(fā)展。作為“互聯(lián)網(wǎng)+醫(yī)療”發(fā)展下的產(chǎn)物,在線醫(yī)療社區(qū)是目前影響范圍最廣的互聯(lián)網(wǎng)醫(yī)療形式之一,其改善健康公平和優(yōu)化資源配置的作用也日益凸顯[1]?;颊呖梢酝ㄟ^移動(dòng)端設(shè)備直接與醫(yī)生進(jìn)行互動(dòng)交流,交流過程中能夠在醫(yī)療社區(qū)留下大量的醫(yī)患交流數(shù)據(jù)。身處大數(shù)據(jù)時(shí)代,從大量的醫(yī)患交流數(shù)據(jù)中挖掘數(shù)據(jù)背后的信息并加以合理利用,具有很高的價(jià)值[2]。本文旨在設(shè)計(jì)并開發(fā)一個(gè)基于在線醫(yī)療社區(qū)數(shù)據(jù)的分析系統(tǒng),為患者診斷和治療提供便利,也能為醫(yī)生了解患者關(guān)切提供依據(jù)。

        1 研究現(xiàn)狀

        文本分析技術(shù)在在線醫(yī)療領(lǐng)域應(yīng)用廣泛,例如,能夠挖掘我國(guó)出臺(tái)的“互聯(lián)網(wǎng)+醫(yī)療”相關(guān)政策,方便對(duì)在線醫(yī)療領(lǐng)域作出修改以契合國(guó)家政策[3];對(duì)相似患者與醫(yī)生交互行為進(jìn)行數(shù)據(jù)挖掘,提取特征后進(jìn)行文本分析,為類似患者進(jìn)行個(gè)性化醫(yī)生推薦[4];對(duì)醫(yī)療文本進(jìn)行分析挖掘,為臨床決策提供有價(jià)值的幫助[5];通過文本分析技術(shù)對(duì)某一疾病進(jìn)行研究,實(shí)現(xiàn)對(duì)疾病的預(yù)測(cè)[6];挖掘患者電子病歷等相關(guān)數(shù)據(jù)的用藥模式,實(shí)現(xiàn)輔助診療[7]。

        近年來,高血壓、高血脂、糖尿病等慢性疾病的患病率一直居高不下[8],在線醫(yī)療社區(qū)和文本分析技術(shù)的發(fā)展在一定程度上可以減輕患者問診、信息咨詢等負(fù)擔(dān)[9]。本文運(yùn)用網(wǎng)絡(luò)爬蟲、數(shù)據(jù)清洗和存儲(chǔ)、文本分詞、數(shù)據(jù)可視化等技術(shù),開發(fā)在線醫(yī)療社區(qū)中醫(yī)患疾病問答等數(shù)據(jù)的分析系統(tǒng),對(duì)不同疾病畫像,不僅能為患者診斷和治療提供便利,也能為醫(yī)生了解病患的關(guān)切提供依據(jù)。

        2 在線醫(yī)療社區(qū)分析系統(tǒng)設(shè)計(jì)

        2.1 總體架構(gòu)

        在線醫(yī)療社區(qū)分析系統(tǒng)的功能模塊主要包括采集數(shù)據(jù)、數(shù)據(jù)存儲(chǔ)以及疾病社區(qū)分析。因此,本系統(tǒng)主要有3個(gè)功能模塊:數(shù)據(jù)采集模塊、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)分析模塊以及數(shù)據(jù)展示模塊。本系統(tǒng)的架構(gòu)如圖1所示。數(shù)據(jù)采集模塊是用來解決基礎(chǔ)數(shù)據(jù)問題的,能夠針對(duì)不同的網(wǎng)站結(jié)構(gòu)編寫不同爬蟲以獲取頁面數(shù)據(jù),接著進(jìn)行數(shù)據(jù)清洗,得到原始數(shù)據(jù);數(shù)據(jù)存儲(chǔ)和分析功能模塊能夠?qū)Σ杉降臄?shù)據(jù)進(jìn)行存儲(chǔ),還可以根據(jù)不同目標(biāo)將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫和文本里,然后對(duì)數(shù)據(jù)進(jìn)行分析來生成詞云和篩選數(shù)據(jù);數(shù)據(jù)展示模塊將數(shù)據(jù)存儲(chǔ)和分析模塊生成的詞云展示到前端頁面上,同時(shí)還具備分類展示和異步刷新展示的功能。

        2.2 數(shù)據(jù)采集模塊

        數(shù)據(jù)采集模塊分為數(shù)據(jù)采集和數(shù)據(jù)清洗2部分,可以對(duì)指定的不同醫(yī)療社區(qū)網(wǎng)站數(shù)據(jù)進(jìn)行采集和處理。數(shù)據(jù)采集通過爬蟲技術(shù)實(shí)現(xiàn),首先針對(duì)不同的醫(yī)療社區(qū)網(wǎng)站結(jié)構(gòu),基于Scrapy框架編寫不同的網(wǎng)絡(luò)爬蟲,采集目標(biāo)網(wǎng)站的頁面數(shù)據(jù),然后依據(jù)不同的頁面結(jié)構(gòu)對(duì)爬取的目標(biāo)網(wǎng)站數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,在完成數(shù)據(jù)清洗之后就得到了網(wǎng)站的基礎(chǔ)數(shù)據(jù)。

        2.3 數(shù)據(jù)存儲(chǔ)模塊

        爬取和清洗的數(shù)據(jù)需要進(jìn)行存儲(chǔ),本系統(tǒng)的基礎(chǔ)數(shù)據(jù)是從醫(yī)療社區(qū)網(wǎng)站獲取,數(shù)量比較龐大,采用數(shù)據(jù)庫存儲(chǔ)會(huì)獲得更好的體驗(yàn)。數(shù)據(jù)存儲(chǔ)模塊采用了主流的MySQL關(guān)系型數(shù)據(jù)庫,主要是根據(jù)數(shù)據(jù)量的大小或特定需求將爬取和清洗后的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫中,便于后續(xù)進(jìn)行數(shù)據(jù)分析和詞云分析。

        2.4 數(shù)據(jù)分析和展示模塊

        數(shù)據(jù)分析和展示模塊采用了基于Django框架的瀏覽器/服務(wù)器模式(B/S),主要分為客戶端、Web服務(wù)器和數(shù)據(jù)服務(wù)器3層。其中,客戶端就是瀏覽器;Web服務(wù)器負(fù)責(zé)對(duì)客戶端發(fā)送的http請(qǐng)求進(jìn)行響應(yīng);數(shù)據(jù)服務(wù)器則用來存放數(shù)據(jù)??蛻舳隧撁嬷饕捎昧思嫒莓?dāng)前大多數(shù)瀏覽器的Echarts技術(shù),提供了多種直觀、生動(dòng)、可定制的數(shù)據(jù)可視化圖表庫,包括折線圖、柱狀圖、散點(diǎn)圖、餅圖、盒形圖等。

        本文主要對(duì)在線醫(yī)療社區(qū)的醫(yī)患問答數(shù)據(jù)進(jìn)行分析,詞云分析能夠展示不同疾病的信息,數(shù)據(jù)分析可將不同疾病的相關(guān)數(shù)據(jù)歸類并用統(tǒng)計(jì)表進(jìn)行展示。除此以外,為了方便用戶查找和盡可能減少服務(wù)器負(fù)載,數(shù)據(jù)展示還可以進(jìn)行分類和異步動(dòng)態(tài)刷新。

        3 在線醫(yī)療社區(qū)分析系統(tǒng)的實(shí)現(xiàn)

        在線醫(yī)療社區(qū)富含大量有價(jià)值的醫(yī)學(xué)信息,例如常見疾病板塊有疾病相關(guān)問題的問和答;名醫(yī)科普中有名醫(yī)發(fā)表的疾病科普文章,可以采用文本分析等技術(shù)進(jìn)行挖掘有用知識(shí)。

        3.1 數(shù)據(jù)采集模塊

        安裝好爬蟲需要的庫,接著編寫相關(guān)代碼,對(duì)目標(biāo)網(wǎng)站數(shù)據(jù)進(jìn)行爬取。本文數(shù)據(jù)來源于ask.39.net網(wǎng)站部分科室部分疾病的醫(yī)患問答內(nèi)容、www.zysj.com.cn網(wǎng)站的中藥方劑數(shù)據(jù)、db.cngb.org網(wǎng)站的癌癥相關(guān)研究文章、baodian.familydoctor.com.cn網(wǎng)站各科室疾病分類的科普文章和醫(yī)患的問答數(shù)據(jù)。完成數(shù)據(jù)采集后再對(duì)爬取的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗以便后續(xù)操作。

        3.2 數(shù)據(jù)存儲(chǔ)模塊

        該模塊主要實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)和分析功能。數(shù)據(jù)主要存儲(chǔ)在數(shù)據(jù)庫,用Django的對(duì)象關(guān)系映射操作數(shù)據(jù)庫,在創(chuàng)建數(shù)據(jù)表之后,將數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫中。在ask.39.net網(wǎng)站上爬取了2022年4月15日至2022年4月20日期間近45萬條數(shù)據(jù),存儲(chǔ)到數(shù)據(jù)庫中的部分?jǐn)?shù)據(jù)片段如圖2所示。

        3.3 數(shù)據(jù)分析和展示模塊

        數(shù)據(jù)分析和展示模塊主要是實(shí)現(xiàn)前端的數(shù)據(jù)分析和展示功能。首先,用戶可以在搜索主頁面的輸入框中輸入需要分析的網(wǎng)站地址并跳轉(zhuǎn)至分析頁面;其次,分析頁面對(duì)目標(biāo)網(wǎng)站進(jìn)行總體的粗略分析,左側(cè)選擇條目,右側(cè)展示分析結(jié)果;最后,用戶可以得到相關(guān)疾病的詞云分析。

        在數(shù)據(jù)分析模塊,用戶可以從不同的角度來分析。偏頭痛的提問時(shí)間偏好分析如圖3所示,由圖3可知“16—20點(diǎn)”這個(gè)時(shí)間段的提問數(shù)明顯高于其他時(shí)間段,偏頭痛問題的提問時(shí)間能側(cè)面反映疾病發(fā)病時(shí)間。

        圖4是對(duì)2020年感冒問題數(shù)按照月份進(jìn)行統(tǒng)計(jì)的折線圖,可以得到2020年感冒提問數(shù)的趨勢(shì)。從圖中可以看出,在11—12月份,感冒提問數(shù)會(huì)有明顯的升高,而2月份往后,提問數(shù)有一個(gè)回落。可以推測(cè),11月份到次年1月份會(huì)是感冒的一個(gè)高發(fā)期。

        對(duì)高血壓?jiǎn)柎饠?shù)據(jù)的詞云分析如圖5所示,可以看出“低鹽低脂”“低脂肪飲食”“低鹽飲食”出現(xiàn)較多,說明高血壓患者在日常生活中需要格外注重自身的飲食習(xí)慣,飲食要清淡,盡可能多地食用低鹽低脂的食物;“藥物”“硝苯地平緩釋片”“波依定”等藥物也被多次提及,高血壓患者通常使用藥物降壓進(jìn)行治療;“原發(fā)性高血壓”和“繼發(fā)性高血壓”也被提及,對(duì)應(yīng)了高血壓的2個(gè)種類。除此以外,“情緒激動(dòng)”“運(yùn)動(dòng)”也有被提及,說明高血壓病患也要控制情緒、多加運(yùn)動(dòng),對(duì)緩解癥狀有一定的幫助。

        4 結(jié)語

        本文通過網(wǎng)絡(luò)爬蟲、數(shù)據(jù)清洗、數(shù)據(jù)存儲(chǔ)、文本分詞和數(shù)據(jù)可視化等技術(shù),開發(fā)并實(shí)現(xiàn)了一個(gè)在線醫(yī)療社區(qū)用戶信息、醫(yī)患問答等數(shù)據(jù)的分析系統(tǒng),從而獲得病患發(fā)病時(shí)間、提問高峰、治療疾病的常用藥物、疾病的可能誘因、疾病的類型、醫(yī)生對(duì)患者的建議等大量有效信息。這些信息能為患者診斷和治療提供便利,也能為醫(yī)生了解病患的關(guān)切提供依據(jù)。

        為了更好地為醫(yī)生和患者服務(wù),在線醫(yī)療社區(qū)分析系統(tǒng)可以采用數(shù)據(jù)挖掘算法挖掘穩(wěn)定社群和動(dòng)態(tài)社群,指導(dǎo)醫(yī)療社群信息網(wǎng)絡(luò)的社群融合;在線醫(yī)療社交媒體用戶生成內(nèi)容包含文本、圖片、音頻、視頻等信息,可以考慮如何將這些多模態(tài)的異質(zhì)及部分隱私信息與網(wǎng)絡(luò)結(jié)構(gòu)相結(jié)合,學(xué)習(xí)復(fù)雜社會(huì)信息網(wǎng)絡(luò)嵌入表征,得到醫(yī)療社群的偏好,提高社群畫像的質(zhì)量;醫(yī)療社群建立在產(chǎn)品與粉絲之間的情感信任之上,可以考慮如何更好地從異構(gòu)網(wǎng)絡(luò)獲取信息為醫(yī)療群組作出合理的推薦并給出推薦的理由。

        參考文獻(xiàn)

        [1]徐中陽,樓海萍.在線健康社區(qū)用戶醫(yī)療健康服務(wù)需求研究[J].醫(yī)學(xué)信息學(xué)雜志,2021(5):32-39.

        [2]楊少梅,吳皓月,李勝利.在線醫(yī)療社區(qū)需求詞屬性分選研究——以丁香園論壇為例[J].情報(bào)探索,2022(2):43-52.

        [3]鄢聞.政策工具視角下我國(guó)健康醫(yī)療大數(shù)據(jù)政策文本分析[J].情報(bào)探索,2023(1):16-21.

        [4]衛(wèi)軼男.基于文本分析的醫(yī)生個(gè)性化推薦[D].成都:西南財(cái)經(jīng)大學(xué),2022.

        [5]周陽.基于機(jī)器學(xué)習(xí)的醫(yī)療文本分析挖掘技術(shù)研究[D].北京:北京交通大學(xué),2020.

        [6]劉偉.基于集成學(xué)習(xí)的心血管疾病預(yù)測(cè)研究[D].太原:山西財(cái)經(jīng)大學(xué),2023.

        [7]馮雪.面向危重癥患者的用藥模式挖掘及預(yù)后預(yù)測(cè)方法研究[D].北京:北京交通大學(xué),2022.

        [8]陳雪蓮,韓杰.某社區(qū)衛(wèi)生服務(wù)中心慢性非傳染性疾病社區(qū)診斷[J].黑龍江醫(yī)藥科學(xué),2020(2):63-64,66.

        [9]劉帥.在線醫(yī)療工具用戶使用意愿影響因素調(diào)查[J].辦公自動(dòng)化,2021(19):15-18.

        Design and implementation of an online medical community analysis system

        Abstract: "As an important product of “Internet + medical”, online medical community has developed rapidly. Online medical community has produced a large number of medical Qamp;A information, which is rich in medical knowledge and patient concerns. Therefore, this paper constructs the framework of an online medical community analysis system, and then design and develop a doctor-patient question-and-answer data analysis system through Web crawler, data cleaning and storage, text word segmentation, data visualization and other technologies to obtain useful knowledge about the symptoms of different diseases, commonly used drugs for treatment, and analyze data such as word cloud, line chart, and pie chart. It facilitates the diagnosis and treatment of patients and provides a basis for doctors to understand patients’ concerns.

        Key words: online medical community; text segmentation; word cloud analysis

        高清少妇一区二区三区| 精品高清一区二区三区人妖| 中文字幕色偷偷人妻久久一区 | 亚洲国产日韩综一区二区在性色 | 日韩av免费在线不卡一区 | 国产熟女自拍视频网站| 日本综合视频一区二区| 后入到高潮免费观看| 国自产精品手机在线观看视频| 国产精品亚洲日韩欧美色窝窝色欲| 国产人成无码视频在线1000| 亚洲黄色一插一抽动态图在线看| 亚洲精品国产成人久久av| 四虎影视成人永久免费观看视频| 亚洲国产综合人成综合网站| 亚洲精品国产精品av| 三级日韩视频在线观看| 国产欧美日韩精品专区| 把女邻居弄到潮喷的性经历| 91久久青青草原线免费| 亚洲中文字幕有综合久久| 青青草视频在线观看色| 国产台湾无码av片在线观看| 久久亚洲AV成人一二三区| 国产精品国产三级国a| 久久不见久久见免费视频6| 成人aaa片一区国产精品| 国模私拍福利一区二区| 青青草国内视频在线观看| 青青草亚洲视频社区在线播放观看| 国产成人av大片大片在线播放| 人妻久久999精品1024| 久久午夜一区二区三区| 丰满少妇作爱视频免费观看| 亚洲日韩精品国产一区二区三区| 日本高清一区二区三区视频| 久久精品av在线观看| 黑人巨大av在线播放无码| 蜜桃一区二区三区在线看| 加勒比久久综合久久伊人爱| 久久精品欧美日韩精品|