亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多中心臨床大數(shù)據(jù)平臺建設及深度應用

        2018-06-01 18:11:36朱立峰劉淑君陳德華樂嘉錦
        大數(shù)據(jù) 2018年3期
        關鍵詞:子系統(tǒng)中心算法

        朱立峰,劉淑君,陳德華,樂嘉錦

        1.上海交通大學醫(yī)學院附屬瑞金醫(yī)院,上海 200025;

        2.東華大學計算機科學與技術學院,上海 201620

        1 引言

        近年來,多中心臨床研究受到越來越多的關注。所謂多中心臨床研究指的是由多個研究中心的臨床醫(yī)生或科研人員按照同樣的研究設計、為同一個研究目的、協(xié)同完成的臨床研究工作[1]。其中,研究中心可以是三級甲等醫(yī)院,也可以是負責某個具體區(qū)域的社區(qū)醫(yī)院。具體而言,在多中心臨床研究中,臨床科研由一個研究中心總體負責,擔當牽頭單位的角色,然后由多個研究中心的臨床醫(yī)生共同合作,按照同一個研究方案在不同的研究中心同時進行。這樣,多位臨床醫(yī)生可不受地點的限制,在不同科室、不同醫(yī)院按同一試驗方案同時進行臨床研究,協(xié)同完成各項研究工作。多中心臨床研究實現(xiàn)了多中心、多學科對同一臨床問題的廣泛協(xié)作研究,對于發(fā)揮臨床醫(yī)生的學術優(yōu)勢、促進醫(yī)學科學的發(fā)展具有重要的意義。

        經(jīng)過多年的努力,多中心臨床研究已成為國內(nèi)外各類醫(yī)療機構開展疾病臨床研究的重要方法[2]。一方面,相對于單中心研究,多中心臨床研究要求多個研究中心同時參與,可在較短的時間內(nèi)遴選出臨床科研所需的病例數(shù);另一方面,相對于單中心研究,在多中心臨床研究中多個中心入選的病例在病種病情分布等方面范圍比較廣。以糖尿病多中心研究為例,在確診和治療前期,患者多選擇到三級甲等醫(yī)院就診,確定適合個體的治療方案。治療方案穩(wěn)定后,患者大多會選擇到社區(qū)衛(wèi)生服務中心進行長期治療和監(jiān)督控制。因此,多中心的研究可以覆蓋更多的糖尿病患者。

        雖然多中心臨床研究已被眾多的醫(yī)院、科研機構、臨床醫(yī)生廣泛采納,但是在實際應用中,多中心臨床研究也具有許多不足之處。

        (1)樣本量往往偏?。磪⑴c臨床科研的病例數(shù)偏少)

        在選取參與科研的樣本病例上,當前的多中心臨床研究通常采取一種協(xié)商遴選的辦法,即各個研究中心的臨床醫(yī)生根據(jù)臨床科研目標提供候選病例,再由總負責的研究中心確定目標樣本。這種協(xié)商遴選的方法難以在較短的時間內(nèi)收集足夠多的病例[3]。當前的多中心臨床研究的樣本數(shù)量規(guī)模大致為幾百,樣本規(guī)模偏小,病例數(shù)不多。

        (2)臨床科研相對封閉、開放程度不高

        在臨床科研上,多中心臨床研究需要科研團隊之間共享科研數(shù)據(jù)和臨床研究設計。當前的多中心臨床研究在組建科研團隊上大多采用如下3種方式:針對某一研究問題正式指派組成團隊;有相同研究興趣的同事組成團隊;先決定團隊的帶頭人,再由帶頭人發(fā)現(xiàn)團隊成員。無論采取哪種方式組織團隊,臨床科研數(shù)據(jù)的搜集與共享都依賴于參與多中心臨床研究的醫(yī)院、科室、臨床醫(yī)生,這使得臨床科研相對比較封閉。

        因此,本文針對當前多中心臨床研究存在的“樣本量偏少、相對封閉”的缺點,結合新近興起的大數(shù)據(jù)與云計算等技術,將物理上分散的各醫(yī)院臨床中心融合成邏輯上統(tǒng)一的臨床大數(shù)據(jù),在此基礎上構建多中心臨床大數(shù)據(jù)應用平臺,并將之運用于多中心的臨床研究實踐中,實現(xiàn)多中心臨床研究向“全樣本、多學科、多病種、開放性”轉變,探索基于多中心臨床大數(shù)據(jù)的應用示范。

        本文首先給出多中心臨床大數(shù)據(jù)平臺的總體架構,然后詳細闡述臨床隨訪系統(tǒng)、平臺核心系統(tǒng),最后闡述臨床大數(shù)據(jù)平臺在內(nèi)分泌和高血壓等疾病上的深度應用。

        2 多病種、多中心臨床大數(shù)據(jù)平臺總體框架

        本文所提的多病種、多中心臨床大數(shù)據(jù)平臺的總體架構如圖1所示。平臺總體框架由數(shù)據(jù)基礎層、臨床隨訪系統(tǒng)、平臺核心系統(tǒng)、應用系統(tǒng)構成。

        ● 數(shù)據(jù)基礎層是整個平臺的數(shù)據(jù)來源,多病種、多中心臨床大數(shù)據(jù)主要來源于醫(yī)院臨床數(shù)據(jù)倉庫、其他大型醫(yī)院臨床數(shù)據(jù)倉庫及社區(qū)衛(wèi)生服務中心臨床數(shù)據(jù)倉庫。

        ● 臨床隨訪系統(tǒng)的目的是為??漆t(yī)生進行臨床科研隨訪提供支持,包括建立隨訪隊列、形成隨訪表單、導出隨訪數(shù)據(jù)、對患者隨訪進行提醒跟蹤。

        ● 平臺核心系統(tǒng)是臨床大數(shù)據(jù)平臺的核心層,由3個子系統(tǒng)組成,即多中心臨床大數(shù)據(jù)整合子系統(tǒng)、多中心臨床大數(shù)據(jù)存儲子系統(tǒng)、多中心臨床大數(shù)據(jù)分析挖掘算法子系統(tǒng)。

        ● 應用系統(tǒng)為平臺面向用戶(包括醫(yī)生和患者)提供的疾病分析應用服務,本文選擇內(nèi)分泌、高血壓、腫瘤等若干病種作為研究對象,通過對多中心臨床大數(shù)據(jù)進行分析與挖掘,更好地為醫(yī)生和患者提供輔助診療服務。

        3 臨床隨訪系統(tǒng)

        臨床隨訪系統(tǒng)方便專科醫(yī)生篩選隨訪隊列,幫助專科醫(yī)生自助設計隨訪表單,并在完成隨訪表單填寫時,高效、準確地獲取患者臨床數(shù)據(jù),如就診記錄、醫(yī)囑、檢驗檢查報告、病理報告、手術麻醉記錄、病史記錄等,并提供隨訪表單數(shù)據(jù)手工錄入功能,幫助??漆t(yī)生獲取和瀏覽患者在院內(nèi)的全部診療記錄,為科研與臨床診療結合提供流程優(yōu)化支持[4]。具體而言,臨床隨訪系統(tǒng)包括以下4項。

        ● 隨訪信息維護。通過輸入隨訪名稱、課題名稱、課題組成員、課題起始時間等信息創(chuàng)建隨訪隊列,并基于隨訪隊列維護課題組成員,可以添加賬戶或凍結賬戶,并通過結題管理維護隊列狀態(tài)。

        ● 隨訪表單管理,編輯管理表單模板名稱、用途、適用的隨訪隊列。每個隨訪隊列可對應多個表單模板,主要可分為首次隨訪記錄、住院隨訪記錄、門診隨訪記錄等。

        ● 隨訪提示為臨床醫(yī)生提供如下功能:對于隨訪隊列中的患者,如果超過預定時間(如門診、住院一個月)無就診記錄,在隨訪隊列中的負責醫(yī)生登錄時進行提示;如果存在就診事件(門診、急診、住院),但尚未填寫對應的隨訪表單,在隨訪隊列中的負責醫(yī)生登錄時進行提示。

        ● 隨訪信息庫提供網(wǎng)頁形式,可由院外科研人員進入某一隨訪隊列,添加患者信息,錄入隨訪表單或者批量導入隨訪數(shù)據(jù)。

        4 平臺核心系統(tǒng)

        本節(jié)闡述的多中心臨床大數(shù)據(jù)平臺的核心系統(tǒng)包括多中心臨床大數(shù)據(jù)整合子系統(tǒng)、多中心臨床大數(shù)據(jù)存儲子系統(tǒng)和多中心臨床大數(shù)據(jù)分析挖掘算法子系統(tǒng)。

        4.1 多中心臨床大數(shù)據(jù)整合子系統(tǒng)

        臨床數(shù)據(jù)整合技術旨在將現(xiàn)有的不同臨床信息系統(tǒng)產(chǎn)生的臨床數(shù)據(jù)匯總到統(tǒng)一的信息平臺,實現(xiàn)患者標識統(tǒng)一以及患者臨床信息的統(tǒng)一瀏覽發(fā)布。目前,筆者所在單位擁有醫(yī)院信息系統(tǒng)(HIS)、實驗室信息系統(tǒng)(LIS)、放射科信息管理系統(tǒng)(RIS)、電子病歷(EMR)、病理、手麻、心電等業(yè)務系統(tǒng),數(shù)據(jù)庫管理系統(tǒng)采用了MS SQL Server和 Sybase ASE,為了將數(shù)據(jù)抽取、加載和轉換(extraction-loadingtransformation,ETL)過程對實時業(yè)務系統(tǒng)的影響降到最低,采用規(guī)范化數(shù)據(jù)存儲(normalized data store,NDS)+多維數(shù)據(jù)存儲(dimensional data store,DDS)的數(shù)據(jù)流架構,臨床數(shù)據(jù)整合流程如圖2所示。ETL是構建數(shù)據(jù)倉庫的重要一環(huán),用戶從數(shù)據(jù)源抽取所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,最終按照預先定義的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中。

        其中,Stage為源系統(tǒng)數(shù)據(jù)的一個副本,從Source到Stage的ETL過程并不對數(shù)據(jù)進行刪減、修改或整合,僅負責抽取和加載,而從Stage到NDS的ETL過程則需要按照數(shù)據(jù)倉庫建模的需求對數(shù)據(jù)進行一定的清洗和轉換[5]。

        4.2 多中心臨床大數(shù)據(jù)存儲子系統(tǒng)

        多中心臨床大數(shù)據(jù)存儲子系統(tǒng)是整個平臺的存儲基礎,為數(shù)據(jù)篩選、過濾、處理、分析提供原始數(shù)據(jù),要求容量大、效率高、安全性強。云存儲是通過集群應用、網(wǎng)絡技術分布式文件系統(tǒng)等將不同種類的存儲設備協(xié)調(diào)工作,共同對外提供數(shù)據(jù)存儲和訪問功能的一個系統(tǒng),它以數(shù)據(jù)存儲和數(shù)據(jù)管理為核心[6]。本文采用云計算的數(shù)據(jù)管理平臺實現(xiàn)對多中心臨床大數(shù)據(jù)的多元化存儲與訪問,提供線性擴展的分布式存儲能力。多中心臨床大數(shù)據(jù)存儲系統(tǒng)通過整合關系數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫、文件系統(tǒng)等異構存儲模式,實現(xiàn)多中心異構臨床數(shù)據(jù)按需、按數(shù)據(jù)特性存儲,支持大容量存儲空間,存儲效率快,可擴展性強,并通過統(tǒng)一的數(shù)據(jù)總線實現(xiàn)跨存儲設施的統(tǒng)一訪問。此外,借助并行數(shù)據(jù)處理技術對吞吐量、并發(fā)量以及可用性進行增強。

        圖1 多病種、多中心臨床大數(shù)據(jù)平臺總體架構

        圖2 數(shù)據(jù)整合流程

        多中心臨床數(shù)據(jù)種類很多,針對不同的臨床科研需求和數(shù)據(jù)特點,遵循HL7標準對各種來源的多中心臨床數(shù)據(jù)進行語義轉換、結構變換,然后調(diào)用統(tǒng)一數(shù)據(jù)訪問接口將其存儲到合適的底層存儲系統(tǒng)中。多中心臨床大數(shù)據(jù)存儲子系統(tǒng)考慮到異構數(shù)據(jù)的特點,采用了不同的底層存儲設施,具體包括MongoDB、MySQL、HBase、Hadoop分布式文件系統(tǒng)(HDFS)等關系數(shù)據(jù)庫、列存儲數(shù)據(jù)庫和分布式文件系統(tǒng)。其中,MongoDB、HBase主要用來存儲半結構化數(shù)據(jù),如檢驗/檢查報告、出院小結等;MySQL主要用來存儲結構化數(shù)據(jù),如病人信息、處方等;HDFS主要用來存儲非結構化的二進制文件,如來自影像歸檔和通信系統(tǒng)(PACS)的放射檢查膠片圖像。

        4.3 多中心臨床大數(shù)據(jù)分析挖掘算法子系統(tǒng)

        多中心臨床大數(shù)據(jù)分析挖掘算法子系統(tǒng)為疾病臨床數(shù)據(jù)分析挖掘系統(tǒng)提供多維分析、分類、聚類、預測、回歸分析和深度學習算法支持。在該系統(tǒng)中,共劃分為多維分析算法、數(shù)據(jù)挖掘算法、深度學習預測算法三大基礎模塊。

        (1)多維分析算法

        多維數(shù)據(jù)分析首先需要建立多維數(shù)據(jù)集,由于其具有很多維度的特性,多維數(shù)據(jù)集通常被形象地稱為數(shù)據(jù)立方體(cube)。多維數(shù)據(jù)集是一個數(shù)據(jù)集合,通常先從數(shù)據(jù)倉庫中選取若干數(shù)據(jù)子集,再組織和匯總成由多個維度和度量值定義的多維結構,多維數(shù)據(jù)分析可對以多維形式組織起來的數(shù)據(jù)立方體進行上卷、下鉆、切片、切塊、旋轉等多種分析操作,以便剖析數(shù)據(jù),使分析者、決策者能從多個角度、多個側面觀察數(shù)據(jù)庫中的數(shù)據(jù),從而深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵[7]。

        (2)數(shù)據(jù)挖掘算法

        數(shù)據(jù)挖掘算法模塊提供了包括分類、聚類、關聯(lián)規(guī)則、回歸分析等機器學習算法的統(tǒng)一注冊、應用與注銷管理,用于針對特定數(shù)據(jù)集的挖掘分析,實現(xiàn)臨床的深度分析、預警與預測。

        數(shù)據(jù)挖掘算法模塊中集成了隨機森林、支持向量機、神經(jīng)網(wǎng)絡、決策樹等分類算法和K-means聚類算法、邏輯回歸、線性回歸和關聯(lián)分析等算法[8]。

        (3)深度學習預測算法

        深度學習預測算法模塊集成了卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)和長短期記憶(long short term memory,LSTM)網(wǎng)絡[9]等算法。

        5 多中心臨床大數(shù)據(jù)平臺深度應用

        在多中心臨床大數(shù)據(jù)平臺的基礎上,進一步結合內(nèi)分泌學科、高血壓等學科的優(yōu)勢,開展臨床大數(shù)據(jù)的深度應用。

        (1)面向甲狀腺腫瘤的臨床醫(yī)療大數(shù)據(jù)的知識挖掘系統(tǒng)

        臨床中患者腫瘤的良惡性診斷結果的準確性主要依賴于醫(yī)生的主觀判斷,不同醫(yī)生的臨床經(jīng)驗和醫(yī)院醫(yī)療水平等存在差異,勢必會造成不同程度的誤診。為了提高醫(yī)生臨床診斷的準確性,簡化不必要的檢查過程,降低誤診率,通過大數(shù)據(jù)分析方法實現(xiàn)醫(yī)療智能化已成為研究的熱點。本文設計開發(fā)的系統(tǒng),通過對甲狀腺腫瘤治療過程中的臨床數(shù)據(jù)進行挖掘分析,實現(xiàn)了對甲狀腺腫瘤良惡性診斷的準確預測。

        (2)糖尿病轉歸及風險評估系統(tǒng)

        糖尿病作為一種常見的慢性病,有治療周期長、并發(fā)癥多、病情反復等特點。當前的糖尿病的診斷還是以傳統(tǒng)的診斷方式為主,每個門診患者和醫(yī)生接觸的時間有限,醫(yī)生無法在每個病人身上花費大量時間深入探究患者的個體情況和診療背景,這導致醫(yī)院和醫(yī)生無法更好地在后期監(jiān)測患者狀況。在有關糖尿病預測的實驗中,可以將樣本數(shù)據(jù)根據(jù)要求按照一定比例劃分成訓練集、測試集和獨立樣本集,進行糖尿病的預測和建模,對糖尿病高危人群提供有效、準確的幫助[10]。本文針對患者糖尿病生化指標預測這一問題,構建了一個基于緩存神經(jīng)網(wǎng)絡的糖尿病生化指標變化趨勢預測模型。該模型特點是在隱藏層中增加計算結果緩存區(qū)域,以應對數(shù)據(jù)模型的不規(guī)則時序特性和內(nèi)部復雜的相互關系,從而達到輔助診療的目的。

        (3)基于數(shù)據(jù)挖掘的高血壓患病趨勢分析及控制

        依托臨床大數(shù)據(jù)平臺,對高血壓科近15年的住院患者的約500萬條臨床數(shù)據(jù)及門診患者的約700萬條臨床數(shù)據(jù)進行收集整理,并進行多維度分析。找出該病種的患病趨勢,并通過對降壓藥處方的分析,指導臨床更加有效地防治高血壓。通過臨床數(shù)據(jù)分析,識別高血壓患者靶器官(心、腦、腎、血管等)損傷,獲取高血壓患者的心血管及其他指標參數(shù),基于這些參數(shù),進行數(shù)據(jù)評估患者心血管風險,降低心腦血管病發(fā)生率[11]。

        6 結束語

        本文針對傳統(tǒng)多中心臨床研究存在的問題,逐步推進多中心臨床大數(shù)據(jù)平臺建設和深度應用工作,完成了多中心臨床大數(shù)據(jù)平臺建設,并對多中心臨床大數(shù)據(jù)平臺中臨床隨訪系統(tǒng)、核心系統(tǒng)和疾病分析應用系統(tǒng)等進行技術驗證,建立了可行的技術框架。

        [1]丁潔. 關于多中心臨床研究的思考[J]. 中華兒科雜志, 2011(11): 801-803.DING J. Thoughts on multi-center clinical research [J]. Chinese Journal of Pediatrics, 2011(11): 801-803.

        [2]李娌, 魏玉萍, 錢芳橋, 等. 加強多中心臨床研究的組織管理水平促進多中心臨床研究質量提高[C]//2011第三屆全國醫(yī)學科研管理論壇暨江蘇省醫(yī)學科研管理學術年會論文集,2011年10月1日, 南京, 中國. [出版地不詳: 出版者不詳], 2011: 207-210.LI L, WEI Y P, QIAN F Q, et al.strengthen the organization and management of multi-center clinical research to promote the quality of multi center clinical research to improve the [C]//2011 3rd National Medical Scientific Research Management Forum and the Jiangsu Provincial Medical Scientific Research Management Academic Annual Meeting, October 1,2011, Nanjing, China. [S.l.:s.n.], 2011:207-210.

        [3]萬霞, 李贊華, 劉建平. 臨床研究中的樣本量估算:(1)臨床試驗[J]. 中醫(yī)雜志, 2007(6):504-507.WAN X, LI Z H, LIU J P. Sample size estimation in clinical research: (1) clinical trials[J]. Journal of Chinese medicine,2007(6): 504-507.

        [4]崔潔, 朱立峰, 左銘. 臨床科研隨訪系統(tǒng)需求與策略[J]. 中國數(shù)字醫(yī)學, 2016(12):36-37, 71.CUI J, ZHU L F, ZUO M. Requirements and strategies for clinical research followup system[J]. Chinese Digital Medicine,2016(12): 36-37, 71.

        [5]萇程. 基于ETL的數(shù)據(jù)集成過程模型[D]. 杭州: 浙江大學, 2010.CHENG C. Data integration process model based on ETL[D]. Hangzhou: Zhejiang University, 2010.

        [6]陳杰. 大數(shù)據(jù)場景下的云存儲技術與應用[J].中興通訊技術, 2012, 18(6): 47-51.CHEN J. Cloud storage technology and application in big data scenario[J]. ZTE Technology, 2012, 18(6): 47-51.

        [7]ALPAY D. System theory, the Schur algorithm and multidimensional analysis[J]. Operator Theory Advances& Applications, 2007, 21(3): 133-150.

        [8]DAN J, QIU J, XIANG G, et al. A synthesized data mining algorithm based on clustering and decision tree[C]// International Conference on Computer and Information Technology, June 29-July 1, 2010,Bradford, UK. Piscataway: IEEE Press, 2010: 2722-2728.

        [9]GERS F A, SCHMIDHUBER J, CUMMINS F.Learning to forget: continual prediction with LSTM[J]. Neural Computation, 2000,12(10): 2451-2471.

        [10]洪燁. 基于機器學習算法的糖尿病預測模型研究[D]. 哈爾濱: 哈爾濱工業(yè)大學, 2016.HONG Y. Research on diabetes prediction model based on machine learning algorithm[D]. Harbin: Harbin Institute of Technology, 2016.

        [11]蘇杰. 基于數(shù)據(jù)挖掘技術的高血壓疾病評估方法研究[D]. 杭州: 浙江大學, 2006.SU J. Research on hypertension disease assessment method based on data mining technology[D]. Hangzhou: Zhejiang University, 2006.

        猜你喜歡
        子系統(tǒng)中心算法
        不對中轉子系統(tǒng)耦合動力學特性研究
        剪掉和中心無關的
        在打造“兩個中心”中彰顯統(tǒng)戰(zhàn)擔當作為
        華人時刊(2021年15期)2021-11-27 09:16:42
        GSM-R基站子系統(tǒng)同步方案研究
        基于MapReduce的改進Eclat算法
        Travellng thg World Full—time for Rree
        進位加法的兩種算法
        駝峰測長設備在線監(jiān)測子系統(tǒng)的設計與應用
        別讓托養(yǎng)中心成“死亡中心”
        一種改進的整周模糊度去相關算法
        小妖精又紧又湿高潮h视频69| 国产农村妇女高潮大叫| 日韩亚洲欧美中文高清在线| 美女视频永久黄网站免费观看国产| 久久麻豆精亚洲av品国产蜜臀| 中文字幕精品一区二区的区别 | 亚洲av成人精品日韩在线播放| 真人新婚之夜破苞第一次视频 | 国产成人av乱码在线观看| 人与嘼交av免费| 日韩免费一区二区三区在线| 日本一区二区在线播放观看| 中文字幕人妻在线少妇| 欧美激情肉欲高潮视频| 亚洲av综合色区无码一二三区| 亚洲一区二区在线| 色偷偷女人的天堂亚洲网| 国产精品亚洲一区二区三区妖精| 你懂的视频在线看播放| 久久精品国产只有精品96| 亚洲av日韩av无码av| 久久久久久人妻一区二区无码Av| 日本高清视频在线观看一区二区 | 亚洲国产精品500在线观看| 日韩在线手机专区av| 午夜一区二区视频在线观看| 忘忧草社区www日本高清| 九九99无码精品视频在线观看| 亚洲性无码av在线| 在线免费观看蜜桃视频| 丰满岳乱妇一区二区三区| 91精品视品在线播放| 亚洲国产免费一区二区| 成人久久久精品乱码一区二区三区| 亚欧美日韩香蕉在线播放视频| 无遮挡网站| 最全精品自拍视频在线| 蜜桃尤物在线视频免费看| 奇米影视777撸吧| 亚洲综合色一区二区三区另类| 一区二区三区在线观看视频免费 |