亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于專(zhuān)病隊(duì)列的重大疾病臨床樣本生命組學(xué)數(shù)據(jù)庫(kù)建設(shè)

        2017-03-21 05:31:50,
        關(guān)鍵詞:隊(duì)列組學(xué)表型

        ,

        2016年,國(guó)家重點(diǎn)研發(fā)計(jì)劃“精準(zhǔn)醫(yī)學(xué)研究”重點(diǎn)專(zhuān)項(xiàng)隊(duì)列已完成立項(xiàng)的重大疾病專(zhuān)病隊(duì)列研究包括:高血壓、心血管、腦血管、呼吸系統(tǒng)、代謝性疾病、乳腺癌、食管癌、宮頸癌以及罕見(jiàn)病等。按照專(zhuān)病隊(duì)列研究的要求,各隊(duì)列所建立的生物樣本和數(shù)據(jù)必須進(jìn)行共享,數(shù)據(jù)須及時(shí)提交精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)平臺(tái)統(tǒng)一管理。

        在這個(gè)背景下,建立臨床樣本生命組學(xué)數(shù)據(jù)協(xié)作網(wǎng)絡(luò)和基于隊(duì)列的重大疾病臨床樣本生命組學(xué)數(shù)據(jù)庫(kù)就顯得至關(guān)重要,起到承前啟后的作用。

        1 臨床樣本生命組學(xué)數(shù)據(jù)利用現(xiàn)狀分析

        1.1 eMERGE平臺(tái)

        美國(guó)eMERGE平臺(tái)(Electronic Medical Records and Genomics Network)是由全美范圍內(nèi)重要的臨床醫(yī)學(xué)、生物組學(xué)及醫(yī)學(xué)信息學(xué)等領(lǐng)域的機(jī)構(gòu)聯(lián)合研發(fā)的協(xié)作網(wǎng)絡(luò)平臺(tái)[1]。該系統(tǒng)與電子病歷的臨床表型信息和生物組學(xué)信息進(jìn)行深度融合,產(chǎn)生了重要的科學(xué)研究成果,成為國(guó)際臨床樣本生命組學(xué)數(shù)據(jù)平臺(tái)的典范。截止到2016年4月,通過(guò)eMERGE項(xiàng)目積累的引文次數(shù)高達(dá)1.2萬(wàn)余次[2]。

        eMERGE之所以能夠產(chǎn)生被廣泛關(guān)注的研究成果,主要依賴(lài)其完善的協(xié)作機(jī)制、強(qiáng)大的信息技術(shù)的支撐、持續(xù)的經(jīng)費(fèi)支持等。同時(shí),eMERGE項(xiàng)目為各參與單位及產(chǎn)業(yè)界提供的大量技術(shù)服務(wù)及開(kāi)放共享數(shù)據(jù)資源,保證了數(shù)據(jù)共享的積極性、平臺(tái)的長(zhǎng)效運(yùn)行以及持續(xù)的科研創(chuàng)新能力。

        1.2 我國(guó)疾病隊(duì)列研究現(xiàn)狀

        從地域分布上看,我國(guó)專(zhuān)病隊(duì)列研究與美國(guó)面臨的問(wèn)題相似。主要表現(xiàn)在專(zhuān)項(xiàng)支持的課題地域覆蓋廣、參與醫(yī)療及科研機(jī)構(gòu)多、涉及的信息系統(tǒng)多以及醫(yī)學(xué)數(shù)據(jù)類(lèi)型復(fù)雜多樣(涵蓋臨床表型、生化檢測(cè)、影像資料、系譜和遺傳檢測(cè)等),這些問(wèn)題對(duì)數(shù)據(jù)共享和協(xié)作機(jī)制建立提出了重大挑戰(zhàn)[3]。筆者2016年末調(diào)研對(duì)中國(guó)醫(yī)學(xué)科學(xué)院下屬機(jī)構(gòu)如基礎(chǔ)醫(yī)學(xué)研究所等采集的專(zhuān)病隊(duì)列結(jié)果見(jiàn)表1。

        表1 重大疾病專(zhuān)病隊(duì)列調(diào)研情況匯總

        結(jié)果顯示,我國(guó)重大疾病隊(duì)列研究令人堪憂(yōu)。在信息系統(tǒng)建設(shè)、數(shù)據(jù)存儲(chǔ)及管理、數(shù)據(jù)標(biāo)準(zhǔn)化、互操作性接口、術(shù)語(yǔ)管理等方面,各課題組的技術(shù)水平參差不齊,數(shù)據(jù)質(zhì)量問(wèn)題較為突出,且數(shù)據(jù)的采集、存儲(chǔ)、處理、交換與共享的管理在技術(shù)上尚無(wú)統(tǒng)一的標(biāo)準(zhǔn)。如何發(fā)揮各疾病隊(duì)列在精準(zhǔn)醫(yī)學(xué)研究中的核心支撐作用,研究機(jī)構(gòu)產(chǎn)生的海量臨床及組學(xué)數(shù)據(jù)如何融合、開(kāi)放、共享、并為國(guó)家精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)平臺(tái)提供數(shù)據(jù)支撐,是我國(guó)精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)資源整合、存儲(chǔ)和利用研究的關(guān)鍵。

        2 重大疾病臨床樣本生命組學(xué)數(shù)據(jù)庫(kù)建設(shè)要求

        為了有效解決臨床樣本及生命組學(xué)數(shù)據(jù)協(xié)作共享機(jī)制不健全,數(shù)據(jù)標(biāo)準(zhǔn)及術(shù)語(yǔ)缺失,隱私保護(hù)及數(shù)據(jù)安全機(jī)制不完善,數(shù)據(jù)質(zhì)控體系未建立,多組學(xué)數(shù)據(jù)融合、檢索及分析技術(shù)欠缺等問(wèn)題。根據(jù)“精準(zhǔn)醫(yī)學(xué)研究”重點(diǎn)專(zhuān)項(xiàng)2017年度項(xiàng)目申報(bào)指南中3.1.1(簡(jiǎn)稱(chēng)“指南”)的要求,應(yīng)建立全國(guó)范圍重大疾病臨床數(shù)據(jù)協(xié)作網(wǎng)絡(luò);系統(tǒng)和規(guī)?;厥占ㄅR床表型信息在內(nèi)的完備的和標(biāo)準(zhǔn)化的臨床樣本元數(shù)據(jù),及其相關(guān)基因組、蛋白組、代謝組等生命組學(xué)信息,促進(jìn)臨床樣本向大數(shù)據(jù)資源的轉(zhuǎn)化、整合、管理及共享;建立國(guó)際級(jí)、標(biāo)準(zhǔn)化、可共享和第三方的生物樣本多層次生命組學(xué)數(shù)據(jù)庫(kù)。

        3 重大疾病臨床樣本及生命組學(xué)數(shù)據(jù)庫(kù)重點(diǎn)建設(shè)內(nèi)容

        分析“指南”的要求,筆者認(rèn)為標(biāo)準(zhǔn)規(guī)范建設(shè)、生物樣本多層次生命組學(xué)數(shù)據(jù)庫(kù)研發(fā)、重大疾病臨床樣本數(shù)據(jù)協(xié)作網(wǎng)絡(luò)平臺(tái)的建設(shè)是重大疾病臨床親本及生命組學(xué)數(shù)據(jù)庫(kù)重點(diǎn)建設(shè)的核心內(nèi)容。涉及關(guān)鍵技術(shù)包括:數(shù)據(jù)質(zhì)量控制與安全隱私保護(hù)技術(shù)、臨床信息與生命組學(xué)數(shù)據(jù)融合類(lèi)技術(shù)、分布式數(shù)據(jù)采集-存儲(chǔ)-檢索-利用技術(shù)。重大疾病臨床樣本生命組學(xué)數(shù)據(jù)協(xié)作網(wǎng)絡(luò)及數(shù)據(jù)庫(kù)的建立,不僅為協(xié)作單位科研提供支撐,更重要的是為國(guó)家精準(zhǔn)醫(yī)療大數(shù)據(jù)平臺(tái)提供臨床表型及生命組學(xué)數(shù)據(jù)服務(wù)。重點(diǎn)建設(shè)內(nèi)容如圖1所示。

        圖1重大疾病臨床樣本生命組學(xué)數(shù)據(jù)庫(kù)建設(shè)內(nèi)容劃分

        3.1 重大疾病臨床信息與組學(xué)信息整合標(biāo)準(zhǔn)研究

        截止到2016年底,國(guó)家衛(wèi)生計(jì)生委已成功制定了電子病歷等 277 項(xiàng)衛(wèi)生信息標(biāo)準(zhǔn),但國(guó)內(nèi)尚缺乏一套解決不同臨床與組學(xué)數(shù)據(jù)及其信息系統(tǒng)之間的數(shù)據(jù)協(xié)作流程、安全管理規(guī)范與標(biāo)準(zhǔn)。

        借鑒 HL7、SNOMED CT、FHIR、ICD等國(guó)際標(biāo)準(zhǔn),構(gòu)建符合中國(guó)人群疾病隊(duì)列特點(diǎn)的精準(zhǔn)醫(yī)學(xué)數(shù)據(jù)協(xié)作網(wǎng)絡(luò)的協(xié)作模式以及信息處理、管理、安全、隱私、倫理等標(biāo)準(zhǔn)規(guī)范體系。規(guī)范臨床信息與組學(xué)信息的收集、存儲(chǔ)、共享、應(yīng)用、管理的全過(guò)程,為實(shí)現(xiàn)不同疾病隊(duì)列臨床與組學(xué)信息在平臺(tái)上的存儲(chǔ)、對(duì)接與映射提供標(biāo)準(zhǔn)規(guī)范。具體包括:臨床表型數(shù)據(jù)共享標(biāo)準(zhǔn)、臨床影像數(shù)據(jù)共享標(biāo)準(zhǔn)、基因組數(shù)據(jù)共享標(biāo)準(zhǔn)、代謝組數(shù)據(jù)共享標(biāo)準(zhǔn)、轉(zhuǎn)錄組數(shù)據(jù)共享標(biāo)準(zhǔn)、蛋白質(zhì)組數(shù)據(jù)共享標(biāo)準(zhǔn)、微生物組數(shù)據(jù)共享標(biāo)準(zhǔn)、表觀(guān)遺傳數(shù)據(jù)共享標(biāo)準(zhǔn)以及疾病與組學(xué)數(shù)據(jù)關(guān)聯(lián)的結(jié)構(gòu)標(biāo)準(zhǔn),此外還包括臨床數(shù)據(jù)格式轉(zhuǎn)化、組學(xué)數(shù)據(jù)格式轉(zhuǎn)化、信息脫敏自動(dòng)化處理、數(shù)據(jù)安全與加密的技術(shù)標(biāo)準(zhǔn)[4]。

        3.2 重大疾病臨床信息與組學(xué)信息融合技術(shù)研究

        針對(duì)臨床信息結(jié)構(gòu)化與非結(jié)構(gòu)化并存、疾病表型多樣、組學(xué)信息數(shù)量大、粒度差異大、不同疾病檢索需求差別大等特點(diǎn),分別利用自然語(yǔ)言處理、統(tǒng)計(jì)學(xué)習(xí)、人工智能與數(shù)據(jù)挖掘技術(shù)對(duì)臨床表型數(shù)據(jù)進(jìn)行分析處理,利用基因組學(xué)、轉(zhuǎn)錄組學(xué)最新技術(shù)對(duì)臨床組學(xué)數(shù)據(jù)分析處理,對(duì)臨床表型數(shù)據(jù)和組學(xué)數(shù)據(jù)進(jìn)行PheWAS(Phenome-wide association study)融合計(jì)算分析,建立組學(xué)-表型相關(guān)性網(wǎng)絡(luò)并實(shí)現(xiàn)功能解釋?zhuān)瑸閺?fù)雜疾病診斷和治療等新方法的研究提供幫助和指導(dǎo)[5]。融合技術(shù)流程見(jiàn)圖2。

        圖2 重大疾病隊(duì)列臨床信息與生命組學(xué)數(shù)據(jù)融合流程圖

        3.2.1 中文電子病歷處理技術(shù)

        主要內(nèi)容如下:研究針對(duì)中文電子病歷自然語(yǔ)言的預(yù)處理方法,如拼寫(xiě)錯(cuò)誤、縮寫(xiě)不規(guī)范等;基于隱馬爾科夫和維特比算法的中文病歷詞性標(biāo)注技術(shù)、基于詞典和詞頻統(tǒng)計(jì)的命名實(shí)體識(shí)別技術(shù)(Named Entity Recognition,NER)、基于中文醫(yī)學(xué)語(yǔ)言的分詞方法;研究中文電子病歷的上下文句法分析技術(shù),識(shí)別否定、時(shí)序、實(shí)體詞作用關(guān)系等上下文句法特征;基于概率語(yǔ)言模型、詞嵌入的語(yǔ)義分析方法,將中文電子病歷中的句子與文檔向量化,并蘊(yùn)含語(yǔ)義信息,在此基礎(chǔ)上,運(yùn)用機(jī)器學(xué)習(xí)方法,挖掘潛在的病理特征。

        3.2.2 臨床表型本體數(shù)據(jù)的整合及映射

        一是整合多個(gè)生物醫(yī)學(xué)本體構(gòu)建臨床表型本體數(shù)據(jù)庫(kù),例如CMeSH(Chinese Medical Subject Headings),CHPO(Chinese Human Phenotype Ontology),NHGRI GWAS CATALOG,藥物數(shù)據(jù)庫(kù),診斷編碼,手術(shù)操作編碼等[6]。

        二是建立機(jī)器學(xué)習(xí)模型將結(jié)構(gòu)化和非結(jié)構(gòu)化的醫(yī)學(xué)數(shù)據(jù)映射到臨床表型本體,基于標(biāo)準(zhǔn)化表型進(jìn)行計(jì)算分析。

        三是針對(duì)電子病歷數(shù)據(jù)的高維稀疏性、異質(zhì)性、不完整性、高噪聲等特點(diǎn),研究并應(yīng)用獨(dú)熱表示、基于句子級(jí)別的分布式表示、深度神經(jīng)網(wǎng)絡(luò)表示等自然語(yǔ)言處理技術(shù)處理分析標(biāo)準(zhǔn)化表型數(shù)據(jù),并應(yīng)用于表型的相關(guān)性研究、疾病的并發(fā)癥分析、病人的分群與識(shí)別分析、不同種疾病的預(yù)測(cè)等工作。

        3.2.3 優(yōu)化組學(xué)數(shù)據(jù)處理流程

        一是研究疾病基因組的數(shù)據(jù)分析流程,優(yōu)化基于GATK流程的國(guó)際通用基因組測(cè)序分析軟件。具體包括:進(jìn)行基因組生物序列比對(duì),實(shí)現(xiàn)數(shù)據(jù)質(zhì)量重校驗(yàn),基于單倍體的變異檢測(cè),以及檢測(cè)質(zhì)量評(píng)估。

        二是研究疾病轉(zhuǎn)錄組的數(shù)據(jù)分析流程,優(yōu)化基于TopHat-Cufflinks方法的國(guó)際通用測(cè)序序列基因組、轉(zhuǎn)錄組的分析工具。具體流程包括:利用TopHat/bowtie的比對(duì)結(jié)果及參考基因組構(gòu)建轉(zhuǎn)錄本,對(duì)兩個(gè)或多個(gè)轉(zhuǎn)錄本集合中轉(zhuǎn)錄本相似情況的進(jìn)行比較,根據(jù)構(gòu)建的轉(zhuǎn)錄本與已知數(shù)據(jù)庫(kù)中的轉(zhuǎn)錄本的相對(duì)位置定義一系列分類(lèi)[7]。

        3.2.4 組學(xué)-表型融合分析

        組學(xué)-表型的融合分析(PheWAS)是將組學(xué)數(shù)據(jù)產(chǎn)生的分子標(biāo)記,如變異、基因表達(dá)豐度、代謝物豐度、蛋白質(zhì)豐度/修飾等,與人體的臨床表型進(jìn)行相關(guān)性分析。具體包括:基因組變異-表型相關(guān)性分析、基因表達(dá)-表型相關(guān)性分析、蛋白質(zhì)-表型相關(guān)性分析、代謝物-表型相關(guān)性分析。

        3.3 臨床和組學(xué)數(shù)據(jù)分布式收集、存儲(chǔ)、檢索、服務(wù)關(guān)鍵技術(shù)的研究

        研究海量醫(yī)療元數(shù)據(jù)語(yǔ)義關(guān)聯(lián)索引組織策略及分布式查詢(xún)過(guò)程中的數(shù)據(jù)協(xié)調(diào)調(diào)度方法,實(shí)現(xiàn)多隊(duì)列臨床樣本生命組學(xué)數(shù)據(jù)分布式收集、存儲(chǔ)、檢索、服務(wù)關(guān)鍵技術(shù)突破,提供多模態(tài)多粒度檢索與計(jì)算服務(wù)。

        3.3.1 臨床樣本生命組學(xué)信息收集與存儲(chǔ)

        由于臨床樣本與生命組學(xué)數(shù)據(jù)本身呈現(xiàn)多源、異構(gòu)的性質(zhì)。同時(shí),每個(gè)疾病隊(duì)列采集數(shù)據(jù)時(shí)的標(biāo)準(zhǔn)與規(guī)范不同,在臨床樣本生命組學(xué)信息采集及存儲(chǔ)過(guò)程中,需采用下列方式:

        第一,構(gòu)建多源異構(gòu)臨床樣本與生命組學(xué)的通用數(shù)據(jù)模型(Common Data Model,CDM)。研究基于完備性和冗余性的檢驗(yàn)方法,解決 CDM 的可擴(kuò)展問(wèn)題。這是數(shù)據(jù)收集、存儲(chǔ)和檢索的數(shù)據(jù)基礎(chǔ),是從不同疾病隊(duì)列的數(shù)據(jù)標(biāo)準(zhǔn)向國(guó)家精準(zhǔn)醫(yī)療大數(shù)據(jù)平臺(tái)的數(shù)據(jù)標(biāo)準(zhǔn)轉(zhuǎn)化與映射的關(guān)鍵。

        第二,采用前置機(jī)技術(shù)從不同醫(yī)院/隊(duì)列抽取數(shù)據(jù),構(gòu)建原始數(shù)據(jù)存儲(chǔ)庫(kù),以分布式數(shù)據(jù)庫(kù)存儲(chǔ)獲取的數(shù)據(jù)。

        3.3.2 海量醫(yī)療元數(shù)據(jù)語(yǔ)義關(guān)聯(lián)索引組織的策略研究

        3.3.2.1 構(gòu)建醫(yī)療臨床專(zhuān)業(yè)語(yǔ)料庫(kù)和業(yè)務(wù)模型

        通過(guò) SNOMED CT、ICD10、藥典庫(kù)、診斷庫(kù)形成臨床專(zhuān)業(yè)語(yǔ)料庫(kù),建立臨床病歷分詞的語(yǔ)料基礎(chǔ),構(gòu)建非結(jié)構(gòu)化分析引擎,實(shí)現(xiàn)采用機(jī)器學(xué)習(xí)的方法訓(xùn)練專(zhuān)業(yè)語(yǔ)料,通過(guò)分詞技術(shù)及詞頻統(tǒng)計(jì),對(duì)電子病歷、檢查報(bào)告等文字性的源數(shù)據(jù)進(jìn)行分析,按詞頻高低列出在專(zhuān)業(yè)語(yǔ)料庫(kù)未收錄的新專(zhuān)業(yè)名詞,并進(jìn)行收錄,形成符合醫(yī)療實(shí)際專(zhuān)業(yè)語(yǔ)料庫(kù),為數(shù)據(jù)索引存儲(chǔ)和查詢(xún)提供語(yǔ)義關(guān)聯(lián)的基礎(chǔ)。同時(shí),利用3.2節(jié)融合技術(shù)的成果物,并結(jié)合臨床業(yè)務(wù)流程,構(gòu)建業(yè)務(wù)模型。

        3.3.2.2 研究基于語(yǔ)義關(guān)聯(lián)的Solr/ElasticSearch 技術(shù)索引組織策略

        采用開(kāi)源的Solr/ElasticSearch技術(shù)實(shí)現(xiàn)多模態(tài)多粒度醫(yī)療元數(shù)據(jù)格式的定義、快速上傳和高效索引構(gòu)建;同時(shí),為了實(shí)現(xiàn)在多模態(tài)多粒度索引數(shù)據(jù)上的同步檢索,及考慮到各類(lèi)型數(shù)據(jù)之間的語(yǔ)義關(guān)系,擬利用專(zhuān)業(yè)語(yǔ)料庫(kù)構(gòu)建各類(lèi)型索引數(shù)據(jù)的語(yǔ)義關(guān)聯(lián)網(wǎng)絡(luò),并存儲(chǔ)于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)中,從而有效提高系統(tǒng)面向語(yǔ)義、支持復(fù)雜查詢(xún)的資源發(fā)現(xiàn)能力[8]。

        3.3.3 多模態(tài)多粒度檢索與計(jì)算服務(wù)

        由于臨床與組學(xué)數(shù)據(jù)存在邏輯關(guān)聯(lián)性、多模態(tài)(指視頻、圖像、文本等多格式)及多粒度(指時(shí)間、療程、地理位置等多維度)的特點(diǎn),如何對(duì)不同隊(duì)列數(shù)據(jù)庫(kù)進(jìn)行多模態(tài)多粒度檢索與計(jì)算成為難題。擬采用 Hadoop 技術(shù)創(chuàng)建一個(gè)多模態(tài)多粒度檢索與計(jì)算服務(wù)平臺(tái),將用戶(hù)查詢(xún)指令轉(zhuǎn)化成一個(gè)基于CDM、海量醫(yī)療元數(shù)據(jù)語(yǔ)義關(guān)聯(lián)索引結(jié)構(gòu)、可解釋的全局關(guān)系查詢(xún)邏輯表達(dá)式,利用關(guān)系代數(shù)等價(jià)變換算法來(lái)實(shí)現(xiàn)[9]。同時(shí),設(shè)計(jì)多模態(tài)檢索策略及多粒度(包括時(shí)間、療程、地理位置等維度)索引,當(dāng)用戶(hù)提交的檢索需求包含多種模態(tài)、多粒度數(shù)據(jù)的需求約束時(shí),對(duì)多種模態(tài)數(shù)據(jù)進(jìn)行相似性匹配,從構(gòu)建的多粒度索引中進(jìn)行檢索,并在融合各單項(xiàng)相似性后獲得最終的查詢(xún)-結(jié)果相似性,最后得到查詢(xún)結(jié)果排序列表[10]。

        3.4 重大疾病臨床樣本數(shù)據(jù)協(xié)作網(wǎng)絡(luò)平臺(tái)及數(shù)據(jù)庫(kù)構(gòu)建

        從軟件工程的角度,設(shè)計(jì)并建設(shè)重大疾病臨床樣本生命組學(xué)協(xié)作網(wǎng)絡(luò)平臺(tái)及數(shù)據(jù)庫(kù)軟硬件支撐環(huán)境。系統(tǒng)收集腦血管病、冠心病、糖尿病、食管癌等十幾種重大疾病臨床樣本及其相關(guān)組學(xué)信息,在標(biāo)準(zhǔn)規(guī)范的指導(dǎo)下,利用臨床信息及組學(xué)信息融合技術(shù)以及臨床及組學(xué)信息分布式收集、存儲(chǔ)、檢索、服務(wù)等關(guān)鍵信息技術(shù),實(shí)現(xiàn)臨床表型數(shù)據(jù)、樣本元數(shù)據(jù)和組學(xué)數(shù)據(jù)三位一體的融合與關(guān)聯(lián),平臺(tái)總體架構(gòu)見(jiàn)圖3。

        圖3 重大疾病臨床樣本生命組學(xué)數(shù)據(jù)協(xié)作網(wǎng)絡(luò)平臺(tái)總體架構(gòu)

        重大疾病臨床樣本數(shù)據(jù)協(xié)作網(wǎng)絡(luò)平臺(tái)建設(shè)需要有一種能夠解決分布式、異構(gòu)與跨平臺(tái)的方案來(lái)滿(mǎn)足各協(xié)作醫(yī)療機(jī)構(gòu)臨床與組學(xué)數(shù)據(jù)采集、存儲(chǔ)、處理以及利用的要求,同時(shí)還要保證各機(jī)構(gòu)內(nèi)部系統(tǒng)的安全及業(yè)務(wù)獨(dú)立性。因此,平臺(tái)基于SOA(Service Oriented Architecture)架構(gòu)進(jìn)行設(shè)計(jì),從下到上劃分為基礎(chǔ)設(shè)施環(huán)境、大數(shù)據(jù)中心、支撐系統(tǒng)、示范應(yīng)用及服務(wù)對(duì)象五部分。利用分布式數(shù)據(jù)庫(kù)實(shí)現(xiàn)臨床與組學(xué)數(shù)據(jù)的存儲(chǔ)加工、關(guān)聯(lián)、匯總,數(shù)據(jù)存儲(chǔ)支持 PB 級(jí)。采用中心交換ESB(Enterprise Service Bus)與可定制前置機(jī)方式實(shí)現(xiàn)各協(xié)作單位信息資源采集、整合及共享。

        重大疾病臨床樣本生命組學(xué)數(shù)據(jù)庫(kù)的設(shè)計(jì)涵蓋臨床信息庫(kù)、電子病歷庫(kù)、組學(xué)信息庫(kù)、人口信息庫(kù)、隊(duì)列信息庫(kù)、語(yǔ)義信息庫(kù)、行業(yè)與社會(huì)信息庫(kù)等眾多資源庫(kù),其中臨床信息庫(kù)包括病人信息、家族信息、病人治療史、治療結(jié)果、病人隨訪(fǎng)、藥物反饋、治療反饋、情況發(fā)生、治療措施、臨床觀(guān)測(cè)表、補(bǔ)充記錄等;電子病歷庫(kù)包括患者基本信息、醫(yī)囑信息、用藥信息、診療信息等;組學(xué)庫(kù)包括數(shù)據(jù)來(lái)源信息、基因變異信息、遺傳模式信息、注釋解讀信息、數(shù)據(jù)存儲(chǔ)信息等;隊(duì)列信息庫(kù)包括治療位置信息、治療方式信息、治療劑量信息等;語(yǔ)義信息庫(kù)包括語(yǔ)義條目列表、語(yǔ)義條目實(shí)體、語(yǔ)義條目關(guān)聯(lián)、藥物相關(guān)語(yǔ)義、隊(duì)列相關(guān)語(yǔ)義等信息[11];行業(yè)與社會(huì)信息庫(kù)包括宏觀(guān)經(jīng)濟(jì)、地理信息、保險(xiǎn)等信息資源。

        4 結(jié)語(yǔ)

        國(guó)內(nèi)針對(duì)臨床和組學(xué)相結(jié)合的疾病隊(duì)列研究剛剛起步,隊(duì)列之間及其與數(shù)據(jù)需求單位間并無(wú)統(tǒng)一的協(xié)作模式與機(jī)制,臨床與組學(xué)信息標(biāo)準(zhǔn)與規(guī)范不一致導(dǎo)致數(shù)據(jù)難以共享,數(shù)據(jù)量日益增長(zhǎng)且缺乏深度融合導(dǎo)致檢索與利用困難。因此,亟待建立全國(guó)范圍的重大疾病臨床樣本數(shù)據(jù)協(xié)作網(wǎng)絡(luò)平臺(tái),在此過(guò)程中,逐步建立國(guó)家級(jí)、標(biāo)準(zhǔn)化、可共享和第三方的臨床樣本多層次生命組學(xué)數(shù)據(jù)庫(kù),對(duì)標(biāo)國(guó)外類(lèi)似數(shù)據(jù)庫(kù),推動(dòng)國(guó)家精準(zhǔn)醫(yī)療技術(shù)快速突破。本文針對(duì)重大疾病臨床樣本生命組學(xué)數(shù)據(jù)庫(kù)建設(shè)的關(guān)鍵內(nèi)容進(jìn)行了概要闡述,希望對(duì)同行從業(yè)人員有所幫助。當(dāng)然,協(xié)作網(wǎng)絡(luò)及數(shù)據(jù)庫(kù)建設(shè)包括的內(nèi)容非常廣泛,臨床及組學(xué)數(shù)據(jù)質(zhì)控、清洗、結(jié)構(gòu)化,患者隱私保護(hù)和安全防護(hù)等內(nèi)容都需要重點(diǎn)關(guān)注。

        猜你喜歡
        隊(duì)列組學(xué)表型
        隊(duì)列里的小秘密
        基于多隊(duì)列切換的SDN擁塞控制*
        軟件(2020年3期)2020-04-20 00:58:44
        口腔代謝組學(xué)研究
        在隊(duì)列里
        基于UHPLC-Q-TOF/MS的歸身和歸尾補(bǔ)血機(jī)制的代謝組學(xué)初步研究
        建蘭、寒蘭花表型分析
        豐田加速駛?cè)胱詣?dòng)駕駛隊(duì)列
        GABABR2基因遺傳變異與肥胖及代謝相關(guān)表型的關(guān)系
        代謝組學(xué)在多囊卵巢綜合征中的應(yīng)用
        慢性乙型肝炎患者HBV基因表型與血清學(xué)測(cè)定的臨床意義
        风韵丰满熟妇啪啪区老老熟妇| 熟女少妇av免费观看| 天堂影院久久精品国产午夜18禁| 久久天堂一区二区三区av| 真人做爰片免费观看播放| 精品2021露脸国产偷人在视频 | 久久精品噜噜噜成人| 国产污污视频| 在线观看人成网站深夜免费| 美腿丝袜在线一区二区| 精品乱码久久久久久久| 无码一区二区三区AV免费换脸| 久久少妇呻吟视频久久久| 久久精品国产亚洲av网| 国产无遮挡又黄又爽在线观看| 男女一级毛片免费视频看| 亚洲国产成人精品一区刚刚| 国产成人自拍高清在线| 精品无码一区在线观看| 人妻无码AⅤ不卡中文字幕| 精品亚洲在线一区二区| 亚洲av综合色区| 亚洲尺码电影av久久| 国产优质女主播在线观看| 一区二区国产av网站| 亚洲免费网站观看视频| 中文字幕乱偷乱码亚洲| av资源在线免费观看| 日韩人妻ol丝袜av一二区| 无码毛片aaa在线| 亚洲伊人成综合人影院| 亚洲av久播在线一区二区| 久久和欧洲码一码二码三码| 成人午夜视频一区二区无码| 女主播国产专区在线观看| 亚洲欧美牲交| 久久精品国产亚洲av瑜伽| 亚洲黄片av在线免费观看| 曰批免费视频播放免费| 男人边吃奶边做好爽免费视频| 亚洲中文字幕日产喷水|