亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        歐美生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心建設(shè)及啟示*

        2022-06-01 07:52:56吳思竹王安然修曉蕾錢慶周偉
        數(shù)字圖書館論壇 2022年4期
        關(guān)鍵詞:數(shù)據(jù)庫科學(xué)資源

        吳思竹 王安然 修曉蕾 錢慶 周偉

        (1. 中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所,北京 100020;2. 國家人口健康科學(xué)數(shù)據(jù)中心,北京 100005)

        1 歐美典型領(lǐng)域科學(xué)數(shù)據(jù)中心概述

        1.1 美國國家生物技術(shù)信息中心

        美國國家生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)是美國國立衛(wèi)生研究院國家醫(yī)學(xué)圖書館(National Library of Medicine,NLM)的下屬中心,成立于1988年。NCBI的定位和重要使命是研發(fā)前沿信息技術(shù),幫助理解和控制健康以及疾病的基本分子和遺傳過程,創(chuàng)建存儲(chǔ)和分析有關(guān)分子生物學(xué)、生物化學(xué)和遺傳學(xué)相關(guān)知識(shí)的自動(dòng)化系統(tǒng),促進(jìn)研究和醫(yī)學(xué)界開展數(shù)據(jù)庫和軟件應(yīng)用,協(xié)調(diào)國內(nèi)和國際范圍開展收集生物技術(shù)信息、研究生物重要分子結(jié)構(gòu)和功能分析的先進(jìn)的計(jì)算機(jī)處理方法[1]。

        NCBI的組織架構(gòu)由科學(xué)顧問委員會(huì)、計(jì)算生物學(xué)部、信息工程部和信息資源部組成。計(jì)算生物學(xué)部是NCBI的主要研究部門,包括9個(gè)研究小組,分別負(fù)責(zé)染色質(zhì)結(jié)構(gòu)生物信息學(xué)、序列比對(duì)、蛋白質(zhì)和基因組進(jìn)化、進(jìn)化基因組學(xué)、生物醫(yī)學(xué)文本挖掘、表觀遺傳和基于序列的基因調(diào)控機(jī)制、生物系統(tǒng)建模和計(jì)算分析、統(tǒng)計(jì)計(jì)算生物學(xué)和定量分子生物物理學(xué)研究。信息工程部主要負(fù)責(zé)設(shè)計(jì)和構(gòu)建NCBI的軟件系統(tǒng)和數(shù)據(jù)庫。信息資源部負(fù)責(zé)規(guī)劃、指導(dǎo)和管理NCBI的技術(shù)和網(wǎng)絡(luò)運(yùn)營,為內(nèi)外部用戶提供技術(shù)支持、咨詢和指導(dǎo)。2021年NCBI的全職員工有273人,占NLM全職員工數(shù)量(647人)的42%,主要由研究人員、跟蹤調(diào)查人員、軟件工程師、博士后和學(xué)生等多層次人員組成。NCBI的研究和服務(wù)主要由NLM內(nèi)部計(jì)劃(Intramural Programs)的經(jīng)費(fèi)支持,該經(jīng)費(fèi)占撥付給NLM的美國總統(tǒng)預(yù)算經(jīng)費(fèi)的80%,主要支持NLM開展前沿計(jì)算健康信息學(xué)研究,開發(fā)先進(jìn)的生物醫(yī)學(xué)信息系統(tǒng)、標(biāo)準(zhǔn)和研究工具,開展生物醫(yī)學(xué)數(shù)據(jù)采集、存儲(chǔ)、傳播,以及提供高質(zhì)量的信息服務(wù)。2017—2021年,NLM的這項(xiàng)計(jì)劃經(jīng)費(fèi)總額一直保持在3億~4億美元。通過公開的NLM預(yù)算收支可獲知2008年以前的NCBI獲得的支持經(jīng)費(fèi)為7 000萬美元左右(占NLM全部預(yù)算經(jīng)費(fèi)的23%~25%)。雖然之后財(cái)年預(yù)算沒有公開NCBI的支持經(jīng)費(fèi),但從2022年NCBI主任和NLM科學(xué)數(shù)據(jù)資源副主任職位招聘的啟事中可獲知,該職位可以有權(quán)支配1.5億美元的經(jīng)費(fèi)預(yù)算和領(lǐng)導(dǎo)NLM的近700名員工[2]。

        1.2 歐洲生物信息學(xué)研究所

        歐洲生物信息學(xué)研究所(European Bioinformatics Institute,EBI)是歐洲分子生物學(xué)實(shí)驗(yàn)室(European Molecular Biology Laboratory,EMBL)的一部分,它的定位和使命包括五方面:為科學(xué)界建立和維護(hù)生物數(shù)據(jù)庫,提供科學(xué)服務(wù)和培訓(xùn),開展生物信息學(xué)基礎(chǔ)研究,向工業(yè)界傳播前沿技術(shù)及協(xié)調(diào)供應(yīng)歐洲生物數(shù)據(jù)[3]。

        EBI的組織架構(gòu)包括理事會(huì)、戰(zhàn)略管理委員會(huì)、科學(xué)顧問委員會(huì)、研究組、服務(wù)組、技術(shù)組、培訓(xùn)組等多個(gè)部門及團(tuán)隊(duì)。研究組包括4個(gè)小組,分別負(fù)責(zé)系統(tǒng)和數(shù)學(xué)生物學(xué)、蛋白質(zhì)結(jié)構(gòu)和化學(xué)、基因組和功能基因組學(xué)研究。服務(wù)組主要負(fù)責(zé)基因、基因組和變異,分子圖譜,蛋白質(zhì)組和蛋白質(zhì)家族,分子系統(tǒng),分子和細(xì)胞結(jié)構(gòu),化學(xué)物質(zhì)等數(shù)據(jù)和文獻(xiàn)服務(wù)。技術(shù)組主要負(fù)責(zé)系統(tǒng)應(yīng)用、系統(tǒng)基礎(chǔ)架構(gòu)建設(shè)、網(wǎng)絡(luò)和軟件開發(fā)與運(yùn)維。EBI的人員隊(duì)伍具有多元化和多學(xué)科特點(diǎn),由來自78個(gè)國家的850多人構(gòu)成,包括研究人員、編外人員、學(xué)生和訪問人員。2020年,EBI的全職工作人員有697名,其中在職員工618人,博士后42人,博士生37人。EBI的大部分經(jīng)費(fèi)來自EMBL的20多個(gè)成員國的政府公共經(jīng)費(fèi),還有部分來自國際合作資助經(jīng)費(fèi),國際合作的主要資助者包括英國研究與創(chuàng)新署(UK Research and Innovation)、英國的生物技術(shù)和生物科學(xué)研究委員會(huì)(Biotechnology and Biological Sciences Research Council)、歐盟委員會(huì)(European Commission)、美國國立衛(wèi)生研究院(National Institutes of Health,NIH)和惠康信托基金會(huì)(Wellcome Trust)等。在支撐經(jīng)費(fèi)上,EBI 2017—2020年的年支出經(jīng)費(fèi)在8 000萬歐元左右,2020年支出8270萬歐元,其中數(shù)據(jù)資源建設(shè)和服務(wù)占55%,基礎(chǔ)維護(hù)、技術(shù)開發(fā)和IT基礎(chǔ)設(shè)施支撐占15%,研究占14%,培訓(xùn)占6%,管理和房地產(chǎn)成本占10%。

        NCBI和EBI作為世界上較大的生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心,其工作分別在NLM和EMBL領(lǐng)導(dǎo)下開展,并高度對(duì)齊NLM和EMBL的最新戰(zhàn)略計(jì)劃。NLM在2018年發(fā)布《生物醫(yī)學(xué)發(fā)現(xiàn)和數(shù)據(jù)驅(qū)動(dòng)健康平臺(tái):2017—2027年國家醫(yī)學(xué)圖書館戰(zhàn)略計(jì)劃》(A Platform for Biomedical Discovery and Data-Powered Health National Library of Medicine Strategic Plan 2017-2027),EMBL在2018年發(fā)布《EMBL計(jì)劃2017—2021:數(shù)字生物學(xué)》(EMBL Programme 2017-2021:Digital Biology),在2022年發(fā)布《EMBL計(jì)劃2022—2026:從分子到生態(tài)系統(tǒng)》(EMBL Programme 2022-2026:Molecules to Ecosystems),二者戰(zhàn)略的核心主題均將開放科學(xué)、基礎(chǔ)設(shè)施能力的提高、數(shù)據(jù)科學(xué)研究與推動(dòng)、服務(wù)培訓(xùn)增強(qiáng)、數(shù)據(jù)應(yīng)用創(chuàng)新與轉(zhuǎn)化等作為重要目標(biāo)。NCBI和EBI面向戰(zhàn)略目標(biāo)承擔(dān)重要使命,包括數(shù)據(jù)資源建設(shè)維護(hù),關(guān)鍵技術(shù)工具研發(fā),面向世界范圍的專業(yè)知識(shí)服務(wù)、教育和培訓(xùn)等。

        2 建設(shè)模式和主要進(jìn)展

        2.1 數(shù)據(jù)資源體系建設(shè)

        2.1.1 重視開展高質(zhì)量專業(yè)數(shù)據(jù)庫建設(shè)

        NCBI和EBI均包括多來源數(shù)據(jù),主要分為三類:①科研人員提交的數(shù)據(jù)資源,如SRA、PRIDE等收集的研究人員提交的數(shù)據(jù);②與數(shù)據(jù)供應(yīng)商和研究聯(lián)盟國家合作的數(shù)據(jù)資源,例如Genbank和ENA均是國際核苷酸序列數(shù)據(jù)庫協(xié)作體(International Nucleotide Sequence Database Collaboration,INSDC)的一部分,通過遵守公共數(shù)據(jù)交換標(biāo)準(zhǔn)與DDBJ進(jìn)行結(jié)構(gòu)統(tǒng)一的核苷酸序列數(shù)據(jù)交換共享;EBI與人工智能公司DeepMind合作建設(shè)的AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫;③由數(shù)據(jù)中心專業(yè)人員加工審編的數(shù)據(jù)資源,如PubChem BioAssay、UniGene等。NCBI和EBI的數(shù)據(jù)資源建設(shè)模式以專業(yè)數(shù)據(jù)庫建設(shè)為主,重視資源的廣度和深度建設(shè)。廣度建設(shè)包括:高通量測(cè)序原始數(shù)據(jù)的長期收集,領(lǐng)域文獻(xiàn)資源建設(shè),涵蓋基因表達(dá)、基因組、蛋白質(zhì)、結(jié)構(gòu)、系統(tǒng)、化學(xué)物質(zhì)、臨床等多類主題專業(yè)數(shù)據(jù)庫建設(shè),關(guān)聯(lián)不同類型數(shù)據(jù)的綜合性數(shù)據(jù)庫建設(shè),以及本體詞表等知識(shí)組織系統(tǒng)建設(shè)。數(shù)據(jù)資源深度建設(shè)主要結(jié)合不同主題特點(diǎn)收集數(shù)據(jù)或在已有原始數(shù)據(jù)基礎(chǔ)上,通過生物醫(yī)學(xué)專業(yè)人員或權(quán)威領(lǐng)域?qū)<业淖⑨?、審編、集成和二次分析加工等形成具有專門用途的高質(zhì)量特色主題數(shù)據(jù)庫。同時(shí),數(shù)據(jù)庫建設(shè)結(jié)合Web瀏覽器、圖形可視化分析、人機(jī)交互等技術(shù),提升數(shù)據(jù)的展示效果、可理解性和易用性。這些數(shù)據(jù)庫資源由大量高水平計(jì)算機(jī)和生物醫(yī)學(xué)專家團(tuán)隊(duì)進(jìn)行長期建設(shè)、更新維護(hù)和優(yōu)化升級(jí),數(shù)據(jù)具有較高質(zhì)量和時(shí)效性。

        2.1.2 數(shù)據(jù)庫資源規(guī)模大且數(shù)量增長迅速

        NCBI和EBI匯集的各類型數(shù)據(jù)增長迅速,每年會(huì)在Nucleic Acids Research上發(fā)布其資源建設(shè)進(jìn)展。根據(jù)NCBI在Nucleic Acids Research上發(fā)布的2021年的35個(gè)數(shù)據(jù)庫的列表,本文匯總整理了這些數(shù)據(jù)庫在2018—2021年的資源數(shù)量年均增長率情況[4-7]。如圖1所示,68%的數(shù)據(jù)庫的數(shù)據(jù)量呈逐年遞增趨勢(shì),31%的數(shù)據(jù)庫的年均增長率超過15%,其中Assembly的年增均長率達(dá)到77.28%,SRA、Identical Protein Groups等的年均增長率均在30%以上。2021年底SRA的數(shù)據(jù)規(guī)模已超過36PB。

        圖1 NCBI數(shù)據(jù)資源年均增長率(2018—2021年)

        EBI的2020年度報(bào)告顯示其人類基因組和表型組數(shù)據(jù)存儲(chǔ)量增長超過50%,其中,包括電子顯微鏡數(shù)據(jù)在內(nèi)的成像數(shù)據(jù)存儲(chǔ)量超過之前所有年度存儲(chǔ)量的120%,而電子冷凍顯微鏡數(shù)據(jù)增長164%[8]。截至2021年EBI網(wǎng)站發(fā)布數(shù)據(jù)庫資源數(shù)量為43個(gè),其存儲(chǔ)數(shù)據(jù)規(guī)模也已達(dá)390PB。

        2.1.3 制定多類數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范數(shù)據(jù)共享

        NCBI和EBI在資源建設(shè)方面均非常重視數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)和應(yīng)用。本文通過FairSharing網(wǎng)站檢索創(chuàng)建機(jī)構(gòu)包含NCBI和EBI,并且狀態(tài)為“Ready”(標(biāo)識(shí)已發(fā)布應(yīng)用)的數(shù)據(jù)標(biāo)準(zhǔn),匯總分析兩個(gè)數(shù)據(jù)中心建立的數(shù)據(jù)標(biāo)準(zhǔn)現(xiàn)狀[9]。經(jīng)過去重,共檢索得到45個(gè)標(biāo)準(zhǔn)。其中,NCBI有10項(xiàng)標(biāo)準(zhǔn)(如A Gold Path format、GenBank Sequence Format、Cell Behavior Ontology等),EBI有37項(xiàng)標(biāo)準(zhǔn),有2個(gè)格式交換標(biāo)準(zhǔn)是由NCBI和EBI共同參與創(chuàng)建的(INSD Sequence Record XML和DDBJ/ENA/GenBank Feature Table,用于INSDC聯(lián)盟進(jìn)行核苷酸數(shù)據(jù)交換共享)。其他標(biāo)準(zhǔn)類型有20項(xiàng)數(shù)據(jù)格式標(biāo)準(zhǔn)(如EBI BioSamples JSON Format、ENA Sequence Flat File Format、OmicsDI XML Format等)、14項(xiàng)術(shù)語標(biāo)準(zhǔn)(如Systems Biology Ontology、Human Phenotype Ontology等)、8項(xiàng)數(shù)據(jù)集元數(shù)據(jù)標(biāo)準(zhǔn)(如FAANG Metadata Experiment Specification Standard和Minimum Information about Plant Phenotyping Exper iment等)和3項(xiàng)數(shù)據(jù)分類標(biāo)準(zhǔn)(如Uni Prot Taxonomy等)。通過綜合分析,本文發(fā)現(xiàn)兩個(gè)數(shù)據(jù)中心的標(biāo)準(zhǔn)建設(shè)工作聚焦在數(shù)據(jù)的規(guī)范化表示和描述方面,重點(diǎn)解決多種類型的生物醫(yī)學(xué)數(shù)據(jù)在提交、存儲(chǔ)、下載、計(jì)算和交換中的文件格式問題。其次是語義表達(dá)差異性問題和數(shù)據(jù)描述的結(jié)構(gòu)化與規(guī)范性問題。NCBI和EBI也積極開展標(biāo)準(zhǔn)的應(yīng)用和服務(wù)。它們?cè)谟脩魯?shù)據(jù)提交時(shí)要求使用標(biāo)準(zhǔn)數(shù)據(jù)格式,如核酸序列存儲(chǔ)使用FASTA格式、存儲(chǔ)核酸序列和測(cè)序質(zhì)量信息用FASTQ格式、存儲(chǔ)序列比對(duì)結(jié)果用SAM/BAM格式、存儲(chǔ)變異文件用VCF格式、保存遺傳特征描述用GFF3格式等。NCBI提供MeSH主題詞表和NCBI Taxonomy的瀏覽查詢服務(wù)。EBI不僅提供多種本體資源并開展統(tǒng)一本體查詢服務(wù),創(chuàng)建的Ontology Lookup Service網(wǎng)站收錄了近280個(gè)本體、700萬條術(shù)語和50萬個(gè)實(shí)例[10]。同時(shí),EBI也參與了全球基因組學(xué)與健康聯(lián)盟(Global Alliance for Genomics and Health),積極推動(dòng)基因組研究和醫(yī)療健康數(shù)據(jù)共享的國際政策和標(biāo)準(zhǔn),提高其對(duì)臨床研究社區(qū)不斷變化的需求的服務(wù)水平。NCBI和EBI創(chuàng)建和參與制定的多類標(biāo)準(zhǔn)也在領(lǐng)域中被廣泛實(shí)施和復(fù)用,開展了良好的應(yīng)用實(shí)踐。

        2.2 關(guān)鍵技術(shù)工具研發(fā)

        2.2.1 擴(kuò)展云基礎(chǔ)設(shè)施提升存儲(chǔ)和服務(wù)

        生物醫(yī)學(xué)數(shù)據(jù)的指數(shù)級(jí)增長和數(shù)據(jù)密集型科學(xué)研究需求的日益迫切,NCBI和EBI積極開展EB級(jí)海量數(shù)據(jù)處理、存儲(chǔ)、計(jì)算和服務(wù)的解決方案探索。2019年,EBI獲得英國研究與創(chuàng)新署的4 500萬英鎊的投資,用于提高其基礎(chǔ)設(shè)施建設(shè)能力。2020年開始,NCBI和EBI在加強(qiáng)基礎(chǔ)設(shè)施建設(shè)的同時(shí)積極探索應(yīng)用云環(huán)境加速促進(jìn)其研究創(chuàng)新和滿足全球化用戶服務(wù)需求。早在2013年,歐洲就組建了ELIXIR(http://www.elixireurope.org/)負(fù)責(zé)協(xié)調(diào)歐洲的數(shù)據(jù)、工具、云存儲(chǔ)、超算及培訓(xùn)等資源以建立一個(gè)可持續(xù)的泛歐生物信息研究基礎(chǔ)設(shè)施。EBI是ELIXIR項(xiàng)目重要節(jié)點(diǎn),已建有龐大的技術(shù)基礎(chǔ)設(shè)施,包括虛擬化環(huán)境、高性能計(jì)算集群和近440PB的存儲(chǔ)資源。為了滿足快速增長的運(yùn)營需求,EBI先后與Google Cloud和Amazon Web Services(AWS)建立戰(zhàn)略合作,實(shí)施混合云及多云戰(zhàn)略。公有云主要使用Google Cloud和Amazon Web Services,私有云使用Embassy Cloud和歐洲開放科學(xué)云(EOSC)。依托私有云開展大規(guī)模的國際合作,如泛癌癥全基因組分析和Tara Oceans等;依托公有云,EBI已開展Human CellAtlas、Idenitifers.org、Ensembl鏡像等項(xiàng)目,為研究人員提供各類分析計(jì)算工具和服務(wù)。

        NCBI基于NLM建立的發(fā)現(xiàn)、實(shí)驗(yàn)和可持續(xù)性科學(xué)技術(shù)研究基礎(chǔ)設(shè)施(STEARDS)計(jì)劃,先后開展了與Google Cloud、Amazon Web Services和Windows Azure的合作,利用云平臺(tái)進(jìn)行SRA、COVID-19基因組序列數(shù)據(jù)集、BLAST數(shù)據(jù)庫和PMC等多個(gè)數(shù)據(jù)庫的數(shù)據(jù)托管和維護(hù),并利用云環(huán)境支撐大規(guī)模數(shù)據(jù)的傳輸、分析、計(jì)算和科研協(xié)作。

        2.2.2 利用高速工具提高數(shù)據(jù)獲取效率

        由于生物醫(yī)學(xué)數(shù)據(jù)規(guī)模大且用戶利用率高,NCBI和EBI研發(fā)以及應(yīng)用能夠支持高性能的大規(guī)模數(shù)據(jù)上傳、下載和集成檢索工具以提高數(shù)據(jù)獲取效率。兩個(gè)數(shù)據(jù)中心均提供IBM Aspera軟件作為大數(shù)據(jù)傳輸?shù)慕鉀Q方案。Aspera基于IBM FASP傳輸協(xié)議,傳輸速度遠(yuǎn)高于FTP,內(nèi)置AES-128加密算法,支持傳輸加密、落地解密和斷點(diǎn)續(xù)傳,并提供瀏覽器插件、客戶端和命令行等多種使用方式。除Aspera以外,針對(duì)不同類型的資源,NCBI還提供NCBI E-Utilities、SRA Toolkit、GEO2R等工具,以及提供API接口等服務(wù)方式支持大體量特定類型數(shù)據(jù)資源的下載。

        在數(shù)據(jù)集成檢索方面,NCBI和EBI分別創(chuàng)建了高性能數(shù)據(jù)庫集成檢索系統(tǒng)NCBI Entrez和EBI Search,并提供統(tǒng)一檢索結(jié)果展示和分類篩選頁面。NCBI Entrez支持NCBI六大類38種數(shù)據(jù)庫資源檢索。用戶可以通過瀏覽器訪問NCBI Entrez,也可以使用E-Utilities通過程序接口和參數(shù)設(shè)置進(jìn)行按需數(shù)據(jù)調(diào)用[11]。EBI Search與EBI的數(shù)據(jù)資源同步,57.14版本已索引了近48億個(gè)條目。它底層基于Apache Lucene建設(shè),利用Carrot2實(shí)現(xiàn)查詢結(jié)果的優(yōu)化[12-13]。EBI Search提供Web瀏覽器和RESTful接口訪問[14]。NCBI Entrez和EBI Search最大的共性特點(diǎn)在于均能夠支持?jǐn)?shù)據(jù)庫記錄內(nèi)和數(shù)據(jù)庫記錄之間的廣泛鏈接和交叉引用,可以幫助用戶發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)和擴(kuò)展應(yīng)用。如NCBI Entrez包含兩種數(shù)據(jù)關(guān)聯(lián):一種是通過相似度等計(jì)算獲得的,如基于BLAST相似性搜索發(fā)現(xiàn)相關(guān)序列;另一種是記錄數(shù)據(jù)本身存在的關(guān)系或跨庫資源類型間的關(guān)聯(lián),如PubMed的論文摘要與PMC全文的關(guān)聯(lián),蛋白質(zhì)序列與其編碼DNA序列或發(fā)表它的論文之間的關(guān)聯(lián)等[15]。

        2.2.3 研發(fā)多類數(shù)據(jù)處理分析工具軟件

        結(jié)合不同類型生物醫(yī)學(xué)數(shù)據(jù)的數(shù)量、特點(diǎn)和用途等,NCBI和EBI研究開發(fā)了大量文獻(xiàn)查詢注釋(PubMed Clinical Queries、Annotation Platform和Europe PMC Grant Finder等),蛋白質(zhì)、核酸和DNA序列比對(duì),包括序列相似性搜索(BLAST、Simple Phylogeny和FASTA等)、多序列比對(duì)(Kalign、T-COFFEE、CLUSTALW2和COBALT等)、雙序列比對(duì)(Clustal Omega和PSIBLAST等),分子進(jìn)化和系統(tǒng)發(fā)育樹構(gòu)建(CDTree和Lifemap等),結(jié)構(gòu)分析與可視化顯示(Cn3D、MapViewer、Nightingale和Protvista等)相關(guān)工具。門戶展示的工具數(shù)近50個(gè),滿足不同用戶的數(shù)據(jù)處理、分析和挖掘需求。NCBI的研究小組也在不斷優(yōu)化數(shù)據(jù)庫搜索、序列比對(duì)、基因組分析、圖像注釋、蛋白質(zhì)結(jié)構(gòu)和功能預(yù)測(cè)等方面的算法和工具。為提高共享應(yīng)用,數(shù)據(jù)中心網(wǎng)站均提供多種工具服務(wù)形式,包括云服務(wù)、網(wǎng)絡(luò)版、工具包下載、開發(fā)接口等,允許用戶通過Web、RESTful API和命令行等創(chuàng)建自定義數(shù)據(jù)集,并支持結(jié)構(gòu)化文件下載。同時(shí),其也為具有開發(fā)能力的用戶提供開發(fā)接口、工具包或開源代碼。此外,兩個(gè)數(shù)據(jù)中心均在GitHub.com發(fā)布了部分?jǐn)?shù)據(jù)資源和工具代碼,提供用戶開放下載和獲取。

        2.3 多元數(shù)據(jù)共享服務(wù)

        2.3.1 保障數(shù)據(jù)開放共享和安全利用

        NCBI和EBI的生物醫(yī)學(xué)數(shù)據(jù)資源和工具在開放獲取政策支持下,開放和開源程度極高,研究人員可訪問大部分?jǐn)?shù)據(jù),并從網(wǎng)站公開獲取和下載。開放的數(shù)據(jù)資源及工具多基于CC-By、CC0、Apache 2.0等開放協(xié)議。研究人員提交到NCBI的人類基因組數(shù)據(jù)必須遵循《美國國立衛(wèi)生研究院的基因數(shù)據(jù)共享政策》(Genomic Data Sharing Policy),依照《美國聯(lián)邦受試者保護(hù)通則》(Federal Policy for the Protection of Human Subjects)和《美國健康保險(xiǎn)可攜性和責(zé)任法案》(Health Insurance Portability and Accountability Act)隱私條例標(biāo)準(zhǔn)進(jìn)行識(shí)別化處理。對(duì)于涉及受試者個(gè)人信息和人類遺傳資源的數(shù)據(jù),NCBI嚴(yán)格實(shí)施受控訪問。例如,在數(shù)據(jù)提交到GEO、SRA等數(shù)據(jù)庫之前,研究人員需要在原始數(shù)據(jù)清洗和質(zhì)控前完成dbGap注冊(cè)。dbGap是提供遺傳關(guān)聯(lián)研究、甲基化研究和其他高風(fēng)險(xiǎn)個(gè)體水平數(shù)據(jù)的數(shù)據(jù)庫,其僅供研究目的使用,數(shù)據(jù)的訪問需要通過數(shù)據(jù)訪問委員會(huì)(Data Access Committee,DAC)審核和授權(quán)。

        而EBI的開放數(shù)據(jù)遵循EMBL的開放獲取政策,促進(jìn)數(shù)據(jù)的廣泛和免費(fèi)獲取。同樣,其也對(duì)潛在可識(shí)別的人類基因數(shù)據(jù)訪問進(jìn)行嚴(yán)格控制,如存儲(chǔ)研究項(xiàng)目產(chǎn)生的所有類型的個(gè)人可識(shí)別遺傳和表型數(shù)據(jù)的歐洲基因組表型數(shù)據(jù)庫(EGA)有7 713個(gè)數(shù)據(jù)集,數(shù)據(jù)使用僅面向特定研究用途或研究人員發(fā)布。這些數(shù)據(jù)集中包含25個(gè)受限數(shù)據(jù)集,使用需要向DAC申請(qǐng)并提交研究方案,審批授權(quán)后方能訪問。

        2.3.2 重視數(shù)據(jù)領(lǐng)域?qū)I(yè)知識(shí)技能培訓(xùn)

        兩大數(shù)據(jù)中心非常重視面向各層次的科學(xué)研究者(包括領(lǐng)域科學(xué)家、臨床醫(yī)生、技術(shù)開發(fā)人員和學(xué)生等)提供數(shù)據(jù)和工具專業(yè)知識(shí)技能的指導(dǎo)和培訓(xùn),提供較為全面的數(shù)據(jù)提交、下載、工具安裝、使用流程和方法說明。如由于數(shù)據(jù)資源庫種類過于繁雜,NCBI和EBI的數(shù)據(jù)匯交門戶均提供數(shù)據(jù)提交引導(dǎo),通過分步選擇引導(dǎo)用戶明確需求找到適合的存儲(chǔ)數(shù)據(jù)庫,降低使用門檻。此外,專業(yè)人員教育和用戶培育也是兩個(gè)數(shù)據(jù)中心的重要工作,NCBI創(chuàng)建了各種在線課程、線上和線下研討會(huì),提供視頻、培訓(xùn)材料和文檔,并充分利用多渠道和多媒體開展資源和工具的宣傳、動(dòng)態(tài)報(bào)道和與用戶交互,包括YouTube、博客、社交媒體網(wǎng)站(FaceBook、Twitter和LinkedIn)、RSS、郵件和NCBI Insight網(wǎng)站等。NCBI不定期舉辦“編程馬拉松”活動(dòng),鼓勵(lì)不同背景的研究人員、開發(fā)人員和數(shù)據(jù)科學(xué)家、學(xué)生和博士后等組建團(tuán)隊(duì),幫助參與者深入了解數(shù)據(jù)管理、學(xué)習(xí)編碼的最佳實(shí)踐和創(chuàng)新生物醫(yī)學(xué)數(shù)據(jù)計(jì)算分析模型算法及工具。EBI也積極開展多種生物醫(yī)學(xué)專業(yè)知識(shí)培訓(xùn),包括現(xiàn)場(chǎng)培訓(xùn)、網(wǎng)絡(luò)研討會(huì)、虛擬課程和在線教程集合等,培訓(xùn)方式包括實(shí)時(shí)課程、點(diǎn)播課程和培訓(xùn)師支持。實(shí)時(shí)課程主要提供生物分析的特定領(lǐng)域培訓(xùn),網(wǎng)絡(luò)研討會(huì)計(jì)劃和在線教程側(cè)重于EBI資源和工具的介紹和利用。培訓(xùn)通過邀請(qǐng)EMBL及領(lǐng)域或社區(qū)的專家以指導(dǎo)實(shí)踐練習(xí)、開展小組討論和問題交流為主。2020年,已有54.5萬個(gè)獨(dú)立IP用戶訪問了EBI的相關(guān)培訓(xùn)頁面,通過多種數(shù)據(jù)中心提供的培訓(xùn)方式提高了生物醫(yī)學(xué)數(shù)據(jù)素養(yǎng)水平[16]。

        2.3.3 開展研究合作積極推動(dòng)數(shù)據(jù)增值

        NCBI和EBI擁有高水平的研究組,積極開展深入的生物醫(yī)學(xué)信息學(xué)和數(shù)據(jù)科學(xué)研究及合作。本文通過對(duì)PumMed數(shù)據(jù)庫進(jìn)行檢索,統(tǒng)計(jì)得到:NCBI在1990—2021年發(fā)表論文3 779篇,EBI在1994—2021年發(fā)表論文3 166篇。這些論文主要發(fā)表在Nucleic Acids Research、Genome Biology、Nature等具有影響力的期刊上,主要是報(bào)道關(guān)于序列和結(jié)構(gòu)比對(duì)算法,基因組分析可視化工具,基于深度學(xué)習(xí)的生物圖像解釋,基礎(chǔ)生物學(xué)突破,以及其他具有廣泛性與重要性的創(chuàng)新算法、方法、資源和工具的相關(guān)研究和實(shí)踐[17-19]。兩大數(shù)據(jù)中心始終保持在國際生物醫(yī)學(xué)信息學(xué)研究和應(yīng)用領(lǐng)域的先進(jìn)性和影響力。由于其開展了領(lǐng)域數(shù)據(jù)管理和共享的良好實(shí)踐,它們也成為Springer Nature、Wiley、Elsevier等知名出版商的數(shù)據(jù)政策中所推薦的可信賴的科學(xué)數(shù)據(jù)倉儲(chǔ),為很多重要的學(xué)術(shù)論文發(fā)表和傳播提供了可靠的數(shù)據(jù)來源、長期的數(shù)據(jù)存儲(chǔ)和高性能計(jì)算分析等重要支持,獲得用戶的長期信賴。同時(shí),NCBI和EBI也積極和多方開展研究合作,參與大型科研項(xiàng)目。NCBI的研究人員與NIH內(nèi)的多個(gè)研究所以及眾多學(xué)術(shù)界或政府開辦的研究實(shí)驗(yàn)室保持著持續(xù)的合作。EBI的研究人員參與了人體細(xì)胞圖譜(Human Cell Atlas,HCA)、OpenTargets、ICGC-ARGO、泛癌全基因組分析(Pan-Cancer Analysis of Whole Genomes)等大型研究計(jì)劃。在與非學(xué)術(shù)型機(jī)構(gòu)合作方面,EBI面向全球“20強(qiáng)”制藥公司及農(nóng)業(yè)食品、營養(yǎng)和醫(yī)療保健公司提供研究計(jì)劃及專業(yè)知識(shí)交流平臺(tái),組織季度戰(zhàn)略會(huì)議和專家研討會(huì)等活動(dòng),并為中小企業(yè)發(fā)展和技術(shù)產(chǎn)品轉(zhuǎn)化提供必要的數(shù)據(jù)基礎(chǔ)設(shè)施、數(shù)據(jù)和服務(wù),幫助其加速產(chǎn)品研發(fā)與創(chuàng)新。

        3 對(duì)我國領(lǐng)域科學(xué)數(shù)據(jù)中心建設(shè)的啟示

        隨著大數(shù)據(jù)、物聯(lián)網(wǎng)和人工智能等新技術(shù)在生物醫(yī)學(xué)研究中的應(yīng)用,我國生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)規(guī)模驟增,成為全球重要的生物醫(yī)學(xué)數(shù)據(jù)生產(chǎn)國,具有豐富的民族遺傳資源、家系遺傳資源、典型疾病臨床病例資源等重要數(shù)據(jù)資源。我國雖是數(shù)據(jù)生產(chǎn)大國,但數(shù)據(jù)資源利用水平低,生物醫(yī)學(xué)數(shù)據(jù)資源建設(shè)和開放共享服務(wù)存在基礎(chǔ)設(shè)施支持不足、高質(zhì)量數(shù)據(jù)規(guī)模不夠、數(shù)據(jù)標(biāo)準(zhǔn)化程度低、價(jià)值挖掘服務(wù)能力不足等系列問題。本文通過系統(tǒng)分析NCBI和EBI在資源建設(shè)、技術(shù)工具和共享服務(wù)等方面的建設(shè)和發(fā)展經(jīng)驗(yàn),為我國開展生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心建設(shè)提出了啟示和建議。

        3.1 基礎(chǔ)保障方面

        (1)數(shù)據(jù)戰(zhàn)略下的協(xié)同發(fā)展。NCBI和EBI在NLM和EMBL整體戰(zhàn)略計(jì)劃的推動(dòng)下,開展數(shù)據(jù)中心建設(shè),持續(xù)保持其在全球生物醫(yī)學(xué)領(lǐng)域資源建設(shè)、數(shù)據(jù)管理、計(jì)算分析、數(shù)據(jù)科學(xué)教育培訓(xùn)等方面的領(lǐng)先優(yōu)勢(shì)。兩個(gè)中心定位清晰,并與NLM及EMBL的其他部門緊密合作、優(yōu)勢(shì)互補(bǔ)、協(xié)同發(fā)展。我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心也應(yīng)積極結(jié)合國家科學(xué)數(shù)據(jù)戰(zhàn)略,與領(lǐng)域/行業(yè)伙伴合作,積極補(bǔ)短板、強(qiáng)弱項(xiàng),全面提升核心競爭力。

        (2)提供穩(wěn)定資助經(jīng)費(fèi)投入。NCBI和EBI均具有持續(xù)穩(wěn)定的大規(guī)模經(jīng)費(fèi)投入,特別是政府經(jīng)費(fèi)。相較國外,我國數(shù)據(jù)中心建設(shè)起步晚,資助經(jīng)費(fèi)來源單一,不足以支撐PB級(jí)數(shù)據(jù)快速增長所帶來的基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)存儲(chǔ)、長期保存、平臺(tái)工具研發(fā)維護(hù)、用戶教育培訓(xùn)、人員隊(duì)伍建設(shè)和管理等巨額成本,亟需國家加大對(duì)數(shù)據(jù)中心經(jīng)費(fèi)投入和拓展多種資助渠道。

        (3)建立穩(wěn)定專業(yè)人才隊(duì)伍。雖然NCBI全職員工數(shù)量少于EBI,但是NCBI與NLM的研究、資源和服務(wù)結(jié)合緊密,共同開展MeSH、PubMed等多類資源和衍生工具的建設(shè)以及服務(wù)的開展。但我國數(shù)據(jù)中心的全職員工數(shù)量還遠(yuǎn)不足此。因此,我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心亟需擴(kuò)大人員隊(duì)伍規(guī)模、增強(qiáng)團(tuán)隊(duì)多樣性、提高團(tuán)隊(duì)研究水平和待遇水平。

        3.2 基礎(chǔ)設(shè)施方面

        (1)加強(qiáng)高性能基礎(chǔ)設(shè)施建設(shè)。NCBI和EBI均有政府支持的大規(guī)模經(jīng)費(fèi)用于提高中心的計(jì)算、存儲(chǔ)等基礎(chǔ)設(shè)施建設(shè)能力。自2019年我國科學(xué)數(shù)據(jù)匯交工作啟動(dòng)以來,數(shù)據(jù)PB級(jí)增長,對(duì)已有基礎(chǔ)設(shè)施帶來了嚴(yán)峻挑戰(zhàn)。我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心需要加強(qiáng)構(gòu)建強(qiáng)大且可訪問的數(shù)據(jù)基礎(chǔ)設(shè)施,這對(duì)于未來幾十年的生物醫(yī)學(xué)科學(xué)研究發(fā)現(xiàn)至關(guān)重要。

        (2)探索可靠的云平臺(tái)解決方案。通過NCBI和EBI在私有云和公有云方面的探索,讓我們看到了云平臺(tái)在生物醫(yī)學(xué)數(shù)據(jù)科學(xué)研究和共享服務(wù)中發(fā)揮的重要作用。其不僅可以支持用戶根據(jù)自身需要訪問、分析、計(jì)算大規(guī)模生物醫(yī)學(xué)數(shù)據(jù),也可以降低數(shù)據(jù)中心對(duì)基礎(chǔ)設(shè)施的管理和維護(hù)成本。我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心也應(yīng)積極探索私有云、公有云及混合云的數(shù)據(jù)存儲(chǔ)和服務(wù)策略,但還需要綜合考慮解決好數(shù)據(jù)的流轉(zhuǎn)、存儲(chǔ)和計(jì)算安全和監(jiān)管問題。

        3.3 資源建設(shè)方面

        (1)擴(kuò)展多種數(shù)據(jù)資源渠道。我國數(shù)據(jù)中心應(yīng)深化《科學(xué)數(shù)據(jù)管理辦法》貫徹落地,加強(qiáng)政府預(yù)算支持的科技項(xiàng)目的科學(xué)數(shù)據(jù)匯交管理。同時(shí),擴(kuò)展與生物醫(yī)學(xué)領(lǐng)域研究機(jī)構(gòu)及醫(yī)療行業(yè)的交流合作,通過資助合作、國際合作、協(xié)議合作等不同方式拓展數(shù)據(jù)資源創(chuàng)建渠道。數(shù)據(jù)中心應(yīng)提高研究和服務(wù)水平,不斷識(shí)別和發(fā)現(xiàn)新類型數(shù)據(jù)資源和開發(fā)新的服務(wù)方式。

        (2)優(yōu)化數(shù)據(jù)資源內(nèi)容質(zhì)量。結(jié)合生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)標(biāo)準(zhǔn)和知識(shí)組織體系,加強(qiáng)對(duì)原始數(shù)據(jù)的歸類、重組、注釋、關(guān)聯(lián)和整合,做好數(shù)據(jù)質(zhì)量審核和控制。面向不同使用需求,研發(fā)多類主題數(shù)據(jù)庫、參考數(shù)據(jù)庫、整合數(shù)據(jù)庫及創(chuàng)新型數(shù)據(jù)庫和知識(shí)庫。

        (3)增強(qiáng)數(shù)據(jù)資源的FAIR化。對(duì)齊國際數(shù)據(jù)中心發(fā)展趨勢(shì),遵循FAIR原則,基于唯一標(biāo)識(shí)技術(shù)、語義技術(shù)、Web瀏覽器技術(shù)、人工智能和可視化等技術(shù),增強(qiáng)數(shù)據(jù)的可理解性、可用性、易用性和互操作性。

        3.4 技術(shù)研發(fā)方面

        (1)突破大規(guī)模數(shù)據(jù)處理瓶頸。我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心迫切需要構(gòu)建和使用支持大規(guī)模數(shù)據(jù)上傳、下載、處理、壓縮、存儲(chǔ)、檢索、質(zhì)控和長期保存等系列工具,解決數(shù)據(jù)中心發(fā)展中面臨的大規(guī)模數(shù)據(jù)處理和管理性能差、效率低的瓶頸問題。數(shù)據(jù)中心應(yīng)通過利用人工智能、區(qū)塊鏈、聯(lián)邦學(xué)習(xí)、多方安全計(jì)算等關(guān)鍵技術(shù),面向日益增長的跨組織/機(jī)構(gòu)大數(shù)據(jù)協(xié)同分析和安全計(jì)算需求,研發(fā)高性能、流程化的協(xié)同分析平臺(tái)以及數(shù)據(jù)挖掘模型和工具,支持?jǐn)?shù)據(jù)驅(qū)動(dòng)建模、模型驅(qū)動(dòng)數(shù)據(jù)分析,實(shí)現(xiàn)生物醫(yī)學(xué)數(shù)據(jù)的分析增值。通過平臺(tái)和工具的建設(shè),提高用戶的數(shù)據(jù)挖掘分析效率,并保持科研過程的透明性和結(jié)果的可復(fù)制性,最終實(shí)現(xiàn)生物醫(yī)學(xué)大數(shù)據(jù)的安全共享和跨組織協(xié)同分析的目標(biāo)。

        (2)研發(fā)自主可控的技術(shù)工具。NCBI和EBI研發(fā)了大量生物醫(yī)學(xué)研究所必須的數(shù)據(jù)資源處理、標(biāo)注、比對(duì)、分析、挖掘和預(yù)測(cè)等關(guān)鍵技術(shù)工具。雖然目前這些資源和工具大多數(shù)是向全球開放和開源獲取的,但面對(duì)國外數(shù)據(jù)資源和技術(shù)壟斷、停止更新或服務(wù)提供等情況,我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心應(yīng)當(dāng)積極開展自主可控的關(guān)鍵技術(shù)工具研發(fā),構(gòu)建安全可靠的國產(chǎn)替代型工具,努力開展核心技術(shù)源頭創(chuàng)新,提高數(shù)據(jù)中心的科技創(chuàng)新自強(qiáng)自立水平。

        3.5 標(biāo)準(zhǔn)規(guī)范方面

        (1)加快實(shí)用標(biāo)準(zhǔn)建設(shè)落地。數(shù)據(jù)標(biāo)準(zhǔn)對(duì)開展生物醫(yī)學(xué)數(shù)據(jù)建設(shè)、管理、共享和利用起到重要指引和規(guī)范作用。NCBI和EBI積極主導(dǎo)了大量在生物醫(yī)學(xué)領(lǐng)域具有重要影響的基因組和蛋白質(zhì)組學(xué)等相關(guān)優(yōu)質(zhì)數(shù)據(jù)集的描述、數(shù)據(jù)表示和數(shù)據(jù)互操作等標(biāo)準(zhǔn)規(guī)范制定,開展了最佳實(shí)踐工作。我國的生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心應(yīng)在結(jié)合領(lǐng)域發(fā)展和標(biāo)準(zhǔn)建設(shè)現(xiàn)狀的基礎(chǔ)上,優(yōu)化完善已有生物醫(yī)學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系,重點(diǎn)針對(duì)數(shù)據(jù)質(zhì)控、數(shù)據(jù)分級(jí)、數(shù)據(jù)共享等方面,分階段、有步驟地加強(qiáng)核心標(biāo)準(zhǔn)的研制,重點(diǎn)制定專業(yè)領(lǐng)域空白和缺失的數(shù)據(jù)標(biāo)準(zhǔn),持續(xù)開展已有數(shù)據(jù)標(biāo)準(zhǔn)的修訂和完善。

        (2)參與國際數(shù)據(jù)標(biāo)準(zhǔn)制定。應(yīng)積極參與國際生物醫(yī)學(xué)科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的制定,一方面,重視國際標(biāo)準(zhǔn)的采納、本地化和引用;另一方面,加快國家標(biāo)準(zhǔn)與國際標(biāo)準(zhǔn)的接軌,提高我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)制定水平,提升我國國際數(shù)據(jù)標(biāo)準(zhǔn)制定的話語權(quán)。此外,應(yīng)重點(diǎn)結(jié)合生物醫(yī)學(xué)科學(xué)數(shù)據(jù)匯交、質(zhì)控、整合、存儲(chǔ)、交換和共享實(shí)踐開展標(biāo)準(zhǔn)規(guī)范宣傳、推廣和落地監(jiān)管,促進(jìn)標(biāo)準(zhǔn)規(guī)范切實(shí)應(yīng)用和發(fā)揮有效作用,讓生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心建設(shè)和發(fā)展有標(biāo)可依,行之有效。

        3.6 用戶服務(wù)方面

        (1)加強(qiáng)多類型用戶培訓(xùn)。NCBI和EBI已從用戶社區(qū)建設(shè)和交互反饋中獲得重要改進(jìn)和影響力,我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心也應(yīng)積極面向?qū)W生、研究人員、數(shù)據(jù)管理人員、企業(yè)用戶等不同類型群體,開展生物醫(yī)學(xué)科學(xué)數(shù)據(jù)管理和數(shù)據(jù)科學(xué)基礎(chǔ)及專業(yè)知識(shí)培訓(xùn),為用戶提供生物醫(yī)學(xué)科學(xué)數(shù)據(jù)管理計(jì)劃、資源查找、分析挖掘、共享利用等方面的咨詢和指導(dǎo)。

        (2)有效提升用戶參與度。新型冠狀病毒肺炎大流行極大地促進(jìn)了線上活動(dòng),數(shù)據(jù)中心應(yīng)充分借助在線視頻、在線會(huì)議、微博、微信、QQ等多媒體工具,并通過舉辦線上、線下相結(jié)合的培訓(xùn)課程、數(shù)據(jù)競賽、校外實(shí)習(xí)等使用戶了解和參與生物醫(yī)學(xué)科學(xué)數(shù)據(jù)管理最佳實(shí)踐。

        (3)促進(jìn)數(shù)據(jù)和研究轉(zhuǎn)化增值。數(shù)據(jù)中心應(yīng)積極利用已有研究成果、數(shù)據(jù)資源以及關(guān)鍵技術(shù)工具,加強(qiáng)與領(lǐng)域?qū)<?、研究機(jī)構(gòu)和生物醫(yī)療機(jī)構(gòu)及企業(yè)的合作,參與國際項(xiàng)目合作。從豐富的研究和合作中,一方面積極獲取學(xué)術(shù)型研究需求和經(jīng)驗(yàn),深化生物醫(yī)領(lǐng)域數(shù)據(jù)管理研究;另一方面積極獲取非學(xué)術(shù)型的應(yīng)用需求,推動(dòng)生物醫(yī)學(xué)科學(xué)數(shù)據(jù)驅(qū)動(dòng)的應(yīng)用創(chuàng)新和成果轉(zhuǎn)化。

        4 結(jié)語

        2021年聯(lián)合國教科文組織正式發(fā)布《開放科學(xué)建議書》(UNESCO Recommendation on Open Science),標(biāo)志著開放科學(xué)進(jìn)入全球共識(shí)新階段[20]。NCBI和EBI作為生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)開放共享典型代表的數(shù)據(jù)中心已取得了較為顯著的成效和影響力,本文系統(tǒng)梳理了其在數(shù)據(jù)資源體系建設(shè)、關(guān)鍵技術(shù)工具研發(fā)和多元數(shù)據(jù)共享服務(wù)等方面的進(jìn)展,并基于此,探討對(duì)我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心發(fā)展的啟示和建議,為我國生物醫(yī)學(xué)領(lǐng)域相關(guān)數(shù)據(jù)中心在“十四五”期間一步深化數(shù)據(jù)中心資源和服務(wù)建設(shè)以及長期發(fā)展提供借鑒思路。本文研究中也還存在不足,由于兩家數(shù)據(jù)中心建設(shè)成果豐富,因筆者研究精力和學(xué)科所限,在內(nèi)容揭示的全面性和分析的深入性方面還存在局限,將在后續(xù)研究工作中持續(xù)完善。

        猜你喜歡
        數(shù)據(jù)庫科學(xué)資源
        基礎(chǔ)教育資源展示
        一樣的資源,不一樣的收獲
        科學(xué)大爆炸
        資源回收
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        數(shù)據(jù)庫
        科學(xué)
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        欧美精品欧美人与动人物牲交| 国产精品色内内在线播放| 97色人阁俺也去人人人人人| 男人天堂亚洲一区二区| 激情内射亚洲一区二区三区| 国产成人无码一区二区三区在线| 无码午夜剧场| 婷婷久久久亚洲欧洲日产国码av| 亚洲免费视频播放| 啪啪视频免费看一区二区| 亚洲av成人av三上悠亚| 国产精品人妻一码二码| 四虎影院在线观看| 日日噜噜夜夜狠狠久久av| 国产丝袜长腿美臀在线观看| 18禁黄网站禁片免费观看女女| 免费黄色电影在线观看| 日本一区免费喷水| 日本一区二区三区不卡在线| 色偷偷亚洲第一成人综合网址| 亚洲男人天堂2019| 国产大陆av一区二区三区| 色综合悠悠88久久久亚洲| 亚洲av无码一区二区三区乱子伦| 屁屁影院一区二区三区| 久久久国产视频久久久| 精品国产成人av久久| 无码午夜成人1000部免费视频 | 亚州AV成人无码久久精品| 国产一区资源在线播放| 成人亚洲一区二区三区在线| 国产98在线 | 免费| 国产一区二区三区免费主播| 精品日韩一级免费视频| 亚洲精品无码久久久久久| 亚洲精品美女自拍偷拍| 亚洲成人av大片在线观看| 三a级做爰片免费观看| 九九99久久精品在免费线18| 国产猛男猛女超爽免费av| 一区二区和激情视频|