亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        GSA-Human:人類遺傳資源數(shù)據(jù)管理的公共系統(tǒng)

        2021-11-01 10:27:48張思思陳旭陳婷婷朱軍偉唐碧霞王安可董麗莉張哲文孫艷玲俞彩霞翟爽孫玉彬陳煥新杜政霖肖景發(fā)章張鮑一明王彥青趙文明
        遺傳 2021年10期
        關(guān)鍵詞:數(shù)據(jù)管理遺傳測序

        張思思,陳旭,陳婷婷,朱軍偉,唐碧霞,王安可,董麗莉,張哲文,孫艷玲,俞彩霞,翟爽,孫玉彬,陳煥新,杜政霖,3,肖景發(fā),3,章張,3,鮑一明,3,王彥青,趙文明,3

        資源與平臺

        GSA-Human:人類遺傳資源數(shù)據(jù)管理的公共系統(tǒng)

        張思思1,2,陳旭1,2,陳婷婷1,2,朱軍偉1,2,唐碧霞1,2,王安可1,2,董麗莉1,2,張哲文1,2,孫艷玲1,2,俞彩霞1,2,翟爽1,2,孫玉彬1,2,陳煥新1,2,杜政霖1,2,3,肖景發(fā)1,2,3,章張1,2,3,鮑一明1,2,3,王彥青1,2,趙文明1,2,3

        1. 國家生物信息中心, 北京 100101 2. 中國科學院北京基因組研究所, 國家基因組科學數(shù)據(jù)中心, 北京 100101 3. 中國科學院大學,北京 100049

        GSA-Human是人類遺傳資源數(shù)據(jù)匯交、存儲、管理與共享的數(shù)據(jù)庫系統(tǒng),可提供人類遺傳資源數(shù)據(jù)的上傳、下載、瀏覽、檢索等公共服務(wù),并有效支撐了國家重點研發(fā)計劃科技項目數(shù)據(jù)的匯交與管理工作。系統(tǒng)具有符合《中華人民共和國人類遺傳資源管理條例》數(shù)據(jù)安全管理策略,提供公開訪問和受控訪問相結(jié)合的數(shù)據(jù)使用模式。公開訪問數(shù)據(jù)允許用戶自由下載與獲取;受控訪問數(shù)據(jù)采用申請-審核的模式,即需要通過數(shù)據(jù)管理委員會(Data Access Committee, DAC)的授權(quán)方可獲得下載和使用權(quán)限。系統(tǒng)自上線以來,截至2021年7月,匯集數(shù)據(jù)總量已超5.27 PB。

        人類遺傳資源數(shù)據(jù)管理系統(tǒng);組學數(shù)據(jù);數(shù)據(jù)匯交;數(shù)據(jù)共享

        數(shù)據(jù)是21世紀的珍貴財產(chǎn)。人類遺傳資源數(shù)據(jù)關(guān)系到人口健康和人類社會的可持續(xù)發(fā)展,是國家重要戰(zhàn)略資源。2019年7月1日開始實施的《中華人民共和國人類遺傳資源管理條例》(簡稱“條例”)明確了人類遺傳資源范圍,即人類遺傳資源數(shù)據(jù)是指利用含有人體基因組、基因等遺傳物質(zhì)的器官、組織、細胞等材料產(chǎn)生的數(shù)據(jù)。該條例規(guī)定了人類遺傳資源數(shù)據(jù)在采集、保藏、利用和對外開放方面的審批事項,為我國人類遺傳資源數(shù)據(jù)的管理提供了指導思想。國家生物信息中心–國家基因組科學數(shù)據(jù)中心(National Genomics Data Center, China National Center for Bioinformation, CNCB-NGDC)于2015年建立的組學原始數(shù)據(jù)歸檔庫(Genome Sequence Ar-chive, GSA)(https://ngdc.cncb.ac.cn/gsa/)[1~3],匯交、存儲、管理和共享全球生命組學測序數(shù)據(jù),為我國的科學數(shù)據(jù)管理發(fā)揮了重要作用。依托GSA系統(tǒng),以人類遺傳資源管理條例為指導原則,以《科學數(shù)據(jù)管理辦法》和《數(shù)據(jù)安全法》為參照,CNCB-NGDC建立了集數(shù)據(jù)匯交、分級存儲、安全管理、受控共享等多個功能為一體的人類遺傳資源數(shù)據(jù)管理系統(tǒng)(Genome Sequence Archive for Human, GSA-Human) (https://ngdc.cncb.ac.cn/gsa-human/),以此推動我國人類遺傳資源數(shù)據(jù)的安全管理與開放共享,促進數(shù)據(jù)開發(fā)與利用,服務(wù)于國家面向人口健康和生命安全相關(guān)的科學研究。

        1 GSA-Human系統(tǒng)建設(shè)

        1.1 支持數(shù)據(jù)類型

        通常,生命組學數(shù)據(jù)可分為三級:一級為原始測序數(shù)據(jù),大多為通過基因測序儀或相關(guān)儀器設(shè)備產(chǎn)生的并經(jīng)過簡單整理和質(zhì)量控制后的數(shù)據(jù),這類數(shù)據(jù)含有最全面的信息;二級為原始測序數(shù)據(jù)經(jīng)過一些處理,如序列比對、基因組拼接等操作后所產(chǎn)生的數(shù)據(jù);三級為在二級數(shù)據(jù)的基礎(chǔ)上進一步深加工產(chǎn)生的數(shù)據(jù),如基因組的變異、基因注釋、轉(zhuǎn)錄組表達量、表觀組調(diào)控位點等分析結(jié)果數(shù)據(jù)。GSA-Human主要面向一級測序序列數(shù)據(jù),支持當前主流測序平臺,如二代測序平臺Illumina、BGISEQ等,三代測序平臺PacBio SMART、Bionano Genomics、Oxford Nanopore等。針對二、三級數(shù)據(jù),CNCB- NGDC已建立了多個數(shù)據(jù)庫系統(tǒng)收錄并整合數(shù)據(jù),如基因組數(shù)據(jù)庫(Genome Warehouse, GWH)[4], 基因組變異數(shù)據(jù)庫(Genome Variation Map, GVM)[5],基因組表達庫(Gene Expression Nebulas, GEN)[6],甲基化數(shù)據(jù)庫(Methylation Bank, MethBank)[7],多元數(shù)據(jù)歸檔庫(Open Archive for Miscellaneous Data, OMIX)等。各數(shù)據(jù)庫通過項目編號(BioProject accession)進行相互關(guān)聯(lián),相輔相成,形成了我國人類遺傳資源數(shù)據(jù)安全存儲和統(tǒng)一管理的公共平臺。

        1.2 數(shù)據(jù)組織模式

        GSA-Human中的數(shù)據(jù)包括元數(shù)據(jù)信息和測序序列數(shù)據(jù)。元數(shù)據(jù)信息主要為測序序列數(shù)據(jù)的描述信息,鑒于人類遺傳資源承載的基本對象是人,GSA-Human使用“個體”(individual)來描述研究對象,并組織與此研究對象相關(guān)聯(lián)的信息,主要包括“樣本信息”(sample)、“實驗信息”(experiment)、“測序反應(yīng)”(run)信息以及對應(yīng)的測序序列數(shù)據(jù)(sequence)。其中,“個體信息”是用于收集取樣對象的基本信息,主要收集包括性別、身體形態(tài)指標、生活習慣、疾病、治療情況以及其他屬性信息。當取樣對象為細胞系時,主要收集原代培養(yǎng)物或細胞系的取樣組織、生理性別和種族來源等信息?!皹颖拘畔ⅰ笔侵饕占芯可婕暗纳飿颖久枋?,如樣本類型、樣本屬性等。為更加靈活的實現(xiàn)個體和樣本的元數(shù)據(jù)信息的收集管理,GSA-Human采樣用固定詞條與自定義屬性相結(jié)合的方式組織數(shù)據(jù),即系統(tǒng)設(shè)置個性化的數(shù)據(jù)描述字段以滿足不同的數(shù)據(jù)管理需求?!皩嶒炐畔ⅰ卑▽嶒災康?、文庫構(gòu)建方式、測序類型等信息?!皽y序反應(yīng)”信息為測序文件所對應(yīng)的校驗信息,測序文件則為各種測序平臺的測序原始數(shù)據(jù),主要測序格式包括Fastq、BAM等。GSA-Human系統(tǒng)中,一個或多個個體組成的數(shù)據(jù)組由“研究信息”(study)數(shù)據(jù)模型進行統(tǒng)一管理,包括研究類型、數(shù)據(jù)訪問機制、數(shù)據(jù)備份號與備案號①數(shù)據(jù)備份號與備案號為中華人民共和國科學技術(shù)部為人類遺傳資源信息對境外機構(gòu)提供或開放使用提供的審批編號。等信息。因此,“研究信息”被定義為GSA-Human中的一個獨立數(shù)據(jù)集(dataset),并以“HRA+6位數(shù)字”(如“HRA000001”)編碼進行唯一標識。各類數(shù)據(jù)元素之間采用層級及關(guān)聯(lián)的模式進行組織,從而形成包括“研究(study)-個體(individual)-樣本(sample)-實驗(experiment)-測序反應(yīng)(run)-序列數(shù)據(jù)(sequence)”的“金字塔”式的數(shù)據(jù)組織與管理模式。

        1.3 數(shù)據(jù)質(zhì)控與審核

        GSA-Human系統(tǒng)建立了元數(shù)據(jù)實時審核、人工審編和數(shù)據(jù)文件審編三個層次的數(shù)據(jù)質(zhì)控與審核功能。元數(shù)據(jù)實時審核發(fā)生在數(shù)據(jù)錄入過程中,審核內(nèi)容包括數(shù)據(jù)合規(guī)性、一致性、控制詞匯、專有術(shù)語和數(shù)據(jù)結(jié)構(gòu)等。人工校驗發(fā)生在數(shù)據(jù)錄入之后,由GSA-Human的系統(tǒng)審編員執(zhí)行,人工校驗可以防止一些內(nèi)容不當或垃圾信息進入系統(tǒng)并被公布,從而確保元數(shù)據(jù)信息的準確性,并使得系統(tǒng)中的數(shù)據(jù)干凈整潔。數(shù)據(jù)文件審編由后臺監(jiān)控程序自動檢測并觸發(fā)運行,該過程主要檢查用戶遞交序列數(shù)據(jù)的完整性和可靠性,防止數(shù)據(jù)文件在處理、壓縮、拷貝、傳輸和存檔過程中出現(xiàn)異常,自動化程序?qū)徍诉^程和內(nèi)容包括:(1)文件壓縮的正確性;(2)文件格式的合規(guī)性,目前主要的文件格式包括Fastq和Bam格式;(3)序列信息的統(tǒng)計,包括reads數(shù)量、堿基數(shù)量、reads長度、堿基數(shù)量分布和reads長度分布等。針對用戶遞交的數(shù)據(jù)集,只有當元數(shù)據(jù)和序列數(shù)據(jù)均通過審核,GSA-Human才為該數(shù)據(jù)集分配正式的訪問序列號(accession number)。

        1.4 數(shù)據(jù)管理委員會

        GSA-Human設(shè)置數(shù)據(jù)管理委員會(Data Access Committee, DAC)對數(shù)據(jù)的訪問權(quán)限進行管理和控制。DAC由數(shù)據(jù)遞交者提供并在遞交數(shù)據(jù)時創(chuàng)建,每一個需要受控管理的數(shù)據(jù)集均需設(shè)置DAC,DAC中可包含一個或多個成員,一般由資深專家組成,且需要設(shè)定一名DAC聯(lián)系人(DAC contact)。DAC是GSA-Human中審批數(shù)據(jù)使用請求的最終決策方,DAC成員負責審核用戶請求,DAC聯(lián)系人負責接收數(shù)據(jù)申請、組織DAC成員對數(shù)據(jù)申請進行審核、處理相關(guān)的決策決議。GSA-Human為每個DAC分配一個編號,并實現(xiàn)與其管理數(shù)據(jù)的關(guān)聯(lián)與訪問。

        1.5 數(shù)據(jù)安全保障措施

        為保證人類遺傳資源數(shù)據(jù)的存儲安全,GSA- Human從系統(tǒng)架構(gòu)整體設(shè)計了多重安全防護措施。在用戶身份認證方面,采取雙重認證方式,用戶既需要通過CNCB-NGDC的單點登錄系統(tǒng)(single sign- on, SSO)的密碼認證,還需要在數(shù)據(jù)提交和申請下載的人工審核階段,進行項目負責人身份信息核實,以確保數(shù)據(jù)的可溯源性。針對數(shù)據(jù)上傳服務(wù),GSA- Human為每個用戶提供獨立的數(shù)據(jù)存儲空間,有效避免不同用戶之間相互干擾,降低信息泄露的可能性,充分確保數(shù)據(jù)的安全性和私密性。在數(shù)據(jù)存儲方面,采用磁盤和磁帶庫相結(jié)合的數(shù)據(jù)備份方式,防止因意外事故造成數(shù)據(jù)丟失。在用戶下載數(shù)據(jù)方面,實現(xiàn)了用戶身份認證和數(shù)據(jù)訪問目錄權(quán)限控制的系統(tǒng)開發(fā),并通過數(shù)據(jù)文件軟連接(soft link)、授權(quán)賬戶關(guān)聯(lián)以及自動權(quán)限控制的模式實現(xiàn)數(shù)據(jù)的受控共享,既保證了數(shù)據(jù)的安全性,也保障了多用戶同時訪問同一數(shù)據(jù)時的效率。

        2 人類遺傳資源數(shù)據(jù)匯交與共享

        2.1 數(shù)據(jù)匯交原則與方法

        為了有效管理和保護我國人類遺傳資源數(shù)據(jù),促進數(shù)據(jù)有序共享與合理利用,GSA-Human建立了人類遺傳資源數(shù)據(jù)匯交的基本規(guī)范,核心內(nèi)容包括:(1)數(shù)據(jù)遞交者身份認證,只允許以課題研究組長的身份進行數(shù)據(jù)提交,從而確保數(shù)據(jù)的可溯源性;(2)倫理合規(guī)性,即數(shù)據(jù)遞交者應(yīng)已經(jīng)從數(shù)據(jù)集對應(yīng)的研究對象處獲得知情同意書,并符合倫理原則,通過相應(yīng)的倫理審查;(3)隱私保護性,數(shù)據(jù)遞交者提供的信息必須對其研究對象的個人信息進行脫敏處理;(4)政策合法性,數(shù)據(jù)遞交者在對外發(fā)布其數(shù)據(jù)集前,遵循科技部人類遺傳資源信息備案流程獲得數(shù)據(jù)集備份號及備案號;(5)遵守科研誠信與道德,數(shù)據(jù)遞交者對其提交的數(shù)據(jù)質(zhì)量負責。

        按照數(shù)據(jù)的組織模式,GSA-Human的數(shù)據(jù)遞交包含兩部分內(nèi)容:元數(shù)據(jù)遞交和序列文件遞交。元數(shù)據(jù)遞交主要為在線遞交(https://ngdc.cncb.ac.cn/gsa- human/submit/hra/submit),即通過WEB頁面實現(xiàn)信息輸入、勾選、導入或確認;GSA-Human提供可視化及向?qū)Щ牟僮髂J?,?nèi)置多種控制詞匯表,最大限度地規(guī)范信息錄入;此外,系統(tǒng)還提供批量表格在線導入與校驗功能,實現(xiàn)元數(shù)據(jù)信息實時在線質(zhì)控和信息反饋,為科研人員提供簡單、便利、高效的元數(shù)據(jù)信息遞交服務(wù)。在測序序列文件匯交方面,可支持Aspera和 FTP兩種在線數(shù)據(jù)上傳方式。對于一次性上傳數(shù)據(jù)量超過1 TB的數(shù)據(jù)遞交,可以選擇采用郵遞硬盤的模式,由GSA-Human系統(tǒng)審編人員協(xié)助上傳數(shù)據(jù)。

        2.2 數(shù)據(jù)共享模式

        GSA-Human提供公開訪問和受控訪問兩種共享訪問模式。公開訪問即已經(jīng)發(fā)布的數(shù)據(jù)可被任何人瀏覽和下載,用戶對數(shù)據(jù)的使用無須向數(shù)據(jù)遞交者申請;受控訪問即對數(shù)據(jù)使用在一定限制下進行,用戶在下載數(shù)據(jù)之前需要先獲得該數(shù)據(jù)的使用授權(quán)。共享模式的選擇由數(shù)據(jù)遞交者自行設(shè)定,但需要遵守相關(guān)的規(guī)則:尚未獲得人類遺傳資源數(shù)據(jù)備案編號的數(shù)據(jù)集(商用細胞系和古人類數(shù)據(jù)除外,依照相關(guān)規(guī)定此兩類數(shù)據(jù)無須備案備份)不能設(shè)置為公開訪問,已獲得備案編號的數(shù)據(jù)集,可以設(shè)置為公開訪問或受控訪問。GSA-Human支持的受控訪問被稱為“申請–審核制”(圖1),即用戶檢索到所需數(shù)據(jù)集后(https://ngdc.cncb.ac.cn/gsa-human/browse/),通過數(shù)據(jù)申請下載模塊(request)在線提交數(shù)據(jù)應(yīng)用“申請單”,該數(shù)據(jù)的管理委員會(DAC)對“申請單”進行審核,如果審核通過,則賦予數(shù)據(jù)使用權(quán)利,用戶需使用授權(quán)賬號的用戶名和密碼登錄系統(tǒng),并通過FTP工具或命令行完成授權(quán)數(shù)據(jù)下載。GSA- Human的數(shù)據(jù)共享政策遵循了相關(guān)的國際規(guī)范,比如獲得數(shù)據(jù)后不能再分發(fā)、再傳播,數(shù)據(jù)申請者要經(jīng)過審核與認證等[8,9]。GSA-Human的數(shù)據(jù)共享模式有效地保護了人類遺傳資源數(shù)據(jù)的合理、合法、合規(guī)使用,降低了安全風險和隱患。

        圖1 受控訪問數(shù)據(jù)集申請下載流程

        3 GSA-Human運行狀況

        GSA-Human自正式上線運行以來,已接收了來自全球用戶遞交的人類遺傳數(shù)據(jù)集750個,已發(fā)布數(shù)據(jù)集395個,其中受控訪問數(shù)據(jù)集313個,公開訪問數(shù)據(jù)集82個,而受控訪問數(shù)據(jù)集中已獲得備案備份號的僅43個);共合計收錄個體數(shù)(individual) 71,283個,生物學樣本數(shù)(sample)159,747個,實驗數(shù)(experiment) 180,231個,測序反應(yīng)數(shù)(run)216,546個,總數(shù)據(jù)量超過5.27 PB,數(shù)據(jù)日增量統(tǒng)計如圖2所示。GSA-Human已接收來自550個用戶的數(shù)據(jù)下載申請共808份,總數(shù)據(jù)下載量超過300 TB。GSA-Human已支撐數(shù)據(jù)遞交用戶在、、、、等66種國內(nèi)外期刊發(fā)表論文117篇。此外,GSA-Human承擔國家重點研發(fā)計劃與人類遺傳資源相關(guān)的多組學數(shù)據(jù)匯聚與統(tǒng)一管理工作,截至2021年7月,已接收來自國家重點研發(fā)計劃項目的原始測序下機數(shù)據(jù)共計1.57 PB。

        圖2 GSA-Human數(shù)據(jù)增長情況統(tǒng)計圖

        4 結(jié)語與展望

        GSA-Human作為人類遺傳資源組學數(shù)據(jù)匯交、存儲和受控訪問管理系統(tǒng),接受來自全球的科研工作者的數(shù)據(jù)提交和共享請求,為人類遺傳資源數(shù)據(jù)共享與利用提供了良好的平臺。同時,GSA-Human系統(tǒng)承擔國家科技項目數(shù)據(jù)匯聚與管理任務(wù),有力支撐了我國重大科研任務(wù)的科學數(shù)據(jù)管理。

        GSA-Human推行數(shù)據(jù)“申請–審核”制共享模式,采用數(shù)據(jù)管理委員會審批數(shù)據(jù)使用權(quán)限的機制,提升數(shù)據(jù)遞交者對數(shù)據(jù)管理的自主權(quán),在充分保障數(shù)據(jù)權(quán)益的同時激發(fā)了數(shù)據(jù)匯交的積極性,促進了我國人類遺傳資源數(shù)據(jù)的共享與再利用。但隨之而來的問題是大量的數(shù)據(jù)匯交與存儲GSA-Human需求,這對當前系統(tǒng)的性能和數(shù)據(jù)存儲能力,尤其是數(shù)據(jù)長期保存能力提出嚴峻的考驗。因此,未來,GSA-Human將從軟件和硬件兩方面出發(fā),加強自身能力的建設(shè)。針對軟件系統(tǒng)層次,在數(shù)據(jù)匯交和共享方面,將進一步優(yōu)化數(shù)據(jù)提交、審核和申請流程,以及管理和共享機制;在數(shù)據(jù)信息檢索方面,完善檢索機制,逐步實現(xiàn)數(shù)據(jù)特性化檢索;在數(shù)據(jù)自動化處理方面,不斷完善流程和算法,實現(xiàn)智能化數(shù)據(jù)處理。此外,在遵守國內(nèi)外法律法規(guī)和道德規(guī)范的前提下,實現(xiàn)更加安全、快捷、高效的人類遺傳資源數(shù)據(jù)管理和共享。在硬件系統(tǒng)層次,將加強計算機存儲系統(tǒng)和網(wǎng)絡(luò)帶寬資源的建設(shè),優(yōu)化硬件設(shè)施以提升大數(shù)據(jù)傳輸與存儲效率,同時,借鑒區(qū)塊鏈、云計算、流計算等數(shù)據(jù)安全管理的特性和理念,建立人類遺傳資源數(shù)據(jù)共享和使用的新模式。

        [1] Chen TT, Chen X, Zhang SS, Zhu JW, Tang BX, Wang AK, Dong LL, Zhang ZW, Yu CX, Sun YL, Chi LJ, Chen HX, Zhai S, Sun YB, Lan L, Zhang X, Xiao JF, Bao YM, Wang YQ, Zhang Z, Zhao WM. The Genome Sequence Archive family: toward explosive data growth and diverse data types., 2021, doi: 10.1016/j.gpb.2021.08.001.

        [2] Wang YQ, Song FH, Zhu JW, Zhang SS, Yang YD, Chen TT, Tang BX, Dong LL, Ding N, Zhang Q, Bai ZX, Dong XN, Chen HX, Sun MY, Zhai S, Sun YB, Yu L, Lan L, Xiao JF, Fang XD, Lei HX, Zhang Z, Zhao WM. GSA: Genome Sequence Archive., 2017, 15(1): 14–18.

        [3] Zhang SS, Chen TT, Zhu JW, Zhou Q, Chen X, Wang YQ, Zhao WM. GSA: Genome Sequence Archive., 2018, 40(11): 1044–1047.

        張思思, 陳婷婷, 朱軍偉, 周晴, 陳旭, 王彥青, 趙文明. GSA: 組學原始數(shù)據(jù)歸檔庫. 遺傳, 2018, 40(11): 1044– 1047.

        [4] Chen ML, Ma YK, Wu S, Zheng XC, Kang HE, Sang J, Xu XJ, Hao LL, Li ZH, Gong Z, Xiao JF, Zhang Z, Zhao WM, Bao YM. Genome Warehouse: A Public Repository Housing Genome-scale Data., 2021, doi: 10.1016/j.gpb.2021.04.001.

        [5] Li CP, Tian DM, Tang BX, Liu XN, Teng XF, Zhao WM, Zhang Z, Song SH. Genome Variation Map: a worldwide collection of genome variations across multiple species., 2021, 49(D1): D1186–D1191.

        [6] CNCB-NGDC Members and Partners. Database resources of the National Genomics Data Center, China National Center for Bioinformation in 2021., 2021, 49(D1): D18–D28.

        [7] Zou D, Sun SX, Li RJ, Liu J, Zhang J, Zhang Z. MethBank: a database integrating next-generation sequencing single-base-resolution DNA methylation programming data., 2015, 43(D1): D54–D58.

        [8] Tryka KA, Hao LN, Sturcke A, Jin YM, Wang ZY, Ziyabari L, Lee M, Popova N, Sharopova N, Kimura M, Feolo M. NCBI's database of genotypes and phenotypes: dbGaP., 2014, 42(D1): D975–D979.

        [9] Lappalainen I, Almeida-King J, Kumanduri V, Senf A, Spalding JD, Ur-Rehman S, Saunders G, Kandasamy J, Caccamo M, Leinonen R, Vaughan B, Laurent T, Rowland F, Marin-Garcia P, Barker J, Jokinen P, Torres AC, de Argila JR, Llobet OM, Medina I, Puy MS, Alberich M, de la Torre S, Navarro A, Paschall J, Flicek P. The European Genome-phenome Archive of human data consented for biomedical research., 2015, 47(7): 692–695.

        GSA-Human: Genome Sequence Archive for Human

        Sisi Zhang1,2, Xu Chen1,2, Tingting Chen1,2, Junwei Zhu1,2, Bixia Tang1,2, Anke Wang1,2, Lili Dong1,2, Zhewen Zhang1,2, Yanling Sun1,2, Caixia Yu1,2, Shuang Zhai1,2, Yubin Sun1,2, Huanxin Chen1,2, Zhenglin Du1,2,3, Jingfa Xiao1,2,3, Zhang Zhang1,2,3, Yiming Bao1,2,3, Yanqing Wang1,2, Wenming Zhao1,2,3

        The Genome Sequence Archive for Human (GSA-Human) is a data repository specialized for human genetic related data derived from biomedical researches, and also supports the data collection and management of National Key Research and Development Projects. GSA-Human has a data security management strategy according to the national regulations of human genetic resources. It provides two different models of data access: Open-access and Controlled-access. Open-access data are universally and freely accessible for global researchers, while Controlled-access ensures that data are accessed only by authorized users with the permission of the Data Access Committee (DAC). Till July 2021, GSA-Human has housed more than 5.27 PB of data from 750 datasets.

        GSA-Human;omics data; data submission; data sharing

        2021-07-13;

        2021-09-16

        國家重點研發(fā)計劃資助項目(編號:2016YFC0901603,2017YFC0907502,2020YFC0847000),中國科學院戰(zhàn)略性先導科技專項基金資助項目(編號:XDB38050300,XDB38050200),中國科學院關(guān)鍵技術(shù)人才基金資助項目(王彥青),中國科學院“十四五”網(wǎng)絡(luò)安全和信息化項目(編號:WX145XQ07-04)資助[Supported by the National Key R&D Program of China (Nos. 2016YFC0901603, 2017YFC0907502, 2020YFC0847000), the Strategic Priority Research Program of the Chinese Academy of Sciences (Nos. XDB38050300, XDB38050200), the Key Technology Talent Program of the Chinese Academy of Sciences (to Yanqing Wang) and the 14th Five-year Network Security and Informatization Plan of Chinese Academy of Sciences (No. WX145XQ07-04)]

        張思思,博士,工程師,研究方向:基因組學、生物信息學。E-mail: zhangss@big.ac.cn

        陳旭,碩士,工程師,研究方向:生物信息學、計算機科學。E-mail: chenx@big.ac.cn

        陳婷婷,碩士,工程師,研究方向:基因組學、生物信息學。E-mail: chentt@big.ac.cn

        張思思、陳旭和陳婷婷并列第一作者。

        王彥青,碩士,高級工程師,研究方向:生物信息學、計算機科學。E-mail: wangyanqing@big.ac.cn

        趙文明,碩士,正高級工程師,研究方向:生物信息學。E-mail: zhaowm@big.ac.cn

        10.16288/j.yczz.21-248

        2021/9/28 11:11:50

        URI: https://kns.cnki.net/kcms/detail/11.1913.R.20210927.1137.001.html

        (責任編委: 朱波峰)

        猜你喜歡
        數(shù)據(jù)管理遺傳測序
        非遺傳承
        杰 Sir 帶你認識宏基因二代測序(mNGS)
        新民周刊(2022年27期)2022-08-01 07:04:49
        企業(yè)級BOM數(shù)據(jù)管理概要
        定制化汽車制造的數(shù)據(jù)管理分析
        海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實踐
        二代測序協(xié)助診斷AIDS合并馬爾尼菲籃狀菌腦膜炎1例
        傳染病信息(2021年6期)2021-02-12 01:52:58
        CTCS-2級報文數(shù)據(jù)管理需求分析和實現(xiàn)
        還有什么會遺傳?
        還有什么會遺傳
        還有什么會遺傳?
        国产精品激情综合久久| 无码一区二区三区免费视频| 粗壮挺进人妻水蜜桃成熟漫画| 无限看片在线版免费视频大全 | 国产av无码专区亚洲awww| 国产99久久无码精品| 日本中出熟女一区二区| 日韩亚洲无吗av一区二区| 淫秽在线中国国产视频| 婷婷久久精品国产色蜜蜜麻豆| 男女做爰猛烈啪啪吃奶动| 国产91精品成人不卡在线观看| 韩国免费一级a一片在线| 成人大片免费观看视频| 欧美人与动牲交a精品| 国产成人精品三级麻豆 | 无码av在线a∨天堂毛片| 中文字幕一区二区人妻在线不卡| 一区二区三区国产免费视频| 99re8这里有精品热视频免费| 久久亚洲AV成人一二三区| 日本超骚少妇熟妇视频| 99国产精品久久久久久久成人热| 国产美女露脸口爆吞精| 人妻av一区二区三区av免费| 国产av一级二级三级| 亚洲精品无码专区| 亚洲熟妇av乱码在线观看 | 久久国产成人精品国产成人亚洲| 小12箩利洗澡无码视频网站| 好爽~又到高潮了毛片视频| 日韩av天堂一区二区| 真人做爰片免费观看播放| 亚洲欧洲精品成人久久曰影片| 久久99免费精品国产| 色欲av伊人久久大香线蕉影院 | 久久99精品久久久久久久清纯| 免费观看在线视频一区| 免费观看91色国产熟女| 性生交大片免费看淑女出招| 亚洲中文久久久久无码|