亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        腫瘤生物信息學(xué)數(shù)據(jù)庫(kù)

        2015-09-14 12:47:18楊健蔡浩洋
        生物技術(shù)通報(bào) 2015年11期
        關(guān)鍵詞:甲基化基因組癌癥

        楊健 蔡浩洋

        隨著人們生活方式和環(huán)境的改變,惡性腫瘤已經(jīng)成為疾病三大死亡病因之一,占全球每年死亡人數(shù)的15%以上[1]。我國(guó)在人口老齡化進(jìn)程不斷加快的情況下,惡性腫瘤的發(fā)病率及死亡率一直呈上升趨勢(shì),估計(jì)每年新發(fā)腫瘤病例超過(guò)300萬(wàn)例,嚴(yán)重威脅人們的健康和生命。當(dāng)前已知的腫瘤類型接近200種,已發(fā)現(xiàn)的與腫瘤相關(guān)的原癌基因或抑癌基因超過(guò)500個(gè)。世界各國(guó)都投入了大量的人力與經(jīng)費(fèi)用于癌癥的基礎(chǔ)研究與診斷治療,美國(guó)國(guó)立癌癥研究所(National Cancer Institute,NCI)2015年度的研究預(yù)算達(dá)到49.5億美元。近年來(lái),隨著高通量檢測(cè)和分析技術(shù)的發(fā)展與普及,與腫瘤相關(guān)的生物學(xué)數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng),利用數(shù)據(jù)挖掘的方法從海量數(shù)據(jù)中找出驅(qū)動(dòng)基因與突變有助于闡明腫瘤發(fā)生的分子機(jī)制。然而,這些數(shù)據(jù)的管理和分析成為研究人員面臨的一大挑戰(zhàn)。不同的檢測(cè)技術(shù)產(chǎn)生了復(fù)雜的、不同結(jié)構(gòu)的生物學(xué)數(shù)據(jù),這些原始數(shù)據(jù)必須經(jīng)過(guò)標(biāo)準(zhǔn)化、結(jié)構(gòu)化、添加注釋及統(tǒng)計(jì)分析才能成為有價(jià)值的信息。同時(shí),在高通量測(cè)序技術(shù)的價(jià)格不斷降低的情況下,當(dāng)前的研究對(duì)腫瘤樣本的測(cè)序深度越來(lái)越高,對(duì)單個(gè)腫瘤樣本的測(cè)序可以產(chǎn)生超過(guò)150 GB的數(shù)據(jù),這對(duì)海量數(shù)據(jù)的存儲(chǔ)與利用也提出了新的挑戰(zhàn)。因此,生物信息學(xué)數(shù)據(jù)庫(kù)的構(gòu)建成為腫瘤研究的一個(gè)重要方向,也是信息處理的基礎(chǔ),通過(guò)大量腫瘤樣本的數(shù)據(jù)分析可以得到單個(gè)實(shí)驗(yàn)難以獲得的規(guī)律性結(jié)論。利用生物信息技術(shù)收集、存儲(chǔ)、分析并共享與腫瘤相關(guān)的生物學(xué)數(shù)據(jù)正逐漸成為癌癥研究中必不可少的技術(shù)手段,高質(zhì)量的腫瘤數(shù)據(jù)庫(kù)將為研究人員提供便捷的數(shù)據(jù)分析服務(wù)與數(shù)據(jù)共享平臺(tái),為揭示癌癥的發(fā)生發(fā)展機(jī)制奠定基礎(chǔ),如圖1所示。專輯,收錄重要的生物學(xué)數(shù)據(jù)庫(kù)。Bioinformatics 雜志也設(shè)立了數(shù)據(jù)庫(kù)專欄,介紹各種生物信息學(xué)數(shù)據(jù)庫(kù)。另外,“精準(zhǔn)醫(yī)療計(jì)劃”的提出為生物信息學(xué)數(shù)據(jù)庫(kù)的發(fā)展帶來(lái)了新的契機(jī)?!熬珳?zhǔn)醫(yī)療”旨在根據(jù)個(gè)體的差異為每一個(gè)病人制定個(gè)性化的預(yù)防和治療方案,達(dá)到精確用藥的目的。該計(jì)劃的短期目標(biāo)主要與惡性腫瘤相關(guān),根據(jù)腫瘤的基因變異研發(fā)靶向藥物,然后對(duì)病人進(jìn)行臨床基因診斷,按個(gè)體基因變異的情況使用不同的靶向藥物。該項(xiàng)目一方面需要構(gòu)建大量人群的腫瘤變異數(shù)據(jù)庫(kù),另一方面需要開(kāi)發(fā)新的數(shù)據(jù)分析算法進(jìn)行海量數(shù)據(jù)的挖掘與整合。表1 列出了主要的腫瘤生物信息學(xué)數(shù)據(jù)庫(kù)網(wǎng)站。本文將這些數(shù)據(jù)庫(kù)按照研究領(lǐng)域或者數(shù)據(jù)類型進(jìn)行分類并作介紹。

        圖1 利用生物信息學(xué)整合多種類型的數(shù)據(jù)并構(gòu)建數(shù)據(jù)庫(kù)

        1 綜合性腫瘤數(shù)據(jù)庫(kù)

        現(xiàn)今生物學(xué)數(shù)據(jù)庫(kù)因其重要作用已獲得了廣泛的關(guān)注與研究。伴隨著生物信息學(xué)這一交叉學(xué)科的快速發(fā)展,目前已經(jīng)產(chǎn)生了大量的數(shù)據(jù)庫(kù),并在生物學(xué)的各個(gè)研究領(lǐng)域產(chǎn)生了廣泛的影響。例如,國(guó)際上三大核酸與蛋白質(zhì)數(shù)據(jù)庫(kù),包括美國(guó)國(guó)家生物信息中心的GenBank[2]、歐洲生物信息研究所的EMBL[3]以及日本生物信息學(xué)中心的 DDBJ[4],是目前最具有影響力的生物全領(lǐng)域數(shù)據(jù)庫(kù),為研究人員提供了獲取與共享數(shù)據(jù)的平臺(tái),極大地促進(jìn)了包括腫瘤在內(nèi)的相關(guān)領(lǐng)域研究。從1994年開(kāi)始,Nucleic Acids Research 雜志每年都出版一期數(shù)據(jù)庫(kù)

        早期的基因芯片和近年來(lái)廣泛應(yīng)用的二代測(cè)序技術(shù)產(chǎn)生了大量的生物學(xué)數(shù)據(jù),包括DNA拷貝數(shù)變化(Copy number aberration,CNA)、基因突變、表達(dá)譜以及全基因組測(cè)序數(shù)據(jù)。這些數(shù)據(jù)中蘊(yùn)含著潛在的有價(jià)值的生物學(xué)信息,可能幫助人們更加深入地理解癌癥,因此對(duì)海量數(shù)據(jù)的存儲(chǔ)和分析也具有重要意義。目前已有多個(gè)機(jī)構(gòu)致力于這些數(shù)據(jù)的收集、存儲(chǔ)以及分析。在這一部分中,我們將對(duì)幾個(gè)重要的綜合數(shù)據(jù)庫(kù)作簡(jiǎn)要介紹。

        The Cancer Genome Atlas(TCGA,https://tcgadata.nci.nih.gov/tcga)[5]由美國(guó)國(guó)立癌癥研究所和國(guó)家人類基因組研究所(National Human Genome Research Institute,NHGRI)資助,關(guān)注與癌癥的發(fā)生和發(fā)展相關(guān)的分子突變圖譜。根據(jù)癌癥的發(fā)病率,TCGA選取了34種癌癥及其對(duì)應(yīng)的正常組織樣本進(jìn)行比較研究,每種腫瘤都有大量的樣本重復(fù)以進(jìn)行癌癥變異數(shù)據(jù)的深度挖掘。TCGA擁有基因組測(cè)序中心(Genome Sequencing Centers,GSCs)、基因組數(shù)據(jù)分析中心(Genome Data Analysis Centers,GDACs)以及基因組描述中心(Genome Characterization Centers,GCCs)等,能夠?qū)颖具M(jìn)行外顯子組和基因組測(cè)序及分析,提供包括基因組拷貝數(shù)變化、表觀遺傳、基因表達(dá)譜、miRNA等數(shù)據(jù)。TCGA的數(shù)據(jù)訪問(wèn)權(quán)限分為兩種,公開(kāi)的數(shù)據(jù)包括了臨床和人口數(shù)據(jù)、基因表達(dá)數(shù)據(jù)、CNA數(shù)據(jù)、表觀數(shù)據(jù)等,而需要授權(quán)的數(shù)據(jù)主要是一些個(gè)人特有數(shù)據(jù),如原始的測(cè)序數(shù)據(jù)、單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)數(shù)據(jù)以及VCF文件等。現(xiàn)在來(lái)源于TCGA的測(cè)序原始數(shù)據(jù)存儲(chǔ)在癌癥基因組中心(Cancer Genomics Hub,CGHub),而序列分析數(shù)據(jù)則可在TCGA的數(shù)據(jù)中心(TCGA Data Portal)下載。隨著TCGA的數(shù)據(jù)的增長(zhǎng),目前有許多基于TCGA的研究,包括對(duì)癌癥分類的探索[6]、癌癥的突變標(biāo)志物研究[7]、藥物靶點(diǎn)研究[8]等。

        表1 主要的腫瘤生物信息學(xué)數(shù)據(jù)庫(kù)

        European Genome-phenome Archive(EGA,https://ega.crg.eu)[9]收集了多種測(cè)序以及分型數(shù)據(jù),如基因組關(guān)聯(lián)分析、分子診斷以及各種目的的測(cè)序數(shù)據(jù)。目前,該數(shù)據(jù)庫(kù)已收集了超過(guò)800項(xiàng)研究的數(shù)據(jù),數(shù)據(jù)量也達(dá)到了1.7 PB之巨,其中約60%都與腫瘤相關(guān)。這些數(shù)據(jù)的訪問(wèn)受到嚴(yán)格的控制,用戶可通過(guò)瀏覽或搜索找到需要的數(shù)據(jù)項(xiàng),但是下載則需要向指定的數(shù)據(jù)訪問(wèn)控制機(jī)構(gòu)申請(qǐng)。為了方便用戶下載數(shù)據(jù),EGA還開(kāi)發(fā)了基于java的下載工具。

        Cancer Genomics Hub(CGHub,https://cghub.ucsc.edu)[10]收集來(lái)自3個(gè)國(guó)家癌癥協(xié)會(huì)項(xiàng)目的基因組信息:包括癌癥基因圖譜項(xiàng)目(TCGA)、癌癥細(xì)胞系百科全書(shū)(Cancer Cell Line Encyclopedia,CCLE)以及為有效治療進(jìn)行的治療方案研究項(xiàng)目(Therapeutically Applicable Research to Generate Effective Treatments,TARGET)。CGHub 收集了來(lái)自25種不同類型癌癥的測(cè)序數(shù)據(jù),以BAM文件形式存儲(chǔ),目前的數(shù)據(jù)量已經(jīng)超過(guò)2 PB,并且以每周約50 TB的速率增長(zhǎng)。CGHub支持對(duì)癌癥測(cè)序數(shù)據(jù)的瀏覽和受控制的訪問(wèn),對(duì)于來(lái)自于CCLE的數(shù)據(jù)是完全公開(kāi),而另外兩個(gè)項(xiàng)目的數(shù)據(jù)則是需要具有授權(quán)才可以下載。CGHub還提供了一款數(shù)據(jù)下載軟件GeneTorrent,并可在多個(gè)平臺(tái)上使用。GCHub提供的原始數(shù)據(jù)對(duì)于整合和共享癌癥相關(guān)數(shù)據(jù)具有重要作用,對(duì)癌癥基礎(chǔ)研究具有極大的促進(jìn)作用。

        International Cancer Genome Consortium(ICGC,https://icgc.org)[11]是由多個(gè)國(guó)家多個(gè)研究機(jī)構(gòu)組成的癌癥研究團(tuán)體,包含來(lái)自亞洲、澳大利亞、歐洲、北美和南美的88個(gè)研究團(tuán)隊(duì)。其目標(biāo)是獲取包括膽道癌、膀胱癌、血癌等多達(dá)50種腫瘤及其亞型的基因組、轉(zhuǎn)錄組和表觀遺傳的全部信息,并以最快的速度和最少的限制將這些數(shù)據(jù)提供給整個(gè)科研團(tuán)體,促進(jìn)癌癥的機(jī)理和治療研究。到目前為止,ICGC(release 19)提供了12 979個(gè)癌癥基因組的數(shù)據(jù),包含了16 459 160個(gè)簡(jiǎn)單的體細(xì)胞突變,涉及到57 543個(gè)基因。用戶可通過(guò)ICGC的數(shù)據(jù)中心搜索感興趣的數(shù)據(jù),并利用網(wǎng)站提供的工具下載。與TCGA一樣,ICGC的測(cè)序原始數(shù)據(jù)和涉及個(gè)體信息的數(shù)據(jù)如生殖細(xì)胞突變需要得到ICGC的授權(quán)。

        Cancer Genome Anatomy Project(CGAP,http://cgap.nci.nih.gov)[12]是NCI的一個(gè)研究項(xiàng)目,主要收集了正常組織、前癌組織以及癌細(xì)胞的基因表達(dá)水平,以期改善癌癥的檢測(cè)、診斷以及病患治療。CGAP網(wǎng)站主要提供了cDNA克隆、文庫(kù)、基因表達(dá)、SNP以及基因組變異信息,并且提供了一系列的分析工具,可實(shí)現(xiàn)對(duì)一個(gè)或多個(gè)基因、文庫(kù)的搜索,發(fā)掘基因組和基因中的SNP,獲取文庫(kù)中差異表達(dá)的基因,比較兩個(gè)文庫(kù)的差異表達(dá)基因,分析基因參與的通路,并且將這些信息可視化。

        Catalogue Of Somatic Mutations In Cancer(COSMIC,http://cancer.sanger.ac.uk/cosmic)[13]是世界上最大最全面的有關(guān)腫瘤的體細(xì)胞突變以及其影響的資源。主要提供多種腫瘤細(xì)胞基因組中的CNA、甲基化、基因融合、SNP及基因表達(dá)信息等。最新的版本(v74,Aug 2015)中描述了超過(guò)100萬(wàn)個(gè)腫瘤樣本中的2002 811個(gè)點(diǎn)突變,涉及到大部分的人類基因。除此之外,COSMIC中還提供了超過(guò)6×106個(gè)非編碼點(diǎn)突變、10 534個(gè)基因融合、61299個(gè)基因組重排、695 504個(gè)拷貝數(shù)異常、60 119 787個(gè)表達(dá)異常的詳細(xì)信息,并且這些信息在基因組和編碼基因中都進(jìn)行了注釋,進(jìn)而與疾病和變異類型關(guān)聯(lián)起來(lái)。COSMIC給癌癥用戶提供了十分重要而全面的腫瘤基因組變異信息。

        cBioPortal for Cancer Genomics(cBioPortal,http://www.cbioportal.org)[14]是一個(gè)癌癥基因組數(shù)據(jù)探索、可視化及分析平臺(tái),提供CNA、基因突變信息,并根據(jù)數(shù)據(jù)完整程度提供包括mRNA豐度、蛋白豐度以及DNA甲基化水平等信息。目前,該平臺(tái)收集了105個(gè)腫瘤研究中的10 473個(gè)樣本數(shù)據(jù)。用戶可選取特定的樣本,形成數(shù)據(jù)集,并定義一系列感興趣的基因,分析這些基因在樣本中的CNA的出現(xiàn)頻率和基因突變頻率。在結(jié)果中除了匯總信息外,還會(huì)針對(duì)每個(gè)基因給出CNA和突變?cè)跇颖局械姆植肌⑼蛔兾稽c(diǎn)和頻率、共表達(dá)基因以及生存曲線等;而對(duì)于用戶提供的基因列表,還可生成互作網(wǎng)絡(luò)并提供已知的相互作用的藥物。cBioPortal在發(fā)現(xiàn)腫瘤相關(guān)突變、分析基因的生物學(xué)功能以及藥物選擇等方面的研究中具有重要推進(jìn)作用。

        UCSC Cancer Genomics Browser(UCSC癌 癥 基因組瀏覽器,https://genome-cancer.ucsc.edu)[15]保存癌癥基因組及臨床數(shù)據(jù),并提供了數(shù)據(jù)可視化和分析的工具。該平臺(tái)中收集了樣本的多種信息,包括基因表達(dá)水平、CNA、通路信息等。在UCSC的癌癥基因組瀏覽器中,研究人員可以對(duì)一個(gè)或幾個(gè)實(shí)驗(yàn)中的樣本及其關(guān)聯(lián)的臨床信息進(jìn)行研究,可實(shí)現(xiàn)不同樣本以及癌癥類型之間的比較,分析基因組變異與表型之間的相關(guān)性。目前,該平臺(tái)收集了來(lái)自TCGA、CLLE、Connectivity Map以及TARGET的575個(gè)數(shù)據(jù)集,包含了超過(guò)22 700個(gè)樣本的數(shù)據(jù)。

        除了UCSC癌癥基因組瀏覽器外,還有多個(gè)綜合性分析平臺(tái)基于TCGA等數(shù)據(jù)庫(kù)的基因組信息綜合性地分析基因組的變異與臨床數(shù)據(jù)和基因表達(dá)譜的關(guān)聯(lián)性。例如,癌癥基因組工作平臺(tái)(Cancer Genome Work Bench,CGWB,https://cgwb.nci.nih.gov)[16]提供了一系列工具來(lái)挖掘、整合以及可視化TCGA等數(shù)據(jù)庫(kù)中的基因組和臨床數(shù)據(jù),用戶可快速地比較患者臨床信息與基因組的變異及甲基化等;而canEvolve[17]數(shù)據(jù)庫(kù)收集了來(lái)自90個(gè)研究的超過(guò)10 000位病人的數(shù)據(jù),為用戶提供兩種水平的分析數(shù)據(jù):其一是mRNA、miRNA、蛋白的表達(dá)水平、基因組變異、蛋白相互作用數(shù)據(jù);其二是綜合分析數(shù)據(jù),如基因表達(dá)與miRNA表達(dá)、基因表達(dá)與CNA之間的關(guān)聯(lián)、基因富集、網(wǎng)絡(luò)分析及生存分析等。

        2 腫瘤基因組數(shù)據(jù)庫(kù)

        一般而言,腫瘤細(xì)胞的基因組中都存在著大量的變異,主要包括染色體結(jié)構(gòu)的變異、CNA、基因融合以及SNP等。對(duì)腫瘤的基因組變異信息的收集和整理可促進(jìn)研究者對(duì)腫瘤發(fā)生發(fā)展的認(rèn)識(shí)。以下介紹一些收集和整理這類信息的數(shù)據(jù)庫(kù)。

        arrayMap(http://www.arraymap.org)[18]是 由 蘇黎世大學(xué)分子生命科學(xué)研究所構(gòu)建的,提供預(yù)處理過(guò)的腫瘤基因組芯片數(shù)據(jù)以及CNA圖譜。目前,最新版的arrayMAP(Jan 2015)包含了約250種癌癥中獲得的64 000多個(gè)基因組芯片數(shù)據(jù)集。用戶可通過(guò)關(guān)鍵字搜索自己感興趣的樣本或者搜索特定文獻(xiàn)中的樣本,并在此基礎(chǔ)上分析感興趣的基因或基因組片段上的CNA;用戶還可以選擇兩個(gè)樣本來(lái)比較二者的CNA的差異。

        CaSNP(http://cistrome.dfci.harvard.edu/CaSN P/)[19]數(shù)據(jù)庫(kù)收集了來(lái)源于SNP芯片的CNA數(shù)據(jù),并提供查詢服務(wù)。CaSNP從34種腫瘤的104項(xiàng)研究中獲取了約11500張SNP芯片,基于這些芯片整理出了腫瘤基因組中的CNA。用戶可以搜索基因或者感興趣的基因組區(qū)域,CaSNP將返回各項(xiàng)研究中的染色體區(qū)域得失頻率及平均的拷貝數(shù),并提供下載鏈接或在UCSC基因組瀏覽器中可視化。

        CanGEM(http://www.cangem.org/)[20]是一個(gè)公開(kāi)的存儲(chǔ)腫瘤樣本的臨床和芯片數(shù)據(jù)的數(shù)據(jù)庫(kù)。它主要利用arrayCGH芯片來(lái)發(fā)掘基因的拷貝數(shù)變異。用戶可以通過(guò)關(guān)鍵字搜索特定類型的腫瘤樣本或者發(fā)掘特定基因發(fā)生拷貝數(shù)變化的樣本構(gòu)建個(gè)性化的數(shù)據(jù)集情況,然后基于這些樣本計(jì)算變異發(fā)生的頻率。CanGEM還提供原始數(shù)據(jù)下載服務(wù),用戶可以對(duì)感興趣的數(shù)據(jù)集進(jìn)行深入的分析。

        Cancer Genome Project(CGP,http://www.sang er.ac.uk/research/projects/cancergenome)[21]是 The Wellcome Trust Sanger Institute下屬的一個(gè)項(xiàng)目,主要目標(biāo)是利用人類基因組序列和高通量的突變檢測(cè)技術(shù)識(shí)別體細(xì)胞突變,進(jìn)而發(fā)現(xiàn)人類腫瘤發(fā)生過(guò)程中重要的基因。該項(xiàng)目提供了腫瘤中的CNA及基因型信息,同時(shí)也提供了一些識(shí)別突變、CNA的軟件,如BioView、GRAFT等。

        BioMuta(https://hive.biochemistry.gwu.edu/to ols/biomuta/)[22]數(shù)據(jù)庫(kù)存儲(chǔ)了癌癥細(xì)胞中基因的非同義單核苷酸變異,這些突變會(huì)影響基因的正常功能。BioMuta中的數(shù)據(jù)來(lái)源于COSMIC、ClinVar、UniProtKB 以及一些文獻(xiàn)中,最新版本(v2.0)中包含了26種癌癥中的322 922個(gè)SNP。用戶可搜索感興趣的基因,獲得該基因在癌細(xì)胞中的突變位點(diǎn)及其分布頻率。

        3 腫瘤DNA甲基化數(shù)據(jù)庫(kù)

        DNA甲基化修飾是表觀遺傳的一個(gè)重要形式,可調(diào)控基因的轉(zhuǎn)錄水平,對(duì)于維持細(xì)胞正常功能具有重要作用。DNA甲基化模式改變可能導(dǎo)致癌癥的發(fā)生,一些抑癌基因的高甲基化導(dǎo)致基因表達(dá)量降低引起癌癥發(fā)生,也可能導(dǎo)致一些抑癌的miRNA轉(zhuǎn)錄水平下降同樣會(huì)引發(fā)癌癥[23]。目前也有部分?jǐn)?shù)據(jù)庫(kù)收集和整理腫瘤中的甲基化模式,并可與基因的表達(dá)水平比較。以下對(duì)這些數(shù)據(jù)庫(kù)作簡(jiǎn)要介紹。

        MethyCancer(http://methycancer.psych.ac.cn/)[24]數(shù)據(jù)庫(kù)收集了腫瘤中的DNA甲基化、重復(fù)序列、癌癥相關(guān)基因、突變、CpG島以及腫瘤相關(guān)信息。用戶可搜索感興趣的基因或基因組區(qū)域,獲得相關(guān)的甲基化、重復(fù)序列、基因以及CpG島等信息。另外,網(wǎng)站還提供了一個(gè)可視化工具M(jìn)ethyView,可在一個(gè)窗口中查看一個(gè)基因組區(qū)域內(nèi)上述元素的相互關(guān)系。MethyCancer可作為分析人類基因組中IpG島的分布、啟動(dòng)子區(qū)DNA甲基化形式的平臺(tái),能幫助研究人員識(shí)別腫瘤中受DNA甲基化影響的基因,發(fā)掘潛在的表觀遺傳靶點(diǎn)。

        MethHC(http://MethHC.mbc.nctu.edu.tw)[25]系統(tǒng)性地整理了來(lái)自TCGA的腫瘤基因組甲基化、基因表達(dá)、miRNA甲基化、miRNA表達(dá)以及甲基化和基因表達(dá)水平的關(guān)聯(lián)關(guān)系。目前,數(shù)據(jù)庫(kù)收集了18種人類腫瘤的超過(guò)6 000個(gè)樣本、6 548張芯片以及12 567個(gè)RNA測(cè)序數(shù)據(jù)。MethHC提供了基因及其上下游的多個(gè)區(qū)域的甲基化水平、甲基化和基因表達(dá)關(guān)系、基于甲基化位點(diǎn)的癌癥分層聚類以及每種癌癥中高甲基化和低甲基化的前250個(gè)基因列表。

        MENT(http://mgrc.kribb.re.kr:8080/MENT)[26]數(shù)據(jù)庫(kù)收集和整合了來(lái)自Gene Expression Omnibus(GEO)[27]和TCGA的DNA甲基化、基因表達(dá)水平數(shù)據(jù),同時(shí)將DNA甲基化和基因表達(dá)水平關(guān)聯(lián)起來(lái)。MENT提供了友好的界面,用戶可通過(guò)基因搜索或數(shù)據(jù)集搜索來(lái)發(fā)掘差異甲基化?;蛩阉鞣祷啬繕?biāo)基因在哪些條件下發(fā)生差異甲基化,而數(shù)據(jù)集搜索則返回一定條件下所有差異甲基化的基因。兩種搜索都可以通過(guò)設(shè)定方向、差異甲基化值和p值對(duì)結(jié)果進(jìn)行篩選。

        DiseaseMeth(http://bioinfo.hrbmu.edu.cn/diseas emeth)[28]收集和整理了多種人類疾病中的甲基化數(shù)據(jù),包括癌癥、神經(jīng)發(fā)育和退行性疾病、自身免疫疾病等。目前,DiseaseMeth整合了175個(gè)高通量數(shù)據(jù)集的數(shù)據(jù),用戶可以多種方式搜索自己感興趣的內(nèi)容,如gene ID、疾病名稱等,還可以比較疾病與疾病之間、基因與基因之間以及疾病與基因之間的甲基化關(guān)系。除此之外,該數(shù)據(jù)庫(kù)還支持甲基化數(shù)據(jù)下載,研究者可將數(shù)據(jù)整合到自己的研究中。

        除了上述針對(duì)癌癥基因組甲基化的數(shù)據(jù)庫(kù)外,還有一些數(shù)據(jù)庫(kù)搜集和整理更為廣泛的甲基化數(shù)據(jù),如MethDB和NGSmethDB。MethDB(http://www.methdb.de/)[29]是較早的 DNA甲基化數(shù)據(jù)庫(kù),主要集中于環(huán)境因子對(duì)甲基化的影響;而NGSmethDB(http://bioinfo2.ugr.es/NGSmethDB)[30]基于高通量測(cè)序數(shù)據(jù),最近更新中還包含了SNP信息,以便后續(xù)分析。

        4 腫瘤轉(zhuǎn)錄組數(shù)據(jù)庫(kù)

        腫瘤細(xì)胞具有較強(qiáng)的生長(zhǎng)和繁殖能力,生命活動(dòng)旺盛,因此與正常細(xì)胞相比,基因的轉(zhuǎn)錄水平和模式也存在較大的差異。轉(zhuǎn)錄組是特定條件下細(xì)胞內(nèi)全部轉(zhuǎn)錄物的總和,包括多種類型的RNA,而通常我們更關(guān)心的是編碼基因的產(chǎn)物mRNA以及近年來(lái)比較熱門的非編碼RNA,如小RNA(miRNA)及長(zhǎng)非編碼RNA(lncRNA)。我們將針對(duì)一些與腫瘤相關(guān)的轉(zhuǎn)錄組數(shù)據(jù)庫(kù)作介紹。

        Gene Expression Omnibus(GEO,http://www.ncbi.nlm.nih.gov/geo/)[27]是美國(guó)國(guó)家生物技術(shù)中心(NCBI)的一個(gè)子數(shù)據(jù)庫(kù),是一個(gè)免費(fèi)且公開(kāi)的生物數(shù)據(jù)存儲(chǔ)平臺(tái),主要存儲(chǔ)包括基因芯片、第二代測(cè)序以及其它高通量的功能基因組學(xué)數(shù)據(jù)。GEO將提交的原始數(shù)據(jù)分為3個(gè)層次:平臺(tái)、系列和樣本。這些原始數(shù)據(jù)又進(jìn)一步組成不同的數(shù)據(jù)集,并在GEO生成基因表達(dá)譜。用戶可通過(guò)搜索獲得感興趣的數(shù)據(jù)集,利用GEO提供的t檢驗(yàn)或聚類發(fā)掘感興趣的基因及其表達(dá)譜,還可進(jìn)一步搜索與之表達(dá)譜相似的基因。GEO的原始數(shù)據(jù)符合MIAME(Mini-mum information about a microarray experiment)數(shù)據(jù)標(biāo)準(zhǔn)(http://www.ncbi.nlm.nih.gov/geo/info/MIAME.html),提供了包括原始數(shù)據(jù)、處理后數(shù)據(jù)、樣本信息、實(shí)驗(yàn)設(shè)計(jì)方案、芯片注釋信息以及實(shí)驗(yàn)和數(shù)據(jù)處理流程等信息。GEO還支持?jǐn)?shù)據(jù)下載,用戶可將感興趣的樣本或數(shù)據(jù)集下載下來(lái),用于自己的研究。

        ArrayExpress(https://www.ebi.ac.uk/arrayexpr ess/)[31]是歐洲生物信息協(xié)會(huì)(EMBL-EBI)下屬的功能基因組數(shù)據(jù)庫(kù),收集整理基于芯片和測(cè)序的基因組數(shù)據(jù)。其數(shù)據(jù)一部分是直接提交到ArrayExpress,另一部分是從GEO導(dǎo)入的,目前收集了7 000個(gè)測(cè)序研究以及42000個(gè)基于芯片的研究中的超過(guò)1.5×106個(gè)樣本數(shù)據(jù)。ArrayExpress的數(shù)據(jù)格式符合MIAME和Minimum Information about Sequencing Experiment(MINSEQE,http://www.fged.org/projects/minseqe/)標(biāo)準(zhǔn),包含了詳細(xì)的樣本和實(shí)驗(yàn)信息,用戶可通過(guò)關(guān)鍵字搜索感興趣的樣本。網(wǎng)站還提供了統(tǒng)一的數(shù)據(jù)提交工具Annotare,方便用戶提交數(shù)據(jù)。

        Oncomine(https://www.oncomine.org/)[32]致 力于收集、標(biāo)準(zhǔn)化并分析腫瘤樣本的基因表達(dá)譜芯片數(shù)據(jù),為生物醫(yī)藥領(lǐng)域的研究者提供腫瘤轉(zhuǎn)錄組數(shù)據(jù)。目前,Oncomine已經(jīng)收集了來(lái)自715個(gè)數(shù)據(jù)集的86 733個(gè)樣本,用于識(shí)別腫瘤基因組中失調(diào)的基因、通路和調(diào)控網(wǎng)絡(luò)。Oncomine可提供基因在腫瘤樣本和正常樣本間、腫瘤樣本和腫瘤樣本間、正常樣本和正常樣本間的差異表達(dá)、基因表達(dá)譜、共表達(dá)基因等信息。用戶可選擇一組樣本,如腫瘤類型、賴藥性、組織類型等,獲得顯著高表達(dá)和低表達(dá)的基因,同時(shí)可聯(lián)合不同樣本,分析共同顯著差異的基因,幫助用戶從大量的差異表達(dá)基因中挑選在多樣本中都顯著差異的基因。對(duì)于獲得的一系列感興趣基因,用戶還可進(jìn)行篩選,作富集分析,并可視化受影響的通路等。需要注意的是,Oncomine是一個(gè)面向非盈利團(tuán)體的受密碼保護(hù)的數(shù)據(jù)分析平臺(tái),因此用戶需要注冊(cè)才可使用其服務(wù)。

        OncomiRDB(http://bioinfo.au.tsinghua.edu.cn/member/jgu/oncomirdb/)[33]的目標(biāo)是收集和注釋通過(guò)實(shí)驗(yàn)驗(yàn)證的對(duì)癌癥具有促進(jìn)或抑制作用的miRNA。該數(shù)據(jù)庫(kù)中的miRNA至少符合以下一條:調(diào)控至少一種與腫瘤相關(guān)的表型或細(xì)胞過(guò)程,如增殖、凋亡、遷移、侵襲、衰老和細(xì)胞周期調(diào)節(jié);或者有實(shí)驗(yàn)證據(jù)證明直接調(diào)控至少一個(gè)原癌基因或抑癌基因。該數(shù)據(jù)庫(kù)的所有數(shù)據(jù)是通過(guò)人工收集和整理,目前包含2259條調(diào)控關(guān)系,涉及到328個(gè)miRNA以及829個(gè)靶基因。用戶可直接搜索某種miRNA,也可以通過(guò)模糊搜索得到miRNA以及靶基因列表,還可以限定組織、腫瘤類型、以及miRNA功能分類,獲得特定細(xì)胞類型中的特定類型的miRNA及其靶基因,結(jié)果可以以列表和圖形方式給出。用戶還可直接下載OncomiRDB中提供的全部調(diào)控關(guān)系,這些高可信度的miRNA-靶基因關(guān)系是miRNA功能研究的重要資源。

        miRCancer(http://mircancer.ecu.edu/)[34]提 供了較為全面的miRNA集合以及它們?cè)诙喾N腫瘤中的表達(dá)情況。miRCancer中的數(shù)據(jù)獲取過(guò)程如下:首先利用文本挖掘方式從PubMed中搜索與miRNA相關(guān)的文章,并獲取miRNA的表達(dá)情況,再人工驗(yàn)證,以提高數(shù)據(jù)的準(zhǔn)確度。目前,數(shù)據(jù)庫(kù)中已經(jīng)搜集了44 000余種miRNA,包括176種腫瘤中的3 700多個(gè)腫瘤相關(guān)的miRNA。用戶可直接搜索某種miRNA,結(jié)果頁(yè)面將給出其在不同腫瘤樣本中的表達(dá)情況,以及相關(guān)文獻(xiàn);也可以限定miRNA和腫瘤類型,結(jié)果頁(yè)只列出該腫瘤中的相關(guān)研究。另外,數(shù)據(jù)庫(kù)還提供了兩種分析工具,可對(duì)不同物種或腫瘤中的miRNA進(jìn)行聚類分析或卡方檢驗(yàn)。

        SomamiR(http://compbio.uthsc.edu/SomamiR/)[35]數(shù)據(jù)庫(kù)主要收集miRNA及其靶序列上的突變,miRNA上的突變會(huì)改變其識(shí)別的靶序列,而靶序列上的突變則可能導(dǎo)致miRNA結(jié)合能力減弱甚至不能結(jié)合。SomamiR數(shù)據(jù)庫(kù)提供了miRNA序列上的體細(xì)胞突變、利用CLASH、PAR-CLIP、HITSCLIP實(shí)驗(yàn)獲得的靶序列中的體細(xì)胞突變、預(yù)測(cè)的靶序列中的體細(xì)胞突變等。另外,數(shù)據(jù)庫(kù)還提供了存在miRNA靶序列體細(xì)胞突變且腫瘤相關(guān)的基因及其參與的通路,受影響的通路可在KEGG通路中展示。數(shù)據(jù)庫(kù)中的所有內(nèi)容都可以免費(fèi)下載。

        ChiTaRS(http://chitars.bioinfo.cnio.es/)[36]數(shù) 據(jù)庫(kù)記錄了來(lái)自人類、小鼠、果蠅等8個(gè)物種中的嵌合轉(zhuǎn)錄本,同時(shí)收集了1400個(gè)人類癌癥基因組序列斷點(diǎn)以及與之對(duì)應(yīng)的嵌合轉(zhuǎn)錄本的表達(dá)水平數(shù)據(jù)。用戶可搜索某種疾病中染色體上的斷點(diǎn)及涉及的基因,也可提供一段DNA序列檢查是否存在斷點(diǎn),還可以比較不同物種中的斷點(diǎn)。這些斷點(diǎn)信息以及在各物種中的比較可幫助我們理解嵌合轉(zhuǎn)錄本的進(jìn)化以及其在腫瘤發(fā)展中的作用。

        5 腫瘤蛋白組數(shù)據(jù)庫(kù)

        蛋白是生命活動(dòng)的主要承擔(dān)者,細(xì)胞的各項(xiàng)生命活動(dòng)都與蛋白有著密切的聯(lián)系,因此細(xì)胞內(nèi)蛋白的種類、數(shù)目和形式對(duì)細(xì)胞功能起著重要的作用。蛋白結(jié)構(gòu)變異、蛋白修飾的改變以及蛋白含量的變化等導(dǎo)致細(xì)胞的生長(zhǎng)和代謝變化是腫瘤發(fā)生的重要因素。對(duì)于腫瘤細(xì)胞中蛋白的種類、含量以及修飾的記錄對(duì)于解析腫瘤的表型具有重要的價(jià)值。我們將介紹一些與腫瘤細(xì)胞中蛋白組相關(guān)的數(shù)據(jù)庫(kù)。

        Clinical Proteomic Tumor Analysis Consortium(CPTAC,http://proteomics.cancer.gov/programs/cptacnetwork)[37]是由NCI啟動(dòng)的一項(xiàng)旨在識(shí)別和描述腫瘤組織和正常組織中的全部蛋白,整合基因組和蛋白組的數(shù)據(jù),發(fā)掘可作為腫瘤生物標(biāo)記的候選蛋白并排序,最終在一組相關(guān)樣本中驗(yàn)證。CPTAC由蛋白組特征研究中心(PCCs)、數(shù)據(jù)整合中心以及資源中心組成。PCCs通過(guò)質(zhì)譜測(cè)定腫瘤組織中的蛋白類型、含量、蛋白修飾等,數(shù)據(jù)整合中心負(fù)責(zé)將PCCs的數(shù)據(jù)整理并公開(kāi),資源中心負(fù)責(zé)整理和發(fā)放樣品以及實(shí)驗(yàn)的參考材料等。目前,CPTAC已發(fā)表近20項(xiàng)蛋白組研究,主要是直結(jié)腸癌、卵巢癌和乳癌中的蛋白組研究以及一些對(duì)于實(shí)驗(yàn)條件和技術(shù)的測(cè)試性研究。目前CPTAC提供的數(shù)據(jù)還較少,還處于起步階段,但是與TCGA這類大型的基因組研究項(xiàng)目類似,未來(lái)CPTAC可能成為蛋白組研究的重要資源,可提供高質(zhì)量的癌癥蛋白組數(shù)據(jù)。

        dbDEPC(http://lifecenter.sgst.cn/dbdepc/)[38]是一個(gè)專門收集腫瘤樣本中出現(xiàn)的差異表達(dá)蛋白的數(shù)據(jù)庫(kù)。最新版本(v2.0)收集了來(lái)自241篇文獻(xiàn)的331項(xiàng)質(zhì)譜數(shù)據(jù),在20種腫瘤中發(fā)現(xiàn)了4 029個(gè)差異表達(dá)蛋白。用戶可通過(guò)關(guān)鍵字或蛋白序列搜索特定蛋白,獲得該蛋白發(fā)生差異表達(dá)的樣本及其表達(dá)譜;也可以瀏覽特定樣本或特定質(zhì)譜數(shù)據(jù)中差異表達(dá)的蛋白。

        Cancer Proteome Variation Database(CanProVar,http://bioinfo.vanderbilt.edu/canprovar/)[39]是 一 個(gè) 存儲(chǔ)人類蛋白組中的體細(xì)胞和生殖細(xì)胞發(fā)生的單個(gè)氨基酸突變,特別是那些與腫瘤發(fā)生和發(fā)展有關(guān)系的氨基酸突變。CanProVar中的數(shù)據(jù)主要來(lái)源于TCGA、COSMIC、OMIM、HPI等數(shù)據(jù)庫(kù)以及一些研究文獻(xiàn)。目前,該數(shù)據(jù)庫(kù)包含了11445個(gè)與腫瘤相關(guān)的蛋白突變位點(diǎn)以及超過(guò)40 000個(gè)與癌癥無(wú)關(guān)的蛋白突變位點(diǎn)。用戶可在網(wǎng)站中搜索特定蛋白或者某種腫瘤,獲取蛋白的突變情況,在結(jié)果頁(yè)面會(huì)給出蛋白的基本信息、GO注釋以及相關(guān)的研究文獻(xiàn)。

        CancerPPD(http://crdd.osdd.net/raghava/cancerppd/)[40]收集了通過(guò)實(shí)驗(yàn)驗(yàn)證的具有抗腫瘤作用的肽段(ACP)和蛋白,這些數(shù)據(jù)來(lái)源于公開(kāi)發(fā)表的文獻(xiàn)、專利和其他的數(shù)據(jù)庫(kù)。目前,CancerPPD包含了3 491個(gè)ACP以及121個(gè)抗腫瘤的蛋白。對(duì)于每一個(gè)條目,該數(shù)據(jù)庫(kù)都提供了全面的注釋信息,包括來(lái)源、肽段的特性、抗癌活性、羧基端和氨基端修飾、構(gòu)象以及肽段的四級(jí)結(jié)構(gòu)等。用戶可搜索和瀏覽蛋白、ACP,查看與之相關(guān)的注釋信息。除此之外,網(wǎng)站提供了多種比對(duì)工具,用戶可通過(guò)比對(duì)來(lái)搜索序列或結(jié)構(gòu)相似的肽段。

        Cancer3D(http://cancer3d.org/)[41]數(shù) 據(jù) 庫(kù) 整合了來(lái)自TCGA和CCLE的體細(xì)胞錯(cuò)義突變信息,在蛋白結(jié)構(gòu)水平上分析其對(duì)蛋白功能的影響。該數(shù)據(jù)庫(kù)為每個(gè)蛋白提供了兩個(gè)不同的分析工具:e-Driver和e-Drug。E-Driver可展示突變?cè)诘鞍字械奈恢?、存在的結(jié)構(gòu)域、與之相互作用的蛋白,并提供蛋白結(jié)構(gòu)的3D視圖,幫助用戶判斷突變對(duì)蛋白功能的潛在影響;e-Drug可提供蛋白突變對(duì)藥物活性的影響,可查看不同結(jié)構(gòu)域上的突變對(duì)藥物活性的影響,可幫助用戶發(fā)掘出蛋白中可能的藥物靶點(diǎn)結(jié)構(gòu)域。Cancer3D提供的這兩項(xiàng)服務(wù)可幫助研究者評(píng)估突變對(duì)蛋白功能以及藥物效果的影響,理解腫瘤突變和賴藥性的關(guān)系,具有重要的應(yīng)用價(jià)值。

        6 癌基因數(shù)據(jù)庫(kù)

        腫瘤相關(guān)基因包括原癌基因和抑癌基因,大部分都與細(xì)胞的生長(zhǎng)、增殖、遷移、侵襲、衰老、凋亡以及細(xì)胞周期有關(guān)。隨著研究的深入,已經(jīng)發(fā)現(xiàn)許多與腫瘤相關(guān)的基因。對(duì)于已知腫瘤相關(guān)基因的收集、整理并共享可幫助研究者快速獲得大量的腫瘤相關(guān)基因的信息,減少研究者的時(shí)間成本。以下對(duì)一些腫瘤相關(guān)基因的數(shù)據(jù)庫(kù)作簡(jiǎn)單介紹。

        DriverDB(http://driverdb.ym.edu.tw/Driver DB/)[42]收集了來(lái)自 TCGA、ICGC、TARGET 等數(shù)據(jù)庫(kù)的總共6 000多個(gè)外顯子組測(cè)序數(shù)據(jù),并利用dbSNP、COSMIC等注釋信息和生物信息學(xué)方法識(shí)別腫瘤驅(qū)動(dòng)基因。用戶可通過(guò)“Cancer”頁(yè)面選取特定的腫瘤類型,得到該腫瘤中的驅(qū)動(dòng)基因列表,并可獲得它們的基因本體信息(GO)、參與的通路以及基因間的互作關(guān)系等。而通過(guò)“Gene”頁(yè)面可搜索感興趣的基因,查看該基因不同區(qū)域在不同腫瘤中的突變頻度。另外,網(wǎng)站還提供元分析(Meta-Analysis),用戶可選取一組樣本做個(gè)性化分析。

        Network of Cancer Genes(NCG,http://bio.ifomieo-campus.it/ncg)[43]收集和整理了多種腫瘤中的已知和候選的腫瘤相關(guān)基因。候選基因數(shù)據(jù)主要來(lái)源于基因組測(cè)序、外顯子測(cè)序以及基因篩選實(shí)驗(yàn)(gene panel screening)。最新版(v5.0)中包含了518個(gè)已知的腫瘤相關(guān)基因及1053個(gè)候選基因,覆蓋了49種腫瘤,同時(shí)提供了miRNA與基因之間的調(diào)控關(guān)系。用戶可瀏覽或搜索一個(gè)或多個(gè)基因,獲得與該基因相關(guān)的功能和疾病注釋信息、突變信息、表達(dá)譜、miRNA及蛋白互作關(guān)系等,還可以可視化miRNA調(diào)控關(guān)系和蛋白互作網(wǎng)絡(luò),用戶可保存獲得的結(jié)果。除此之外,用戶還可下載全部腫瘤相關(guān)基因。

        TP53MULTLoad(http://p53.fr)[44]是 一 個(gè) 人工收集的有關(guān)TP53基因突變的網(wǎng)站,包含了UMD TP53(http://www.umd.be:2072/)[45]數(shù) 據(jù) 庫(kù) 以 及與TP53有關(guān)的信息。用戶可利用該網(wǎng)站獲取到p53蛋白的所有點(diǎn)突變的相關(guān)信息,如生化活性等。同時(shí),該網(wǎng)站還提供有關(guān)TP53的分析工具,如TP53 Mut Assessor,允許用戶在個(gè)人電腦上獲取p53各種突變多方面的信息。

        7 腫瘤與藥物數(shù)據(jù)庫(kù)

        腫瘤細(xì)胞的耐藥性是臨床腫瘤治療失敗的主要原因之一,因此尋找耐藥靶點(diǎn)成為腫瘤藥物開(kāi)發(fā)領(lǐng)域的熱點(diǎn)之一。除了耐藥性,腫瘤細(xì)胞對(duì)藥物的敏感性、藥物的副作用、腫瘤細(xì)胞的潛在藥物靶點(diǎn)開(kāi)發(fā)等也是腫瘤藥物的重要研究方向,且依賴于醫(yī)療臨床大數(shù)據(jù)的采集和分析。數(shù)據(jù)庫(kù)的構(gòu)建使得結(jié)構(gòu)化的數(shù)據(jù)便于進(jìn)行統(tǒng)計(jì)分析,從而研究治療方案及療效評(píng)價(jià)、藥物副反應(yīng)情況、腫瘤病人的治療現(xiàn)狀等,有助于深度挖掘腫瘤細(xì)胞與藥物之間的關(guān)聯(lián),為精準(zhǔn)醫(yī)療提供參考依據(jù),促進(jìn)腫瘤新藥研發(fā)。

        Genomics of Drug Sensitivity in Cancer(GDSC,www.cancerRxgene.org)[46]由英國(guó)桑格研究院(Sanger Institute)開(kāi)發(fā),收集腫瘤細(xì)胞對(duì)藥物的敏感度和反應(yīng)。癌基因組的變異會(huì)影響臨床治療的效果,不同的靶點(diǎn)對(duì)藥物的反應(yīng)也有很大不同。因此這類數(shù)據(jù)對(duì)于發(fā)現(xiàn)潛在的腫瘤治療靶點(diǎn)十分重要。GDSC的數(shù)據(jù)來(lái)自75 000個(gè)實(shí)驗(yàn),描述了約200個(gè)抗癌藥物在1000多種腫瘤細(xì)胞中的反應(yīng)。該數(shù)據(jù)庫(kù)中的癌基因組突變信息來(lái)自COSMIC數(shù)據(jù)庫(kù),包括癌基因點(diǎn)突變、基因擴(kuò)增與丟失、組織類型以及表達(dá)譜等。用戶可以從化合物、癌基因和細(xì)胞系3個(gè)層面對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索,癌基因或細(xì)胞系對(duì)不同藥物的反應(yīng)會(huì)被詳細(xì)列出,并且結(jié)果會(huì)以圖形化的界面加以展示,包括統(tǒng)計(jì)分析,火山圖及相關(guān)文獻(xiàn)等。檢索結(jié)果以及整個(gè)數(shù)據(jù)庫(kù)都可由用戶下載以進(jìn)行后續(xù)分析。

        canSAR(http://cansar.icr.ac.uk)[47]是 由 英 國(guó)癌癥研究院(The Institute of Cancer Research)開(kāi)發(fā),致力于幫助藥物開(kāi)發(fā)與腫瘤轉(zhuǎn)化醫(yī)學(xué)研究。該數(shù)據(jù)庫(kù)包含了多種類型的數(shù)據(jù),包括生物學(xué)、藥理學(xué)、化學(xué)、結(jié)構(gòu)生物學(xué)和蛋白質(zhì)相互作用網(wǎng)絡(luò)。這些不同類型的數(shù)據(jù)被整合起來(lái)以解決復(fù)雜的生物學(xué)問(wèn)題,例如某個(gè)蛋白在不同腫瘤類型中的表達(dá)情況或突變情況,哪些化合物可以影響某類腫瘤細(xì)胞系的生長(zhǎng),某類藥物會(huì)結(jié)合哪些蛋白并影響其生物學(xué)活性等。用戶可以通過(guò)基因、蛋白、蛋白家族、蛋白3D結(jié)構(gòu)、細(xì)胞系及藥物來(lái)瀏覽或查詢整個(gè)數(shù)據(jù)庫(kù),結(jié)果以詳細(xì)列表的形式展示,并鏈接到相關(guān)信息資源。目前canSAR包含2萬(wàn)多個(gè)蛋白,約1.2萬(wàn)種細(xì)胞系,100萬(wàn)個(gè)化合物結(jié)構(gòu),整合了ArrayExpress、UniProt、COSMIC等11種數(shù)據(jù)源的數(shù)據(jù)。

        CancerResource(http://bioinformatics.charite.de/cancerresource)[48]致力于收集與腫瘤相關(guān)的化合物與靶標(biāo)之間的聯(lián)系,由柏林夏洛特醫(yī)科大學(xué)開(kāi)發(fā)。眾多的生物學(xué)和醫(yī)學(xué)實(shí)驗(yàn)發(fā)現(xiàn)了多種化合物可以用于激活或者抑制與腫瘤相關(guān)的癌基因,這些化合物可能成為潛在的藥物靶點(diǎn)。然而這些信息都存在于大量的文獻(xiàn)中,需要用文獻(xiàn)挖掘的方法提取有用的信息。CancerResource通過(guò)文獻(xiàn)挖掘以及整合多種數(shù)據(jù)源的方式收集并發(fā)現(xiàn)了大量化合物及其靶點(diǎn)的信息。用戶可以選擇多種檢索數(shù)據(jù)庫(kù)的方式,包括搜索化合物、靶標(biāo)、細(xì)胞系、突變、信號(hào)通路等。結(jié)果頁(yè)面包含化合物與靶標(biāo)的詳細(xì)信息、表達(dá)圖譜及相關(guān)數(shù)據(jù)來(lái)源鏈接等。該數(shù)據(jù)庫(kù)收錄了近50 000個(gè)化合物,3 000多個(gè)與腫瘤相關(guān)的蛋白,2000多個(gè)細(xì)胞系以及約9×105條突變信息。由于整合了多種數(shù)據(jù)源,CancerResource提供的數(shù)據(jù)資源非常全面,將有助于精準(zhǔn)醫(yī)藥的開(kāi)發(fā)與研究。

        CancerDR(http://crdd.osdd.net/raghava/cancerdr)[49]是另一個(gè)有助于精準(zhǔn)醫(yī)療的數(shù)據(jù)庫(kù),由印度CSIR微生物技術(shù)研究所開(kāi)發(fā)維護(hù)。耐藥性是腫瘤治療的一大障礙,藥物靶點(diǎn)的突變是腫瘤產(chǎn)生耐藥性的重要原因之一。CancerDR收集了148種抗癌藥物以及它們?cè)?52種細(xì)胞系中的藥理狀況,對(duì)于每一個(gè)藥物靶點(diǎn)提供了序列的天然變體、突變體、三維結(jié)構(gòu)和序列突變信息。其界面允許用戶通過(guò)藥物靶點(diǎn)、細(xì)胞系、藥物名稱和三維結(jié)構(gòu)來(lái)檢索或者瀏覽數(shù)據(jù)庫(kù),檢索結(jié)果將以列表的形式展現(xiàn)。同時(shí),作者還開(kāi)發(fā)了一些在線分析工具,例如突變序列比對(duì)和聚類分析等。該數(shù)據(jù)庫(kù)有助于發(fā)現(xiàn)新的藥物靶點(diǎn)突變,并識(shí)別能殺死多種癌細(xì)胞的藥物分子,從而促進(jìn)腫瘤耐藥性的治療。

        另一個(gè)更廣泛收集耐藥性信息的數(shù)據(jù)庫(kù)是由劍橋大學(xué)開(kāi)發(fā)的Platinum(http://structure.bioc.cam.ac.uk/platinum)[50]。該數(shù)據(jù)庫(kù)不局限于腫瘤數(shù)據(jù),包含超過(guò)1000種蛋白配體復(fù)合物的三維結(jié)構(gòu)突變,以及這些突變對(duì)其親和力的影響。這些數(shù)據(jù)由人工從180多篇相關(guān)文獻(xiàn)中提取得到,共有200多個(gè)復(fù)合物。Platinum的用戶搜索界面包括多種限制條件,能使用戶快速精確地從數(shù)據(jù)庫(kù)中檢索出需要的信息。該數(shù)據(jù)庫(kù)將蛋白質(zhì)結(jié)構(gòu)突變與配體的親和力關(guān)聯(lián)起來(lái),有助于研究由突變引起的疾病耐藥性。

        8 問(wèn)題與展望

        腫瘤生物信息學(xué)數(shù)據(jù)庫(kù)發(fā)展迅速,但同時(shí)也存在一些問(wèn)題與挑戰(zhàn)。例如,與腫瘤相關(guān)的數(shù)據(jù)積累越來(lái)越快,單個(gè)研究課題就可能產(chǎn)生10 TB以上的原始數(shù)據(jù),分析處理這些數(shù)據(jù)將耗費(fèi)巨大的計(jì)算資源,如果要進(jìn)行大規(guī)模數(shù)據(jù)分析所需要的資源將是難以承受的,如何將這些海量數(shù)據(jù)有效地存儲(chǔ)起來(lái),并以適當(dāng)?shù)母袷教峁┙o研究人員成為急需解決的問(wèn)題。在數(shù)據(jù)迅速積累的情況下保持?jǐn)?shù)據(jù)庫(kù)的及時(shí)更新與升級(jí)也是非常重要的問(wèn)題。另外,由于組學(xué)數(shù)據(jù)格式并不統(tǒng)一,現(xiàn)有的數(shù)據(jù)庫(kù)大多只針對(duì)某一種組學(xué)數(shù)據(jù)或某一類特定的數(shù)據(jù)類型,整合多種數(shù)據(jù)類型可以促進(jìn)尋找腫瘤驅(qū)動(dòng)基因及治療靶點(diǎn),如何將獨(dú)立的、分散的數(shù)據(jù)庫(kù)中的信息整合到一起并開(kāi)發(fā)新的數(shù)據(jù)整合算法,形成標(biāo)準(zhǔn)化、全方面的腫瘤信息數(shù)據(jù)庫(kù)是目前該研究領(lǐng)域的新挑戰(zhàn)。最后,目前廣泛應(yīng)用的腫瘤數(shù)據(jù)庫(kù)主要集中在歐美等國(guó),而我國(guó)有一些高發(fā)腫瘤類型在西方國(guó)家并不高發(fā),如鼻咽癌和食管癌,因此這兩類腫瘤的相關(guān)數(shù)據(jù)相對(duì)較少,研究也不多;反之,在西方國(guó)家高發(fā)的黑色素瘤在我國(guó)發(fā)病率極低。此外,由于人種的差異,同一種腫瘤在不同人種中的易感位點(diǎn)和基因突變頻率也不盡相同。因此需要開(kāi)發(fā)一些針對(duì)我國(guó)特有高發(fā)腫瘤類型或者針對(duì)亞洲人群的數(shù)據(jù)庫(kù),為我國(guó)的腫瘤研究提供高質(zhì)量的數(shù)據(jù)服務(wù)與對(duì)比分析,同時(shí)完善全球腫瘤研究的數(shù)據(jù)資源。

        目前,國(guó)內(nèi)癌癥研究相關(guān)數(shù)據(jù)庫(kù)主要涉及到癌癥病例的收集和整理的腫瘤登記數(shù)據(jù)庫(kù)以及針對(duì)miRNA、甲基化等熱門領(lǐng)域的數(shù)據(jù)庫(kù)。前者根據(jù)癌癥病例數(shù)據(jù)的特點(diǎn)設(shè)計(jì)適宜的數(shù)據(jù)庫(kù)結(jié)構(gòu),提高病例信息的管理水平,是循證醫(yī)學(xué)十分重要的資源。目前,已有針對(duì)乳腺癌[51]、原發(fā)骨腫瘤[52]、腦腫瘤[53]等癌癥的數(shù)據(jù)庫(kù),收集和整理了不同癌癥患者的病例信息。而miRNA、甲基化是目前生物學(xué)研究的前沿和熱門領(lǐng)域,也是國(guó)內(nèi)癌癥研究的重要方向。除了前述的 MethyCancer[24]、DiseaseMeth[28]及OncomiRDB[33]等數(shù)據(jù)庫(kù)外,還有多個(gè)數(shù)據(jù)庫(kù)也是針對(duì)這些熱門領(lǐng)域的。dbDEMC[54]和 nc2Cancer[55]都是人類癌癥相關(guān)的非編碼RNA數(shù)據(jù)庫(kù),分別記錄了非編碼RNA的表達(dá)譜及其與腫瘤的關(guān)系;而李孟嬌等[56]構(gòu)建的有關(guān)喉癌的數(shù)據(jù)庫(kù)則整理與喉癌相關(guān)的基因、蛋白以及miRNA甲基化和表達(dá)數(shù)據(jù)。這些數(shù)據(jù)庫(kù)的構(gòu)建為國(guó)內(nèi)的癌癥研究積累了重要的具有地域特色的癌癥基礎(chǔ)數(shù)據(jù),為針對(duì)本國(guó)的腫瘤研究奠定了一定的基礎(chǔ)。值得注意的是,我國(guó)腫瘤病例登記目前還處在初級(jí)階段,信息分散且數(shù)據(jù)量比較有限,需要更多的努力來(lái)整合并擴(kuò)大覆蓋面;而針對(duì)熱門領(lǐng)域的數(shù)據(jù)庫(kù)要注重?cái)?shù)據(jù)庫(kù)的維持和更新,保持?jǐn)?shù)據(jù)庫(kù)的時(shí)效性,進(jìn)一步提高數(shù)據(jù)的科研和應(yīng)用價(jià)值。

        雖然存在問(wèn)題與挑戰(zhàn),腫瘤生物信息學(xué)數(shù)據(jù)庫(kù)已經(jīng)為腫瘤研究做出了巨大的貢獻(xiàn)。癌癥研究領(lǐng)域豐富的實(shí)驗(yàn)數(shù)據(jù)促進(jìn)了一大批腫瘤生物信息學(xué)數(shù)據(jù)庫(kù)的出現(xiàn),這些數(shù)據(jù)庫(kù)所提供的在線數(shù)據(jù)分析功能與下載平臺(tái)又大大地促進(jìn)了我們對(duì)腫瘤發(fā)生發(fā)展機(jī)制的認(rèn)識(shí)。隨著生物學(xué)大數(shù)據(jù)時(shí)代的到來(lái),利用生物信息學(xué)進(jìn)行數(shù)據(jù)分析與詮釋已經(jīng)成為實(shí)驗(yàn)研究不可或缺的手段與資源。隨著日新月異的技術(shù)革新與精準(zhǔn)醫(yī)療項(xiàng)目的開(kāi)展,必定會(huì)出現(xiàn)更多的腫瘤數(shù)據(jù)庫(kù),并最終從根本上改變癌癥的診斷和治療方式。

        [1]Stratton MR, Campbell PJ, Futreal PA. The cancer genome[J].Nature, 2009, 458:719-724.

        [2]Benson DA, Clark K, Karsch-Mizrachi I, et al. GenBank[J].Nucleic Acids Res, 2015, 43(Database issue):D30-35.

        [3]Li W, Cowley A,Uludag M, et al. The EMBL-EBI bioinformatics web and programmatic tools framework[J]. Nucleic Acids Res, 2015,43(W1):W580-584.

        [4]Kodama Y, Mashima J, Kosuge T, et al. The DDBJ Japanese Genotype-phenotype Archive for genetic and phenotypic human data[J]. Nucleic Acids Res, 2015, 43(Database issue):D18-22.

        [5]Weinstein JN, Collisson EA, Mills GB, et al. The Cancer Genome Atlas Pan-Cancer analysis project[J]. Nat Genet, 2013, 45:1113-1120.

        [6]Hoadley KA, Yau C, Wolf DM, et al. Multiplatform analysis of 12 cancer types reveals molecular classification within and across tissues of origin[J]. Cell, 2014, 158(4):929-944.

        [7]Alexandrov LB, Nik-Zainal S, Wedge DC, et al. Signatures of mutational processes in human cancer[J]. Nature, 2013, 500(7463):415-421.

        [8]Grieb BC, Chen X, Eischen CM. MTBP is overexpressed in triple-negative breast cancer and contributes to its growth and survival[J]. Mol Cancer Res, 2014, 12(9):1216-1224.

        [9]Lappalainen I, Almeida-King J, Kumanduri V, et al. The European Genome-phenome Archive of human data consented for biomedical research[J]. Nat Genet, 2015, 47(7):692-695.

        [10]Wilks C, Cline MS, Weiler E, et al. The Cancer Genomics Hub(CGHub):overcoming cancer through the power of torrential data[J]. Database(Oxford), 2014, 2014. pii:bau093.

        [11]International Cancer Genome Consortium. International network of cancer genome projects. [J]. Nature, 2010, 464(7291):993-998.

        [12]Strausberg RL, Buetow KH, Emmert-Buck MR, et al. The cancer genome anatomy project:building an annotated gene index[J].Trends Genet, 2000, 16(3):103-106.

        [13]Forbes SA, Beare D, Gunasekaran P, et al. COSMIC:exploring the world's knowledge of somatic mutations in human cancer[J].Nucleic Acids Res, 2015, 43(Database issue):D805-811.

        [14]Gao J, Aksoy BA, DogrusozU, et al. Integrative analysis of complex cancer genomics and clinical profiles using the cBioPortal[J].Sci Signal, 2013, 6(269):pl1.

        [15]Goldman M, Craft B, Swatloski T, et al. TheUCSC Cancer Genomics Browser:update 2015[J]. Nucleic Acids Res, 2015,43(Database issue):D812-817.

        [16]Zhang J, Finney RP, Rowe W, et al. Systematic analysis of genetic alterations in tumors using Cancer Genome WorkBench(CGWB)[J]. Genome Res, 2007, 17(7):1111-1117.

        [17]Samur MK, Yan Z, Wang X, et al. canEvolve:a web portal for integrative oncogenomics[J]. PLoS One, 2013, 8(2):e56228.

        [18]Cai H, Gupta S, Rath P, et al. arrayMap 2014:an updated cancer genome resource. [J]. Nucleic Acids Res, 2015, 43(Database issue):D825-830.

        [19]Cao Q, Zhou M, Wang X, et al. CaSNP:a database for interrogating copy number alterations of cancer genome from SNP array data[J]. Nucleic Acids Res, 2011, 39(Database issue):D968-974.

        [20]Scheinin I, Myllykangas S, Borze I, et al. CanGEM:mining gene copy number changes in cancer. [J]. Nucleic Acids Res, 2008, 36(Database issue):D830-835.

        [21]Timms B. Cancer genome project to start[J]. Eur J Cancer, 2000,36(6):687.

        [22]Wu TJ, Shamsaddini A, Pan Y, et al. A framework for organizing cancer-related variations from existing databases, publications and NGS data using a High-performance Integrated Virtual Environment(HIVE)[J]. Database(Oxford), 2014, 2014:bau022.

        [23]Formosa A, Lena AM, Markert EK, et al. DNA methylation silences miR-132 in prostate cancer[J]. Oncogene, 2013, 32(1):127-134.

        [24]He X, Chang S, Zhang J, et al. MethyCancer:the database of human DNA methylation and cancer[J]. Nucleic Acids Res,2008, 36(Database issue):D836-841.

        [25]Huang WY, Hsu SD, Huang HY, et al. MethHC:a database of DNA methylation and gene expression in human cancer[J].Nucleic Acids Res, 2015, 43(Database issue):D856-861.

        [26]Baek SJ, Yang S, Kang TW, et al. MENT:methylation and expression database of normal and tumor tissues[J]. Gene, 2013,518(1):194-200.

        [27]Barrett T, Wilhite SE, Ledoux P, et al. NCBI GEO:archive for functional genomics data sets--update[J]. Nucleic Acids Res,2013, 41(Database issue):D991-995.

        [28]Lv J, Liu H, Su J, et al. DiseaseMeth:a human disease methylation database[J]. Nucleic Acids Res, 2012, 40(Database issue):D1030-1035.

        [29]Negre V, Grunau C. The MethDB DAS server:adding an epigenetic information layer to the human genome[J].Epigenetics, 2006, 1(2):101-105.

        [30]Geisen S, Barturen G, Alganza AM, et al. NGSmethDB:an updated genome resource for high quality, single-cytosine resolution methylomes[J]. Nucleic Acids Res, 2014, 42(Database issue):D53-59.

        [31]Kolesnikov N, Hastings E, Keays M, et al. ArrayExpress update--simplifying data submissions[J]. Nucleic Acids Res, 2015, 43(Database issue):D1113-1116.

        [32]Rhodes DR, Kalyana-Sundaram S, Mahavisno V, et al. Oncomine 3.0:genes, pathways, and networks in a collection of 18, 000 cancer gene expression profiles[J]. Neoplasia, 2007, 9(2):166-180.

        [33]Wang D, Gu J, Wang T, et al. OncomiRDB:a database for the experimentally verified oncogenic and tumor-suppressive microRNAs[J]. Bioinformatics, 2014, 30(15):2237-2238.

        [34]Xie B, Ding Q, Han H, et al. miRCancer:a microRNA-cancer association database constructed by textmining on literature[J].Bioinformatics, 2013, 29(5):638-644.

        [35]Bhattacharya A, Ziebarth JD, Cui Y. SomamiR:a database for somatic mutations impacting microRNA function in cancer[J].Nucleic Acids Res, 2013, 41(Database issue):D977-982.

        [36]Frenkel-Morgenstern M, Gorohovski A, Vucenovic D, et al.ChiTaRS 2. 1--an improved database of the chimeric transcripts and RNA-seq data with novel sense-antisense chimeric RNA transcripts[J]. Nucleic Acids Res, 2015, 43(Database issue):D68-75.

        [37]Ellis MJ, Gillette M, Carr SA, et al. Connecting genomic alterations to cancer biology with proteomics:the NCI Clinical Proteomic Tumor Analysis Consortium[J]. Cancer Discov, 2013, 3(10):1108-1112.

        [38]He Y, Zhang M, Ju Y, et al. dbDEPC 2. 0:updated database of differentially expressed proteins in human cancers[J]. Nucleic Acids Res, 2012, 40(Database issue):D964-971.

        [39]Li J, Duncan DT, Zhang B. CanProVar:a human cancer proteome variation database[J]. Hum Mutat, 2010, 31(3):219-228.

        [40]Tyagi A, Tuknait A, Anand P, et al. CancerPPD:a database of anticancer peptides and proteins[J]. Nucleic Acids Res, 2015,43(Database issue):D837-843.

        [41]Porta-Pardo E, Hrabe T, Godzik A. Cancer3D:understanding cancer mutations through protein structures[J]. Nucleic Acids Res, 2015, 43(Database issue):D968-973.

        [42]Cheng WC, Chung IF, Chen CY, et al. DriverDB:an exome sequencing database for cancer driver gene identification[J].Nucleic Acids Res, 2014, 42(Database issue):D1048-1054.

        [43]An O, Pendino V, D'Antonio M, et al. NCG 4. 0:the network of cancer genes in the era of massive mutational screenings of cancer genomes[J]. Database(Oxford), 2014, 2014:bau015.

        [44]Leroy B, Fournier JL, Ishioka C, et al. The TP53 website:an integrative resource centre for the TP53 mutation database and TP53 mutant analysis[J]. Nucleic Acids Res, 2013, 41(Database issue):D962-969.

        [45]Hamroun D, Kato S, Ishioka C, et al. TheUMD TP53 database and website:update and revisions[J]. Hum Mutat, 2006, 27(1):14-20.

        [46]Yang W, Soares J, Greninger P, et al. Genomics of Drug Sensitivity in Cancer(GDSC):a resource for therapeutic biomarker discovery in cancer cells[J]. Nucleic Acids Res, 2013, 41(Database issue):D955-961.

        [47]Bulusu KC, Tym JE, Coker EA, et al. canSAR:updated cancer research and drug discovery knowledgebase[J]. Nucleic Acids Res, 2014, 42(Database issue):D1040-1047.

        [48]Ahmed J, Meinel T, Dunkel M, et al. CancerResource:a comprehensive database of cancer-relevant proteins and compound interactions supported by experimental knowledge[J]. Nucleic Acids Res, 2011, 39(Database issue):D960-967.

        [49]Kumar R, Chaudhary K, Gupta S, et al. CancerDR:cancer drug resistance database[J]. Sci Rep, 2013, 3:1445.

        [50]Pires DE, Blundell TL, Ascher DB. Platinum:a database of experimentally measured effects of mutations on structurally defined protein-ligand complexes[J]. Nucleic Acids Res, 2015,43(Database issue):D387-391.

        [51]李金平, 李宏, 廉斌, 等. 乳腺癌電子數(shù)據(jù)庫(kù)的建立及臨床應(yīng)用[J]. 海南醫(yī)學(xué) , 2013, 24(9):1371-1372.

        [52]單華超, 徐海榮, 李遠(yuǎn), 等. 原發(fā)骨腫瘤流行病學(xué)數(shù)據(jù)庫(kù)的建立與使用[J]. 中國(guó)骨與關(guān)節(jié)雜志, 2015(9):693-696.

        [53]鄭虎, 張紅波, 孫彥輝, 等. 腦腫瘤患者認(rèn)知障礙數(shù)據(jù)庫(kù)的初步建立及臨床意義[J]. 數(shù)理醫(yī)藥學(xué)雜志, 2013(4):410-412.

        [54]崔洪亮, 張陽(yáng)德, 任菲. dbDEMC2. 0:人類癌癥相關(guān)miRNA數(shù)據(jù)庫(kù)2. 0[J]. 中國(guó)現(xiàn)代醫(yī)學(xué)雜志, 2014, 24(3):77-79.

        [55]程卓, 劉珂, 嚴(yán)章明, 等. nc2Cancer:一個(gè)研究與癌癥相關(guān)人類非編碼RNA的數(shù)據(jù)庫(kù)[J]. 生物信息學(xué), 2015, 13(2):77-81.

        [56]李孟嬌, 鄂琪敏, 劉加林, 等. 喉癌相關(guān)基因和miRNA綜合數(shù)據(jù)庫(kù)的構(gòu)建[J]. 中華耳鼻咽喉頭頸外科雜志, 2015, 50(9):765-768.

        猜你喜歡
        甲基化基因組癌癥
        牛參考基因組中發(fā)現(xiàn)被忽視基因
        留意10種癌癥的蛛絲馬跡
        癌癥“偏愛(ài)”那些人?
        海峽姐妹(2018年7期)2018-07-27 02:30:36
        對(duì)癌癥要恩威并施
        特別健康(2018年4期)2018-07-03 00:38:08
        不如擁抱癌癥
        特別健康(2018年2期)2018-06-29 06:13:42
        鼻咽癌組織中SYK基因啟動(dòng)子區(qū)的甲基化分析
        胃癌DNA甲基化研究進(jìn)展
        基因組DNA甲基化及組蛋白甲基化
        遺傳(2014年3期)2014-02-28 20:58:49
        有趣的植物基因組
        全甲基化沒(méi)食子兒茶素沒(méi)食子酸酯的制備
        亚洲男人第一av网站| 国产一区二区三区视频网| 一个人看的在线播放视频| 少妇人妻偷人精品一区二区| 精品无码专区久久久水蜜桃| 中文字幕亚洲人妻系列| 久久精品无码一区二区三区不卡| 国产v精品成人免费视频400条| 冲田杏梨av天堂一区二区三区| 日韩亚洲在线一区二区| 国产av区亚洲av毛片| 国产一区二区三区乱码在线| 少妇呻吟一区二区三区| 人妻有码中文字幕在线| 美女视频黄a视频全免费网站色| 日本九州不卡久久精品一区| av免费不卡一区二区| 极品粉嫩小仙女高潮喷水网站| 日本不卡高字幕在线2019| 国产大片内射1区2区| 精品无码国产自产拍在线观看 | 亚洲精品tv久久久久久久久久| 十八禁在线观看视频播放免费| 亚洲综合精品伊人久久| 日韩精品无码av中文无码版| 欧美极品少妇性运交| 久久AV中文综合一区二区| 久久久久一| 国产在线一区二区视频免费观看| 极品少妇在线观看视频| 熟女肥臀白浆一区二区| 精品亚洲一区二区区别在线观看| 极品粉嫩嫩模大尺度无码视频| 国产精品久久久久精品一区二区| 特级a欧美做爰片第一次| a级毛片无码免费真人| 乱码午夜-极品国产内射| 亚洲另在线日韩综合色| 官网A级毛片| 在线观看日韩精品视频网站| 国产自产二区三区精品|