亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于FastMap算法的類風(fēng)濕病通路基因在1號染色體上的連鎖特性的研究

        2014-07-31 23:11:10李嘉寧華琳夏翃閆巖
        中國醫(yī)療設(shè)備 2014年8期
        關(guān)鍵詞:連鎖染色體特性

        李嘉寧,華琳,夏翃,閆巖

        首都醫(yī)科大學(xué) 生物醫(yī)學(xué)工程學(xué)院,北京 100069

        基于FastMap算法的類風(fēng)濕病通路基因在1號染色體上的連鎖特性的研究

        李嘉寧,華琳,夏翃,閆巖

        首都醫(yī)科大學(xué) 生物醫(yī)學(xué)工程學(xué)院,北京 100069

        本文闡述了應(yīng)用FastMap算法研究類風(fēng)濕病通路基因在1號染色體上的連鎖特性的方法和結(jié)果。結(jié)果發(fā)現(xiàn),在FGF Signaling in Rheumatoid Arthritis通路中,CTSB、PRKC、ACAT2和MAPK1出現(xiàn)了相似的連鎖特性。在IFN Signaling in Rheumatoid Arthritis通路中,IL15、HLA-DR和HLA-DQA1出現(xiàn)了相似的連鎖特性。在IL10 Signaling in Rheumatoid Arthritis通路中,HLA-DR和TGFB1,CXCR4和CD86出現(xiàn)了相似的連鎖特性。該結(jié)果說明同一通路中的基因存在相似的連鎖特性,這些基因可能具有潛在的相似功能。

        FastMap算法;類風(fēng)濕病通路;1號染色體;連鎖特性;基因

        0 前言

        隨著人類基因組計劃的實施,復(fù)雜疾病的基因定位研究備受關(guān)注。復(fù)雜疾病通常受多基因控制,且多個基因間存在交互作用,因而其基因型和表型間往往不是簡單的一一對應(yīng)關(guān)系。傳統(tǒng)的統(tǒng)計遺傳學(xué)方法多用于研究疾病和單點基因的連鎖和關(guān)聯(lián),但對復(fù)雜疾病的基因定位尚處于探索階段,很多多基因的定位方法對研究多基因的協(xié)同分析有一定的局限性[1-2]。因此,迫切需要尋找出一種能夠分析復(fù)雜疾病全基因組進(jìn)而來探查基因間互作關(guān)系的方法。最近,有報道將基因集富集分析(Gene Set Enrichment Analysis,GSEA)等方法應(yīng)用于全基因組關(guān)聯(lián)研究中,以進(jìn)一步尋找出與疾病關(guān)聯(lián)的位點(基因)是否富集在某些代謝通路或染色體上,以便合理地解釋生物學(xué)現(xiàn)象[3-4]。目前這些方法已經(jīng)深入到了對復(fù)雜疾病(如腫瘤和免疫系統(tǒng)疾?。┑难芯恐?,本文采用 FastMap 算法對類風(fēng)濕病進(jìn)行了研究[5]。

        類風(fēng)濕病是一種病因尚未明了的免疫系統(tǒng)疾病,以慢性、對稱性、多滑膜關(guān)節(jié)炎和關(guān)節(jié)外病變?yōu)橹饕R床表現(xiàn),屬于自身免疫炎癥性疾病。該病多發(fā)于手、腕、足等小關(guān)節(jié)處,可反復(fù)發(fā)作,呈對稱分布。從病理改變的角度來看,類風(fēng)濕病是一種主要累及關(guān)節(jié)滑膜(以后可波及到關(guān)節(jié)軟骨、骨組織、關(guān)節(jié)韌帶和肌鍵),其次為漿膜、心、肺及眼等結(jié)締組織的廣泛性炎癥疾病。該病具有家族聚集傾向,病因復(fù)雜,具有遺傳異質(zhì)性,基因型和表型間不是簡單的一一對應(yīng)關(guān)系。因此,從分子生物學(xué)層面研究類風(fēng)濕病對其病理學(xué)研究有著十分重要的意義。

        近年來,發(fā)展迅速并被廣泛應(yīng)用的單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP)芯片技術(shù)為從系統(tǒng)生物學(xué)水平研究基因功能、從分子生物學(xué)水平研究多基因復(fù)雜疾病的發(fā)病機(jī)理與疾病分析提供了一種全新的途徑。研究疾病相關(guān)的通路中的基因的相關(guān)性和連鎖特性十分重要,本文主要研究類風(fēng)濕病相關(guān)通路上基因的連鎖特性。

        1 材料與方法

        本文主要是從 KEGG(Kyoyo Encyclopedia of Genes and Genomes) 數(shù) 據(jù) 庫 中(http://www.genome.jp/kegg) 篩 選 出 3條與類風(fēng)濕病相關(guān)的通路,并采用 FastMap 算法研究這些通路上的基因在1號染色體上的連鎖特性(1號染色體上的位點最多),以探討基因潛在的相似功能。

        1.1 SNP基因型數(shù)據(jù)處理

        選 擇 由 國 外 遺 傳 工 作 組 提 供 的 Genetic Analysis Workshop 15 (GAW15)問題 1 中的數(shù)據(jù)[6],含有 194 個個體的 3554 個基因的表達(dá)譜數(shù)據(jù)和 2883 個 SNP 基因型數(shù)據(jù)。對于選取的每個個體,均取其 1 號染色體上的 464 個 SNP基因型數(shù)據(jù)進(jìn)行分析,并對 SNP 基因型數(shù)據(jù)重新進(jìn)行編碼:將頻率高的等位基因(allele)編碼為 0,而頻率低的 allele編碼為1。

        1.2 通路選取及對應(yīng)基因表達(dá)數(shù)據(jù)

        從 KEGG 數(shù)據(jù)庫中通過輸入風(fēng)濕性關(guān)節(jié)炎(Rheumatoid Arthritis,RA)關(guān)鍵詞及數(shù)據(jù)庫中默認(rèn)的相關(guān)性測度篩選出與類風(fēng)濕病特別相關(guān)的 3 條通路,分別為 :FGF Signaling in Rheumatoid Arthritis ;IFN Signaling in Rheumatoid Arthritis和 IL10 Signaling in Rheumatoid Arthritis。將這 3 條通路中的基因映射到含有 3554 個基因的基因表達(dá)譜數(shù)據(jù)中,獲取該通路上的基因表達(dá)值。

        1.3 FastMap算法

        FastMap 方法通過構(gòu)建集合加和樹來計算基因表達(dá)值和SNP(allele)的 Pearson 相關(guān)系數(shù)[7]。具體步驟描述如下 :

        (1)構(gòu)建加和樹計算 Pearson 相關(guān)系數(shù)。設(shè)基因g和SNPs的 Pearson 相關(guān)系數(shù)為 :

        如果先將基因表達(dá)值進(jìn)行標(biāo)準(zhǔn)化,則 (1)式可以簡化為:

        該算法的根本目的是為了加速Mg(s)的計算,從而加速Pearson 相關(guān)系數(shù)的計算。假設(shè)s’和s表示兩個 SNP 僅在第i 個位置上(第i 個個體)的 allele 不同,其他位置均相同,則有:

        (4)式說明相同 SNP 分布的協(xié)方差相同,而不同 SNP分布的協(xié)方差為相同分布的協(xié)方差加上不同 allele 對應(yīng)的基因和,因此考慮構(gòu)建加和樹,加和樹的具體構(gòu)建過程如下:① 首先將所有 SNP 的分布都存儲在一個表中 ;② 從表中搜索出與樹的頂點距離為 1 的 SNPs,并將其作為樹的結(jié)點從表中移出;③ 當(dāng)與樹的頂點距離為 1 的 SNPs搜索完畢后,繼續(xù)搜索與樹的頂點距離為 2 的 SNPs并從表中移出 ;④重復(fù)執(zhí)行程序,當(dāng)與樹的頂點距離為 3 的 SNPs搜索完畢后,從表中搜索與樹的距離最近的 SNPs,直到所有的 SNPs都包含在樹中 ;⑤ 根據(jù)樹的結(jié)點計算Mg(s)及相應(yīng)的 Pearson系數(shù)。

        (2)隨機(jī)重排計算P值。對于每一個基因,計算出它與所有 SNPs 的 Pearson 相關(guān)系數(shù)[8-10]。為了獲得 P 值,將樣本的基因值進(jìn)行隨機(jī)重排 1000 次,每一次均保留最大的Pearson 相關(guān)系數(shù)值。這 1000 個值構(gòu)成了相關(guān)系數(shù)的經(jīng)驗分布,取α=0.05,即確定該經(jīng)驗分布的第 95 位百分位數(shù)為相應(yīng)的域值。

        2 數(shù)值實驗結(jié)果

        通過研究 3 條 RA 相關(guān)通路中的基因,并采用 Fastmap算法將這些基因與 1 號染色體上的 464 個 SNPs作 eQTL 分析,探討這些基因在1號染色體上的連鎖特性。本研究同時獲得了通路中每個基因的平均 Pearson 相關(guān)系數(shù)及隨機(jī)重排檢驗獲得的P值。

        2.1 FGF Signaling in Rheumatoid Arthritis通路

        該通路中的基因、平均 Pearson 相關(guān)系數(shù)及隨機(jī)重排檢驗的P值分別見圖 1 和表 1。對于該通路,CTSB、PRKC、ACTA2 和 MAPK1 這 4 個基因可以對應(yīng)上基因表達(dá)譜數(shù)據(jù)中的基因表達(dá)值,通過 eQTL 分析,獲得了這 4 個基因相應(yīng)的連鎖分析結(jié)果,4個基因的連鎖峰值位置大體相同。由表 1 可知,與 1號染色體上的 SNP 最為相關(guān)的基因是MAPK1(P=0.029)。

        圖1 FGF Signaling in Rheumatoid Arthritis通路中的基因

        表1 平均Pearson相關(guān)系數(shù)及相應(yīng)P值

        2.2 IFN Signaling in Rheumatoid Arthritis通路

        該通路中的基因、平均 Pearson 相關(guān)系數(shù)及隨機(jī)重排檢驗的P值分別見圖 2和表2。

        圖2 IFN Signaling in Rheumatoid Arthritis通路中的基因

        表2 平均Pearson相關(guān)系數(shù)及相應(yīng)P值

        對于該通路,CTSB、NFKB、HLA-DPA1、IL15、HLA-DR和 HLA-DQA1 這 6 個基因可以對應(yīng)上基因表達(dá)譜數(shù)據(jù)中的基因表達(dá)值,并獲得了相應(yīng)的連鎖分析結(jié)果,IL15、HLADR 和 HLA-DQA1 出現(xiàn)了相似的連鎖特性,即他們大體在同一位置出現(xiàn)了較高的連鎖峰值。這3個基因都是和類風(fēng)濕病十分相關(guān)的基因,特別是 HLA-DR 和 HLA-DQA1,很多文獻(xiàn)都已經(jīng)證實為和類風(fēng)濕病特別相關(guān)的基因。但由表2 可知,這 6 個基因與 1號染色體上的 SNP 的相關(guān)性并不強(qiáng)(P值均 >0.05)。

        2.3 IL10 Signaling in Rheumatoid Arthritis通路

        該通路中的基因、平均 Pearson 相關(guān)系數(shù)及隨機(jī)重排檢驗的P值分別見圖 3 和表 3。對于該通路,HLA-DR、 IL10、TGFB1、IL1B、VEGF、TNF、CXCR4 和 CD86 這 8個基因可以對應(yīng)上基因表達(dá)譜數(shù)據(jù)中的基因表達(dá)值,并獲得了相應(yīng)的連鎖分析結(jié)果。

        圖3 IL10 Signaling in Rheumatoid Arthritis 通路中的基因

        HLA-DR 和 TGFB1 的連鎖峰值,CXCR4 和 CD86 的連鎖峰值出現(xiàn)的位置大體相同。由表3可知,這8個基因與1 號染色體上的 SNP 的相關(guān)性也不強(qiáng)(P值均 >0.05)。

        表3 平均Pearson相關(guān)系數(shù)及相應(yīng)P值

        由上述結(jié)果可知,在3個類風(fēng)濕病相關(guān)通路中,同一通路中的部分基因的連鎖峰值出現(xiàn)的位置大體相同,提示這些基因可能具有相似的功能。事實上,已有文獻(xiàn)證實同一通路上的基因會存在潛在的共表達(dá)模式,基因的功能也可能具有相似性。

        3 討論

        近年來,隨著第三代遺傳標(biāo)記 SNP 的出現(xiàn),高通量的數(shù)據(jù)使得復(fù)雜疾病的基因定位和關(guān)聯(lián)分析面臨著巨大挑戰(zhàn)[11-12],迫切需要尋找出新的方法及算法對復(fù)雜疾病的分子生物學(xué)進(jìn)行靶向研究。盡管當(dāng)前對于分析遺傳和環(huán)境因素對復(fù)雜疾病的影響,如基因與基因互作、基因與環(huán)境互作等已涌現(xiàn)出大量算法[13],但這些算法很大程度上依賴于樣本量,也就是說,隨著 SNP 標(biāo)記的增多和樣本量的增大,其計算復(fù)雜度和計算時間會急劇增加。

        本研究采用 FastMap 算法研究了類風(fēng)濕病通路基因在 1號染色體上的連鎖特性(連鎖峰值)。該算法通過構(gòu)建加和樹能夠快速地計算基因與 SNP 的 Pearson 相關(guān)系數(shù),并采用隨機(jī)重排檢驗獲得相應(yīng)的顯著性P值,對于全基因組研究及 eQTL 分析都有直接的借鑒意義。同時,本研究還整合了兩種不同的數(shù)據(jù)類型,即基因表達(dá)譜數(shù)據(jù)和 SNP 基因型數(shù)據(jù),通過兩種不同數(shù)據(jù)的整合分析識別了類風(fēng)濕病相關(guān)的風(fēng)險通路的連鎖特性,給復(fù)雜疾病的遺傳學(xué)研究提供了一定參考。但需要指出的是,本研究使用的 KEGG通路數(shù)據(jù)庫每天都在不斷更新,因此相對于真實的生物學(xué)過程,其數(shù)據(jù)可能有一定出入。

        在實際的系統(tǒng)生物學(xué)數(shù)據(jù)分析當(dāng)中,數(shù)據(jù)整合分析遠(yuǎn)遠(yuǎn)要比單一的數(shù)據(jù)分析的效能要高。當(dāng)前,高通量的實驗方法導(dǎo)致大量基因組、轉(zhuǎn)錄組等組學(xué)數(shù)據(jù)的產(chǎn)生,為全面進(jìn)行生物學(xué)數(shù)據(jù)分析和了解生物學(xué)系統(tǒng)提供了條件。近年來,也產(chǎn)生了很多新的數(shù)據(jù)整合方法和分析平臺,對于發(fā)現(xiàn)組學(xué)數(shù)據(jù)之間的關(guān)聯(lián),提高疾病易感基因(位點)識別的準(zhǔn)確度有很大意義。本研究識別出的在 IL10 Signaling in Rheumatoid Arthritis 通路中出現(xiàn)相同連鎖峰值的基因HLA-DR 和 HLA-DQA1 不僅是和類風(fēng)濕病極其相關(guān)的基因,而且這兩個基因還同時位于 HLA 區(qū)域,已有報道證實HLA區(qū)域的等位基因或基因多態(tài)可以用作類風(fēng)濕病的預(yù)后標(biāo)志物。因此,未來的研究工作將是整合更多的數(shù)據(jù)類型和不同方法對疾病基因進(jìn)行分析,以準(zhǔn)確地識別和疾病真正相關(guān)的生物標(biāo)記。

        [1] Gatti DM,Shabalin AA,Lam TC,et al.FastMap:fast eQTL mapping in homozygous populations[J].Bioinformatics,2009,25(4):482-489.

        [2] Ma L,Runesha HB,Dvorkin D,et al.Parallel and serial computing tools for testing single-locus and epistatic SNP effects of quantitative traits in genome-wide association studies[J].BMC Bioinformatics,2008,(9):315-323.

        [3] Wellcome Trust Case Control Consortium.Consortium, Genomewide association study of 14,000 cases of seven common diseases and 3,000 shared controls[J].Nature,2007,447(7145):661-678.

        [4] Huang W,Wang P,Liu Z,et al.Identifying disease associations via genomewide association studies[J].BMC Bioinformatics,2009,(10):S68.

        [5] Wang K,Li M,Bucan M.Pathway-based approaches for analysis of genomewide association studie[J].Am J Hum Genet,2007,81(6):1278-1283.[6] Torkamani A,Topol EJ,Schork NJ.Pathway analysis of seven common diseases assessed by genome-wide association[J].Genomics,2008,92(5):265-272.

        [7] Backes C,Keller A,Kuentzer J,et al.GeneTrail-advanced gene set enrichment analysis[J].Nucleic Acids Res,2007,(35):W186-W192.

        [8] Chai HS,Sicotte H,Bailey KR,et al.GLOSSI:a method to assess the association of genetic loci-sets with complex diseases[J].BMC Bioinformatics,2009,(10):102.

        [9] Lim J,Hao T,Shaw C,et al.A protein-protein interaction network for human inherited ataxias and disorders of Purkinje cell degeneration[J].Cell,2006,125(4):801-814.

        [10] Gregersen PK,Silver J,Winchester RJ.The shared epitope hypothesis.An approach to understanding the molecular genetics of susceptibility to rheumatoid arthritis[J].Arthritis Rheum,1987,30(11):1205-1213.

        [11] Aud D,Peng SL.Mechanisms of disease:Transcription factors in inflammatory arthritis[J].Nat Clin Pract Rheumatol,2006,2(8):434-442.

        [12] Heinemeyer T,Wingender E,Reuter I,et al.Databases on transcriptional regulation:TRANSFAC,TRRD and COMPEL[J].Nucleic Acids Res,1998,26(1):362-367.

        [13] Hershberg RM,Framson PE,Cho DH,et al.Intestinal epithelial cells use two distinct pathways for HLA class II antigen processing[J].J Clin Invest, 1997,100(1):204-215.

        Research on Linkage Characteristics of Rheumatoid Arthritis Pathway Genes Located in Chromosome 1 Based on FastMap Algorithm

        LI Jia-ning, HUA Lin, XIA Hong, YAN Yan
        School of Biomedical Engineering, Capital Medical University, Beijing 100069, China

        This paper introduced the methods and results of the research on linkage characteristics of rheumatoid arthritis pathway genes located in chromosome 1 by using FastMap algorithm. The results showed that there were similar linkage characteristics among genes including CTSB, PRKC, ACAT2 and MAPK1 in FGF Signaling in Rheumatoid Arthritis pathway and there were similar linkage characteristics among genes including IL15, HLA-DR and HLA-DQA1 in IFN Signaling in Rheumatoid Arthritis pathway while there were similar linkage characteristics between genes including HLA-DR and TGFB1 as well as CXCR4 and CD86 in IL10 Signaling in Rheumatoid Arthritis pathway. The results indicated that the potential functions of the genes with similar linkage characteristics in the same pathway may be similar.

        FastMap algorithm; rheumatoid arthritis pathway; chromosome 1; linkage characteristics; genes

        R311

        A

        10.3969/j.issn.1674-1633.2014.08.009

        1674-1633(2014)08-0032-04

        2013-07-10

        北京市教育委員會科技計劃面上項目(SQKM201210025008);

        北京市優(yōu)秀人才培養(yǎng)資助項目(2012D005018000002);首都醫(yī)科大學(xué)基礎(chǔ)臨床-合作項目(11JL30、11JL33、12JL75)。

        閆巖,副教授。

        作者郵箱:ning9024@126.com

        猜你喜歡
        連鎖染色體特性
        谷稗的生物學(xué)特性和栽培技術(shù)
        專注零售連鎖空間打造
        色彩特性
        流行色(2020年9期)2020-07-16 08:08:54
        多一條X染色體,壽命會更長
        進(jìn)一步凸顯定制安裝特性的優(yōu)勢 Integra DRX-5.2
        為什么男性要有一條X染色體?
        庫里受傷的連鎖效應(yīng)
        NBA特刊(2018年7期)2018-06-08 05:48:32
        布拉格Burrito Loco連鎖快餐店
        Quick Charge 4:什么是新的?
        CHIP新電腦(2017年6期)2017-06-19 09:41:44
        能忍的人壽命長
        亚洲av无码一区二区乱子伦| 国产成人精品一区二三区孕妇| 美女张开腿黄网站免费| 激情综合一区二区三区| 一本色道久久88精品综合 | 夫妻免费无码v看片| 久久九九国产精品怡红院| 久久AV中文综合一区二区| 亚洲天堂免费成人av| 日韩熟女系列中文字幕| 在线看片免费人成视频久网下载| 日本免费人成视频播放| 风流少妇一区二区三区| 日韩精品视频免费网站| 丰满爆乳在线播放| 天天综合久久| 亚洲精品成人久久av| 免费观看国产短视频的方法| 精品国产sm捆绑最大网免费站 | 国产中老年妇女精品| 久久99精品这里精品动漫6| 日韩在线一区二区三区中文字幕| 国产成人无码精品久久久露脸 | 欧美最猛性xxxxx免费| 亚洲第一成人网站| 亚洲精品一品二品av| av色一区二区三区精品| 色 综合 欧美 亚洲 国产| 国产精品亚洲一区二区杨幂| 精品一区二区三区老熟女少妇| 4455永久免费视频| 国产精品高潮呻吟av久久4虎| 鲁丝一区鲁丝二区鲁丝三区| 在线日本国产成人免费精品| yw尤物av无码国产在线观看| 精品人妻潮喷久久久又裸又黄| 中文字幕午夜AV福利片| 久久精品国产亚洲av沈先生| 99久久精品免费看国产| 亚洲免费观看在线视频| 丝袜美腿爆炒国产在线观看|