亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        不同人群的SNPs基因型數(shù)據(jù)中r2值對TagSNP數(shù)量的影響*

        2012-03-11 14:02:12張鎦琢鄭娟娟孫遠(yuǎn)潔袁重勝
        中國衛(wèi)生統(tǒng)計(jì) 2012年3期
        關(guān)鍵詞:百分比單體染色體

        張鎦琢 秦 平 李 昂 鄭娟娟 孫遠(yuǎn)潔 袁重勝 劉 艷△

        研究人員通過對比病例組和對照組的基因型頻率的不同來發(fā)現(xiàn)基因?qū)膊〉挠绊?,由于單體型(haplotype)整合了各個(gè)多態(tài)位點(diǎn)之間的連鎖不平衡(linkage disequilibrium,LD)信息,因此基于單體型的關(guān)聯(lián)研究比基于單個(gè)單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)的分析能夠提供更高的檢出功效〔1-2〕。與疾病相關(guān)的基因型很有可能就存在于病例組和對照組之間基因型頻率不同的染色體區(qū)域內(nèi),理論上對全部的SNPs位點(diǎn)都進(jìn)行基因分型,就能夠?qū)ふ业竭@樣的區(qū)域〔3〕,但應(yīng)用這種方法進(jìn)行鑒定的成本卻過于昂貴。已有研究表明〔4〕,用少部分的遺傳標(biāo)記仍可保留單體型的大部分信息,例如單體型圖計(jì)劃已鑒定出約50萬個(gè)標(biāo)簽SNP(TagSNP)位點(diǎn),提供了與一千萬個(gè)SNPs位點(diǎn)大致相同的圖譜信息,從而大幅度地減少了成本使得研究易于進(jìn)行。目前,已有幾種根據(jù)基因分型或單體型數(shù)據(jù)篩選tagSNP的方法〔5〕,研究者利用SNPs及其他遺傳變異在染色體上的組成特點(diǎn),從HapMap中獲得tagSNP的信息,通過軟件分析用來定位與重要醫(yī)學(xué)特征相關(guān)的基因〔6〕。TagSNP的篩選大大簡化了基因與疾病的關(guān)聯(lián)分析,使遺傳疾病的基因定位能夠更為有效的進(jìn)行。

        材料與方法

        1.數(shù)據(jù)來源

        利用國際人類基因組單體型圖計(jì)劃(The International HapMap Project,http://www.hapmap.org) 的通用基因組瀏覽器(HapMap Genome Btowser)下載2009年2月公布的Ⅲ期22號(hào)染色體的SNPs基因型數(shù)據(jù)。其中,北京漢族人群(Han Chinese in Beijing,China,CHB)包括84個(gè)樣本的18 588個(gè)SNPs信息;東京日本人群(Japanese in Tokyo,Japan,JPT)包括86個(gè)樣本的18 103個(gè)SNPs信息;而來自歐洲北部和西部的猶他州人群(Utah residents with Northern and Western European ancestry from the CEPH collection,CEU)則包括165個(gè)樣本的19 660個(gè)SNPs信息。

        2.軟件介紹

        在SNPs基因型數(shù)據(jù)分析中,常用的軟件有BEST、GeneDigger、HaploBlock 以及 Haploview,其中 Haploview是由劍橋大學(xué)編寫的利用已有的基因型數(shù)據(jù)來計(jì)算連鎖不平衡統(tǒng)計(jì)量并推斷人群單體型模型的公用軟件包,目前的最新版本為Haploview4.2(可從http://www.broadinstitute.org/haploview/haploview-downloads免費(fèi)下載),可在1.4版及以上的Java運(yùn)行環(huán)境(JRE)中使用。

        Haploview中的Tagger計(jì)算機(jī)程序提供了篩選tagSNP的方法〔7〕,主要參數(shù)是次等位基因頻率(Minor Allele Frequency,MAF)閾值以及 tagSNP和未檢測SNP之間的最小連鎖不平衡相關(guān)程度(用r2值來表示),即侯選基因上所有常見 SNPs(即次等位基因頻率大于閾值者),要么作為tag-SNP進(jìn)行直接檢測,要么與一個(gè)待檢SNP相關(guān)聯(lián)(r2值超過設(shè)定值)。此外,研究者也可以結(jié)合現(xiàn)有文獻(xiàn)選取感興趣的可能的功能位點(diǎn)(如基因編碼區(qū)和調(diào)控區(qū)的多態(tài)位點(diǎn))作為tagSNP。

        3.篩選tagSNP

        運(yùn)行Haploview4.2分別讀取HapMap中的CHB、JPT和CEU的22號(hào)染色體SNPs基因型數(shù)據(jù),之后首先要對數(shù)據(jù)的信息進(jìn)行整理,設(shè)定Hardy-Weinberg平衡切斷值(HW p-value cutoff)為0.0010,次等位基因頻率(minimum minor allele freq)的最小值為0.0010,未缺失的基因型頻率最小值為75%,最大孟德爾遺傳規(guī)律錯(cuò)誤的個(gè)數(shù)(max mendel errors)為1,Haploview將最終選取滿足這些條件的SNPs進(jìn)行有效的分析;隨后在tagSNP的篩選過程中設(shè)定不同的r2值(0.5~1.0),并記錄tagSNP的數(shù)量。

        4.TagSNP數(shù)量的比例關(guān)系

        HapMap所提供的不同人群的相同染色體的SNPs數(shù)量并不完全相同,為了排除所篩選的tagSNP數(shù)量會(huì)受到人群總SNPs數(shù)量的影響,需要計(jì)算不同人群中不同r2值所對應(yīng)的tagNP數(shù)量占總SNPs數(shù)量的百分比例。

        結(jié) 果

        運(yùn)行Haploview4.2分別處理三個(gè)人群的SNPs基因型數(shù)據(jù),不同r2值所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例的具體情況見表1。當(dāng)r2值為0.8(軟件默認(rèn)值)時(shí),在CHB中篩選出7 752個(gè)tag-SNP,這表示由占總SNPs數(shù)量41.70%的這7 752個(gè)tagSNP所構(gòu)建的單體型即可反映北京漢族人群整個(gè)22號(hào)染色體上的18 588個(gè)SNPs的大部分信息;與此相比,依然是在 r2值為0.8時(shí),分別需要7 460個(gè)(41.21%)和9086個(gè)(46.22%)tagSNP才能反映東京日本人群和來自歐洲北部和西部的猶他州人群22號(hào)染色體上的單體型信息。即使在相鄰的SNPs位點(diǎn)存在著完全連鎖的情況下(r2值為1)所篩選的tagSNP的數(shù)量還是明顯的低于總SNPs數(shù)量,此時(shí)CHB、JPT和CEU的tagSNP數(shù)量分別占總SNPs數(shù)量的65.56%、63.35%和70.05%。

        表1 三個(gè)人群中不同r2值所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例

        若以設(shè)定的r2值為橫坐標(biāo),以所篩選的tagSNP數(shù)量或其占總SNPs數(shù)量百分比例為縱坐標(biāo)做圖,則可以更為直觀地看到三個(gè)人群中北京漢族人群和東京日本人群比較接近,且三個(gè)人群均表現(xiàn)出隨著所設(shè)定的r2值的增大tagSNP數(shù)量及其百分比例呈現(xiàn)出逐漸增多的趨勢;但在r2值相同時(shí)三個(gè)人群的tagSNP數(shù)量卻存在著一定的差異,表現(xiàn)為日本人群的數(shù)量最少,北京漢族人群其次,歐洲北部和西部的猶他州人群的數(shù)量最多。在三個(gè)人群中tagSNP數(shù)量的增加速度都表現(xiàn)為在r2值小于0.9時(shí)較為平穩(wěn),r2值大于0.9時(shí)增加速度都有所提高,其中以北京漢族人群的增加更為明顯。

        討 論

        運(yùn)用Haploview軟件進(jìn)行tagSNP的篩選,可直接分析從HapMap上下載到的階段性SNPs基因型數(shù)據(jù),通過計(jì)算連鎖不平衡統(tǒng)計(jì)量來推斷人群單體型模型。有研究顯示利用HapMap基因型數(shù)據(jù)所篩選的tagSNP進(jìn)行關(guān)聯(lián)研究比單位點(diǎn)研究的統(tǒng)計(jì)效力更高,且可不受數(shù)據(jù)庫完整性的影響〔7〕。本研究即是運(yùn)用Haploview4.2軟件計(jì)算出三個(gè)人群(北京漢族人群、東京日本人群和來自歐洲北部和西部的猶他州人群)22號(hào)染色體在不同r2值(最小連鎖不平衡相關(guān)程度)時(shí)所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例,結(jié)果顯現(xiàn)出tagSNP的數(shù)量受r2值的影響較大,雖然三個(gè)人群在SNPs連鎖不平衡關(guān)系上存在著一定的差異(相對說來,北京漢族人群和東京日本人群的結(jié)果較為接近),但均表現(xiàn)出隨著所設(shè)定的r2值的增大tagSNP數(shù)量及其百分比例呈現(xiàn)出逐漸增多的趨勢,不過tagSNP數(shù)量的增加速度在三個(gè)人群中略有不同。究其增加速度不同的原因,一方面在于HapMap計(jì)劃所檢測的三個(gè)人群總SNPs位點(diǎn)個(gè)數(shù)以及樣本例數(shù)的差異(北京漢族人群和東京日本人群樣本例數(shù)幾乎相等,而歐洲北部和西部的猶他州人群的樣本例數(shù)則幾乎是北京漢族人群和東京日本人群樣本例數(shù)的總和),理論上較大的樣本量意味著位點(diǎn)間有更多的重組機(jī)會(huì)(重組機(jī)會(huì)的增多可降低原位點(diǎn)間的r2值),故當(dāng)固定r2值以篩選tagSNP時(shí),較大的樣本量就可導(dǎo)致有更多的tagSNP被篩選出來;另一方面,影響r2值的因素還包括群體有效大小(Ne)以及位點(diǎn)間重組率(c),三個(gè)人群不同的遺傳背景使得位點(diǎn)間重組率和重組率圖(相鄰的SNPs位點(diǎn)間的重組率即組成了重組率圖) 產(chǎn)生差異,因 E(r2)=1/(1+4Nec)〔8〕,從而也導(dǎo)致了三個(gè)人群的tagSNP在數(shù)量及增加速度上的差異。所以,在實(shí)際研究中要依據(jù)目標(biāo)人群、研究經(jīng)費(fèi)等方面的具體情況設(shè)置合理的r2值,若因研究經(jīng)費(fèi)有限需要檢測的SNPs位點(diǎn)數(shù)量較少時(shí),可通過降低r2值來減少tagSNP的數(shù)量,尤其是當(dāng)研究人群不同時(shí),不應(yīng)盲目地遵從由參考樣本數(shù)據(jù)所計(jì)算出的r2值,應(yīng)更相信從實(shí)際研究數(shù)據(jù)中所計(jì)算得到的r2值。此外,當(dāng)估算出位點(diǎn)間的r2值后,還可進(jìn)一步推斷群體有效大小,因?yàn)槿后w有效大小是一個(gè)重要參數(shù),有助于解釋人群是如何進(jìn)行演變和擴(kuò)大的,并可提高對復(fù)雜性狀遺傳模式的理解和建模〔9〕。

        目前,在疾病的病因?qū)W研究中,盡管已在發(fā)現(xiàn)疾病的危險(xiǎn)等位基因方面取得了很大的進(jìn)步,但大多數(shù)的遺傳風(fēng)險(xiǎn)仍然無法解釋。在廣泛的人群中全面的檢測所有常見和稀有的等位基因可對疾病的遺傳風(fēng)險(xiǎn)有一個(gè)更為完整的認(rèn)識(shí)〔8〕。但對全部SNPs位點(diǎn)進(jìn)行關(guān)聯(lián)研究確實(shí)存在著諸多困難(工作量大、成本較高等),而利用少量的tagSNP就能提供與全基因組SNPs位點(diǎn)大致相同的圖譜信息的方式,則可以良好的解決這些問題。相信,隨著生命科學(xué)的不斷發(fā)展和進(jìn)步,提取tagSNP的算法將會(huì)得到逐步完善,從而在分子流行病學(xué)和生命科學(xué)的研究中發(fā)揮積極的作用。

        1.Akey J,Jin L,Xiong M.Haplotypes vs single marker linkage disequilibrium tests:what do we gain?Eur J Hum Genet,2001,9(4):291-300.

        2.鄒莉玲,趙耐青,秦國友,等.應(yīng)用關(guān)聯(lián)規(guī)則篩選疾病相關(guān)的SNP位點(diǎn)及其組合的分析方法.中國衛(wèi)生統(tǒng)計(jì),2009,26(3):226-233.

        3.Johnson GC,Esposito L,Barratt BJ,et al.Haplotype tagging for the identification of common disease genes.Nat Genet,2001,29(2):233-237.

        4.Patil N,Berno AJ,Hinds DA,et al.Blocks of limited haplotype diversity revealed by high-resolution scanning of human chromosome 21.Science,2001,294(5547):1669-1670.

        5.Gopalakrishnan S,Qin ZS.TagSNPselection based on pairwise LD criteria and power analysis in association studies.Pac Symp Biocomput,2006,511-522.

        6.Xu Z,Kaplan NL,Taylor JA.Tag SNPselection for candidate gene association studies using HapMap and gene resequencing data.Eur J Hum Genet,2007,15(10):1063-1070.

        7.Bakker PI,Yelensky R,Pe'er I,et al.Efficiency and power in genetic association studies.Nat Genet,2005,37(11):1217-1223.

        8.Sved JA.Correlation measures for linkage disequilibrium within and between populations.Genet Res(Camb),2009,91(3):183-192.

        9.Tenesa A,Navarro P,Hayes BJ,et al.Recent human effective population size estimated from linkage disequilibrium.Genome Res,2007,17(4):520-526.

        猜你喜歡
        百分比單體染色體
        多一條X染色體,壽命會(huì)更長
        為什么男性要有一條X染色體?
        單體光電產(chǎn)品檢驗(yàn)驗(yàn)收方案問題探討
        普通照明用自鎮(zhèn)流LED燈閃爍百分比測量不確定度分析
        電子制作(2017年20期)2017-04-26 06:57:46
        能忍的人壽命長
        肝癌患者外周血Treg、Th17百分比及IL-17水平觀察
        相變大單體MPEGMA的制備與性能
        再論高等植物染色體雜交
        巨無霸式醫(yī)療單體的選擇
        類姜黃素及其單體對β-內(nèi)分泌酶活性的抑制作用
        国产av综合一区二区三区最新 | 人妻饥渴偷公乱中文字幕| 极品成人影院| 无遮无挡三级动态图| 天天澡天天揉揉AV无码人妻斩 | av一区无码不卡毛片| 91久国产在线观看| 免费看草逼操爽视频网站| 性色视频加勒比在线观看| 九九久久99综合一区二区| 亚洲成色www久久网站夜月| 精品熟女少妇免费久久| 精品国产一区二区三广区| 日本一区二区免费在线看| 精品国产综合区久久久久久| 人妻少妇久久中文字幕一区二区| 成人国产精品一区二区网站| 亚洲av粉色一区二区三区| 国产亚洲一本二本三道| 亚洲色偷偷综合亚洲avyp| 亚洲午夜精品a片久久www慈禧| 狠狠躁夜夜躁AV网站中文字幕| 亚洲国产av自拍精选| 午夜视频一区二区三区播放| 亚洲av永久无码天堂网| 狠狠色噜噜狠狠狠888米奇视频| 成人片在线看无码不卡| 久久青青草原亚洲av| 欲女在线一区二区三区| 久久精品国产亚洲av高清热| 午夜亚洲www湿好大| 久草视频华人在线观看| 人妻精品一区二区三区蜜桃| 白丝爆浆18禁一区二区三区| 日本熟妇人妻xxxxx视频| 2020亚洲国产| 极品少妇一区二区三区四区视频| 尹人香蕉久久99天天拍| 亚洲av无码av制服另类专区 | AV中文码一区二区三区| 亚洲熟女av在线观看|