刁淑琪,羅元宇,蔡 迪,陳桂華,陳贊謀,張 豪,李加琪,張 哲
(華南農(nóng)業(yè)大學(xué)動物科學(xué)學(xué)院,廣東 廣州 510642)
杜洛克豬全基因組連鎖不平衡分析
刁淑琪,羅元宇,蔡 迪,陳桂華,陳贊謀,張 豪,李加琪,張 哲
(華南農(nóng)業(yè)大學(xué)動物科學(xué)學(xué)院,廣東 廣州 510642)
利用豬Illumina Porcine SNP60K芯片對福建某核心種豬場杜洛克豬216個個體進行基因型檢測,基于該高密度SNP芯片數(shù)據(jù),運用Haploview軟件計算全基因組連鎖不平衡并構(gòu)建杜洛克豬連鎖不平衡圖譜。結(jié)果表明,該杜洛克豬群體不同染色體上相鄰標記間r2存在波動,波動范圍為0.46~0.59,相鄰標記間的平均連鎖不平衡程度r2為0.52,SSC10的r2最低(平均為0.46),SSC6的r2最高(平均為0.59),連鎖不平衡水平隨著標記間距的增加而衰減、變異程度隨之減小。該研究結(jié)果可為杜洛克豬遺傳分析及全基因組選擇研究提供參考。
豬;連鎖不平衡;杜洛克;SNP
連鎖不平衡(Linkage Disequilibrium,LD)又稱等位基因關(guān)聯(lián),是指同一條染色體上,等位基因間廣泛存在的非隨機組合現(xiàn)象[1]。連鎖不平衡是群體遺傳學(xué)研究的重要內(nèi)容之一,在分子生物學(xué)研究與動物遺傳育種領(lǐng)域,群體基因組連鎖不平衡信息是數(shù)量性狀基因座定位、群體遺傳結(jié)構(gòu)分析和全基因組選擇的基礎(chǔ)。連鎖不平衡受選擇、突變和遺傳漂變等因素的影響。隨著科學(xué)技術(shù)的發(fā)展,覆蓋全基因組的高密度遺傳標記已廣泛運用于人和動植物的連鎖不平衡研究,并取得了很大的研究進展。在人類基因組學(xué)研究中,將單核苷酸多態(tài)性(Single Nucleotide Polymorphisms,SNP)作為遺傳標記來深入研究連鎖不平衡已成為一種趨勢。結(jié)合關(guān)聯(lián)分析和功能研究,將包括復(fù)雜疾病及其中間表型在內(nèi)的人類各種表型特征,與基因組上以SNP為主的多態(tài)性位點聯(lián)系起來,這對疾病預(yù)測、預(yù)防和治療等的突破具有重要作用[2]。
目前,在畜禽方面有很多基于連鎖不平衡的研究。在牛的連鎖不平衡研究中,Mckay等[3]利用2 670個SNP標記構(gòu)建了8個不同品種的連鎖不平衡圖譜,并發(fā)現(xiàn)其LD區(qū)域長度不超過500 kb。Lu等[4]利用SNP標記對安格斯牛、夏洛萊牛和雜交牛3個群體進行LD分析,發(fā)現(xiàn)當標記間距小于30 kb時,3個品種的LD分別為0.29、0.22和0.21,認為不同品種和不同染色體間LD強度具有顯著差異。Ross等[5]以r2作為LD的度量指標,利用SNP標記估計了澳大利亞荷斯坦牛、澳洲安格斯牛、新西蘭黑白花奶牛和娟姍牛4個群體的LD,其大小分別為0.35、0.25、0.22和0.14。
在豬的連鎖不平衡研究方面,Amaral等[6]通過分析中國家豬、歐洲家豬和歐洲野豬的371個SNP,發(fā)現(xiàn)歐洲豬種的LD程度高于中國豬種。Badke等[7]以r2作為度量指標對長白豬、約克夏、杜洛克和漢普夏的LD進行比較,發(fā)現(xiàn)在標記間距較小時,杜洛克豬的LD較高;而標記間距較大時,漢普夏豬的LD較低。此外,Ai等[8]比較了中國地方豬和西方家豬的LD,發(fā)現(xiàn)西方家豬的LD高于中國地方豬。
本研究以杜洛克豬為研究對象,基于SNP芯片基因組數(shù)據(jù)分析杜洛克豬群體的連鎖不平衡水平及其衰減規(guī)律,旨在為杜洛克豬的連鎖不平衡研究提供一定的參考。
1.1 試驗材料
試驗對象為福建某核心種豬場的216頭杜洛克豬(公豬20頭,母豬196頭),試驗豬均在常規(guī)條件下飼養(yǎng),體況正常。使用OMEGA Tissue DNA Kit對所有個體的耳組織抽提基因組DNA。采用Illumina Porcine SNP60K芯片[9]進行SNP基因分型[10],共得到61 565個SNP。
1.2 基因型質(zhì)量控制
采用美國農(nóng)業(yè)部和愛荷華州立大學(xué)于2010年9月聯(lián)合組裝的豬基因組(Sus scrofa Build 10)作為參考序列(http://www.animalgenome. org/blast/),利用Plink軟件[11]對供試的216個個體和61 565個SNPs進行基因型質(zhì)量控制。質(zhì)控標準為:個體檢出率(call rate)>0.95,SNP檢出率>0.95,最小等位基因頻率(Minor allele frequency,MAF)>0.05和哈迪-溫伯格平衡P值(Hardy-Weinberg equilibrium,HWE)≥10-6。經(jīng)過質(zhì)控后,剩余215個個體和32 186個有效SNP用于后續(xù)研究。
1.3 LD度量
連鎖不平衡程度通常用D'[12]和r2[13]進行度量,本研究選用r2作為LD的度量標準。r2表示兩個位點統(tǒng)計上和遺傳上相關(guān)程度的關(guān)系(0< r2<1),其表現(xiàn)較穩(wěn)定r2,對基因頻率的變化不敏感。r2的計算公式為:
式中,PA1和PB1是兩個標記位點上第1個等位基因的頻率,PA1B1是等位基因之間形成的單倍型頻率。
采用Haploview軟件[15]計算各SNP之間的r2值,采用R軟件進行后續(xù)的統(tǒng)計分析。
圖1 杜洛克豬質(zhì)量控制后SNP最小等位基因頻率分布
2.1 基因型質(zhì)量控制
供試的216個個體和61 565個SNPs進行基因型質(zhì)量控制后,剩余215個個體和32 186個有效SNP進行后續(xù)分析。質(zhì)控后的SNP最小等位基因頻率(MAF)分布情況見圖1。從圖1可以看出,MAF呈均勻分布,本研究中稀有突變位點極少。其中,70%以上SNP的MAF>0.20,說明本研究中杜洛克豬群體中的SNP多態(tài)性較高,分型數(shù)據(jù)適用于LD的計算和圖譜的構(gòu)建。
2.2 杜洛克豬各染色體LD
杜洛克豬18條常染色體和X染色體r2的衰減趨勢如圖2所示。從圖2可以看出,相鄰標記間的LD水平隨標記間物理距離的增大而衰減。此外,除了SSC6、SSC14、SSC16、SSC17和SSC18等染色體外,其他染色體上個別間距較大的標記之間也存在高r2現(xiàn)象。
2.3 杜洛克豬全基因組LD及LD圖譜
圖2 杜洛克豬各染色體的r2分布
杜洛克豬全基因組r2的衰減趨勢如圖3所示,在全基因組水平上,LD變化趨勢與各染色體LD一致,即LD水平隨標記間距的增加而衰減,LD的變異程度也隨之減小。但在某些距離較遠的SNP標記之間,LD程度也很高。
本研究還構(gòu)建了杜洛克豬全基因組連鎖不平衡圖譜(圖4),圖4中顏色越深代表LD程度越強。結(jié)果表明,除了在相同染色體上的標記間存在LD,不同染色體上的標記間也存在一定程度的LD。
2.4 杜洛克豬不同標記間距的LD分布
本研究統(tǒng)計了杜洛克豬各染色體上相鄰標記間的r2分布情況,從表1可見,杜洛克豬不同染色體上相鄰標記間的r2存在波動,波動范圍為0.46~0.59。
對杜洛克豬的r2統(tǒng)計發(fā)現(xiàn),不同染色體上標記間的LD程度存在差異。本研究分別統(tǒng)計了杜洛克豬在標記間距為50 kb、500 kb、1 Mb和5 Mb時各染色體的LD分布,結(jié)果(表1)表明,SSC10的連鎖不平衡程度較低,SSC6的連鎖不平衡程度較高。
圖3 杜洛克豬全基因組的r2分布
圖4 杜洛克豬全基因組連鎖不平衡圖譜
本研究利用Illumina Porcine SNP60K芯片,對216頭杜洛克豬進行了全基因組LD分析,揭示了該杜洛克豬群體中LD的變化規(guī)律,成功構(gòu)建了杜洛克豬的高密度連鎖不平衡圖譜,為杜洛克豬QTL定位、群體遺傳結(jié)構(gòu)分析及基因組選擇等研究提供了參考。
在相鄰標記(標記間距平均為82 kb)之間,該杜洛克豬群體的平均LD程度為0.52,結(jié)果與Badke等[16]對4個外種豬的LD研究結(jié)果(r2=0.46,相鄰標記間距約為70 kb)相似。在每條染色體之間,杜洛克的LD程度波動范圍為0.46~0.59。這說明杜洛克擁有較高的連鎖不平衡水平,推測其在進化過程中受到高強度的人工選擇,長期的選育也導(dǎo)致了杜洛克豬種的高度純化,從而使其LD程度較高。此外,本研究比較了標記間距為50 kb、500 kb、1 Mb和5 Mb時各染色體的r2分布,發(fā)現(xiàn)SSC10的r2較小,SSC6的r2較大。這與Uimari等[17]對芬蘭長白豬和芬蘭約克夏豬LD進行分析的研究中SSC10 r2偏小的結(jié)果相同。同時,也與Lei等[18]對3個丹麥豬種進行LD分析研究得到SSC10的r2偏小的結(jié)果相同。
表1 杜洛克豬各染色體上標記間的r2分布情況
LD隨著標記間距的增加呈衰減趨勢,標記間r2逐漸降低,本研究結(jié)果與上述規(guī)律一致。但在本研究中發(fā)現(xiàn)某些距離較遠的標記間也存在強LD,這可能和參考基因組序列有關(guān)[19-20]。通過比較不同物種間相鄰標記間的連鎖不平衡發(fā)現(xiàn),杜洛克豬的LD程度高于人類的LD水平[21-22],也高于綿羊的LD水平[23]。參考GWAS和GS的研究,將有用的LD界定為相鄰標記間平均r2>0.3[24],這在本研究中SNP密度是充足的,但質(zhì)控后的SNP在基因組上呈非均勻分布,這可能會影響到SNP芯片在相關(guān)研究中的應(yīng)用效果。
[1]Hill W G,Robertson A. Linkage disequilibrium in finite populations[J]. TAG. Theoretical and applied genetics. Theoretische und angewandteGenetik,1968,38(6):226-231.
[2]Wall J D,Pritchard J K. Haplotype blocks and linkage disequilibrium in the human genome[J]. Nat Rev Genet,2003,4(8):587-597.
[3]McKay S D,Schnabel R D,Murdoch B M,et al. Whole genome linkage disequilibrium maps in cattle[J]. BMC GENET,2007,8(1):74.
[4]Lu D,Sargolzaei M,Kelly M,et al. Linkage disequilibrium in Angus,Charolais,and Crossbred beef cattle[J]. Frontiers in Genetics,2012,3.
[5]de Roos Al APWD,Hayes B J,Spelman R J ,et al. Linkage Disequilibrium and Persistence of Phase in Holsten-Friesian,Jersey and Angus Cattle[J]. Genetics,2008,179(3):1503-1512.
[6]Amaral A J,Megens H J,Crooijmans R P M A,et al. Linkage Disequilibrium Decay and Haplotype Block Structure in the Pig[J]. Genetics,2008,179(1):569-579.
[7]Badke Y M,Bates R O,Ernst C W,et al Estimation of linkage disequilibrium in four US pig breeds[J]. Bmc Genomics,2012,1(13):1-10.
[8]Ai H S,Huang L S,Ren J. Genetic Diversity,Linkage Disequilibrium and Selection Signatures in Chinese and Western Pigs Revealed by Genome-Wide SNP Markers[J]. Plos One,2013,2(8):e56001.
[9]Ramos A M,Crooijmans R P M A,Affara N A,et al. Design of a High Density SNP Genotyping Assay in the Pig Using SNPs Identified and Characterized by Next Generation Sequencing Technology[J]. Plos One,2009,8(4):e6524.
[10]Heaton M P,Harhay G P,Bennett G L,et al. Selection and use of SNP markers for animal identification and paternity analysis in U.S. beef cattle[J]. Mamm Genome,2002,13(5):272-281.
[11]Purcell S,Neale B,Todd-Brown K,et al. PLINK:A Tool Set for Whole-Genome Association and Population-Based Linkage Analyses[J]. The American Journal of Human Genetics,2007,81(3):559-575.
[12]Lewontin R C. The Interaction of Selection and Linkage. I. General Considerations;Heterotic Models[J]. Gnentics,1964,1(49):49-67.
[13]Hill W G. Estimation of linkage disequilibrium in randomly mating populations.[J]. Heredity,1974,33(2):229-239.
[14]Zhao H,Nettleton D,Soller M,et al. Evaluation of linkage disequilibrium measures between multi-allelic markers as predictors of linkage disequilibrium between markers and QTL[J]. Genet Research,2005,86(1):77-87.
[15]Barrett J C,F(xiàn)ry B,Maller J,et al. Haploview: analysis and visualization of LD and haplotype maps[J]. Bioinformatics,2005,21(2):263-265.
[16]Badke Y M,Bates R O,Ernst C W,et al. Estimation of linkage disequilibrium in four US pig breeds[J]. Bmc Genomics,2012,1(13):1-10.
[17]Uimari P,Tapio M. Extent of linkage disequilibrium and effective population size in Finnish Landrace and Finnish Yorkshire pig breeds[J]. J Anim Sci,2011,89(3):609-614.
[18]Wang L,Rensen P S,Janss L,et al. Genomewide and local pattern of linkage disequilibrium and persistence of phase for 3 Danish pig breeds[J]. Bmc Genet,2013,1(14):1-11.
[19]Farnir F,Coppieters W,Arranz J J,et al. Extensive Genome-wide Linkage Disequilibrium in Cattle[J]. Genome Res,2000,10(2):220-227.
[20]Smith E M,Wang X,Littrell J,et al. Comparison of linkage disequilibrium patterns between the HapMap CEPH samples and a family-based cohort of Northern European descent[J]. Genomics,2006,88(4):407-414.
[21]Dunning A M,Durocher F,Healey C S,et al. The extent of linkage disequilibrium in four populations with distinct demographic histories[J]. Am J Hum Genet,2000,67(6):1544-1554.
[22]Kruglyak L. Prospects for whole-genome linkage disequilibrium mapping of common disease genes.[J]. Nat Genet,1999,2(22):139-144.
[23]Zhao F P,Wang G K,Zeng T,et al. Estimations of genomic linkage disequilibrium and effective population sizes in three sheep populations[J]. Livest Sci,2014,170:22-29.
[24]Ai H S,Huang L S,Ren J. Genetic Diversity,Linkage Disequilibrium and Selection Signatures in Chinese and Western Pigs Revealed by Genome-Wide SNP Markers[J]. Plos One,2013,8:e560012.
(責任編輯 崔建勛)
Genome-wide linkage disequilibrium analysis in Duroc pigherd
DIAO Shu-qi,LUO Yuan-yu,CAI Di,CHEN Gui-hua,CHEN Zan-mou,ZHANG Hao,LI Jia-qi,ZHANG Zhe
(College of Animal Science,South China Agricultural University,Guangzhou 510642,China)
In this study,we collected 216 Duroc pigs from a breeding herd in Fujian province and genotyped them with Illumina Porcine SNP60K Bead Chip. Based on the high-density SNP data,the genome-wide LD was calculated with Haploview. Results showed that LD reduced as the marker intervals increasing. The r2between adjacent markers ranged from 0.46 to 0.59 in the Duroc population. The mean r2was 0.52 among adjacent markers across the genome,with the minimum in SSC10 (r2=0.46),and the maximum in SSC6 (r2=0.59). This study provides useful information for further genome-wide analysis of Duroc pig.
pig;linkage disequilibrium;Duroc;SNP
S828.2;Q343.1
A
1004-874X(2016)11-0116-06
2016-08-10
廣東省自然科學(xué)基金(2014A03031345);國家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系項目(CARS-36);華南農(nóng)業(yè)大學(xué)大學(xué)生創(chuàng)新訓(xùn)練項目(201410564155)
刁淑琪(1993-),女,在讀碩士生,E-mail:saradiao@126.com
張哲(1984-),男,博士,副教授,E-mail:zhezhang@scau.edu.cn
刁淑琪,羅元宇,蔡迪,等.杜洛克豬全基因組連鎖不平衡分析[J].廣東農(nóng)業(yè)科學(xué),2016,43(11):116-121.