初芹, 李東, 侯詩宇, 石萬海, 劉林, 王雅春
1. 北京市農(nóng)林科學(xué)院畜牧獸醫(yī)研究所, 北京 100097;
2. 中國農(nóng)業(yè)大學(xué)動物科技學(xué)院, 畜禽育種國家工程實驗室, 北京 100193;
3. 鞍山恒利奶牛場, 遼寧 114200;
4. 北京奶牛中心, 北京 100192
基于DNA池測序法篩選奶牛高信息量SNP標(biāo)記的可行性
初芹1, 李東2, 侯詩宇3, 石萬海4, 劉林4, 王雅春2
1. 北京市農(nóng)林科學(xué)院畜牧獸醫(yī)研究所, 北京 100097;
2. 中國農(nóng)業(yè)大學(xué)動物科技學(xué)院, 畜禽育種國家工程實驗室, 北京 100193;
3. 鞍山恒利奶牛場, 遼寧 114200;
4. 北京奶牛中心, 北京 100192
首先選擇139個牛SNP標(biāo)記, 利用DNA池測序法, 根據(jù)測序峰圖中不同堿基信號峰高的比值確定了92個SNP為高信息量標(biāo)記(比值>1/2); 為了進一步驗證篩選的準(zhǔn)確性, 對其中59個標(biāo)記采用基質(zhì)輔助激光解析電離飛行時間質(zhì)譜(Matrix-assisted laser desorption/ionisation time-of-flight mass spectrometry, MALDI-TOF MS)技術(shù)檢測了 122頭荷斯坦牛的基因型。結(jié)果顯示, 檢出率高于 85%的標(biāo)記有 56個, 其平均最小等位基因頻率(Minor allele frequency, MAF)為0.41, 最小值為0.27, 最大值為0.5; MAF>0.3的標(biāo)記有54個, 占96.4%(54/56)。文章結(jié)果表明, 采用DNA池測序法篩選高信息量SNP標(biāo)記是可行和可信的。
奶牛; DNA池; SNP標(biāo)記; 基質(zhì)輔助激光解析電離飛行時間質(zhì)譜技術(shù); 最小等位基因頻率
DNA池(DNA pooling)是將幾個或多個個體的DNA按照一定比例混合后再進行 PCR擴增、位點掃描和分型的一種方法, 具有低成本、高效率的優(yōu)點[1]。研究表明, DNA池與測序技術(shù)相結(jié)合, 在尋找突變位點[2~4]、估計等位基因頻率[5~7]、單倍型推斷[8]、病例-對照研究[9]等領(lǐng)域都有著廣泛的應(yīng)用。
對奶牛進行親子鑒定或個體識別時, 為了增加鑒定效率, 需要選擇信息量高的 SNP標(biāo)記, 如最小等位基因頻率(Minor allele frequency, MAF)高于0.3或以上[10~12]。最小等位基因頻率是指給定群體中不常見等位基因的發(fā)生頻率[13], 是衡量SNP信息含量的一個重要指標(biāo)[14]。然而, 由于SNP標(biāo)記存在較高的品種特異性, 其多態(tài)性甚至在同一品種內(nèi)不同群體之間也存在差異[15]。因此, 不同群體間SNP標(biāo)記的交流和數(shù)據(jù)共享存在局限性。
本研究選擇不同來源的牛SNP標(biāo)記, 采用DNA池測序法并結(jié)合個體基因型測定進行驗證, 研究了DNA池測序法篩選奶牛高信息量 SNP標(biāo)記的可行性。
1.1 DNA池的構(gòu)建
本研究使用的實驗動物來自遼寧鞍山恒利奶牛場, 共122頭荷斯坦母牛。頸靜脈采血, 提取基因組DNA, 使用分光光度計NanoDrop2000測定DNA濃度后調(diào)整至50 ng/μL。篩選無親緣關(guān)系的 30頭牛,取等量DNA進行混池, 4℃保存?zhèn)溆谩?/p>
1.2 SNP標(biāo)記的篩選
1.2.1 SNP標(biāo)記的初選
初步選擇的SNP標(biāo)記主要來源于兩部分, 一部分來自于文獻[11, 12], 另一部分來自北京地區(qū)中國荷斯坦牛芯片數(shù)據(jù)[16]。按照最小等位基因頻率MAF>0.3的標(biāo)準(zhǔn), 選取139個SNP標(biāo)記。
1.2.2 PCR擴增與測序
對初選的139個SNP標(biāo)記, 參考NCBI公布序列, 利用 Primer3.0程序(http: //frodo.wi.mit.edu/ primer3/)設(shè)計引物, 以池DNA為模板, 進行PCR擴增, 2%瓊脂糖凝膠電泳檢測合格后ABI 3730XL測序儀完成測序。測序結(jié)果使用DNAMAN和Chromas分析, 計算不同堿基信號峰比值。
1.2.3 飛行時間質(zhì)譜法
基質(zhì)輔助激光解析電離飛行時間質(zhì)譜(MALDITOF MS), 簡稱飛行時間質(zhì)譜, 是一種高通量、自動化SNP分型技術(shù)。具體步驟是: (1)多重PCR反應(yīng)。利用上下游引物擴增目的序列, 通常為 25~48重PCR擴增; (2)單堿基引物延伸反應(yīng)。單堿基延伸引物3′末端堿基緊挨SNP位點, 當(dāng)進行延伸反應(yīng)時,采用ddNTP替代dNTP, 在SNP位點處僅延伸一個堿基, 連接上的 ddNTP與 SNP位點的等位基因?qū)?yīng); (3)所得產(chǎn)物進行純化處理后, 置于質(zhì)譜儀內(nèi)使之離子化, 并經(jīng)電場以相同動能加速; (4)獲得脈沖式質(zhì)譜圖, 根據(jù)不同質(zhì)荷比的離子化樣品進入無電場區(qū)的飛行時間加以鑒別, 質(zhì)量小的粒子先于質(zhì)量大的粒子到達終點, 由此, 可以區(qū)分不同位置的突變情況。
本研究使用 Assay Design 3.1軟件, 對篩選的SNP標(biāo)記及附近序列進行多重PCR組合和引物設(shè)計,最終確定59個SNP標(biāo)記, 通過兩組反應(yīng)完成(表1)。多重PCR反應(yīng)和單堿基引物延伸反應(yīng)在384微孔板內(nèi), 使用ABI 3700擴增儀完成。產(chǎn)物經(jīng)樹脂純化后,利用Sequenom公司的MassARRAY飛行時間質(zhì)譜檢測系統(tǒng)[17]判定每個個體所有檢測位點的基因型。
表1 59個SNP標(biāo)記的信息
1.3 統(tǒng)計分析
使用Cervus軟件(V 3.1)計算每個SNP位點的最小等位基因頻率(MAF)、觀察雜合度(Ho)、期望雜合度(He)以及多態(tài)信息含量(PIC)。
2.1 SNP位點多態(tài)性分析
由于 DNA池是由 30個無親緣個體等量混合,所以SNP位點處不同堿基信號峰值能夠在一定程度上反映該突變位點在30個個體之間的比例關(guān)系。根據(jù)信號峰的比值從低到高進行了劃分(圖1): (1)等級0, 只有一種顏色信號, 不存在多態(tài); (2)等級1, 低信息量標(biāo)記, 兩種信號比值小于 1/3; (3)等級 2, 中信息量標(biāo)記, 兩種顏色信號比值1/3~1/2; (4)等級3, 高信息量標(biāo)記, 兩種顏色信號比值1/2~1/1。
139個SNP標(biāo)記的等級見表2。其中, 有13個標(biāo)記信號圖譜質(zhì)量差, 難以準(zhǔn)確判斷, 占初選標(biāo)記的9.4%(13/139), 其余126個標(biāo)記得到了清晰可靠的測序結(jié)果。在126個測序結(jié)果可靠的標(biāo)記中, 有11個判定為不存在多態(tài)性。在 115個多態(tài)標(biāo)記中, 92個為等級3, 即高信息量標(biāo)記, 占66.2%(92/139); 16個為等級 2, 即中度信息量標(biāo)記, 占 11.5%(16/139);另外7個為低信息量標(biāo)記, 占5%(7/139)。
2.2 SNP標(biāo)記飛行時間質(zhì)譜法判型結(jié)果
2.2.1 飛行時間質(zhì)譜法檢測平臺的構(gòu)建
本研究SNP標(biāo)記數(shù)量較多, 因此, 對92個可能是高信息量的SNP標(biāo)記進行篩選組合和優(yōu)化, 最終確定了 59個標(biāo)記, 通過兩重反應(yīng)來完成。利用MassARRAY飛行時間質(zhì)譜檢測系統(tǒng)進行每個個體的SNP標(biāo)記基因型判定。
圖1 不同等級SNP的劃分標(biāo)準(zhǔn)箭頭所指為突變位點。
表2 139個SNP標(biāo)記測序后多態(tài)性的等級劃分
為了檢驗飛行時間質(zhì)譜方法的準(zhǔn)確性, 實驗中隨機設(shè)置了10對重復(fù)樣品, 486個一一對應(yīng)基因型數(shù)據(jù)中只有 1個出現(xiàn)不一致, 由此估計本研究中飛行時間質(zhì)譜法判型不一致率為0.002(1/486), 表明結(jié)果準(zhǔn)確率很高, 可以用于后續(xù)分析。
2.2.2 群體SNP檢測結(jié)果
59個SNP標(biāo)記的檢出率見表1, 有3個標(biāo)記的檢出率較低, 分別是 BFGL-NGS-111000(28%)、BTB-00230297(55%)和ARS-BFGL-NGS-10037(62%)。由于飛行時間質(zhì)譜法進行SNP分型時檢出率與準(zhǔn)確性顯著相關(guān), 因此這 3個檢出率低的標(biāo)記不作進一步分析。其余56個標(biāo)記的檢出率最低88%, 平均檢出率為97%。
56個檢出率較高的標(biāo)記均為二態(tài)性標(biāo)記, 與NCBI公布的堿基突變一致。多態(tài)性分析顯示, 56個標(biāo)記的最小MAF為0.27, 最大為0.5, 平均0.41。觀測雜合度(Ho)范圍為 0.38~0.62, 平均 0.50; 期望雜合度(He)范圍是 0.40~0.50, 平均 0.48; 各位點的多態(tài)信息含量(PIC)范圍是0.32~0.38, 平均0.36。結(jié)果表明, 56個標(biāo)記屬于高信息量的SNP標(biāo)記。
3.1 DNA池測序法篩選高信息量SNP的可行性
本研究首先收集文獻和報道中存在較高信息量的SNP標(biāo)記, 共獲得139個SNP標(biāo)記, 這一過程不需要實驗成本投入。然后, 通過 DNA池測序法,根據(jù)測序信號峰比值來判定初選標(biāo)記在實驗群體中的多態(tài)性, 如果兩種顏色信號峰比值為 1/2~1/1,則推斷為高信息量標(biāo)記。最終確定了 92個 SNP標(biāo)記。
為了驗證 DNA池測序法篩選的高信息量 SNP標(biāo)記的準(zhǔn)確性, 進一步通過飛行時間質(zhì)譜法對59個標(biāo)記在 122頭荷斯坦牛群體中的多態(tài)性進行了檢測。本研究估計的飛行時間質(zhì)譜法判型錯誤率為0.002, 與 Anderson等[18]報道的 SNP判型錯誤率0.005~0.0001相一致, 說明 SNP判型結(jié)果是比較可靠的。此外, 由于檢出率與高質(zhì)量結(jié)果顯著相關(guān), 檢出率低于 82%可能會影響結(jié)果準(zhǔn)確性[19], 因此分析中剔除了3個檢出率低于85%的標(biāo)記。其余56個高檢出率的SNP標(biāo)記最低的MAF為0.27, 有54個標(biāo)記的MAF大于0.3, 均屬于高信息量的SNP標(biāo)記。結(jié)果充分說明 DNA池測序法篩查信息量高的 SNP標(biāo)記是一種切實可行的方法。考慮到實驗成本, 只對59個標(biāo)記進行了飛行時間質(zhì)譜分型的驗證, 可以推斷, 其他36個SNP標(biāo)記也具有良好的多態(tài)性。
近年來, SNP標(biāo)記由于其分布廣、遺傳穩(wěn)定、適于高通量檢測等諸多優(yōu)點[12,20], 得到了廣泛的應(yīng)用。然而, 由于 SNP為二態(tài)標(biāo)記, 單個標(biāo)記的檢測效力受到局限, 在許多研究中高雜合度、高信息量的標(biāo)記更有應(yīng)用價值。Ozerov等[21]研究表明, 在遺傳種源鑒定(Genetic stock identification, GSI)中優(yōu)先選擇高信息量的標(biāo)記可以降低所需標(biāo)記數(shù)量的 53%。Heaton等[11]研究安格斯牛親子推斷中報道 32個高信息量SNPs能夠成功推斷96%的親子關(guān)系, 而任意選擇的32個標(biāo)記的成功推斷概率只有9%。Baruch等[22]和周磊等[23]通過模擬研究也表明, 高信息量標(biāo)記的選擇對提高親子鑒定或親本推斷的效率尤為重要。因此, 不同品種、群體進行親子鑒定、個體識別、遺傳種源鑒定等研究往往需要首先從大量 SNP標(biāo)記中篩選出少量高信息量SNP標(biāo)記。如果直接對每一個個體檢測篩選, 工作量大, 成本高, 而采用DNA池法則能夠大大降低實驗成本, 并且仍然能夠滿足準(zhǔn)確率高、重復(fù)性好的要求[24,25]。
3.2 不同來源SNP的比較
本研究初選的139個SNP主要參考美國肉牛群體、歐洲奶牛群體和北京地區(qū)中國荷斯坦牛群報道標(biāo)記, 其中來自國外牛群的標(biāo)記50個, 中國荷斯坦牛群的標(biāo)記76個。測序確定的92個多態(tài)標(biāo)記中31個來自國外牛群, 占62%(31/50); 其余61個來自中國荷斯坦牛群, 占81%(61/76)。可以看出, 不同的群體SNP標(biāo)記多態(tài)性之間存在差異, 中國荷斯坦牛群SNP標(biāo)記篩選高信息量標(biāo)記成功率更高。也就是說,在篩選標(biāo)記時參考親緣關(guān)系相近的群體會更具有參考價值。
[1] Germer S, Holland MJ, Higuchi R. High-throughput SNP allele-frequency determination in pooled DNA samples by kinetic PCR. Genome Res, 2000, 10(2): 258-266.
[2] 崔建勛, 杜紅麗, 張細(xì)權(quán). 雞催乳素基因序列多態(tài)及生物信息學(xué)分析. 遺傳, 2005, 27(2): 208-214.
[3] 肖禮華, 史忠輝, 曾瓊, 穆林, 徐猛, 羅衛(wèi)星, 劉若余,陳志.羊RBP4基因DNA池測序分析. 中國草食動物科學(xué), 2012, 32(5): 5-8.
[4] Jiao S, Chu Q, Wang Y, Xie Z, Hou S, Liu A, Wu H, Liu L, Geng F, Wang C, Qin C, Tan R, Huang X, Tan S, Wu M, Xu X, Liu X, Yu Y, Zhang Y. Identification of the causative gene for Simmental arachnomelia syndrome using a network-based disease gene prioritization approach. PLoS ONE, 2013, 8(5): e64468.
[5] Werner M, Sych M, Herbon N, Illig T, K?nig IR, Wjst M. Large-scale determination of SNP allele frequencies in DNA pools using MALDI-TOF mass spectrometry. Hum Mutat, 2002, 20(1): 57-64.
[6] 崔建勛, 杜紅麗, 張細(xì)權(quán). 利用 DNA 池和測序技術(shù)快速篩查SNPs 及估算基因頻率. 遺傳學(xué)報, 2005, 32(4): 372-377.
[7] 蔣婷婷, 陳星, 李婷婷, 張鳳國, 謝毅, 張建寧, 彭潔,劉天驕, 陳剛, 郭媛. 冠狀動脈粥樣硬化性心臟病 8號染色體基因掃描. 遺傳, 2012, 34(8): 1043-1049.
[8] Kuk AY, Xu J, Yang Y. A study of the efficiency of pooling in haplotype estimation. Bioinformatics, 2010, 26(20): 2556-2263.
[9] Yip SP, Leung KH, Fung WY, Ng PW, Sham PC, Yap MK. A DNA pooling-based case-control study of myopia candidate genes COL11A1, COL18A1, FBN1, and PLOD1 in a Chinese population. Mol Vis, 2011, 17: 810-821.
[10] Fisher PJ, Malthus B, Walker MC, Corbett G, Spelman RJ. The number of single nucleotide polymorphisms and on-farm data required for whole-herd parentage testing in dairy cattle herds. J Dairy Sci, 2009, 92(1): 369-374.
[11] Heaton MP, Harhay GP, Bennett GL, Stone RT, Grosse WM, Casas E, Keele JW, Chitko-McKown CG, Laegreid WW. Selection and use of SNP markers for animal identification and paternity analysis in US beef cattle. Mamm Genome, 2002, 13(5): 272-281.
[12] Werner FA, Durstewitz G, Habermann FA, Thaller G, Kr?mer W, Kollers S, Buitkamp J, Georges M, Brem G, Mosner J, Fries R. Detection and characterization of SNPs useful for identity control and parentage testing in major European dairy breeds. Anim Genet, 2004, 35(1): 44-49.
[13] http: //en. wikipedia. org/wiki/Minor_allele_frequency
[14] Cargill M, Altshuler D, Ireland J, Sklar P, Ardlie K, Patil N, Lane CR, Lim EP, Kalyanaraman N, Nemesh J, Ziaugra L, Friedland L, Rolfe A, Warrington J, Lipshutz R, Daley GQ, Lander ES. Characterization of single-nucleotide polymorphisms in coding regions of human genes. Nat Genet, 1999, 22(3): 231-238.
[15] Krawczak M. Informativity assessment for biallelic single nucleotide polymorphisms. Electrophoresis, 1999, 20(8): 1676-1681.
[16] 郭剛, 周磊, 劉林, 李東, 張勝利, 劉劍鋒, 丁向東, 張毅, 王雅春, 張勤, 張沅. 利用 SNP標(biāo)記進行北京地區(qū)中國荷斯坦牛親子推斷的研究. 畜牧獸醫(yī)學(xué)報, 2012, 43(1): 44-49.
[17] Gabriel S, Ziaugra L, Tabbaa D. SNP genotyping using the Sequenom MassARRAY iPLEX platform. Curr Protoc Hum Genet, 2009, Chapter 2: Unit 2. 12, doi: 10.1002/0471142905.hg0212s60.
[18] Anderson EC, Garza JC. The power of single-nucleotide polymorphisms for large-scale parentage inference. Genetics, 2006, 172(4): 2567-2582.
[19] 趙輝, 王威, 張清潤, 高揚, 趙洪斌, 周珺, 林偉, 曾長青. 高通量飛行時間質(zhì)譜基因分型方法的研究. 生物化學(xué)與生物物理進展, 2005, 32(7): 667-672.
[20] Lee HY, Park MJ, Yoo JE, Chung U, Han GR, Shin KJ. Selection of twenty-four highly informative SNP markers for human identification and paternity analysis in Koreans. Forensic Sci Int, 2005, 148(2-3): 107-112.
[21] Ozerov M, Vasem?gi A, Wennevik V, Diaz-Fernandez R, Kent M, Gilbey J, Prusov S, Niemel? E, V?h? JP. Finding markers that make a difference: DNA pooling and SNP-arrays identify population informative markers for genetic stock identification. PLoS ONE, 2013, 8(12): e82434.
[22] Baruch E, Weller JI. Estimation of the number of SNP genetic markers required for parentage verification. Anim Genet, 2008, 39(5): 474-479.
[23] 周磊, 初芹, 劉林, 劉劍鋒, 王雅春, 張沅. 利用微衛(wèi)星和 SNP 標(biāo)記信息進行奶牛親子鑒定的模擬研究. 畜牧獸醫(yī)學(xué)報, 2011, 42(2): 169-176.
[24] Sham P, Bader JS, Craig I, O'Donovan M, Owen M. DNA pooling: a tool for large-scale association studies. Nat Rev Genet, 2002, 3(11): 862-871.
[25] Kim MK, Nam TS, Choi KH, Jang SY, Kim YO, Lee MC. Usefulness of direct sequencing of pooled DNA for SNP identification and allele-frequency determination compa tible with a common disease/common variant hypothesis. Genet Mol Res, 2010, 9(2): 772-779.
(責(zé)任編委: 陳 宏)
Direct sequencing of DNA pooling for screening highly informative SNPs in dairy cattle
Qin Chu1, Dong Li2, Shiyu Hou3, Wanhai Shi4, Lin Liu4, Yachun Wang2
1. Institute of Animal Husbandry and Veterinary Medicine, Beijing Academy of Agriculture and Forestry Sciences, Beijing 100097, China;
2. Key Laboratory of Agricultural Animal and Breeding, National Engineering Laboratory for Animal Breeding, College of Animal Science and Technology, China Agricultural University, Beijing 100193, China;
3. Anshan Hengli Dairy Cattle Farm, Liaoning 114200, China;
4. Beijing Dairy Cattle Center, Beijing 100192, China
In this study, 139 bovine single nuclear polymorphisms (SNPs) were firstly selected and then directly sequenced using DNA pooling. Based on the ratio of two signal peak values, 92 SNPs with the ratio over 1/2 were consideredas potential highly informative markers. To further verify the reliability of screening system, 59 SNP markers were genotyped in 122 Holstein cattle using matrix-assisted laser desorption/ionisation time-of-flight mass spectrometry(MALDI-TOF MS) method. The results showed that 56 SNPs had a call rate higher than 85%. The minor allele frequency (MAF) of these 56 markers ranged from 0.27 to 0.5, with an average of 0.41; and in which 54 markers had a MAF over 0.3, covering 96.4% of this group of markers (54/56). Our findings indicate that direct sequencing of DNA pooling is a useful and efficient tool for identifying highly informative SNPs.
dairy cattle; DNA pooling; single nuclear polymorphism; matrix-assisted laser desorption/ionisation time-offlight mass spectrometry (MALDI-TOF MS); minor allele frequency
2013-12-04;
2014-03-17
國家科技攻關(guān)計劃項目(編號:2011BAD28B02), 現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系專項資金(編號:CARS-37), 長江學(xué)者與創(chuàng)新團隊發(fā)展計劃項目(編號:IRT1191)和國家自然科學(xué)基金項目(編號:31172191)資助
初芹, 博士, 副研究員, 研究方向:動物遺傳育種。E-mail: chuqinsd@163.com
王雅春, 博士, 副教授, 研究方向:動物遺傳育種與分子數(shù)量遺傳學(xué)。E-mail: wangyachun@cau.edu.cn
10.3724/SP.J.1005.2014.0691
時間: 2014-5-6 15:13:18
URL: http://www.cnki.net/kcms/detail/11.1913.R.20140506.1513.006.html