丁 潛, 邢光東, 胡肄農(nóng), 紀(jì)紅軍, 趙慶順, 徐銀學(xué)
(1.南京農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,江蘇 南京210095;2.江蘇省農(nóng)業(yè)科學(xué)院畜牧研究所,江蘇 南京210014;3.江蘇省農(nóng)業(yè)科學(xué)院獸醫(yī)研究所,江蘇 南京210014;4.南京大學(xué)模式動(dòng)物研究所,江蘇 南京210061)
豬個(gè)體身份識(shí)別在豬場管理、豬肉產(chǎn)品溯源等方面意義重要。技術(shù)簡單、成本低廉且操作簡單的耳標(biāo)等傳統(tǒng)方法仍是豬場的主要個(gè)體識(shí)別方法,但應(yīng)用中存在易損、易脫落丟失、易混淆等缺陷?;趥鹘y(tǒng)方法的不足,近年來DNA 個(gè)體鑒定方法,包括微衛(wèi)星標(biāo)記、SNP 標(biāo)記等在內(nèi)的個(gè)體鑒定方法成為研究熱點(diǎn)[1-3],但仍無法得到實(shí)際應(yīng)用。針對(duì)以上情況,我們依據(jù)NCBI 數(shù)據(jù)庫中已登錄的SNP 相關(guān)信息[4],設(shè)計(jì)并篩選可有效且特異進(jìn)行PCR 擴(kuò)增的引物對(duì),以獲得高雜合度SNP 位點(diǎn),用于豬個(gè)體身份DNA 條形碼及相應(yīng)的數(shù)字條形碼編制,實(shí)現(xiàn)豬個(gè)體身份的DNA 識(shí)別。
68 頭杜洛克(Duroc)豬的耳組織樣采自杭州大觀山種豬場,-20 ℃冷凍保存?zhèn)溆??;蚪MDNA模板用DNA Mini Extract 試劑盒(南京潤邦生物技術(shù)有限公司產(chǎn)品)制備,具體制備過程如下(單個(gè)樣本):小米粒大小(1 mm3左右)耳組織放入裝有17.6 μl DNA Mini Extract (A、B 液混合而成)的PCR 管中,PCR 儀中95 ℃5 min,16 ℃1 min(在此過程中暫停PCR 儀,加入10 mg/ml蛋白酶K 2.4 μl),55 ℃2 h,95 ℃10 min,16 ℃1 min,離心取上清或上清混合成模板作PCR 模板。
根據(jù)NCBI 登錄的豬基因組序列,共設(shè)計(jì)31 對(duì)引物,其中8 對(duì)引物的混合樣本PCR 產(chǎn)物電泳條帶單一,直接測(cè)序峰圖背景干凈易讀且包含1 個(gè)或多個(gè)套峰,并獲得H≥0.10 的SNP 位點(diǎn)(表1、表2)。引物擴(kuò)增的PCR 體系(20 μl)為:樣品基因組DNA模板1 μl,正反引物各1 μl,超純水7 μl,2 × PCR Master Mix 10 μl。反應(yīng)條件為:95 ℃先變性2 min;95 ℃變性30 s,退火30 s,72 ℃延伸50 s,共35 個(gè)循環(huán);72 ℃最后延伸10 min。各引物對(duì)的退火溫度和延伸時(shí)間見表1。PCR 擴(kuò)增產(chǎn)物測(cè)序結(jié)果用Vector NTI Advance 11 軟件比對(duì),并結(jié)合分析測(cè)序峰圖,以篩選SNP 位點(diǎn)。
表1 篩選的8 對(duì)引物相關(guān)信息及其退火溫度和延伸時(shí)間Table 1 Information of 8 primer pairs and their annealing temperatures and extending times for PCR reactions
基因的同一條染色體或擴(kuò)增片段SNP 位點(diǎn)之間存在關(guān)聯(lián)性,即SNP 位點(diǎn)連鎖不平衡(Linkage disequilibrium,LD)現(xiàn)象。根據(jù)68 個(gè)杜洛克個(gè)體的擴(kuò)增片段測(cè)序結(jié)果,對(duì)獲得的39 個(gè)SNP 位點(diǎn)的關(guān)聯(lián)性進(jìn)行分析。剔除完全關(guān)聯(lián)的SNP 位點(diǎn),并過濾雜合度小于0.10 的SNP 位點(diǎn),根據(jù)剩余的16 個(gè)SNP 位點(diǎn),對(duì)擴(kuò)增片段進(jìn)行基因分型。
雜合度反映一個(gè)位點(diǎn)具有2 個(gè)以上等位基因的期望值。雜合度小的SNP 位點(diǎn)出現(xiàn)單一純合基因型的概率較大,用于個(gè)體識(shí)別的意義也相對(duì)較小。為了使研發(fā)的DNA 個(gè)體身份識(shí)別技術(shù)更有效,選用雜合度H≥0.10 的SNP 位點(diǎn)。雜合度值的計(jì)算公式如下:
式中,H是雜合度值,Pi是每個(gè)SNP 的等位基因頻率,n是等位基因的數(shù)目。
8 對(duì)引物擴(kuò)增的有效SNP 位點(diǎn)共計(jì)39 個(gè),經(jīng)連鎖不平衡分析及雜合度計(jì)算,最終確定16 個(gè)SNP位點(diǎn)用于杜洛克豬個(gè)體身份識(shí)別的條形碼編制。SNP 條形碼中SNP 位點(diǎn)的排列,以引物對(duì)1 ~8 的次序依次排列(其中每對(duì)引物的SNP 位點(diǎn)以5'-至3'-順序依次排列),組合成SNP 條形碼。其中SNP位點(diǎn)以每對(duì)引物擴(kuò)增產(chǎn)物(正向引物)的第1 個(gè)堿基所在位置計(jì)為+1 進(jìn)行標(biāo)識(shí)。每個(gè)SNP 位點(diǎn)可形成AA、TT、GG、CC、AT、AG、AC、TG、TC、GC 10 種基因型,當(dāng)依次分別用數(shù)字0、1、2、3、4、5、6、7、8、9 共10 個(gè)數(shù)字替代時(shí),每個(gè)個(gè)體不同SNP 位點(diǎn)的基因型就轉(zhuǎn)換為相應(yīng)的數(shù)字SNP 條形碼。
8 對(duì)引物擴(kuò)增68 頭杜洛克豬基因組DNA 樣并測(cè)序,共獲得39 個(gè)SNP 位點(diǎn)(表2)。經(jīng)SNP 位點(diǎn)連鎖不平衡分析及雜合度篩選(H≥0.10),最終選留16 個(gè)SNP 位點(diǎn)用于杜洛克豬的個(gè)體身份識(shí)別(表2)。剔除的23 個(gè)SNP 位點(diǎn),或與選留的SNP位點(diǎn)完全連鎖,或其雜合度H<0.10。雖然雜合度H<0.10 的SNP 位點(diǎn)也能夠與其他SNP 位點(diǎn)一起組成數(shù)量極少的基因型,但是因?yàn)殡s合度過低,在繁育過程中容易產(chǎn)生單一純合子而在后代中丟失多態(tài)性,在個(gè)體識(shí)別中意義不大。
表2 8 對(duì)引物在杜洛克豬中獲得的39 個(gè)SNP 位點(diǎn)Table 2 The 39 SNP loci obtained by 8 PCR primer pairs in Duroc pigs
選留的16 個(gè)H≥0.10 的SNP 位點(diǎn)用于杜洛克豬個(gè)體身份識(shí)別條形碼編制。在豬個(gè)體識(shí)別中,同窩豬樣品的個(gè)體識(shí)別理論上是最困難的,試驗(yàn)中能夠完全區(qū)分的68 個(gè)樣品來自10 窩豬,而由這16 個(gè)SNP 組成的基因型能夠在68 頭杜洛克豬中,完全區(qū)分每個(gè)個(gè)體,實(shí)現(xiàn)個(gè)體識(shí)別(表3)。
表3 編制的用于個(gè)體身份識(shí)別的部分杜洛克豬SNP 條形碼及相應(yīng)的數(shù)字條形碼Table 3 SNP and their corresponding digital barcodes of some of the Duroc pigs used for individual identification
傳統(tǒng)的耳標(biāo)等豬個(gè)體識(shí)別技術(shù)[5],一旦與肉產(chǎn)品分離就會(huì)失去作用,而基因標(biāo)記技術(shù)可以彌補(bǔ)這一缺陷[6]?;驑?biāo)記技術(shù)將成為新一代的溯源或個(gè)體識(shí)別標(biāo)記技術(shù)。在基因標(biāo)記技術(shù)中,SNP 標(biāo)記被公認(rèn)為最具有潛在的實(shí)際應(yīng)用價(jià)值。豬共有18對(duì)常染色體,每個(gè)SNP 位點(diǎn)存在3 種基因型,如果每對(duì)染色體僅篩選、利用1 個(gè)雜合度高的SNP 位點(diǎn),那么理論上18 個(gè)SNP 位點(diǎn)就可以組成近4 億(318=387 420 489)種基因型。實(shí)際上每條染色體上可利用的SNP 位點(diǎn)很多(1 對(duì)引物可同時(shí)擴(kuò)增出多個(gè)SNP 位點(diǎn),且可組成多種可利用的基因型),篩選SNP 位點(diǎn)并用于豬的個(gè)體身份識(shí)別是可行的。本研究篩選的8 對(duì)引物擴(kuò)增片段中組成的基因型分別有2、10、9、3、3、9、3、3 種,理論上可以用于131 220(2 ×10 ×9 ×3 ×3 ×9 ×3 ×3)頭豬的個(gè)體身份識(shí)別,試驗(yàn)中也很好地區(qū)分了所采集的68 頭豬的樣品。
在NCBI 公共數(shù)據(jù)庫中獲得的候選SNP 被用到遺傳學(xué)研究中之前,這些SNP 的驗(yàn)證和其等位基因頻率的估計(jì)是必須的[7]。而對(duì)這些SNP 的等位基因頻率估算,需要大量且相關(guān)度低的樣品,成本很高[8]。通過混合等量個(gè)體DNA 樣品形成混樣來檢測(cè)等位基因頻率,高效且廉價(jià),能夠大大地減少DNA 的用量及分析費(fèi)用[7]。這是本試驗(yàn)選擇使用混合模板的原因。
我們先通過混樣PCR 產(chǎn)物測(cè)序,粗略檢測(cè)SNP位點(diǎn)存在情況,再由每個(gè)個(gè)體的SNP 位點(diǎn)檢測(cè),最終確定1 對(duì)引物所擴(kuò)增的片段是否含有多個(gè)SNP位點(diǎn)存在?;鞓覲CR 產(chǎn)物測(cè)序時(shí)會(huì)出現(xiàn)套峰,無論是個(gè)別優(yōu)勢(shì)模板PCR 的結(jié)果,或是部分模板PCR產(chǎn)物混合的結(jié)果,都能在一定程度上說明套峰出現(xiàn)位置存在SNP 位點(diǎn)。在混樣測(cè)序的結(jié)果中,有3 處套峰都說明該處存在SNP,+502 處雖然在單個(gè)樣品測(cè)序中發(fā)現(xiàn)了SNP,但在混合樣品測(cè)序中并沒有發(fā)現(xiàn),查找其對(duì)應(yīng)的雜合度可知,+502 處的雜合度為0.13,較其他3 處0.37 低了很多。說明混樣測(cè)序中套峰的出現(xiàn),在一定程度上表明該處存在SNP 且雜合度較高。
SNP 位點(diǎn)連鎖不平衡,是指同一條染色體上,2個(gè)SNP 位點(diǎn)間的非隨機(jī)相關(guān),即位于同一條染色體的2 個(gè)SNP 位點(diǎn)同時(shí)存在的概率,大于群體中因隨機(jī)分布而同時(shí)出現(xiàn)的概率。2 個(gè)SNP 位點(diǎn)完全連鎖不平衡時(shí),這2 個(gè)SNP 位點(diǎn)組成的單體型只有2種,在用作個(gè)體身份識(shí)別時(shí)2 個(gè)一起的效果和單獨(dú)一個(gè)是相同的,這樣的SNP 位點(diǎn)只取其一即可。本試驗(yàn)中引物對(duì)3 共獲得9 個(gè)SNP 位點(diǎn),其中+470、+499 和+530 這3 個(gè)SNP 所組成的基因型只有TTTTTT、CCGGCC 和TCTGTC 這3 種,在其余65 個(gè)樣品中這3 個(gè)SNP 也只能組成該3 種基因型。說明在該群體中,若排除新的SNP 出現(xiàn),則+470、+499 和+530 這3 個(gè)SNP 只有TTT 和CGC 這2 種單體型,SNP 完全關(guān)聯(lián),所以+470、+499 和+530 這3 個(gè)SNP 中取+470 一個(gè)用作個(gè)體鑒定即可。而+502 位置和+ 470 位置的SNP 共可組成TCCC、TCTC、TTCC、CCCC 4 種基因型,推斷這2 個(gè)位置有TC、CC、TT 這3 種單體型,SNP 沒有完全關(guān)聯(lián),所以+470 和+502 都可用于個(gè)體識(shí)別。8 對(duì)引物擴(kuò)增的SNP 位點(diǎn)經(jīng)過連鎖不平衡分析,完全連鎖的SNP位點(diǎn)都只保留一個(gè)。其中,雖然引物對(duì)2 和引物對(duì)3 在同一條染色體上,但這2 對(duì)引物所擴(kuò)增的片段在染色體上相距約9 Mbp,擴(kuò)增的SNP 位點(diǎn)之間沒有發(fā)現(xiàn)完全的連鎖不平衡。雜合度過低(H<0.10)的SNP 位點(diǎn)對(duì)于個(gè)體識(shí)別的意義不大,編碼SNP 條形碼和對(duì)應(yīng)的數(shù)字條形碼時(shí),予以舍棄。
[1] INAGAKI S,YAMAMOTO Y,DOI Y,et al.A new 39-plex analysis method for SNPs including 15 blood group loci[J].Forensic Sci Int,2004,144(1):45-57.
[2] LEE H Y,PARK M J,YOO J E,et al.Selection of twenty-four highly informative SNP markers for human identification and paternity analysis in Koreans[J].Forensic Sci Int,2005,148(2-3):107-112.
[3] ZENG Z,WANG L,F(xiàn)ENG Q,et al.Evaluation of 96 SNPs in 14 populations for worldwide individual identification[J].Forensic Sci,2012,57(4):1031-1035.
[4] VAN TASSELL C P,SMITH T P,MATUKUMALLI L K,et al.SNP discovery and allele frequency estimation by deep sequencing of reduced representation libraries[J].Nat Methods,2008,5(3):247-252.
[5] MADEC F,GEERS R,VESSEUR P,et al.Traceability in the pig production chain[J].Rev Sci Tech,2001,20(2):523-537.
[6] GOFFAUX F,CHINA B,DAMS L,et al.Development of a genetic traceability test in pig based on single nucleotide polymorphism detection[J].Forensic Sci Int,2005,151(2-3):239-247.
[7] SASAKI T,TAHIRA T,SUZUKI A,et al.Precise estimation of allele frequencies of single-nucleotide polymorphisms by a quantitative SSCP analysis of pooled DNA[J].Hum Genet,2001,68(1):214-218.
[8] RISCH N,TENG J.The relative power of family-based and casecontrol designs for linkage disequilibrium studies of complex human diseases I.DNA pooling[J].Genome Res,1998,8(12):1273-1288.