陳孝梅 李永勝 藺哲廣 吉挺
(1 揚(yáng)州大學(xué)動(dòng)物科學(xué)與技術(shù)學(xué)院,揚(yáng)州 225009;2 安徽黃山市畜牧技術(shù)推廣中心,黃山 245000)
單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP),指由染色體基因組中單個(gè)核苷酸的突變而引起的DNA的多態(tài)性,包括單堿基的顛換、轉(zhuǎn)換、插入和缺失等形式[1]。一般而言,上述形式中最少一種等位基因在群體中的頻率不小于1%[2],但在某種特殊情況下(如cDNA)也可以小于1%[3]。SNP在基因組內(nèi)可以劃分為兩種形式:一是遍布于基因組的大量單堿基變異,二是基因編碼區(qū)的功能性突變,由于分布在基因編碼區(qū)(coding region),故稱(chēng)其為cSNP。SNP在單個(gè)基因或整個(gè)基因組的分布是不均勻的[4],在非編碼序列中發(fā)生的頻率要高于編碼序列,而且非同義突變(導(dǎo)致氨基酸序列發(fā)生改變的堿基突變)發(fā)生的頻率要比其他方式突變的頻率低得多。一般情況下,SNP多發(fā)生在非編碼區(qū)[5]。
SNP是基于單核苷酸的突變,點(diǎn)突變率通常為10-9,遺傳穩(wěn)定性遠(yuǎn)大于微衛(wèi)星等重復(fù)序列標(biāo)記[6]。
SNP幾乎遍布整個(gè)基因組,而不同基因組之間、同一基因組不同染色體之間及編碼區(qū)與非編碼區(qū)之間的SNP分布頻率都不同。據(jù)估計(jì)人類(lèi)基因組大約平均每1000bp就會(huì)出現(xiàn)一個(gè)SNP,這樣在整個(gè)基因組的分布就多達(dá)300萬(wàn)個(gè)[7]。玉米1號(hào)染色體中每104個(gè)堿基就出現(xiàn)一個(gè)SNP[8]。在大豆基因中,SNP標(biāo)記的平均密度約為272bp出現(xiàn)一個(gè)SNP[9]。Nasu[10]等分析了三個(gè)粳稻品種、兩個(gè)秈稻品種和一個(gè)野生稻之間SNP發(fā)生的頻率,發(fā)現(xiàn)每232個(gè)堿基存在一個(gè)SNP。Kanazin[11]等分析五個(gè)大麥品系的54個(gè)基因時(shí),發(fā)現(xiàn)大麥的38個(gè)基因中存在112個(gè)SNP。晏勵(lì)民[12]等收集了強(qiáng)抗病幼蟲(chóng)個(gè)體(6只)和易感病幼蟲(chóng)個(gè)體(6只),經(jīng)SNP測(cè)序,獲得位于mRNA的與蜜蜂抗白堊病相關(guān)的SNP位點(diǎn)696個(gè),與蜜蜂易感白堊病相關(guān)的SNP位點(diǎn)102個(gè),最終共篩選出71個(gè)與蜜蜂幼蟲(chóng)抗白堊病性狀相關(guān)的SNP位點(diǎn)。在其他哺乳動(dòng)物中SNP的頻率為每500~1000bp出現(xiàn)一次[13]。
某些位于基因內(nèi)部的SNP有可能直接影響蛋白質(zhì)的結(jié)構(gòu)或表達(dá)水平,從而使生物體發(fā)生變異或病變,因此,它們可能代表疾病遺傳機(jī)理中的重要因素。
SNP標(biāo)記與RFLP、SSR等傳統(tǒng)的分子標(biāo)記方法差異很大。在開(kāi)發(fā)檢測(cè)技術(shù)上,過(guò)去一般是建立在凝膠電泳基礎(chǔ)上對(duì)多個(gè)個(gè)體進(jìn)行分析的方法[14],操作步驟繁瑣,效率相對(duì)較低,成本也較高。Quinton[15]表示SNP通常是一種雙等位基因的遺傳變異,在檢測(cè)時(shí)無(wú)需測(cè)量片段的長(zhǎng)度,只利用“+/-”或“全或無(wú)”分析的方式,經(jīng)測(cè)序直接進(jìn)行序列比對(duì)來(lái)發(fā)現(xiàn)差異,因此SNP在技術(shù)上有著較大的優(yōu)勢(shì),加上近年來(lái)各種新興技術(shù)的問(wèn)世,提高了自動(dòng)化檢測(cè)水平。
SNP有多種檢測(cè)方法,學(xué)者按不同分類(lèi)標(biāo)準(zhǔn)將其分為不同的類(lèi)型。董文甫[16]等認(rèn)為SNP的檢測(cè)方法大致可歸結(jié)為兩類(lèi):一類(lèi)是引物延伸,另一類(lèi)是異源雙鏈DNA的識(shí)別,有時(shí)兩者相互連用。曲娟娟[17]等認(rèn)為SNP分析技術(shù)按其研究對(duì)象主要分為兩大類(lèi):尋找未知的SNP或確定某一未知SNP與某遺傳性狀的關(guān)系;對(duì)不同群體已知SNP遺傳多樣性檢測(cè)或?qū)σ阎虏』蜻M(jìn)行診斷。張必弦[18]等將SNP標(biāo)記的研究方法分為四大類(lèi):利用基因測(cè)序(Sequencing)的研究、利用化學(xué)方法的研究、利用電泳方法的研究和利用雜交方法的研究。許家磊[19]等認(rèn)為根據(jù)是否需要凝膠電泳和自動(dòng)化程度的高低,大致可以把SNP的檢測(cè)方法分為兩大類(lèi),即基于凝膠電泳的SNP檢測(cè)方法和高通量、自動(dòng)化程度較高的SNP檢測(cè)方法。
具體的檢測(cè)方法,目前常用的有:直接測(cè)序法、DNA芯片、單鏈構(gòu)象多態(tài)性(SSCP)和變性梯度凝膠電泳(DGGE)。
直接測(cè)序法是最容易實(shí)施的SNP檢測(cè)方法。首先,利用DNA測(cè)序技術(shù)獲得目的片段的堿基序列,然后利用生物信息學(xué)軟件進(jìn)行序列間比對(duì),直觀地尋找SNP,檢出率高達(dá)100%。用此方法還可獲得SNP分型時(shí)所需要的重要信息,如SNP的類(lèi)型和準(zhǔn)確的位置。但該法也存在缺點(diǎn),即不能從序列誤差中鑒別出雜合子個(gè)體,但可以通過(guò)設(shè)計(jì)重復(fù)試驗(yàn)和確認(rèn)試驗(yàn)來(lái)解決此類(lèi)問(wèn)題[20]。通過(guò)該技術(shù),在人類(lèi)的全基因組中檢測(cè)到47172個(gè)SNP,為人類(lèi)高密度SNP圖譜的建立奠定了基礎(chǔ)[21]。
DNA芯片,是用標(biāo)記的探針與特定的DNA樣品雜交,然后通過(guò)檢測(cè)雜交信號(hào)的強(qiáng)弱判斷樣品中靶分子的數(shù)量[22]。該方法實(shí)現(xiàn)了快速、高效、并行的多態(tài)性信息分析,是基于固態(tài)介質(zhì)進(jìn)行分子雜交和原位熒光檢測(cè)的一種高通量的SNP分析方法[23]?;蛐酒夹g(shù)已廣泛應(yīng)用在SNP檢測(cè)和多態(tài)性分析等領(lǐng)域,但其大規(guī)模應(yīng)用和發(fā)展中也存在諸多不足,如檢測(cè)分析范圍較窄、多態(tài)性差和靈敏度等[24]。
單鏈構(gòu)象多態(tài)性是指單鏈DNA由于堿基序列不同而引起空間構(gòu)象差異,這種差異會(huì)導(dǎo)致相同或相近長(zhǎng)度單鏈DNA電泳遷移率的不同,從而可以通過(guò)非變性聚丙烯酰胺凝膠電泳進(jìn)行有效檢測(cè)[19]。該技術(shù)主要是用內(nèi)切酶對(duì)DNA樣品進(jìn)行變性處理,經(jīng)過(guò)非變性PAGE電泳,由于單鏈DNA鏈內(nèi)的堿基會(huì)互作從而發(fā)生卷曲,形成較為穩(wěn)定的空間構(gòu)象,而DNA堿基序列差異會(huì)使DNA卷曲的分子構(gòu)象發(fā)生變化。因此,DNA序列在電泳中所受阻力不同,導(dǎo)致的電泳速度也不同,從而可鑒定出堿基差異的序列[18]。Orita[25]等進(jìn)一步將SSCP用于PCR擴(kuò)增產(chǎn)物的基因突變檢測(cè),通過(guò)PCR結(jié)合SSCP使得分析的靈敏度得到了很大程度的提高。目前,PCR-SSCP技術(shù)被廣泛應(yīng)用于分子生物學(xué)的各個(gè)領(lǐng)域,被認(rèn)為是一種SNP的經(jīng)典檢測(cè)方法[26]。
變性梯度凝膠電泳是Fisher和Lerman[27]在1979年提出的用于檢測(cè)DNA突變的一種電泳技術(shù)。通過(guò)設(shè)置變性劑濃度梯度,單堿基突變的DNA因解鏈行為不同導(dǎo)致遷移率不同,從而達(dá)到分離目的[28]。DGGE能夠檢測(cè)長(zhǎng)達(dá)1kb的DNA片段,如果SNPS恰好出現(xiàn)在發(fā)生部分解旋的DNA區(qū)域內(nèi),其檢出率可達(dá)100%,尤其是100~500bp長(zhǎng)度的片段[29]。因此,DGGE已被廣泛應(yīng)用于SNP的檢測(cè)。但該方法只能對(duì)突變進(jìn)行粗略檢測(cè),一般不能確定突變的位置和類(lèi)型,最終還是要依賴(lài)于DNA測(cè)序[30]。
近年來(lái),SNP標(biāo)記已廣泛應(yīng)用于動(dòng)植物的研究中,對(duì)動(dòng)植物遺傳育種、種質(zhì)資源管理、物種進(jìn)化等領(lǐng)域作出了巨大貢獻(xiàn),已成為生命科學(xué)研究領(lǐng)域不可或缺的工具[31-33]。
SNP標(biāo)記技術(shù)在蜜蜂中的應(yīng)用近年間也已取得一定的進(jìn)展。石元元[34]以中華蜜蜂為實(shí)驗(yàn)材料,利用SNP技術(shù)判定了103只工蜂的126990個(gè)位點(diǎn)的基因型,篩選出3000個(gè)候選SNPs位點(diǎn),最后選取1535個(gè)SNPs標(biāo)記構(gòu)建了東方蜜蜂的第一張遺傳圖譜,該圖譜包含了1535個(gè)遺傳標(biāo)記和16個(gè)連鎖群,其總的遺傳距離是3942.7cm,最大連鎖群的長(zhǎng)度是574.5cm(包含180個(gè)標(biāo)記),每個(gè)標(biāo)記的平均遺傳距離是2.6cm。Sim?es[35]等和Evans[36]等用基因芯片對(duì)發(fā)育期的蜂王和工蜂進(jìn)行研究,蜂王中上調(diào)表達(dá)的基因多數(shù)與機(jī)體的生理代謝相關(guān),而工蜂中上調(diào)表達(dá)的基因則與工蜂的形態(tài)特征及行為特征密切相關(guān)。Ament[37]等用基因芯片技術(shù)在哺育蜂和采集蜂的腦部發(fā)現(xiàn)大量有關(guān)能量代謝的差異表達(dá)基因,采集蜂腦部和腹部的胰島素生長(zhǎng)因子信號(hào)表達(dá)水平顯著高于哺育蜂,可能通過(guò)抑制與胰島素相關(guān)的代謝途徑,推遲蜜蜂采集行為的時(shí)間。潘嬌[38]等用蜜蜂幼蟲(chóng)中新檢測(cè)的1722條基因和175條與王漿分泌可能緊密相關(guān)的基因,設(shè)計(jì)和制備了蜜蜂基因芯片,分別與王漿高產(chǎn)蜜蜂及王漿低產(chǎn)蜜蜂中的哺育蜂的頭部cDNA進(jìn)行雜交,初步篩選出369條差異表達(dá)的基因,并獲得潛在作為王漿高產(chǎn)性狀相關(guān)的分子標(biāo)記的10個(gè)候選基因。Kim[39]等鑒定出的SNP標(biāo)記AmD9成功區(qū)分了近親交配的蜜蜂品系,可以直接用于基因分型和育種應(yīng)用。Kadri[40]對(duì)30個(gè)巴西非洲化蜜蜂群的360只工蜂進(jìn)行了高覆蓋率的重復(fù)測(cè)序,產(chǎn)生了高密度數(shù)據(jù)集,每個(gè)讀取點(diǎn)的平均讀取深度為20.25,該數(shù)據(jù)是非洲化蜜蜂可用的最大基因組資源,能夠?qū)Υ松锶肭终叩姆N群動(dòng)態(tài)、進(jìn)化和遺傳進(jìn)行高分辨率的研究。Parejo[41]等表示一個(gè)低密度的SNP小組可以成為授粉媒介的保護(hù)管理工作的一個(gè)精確且具有成本效益的工具。
作為第三代分子標(biāo)記技術(shù),SNP已廣泛用于蜜蜂的遺傳圖譜、形態(tài)和行為特征、基因分型、種群動(dòng)態(tài)及進(jìn)化等方面。隨著基因組計(jì)劃的逐步深入、SNP檢測(cè)分析技術(shù)的快速發(fā)展、高通量測(cè)序成本的降低,相信SNP標(biāo)記技術(shù)會(huì)為蜜蜂的基因、遺傳、進(jìn)化及保種等領(lǐng)域做出更大的貢獻(xiàn)。