曾玉琳,蒙裕歡,張 鈺,杜紅麗*
(1.華南理工大學(xué)生物科學(xué)與工程學(xué)院,廣州 510006; 2.廣東省實驗動物監(jiān)測所,廣州 510663)
大鼠具有體型較大、易于研究以及在某些生理特性方面更接近人類等優(yōu)點,是多種生物醫(yī)學(xué)實驗的首選動物模型。其中,Wistar、GK、BN及SD大鼠作為常用的實驗大鼠模型廣泛應(yīng)用于多種藥物和疾病機(jī)制等研究中。Wistar大鼠于1907年由Wistar研究所培育而來,其引進(jìn)時間較早,遍布范圍較廣,廣泛應(yīng)用于世界各國實驗室中[1];Goto-Kakizaki(GK)大鼠是1975年由日本東北大學(xué)的Goto和Kakizaki等[2]從Wistar大鼠中篩選高血糖個體近交繁殖數(shù)代而來,具有高血糖、高胰島素血癥、胰島素抵抗等特性,常用于II型糖尿病的發(fā)病機(jī)制研究;Brown-Norway(BN)大鼠是Silvers和Billingham于1958年運用此前由野生大鼠培育而成的棕色突變型大鼠近交繁殖而來,其對實驗過敏性腦脊髓炎及自身免疫性復(fù)合型腎小球腎炎有抗性,可作為致敏等動物模型[3-4];SD大鼠是1925年由美國的Sprague Dawley農(nóng)場用Wistar大鼠培育而成,其具有較強(qiáng)的適應(yīng)能力和抗病能力,廣泛用于營養(yǎng)學(xué)及病理學(xué)等研究中[5]。
實驗動物的遺傳穩(wěn)定性對實驗的準(zhǔn)確性和可靠性有著一定影響,因此在實驗動物的飼養(yǎng)過程中,對其進(jìn)行定期的遺傳檢測是必不可少的環(huán)節(jié)[6]。生化標(biāo)記基因檢測[7]、免疫標(biāo)記基因檢測[8]以及毛色基因檢測[9]等傳統(tǒng)的遺傳質(zhì)量檢測方法存在著精確度不高以及檢測位點少等局限性,這些檢測方法已不再滿足科學(xué)發(fā)展的需要[10]。隨著基因組學(xué)研究的不斷進(jìn)步,SNP標(biāo)記開始逐漸被應(yīng)用于各種實驗動物的鑒定及遺傳檢測中,相比于傳統(tǒng)的遺傳質(zhì)量檢測方法,利用SNP標(biāo)記具有操作簡單快速、能鑒別出同源品系以及能進(jìn)行大規(guī)模高通量檢測等顯著優(yōu)點[11]。然而,在國內(nèi)外的研究中,應(yīng)用于大鼠遺傳檢測的SNP標(biāo)記的研究卻并不多。Saar等[12]利用3 × 106個SNPs對一系列大鼠進(jìn)行了基因型分析,共發(fā)掘了20 238個有效的SNPs;Guichoux等[13]通過對33 305個已知的候選SNPs進(jìn)行驗證,結(jié)果顯示其中66%的SNPs能通用于不同大鼠品系中,并另外發(fā)掘了287個新的SNPs;蔡月花等[14]對MIJ和HFJ兩個品系的大鼠進(jìn)行了SNP分析研究,確定了這兩個品系大鼠在9個位點的基因型。
目前,篩查到國內(nèi)外廣泛認(rèn)可的有效遺傳標(biāo)記依然是實現(xiàn)實驗動物遺傳質(zhì)量監(jiān)測技術(shù)突破的有途徑之一。因此,開發(fā)出能用于大鼠遺傳檢測的SNP標(biāo)記具有重要意義。本文旨在于利用高通量基因組測序、生物信息技術(shù)及一代測序等方法開發(fā)出能用于快速鑒定Wistar、GK、BN和SD這四種常用品系大鼠的SNP位點,以補(bǔ)充大鼠遺傳質(zhì)量檢測方法,并進(jìn)一步完善常用品系大鼠等位基因信息。
SPF級Wistar大鼠53只,體重170~240 g,1.5月齡;SPF級GK大鼠53只,體重150~220 g,1.5月齡。均購于上海斯萊克實驗動物有限責(zé)任公司[SCXK (滬) 2017-0005]。SPF級BN大鼠50只,體重70~150 g,1月齡;SPF級SD大鼠50只,體重80~150 g,1月齡。均購于北京維通利華實驗動物技術(shù)有限公司[SCXK (京) 2016-0011]。以上大鼠均雌雄各半。大鼠飼養(yǎng)在符合《中華人民共和國衛(wèi)生部實驗動物環(huán)境設(shè)施標(biāo)準(zhǔn)》二級標(biāo)準(zhǔn)的動物房中,恒溫室內(nèi)金屬鼠籠,進(jìn)食標(biāo)準(zhǔn)飼料,可自由飲水,大鼠的鼠尾組織取材堅持實驗動物使用的3R原則,于廣東省實驗動物監(jiān)測所動物實驗設(shè)施內(nèi)進(jìn)行[SYXK (粵) 2016-0122],倫理審查編號為IACUC2014029。
組織基因組DNA提取試劑盒購自天根生化科技有限公司;引物由上海生工生物工程有限公司合成;DNA聚合酶Taq Mix購自TaKaRa寶生物工程有限公司;PCR擴(kuò)增產(chǎn)物送于華大基因測序。PCR擴(kuò)增儀和凝膠成像儀購自美國Bio-Rad公司;DNA電泳儀及電泳槽購自北京六一儀器廠;紫外-可見微量分光光度計購自美國賽默飛世爾科技公司;高速離心機(jī)購自德國Eppendorf公司。
1.3.1 全基因組重測序
提取3只Wistar大鼠和3只GK大鼠的基因組DNA于華大基因Illumina HiSeq 2500平臺進(jìn)行全基因組重測序。
1.3.2 候選SNP的篩查
首先對測序的原始數(shù)據(jù)(raw reads)進(jìn)行截短和過濾得到待分析數(shù)據(jù)(clean reads),然后使用Bowtie 2軟件[15]將clean reads比對到BN大鼠參考基因組(www.ncbi.nlm.nih.gov/genome/?term=Rat)并生成SAM文件,利用Picard軟件[16]去除PCR重復(fù),將SAM文件用SAMtools軟件[17]轉(zhuǎn)換成BAM文件并進(jìn)行排序。在Linux系統(tǒng)上,使用SAMtools軟件對上述準(zhǔn)備好的BAM文件及參考基因組建索引,使用GATK軟件[18]的Haplotype Caller工具進(jìn)行SNP檢測并得到相應(yīng)的VCF文件,最后通過閾值篩選得到最終的VCF文件。
經(jīng)過整理統(tǒng)計,Wistar大鼠比對參考序列檢測出94 800個純合SNP,GK大鼠比對參考序列檢測出106 019個純合SNP,其中有56 216個SNP為Wistar和GK大鼠所共有,又對這些共有的SNP進(jìn)行篩查,發(fā)現(xiàn)BN大鼠參考基因組、Wistar大鼠和GK大鼠三者基因型互不相同的位點僅有38個,從中隨機(jī)挑選了15個作為候選SNP位點(如表1所示)進(jìn)行后續(xù)實驗。
1.3.3 基因組DNA提取與混合池構(gòu)建
使用組織基因組DNA提取試劑盒提取大鼠鼠尾的基因組DNA。在每種大鼠的DNA樣品中挑10個用于后續(xù)單個個體的PCR擴(kuò)增(分別編號為:BN1~BN10、W1~W10、GK1~GK10、SD1~SD10),而其余40個則用于合成DNA混合池。對于合成DNA混合池的樣品,先用紫外分光光度計分別對每個DNA樣品的濃度測量3次,取平均值作為樣品濃度值,然后用TE緩沖液稀釋并定量至50 ng/μL,體積為20 μL,每10個同品系大鼠的DNA混合為一個DNA池(例如Wistar大鼠,將編號為W11~W20的DNA樣品混合為W-A,將編號為W21~W30的DNA樣品混合為W-B,將編號為W31~W40的DNA樣品混合為W-C,將編號為W41~W50的DNA樣品混合為W-D),混合好的16個池用于后續(xù)DNA混合池實驗。
1.3.4 引物設(shè)計與PCR反應(yīng)
提取候選SNP位點上下600 bp序列為模板,使用Primer 6.0分別設(shè)計15對引物(如表2所示)。PCR反應(yīng)程序:94℃預(yù)變性5 min,94℃變性30 s,55℃退火30 s,72℃延伸1 min,循環(huán)35次后于72℃充分延伸10 min,最后于4℃保存。
1.3.5 單個個體測序及比對
對于每個品系10只大鼠的PCR擴(kuò)增產(chǎn)物,分別取15 μL進(jìn)行一代測序,然后利用Lasergene軟件包中的SeqMan對測序結(jié)果進(jìn)行整理與比對。根據(jù)四個品系大鼠序列的比對結(jié)果對SNP位點進(jìn)行進(jìn)一步的篩選:①若同品系的10只大鼠在某一SNP位點的基因型不一致,則不采用該SNP;②若GK大鼠和Wistar大鼠在某一SNP位點的基因型與表1不一致,則不采用該SNP;③對于候選SNP位點上下游序列,若出現(xiàn)能鑒別出某種大鼠的SNP位點,則挑選采用。
注:“AA”、“GG”、“TT”、“CC”為基因型。
Note. “AA”, “GG”, “TT”, and “CC” refer to genotypes.
表2 候選SNP位點對應(yīng)的引物信息
1.3.6 DNA混合池實驗
對最終篩選的位點進(jìn)行擴(kuò)大樣本的DNA混合池實驗,以上述準(zhǔn)備好的16個混合池為模板進(jìn)行PCR擴(kuò)增目的片段,反應(yīng)體系與反應(yīng)程序同上。對PCR產(chǎn)物進(jìn)行測序,利用SeqMan對序列結(jié)果進(jìn)行整理與比對,并查看測序情況。
以W1~W10,GK1~GK10,BN1~BN10和SD1~SD10為模板,用設(shè)計的15對引物擴(kuò)增目的片段。結(jié)果顯示,第7對和第11對引物擴(kuò)增失敗,其余產(chǎn)物均擴(kuò)增成功且可用于測序。
擴(kuò)增成功的產(chǎn)物測序結(jié)果顯示,滿足上述篩選要求的位點有SNP4、SNP5、SNP6、SNP9、SNP12、SNP13、SNP14。除此之外,在這些序列中還發(fā)掘了其他可以用于快速鑒定的6個位點,分別命名為SNP16、SNP17、SNP18、SNP19、SNP20、SNP21。這13個位點在四種大鼠中的等位基因型如表3所示。
對于上述13個SNP位點,DNA混合池的PCR產(chǎn)物測序結(jié)果顯示,除SNP13和SNP16在SD大鼠中出現(xiàn)套峰外(如圖1所示),其他位點均未出現(xiàn)套峰。SNP13在SD大鼠單個個體測序結(jié)果中10個個體都是雜合子,因此在混合池測序時出現(xiàn)套峰屬于正?,F(xiàn)象,而SNP16在SD大鼠中出現(xiàn)輕微G峰,說明SD大鼠群體中存在少數(shù)AG雜合子或GG純合子的個體。
本研究首先利用高通量基因組測序和生物信息技術(shù)篩選了一組候選SNP位點,并繼續(xù)擴(kuò)大樣本量以及增加大鼠種類進(jìn)行測序分型,利用了一代測序?qū)λ姆N大鼠(Wistar、GK、BN、SD大鼠)的候選SNP位點進(jìn)行進(jìn)一步篩查與驗證,最終得到了13個SNP位點以用于四種大鼠的快速鑒定,最后利用DNA混合池法驗證了這些位點在群體中的穩(wěn)定性和用于鑒定的可靠性。
表3 13個SNP位點在四種大鼠中的基因型
注:“AA”、“GG”、“TT”、“CC”為基因型;“—”為堿基缺失。
Note. “AA”, “GG”, “TT”, and “CC” refer to genotypes; “—”refers to base deletion.
注:“W”、“GK”、“BN”、“SD”分別代表Wistar大鼠、GK大鼠、BN大鼠和SD大鼠;A~D分別代表四個DNA混合池。圖1 混合池擴(kuò)增產(chǎn)物的測序峰圖Note. “W”, “GK”, “BN”, and “SD” refer to Wistar, GK, BN, and SD rats, respectively; A-D refer to the four DNA pools, respectively.Figure 1 Sequencing peak maps of DNA pooling amplification products
從這13個SNP位點在四種大鼠中的基因型可以發(fā)現(xiàn),SNP13可鑒別出Wistar、GK、BN和SD四種大鼠,SNP16和SNP17可鑒別出SD大鼠,SNP18和SNP19可鑒別出GK大鼠,SNP20和SNP21可鑒別出BN大鼠,而SNP4、SNP5、SNP6、SNP9、SNP12和SNP14雖然可鑒別出GK和BN大鼠,但區(qū)分不出Wistar和SD大鼠,主要是Wistar大鼠和SD大鼠這兩個品系親緣關(guān)系較近的緣故,因此可以利用多個位點配合進(jìn)行鑒別,例如,SNP4和SNP17結(jié)合也可快速鑒別出四種大鼠。此外,增加檢測的SNP位點個數(shù)會大大提高鑒別的準(zhǔn)確性和可靠性。
混合池實驗顯示,SNP13和SNP16在SD大鼠中出現(xiàn)了套峰。SNP13在SD大鼠單個個體測序結(jié)果中10個個體都是雜合子,而SNP16在SD大鼠中出現(xiàn)輕微G峰,說明在SD大鼠群體中存在少數(shù)AG雜合子或GG純合子的個體,這些現(xiàn)象是由于SD大鼠作為封閉群在這些位點保持著一定的雜合性。鑒于以上結(jié)果,SNP13和SNP16還可以作為SD大鼠封閉群遺傳評估的SNP標(biāo)記,其他未出現(xiàn)套峰的位點說明了在四個大鼠群體中已趨于穩(wěn)定,用于鑒定物種具有可靠性。
實驗動物的遺傳質(zhì)量是衡量其品質(zhì)好壞的重要因素,使用遺傳特性穩(wěn)定的實驗動物才能保證實驗結(jié)果更加具有可靠性和可重復(fù)性[19]。在生物醫(yī)學(xué)研究中,使用具有明確遺傳背景的實驗動物是非常重要的[20],因此,篩查到能監(jiān)測實驗動物遺傳背景的標(biāo)記至關(guān)重要。SNP是基因組中最為豐富且最為常見的可遺傳變異,SNP標(biāo)記也將成為用于大鼠遺傳質(zhì)量監(jiān)測的理想遺傳標(biāo)記[21]。目前應(yīng)用于大鼠遺傳檢測的SNP標(biāo)記的研究較少,對其展開研究并篩選能快速鑒定四種常見品系大鼠的SNP位點,以補(bǔ)充大鼠遺傳質(zhì)量檢測手段,具有進(jìn)一步豐富大鼠SNP數(shù)據(jù)庫的重要意義。