彭 巍,賈可欣,張子敬,劉 賢,蔡翠翠,李欣淼,雷初朝,陳 宏,黃永震*
(1.青海省畜牧獸醫(yī)科學院,青海大學,青海西寧 810016;2.西北農(nóng)林科技大學動物科技學院,陜西楊凌 712100;3.河南省農(nóng)業(yè)科學院畜牧獸醫(yī)研究所,河南鄭州 450002;4.河南省畜牧總站,河南鄭州 450008)
1665 年Hooke 發(fā)現(xiàn)細胞,打開了從細胞水平認識生物個體的大門;1975 年Sanger 發(fā)明了第1 代基因測序技術(shù),使人們能夠從分子水平上探索細胞的遺傳物質(zhì);21 世紀以來,人類基因組計劃完成,人類對遺傳物質(zhì)的研究更進一步,測序技術(shù)也得到很大提高,但這些測序技術(shù)以及對細胞遺傳物質(zhì)的研究總是基于大量的細胞,所測得的數(shù)據(jù)為細胞群體的平均水平,無法獲得精確的單個細胞的遺傳信息,體現(xiàn)不出細胞間的異質(zhì)性。2009 年,Tang 等在Nature Methods 雜志上初次發(fā)表了單細胞轉(zhuǎn)錄組測序的文章,開啟了單細胞測序的大門。隨著單細胞測序技術(shù)的發(fā)展,單細胞測序與動物遺傳育種的聯(lián)系越來越緊密,為家畜家禽的早期選種及生長性狀的選擇提供重要依據(jù)。本文對單細胞測序技術(shù)及其在畜禽遺傳育種中的應(yīng)用展開綜述,以期為后續(xù)家畜家禽遺傳育種的研究提供參考。
單細胞測序技術(shù)包括單細胞樣本的制備、單細胞分離技術(shù)、單細胞測序技術(shù)以及數(shù)據(jù)處理與分析。
1.1 單細胞樣本制備 單細胞樣本質(zhì)量的好壞直接關(guān)乎到測序結(jié)果的準確與否,在單細胞測序中通常采用新鮮組織樣本分離的細胞,以此避免離體組織缺血缺氧對細胞造成損害。首先對待測樣本進行機械剪切,再根據(jù)樣本的差別加入不同的酶處理,過濾掉沒有被酶消化的大塊組織,對細胞重懸,防止細胞聚集,影響測序結(jié)果。
1.2 單細胞分離與提取 隨著科學技術(shù)的發(fā)展,單細胞分離提取方法已從原始的、低通量的連續(xù)稀釋法發(fā)展為今天的具有高通量的熒光活化細胞分選技術(shù)、微流體技術(shù)等。連續(xù)稀釋法是指在細胞懸液中不斷稀釋細胞群體,直至懸液中細胞個數(shù)僅為1 個或極少數(shù)時停止,該方法成本低廉,操作簡便,但無法辨別細胞,且可能造成DNA 污染。顯微操作法是在顯微鏡下通過觀察細胞形態(tài)或細胞著色情況辨別細胞并分離,該方法的優(yōu)點同連續(xù)稀釋法,缺點為靠人眼辨識細胞易發(fā)生錯誤,且通量低。激光捕獲顯微切割技術(shù)(Laser Capture Microdissection,LCM)是在顯微鏡下選擇要操作的細胞,利用激光捕獲并分離細胞,為低通量的技術(shù),可對用石蠟包埋、福爾馬林固定的組織操作,缺點是激光容易損傷細胞及所含的遺傳物質(zhì)。熒光活化細胞分選(Fluorescent-Activated Cell Sorting,F(xiàn)ACS)使 用熒光色素與細胞表面受體特異性結(jié)合,對細胞做標記,基于標記和激光對細胞選擇,實現(xiàn)對細胞的高通量選擇,不足之處在于此方法需要從大量的懸浮細胞中檢測,對數(shù)量較少的細胞可能會造成損害以致結(jié)果不準確。磁活化細胞分選(Magnetic-Activated Cell Sorting,MACS)與FACS 差異之處在于以帶有特異抗原的磁珠與細胞表面的受體結(jié)合,相比于FACS 作用時間更短,但不如FACS 特異性強。微流控技術(shù)(Microfluidic Control)是在1 個微芯片上集樣本制備、細胞分離為一體,通過計算機控制細胞的分選,可以對細胞精確篩選,靈敏度高,通量高,由于使用芯片作為生物化學功能的集成,該技術(shù)成本較高。拉曼鑷子技術(shù)(Raman Tweezers)是將光鑷與拉曼顯微光譜結(jié)合起來,光鑷用于對單個細胞的固定,拉曼顯微光譜用于檢測細胞信息,這項技術(shù)對細胞無直接接觸,不會損傷細胞,而且提高了對細胞的辨識能力。
1.3 單細胞測序
1.3.1 單細胞基因組測序 單細胞分離成功后,因為單個細胞的基因組DNA 含量過少,所以需要對基因組進行擴增,以便完成高通量的測序。目前已知對基因組擴增方法有基于聚合酶鏈式反應(yīng)(Polymerase Chain Reaction,PCR)的技術(shù)、多重置換擴增(Multiple Displacement Amplification,MDA)技術(shù)、多次退火環(huán)狀循環(huán)擴增(Multiple Annealing And Looping-based Amplification Cycles,MALBAC)和轉(zhuǎn)座子介導的基因組線性擴增技術(shù)(Linear Amplification Via Transposon Insertion)。
具體地,隨機寡核苷酸引物PCR(Primer-extension Preamplification PCR,PEP-PCR)和退變寡核苷酸引 物PCR(Degenerate Oligonucleotide-primed PCR,DOP-PCR)都是將短片段引物隨機結(jié)合在基因組上,在酶的作用下擴增。接頭介導的PCR(Ligationmediated PCR)是先用限制性核酸內(nèi)切酶剪切DNA片段,之后在DNA 片段末端添加擴增引物,隨即擴增DNA。使用PCR 技術(shù)對基因組進行擴增有許多不足之處,非特異性擴增強,擴增效率低,擴增產(chǎn)物的基因組覆蓋率低,不足10%。MDA 的擴增原理是鏈置換,使用DNA 聚合酶如phi29 和耐核酸外切酶的引物在DNA片段上隨機結(jié)合并擴增,擴增產(chǎn)物取代原先的互補鏈成為新的模板,擴增產(chǎn)物為高相對分子質(zhì)量的DNA。MDA 技術(shù)在恒溫30℃下即可完成,具有較高通量,可獲得大量擴增產(chǎn)物,phi29 聚合酶保真性好,全基因組覆蓋率高。MALBAC 將PCR 技術(shù)和MDA 技術(shù)聯(lián)合使用,前5 個循環(huán)使用Bst DNA 聚合酶完成MDA 部分,擴增產(chǎn)物兩端加入互補序列形成環(huán)狀結(jié)構(gòu),防止MDA的基因指數(shù)型增長,此后PCR 擴增,高溫變性使環(huán)狀鏈斷開變?yōu)榫€性結(jié)構(gòu),大量擴增。MALBAC 技術(shù)既克服了PCR 技術(shù)錯配率高的缺點,也克服了MDA 技術(shù)指數(shù)擴增基因組的不足之處,具有高通量,全基因組覆蓋率達90%。轉(zhuǎn)座子介導的線性擴增技術(shù)通過Tn5轉(zhuǎn)座酶切開DNA,插入1 個T7 啟動子,在體外條件下把DNA 轉(zhuǎn)錄為mRNA,再逆轉(zhuǎn)錄為cDNA,降低了擴增過程的錯誤率,全基因組覆蓋度高達97%。
1.3.2 單細胞轉(zhuǎn)錄組測序 單細胞轉(zhuǎn)錄組的測序主要是將DNA 轉(zhuǎn)錄為mRNA 再逆轉(zhuǎn)錄為cDNA,對其進行擴增并測序,可以分為基于全長的測序和基于特殊分子標記的測序?;谌L的測序包括同聚物末端加尾法、Smart-seq、CEL-seq。同聚物末端加尾法和Smartseq都是利用多個單核苷酸聚合物捕獲RNA,逆轉(zhuǎn)錄為cDNA 并擴增。CEL-seq結(jié)合體外擴增技術(shù),在Oligo(dT)引物中添加T7 啟動子,cDNA 合成后即可體外擴增。這些方法有通量低或錯誤率高的不足,而帶有獨特分子標記的測序則可解決這些問題?;谔厥夥肿訕擞浀臏y序有STRT-seq 和Drop-seq,STRT-seq將分子標記與微流控技術(shù)結(jié)合,可對mRNA 的表達定量檢測;Drop-seq是對每個cDNA 分子特殊標記并建庫,可以進行高通量的測序。
1.3.3 單細胞蛋白質(zhì)組測序 蛋白質(zhì)組測序首次出現(xiàn)時間較晚,在2004 年由Nolan 和Dovichi 提出,Nolan 的方法是采用流式細胞儀技術(shù)分析細胞信號,構(gòu)建信號網(wǎng)絡(luò)。Dovichi 的方法側(cè)重于化學細胞術(shù),熒光標記蛋白質(zhì),毛細管電泳分離獲得整個細胞的蛋白質(zhì)指紋圖譜。隨著科技的發(fā)展,近幾年對蛋白質(zhì)組的測序方法也有了更新,如Proximity Ligation Assay for RNA(PLAYR)用不同探針和金屬元素的同位素分別標記RNA 和蛋白質(zhì),用質(zhì)譜流式細胞儀分析RNA 和蛋白質(zhì)。Cellular Indexing of Transcriptomes and Epitopes by Sequencing(CITE)用被寡核苷酸片段標記的抗體和磁珠特異性結(jié)合蛋白質(zhì)和RNA,根據(jù)分子質(zhì)量大小不同分離,測序分析RNA 和蛋白質(zhì)。
1.3.4 單細胞表觀遺傳測序 表觀遺傳是指基因組DNA核苷酸序列不發(fā)生變化而基因、蛋白質(zhì)的表達發(fā)生變化,導致表型改變的可遺傳現(xiàn)象,包括DNA 甲基化,組蛋白乙酰化、甲基化等現(xiàn)象。單細胞表觀遺傳測序最早提出的方法是Hi-C 法,Hi-C 法是將染色質(zhì)區(qū)域捕獲(Chromosome Conformation Capture)與高通量測序技術(shù)(High-throughout sequencing)結(jié)合起來的技術(shù),使用甲醛將DNA 與蛋白質(zhì)鍵合交聯(lián)從而穩(wěn)定DNA 構(gòu)象,之后經(jīng)過酶切、加入生物素、酶連、提取一系列步驟,構(gòu)建新文庫、高通量測序,通過測序結(jié)果觀察染色質(zhì)間的相互作用。此外,亞硫酸鹽測序法也是表觀遺傳測序中應(yīng)用較多的方法,主要是對DNA 甲基化檢測,亞硫酸鹽使未甲基化的胞嘧啶變?yōu)槟蜞奏?,?jīng)過PCR擴增技術(shù)轉(zhuǎn)為胸腺嘧啶,而已經(jīng)甲基化的胞嘧啶不受此干擾。此種方法與新一代高通量測序結(jié)合,可以對全基因組的DNA 甲基化剖析。ATAC-seq是表觀遺傳組測序的一大提高,僅需要少量細胞就可以獲知全基因組范圍內(nèi)的基因調(diào)控序列,實現(xiàn)開放性染色質(zhì)測序,繪制染色質(zhì)可及性圖譜,顯示染色質(zhì)中各位點的位置;這種方法利用單細胞微滴制備系統(tǒng)分離細胞核并使其處于各微滴中,使用活性很高的Tn5 轉(zhuǎn)座酶將細胞核中的核小體切割為很小的片段,測序分析。
1.3.5 多組學聯(lián)合分析 對單個細胞的測序可以了解到該細胞的異質(zhì)性及其在遺傳內(nèi)在機理中的差別,有些細胞數(shù)量少、不易捕獲、在測序過程中會導致細胞損失,因而若對單個細胞進行多組學測序分析,則可以全面充分地了解到細胞信息和行為。目前具有代表性的多組學測序方法包括如下幾種:DR-seq對DNA 和RNA測序,細胞裂解后同時擴增基因組DNA 和RNA,分離測序,但此種方法存在一定的不足,分離DNA 和RNA 時存在有分離不全的問題,導致測序結(jié)果不準確。G&T-seq也是對基因組和轉(zhuǎn)錄組的平行測序,通過帶有短寡核苷酸鏈的磁珠分離RNA 和DNA,分別測序。scM&T-seq基于G&T-seq,對分離后的DNA 用亞硫酸鹽測序甲基化,可以平行測序甲基化和轉(zhuǎn)錄組。3 組學測序方法為對細胞裂解物的上清液轉(zhuǎn)錄組測序,對裂解沉淀物基因組測序和甲基化測序;此外,scTrioseq可以對基因組、甲基化組、轉(zhuǎn)錄組平行測序,通過離心分離出細胞核,對細胞質(zhì)選擇性裂解,分離細胞質(zhì)中的mRNA 與細胞核中的基因組DNA,可對基因組直接測序,也可以亞硫酸鹽測甲基化。
1.4 數(shù)據(jù)處理與分析 單細胞測序后的原始數(shù)據(jù)首先應(yīng)轉(zhuǎn)化為FATSQ 格式,便于數(shù)據(jù)比對;其次要對數(shù)據(jù)有質(zhì)量控制,基于FASTQC 執(zhí)行數(shù)據(jù)質(zhì)量檢驗,由QC值決定數(shù)據(jù)的好壞;第三對數(shù)據(jù)標準化,此步為數(shù)據(jù)處理部分中最重要的步驟,標準化是為消除在前面的實驗操作中由非生物因素導致的數(shù)據(jù)偏差,如在樣本制備過程中樣本的損失、擴增偏差以及測序的不完整等。標準化后的數(shù)據(jù)分析應(yīng)根據(jù)實驗進行不同的設(shè)置,目前常用的有主成分分析法(Principal Components Analysis,PCA)和t-分布隨機鄰域嵌入法(t-Distributed Stochastic Neighbor Embedding,t-SNE),二者都可將高維數(shù)據(jù)降維處理,捕獲細胞間的差別,不同之處在于PCA 無法將數(shù)據(jù)可視化,而t-SNE 則彌補了此不足。
單細胞測序技術(shù)近來在臨床醫(yī)學、微生物、神經(jīng)科學、家畜育種等方面研究迅速,為研究的深入開展提供了理論和實踐依據(jù),本部分對近年來單細胞測序在家畜家禽育種上的應(yīng)用展開介紹。
畜禽生產(chǎn)中,育種技術(shù)為核心技術(shù),提高育種效率、縮短育種年限、對遺傳資源的改良等都是育種過程中的關(guān)鍵問題。隨著生物分子技術(shù)的發(fā)展,動物遺傳育種與分子技術(shù)結(jié)合日漸緊密,全基因組育種、基因編輯育種、分子設(shè)計育種凸顯出來,單細胞測序技術(shù)的應(yīng)用更是為育種實踐提供了新的技術(shù)方法。
2.1 在牛上的應(yīng)用 有研究使用全基因組甲基化測序檢測牛體內(nèi)、體外囊胚細胞,以尋找體外胚胎生產(chǎn)技術(shù)與體內(nèi)差異的原因,進而改進體外胚胎生產(chǎn)技術(shù)。該研究通過對體內(nèi)、體外囊胚的單細胞全基因組甲基化測序,篩選出差異甲基化基因,從而改進體外胚胎生產(chǎn)技術(shù),使其在引進優(yōu)良品種、縮短育種進程、提高育種繁殖效率等方面發(fā)揮出巨大潛能。Soto 等用單細胞RNA測序技術(shù)、實時熒光定量PCR、免疫熒光分析對牛性腺發(fā)育過程中原始生殖細胞的分子特征做了研究,分析早期發(fā)育階段原始生殖細胞的基因表達,闡釋了牛原始生殖細胞的發(fā)育機制,并表明牛的生殖系和人類有相似性。
2.2 在豬上的應(yīng)用 在豬上,對豬早期胚胎進行單細胞轉(zhuǎn)錄組測序,構(gòu)建豬早期胚胎轉(zhuǎn)錄組圖譜,發(fā)現(xiàn)眾多還未進行功能研究的基因,可以擴大豬品種遺傳資源,改良豬的重要性狀。如有研究利用單細胞RNA 測序技術(shù)對瘦肉型豬和肥胖型豬的肌肉分析,發(fā)現(xiàn)在瘦肉型豬中具有比肥胖型豬明顯多的肌系細胞,結(jié)合蛋白質(zhì)組學分析,瘦肉型豬中的鈣離子含量更少,研究顯示鈣離子含量少有助于維持肌系細胞的分化潛能,這2 個因素成為瘦肉型豬脂肪沉積少的重要原因,因此,根據(jù)單細胞測序技術(shù)能夠發(fā)現(xiàn)控制豬優(yōu)良性狀的基因本質(zhì),可從DNA 上開展對豬的選育。
2.3 在羊上的應(yīng)用 在綿羊上,有研究對小尾寒羊的產(chǎn)多羔基因進行卵巢相關(guān)單細胞轉(zhuǎn)錄組測序和蛋白質(zhì)組學分析,篩選出相關(guān)的差異基因和差異蛋白,對這些基因進行功能驗證,闡明多羔性狀的分子遺傳機制,為提高羊的繁殖效率、遺傳性狀改良及分子育種提供了理論基礎(chǔ)。在山羊上,Yin 等通過單細胞轉(zhuǎn)錄組測序比較羔羊和母山羊成熟卵母細胞的基因表達,鑒定出1 086個差異表達基因,闡明了幼山羊的成熟卵母細胞在體外發(fā)育過程中不如成熟母山羊的卵母細胞發(fā)育良好的原因,為提高幼畜體外胚胎移植的效率提供了理論依據(jù),對提升山羊的繁殖性能、縮短世代間隔具有重要意義。
2.4 在家禽上的應(yīng)用 在肉雞上,可以應(yīng)用單細胞測序技術(shù)找尋影響肉雞肌肉生長發(fā)育和脂肪沉積的相關(guān)基因,以此作為分子標記,對肉雞進行輔助選育。有研究以京星黃雞不同發(fā)育階段(5 日齡和100 日齡)的胸肌組織中原代肌細胞和IMF 細胞為對象,應(yīng)用單細胞RNA 測序技術(shù),分析二者中的細胞組成及異質(zhì)性,根據(jù)測序結(jié)果中基因表達的相似性分為成肌細胞群和脂肪細胞群,比較分析這兩個細胞群,發(fā)現(xiàn)與肌肉生長發(fā)育、肌內(nèi)脂肪代謝轉(zhuǎn)運相關(guān)的基因,這些基因可作為分子標記對成肌細胞、IMF 細胞進行選擇,為肉雞肌肉生長、脂肪沉積等性狀的選育提供幫助。
單細胞測序技術(shù)是近年來發(fā)展較快、與生命科學領(lǐng)域結(jié)合緊密的一項技術(shù),在醫(yī)學方面為腫瘤、心臟疾病、肝臟疾病的研究與治療做出了巨大貢獻,如探究腫瘤細胞的微環(huán)境、分析腫瘤細胞的異質(zhì)性為腫瘤疾病的治療提供了理論基礎(chǔ);在育種方面,單細胞測序技術(shù)與植物育種和動物育種結(jié)合加快了分子育種進程。單細胞測序具有高通量、高精確度等特點,可在細胞水平上鑒定分析細胞行為、內(nèi)在機制,可以檢測新細胞,通過多組學聯(lián)合分析可以獲知細胞內(nèi)復(fù)雜的相互作用機制,但單細胞測序技術(shù)還有一定的不足,如較高的成本,無法做到大規(guī)模大批量推廣使用,且在單細胞樣本的分離制備上有一定的難度,對于樣本量較少、不易獲取的細胞,若在實驗過程中造成一定損失,則會導致所得數(shù)據(jù)不精確,故單細胞測序的各分步驟還有待完善。目前所有的單細胞組測序技術(shù)沒有對microRNA、lncRNA 等非mRNA的檢測,有些重要的功能也未發(fā)覺,這也是未來單細胞測序發(fā)展的重點。