宋金益,胡海洋
(中國藥科大學(xué),江蘇 南京 211198)
自2009年第一個單細(xì)胞轉(zhuǎn)錄組測序(Single-cell RNA sequenc ing,sc RNA-seq)技術(shù)問世以來[1],對單個細(xì)胞的遺傳物質(zhì)進行測序已日漸成為生物醫(yī)學(xué)研究的新范式。基于整個轉(zhuǎn)錄組的大量數(shù)據(jù),scRNA-seq以極高的分辨率提供了有關(guān)基因表達及其調(diào)控的全面信息,從而能夠精準(zhǔn)地描述細(xì)胞類型和狀態(tài)。近幾年,隨著單細(xì)胞轉(zhuǎn)錄組測序技術(shù)在靈敏度和精確性方面不斷被改良,不僅可以更高效、更低成本地提供全面的生物信息,同時也使更精確地解析單個細(xì)胞的增殖分化、衰老以及病變過程成為現(xiàn)實。單細(xì)胞組學(xué)技術(shù)的革新正在帶來一場細(xì)胞檢測、分類和鑒定的方法學(xué)革命,其應(yīng)用范圍從早期胚胎發(fā)育擴大到組織器官發(fā)育、神經(jīng)系統(tǒng)、免疫和腫瘤等多個重要領(lǐng)域。
單細(xì)胞轉(zhuǎn)錄組測序基本流程可以概括為單細(xì)胞捕獲、mRNA提取與逆轉(zhuǎn)錄、cDNA擴增、測序文庫構(gòu)建、測序、數(shù)據(jù)分析等。目前,主流的單細(xì)胞測序平臺包括10X Genomics Chromium、Nadia(Dolomite Bio)、BD Rhapsody Single-Cell Analysis System、Illumina Bio-Rad、Fluidigm C1等。雖然scRNA-seq的新平臺仍在不斷涌現(xiàn),但使用最廣泛的平臺仍然是基于Drop-seq測序技術(shù)的10X Genomics Chromium[2],其測序流程如圖1所示。具體如下:從組織中分離細(xì)胞,制備單細(xì)胞懸液;將每個細(xì)胞與具有明顯條形碼的微珠共同封裝在納升級液滴中;分離液滴,裂解細(xì)胞;微珠捕獲細(xì)胞的mRNA,形成STAMPs(Single-cell Transcriptomes Attached to Microparticles);在一個反應(yīng)中逆轉(zhuǎn)錄、擴增和測序數(shù)千個STAMP;使用Barcode獲取每個轉(zhuǎn)錄本的細(xì)胞來源。
圖1 高通量單細(xì)胞轉(zhuǎn)錄組測序(Drop-seq)工作流程
吳昊等[3]開發(fā)的scNT-seq(single-cell metabolically labeled new RNA tagging sequencing)技術(shù)可以大規(guī)模并行分析來自同一細(xì)胞的已存在和新轉(zhuǎn)錄mRNA。CAO等[4]開發(fā)的sci-fate可以用于研究單細(xì)胞轉(zhuǎn)錄組的動態(tài)基因表達。MOUDGIL等[5]介紹了一種在不同細(xì)胞系以及小鼠體內(nèi)可以同時捕捉基因表達和轉(zhuǎn)錄因子結(jié)合位點的單細(xì)胞測序方法scCC(single-cell calling cards)。
DUAN等[6]開發(fā)了基于人工智能度量學(xué)習(xí)的單細(xì)胞類型鑒定新方法scLearn。NITZAN等[7]首次利用生物學(xué)假設(shè)和數(shù)學(xué)優(yōu)化模型,提出完全獨立于參考數(shù)據(jù)的單細(xì)胞空間位置從頭推斷策略。MA等[8]介紹了一種scRNA-seq差異表達基因和基因富集聯(lián)合分析的計算方法iDEA。LANGE等[9]建立了包括再生、重編程以及疾病發(fā)生過程等發(fā)展方向未知的單細(xì)胞命運映射工具CellRank。
在單細(xì)胞水平分析染色質(zhì)可及性可以提供復(fù)雜組織內(nèi)細(xì)胞類型組成和細(xì)胞間變異的關(guān)鍵信息。LI等[10]開發(fā)了基于流式分選并利用熒光標(biāo)記轉(zhuǎn)座酶插入細(xì)胞染色質(zhì)的測序方法 ftATAC-seq(fluorescent tagmentation-and FACS-sorting-based scATAC-seq)。陳曦等[11]詳細(xì)描述了一項基于流式細(xì)胞分選和384孔板的單細(xì)胞染色質(zhì)可及性技術(shù)。
BODENMILLER等[12]使用大規(guī)模高維單細(xì)胞質(zhì)譜成像分析技術(shù),確定了腫瘤和基質(zhì)單細(xì)胞的表型、組織和異質(zhì)性,并能夠根據(jù)細(xì)胞組成和組織來表征乳腺癌組織的細(xì)胞結(jié)構(gòu)。BAYRAKTAR團隊[13]開發(fā)的新工具Cell2location可對不同組織結(jié)構(gòu)進行精細(xì)空間轉(zhuǎn)錄組分析。
除了探索單細(xì)胞的分子特征,采用單細(xì)胞測序技術(shù)還能通過譜系示蹤研究細(xì)胞的正?;蚣膊顟B(tài)[14-15]。PEI等[16]報告了人工DNA重組基因座,即Polylox條形碼,成功實現(xiàn)在高分辨率水平重建細(xì)胞發(fā)育軌跡以及在克隆水平揭示細(xì)胞發(fā)育命運。2020年,PEI等[17]在Polylox系統(tǒng)的基礎(chǔ)上,將DNA條形碼表達為RNA條形碼,實現(xiàn)了在單細(xì)胞水平整合細(xì)胞譜系信息與基因表達信息。
將RNA雜交、蛋白質(zhì)免疫組織化學(xué)、原位測序、質(zhì)譜等技術(shù)與單細(xì)胞空間轉(zhuǎn)錄組、蛋白組學(xué)等進一步整合,可以在時間和空間上實現(xiàn)對細(xì)胞狀態(tài)的檢測[18]。
任兵團隊[19]報道了利用Methyl-HiC技術(shù)可使DNA甲基化與染色質(zhì)結(jié)構(gòu)測定同步進行成為現(xiàn)實。MIMITOU等[20]開發(fā)了一種能夠同時檢測單細(xì)胞蛋白質(zhì)水平和染色質(zhì)可及性的方法PHAGE-ATAC。任兵團隊[21]開發(fā)了單細(xì)胞多組學(xué)技術(shù)Paired-Tag,利用該技術(shù)可在單個細(xì)胞中對組蛋白修飾和轉(zhuǎn)錄組進行聯(lián)合分析。YANAI等[22]將基于微陣列的空間轉(zhuǎn)錄組方法和單細(xì)胞轉(zhuǎn)錄組2種技術(shù)結(jié)合起來,并將多模式交叉分析應(yīng)用于原發(fā)性胰腺腫瘤。
郭國驥等[23]利用簡單低成本的Microwell-seq高通量單細(xì)胞測序平臺,對來自小鼠的40萬個細(xì)胞進行了單細(xì)胞轉(zhuǎn)錄組分析,構(gòu)建了首個哺乳動物細(xì)胞圖譜。這一單細(xì)胞組學(xué)領(lǐng)域里程碑式的研究成果,推動了單細(xì)胞測序在基礎(chǔ)科學(xué)領(lǐng)域的普及。2020年,郭國驥團隊[24]又對60種人體組織類型的樣本進行高通量單細(xì)胞測序分析,系統(tǒng)地繪制了包含8大系統(tǒng)的人類細(xì)胞圖譜,同時對人和小鼠的景觀進行了單細(xì)胞比較分析,確定了保守的遺傳網(wǎng)絡(luò)。
大腦皮層是高級認(rèn)知的中樞,是人類進化過程中大腦中擴張和多樣化最多的區(qū)域。SESTAN等[25]通過跨物種單細(xì)胞數(shù)據(jù)整合分析、免疫染色分析以及重新分析已發(fā)表的數(shù)據(jù),證明了成年人腦中神經(jīng)元生成非常罕見甚至并不存在。KRIEGSTEIN團隊[26]利用單細(xì)胞測序,通過分析神經(jīng)發(fā)生的高峰階段和早期膠質(zhì)發(fā)生期間的10個主要大腦結(jié)構(gòu)和6個新皮質(zhì)區(qū)域,揭示了不同皮層區(qū)域不同細(xì)胞縱向發(fā)育的分子圖譜?,F(xiàn)有的人類腦細(xì)胞圖譜還未涉及腦血管系統(tǒng),而腦血管疾病是引發(fā)死亡和神經(jīng)功能障礙的重要原因,NOWAKOWSKI團隊[27]通過分析約18萬個細(xì)胞的轉(zhuǎn)錄組,成功繪制了成人腦血管系統(tǒng)的細(xì)胞圖譜。
錢俊斌等[28]繪制了一份全面的COVID-19肺炎免疫圖譜,通過分析患有輕度或危重疾病的COVID-19患者的支氣管肺泡灌洗樣本以及非COVID-19肺炎患者樣本,為區(qū)分COVID-19特異性相關(guān)免疫變化的肺局部炎癥信號提供參考。CD8+T細(xì)胞是殺傷癌細(xì)胞的最主要細(xì)胞類群,但在腫瘤發(fā)生過程中,這些T細(xì)胞呈現(xiàn)功能失調(diào)狀態(tài),即T細(xì)胞耗竭。張澤民團隊[29]對來自300多名患者的21種癌癥類型的T細(xì)胞進行測序,確定了不同T細(xì)胞類型轉(zhuǎn)錄物組成的差異。
在人類妊娠早期,子宮黏膜轉(zhuǎn)變?yōu)橥懩?,胎兒胎盤被植入其中,胎盤滋養(yǎng)層細(xì)胞與母體細(xì)胞混合并交流;滋養(yǎng)層-蛻膜相互作用異常是妊娠常見疾病的基礎(chǔ),包括先兆子癇和死產(chǎn)。英國劍橋桑格研究所[30]通過單細(xì)胞測序分析了來自孕早期胎盤的約7萬個單細(xì)胞轉(zhuǎn)錄組與相匹配的母體血液和蛻膜細(xì)胞的轉(zhuǎn)錄組,構(gòu)建了人類蛻膜-胎盤的詳細(xì)分子和細(xì)胞圖譜。LUNDEBERG等[31]以受孕后10周內(nèi)的3個發(fā)育階段的人類心臟樣本為研究對象,綜合利用單細(xì)胞轉(zhuǎn)錄組測序、空間轉(zhuǎn)錄組測序和RNA原位雜交等實驗技術(shù)以及細(xì)胞空間概率分型的計算方法,首次從全器官尺度繪制了人類心臟發(fā)育的單細(xì)胞基因表達空間圖譜。CAMP團隊[32]成功繪制了呼吸道和胃腸道的多個發(fā)育中內(nèi)胚層器官的單細(xì)胞轉(zhuǎn)錄組圖譜。ROY等[33]通過比較來自5個不同組織的57 489個造血干/祖細(xì)胞,跨越人類一生的4個發(fā)育階段,揭示了人類發(fā)育過程中肝臟和骨髓的造血干/祖細(xì)胞的高分辨率單細(xì)胞轉(zhuǎn)錄組圖譜。
湯富酬團隊[34]在人類胚胎和胎兒發(fā)育過程中對4個皮質(zhì)葉和腦橋進行了單細(xì)胞轉(zhuǎn)錄組分析,系統(tǒng)鑒定了人類胚胎發(fā)育關(guān)鍵階段的8種主要細(xì)胞類型及其亞型。MICHAELA等[35]綜合利用scRNA-seq、空間轉(zhuǎn)錄組和原位測序技術(shù),系統(tǒng)地描述了在妊娠前3個月3個發(fā)育階段的人類心臟的空間原型和細(xì)胞異質(zhì)性。MEISTERMANN等[36]明確人類胚胎中譜系規(guī)范事件的精確時間以及相關(guān)的轉(zhuǎn)錄組學(xué)和細(xì)胞命運標(biāo)志物。
單細(xì)胞測序技術(shù)已被廣泛應(yīng)用于癌癥領(lǐng)域,揭示了腫瘤驅(qū)動基因突變、克隆進化、侵襲和轉(zhuǎn)移的潛在機制。LOCASALE課題組[37]首次通過單細(xì)胞測序數(shù)據(jù)解析了黑色素瘤和頭頸癌微環(huán)境中的代謝基因表達圖譜,并確定了不同免疫和基質(zhì)細(xì)胞亞型的代謝特征。MAYNARD等[38]首次在單細(xì)胞轉(zhuǎn)錄組層面上對肺癌患者在治療之前和治療期間的腫瘤樣本進行了橫向及縱向?qū)Ρ?,產(chǎn)生的癌癥和腫瘤微環(huán)境單細(xì)胞圖譜揭示了豐富而動態(tài)的腫瘤生態(tài)系統(tǒng)。ZHANG等[39]對結(jié)直腸癌患者的免疫和基質(zhì)細(xì)胞進行了單細(xì)胞測序分析,同時對人和小鼠關(guān)鍵骨髓亞群進行綜合分析,確定了調(diào)節(jié)腫瘤免疫的關(guān)鍵細(xì)胞間的相互作用,并揭示了目前正在進行臨床試驗的骨髓靶向免疫療法的潛在機制。
張澤民團隊[40]對跨組織分布的腫瘤浸潤淋巴細(xì)胞的組成、譜系和功能狀態(tài)的鑒定,有助于進一步了解肺癌中T細(xì)胞的功能狀態(tài)和動力學(xué)。MERAD等[41]綜合利用scRNA-seq、CITE-seq和TCR-seq技術(shù),對35個非小細(xì)胞肺癌病人的病灶腫瘤與非肺部組織進行分析,成功構(gòu)建了早期肺癌免疫反應(yīng)細(xì)胞圖譜。閻新龍團隊[42]明確了人類肝內(nèi)膽管癌的腫瘤間異質(zhì)性,強調(diào)肝內(nèi)膽管癌細(xì)胞和血管癌相關(guān)成纖維細(xì)胞之間的細(xì)胞間通信的重要性,同時揭示了潛在的治療靶點。MILES等[43]對髓系惡性腫瘤患者樣本進行了單細(xì)胞突變分析,對髓系細(xì)胞的惡化機制以及克隆復(fù)雜性在疾病進程中的變化進行了闡述。
利用單細(xì)胞測序技術(shù)可準(zhǔn)確度量單個細(xì)胞內(nèi)生物信息,技術(shù)的不斷革新進一步推動了單細(xì)胞水平的生理過程和病理機制的解析與發(fā)現(xiàn),從而為尋找新的診斷標(biāo)志物或新的治療靶點提供重要基礎(chǔ),也為提高疾病的診斷和治療水平提供潛在的實踐依據(jù)。
本綜述介紹了單細(xì)胞轉(zhuǎn)錄組測序技術(shù)的原理、測序技術(shù)的革新以及不斷涌現(xiàn)的單細(xì)胞測序新技術(shù),如單細(xì)胞染色質(zhì)可及性測序、空間轉(zhuǎn)錄組測序和單細(xì)胞譜系示蹤技術(shù)等;同時涵蓋了單細(xì)胞測序方法在神經(jīng)系統(tǒng)、發(fā)育生物學(xué)、胚胎學(xué)、免疫學(xué)和腫瘤領(lǐng)域等方面的創(chuàng)新性應(yīng)用,凸顯了單細(xì)胞測序技術(shù)在高度異質(zhì)性單細(xì)胞研究中的巨大優(yōu)勢。與此同時,單細(xì)胞測序技術(shù)仍存在操作煩瑣、檢測成本高等實際問題,限制了技術(shù)被更廣泛應(yīng)用與推廣。此外,單細(xì)胞測序領(lǐng)域在從單細(xì)胞數(shù)據(jù)分析中獲取生物信息內(nèi)容和質(zhì)量等方面仍然有需要克服的技術(shù)和計算限制,同時單細(xì)胞多組學(xué)分析的應(yīng)用仍處于早期階段,仍有許多方向有待探索,并且有相當(dāng)多的發(fā)展機會。