林 辰,張心雅,馬偉燕,柯榮秦
(華僑大學醫(yī)學院,福建 泉州 362021)
基因表達是一個動態(tài)的過程,具有廣泛的時空異質(zhì)性.傳統(tǒng)的轉(zhuǎn)錄組測序?qū)NA的表達量平均化,忽略了細胞群體內(nèi)不同細胞之間基因表達的異質(zhì)性[1].單細胞RNA測序技術(shù)的出現(xiàn)解決了這一問題,它能夠獨立地提供每個細胞的RNA表達譜,區(qū)分出細胞之間的基因表達差異,并鑒定出異質(zhì)細胞群中的稀有細胞[2-3].盡管單細胞RNA測序技術(shù)極大地擴展了人們對細胞群體異質(zhì)性的認識,但是進行單細胞測序需要將細胞從組織中解離,從而導(dǎo)致細胞空間位置信息的丟失[4].而細胞的空間位置信息預(yù)示著細胞之間可能存在相互作用,而這又與生理和病理功能緊密相關(guān),因此有必要將基因表達與空間位置信息聯(lián)系在一起[5].在這種需求的驅(qū)動下,Joakim Lundeberg課題組于2016年首次提出了空間轉(zhuǎn)錄組學的概念,發(fā)表了第一個基于原位捕獲RNA的空間轉(zhuǎn)錄組學技術(shù)[6].此后,一系列能夠進行高通量原位RNA檢測分析的技術(shù)都被歸為空間轉(zhuǎn)錄組學技術(shù)的范疇.盡管這些技術(shù)的原理不盡相同,但都有一個共同點,即記錄所檢測RNA分子的空間位置信息.本文對空間轉(zhuǎn)錄組學技術(shù)的發(fā)展進行介紹,總結(jié)并比較不同技術(shù)之間的優(yōu)缺點,舉例說明空間轉(zhuǎn)錄組學技術(shù)在不同研究領(lǐng)域的應(yīng)用,最后討論其所面臨的挑戰(zhàn)并展望其發(fā)展趨勢.
現(xiàn)有的空間轉(zhuǎn)錄組學技術(shù)在可檢測的基因數(shù)量和可測定的組織大小方面差異很大,可以分為兩大類:一類是基于原位捕獲和測序的方法,在測序之前通過原位捕獲將空間位置信息編碼到轉(zhuǎn)錄本上,之后通過高通量測序獲得轉(zhuǎn)錄本及其空間位置信息;另一類是基于成像的方法,即在RNA的原始位置對其進行染色編碼,實現(xiàn)多重檢測.
為了解決單細胞RNA測序丟失細胞空間位置信息的問題,2016年,Joakim Lundeberg課題組展示了一種利用引物微陣列進行原位RNA表達分析的空間轉(zhuǎn)錄組學技術(shù)(下文簡稱ST技術(shù))[6].該文首次介紹了利用帶有空間標簽序列的引物微陣列原位捕獲轉(zhuǎn)錄本,從而保留轉(zhuǎn)錄本位置信息的方法.其基本原理如圖1所示:將組織切片貼于帶有空間位置信息標簽序列的多聚T堿基引物微陣列芯片上,通過蘇木精-伊紅染色法對組織進行染色并拍照記錄組織的形態(tài);接著對組織進行透化處理及原位逆轉(zhuǎn)錄,獲得帶有空間位置信息的互補DNA(complementary DNA,cDNA);最后通過二代測序獲得基因序列并解碼空間位置信息標簽,通過與組織形態(tài)聯(lián)合分析就可以得到該組織的空間轉(zhuǎn)錄組數(shù)據(jù).利用該技術(shù),他們對小鼠嗅球組織中的RNA進行測序,獲得了組織切片上完整的基因空間表達圖譜.2018年,10x Genomics收購了該技術(shù),并推出Visium芯片技術(shù),與最初的方案相比,進一步提高了空間分辨率和靈敏度,并且成為一種被廣泛接受的商品化空間轉(zhuǎn)錄組學技術(shù),應(yīng)用于生物學不同領(lǐng)域.
圖1 基于原位捕獲和測序的空間轉(zhuǎn)錄組學技術(shù)的基本原理
通過圖1所示的空間轉(zhuǎn)錄組學技術(shù)基本原理可知,實現(xiàn)空間轉(zhuǎn)錄組測序的關(guān)鍵在于對空間位置信息的保留.因此,利用不同的方法構(gòu)建帶有空間位置信息的引物微陣列芯片是此類技術(shù)的核心步驟.Slide-seq是繼ST技術(shù)之后發(fā)表的第二個基于原位捕獲和測序的高通量空間轉(zhuǎn)錄組學技術(shù)[7-8].在Slide-seq中,大量直徑為10 μm的帶有DNA標簽引物的微球首先被平鋪于芯片的表面,通過二代測序方法SoLiD(sequencing by oligonucleotide ligation and detection)技術(shù)原位獲得每個微球的空間DNA標簽序列;然后將組織切片貼附于帶有這些微球的芯片表面,采用組織透化技術(shù)釋放樣品中的RNA進行原位逆轉(zhuǎn)錄,在芯片表面獲得帶有空間位置標簽序列的cDNA;這些cDNA再通過建庫和二代測序可以推斷出所檢測RNA的空間位置信息,從而獲得組織的空間基因表達圖譜.與ST技術(shù)中引物微陣列的引物點相比,Slide-seq的微球直徑更小,因此大大提高了分辨率和靈敏度,達到對單細胞轉(zhuǎn)錄組進行空間定位的水平.為了達到更高的分辨率以實現(xiàn)對單細胞的定位和分析,Vickovic等[9]提出了高分辨率空間轉(zhuǎn)錄組學(high-definition spatial transcriptomics,HDST)技術(shù).HDST技術(shù)使用類似于Slide-seq的方法來提高分辨率,不同的是該技術(shù)將帶有空間位置標簽的微球放置于芯片表面的微孔內(nèi);而這些微球直徑只有2 μm,理論上來說能夠提供比Slide-seq更高的空間分辨率.Seq-Scope技術(shù)是一種基于Illumina測序平臺的空間轉(zhuǎn)錄組學技術(shù),該技術(shù)通過橋式PCR在捕獲芯片的表面生成一系列帶有隨機標簽的引物簇[10].通過成像和測序獲取引物簇的序列及空間位置信息后,利用這些引物簇捕獲組織中的RNA并轉(zhuǎn)錄為待測序的cDNA.該方法可獲得0.5~0.8 μm分辨率的引物簇,進一步提高了空間分辨率,達到單細胞甚至是亞細胞的分辨率水平.除此之外,Pixel-seq[11]和Stereo-seq[12]是最近報道的兩種基于捕獲的空間轉(zhuǎn)錄組學技術(shù).其中Pixel-seq是利用類似于Seq-Scope技術(shù)的原理,通過橋式PCR獲得具有空間分辨率和空間標簽的引物簇[11].Stereo-seq是華大基因所開發(fā)的技術(shù),該方法基于華大基因所特有的DNA納米球(DNA nanoball,DNB)測序芯片,將帶有隨機序列的DNB置于芯片上測序獲得位置及標簽序列后,這些DNB再接上多聚T堿基尾巴作為引物用于捕獲信使RNA(messenger RNA,mRNA),后續(xù)測序步驟與其他方法類似[12].Stereo-seq的特點在于利用DNB芯片的規(guī)則陣列以及DNB的微小尺寸實現(xiàn)高分辨率的空間RNA捕獲,并且擁有較大的整體捕獲面積,達到厘米級別的大視野空間轉(zhuǎn)錄組分析水平.
上述方法都是基于原位轉(zhuǎn)錄本捕獲并測序獲得組織的空間轉(zhuǎn)錄圖譜,其標記空間信息的方法均是基于芯片表面的標簽引物.2020年,Liu等[13]則采用了一種名為組織層面的條形碼編碼的空間組測序(deterministic barcoding in tissue for spatial omics sequencing,DBiT-seq)的微流控空間組測序方法.與其他方法不同,該技術(shù)并不將引物固定于芯片表面,而是通過兩個正交方向的微流控將引物引入組織表面,每個方向50個微通道,每個通道里引入不同的寡聚核苷酸序列進行組合,從而形成2 500個標簽編碼點.通過這種方式獲得的每個標簽編碼點的大小約10 μm,具有較高的空間分辨率.同時,他們利用帶有寡聚核苷酸標簽的抗體對不同蛋白質(zhì)進行空間定位和定量分析,實現(xiàn)了多組學基因表達空間圖譜的構(gòu)建.
總之,利用具有空間位置信息的DNA標簽引物捕獲并標記轉(zhuǎn)錄本的空間位置信息,是基于原位捕獲和測序的空間轉(zhuǎn)錄組學技術(shù)的核心所在.
基于成像的空間轉(zhuǎn)錄組學技術(shù)的本質(zhì)是RNA原位雜交,具體地說就是多重RNA原位雜交技術(shù).嚴格意義上,這一系列技術(shù)的起源都可以追溯到單分子RNA原位雜交技術(shù).早在1998年,F(xiàn)emino等[14]就利用標記有多個熒光基團的DNA探針與RNA分子進行原位雜交,實現(xiàn)了對單分子RNA的原位檢測.不僅如此,Levsky等[15]還在后續(xù)研究中利用顏色組合的方式,突破了光譜分辨的限制,實現(xiàn)了對11個基因的同時檢測.Raj等[16]對該方法進行改進,通過將24~48條的單標記探針雜交于同一個RNA分子上,實現(xiàn)了更加高效靈敏的單分子RNA原位雜交,并將此方法正式命名為單分子熒光原位雜交(single-molecule fluorescenceinsituhybridization,smFISH).Lubeck等[17]通過改變雜交于RNA分子上標記探針的熒光標簽的順序或者比例,利用高分辨顯微鏡進行分辨,從而實現(xiàn)了對多種RNA分子的同時檢測.以上方法均在同一輪成像中進行不同種類RNA分子的原位多重檢測,因此能夠?qū)崿F(xiàn)的檢測通量比較有限.2013年,Ke等[18]首次發(fā)表了原位測序(insitusequencing,ISS)技術(shù),提供了一種通過多輪成像實現(xiàn)顏色序列編碼的方法實現(xiàn)對不同種類的RNA進行高度多重原位檢測的方案.其基本原理如圖2所示,即對同一個RNA分子在其原始位置進行信號放大后利用不同的標記探針進行多次標記成像,并通過高級圖形分析算法,將每一輪的顏色進行配準和標注,得到一串顏色編碼標簽,達到利用不同顏色順序檢測不同基因的目的,從而不受光譜和顯微鏡檢測通道數(shù)量的限制達到高度多重的RNA原位檢測.
圖2 基于成像的空間轉(zhuǎn)錄組學方法的基本原理
ISS的具體做法是在固定的細胞或者組織中將RNA原位逆轉(zhuǎn)錄為cDNA,再將帶有4種堿基組成的基因特異DNA標簽的鎖式探針與其目標基因雜交并連接成環(huán),通過滾環(huán)擴增(rolling circle amplification,RCA)獲得信號放大的RCA產(chǎn)物.為了解析不同RCA產(chǎn)物上的標簽序列,Drmanac等[19]采用邊連接邊測序(sequencing by ligation,SBL)的二代測序技術(shù)對DNA標簽的4種堿基進行測序,結(jié)合圖形信息得到每個擴增產(chǎn)物的標簽序列,從而可以得知該擴增產(chǎn)物所檢測的RNA種類.利用該方法,Ke等[18]展示了在乳腺癌冰凍切片組織中識別31個基因的空間表達圖譜.2016年,基于ISS技術(shù)成立了Cartana公司,正式將該技術(shù)商業(yè)化.2019年,10x Genomics公司收購了Cartana公司.
ISS技術(shù)基于鎖式探針特異識別和RCA進行信號放大,并通過二代測序化學實現(xiàn)原位測序,由于其具有操作簡易和信號穩(wěn)定等特點,所以此后有多種技術(shù)基于鎖式探針和RCA發(fā)展而來.Wang等[20]報道了一種能夠?qū)崿F(xiàn)三維原位測序的STARmap技術(shù),該技術(shù)能夠?qū)?60~1 020個基因?qū)崿F(xiàn)同時檢測.STARmap技術(shù)也是基于鎖式探針來實現(xiàn)靶向原位測序的,與ISS技術(shù)不同的是其探針直接與RNA雜交,并通過輔助的領(lǐng)位雜交引物進行成環(huán)步驟,省去了原始ISS技術(shù)中的逆轉(zhuǎn)錄步驟,這種成環(huán)模式的探針也稱為蝸牛探針.在RCA完成后,通過對擴增產(chǎn)物上的氨基與N-羥基丁二酰亞胺反應(yīng)修飾后與丙烯酰胺一起聚合形成水凝膠,之后使用蛋白酶消化一些自發(fā)熒光的蛋白等使組織透明化,以降低測序中的熒光背景.STARmap還設(shè)計了一種糾錯的連接測序方法以增加測序的準確率,在多重改進條件的保證下,實現(xiàn)了對0.1 mm厚的小鼠大腦皮層中上千個基因的原位檢測,展示了其作為三維原位測序技術(shù)的潛力.Liu等[21]報道的條形碼寡核苷酸多重原位分析(barcoded oligonucleotides ligated on RNA amplified for multiplexed and parallelinsituanalyses,BOLORAMIS)技術(shù)則直接以RNA為模板雜交,并利用能夠在RNA上連接DNA探針的連接酶SplintR連接鎖式探針成環(huán),在RCA后采用SBL方法測得標簽序列,可實現(xiàn)多重RNA原位檢測.利用該方法在細胞系和共培養(yǎng)的神經(jīng)元細胞與小膠質(zhì)細胞上對多達96個基因的空間表達進行了分析,然而卻缺少組織基因表達分析的數(shù)據(jù).
2013年,Ke等[18]除利用帶有標簽的鎖式探針實現(xiàn)多重RNA原位檢測外,還介紹了一種利用帶有幾個堿基缺口的特殊鎖式探針(gap-fill padlock probe)來實現(xiàn)對RNA序列本身進行測序的方法,并將該方法用于不同RNA序列的測序和稀有突變的檢測.Chen等[22]對該方法進行了優(yōu)化,開發(fā)了BaristaSeq技術(shù),利用Phusion DNA聚合酶代替ISS中的Stoffel片段聚合酶,提高了缺口的補充效率,并利用和Illumina測序平臺相同的邊合成邊測序方法獲得了更穩(wěn)定的測序熒光信號,從而實現(xiàn)更長的測序長度.與其他基于鎖式探針的空間轉(zhuǎn)錄組學技術(shù)不同的是,BaristaSeq技術(shù)并非用來檢測單個轉(zhuǎn)錄本的表達位置,而是檢測表達同一個由病毒引入細胞的RNA標簽,從而實現(xiàn)對整個細胞的編碼檢測.此后,Chen等[23]在此基礎(chǔ)上又發(fā)展了BARseq技術(shù),通過對不同細胞的標簽進行原位測序,獲得細胞的空間位置信息,實現(xiàn)了對小鼠大腦聽覺皮層中3 579個神經(jīng)元的連接圖譜繪制.
以上基于鎖式探針的原位測序技術(shù)可以認為是靶向空間轉(zhuǎn)錄組學方法.在2014年,Lee等[24]就開發(fā)了一種高通量原位測序方法,即熒光原位RNA測序(fluorescentinsituRNA sequencing,FISSEQ),能夠非靶向地對轉(zhuǎn)錄組水平的RNA表達同時進行定位分析.FISSEQ技術(shù)之所以能夠?qū)崿F(xiàn)非靶向RNA表達高通量原位分析,是因為其直接將逆轉(zhuǎn)錄獲得的所有cDNA通過單鏈DNA環(huán)化酶CircLigase進行環(huán)化,并通過RCA信號放大后直接對RNA本身進行測序,獲取RNA序列信息來判定不同的基因類型.然而,非靶向檢測與RCA信號放大會導(dǎo)致擴增產(chǎn)物過多而產(chǎn)生光學擁擠效應(yīng),并導(dǎo)致無法正確區(qū)分信號點,降低了檢測效率.最近開發(fā)的擴展測序(expansion sequencing,ExSeq)技術(shù)使用擴展顯微鏡解決了這個問題[25],該技術(shù)利用可膨脹的水凝膠吸水膨脹后將含有擴增產(chǎn)物的組織物理放大,從而增加信號點之間的距離,進而提高了分辨率和檢測效率.
第二類基于成像的方法是在原位雜交技術(shù)基礎(chǔ)上,通過互補熒光探針的雜交來檢測目標序列.2014年,Lubeck等[26]首次提出了連續(xù)單分子熒光原位雜交技術(shù)的概念,并采用該技術(shù)在固定的細胞中利用4種顏色編碼的熒光探針組進行兩輪雜交,同時檢測多個基因,在兩輪雜交之間利用光漂白和DNA酶對上一輪的檢測探針進行消化剝離及新一輪的探針雜交.2015年,Chen等[27]發(fā)表了同樣基于單分子熒光原位雜交的多重抗誤差熒光原位雜交(multiplexed error-robust fluorescenceinsituhybridization,MERFISH)技術(shù),該技術(shù)可以鑒定單個細胞中數(shù)千種RNA的拷貝數(shù)和空間定位.MERFISH利用組合探針與連續(xù)成像等技術(shù)來提高檢測通量,并通過漢明碼糾錯的二進制條形碼來抵消單分子標記檢測錯誤.目前,MERFISH 已廣泛應(yīng)用于多個領(lǐng)域,從單個細胞內(nèi)的轉(zhuǎn)錄本位置到組織水平的空間轉(zhuǎn)錄組學均展示出其獨特的優(yōu)勢.2016年,Shah等[28]結(jié)合雜交鏈式反應(yīng)(hybid chain reaction,HCR)進行信號放大,正式將其連續(xù)單分子RNA熒光原位雜交技術(shù)命名為seqFISH(sequential fluorescenceinsituhybridization).該方法實現(xiàn)了對小鼠海馬體中249個基因的同時檢測,并通過基因表達聚類分析實現(xiàn)了對不同類型細胞的原位鑒別.2019年,Xia等[29]則提出了與支鏈DNA技術(shù)相結(jié)合對MERFISH進行信號放大的方法,證明在基因雜交探針較少的情況下信號放大具有一定的優(yōu)勢,不過使用更多對探針也能替代信號放大的效果.同年,Eng等[30]發(fā)表了seqFISH+技術(shù),該技術(shù)采用和MERFISH相似的探針設(shè)計策略和超分辨成像,不同的是該技術(shù)使用了3個成像通道,經(jīng)過20次反復(fù)雜交獲得60個假單色進行編碼.由于每個通道的20種假單色經(jīng)過3輪解碼可以獲得203(8 000)種基因編碼,所以3個通道就可以編碼24 000種基因.通過該方法,他們在亞細胞分辨率下實現(xiàn)了對1萬個基因的空間表達分析.
2020年,Goh等[31]提出改良型RNA單分子熒光原位雜交技術(shù)并命名為split-FISH.該技術(shù)主要是在RNA與檢測探針之間引入了一對編碼探針,當編碼探針與目標基因雜交后靠近,橋接探針與兩條編碼探針的3’-端和5’-端雜交結(jié)合后再與檢測探針結(jié)合,保證了特異性.通過與MERFISH相同的雜交編碼方法,split-FISH實現(xiàn)了對317個基因的同時檢測.與通過編碼方式實現(xiàn)多重檢測的方法不同,Codeluppi等[32]開發(fā)的循環(huán)單分子熒光原位雜交技術(shù)(cyclic single-molecule fluorescentinsituhybridization,osmFISH)技術(shù)是直接在每一輪雜交中利用不同的熒光標記和檢測通道只檢測3種基因,利用多輪雜交來實現(xiàn)更多的基因檢測;他們經(jīng)過13輪雜交,檢測了小鼠軀體感覺皮質(zhì)層中33種基因的表達,通過基因表達模式區(qū)分并定位了不同類型的細胞.組織上的單細胞分辨率的原位雜交(single cell resolutioninsituhybridization on tissues,SCRINSHOT)技術(shù)[33]則是先通過RCA對RNA信號進行放大后,采用類似osmFISH的多輪不相關(guān)雜交方法,實現(xiàn)了多達29種基因的同時檢測分析.由于osmFISH和SCRINSHOT技術(shù)對不同雜交輪次之間的信號不進行關(guān)聯(lián)配準分析,所以它們之間互不影響,避開了由于光學擁擠產(chǎn)生的信號識別問題,對高表達基因具有更好的檢測效果.
綜上所述,現(xiàn)有的空間轉(zhuǎn)錄組學技術(shù)泛指一類能夠?qū)崿F(xiàn)高度多重RNA原位檢測的新型轉(zhuǎn)錄組分析技術(shù),通過將基因表達信息與組織形態(tài)學信息聯(lián)系在一起,為準確地預(yù)測基因功能和調(diào)控網(wǎng)絡(luò)提供更多的支持信息.然而,這些技術(shù)往往具有不同的檢測通量和分辨率等,研究人員需要根據(jù)不同的目標進行合理的選擇.表1對一些主要的空間轉(zhuǎn)錄組學技術(shù)的特點進行了總結(jié).
表1 不同空間轉(zhuǎn)錄組學技術(shù)的特點
除利用上述方法能夠?qū)崿F(xiàn)對基因表達位置信息的記錄外,還可以利用切割的方法對組織進行空間基因表達分析.激光捕獲顯微切割(laser capture microdissection,LCM)[35]可以對組織切片中感興趣的區(qū)域進行切割捕獲,分離得到的小組織塊可以進行包括轉(zhuǎn)錄組測序在內(nèi)的多組學分析,獲得其含有空間位置信息的基因表達譜等.在Tomo-seq技術(shù)[36]中,冰凍的組織被連續(xù)切片后對每個切片進行轉(zhuǎn)錄組測序,得到具有空間位置信息的基因表達圖譜.Geo-seq技術(shù)[37]則是將組織切割成小塊,對每個小塊進行轉(zhuǎn)錄組測序,利用小組織塊的位置信息重構(gòu)三維基因表達圖譜.雖然Tomo-seq和Geo-seq技術(shù)可以獲得三維空間表達圖譜,但是空間分辨率較低;而LCM雖然能夠獲得高分辨率區(qū)域基因表達譜,但是其分析通量很低.與其他空間轉(zhuǎn)錄組學技術(shù)相比,基于切割的空間轉(zhuǎn)錄組學技術(shù)都存在步驟繁瑣、不易操作的問題.
空間轉(zhuǎn)錄組技術(shù)提供的基因表達的空間位置信息能夠用于建立組織細胞的空間圖譜,具有重要的參考價值.經(jīng)過短短幾年的發(fā)展,現(xiàn)有的空間轉(zhuǎn)錄組學技術(shù)已經(jīng)被廣泛應(yīng)用于神經(jīng)生物學、發(fā)育生物學、腫瘤生物學等領(lǐng)域[38-40].
神經(jīng)科學中的一個主要挑戰(zhàn)是如何系統(tǒng)地了解腦細胞類型及其在組織中的定位,并解析其工作機制.空間轉(zhuǎn)錄組學可以將腦細胞類型與形態(tài)學、生理學和連接性相關(guān)的功能學聯(lián)系起來,從而全面了解腦神經(jīng)回路[41].雖然利用單細胞測序能夠?qū)δX組織中不同類型的細胞進行分型和定義,但是由于獲得的單細胞已經(jīng)從組織解離,所以無法準確定位這些細胞的微環(huán)境,不利于后續(xù)的細胞功能分析.Codeluppi等[32]將小鼠細胞體感區(qū)神經(jīng)元細胞標志基因結(jié)合osmFISH技術(shù)對這些細胞類型進行空間定位.Qian等[34]采用在原有ISS技術(shù)基礎(chǔ)上開發(fā)的pciSeq技術(shù),通過檢測已有單細胞數(shù)據(jù)篩選出來的標志基因,對小鼠海馬區(qū)CA1中的抑制性神經(jīng)元以及不同類群的錐體細胞進行定位.Moffitt等[42]結(jié)合單細胞RNA測序和MERFISH技術(shù)創(chuàng)建了小鼠下丘腦視前區(qū)的空間轉(zhuǎn)錄細胞圖譜,繪制了約100萬個細胞的輪廓,鑒定了約70個具有不同神經(jīng)調(diào)節(jié)特征和空間組織特征的神經(jīng)元群體,該方法為在不同組織和生物體中構(gòu)建細胞圖譜開辟了一條新的途徑.Chen等[43]同樣運用單細胞RNA測序與MERFISH結(jié)合的方法,系統(tǒng)地解析了小鼠伏隔核腦區(qū)的細胞類型,區(qū)分出D1中型多棘GABAergic神經(jīng)元、D2中型多棘GABAergic神經(jīng)元和中間神經(jīng)元等主要細胞類型,并將其分為多種亞型;接著利用MERFISH技術(shù)確定了這些神經(jīng)元亞型在伏隔核腦區(qū)不同位置的空間分布,構(gòu)建了小鼠伏隔核細胞空間圖譜,為伏隔核結(jié)構(gòu)與功能的研究奠定了良好的基礎(chǔ).Yu等[44]利用單細胞測序以及ISS技術(shù)對人腦發(fā)育過程中的中間神經(jīng)元起源和多樣性進行探究,系統(tǒng)地揭示了人類胚胎大腦不同發(fā)育階段中間神經(jīng)元的起源和特異分子標記;其中ISS技術(shù)對基因表達的定位起關(guān)鍵作用.Rodriques等[7]利用其開發(fā)的Slide-seq技術(shù)將單細胞RNA測序確定的細胞類型在小腦和海馬體內(nèi)進行定位,表征小鼠小腦浦肯野層的基因空間表達模式,并展示了創(chuàng)傷性腦損傷小鼠模型中細胞類型特異性反應(yīng)的時間演變.Maynard等[45]選擇人背外側(cè)前額葉皮層(dorsolateral prefrontal cortex,DLPFC)中一個與許多神經(jīng)精神疾病有關(guān)的大腦區(qū)域進行Visium空間轉(zhuǎn)錄組測序,繪制DLPFC中基因表達的層狀圖譜,并利用已發(fā)表的大規(guī)模snRNA-seq(single nuclei RNA sequencing)研究的數(shù)據(jù)進行驗證,確定了已知的精神分裂癥和自閉癥相關(guān)基因的空間分布模式,從而提出了精神分裂癥遺傳易感性的機制.
利用單獨的空間轉(zhuǎn)錄組學技術(shù)也能對神經(jīng)系統(tǒng)中的不同細胞類型進行鑒定和定位.Yao等[46]使用MERFISH技術(shù)分析了小鼠初級運動皮層中的約30萬個細胞,識別了95個神經(jīng)元和非神經(jīng)元細胞簇,發(fā)現(xiàn)不僅是興奮性神經(jīng)元簇,大多數(shù)抑制性神經(jīng)元簇也都有分層組織,構(gòu)建了一個復(fù)雜的空間細胞圖譜.Eng等[30]采用seqFISH+技術(shù)對小鼠腦室下皮層和嗅球中的1萬個基因進行檢測,對其中2 963個細胞進行了空間定位.不同空間轉(zhuǎn)錄組學技術(shù)的組合也有獨特的優(yōu)勢,例如Chen等[47]將ST與ISS技術(shù)相結(jié)合,研究阿爾茨海默病(Alzheimer’s disease,AD)淀粉樣斑塊周圍直徑100 μm的組織結(jié)構(gòu)域的基因表達變化,揭示了富含髓鞘和少突膠質(zhì)細胞基因的基因共表達網(wǎng)絡(luò)的早期改變,以及斑塊誘導(dǎo)基因的多細胞基因共表達網(wǎng)絡(luò),為AD和其他腦部疾病的研究提供了新的思路.
構(gòu)成復(fù)雜生命體組織或器官的細胞都是由多功能干細胞或者祖細胞分化而來的,在胚胎發(fā)育的早期,細胞根據(jù)生長發(fā)育的需要分化為特定細胞,這些細胞的分化軌跡和發(fā)育譜系及其在組織中的空間定位對組織器官的正常發(fā)育至關(guān)重要[48-49].van den Brink等[50]使用單細胞RNA測序和ST技術(shù)比較了小鼠原腸胚和胚胎,在原腸胚中鑒定了以前未知的胚胎細胞類型,并發(fā)現(xiàn)體細胞發(fā)生的關(guān)鍵調(diào)節(jié)因子在胚胎和原腸胚之間具有許多相似的地方.Fawkner-Corbett等[51]通過對來自17例胚胎的77個樣本進行單細胞RNA測序,并對來自5個樣本的8張切片進行空間轉(zhuǎn)錄組測序,探究腸道發(fā)育的分子生物學基礎(chǔ),通過一系列的生物信息學分析,鑒定了腸道發(fā)育過程中的101種細胞類型,繪制了其發(fā)育的空間圖譜.該研究揭示了腸道發(fā)育的一些關(guān)鍵事件,如上皮隱窩-絨毛的形成原理,確定了發(fā)育中的成纖維細胞和肌成纖維細胞亞型的分化層次和功能、血管的擴張、免疫定植和腸道相關(guān)淋巴樣組織的形成等.Asp等[52]采集了妊娠早期3個階段(孕4.5~5.0周,6.5周和9.0周)的心臟組織樣本,采用單細胞測序結(jié)合ST和ISS技術(shù)繪制了心臟發(fā)育過程中基因表達的時空圖譜.ST與ISS技術(shù)聯(lián)合確定了發(fā)育過程中不同的解剖區(qū)域特異的基因表達譜,而單細胞RNA測序則幫助鑒定了細胞的類型,并通過聯(lián)合分析映射到特定的解剖區(qū)域,最終構(gòu)建了妊娠早期3個階段心臟發(fā)育的三維可視化轉(zhuǎn)錄圖譜.這些研究均展示了空間轉(zhuǎn)錄組學技術(shù)對發(fā)育過程中基因表達的時空特異性分析和細胞的定位具有獨特的優(yōu)勢,能夠為其分子機制的研究提供關(guān)鍵信息.
異質(zhì)性是惡性腫瘤的主要特征之一,與癌癥的發(fā)生發(fā)展、轉(zhuǎn)移侵襲以及預(yù)后治療等密切相關(guān).空間轉(zhuǎn)錄組學技術(shù)能夠直接觀測到不同組織區(qū)域基因表達的異質(zhì)性,因此非常適用于腫瘤組織的異質(zhì)性研究.Ke等[18]最早利用ISS技術(shù)觀測到乳腺癌組織中31個基因表達的異質(zhì)性;Svedlund等[53]在此基礎(chǔ)上,利用ISS技術(shù)對乳腺癌組織中91個基因的表達進行分子與形態(tài)學的聯(lián)合分析,構(gòu)建出腫瘤地圖,揭示了與腫瘤亞型關(guān)聯(lián)的腫瘤內(nèi)部異質(zhì)性并觀測到含有少數(shù)細胞亞群的區(qū)域;此外,ISS技術(shù)還被應(yīng)用于稀有突變以及基因融合的原位檢測[54].Berglund等[55]利用ST技術(shù)對前列腺癌的6 750個區(qū)域進行分析,利用反卷積方法提取特異的基因表達譜,揭示了在前列腺癌中健康與腫瘤組織基因表達的變化,并在腫瘤區(qū)域周圍發(fā)現(xiàn)了與腫瘤微環(huán)境重分層相關(guān)的基質(zhì)區(qū)基因表達的梯度.Sun等[56]利用ST技術(shù)研究缺氧狀態(tài)下胰腺導(dǎo)管癌的異質(zhì)性,發(fā)現(xiàn)缺氧使得腫瘤細胞類群從對照組中的9個減少為7個,并對其微環(huán)境中的特異基因表達進行了分析.
此外,單細胞測序與空間轉(zhuǎn)錄組學技術(shù)相結(jié)合也是揭示腫瘤異質(zhì)性的重要手段.Wu等[57]開發(fā)了一種固有亞型分類SCSubtype的單細胞分析方法,揭示了復(fù)發(fā)性乳腺癌腫瘤細胞的異質(zhì)性,結(jié)合ST技術(shù)的分析表明不同臨床亞型的相關(guān)細胞簇在空間上相互排斥.Moncada等[58]將來自胰腺導(dǎo)管癌患者的同一腫瘤組織的樣本分布進行單細胞測序和空間轉(zhuǎn)錄組學分析,利用多模態(tài)交叉分析將癌細胞狀態(tài)映射到不同的空間組織區(qū)域,解析它們與其他類型細胞的相互作用.Ji等[59]將單細胞轉(zhuǎn)錄組測序和空間轉(zhuǎn)錄組學技術(shù)進一步結(jié)合多路復(fù)用離子束成像技術(shù),對一系列人皮膚鱗狀細胞癌(cutaneous squamous cell carci-nomad,cSCC)與匹配的正常皮膚組織進行比較分析,鑒定了cSCC的4種腫瘤細胞亞群,包括1種癌癥特有的腫瘤特異角化細胞(tumor specific keratinocytes,TSK)和3種與正常組織相同的細胞群,并且TSK細胞是細胞通訊的中心.
除了神經(jīng)科學、發(fā)育生物學、腫瘤生物學領(lǐng)域之外,空間轉(zhuǎn)錄組學在其他多個領(lǐng)域的研究中也開始嶄露頭角.Carlberg等[60]利用Visium空間轉(zhuǎn)錄組學技術(shù)對類風濕性關(guān)節(jié)炎(rheumatoid arthritis,RA)和脊柱關(guān)節(jié)炎(spinal arthritis,SpA)患者的滑膜組織進行建庫測序,通過對差異表達基因的功能和通路進行分析,揭示了RA與適應(yīng)性免疫應(yīng)答相關(guān),而SpA與細胞外基質(zhì)及軟骨損傷修復(fù)過程相關(guān).Boyd等[61]利用ST技術(shù)對肺損傷的相關(guān)基因進行空間定位,為研究病毒感染導(dǎo)致肺損傷的機制提供了新的視角.Desai等[62]利用 NanoString 公司的 GeoMx空間轉(zhuǎn)錄組學技術(shù)對新冠病毒感染者的肺部組織進行分析,揭示了病毒感染過程中不同部位受到的不同影響,剖析了新冠病毒在肺部感染組織中引起的免疫反應(yīng)存在異質(zhì)性.在腫瘤免疫學以及免疫治療方面,空間轉(zhuǎn)錄組學技術(shù)也是一種具有很大潛力的分析手段.例如Wu等[63]使用Visium平臺對7名患者的21個組織標本進行空間轉(zhuǎn)錄組測序,結(jié)果表明不同腫瘤區(qū)域(癌區(qū)、癌旁和前沿)的免疫細胞具有高度的多樣性和異質(zhì)性,為腫瘤免疫治療的個性化設(shè)計提供了參考信息.空間轉(zhuǎn)錄組學技術(shù)除應(yīng)用于動物組織外,還在植物組織上進行了嘗試[64];但是植物組織與動物組織的細胞在形態(tài)結(jié)構(gòu)上有很大的差異,因此需要更多的優(yōu)化和處理以保證更好的實驗結(jié)果[65].可以預(yù)見,隨著時間的推移空間轉(zhuǎn)錄組學技術(shù)將會在不同的領(lǐng)域繼續(xù)擴大應(yīng)用.
空間轉(zhuǎn)錄組學的出現(xiàn)讓人們以一種前所未有的視角觀察基因的表達和調(diào)控網(wǎng)絡(luò),使人們對其功能機制有了更深入的了解[66].空間轉(zhuǎn)錄組學技術(shù)已經(jīng)逐漸成為一項被廣泛接受的組學研究新手段,然而當前空間轉(zhuǎn)錄組學仍然面臨許多挑戰(zhàn).尤其是在實驗技術(shù)方面,空間轉(zhuǎn)錄組學仍然有待改進.
首先,目前的空間轉(zhuǎn)錄組學技術(shù)大多數(shù)是基于薄的組織切片,獲得的是基因在二維空間的表達情況,仍然無法實現(xiàn)真正的三維空間轉(zhuǎn)錄組.近期Bergenstr?hle等[67]在BMCGemoimcs雜志上發(fā)表了一篇探索性文章,利用連續(xù)組織切片進行二維空間基因表達分析,然后采用生物信息學工具STUtility,將獲得的二維基因表達圖譜進行重構(gòu)得到三維基因表達圖譜.然而該方法仍然存在過程復(fù)雜、無法保證切片質(zhì)量以及難以獲得完美三維結(jié)構(gòu)等問題,因此是一種折中的辦法.由此可見,基于原位捕獲和測序的空間轉(zhuǎn)錄組學技術(shù)存在如何捕獲三維位置信息的問題,而這個問題可能需要革命性技術(shù)才能夠真正解決.而基于成像的空間轉(zhuǎn)錄組學技術(shù)由于具有真正在原位進行檢測的特點,所以在三維空間轉(zhuǎn)錄組學方面有一定的優(yōu)勢和潛力.理論上來說,只要能夠?qū)π盘桙c進行三維原位成像,獲得其位置信息并進行解碼,便可以獲得三維轉(zhuǎn)錄圖譜.然而,有幾個主要的技術(shù)性問題需要解決,包括如何能夠使組織透明化以對組織內(nèi)部的信號進行成像[68],如何使成像探針和一些方法所需要的酶分子等進入組織內(nèi)部進行反應(yīng),以及如何有效地進行三維成像的大數(shù)據(jù)分析等.STARmap技術(shù)就是利用水凝膠和組織透明化技術(shù),實現(xiàn)了在0.1 mm厚度的小鼠腦組織切片上的三維基因表達分析[20].雖然與常規(guī)的顯微切片幾微米級的厚度相比已經(jīng)有數(shù)量級的增加,并且提供了第三維度的空間信息,但是相對于全腦的尺寸仍然有很大的差距.ExSeq技術(shù)也利用組織透明化技術(shù)[25],并同時引入擴展顯微技術(shù),進一步提高了空間分辨率,實現(xiàn)了三維空間轉(zhuǎn)錄組圖譜的構(gòu)建.
其次,目前的空間轉(zhuǎn)錄組學技術(shù)在單細胞層面的分辨率和基因檢測效率仍然不如普通的單細胞RNA測序[69].總體來說,基于原位捕獲和測序的空間轉(zhuǎn)錄組學技術(shù)擁有較高的基因數(shù)目檢測通量,但單細胞或者亞細胞的空間分辨率較低;而基于成像的空間轉(zhuǎn)錄組學技術(shù)理論上來說具有更高的空間分辨率,但只有較低的基因數(shù)目檢測通量(表1).然而,兩者的單細胞基因數(shù)目檢測效率和分辨率與普通的單細胞RNA測序相比仍然存在差距.這是因為普通的單細胞RNA測序具有更高的基因捕獲效率,幾乎可以無偏差捕獲不同基因的轉(zhuǎn)錄本,并且比較容易實現(xiàn)單細胞之間的真正分離和分析;而基于原位捕獲和測序的空間轉(zhuǎn)錄組學技術(shù)存在捕獲點分辨率不同以及潛在的轉(zhuǎn)錄本擴散等問題,難以很好地區(qū)分單細胞,基于成像的空間轉(zhuǎn)錄組學技術(shù)則由于光學擁擠等因素導(dǎo)致所能分辨的基因數(shù)量有限[32].因此,這些技術(shù)性問題仍然是現(xiàn)有空間轉(zhuǎn)錄組學技術(shù)需要進一步克服的.
再者,空間轉(zhuǎn)錄組學數(shù)據(jù)的分析以及空間轉(zhuǎn)錄組數(shù)據(jù)庫的建立仍然有待開發(fā)和完善.空間轉(zhuǎn)錄組學數(shù)據(jù)分析的主要目的是將帶有位置信息的基因表達原始數(shù)據(jù)轉(zhuǎn)化為有用的生物學信息,如細胞的空間定位和細胞之間的通訊等[70].空間轉(zhuǎn)錄組學中最重要的數(shù)據(jù)是基因表達的位置信息,而將這些基因表達數(shù)據(jù)定位到組織中的單細胞水平是目前研究者最關(guān)注的問題,因為這是實現(xiàn)對組織中不同類型的細胞進行分型和定位的基礎(chǔ).然而,現(xiàn)有的商業(yè)化空間轉(zhuǎn)錄組學技術(shù)如10x Genomics的Visium以及NanoString的GeoMx技術(shù)均未能達到單細胞的分辨率,因此只能依靠生物信息學算法來實現(xiàn)對部分區(qū)域內(nèi)細胞類型的預(yù)測[70].而在基于成像的空間轉(zhuǎn)錄組學技術(shù)中,還可以利用標志基因來確定細胞類型[71].基于成像的空間轉(zhuǎn)錄組學技術(shù)依賴于對細胞的正確劃分,即如何找到細胞邊界去確定RNA分子歸屬的細胞.對于高表達的基因或者檢測效率較高的成像技術(shù)來說,比較容易實現(xiàn)細胞的劃分[32],而對于一些檢測效率較低的技術(shù)(如ISS),則需要通過單細胞測序獲得的標志物基因作為參考,并通過概率算法確定RNA分子歸屬的細胞,再依據(jù)表達譜確定細胞類型[34].除此之外,一些新的算法也有助于分辨圖形中的單細胞及其相關(guān)的基因表達信號[72].一般來說,當細胞被正確定位和分型后,下游的分析相對來說比較容易.盡管當前空間轉(zhuǎn)錄組學數(shù)據(jù)在快速地增長,但尚未有對應(yīng)的數(shù)據(jù)庫來對這些數(shù)據(jù)進行匯總集成.為了方便研究者的使用,這樣的數(shù)據(jù)庫應(yīng)該具備交互式訪問界面以及較為全面的數(shù)據(jù)等.然而,目前這樣的網(wǎng)站并不多,且現(xiàn)有網(wǎng)站也存在數(shù)據(jù)有限等問題[73].
總之,經(jīng)過短短幾年的發(fā)展,空間轉(zhuǎn)錄組學已經(jīng)發(fā)展成一個具有多種技術(shù)解決方案且能夠提供不同精度基因表達空間信息的新的組學研究手段.空間轉(zhuǎn)錄組學與其他組學技術(shù)相結(jié)合,將有助于人們更好地了解組織結(jié)構(gòu)的細胞群體之間的位置信息及其交流通訊網(wǎng)絡(luò),為更好地理解組織器官甚至整個生命體如何工作提供了有力的工具.未來的空間轉(zhuǎn)錄組學技術(shù)將朝著更高的空間分辨率、更好的自動化實驗流程以及數(shù)據(jù)分析流程發(fā)展,并且實驗成本有望進一步下降.