陳 晨, 秦付軍, 2), 3), 4)*, 唐 悅*
(1)鄭州大學基礎(chǔ)醫(yī)學院微生物學與免疫學系, 鄭州 450001;2)鄭州大學醫(yī)學科學院分子病理中心, 鄭州 450052;3)鄭州大學醫(yī)學科學院轉(zhuǎn)化醫(yī)學平臺, 鄭州 450052;4)鄭州大學省部共建食管癌防治國家重點實驗室, 鄭州 450052)
科學家從慢性粒細胞白血病(chronic myelocytic leukemia, CML)患者細胞中發(fā)現(xiàn)了一條較短的22號染色體,并將其命名為費城染色體[1];隨后在這種異常染色體上發(fā)現(xiàn)了由9號染色體的C-ABL基因與22號染色體的BCR基因發(fā)生易位而形成的融合基因BCR-ABL。這種染色體易位所導致的融合基因及其產(chǎn)物也是早期發(fā)現(xiàn)的嵌合RNA(或蛋白)的一種類型。BCR-ABL的發(fā)現(xiàn)及其靶向藥物格列衛(wèi)在臨床的成功應用,促進了使用嵌合RNA作為生物標志物和藥物靶標相關(guān)研究的快速發(fā)展[1]。
由于早期的嵌合RNA主要是在腫瘤中被發(fā)現(xiàn),因而人們通常認為嵌合RNA都具有癌癥特異性。隨著RNA-Seq技術(shù)的廣泛使用和二代測序技術(shù)成本的不斷降低,越來越多的RNA-seq數(shù)據(jù)被上傳到公共數(shù)據(jù)庫中并被下載和分析,通過使用不同的嵌合RNA分析軟件和檢測方法,在不同癌癥數(shù)據(jù)庫中能快速發(fā)現(xiàn)并篩選出可以作為該癌癥生物標志物的新型嵌合RNA[2-10]。近來,通過對人類正常組織的RNA測序數(shù)據(jù)庫GTEx(genotype-Tissue Expression)分析,我們發(fā)現(xiàn)正常組織中的嵌合RNA數(shù)量不僅遠超科學家們的預期,而且具有獨特的作用模式,在正常細胞中也具有一定的生理功能[11-15]。
嵌合RNA是由來自于不同基因的外顯子片段融合在一起組成的融合轉(zhuǎn)錄本[12, 16]。傳統(tǒng)觀點認為,染色體重排是生成嵌合RNA的唯一機制,然而,已有足夠證據(jù)表明,嵌合RNA也會通過各種RNA的轉(zhuǎn)錄調(diào)控和剪接形成,且未發(fā)生染色體的改變[11, 12, 16-19]。
本文將綜述嵌合RNA的形成機制及生物學意義。對這一新的研究領(lǐng)域的探索,將有助于從更深層面上挖掘人類基因組的生理功能和調(diào)控機制,便于更全面地了解嵌合RNA在分子與細胞水平和各種疾病中所發(fā)揮的功能和意義。
1.1.1 染色體重排的定義 染色體重排(chromosome rearrangement)是指染色體發(fā)生斷裂,與其他染色體相連,構(gòu)成新的染色體,包括插入、缺失和易位,可導致細胞遺傳學上不同的基因位點并列在一起(Fig.1A)。過去由于技術(shù)限制,大多數(shù)基因融合只在血液學疾病和兒童惡性腫瘤中被發(fā)現(xiàn),包括慢性粒細胞白血病中t(9;22)染色體易位導致的融合基因BCR-ABL;急性淋巴細胞白血病中t(12;21)染色體易位導致的融合基因TEL-AML1[20]等。這些融合基因的發(fā)現(xiàn)表明,嵌合RNA可通過DNA水平的染色體重排產(chǎn)生。
1.1.2 染色體重排形成的分子機制
(1)DNA復制障礙誘導染色體重排
DNA復制障礙能誘發(fā)染色體重排以及基因組拷貝數(shù)變異(copy number variation,CNV)。在癌癥發(fā)展過程中,環(huán)境因素和致癌基因誘導的增殖會增加復制壓力。當壓力阻止DNA復制時,DNA復制子和停頓的DNA復制叉處于連接狀態(tài),且受到S期檢測點的保護。當所受壓力得到緩解時,停頓的DNA復制叉可重新進行有效復制。然而,當DNA聚合酶從DNA復制叉解離或者復制叉結(jié)構(gòu)被破壞時,DNA復制則需要同源重組或者是微同源序列介導才能重新啟動[21]。 Mizuno等[22]在研究中表明,同源重組啟動DNA復制叉,同時DNA復制叉容易出錯的特點可誘發(fā)癌癥細胞中的染色體重排和基因擴增。
(2)DNA雙鏈斷裂誘導染色體重排
染色體重排過程的關(guān)鍵一步是誘導2個DNA雙鏈斷裂(DNA double-strand break, DSB)。誘發(fā)DNA雙鏈斷裂發(fā)生的可能機制有[23]:1)由于電離輻射、自由基氧化損傷或自發(fā)水解導致的隨機位置的斷裂;2)與拓撲異構(gòu)酶抑制劑治療相關(guān)的斷裂;3)由未知的鏈斷裂機制介導的直接或反向重復序列的斷裂。在淋巴樣細胞中,DNA雙鏈斷裂通常是生理性的在淋巴樣抗原受體位點的V(D)J重組(H鏈可變區(qū)的D基因的任一段與J基因拼成DJ基因后再與V基因任一段相結(jié)合而形成新基因的過程)、或類別轉(zhuǎn)換重組(class switch recombination, CSR)的結(jié)果;4)、重組活化基因(recombination activating gene, RAG)復合體在符合其正常V(D)J重組信號靶點的位點上引起序列特異性的DNA雙鏈斷裂;5)在單鏈到雙鏈的過渡區(qū)域發(fā)生的結(jié)構(gòu)特異性的DNA雙鏈斷裂;6)單鏈DNA位點的激活誘導的胞苷脫氨酶(cytidine deaminase, CyD)作用,可能發(fā)生在類別轉(zhuǎn)換重組區(qū)域和體細胞高頻突變區(qū)域(somatic hypermutation, SHM)的正常靶基因位點以外的病理位置。
1.2.1 反式剪接的定義 在反式剪接(trans-splicing)過程(Fig.1B)中,成熟的RNA通過2個獨立的mRNA前體分子融合而成。前體mRNA分子通常來源于多個不同基因(基因間反式剪接)[24-26]或相同基因(基因內(nèi)反式剪接)[27-29](Fig.2)。基因內(nèi)反式剪接產(chǎn)物包括外顯子復制或重排[12],以及由互補鏈轉(zhuǎn)錄的外顯子構(gòu)成的RNA[28, 30]。理論上,一些外顯子重排會由于重新剪接而形成環(huán)狀RNA。環(huán)狀RNA不具有游離末端,因此它們會通過經(jīng)由核糖核酸酶R處理與鏈式RNA區(qū)分[31]。目前,仍不清楚在不同譜系中是丟失還是獲得了反式剪接[32]。
Fig.1 Three mechanisms for the production of chimeric RNAs are known Three known generating mechanisms for chimeric RNAs. Exons are depicted as blocks, and introns are indicated by lines. (A) Chromosomal rearrangement including translocation, deletion, and inversion. Shown here is a case of translocation. Gene fragments from different genomic loci are juxtaposed together. (B) RNA trans-splicing. Two separate pre-mRNA transcripts are spliced together. (C) cis-splicing between adjacent genes.The transcription machinery reads through two neighboring genes, and the exons from the two genes are spliced together
Fig.2 Classification of different splicing mechanisms Classification of different types of splicing. The two main classes are cis- and trans-splicing (TS). Canonical cis-splicing involves transcripts from one gene. Adjacent genes that transcribe in the same direction can also form chimeric RNAs, via the cis-SAGe mechanism. In primitive organisms, TS usually occurs between a short leader sequence (SL) and the transcript of another gene; however, an SL is not required in all of the cases—joined transcripts can derive from different genes, via intergenic TS, or from different exons of the same gene, via intragenic TS,which includes sense-antisense chimeras, as shown here. The latter also includes exon shuffling and exon repetition (not depicted in this figure)
以嵌合RNAJAZF1-JJAZ1為例,它是由7號染色體p15上的JAZF1基因的5′-端外顯子和17號染色體q11上的JJAZ1/SUZ12基因的3′-端外顯子組成。正常的子宮內(nèi)膜基質(zhì)細胞中存在該嵌合RNA,其組成與在子宮內(nèi)膜間質(zhì)肉瘤(endometrial stromal sarcoma, ESS)[33]中發(fā)現(xiàn)的JAZF1-JJAZ1融合是相同的。前期的細胞遺傳學分析表明,人子宮內(nèi)膜間質(zhì)細胞中7號和17號染色體均正常,利用Southern印跡及FISH實驗表明,人子宮內(nèi)膜間質(zhì)細胞中未發(fā)現(xiàn)染色體重排現(xiàn)象;通過體外反式剪接檢測表明,人子宮內(nèi)膜間質(zhì)細胞中的JAZF1-JJAZ1嵌合體是RNA 反式剪接的結(jié)果[24]。以上結(jié)果說明,嵌合RNA可以通過RNA反式剪接機制形成。
1.2.2 反式剪接形成的分子機制
(1)低等生物中反式剪接的分子機制:短前導序列介導的反式剪接
在錐蟲體中最早發(fā)現(xiàn)了一種古老的反式剪接類型,SL反式剪接(short leader sequence trans-splicing,SLTS)[34]。該類型后來在其他低等真核生物中也被發(fā)現(xiàn),包括:甲藻[35]、眼蟲門生物[36]、線蟲類生物,例如秀麗隱桿線蟲[37]等。在這些生物體中,SL反式剪接通過非編碼的短前導序列(short leader sequence,SL)連接到轉(zhuǎn)錄物的5′端產(chǎn)生。在這個過程中,短前導序列mRNA的內(nèi)含子中的剪切體結(jié)合位點會結(jié)合核小核糖核酸蛋白(small nuclear ribonucleic protein,snRNP)(U1 snRNP除外),其利用傳統(tǒng)的剪接供體和受體位點進行后續(xù)進程。因此,轉(zhuǎn)錄本具有共同的前導序列。有趣的是,SL RNA可能直接從U1 snRNA進化而來,已有研究支持這一觀點。在該研究中,U1 snRNA只通過添加1個剪接供體序列就被轉(zhuǎn)化為SL RNA,而核苷酸序列幾乎未見變化[38]。高等真核生物中SL反式剪接的發(fā)生極少,在原始脊索動物中觀察到了SL反式剪接,但在植物、真菌和昆蟲中未觀察到[30, 37]。然而,人體內(nèi)尚未發(fā)現(xiàn)SL反式剪接存在的證據(jù),其中的反式剪接不涉及任何常見的短序列,而是2個獨立的基因轉(zhuǎn)錄物相互作用的結(jié)果[30, 37, 39]。
(2)脊椎動物反式剪接可能的分子機制
脊椎動物反式剪接的分子機制仍不清晰。此前的研究提出了一些模型:
1)剪切體介導的反式剪接
與順式剪接類似,反式剪接通常使用經(jīng)典剪接位點來連接2個獨立的原始轉(zhuǎn)錄物。因此,反式剪接可能使用與順式剪接相同的基本組件。體外研究已經(jīng)證明,剪接體機制能夠產(chǎn)生反式剪接的嵌合體[40, 41]。有研究表明,RNA剪接體產(chǎn)生的反式剪接RNA能用來對疾病進行RNA治療[42]。但是,是否所有反式剪接事件都是利用與常規(guī)剪接相同的機制,仍然有待研究。
2)短同源序列(short homologous sequence,SHS)介導的反式剪接
這種機制假定轉(zhuǎn)錄組件能從“第一”轉(zhuǎn)錄本中解離出來,并以某種方式移動到新的位置并繼續(xù)轉(zhuǎn)錄。這主要涉及短同源序列,它可能將轉(zhuǎn)錄組件引導到另一個位點,甚至可能是附近的染色體上[43]。這種機制不能解釋大部分利用經(jīng)典剪接位點的嵌合RNA。此外,已知同源序列會誘導假陽性結(jié)果,因為它們的相似性在反轉(zhuǎn)錄或PCR過程中會驅(qū)動模板轉(zhuǎn)換[31, 44]。
3)tRNA介導的反式剪接
兩個單獨的轉(zhuǎn)錄物可以通過普遍的tRNA序列連接,它們與伴侶基因相鄰并與tRNA核酸內(nèi)切酶共同作用[45]。
4)三維空間距離鄰近可能誘導反式剪接
較近的三維空間距離可能是嵌合RNA形成的必要因素。據(jù)推測,嵌合RNA的母基因彼此(三維空間)靠近,可以共享相同的轉(zhuǎn)錄機制,或者至少在形成嵌合RNA的條件下瞬時共享。無論如何,在獲得更多研究數(shù)據(jù)以前這仍然是一個有吸引力的假設(shè)。
1.3.1 順式剪接的定義 傳統(tǒng)順式剪接(cis-splicing)是指前體mRNA分子的外顯子連接在一起形成成熟mRNA的過程(Fig.2),這些mRNA通常翻譯為蛋白質(zhì)[30]。前體mRNA分子的剪接,即內(nèi)含子從前體mRNA上被切除后形成成熟mRNA的過程。但在某些情況下,能觀察到嵌合RNA分子通常由2個不同基因編碼的轉(zhuǎn)錄物片段組成。不同于常規(guī)的、正常剪接形成的RNA,嵌合體是通過基因間剪接機制產(chǎn)生的非傳統(tǒng)的RNA融合物[12, 46]。
1.3.2 順式剪接形成的分子機制
(1)5′端基因的聚A信號突變可產(chǎn)生嵌合RNA
一般認為,順式剪接也存在不同的分子機制,且在一定程度上與上游基因的轉(zhuǎn)錄終止信號的變化有關(guān)。早期的研究指出,5′端基因的聚A信號突變可能導致嵌合RNA的產(chǎn)生[47]。但目前仍未獲得更多的研究證實[48],而且也不能完全闡明大量順式剪接嵌合體存在的原因。
(2)扭轉(zhuǎn)應力促進相鄰基因間順式剪接嵌合RNA的形成
Meyer和Beslon在研究DNA螺旋的力學性質(zhì)時提出,扭轉(zhuǎn)應力是相距較近(僅僅幾千個堿基)的2個基因連接的原因之一[49]。扭轉(zhuǎn)應力可能會一方面促進上游基因的活躍轉(zhuǎn)錄,另一方面促進下游基因轉(zhuǎn)錄機制的啟動。然而,此理論僅能解釋相鄰基因間順式剪接嵌合RNA的形成原因,卻在多數(shù)其他情況下并不適用。
(3)轉(zhuǎn)錄抗終止作用
早期,大鼠細胞中的終止信號旁路作用主要由于轉(zhuǎn)錄抗終止所導致[50],人類正常的卵巢細胞中也存在該作用[51]。此外,在低等生物體細菌和噬菌體中也觀察到類似的作用現(xiàn)象,并且它似乎是一個高度調(diào)控的事件[52]。具有短同源序列的母基因可通過“轉(zhuǎn)錄滑動”模型形成嵌合體。在這個模型中,模板序列之間的高度相似性會干擾轉(zhuǎn)錄機制的進行,導致其遷移到附近的染色體區(qū)域,甚至遷移到另一個位點(三維結(jié)構(gòu)中的鄰近區(qū)域)[43]。然而,在這些情況下,很難辨別模板轉(zhuǎn)換是一種生理過程,還是研究分析中逆轉(zhuǎn)錄過程產(chǎn)生的假象[31, 44, 53],后者可能導致產(chǎn)生假陽性結(jié)果。McManus等的研究也表明[28],所有成年果蠅中的嵌合體都已被證實為模板切換所造成的假象。
在對大量雙末端RNA-Seq的數(shù)據(jù)研究中發(fā)現(xiàn),有許多相鄰基因外顯子連接形成的嵌合RNA。通過對前列腺癌和非癌癥樣本的分析研究,本文作者從中篩選分離到300多個嵌合RNA,其中30%的嵌合RNA也被鑒定為由相鄰基因外顯子形成[54]。因此,將此類由相鄰基因外顯子經(jīng)順式剪接機制產(chǎn)生的RNA 定義為“相鄰基因順式剪接” (cis-splicing of adjacent genes,cis-SAGe)嵌合RNA(Fig.1c)。直觀上看,cis-SAGe需要來自5′母基因的活躍轉(zhuǎn)錄,基因邊界的轉(zhuǎn)錄通讀,以及2個基因外顯子之間的選擇性剪接。轉(zhuǎn)錄因子CTCF結(jié)合到相鄰基因間的絕緣子序列,形成基因邊界,從而影響嵌合RNA的形成[19]。以SLC45A3-ELK4為例:SLC45A3-ELK4由于其可作為潛在的前列腺癌生物標志物已得到了大量的關(guān)注[55]。這個嵌合體的兩個母基因位于染色體1q32,相隔25 kb。利用小干涉RNA特異性地敲低CTCF的表達,可引起該嵌合RNA表達的增高。FISH、CGH陣列、Southern印跡和qPCR的研究結(jié)果表明,參與融合的2個外顯子之間并未發(fā)生任何DNA缺失而導致嵌合RNA的產(chǎn)生。體外反式剪接研究沒有檢測到SLC45A3-ELK4嵌合RNA,表明其不是RNA 反式剪接的結(jié)果[56]。相反,用特異嵌合RNA下游引物進行qRT-PCR實驗,可從相鄰母基因的基因間區(qū)域檢測到RNA前體轉(zhuǎn)錄本。上述結(jié)果表明,這類嵌合RNA是cis-SAGe的產(chǎn)物[18]。
通過對形成cis-SAGe的母基因的序列及相關(guān)特征進行分析[54],結(jié)果顯示,參與形成嵌合RNA的基因間距各不相同,但通常在8.5~30.6 kb范圍內(nèi),顯著地小于人類基因組內(nèi)的平均基因間距(大約為50 kb)。最常見的順式剪接嵌合RNA的剪接,通常發(fā)生于5′端基因的倒數(shù)第2個外顯子和3′端基因的第2個外顯子[54, 57](Fig.3)。這個結(jié)果并不令人意外,因為它包含了5′端基因的最后1個剪接供體位點和3′端基因的第1個剪接受體位點。目前,在嵌合連接位點周圍尚未發(fā)現(xiàn)特定的序列模板,這可能是由于目前的研究僅限于一小部分真正的順式剪接案例。隨著越來越多的順式剪接嵌合RNA被發(fā)掘,傳統(tǒng)基因的定義也亟需不斷的完善與補充?;蝾l繁地越過邊界進行轉(zhuǎn)錄并與相鄰的基因形成嵌合RNA,對定義一個基因的確切起始位置提出了挑戰(zhàn)。
Fig.3 General characteristics of cis-SAGe chimeric RNAs Common characteristics of cis-SAGe chimeras: (1) parental genes are usually separated by a relatively small distance, 8.5~30.6 kb region, (2) 50 gene is actively transcribed, and (3) the fusion transcripts tend to have the second-to-last exon of the 50 gene joining to the second exon of the 30 gene
基因融合及其產(chǎn)物(RNA和蛋白質(zhì))曾被認為是癌癥的特有現(xiàn)象。近年來研究發(fā)現(xiàn),嵌合RNA在人類多種正常組織和細胞中也廣泛存在。此前,本文對來源于30種人類正常組織和細胞以及15種小鼠正常組織的300個RNA-Seq數(shù)據(jù)庫進行了嵌合RNA的生物信息學分析[12]。在這些樣本中,發(fā)現(xiàn)了9 778個嵌合RNA,大部分嵌合RNA只出現(xiàn)在一個組織(細胞)樣本中,大約10%的嵌合RNA存在于一個以上的組織(細胞)樣本中。通過分析發(fā)現(xiàn),大多數(shù)嵌合RNA使用經(jīng)典的剪接位點進行融合,且較大可能是相鄰基因順式剪接或RNA反式剪接的產(chǎn)物。通過一系列分析發(fā)現(xiàn),51個嵌合RNA在多種不同組織(超過5種以上)中表達,例如嵌合RNACTBS-GNG5、CTNNBIP1-CLSTN1等[12]。近來,本課題組研究發(fā)現(xiàn),下調(diào)或過表達嵌合RNACTNNBIP1-CLSTN1能夠影響HEK-293T、HUVEC和LO2的細胞增殖和遷移。其中,下調(diào)CTNNBIP1-CLSTN1的表達能夠誘導細胞凋亡,并引起細胞周期G2/M期阻滯。在轉(zhuǎn)染siCTNNBIP1-CLSTN1的HEK-293T細胞中,過表達CTNNBIP1-CLSTN1,可拯救因下調(diào)CTNNBIP1-CLSTN1導致的細胞增殖減慢。而過表達母基因CTNNBIP1后,無明顯拯救作用[17]。在對大腦新皮層發(fā)育的研究中發(fā)現(xiàn),CTNNBIP1-CLSTN1在外放射狀膠質(zhì)細胞中富集,在人類進化的過程中與大腦皮層發(fā)育相關(guān),通過對Wnt/β-catenin信號通路的精細調(diào)控來實現(xiàn)大腦皮層的發(fā)育模式[58]。
嵌合RNA可在腫瘤細胞和正常細胞中同時存在,其對生理功能的影響并不局限于腫瘤細胞。嵌合RNAJAZF1-JJAZ1可以在子宮內(nèi)膜基質(zhì)細胞和子宮內(nèi)膜間質(zhì)肉瘤中同時存在[33]。嵌合RNADUS4L-BCAP29曾被認為是前列腺癌和胃癌中存在的癌癥特異嵌合RNA,并具有一定的致瘤作用[59]。本課題組進行深入研究后發(fā)現(xiàn),DUS4L-BCAP29也存在于多種正常組織中,并與癌細胞中的表達水平相當,是相鄰基因順式剪接的產(chǎn)物。細胞功能研究表明,DUS4L-BCAP29可以促進非癌癥細胞的生長和遷移能力,其促生長作用并非癌細胞所獨有[60]。這些結(jié)果對使用嵌合RNA作為腫瘤生物標志物,尤其是用于檢測癌癥疾病的應用提出警示,在尋找真正的癌癥特異性嵌合RNA時,需要考慮正常情況下基因間剪接產(chǎn)生嵌合RNA的可能性。
嵌合RNA的表達具有組織特異性和細胞階段特異性。西班牙國家癌癥研究中心的生物信息學研究者通過高通量RNA測序、質(zhì)譜分析和功能注釋等,在16個人類組織樣本中發(fā)現(xiàn)了175個嵌合RNA轉(zhuǎn)錄本和12個嵌合蛋白質(zhì),這些嵌合RNA明顯比非嵌合RNA呈現(xiàn)更高的組織特異性。嵌合RNA的組織特異性和細胞階段特異性的特征,為識別未分化腫瘤的細胞來源提供了依據(jù)。本文作者對橫紋肌肉瘤RH30細胞系的整個肌生成過程中的4個不同時間點細胞進行了轉(zhuǎn)錄組分析,最終發(fā)現(xiàn)18個嵌合RNA是在肌肉生成過程的一個特定時間點內(nèi)細胞中特異性表達的[61]。此類嵌合RNA的挖掘為鑒定細胞來源提供了另一種獨特的視角,并為研究其他腫瘤提供思路和可能。
嵌合RNA通過編碼的嵌合蛋白質(zhì)(Fig.4A)行使功能進而誘導腫瘤發(fā)生,也可以作為長非編碼嵌合RNA調(diào)控癌癥細胞的增殖和遷移(Fig.4B)[16, 18]。目前,BCR-ABL1融合基因已被廣泛地應用于臨床診斷和靶向治療[62],它存在于95%的慢性粒細胞白血病中,其編碼的P210蛋白能增強酪氨酸激酶的活性,從而改變細胞內(nèi)多種蛋白質(zhì)酪氨酸磷酸化水平,影響細胞內(nèi)正常信號的傳導,并抑制細胞凋亡的發(fā)生。格列衛(wèi)是一種有效針對該嵌合蛋白質(zhì),且已在臨床上被廣泛應用的抗癌藥物。格列衛(wèi)具有特異的ABL酪氨酸激酶抑制作用,可有效地抑制BCR-ABL1激酶底物中酪氨酸殘基的磷酸化,并使得該酶失活,從而發(fā)揮治療作用[63, 64]。
嵌合RNA也可通過干擾母基因的表達而發(fā)揮致癌作用。約50%的前列腺癌患者過表達ETS轉(zhuǎn)錄因子家族的基因,其中90% ETS 表達嵌合RNATMPRSS2-ETS。TMPRSS2-ETS是由TMPRSS2的5′UTR區(qū)域與ETS轉(zhuǎn)錄因子家族的一個成員結(jié)合形成。此嵌合RNA可誘導一種雄激素應答調(diào)控元件與ETS結(jié)合,該元件在應對雄激素激活時可上調(diào)ETS轉(zhuǎn)錄因子的表達水平,從而導致腫瘤的發(fā)生[65](Fig.4C)。環(huán)狀RNA由于其持久的化學穩(wěn)定性成為受人關(guān)注的癌癥治療靶標。近年P(guān)andolfi等研究人員,利用 RNase R 消化線性嵌合 RNA,設(shè)計反向引物,進行 RT-PCR、Sanger 測序等實驗,鑒定出一類重要環(huán)狀RNA分子——融合(嵌合)環(huán)狀RNA[66]。融合環(huán)狀 RNA由嵌合 RNA反向剪切形成,也是轉(zhuǎn)錄物組復雜性的重要體現(xiàn)[67, 68]。目前的融合環(huán)狀RNA多源于急性早幼粒細胞白血病(acute promyelocytic leukemia)、急性骨髓性白血病(acute myeloid leukemia)等疾病的融合基因[67-69]。由嵌合轉(zhuǎn)錄本形成的融合環(huán)狀RNA可以由“Fcirc”的算法特異性識別,但需要開展更多研究,以便理解融合環(huán)狀RNA如何發(fā)揮作用[70]。
Fig.4 The central theory of chimeric RNAs Chimeric RNA-centric view. Chimeric RNAs can be generated by gene fusion, trans-splicing, and cis-splicing between adjacent genes (cis-SAGe). They can function as chimeric proteins, long non-coding chimeric RNAs (lnccRNA), or affect parental gene expression. Traditionally, they have been thought to be specific to cancer. However, increasing numbers are being found in normal physiology
參與染色體重排的母基因和參與基因間剪接的母基因存在部分基因重疊,這可能并不是巧合,嵌合RNA可能是RNA介導雙鏈斷裂后修復和重排的潛在模板。基因組的三維鄰近區(qū)域雙鏈斷裂[71]后的錯配修復可能會增加該區(qū)域發(fā)生易位的風險。嵌合RNA的形成使母基因在三維空間上彼此靠近,進而影響染色體重排。已有研究表明,RNA模板或相對應的cDNA(complementary DNA)可在無同源染色體的情況下,介導同源重組和雙鏈斷裂修復[72]的發(fā)生。有學者認為,反式剪接的嵌合RNA或逆轉(zhuǎn)錄的cDNA可以作為染色體重排的模板[73],這將為發(fā)生在DNA水平的基因融合提供另一種分子機制。在正常細胞和腫瘤細胞中,均出現(xiàn)類似JAZF1-JJAZ1和DUS4L-BCAP29的嵌合RNA,支持了這種可能性[60, 74]。
盡管部分嵌合RNA缺乏編碼新蛋白質(zhì)的功能,但與其他基因仍存在序列同源、組織特異和進化保守等表達特點。由于與母基因序列的相似性,嵌合RNA可作為競爭性內(nèi)源RNA(competing endogenous RNA,ceRNA)或微小RNA(microRNA, miRNA)發(fā)揮作用。ceRNA能夠與某些具有類似核酸序列的轉(zhuǎn)錄本競爭,作為海綿來為miRNA提供結(jié)合位點,進而調(diào)控目標基因表達[75]。miRNA的生理調(diào)控作用也已經(jīng)在許多癌癥和其他疾病中被發(fā)現(xiàn)和證實[76]。嵌合RNAPAX3-FOXO1和母基因PAX3因序列相似而具有共同的下游靶點,而miR-495則可以特異性地結(jié)合到人類PAX3基因的3′UTR,從而調(diào)控PAX3蛋白的表達。嵌合RNA的形成使人類細胞逃避了miR-495對PAX3基因表達的調(diào)控,從而使PAX3在人類干細胞和肌肉分化過程中的表達水平顯著低于其他哺乳動物[77]。
在基因組未改變的情況下,細胞獲得新的生物學特性的連續(xù)過程,被稱為干細胞分化。該過程主要是由轉(zhuǎn)錄因子(transcription factor,TF)通過驅(qū)動表觀基因組的反復變化,最終調(diào)控細胞的成熟及命運[78]。在細胞分化階段,基因組的染色質(zhì)高級結(jié)構(gòu)會發(fā)生顯著的變化,進而影響基因間相互作用的頻率。這些染色質(zhì)相關(guān)的變化可能會破壞或引入嵌合RNA的表達。因此,很多嵌合RNA表現(xiàn)出明顯的組織特異性[12, 61]。參與形成嵌合RNA的母基因也會由轉(zhuǎn)錄因子組成,在細胞分化的過程中轉(zhuǎn)錄因子會受到嵌合RNA的調(diào)控[61],且在癌癥中特異表達或上調(diào)[16, 56, 79]。
選擇性的基因內(nèi)反式剪接RNA(trans-spliced RNA,tsRNA)可以調(diào)節(jié)胚胎干細胞的分化。Wu等[80]發(fā)現(xiàn),有4種在分化和未分化的人胚胎干細胞中呈現(xiàn)出特異性差異表達的tsRNA,它們可通過與全能性相關(guān)因子NANOG和SUZ12的相互作用來抑制分化特異性基因的表達,從而影響細胞全能性的維持。
人類與低等生物(果蠅和線蟲)之間存在許多不同,但基因數(shù)量卻相近。顯然,基因數(shù)量不是這些物種差異的根本原因。人類基因組包含約20 000個基因,而人體內(nèi)蛋白質(zhì)的種類卻遠多于理論數(shù)量。人類和小鼠的基因組的相似度高達95%,但人類轉(zhuǎn)錄組中的嵌合RNA數(shù)量卻顯著超過小鼠,并且比非嵌合RNA具有更顯著的組織特異性表達的特征。上述內(nèi)容中提及的幾個案例表明,嵌合RNA在關(guān)鍵的細胞過程中發(fā)揮作用,這已經(jīng)不是孤立的現(xiàn)象。嵌合RNA在人體中的存在形式,以及在不同組織中的生理功能將是未來需要研究的重要方向之一。
目前,GTEx項目已經(jīng)收集了包括54個正常組織在內(nèi)的948個非癌癥捐獻者的數(shù)據(jù)資料,為科學界研究人類基因組的表達調(diào)控及其與遺傳變異的關(guān)系提供了資源[13, 15]。目前,它被廣泛應用于研究基因表達數(shù)量或表達數(shù)量性狀基因座(expression quantitative trait loci,eQTL),但它也是研究非癌組織中嵌合RNA表達的非常有用的資源。這些豐富的原始RNA-Seq數(shù)據(jù)能夠用于驗證之前發(fā)現(xiàn)的嵌合RNA和分離鑒定新的嵌合RNA。通過對正常機體中嵌合RNA的序列、表達、來源和分布等基本特征進行深入了解,挖掘嵌合RNA生成、調(diào)控和功能等機制,將豐富人們對RNA分子家族的認識,從而便于全面理解轉(zhuǎn)錄組的復雜性和蛋白質(zhì)組多樣性。
嵌合RNA的發(fā)現(xiàn)和研究,較大程度上依賴于生物信息分析算法和檢測技術(shù)的發(fā)展[10]。目前,基因測序技術(shù)已經(jīng)發(fā)展到了第3代,可以實現(xiàn)單分子測序和超長讀長。基于3代測序結(jié)果的分析,已實現(xiàn)全長嵌合RNA電子克隆,也將提高嵌合RNA的陽性檢測和驗證效率。
相當一部分的嵌合RNA會以長非編碼嵌合RNA(lnccRNA)形式存在,同時也有證據(jù)證實了融合環(huán)狀RNA的存在[67, 68]。它們與經(jīng)典的lncRNA、circRNA在表達特征、作用方式上會有何不同?這是今后需要解決的問題。
此外,嵌合RNA產(chǎn)生的詳細機制尚不完全清楚,其發(fā)揮生理作用的相關(guān)分子機制有待探索。嵌合RNA未來將成為潛在的新型生物標記物和治療靶標,并為疾病的臨床治療和致癌病理提供新的理論和研究方向,同時有助于理解嵌合RNA在不同物種進化過程中的功能和意義。