·綜述·
長鏈非編碼RNA及其與結直腸腫瘤相關研究進展
謝宇梁德森李林強
作者單位:150001 哈爾濱醫(yī)科大學附屬第一臨床醫(yī)學院肛腸外科
長鏈非編碼RNA(long non-coding RNA,lncRNA)是一類長度超過200 nt的RNA分子,因其缺乏有意義的開放閱讀框(open reading frame,ORF),不參與編碼蛋白質(zhì),而是直接以RNA的形式在表觀遺傳學、轉(zhuǎn)錄及轉(zhuǎn)錄后等多種層面上調(diào)節(jié)蛋白編碼基因的表達[1],其異常表達與包括惡性腫瘤在內(nèi)的多種重大疾病的發(fā)生、發(fā)展密切相關[2]。
結直腸癌是目前世界范圍內(nèi)最常見的惡性腫瘤之一,且隨著人們生活水平的提高和飲食結構及方式的改變,其發(fā)病率仍在逐年升高,早期診斷、早期治療對結直腸癌預后影響顯著。而lncRNA因其多重與腫瘤發(fā)生發(fā)展相關的功能特性及顯著的腫瘤組織特異性,展現(xiàn)出其在結直腸腫瘤早期診斷、預后判斷及靶向治療上的廣闊前景。本文就lncRNA及其在結直腸腫瘤中的研究進展作一綜述。
一、長鏈非編碼RNA概述
人類基因組計劃研究顯示,在由長達30億個堿基對組成的人類基因組中,最終得到確認的基因只有2.1萬個左右,即其中編碼蛋白質(zhì)的序列只占全序列約1.5%,剩余98.5%為非蛋白質(zhì)編碼序列[3]。這些非編碼序列曾被認為是進化過程中累積的“垃圾序列”。而在2003年啟動的ENCODE(encyclopedia of DNA elements)計劃經(jīng)十余年研究發(fā)現(xiàn),在全序列中大約有75%的DNA片段可以被轉(zhuǎn)錄為RNA,近74%為非編碼RNA(non-coding RNA,ncRNA)[4]。其中絕大多數(shù)轉(zhuǎn)錄本長度超過200nt,稱為長鏈非編碼RNA(long non-coding RNA,lncRNA)。
(一)長鏈非編碼RNA的起源與結構特點
長鏈非編碼RNA于2002年由Okazaki等在對小鼠全長互補DNA(cDNA)文庫大規(guī)模測序中首次發(fā)現(xiàn)[5]。LncRNA起初被認為是RNA聚合酶Ⅱ低保真度轉(zhuǎn)錄的副產(chǎn)物,是基因組轉(zhuǎn)錄的“噪音”,并未得到重視。2007年,Rinn等[6]利用高分辨率芯片技術從11種成纖維細胞中鑒定分析出首個具有反式轉(zhuǎn)錄調(diào)控作用的lncRNA-HOTAIR,即HOX基因轉(zhuǎn)錄反義基因間RNA(HOX transcript antisense intergenic RNA)。其通過作用于polycomb復合物蛋白,修飾染色質(zhì),從而抑制HOX基因的轉(zhuǎn)錄。此后,隨著越來越多功能性lncRNA的發(fā)現(xiàn),人們逐漸認識到其廣泛參與X染色體沉默、基因組印記及染色質(zhì)修飾、轉(zhuǎn)錄激活及干擾、核內(nèi)運輸?shù)榷喾N重要的調(diào)控過程,lncRNA逐漸成為研究熱點。
全基因組高通量芯片以及cDNA文庫高通量測序顯示,lncRNA的編碼基因在基因組內(nèi)廣泛分布,可位于編碼mRNA基因的外顯子或內(nèi)含子中,或來自編碼mRNA基因之間的序列。根據(jù)其在基因組上相對于編碼mRNA基因的位置可分為正義(sense)、反義(antisense)、雙向(bidirectional)、基因內(nèi)(intronic)及基因間(intergenic)五類。因其在序列同一個位置可形成多種不同的轉(zhuǎn)錄情況,推斷l(xiāng)ncRNA起源至少包括下列5種:(1)蛋白質(zhì)編碼基因結構中斷,由變態(tài)的編碼基因轉(zhuǎn)錄而來;(2)染色質(zhì)重組,由原來缺乏外顯子的序列轉(zhuǎn)錄而來;(3)由非編碼基因在復制過程中的反轉(zhuǎn)錄生成;(4)由鄰近的復制子串聯(lián)后轉(zhuǎn)錄生成;(5)由編碼基因中插入轉(zhuǎn)座子轉(zhuǎn)錄生成[2]。
相對于編碼RNA及短鏈非編碼RNA而言,lncRNA初級序列保守性較低,但其分子內(nèi)部卻具有某些高度保守的區(qū)段,且表達具有時空特異性[7]。Khalil等先后在小鼠與人類基因組中發(fā)現(xiàn)3289個基因間保守lncRNA,并考慮到由于實驗條件限制,其數(shù)量可能達4500個左右[8]。不同于mRNA必須保證密碼子正確以確保開放閱讀框有意義,lncRNA只需維持其二級結構的穩(wěn)定,并對其功能起關鍵作用的區(qū)段保持高保守性,即在一級結構水平上呈低保守性,而二級結構呈保守性。
(二)長鏈非編碼RNA的作用機制與功能
LncRNA初級序列保守性低、起源多樣,但因其具有高保守性功能元件及相對穩(wěn)定的二級結構,使之在調(diào)控基因表達方面有著相似的作用機制,現(xiàn)已發(fā)現(xiàn)的常見作用機制包括:(1)通過與mRNA形成互補雙鏈,進一步在Dicer酶作用下產(chǎn)生內(nèi)源性的siRNA,進而使該mRNA沉默;(2)通過與mRNA形成互補雙鏈,干擾其剪切,從而生成不同的剪切形式;(3)通過在蛋白編碼基因上游啟動子區(qū)發(fā)生轉(zhuǎn)錄,影響下游基因的表達;(4)通過結合到特定蛋白質(zhì)上調(diào)節(jié)相應蛋白質(zhì)的活性;(5)通過結合到特定蛋白質(zhì)上改變該蛋白的細胞質(zhì)定位;(6)作為結構組分與蛋白質(zhì)形成核酸蛋白復合體;(7)作為小分子RNA的前體分子;(8)通過抑制RNA聚合酶Ⅱ或者介導染色質(zhì)重構及組蛋白修飾,影響下游基因的表達等[9]。
隨著更多功能性lncRNA的發(fā)現(xiàn)及對其作用機制的進一步探索,lncRNA調(diào)控蛋白質(zhì)編碼基因表達功能已被廣泛認可,其對于基因表達的調(diào)控按層次大體上可分為:
1.表觀遺傳學水平調(diào)控:為lncRNA最重要功能之一。通過與染色質(zhì)修飾酶相互作用,改變?nèi)旧|(zhì)構象,在不同發(fā)育階段激活或抑制可遺傳的等位基因的表達,使多細胞動物維持其表觀性狀。
2.轉(zhuǎn)錄水平調(diào)控:通過轉(zhuǎn)錄干擾、調(diào)控RNA聚合酶II、調(diào)節(jié)轉(zhuǎn)錄因子的結合與裝配、與調(diào)控DNA序列形成RNA-DNA-Triplexes等方法實現(xiàn)。
3.轉(zhuǎn)錄后水平調(diào)控:通過與互補的mRNA形成dsRNA,影響mRNA的加工、轉(zhuǎn)運、翻譯和降解等過程,從而影響基因表達[10]。
LncRNA通過多種復雜機制在表觀遺傳學、轉(zhuǎn)錄及轉(zhuǎn)錄后等多層面上調(diào)節(jié)蛋白編碼基因的表達,其異常表達可導致包括惡性腫瘤在內(nèi)的多種重大疾病的發(fā)生。
二、長鏈非編碼RNA與結直腸腫瘤
2009年Guttman等通過全基因組序列分析,發(fā)現(xiàn)lncRNA中特有的超保守元件在腫瘤細胞中存在廣泛表達。這類元件在正常細胞中廣泛分布于染色體的脆性位點及腫瘤相關區(qū)域,與原癌基因表達密切相關,起著抑制細胞凋亡的作用,而其異常表達則會導致細胞過度增殖,形成腫瘤[7]。2010年Khachane等通過分析全長人類基因cDNA數(shù)據(jù)庫,發(fā)現(xiàn)腫瘤相關lncRNA 的基因比例是腫瘤相關編碼基因的二倍,由此指出腫瘤相關基因更有可能表達出lncRNA[11],甚至可通過測定其表達水平的變化輔助腫瘤早期診斷[12]。
隨著HOTAIR、H19、MALAT-1、HULC 等結直腸癌相關長鏈非編碼RNA發(fā)現(xiàn),基于其不同功能而應用于結直腸腫瘤的鑒別、早期診斷與靶向治療成為了研究的熱點方向。
(一)HOX基因轉(zhuǎn)錄反義基因間RNA
HOX基因轉(zhuǎn)錄反義基因間RNA(HOX transcript antisense intergenic RNA,HOTAIR)于2007年由Rinn等發(fā)現(xiàn),是首個被發(fā)現(xiàn)的具有反式轉(zhuǎn)錄調(diào)控作用的lncRNA[6],其編碼基因位于12q13.13。Gupta等發(fā)現(xiàn)HOTAIR能夠通過引導基因組PCR2重新定向,導致組蛋白H3上第27位氨基酸三甲基化(H3K27me3),并且通過調(diào)節(jié)多個抑制基因的沉默來促進乳腺癌的浸潤與轉(zhuǎn)移[13-14]。
2011年Kogo等實驗證實HOTAIR在結直腸癌中高表達。其通過下調(diào)腫瘤轉(zhuǎn)移抑制基因的表達從而促進癌轉(zhuǎn)移[15]。在出現(xiàn)肝轉(zhuǎn)移的Ⅳ期結直腸癌癌組織中,HOTAIR水平顯著高于癌旁組織,且細胞分化程度低、腫瘤局部浸潤深,因此HOTAIR可作為判斷結直腸癌肝轉(zhuǎn)移及其預后的獨立指標。
(二)母源性印跡基因19轉(zhuǎn)錄因子
母源性印跡基因19轉(zhuǎn)錄因子(imprinted maternally expressed transcript,H19)基因表達于11p15.5,由4個內(nèi)含子和5個外顯子構成,是首個被發(fā)現(xiàn)的非編碼基因。其第一外顯子可產(chǎn)生一個高保守的miRNA分子,即miR-675。2010年Tsang等研究發(fā)現(xiàn),過表達的miR-675能夠促進結直腸癌細胞株的生長,與結直腸癌的發(fā)病密切相關[16],顯示其可能成為結直腸癌治療的新靶點。
而Yoshimizu等[17]研究發(fā)現(xiàn),H19的低表達導致小鼠結腸息肉數(shù)量顯著上升,顯示H19具有癌基因和抑癌基因的雙重功能。其轉(zhuǎn)錄本在肝癌、胃癌中水平升高,而在畸胎瘤、前列腺癌中水平降低,亦印證了這一特性。
Fellig等通過檢測37例結直腸癌的肝轉(zhuǎn)移灶上H19的表達情況,發(fā)現(xiàn)18例存在高表達,提示H19對結直腸癌肝轉(zhuǎn)移亦具有促進作用[18]。
(三)人肺腺癌轉(zhuǎn)移相關轉(zhuǎn)錄因子1
人肺腺癌轉(zhuǎn)移相關轉(zhuǎn)錄因子1(metastasis-associated lung adenocarcinoma transcript-1,MALAT-1)長8708nt,其編碼基因定位于11q13.1。最初由Ji等在研究人非小細胞肺癌的轉(zhuǎn)移中發(fā)現(xiàn)[19],通過調(diào)控基因表達的轉(zhuǎn)錄及轉(zhuǎn)錄后水平,增強肺腺癌細胞的運動性,參與腫瘤的侵襲與轉(zhuǎn)移。MALAT-1作為腫瘤標記物具有廣譜性,在結直腸癌、肝癌、胰腺癌、乳腺癌、前列腺癌等癌組織中亦可見高表達。
2011年Xu等通過對原發(fā)結直腸癌組織及腸癌細胞系研究發(fā)現(xiàn),其中MALAT-1的3’ 末端區(qū)域均存在突變,對癌細胞的增殖、侵襲、轉(zhuǎn)移均起著重要作用[20]。常建蘭等發(fā)現(xiàn)MALAT-1在大腸腺瘤、正常大腸黏膜和大腸癌中表達量依次增高[21],為結直腸腺瘤與結直腸癌的鑒別提供了有力依據(jù)。
(四)結腸癌相關轉(zhuǎn)錄因子1,2
結腸癌相關轉(zhuǎn)錄因子1,2(colon cancer associated transcript-1,2,CCAT-1,CCAT-2)由Nissan等[22]利用代表性差異分析法發(fā)現(xiàn),而CCAT-2則于2013年由Ling等[23]首次報道。其編碼基因位于染色體組8q24,而結直腸多發(fā)腺瘤的發(fā)生與該區(qū)多態(tài)性密切相關,提示CCAT與結直腸腺瘤發(fā)生相關[24]。其在結直腸癌前病變、原位癌、結直腸癌侵襲邊緣組織、結直腸癌淋巴結轉(zhuǎn)移瘤、結直腸癌肝轉(zhuǎn)移瘤中表達逐級增強,而在正常結直腸組織內(nèi)無表達,因此可作為結直腸癌早期篩查及診斷的特異性標志物之一。
(五)肝癌高表達轉(zhuǎn)錄因子(highly up-regulated in liver cancer,HULC)
由Panzitt等[25]在肝癌組織中發(fā)現(xiàn),是首個肝癌細胞特異性高表達的lncRNA,長約500nt,基因定位于6p24.3。Matouk等[26]發(fā)現(xiàn)只有在原發(fā)性肝癌及結直腸癌肝轉(zhuǎn)移的繼發(fā)性肝癌中可檢測到特異性高表達的HULC,而在原發(fā)性結直腸癌、淋巴結轉(zhuǎn)移的結直腸癌或非肝轉(zhuǎn)移的腫瘤中則無法測得。HULC可在肝癌患者的血液中被檢測到,因而可能成為一種新的肝癌或結直腸癌肝轉(zhuǎn)移標志物。
除上述與結直腸癌相關的經(jīng)典lncRNA外,尚有結直腸腫瘤形成差異表達基因轉(zhuǎn)錄因子(colorectal neoplasia differentially expressed,CNRDE)、母本印跡表達基因3轉(zhuǎn)錄因子(maternally expressedgene3,MEG3)、前列腺癌相關非編碼RNA轉(zhuǎn)錄因子1(prostate cancer-associated ncRNA transcripts 1,PCAT-1)等多種lncRNA以不同方式調(diào)節(jié)癌及抑癌基因表達,從而與結直腸腫瘤的發(fā)生、發(fā)展密切相關。
三、長鏈非編碼RNA在結直腸腫瘤中發(fā)展前景展望
隨著越來越多在結直腸腫瘤發(fā)生發(fā)展各階段起重要調(diào)控作用的長鏈非編碼RNA的發(fā)現(xiàn),其成為結直腸腫瘤研究領域的新熱點。我們對于lncRNA的研究剛剛起步,僅對HOTAIR、H19、MALAT-1等幾種lncRNA作用機制較為清楚,隨著更多功能性lncRNA被發(fā)現(xiàn),我們更多了解其與腫瘤發(fā)生發(fā)展的關系,但對其具體的分子機制尚不明了。因此在我們探索lncRNA實際作用時,也有必要進行更多的結構和功能的研究。而隨著生物技術的發(fā)展和研究的不斷深入,也許在不久的將來,特異性lncRNA可作為早期診斷及預后判斷標志物或新的治療靶點應用于臨床。
參考文獻
[1]Wilusz JE,Sunwoo H,Spector DL.Long non-coding RNAs:functional surprises from the RNA world.Genes & Development,2009,23(13),1494-1504.
[2]Ponting CP,Oliver PL,Reik W.Evolution and functions of long non-coding RNAs.Cell,2009,136(4):629-641.
[3]Bimey E,Stamatoyannopoulos JA,Dutta A,et al.Identificationand analysis of functional elements in 1% of the human genome by the ENCODE pilot project.Nature,2007,447:799-816.
[4]Pennisi E.ENCODE project writes eulogy for junk DNA.Science,2012,337(6099):1159-1161.
[5]Okazaki Y,F(xiàn)uruno M,Kasukawa T,et al.Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs.Nature,2002,420(6915):563-573.
[6]Rinn JL,Kertesz M,Wang JK,et al.Functional demarcation of active and silent chromatin domains in human HOX loci by non-coding RNAs.Cell,2007,129(7):1311-1323.
[7]Guttman M,Amit I,Gather M,et a1.Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals.Nature,2009,458(7235):223-227.
[8]Khalil AM,Guttman M,Huarte M,et a1.Many human large intergenic non-coding RNAs associate with chromatin-modifying complexes and affect gene expression.Proc Natl Acad Sci USA,2009,106(28):11667-11672.
[9]Zhao J,Sun BK,Erwin JA,et al.Polycomb proteins targeted by a short repeat RNA to the mouse X chromosome.Science,2008,322(5902):750-756.
[10]朱雯.長鏈非編碼RNA與腫瘤研究進展.中國腫瘤臨床,2012,39(8):476-480.
[11]Khachane AN,Harrison PM.Mining mammalian transcript data for functional long non-coding RNAs.PLoS One,2010,5(4):e10316.
[12]Gibb EA,Brown CJ,Lam WL.The functional role of long non-coding RNA in human carcinomas.Mol Cancer,2011,10: 38.
[13]Gupta RA,Shah N,Wang KC,et al.Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis.Nature,2010,464(7291):1071-1076.
[14]Wu SC,Kallin EM,Zhang Y.Role of H3K27 in the regulation of lncRNA expression.Cell Res,2010,20(10):1109-1116.
[15]Kogo R,Shimamura T,Mimori K,et al.Long non-coding RNA HOTAIR regulates polycomb-dependent chromatin modification and is associated with poor prognosis in colorectal cancers.Cancer Res,2011,71(20):6320-6326.
[16]Tsang WP,Ng EK,Ng SS,et al.Oncofetal H19-derived miR-675 regulates tumor suppressor RB in human colorectal cancer.Carcinogenesis,2010,31(3):350-358.
[17]Yoshimizu T,Miroglio A,Ripoche MA,et al.The H19 locus acts in vivo as a tumor suppressor.Proc Natl Acad Sci USA,2008,105(34):12417-12422.
[18]Fellig Y,Ariel I,Ohana P,et al.H19 expression in hepatic metastases from a range of human carcinomas.J Clin Pathol,2005,58(10):1064-1068.
[19]Ji P,Diederichs S,Wang W,et al.MALAT-1,a novel non-coding RNA,and thymosin beta4 predict metastasis and survival in early-stage non-small cell lung cancer.Oncogene,2003,22(39):8031-8041.
[20]Xu C,Yang M,Tian J,et al.MALAT-1:a long non-coding RNA and its important 3’ end functional motif in colorectal cancer metastasis.Int J Oncol,2011,39(1):169-175.
[21]常建蘭,李祖國,王曉燕,等.p53,MALAT-1,ki-67和β-catenin基因mRNA檢測在大腸癌分子診斷中的意義.世界華人消化雜志,2008,16(34):3849-3854.
[22]Nissan A,Stojadinovic A,Mitrani-Rosenbaum S,et al.Colon cancer associated transcript-1:a novel RNA expressed in malignant and pre-malignant human tissues.Int J Cancer,2012,130(7):1598-1606.
[23]Ling H,Spizzo R,Atlasi Y,et al.CCAT-2,a novel non-coding RNA mapping to 8q24,underlies metastatic progression and chromosomal instability in colon cancer.Genome Res,2013,23(9):1446-1461.
[24]Berndt SI,Potter JD,Hazra A,et al.Pooled analysis of genetic variation at chromosome 8q24 and colorectal neoplasia risk.Hum Mol Genet,2008,17(17):2665-2672.
[25]Panzitt K,Tschernatsch MM,Guelly C,et al.Characterization of HULC,a novel gene with striking up-regulation in hepatocellular carcinoma,as non-coding RNA.Gastroenterology,2007,132(1):330-342.
[26]Matouk IJ,Abbasi I,Hochberg A,et al.Highly up-regulated in liver cancer non-coding RNA is over-expressed in hepatic colorectal metastasis.Eur J Gastroenterol Hepatol,2009,21(6):688-692.
(本文編輯:馬天翼)
謝宇,梁德森,李林強.長鏈非編碼RNA及其與結直腸腫瘤相關研究進展[J/CD].中華結直腸疾病電子雜志,2015,4(2):170-172.
(收稿日期:2015-01-19)
通訊作者:梁德森,Email: hydpw8@163.com
DOI:10.3877/cma.j.issn.2095-3224.2015.02.13