馬榮 尚方正 潘劍鋒 戎友俊 王敏 李金泉 張燕軍
(1.內(nèi)蒙古農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院,呼和浩特 010018;2.農(nóng)業(yè)農(nóng)村部肉羊遺傳育種重點(diǎn)實(shí)驗(yàn)室,呼和浩特 010018;3.內(nèi)蒙古自治區(qū)動(dòng)物遺傳育種與繁殖重點(diǎn)實(shí)驗(yàn)室,呼和浩特 010018;4.內(nèi)蒙古自治區(qū)山羊遺傳育種工程技術(shù)研究中心,呼和浩特 010018)
蛋白質(zhì)是基因的功能產(chǎn)物,是細(xì)胞功能的主要執(zhí)行者,在發(fā)育、神經(jīng)發(fā)生、記憶形成和衰老等多種生理過程中起著關(guān)鍵作用[1-2]。mRNA 是蛋白質(zhì)合成的信息藍(lán)圖,基于高通量測(cè)序的轉(zhuǎn)錄組測(cè)序可以反映細(xì)胞中mRNA 的種類和數(shù)量,且可以檢測(cè)mRNA 的序列突變和可變剪切[3-4]。Maier 等[5]對(duì)多個(gè)物種的轉(zhuǎn)錄組和蛋白組進(jìn)行比較后發(fā)現(xiàn),mRNA 表達(dá)水平與其編碼蛋白質(zhì)的表達(dá)量的相關(guān)系數(shù)在0.01-0.5 之間,表明mRNA 的表達(dá)水平并不能較好地作為判斷蛋白質(zhì)水平的依據(jù)。因此,作為轉(zhuǎn)錄組和蛋白組之間的“橋梁”——翻譯調(diào)控被認(rèn)為是調(diào)節(jié)基因表達(dá)的主要機(jī)制。翻譯調(diào)控是一種快速激活或抑制mRNA 翻譯以響應(yīng)內(nèi)源、外源信號(hào)的機(jī)制,可快速靈活的調(diào)節(jié)細(xì)胞內(nèi)蛋白質(zhì)濃度,實(shí)現(xiàn)生理變化、維持體內(nèi)環(huán)境穩(wěn)態(tài)。翻譯調(diào)控紊亂會(huì)導(dǎo)致細(xì)胞無法維持正常的細(xì)胞功能或無法適應(yīng)不斷變化的環(huán)境條件,從而導(dǎo)致多種疾?。?-7]。翻譯可分為3個(gè)階段:起始、延伸、終止。其中,翻譯起始長(zhǎng)久以來被認(rèn)為是翻譯速率的主要限速步驟[8],是決定蛋白質(zhì)表達(dá)量的關(guān)鍵,影響著蛋白質(zhì)的結(jié)構(gòu)和功能,在細(xì)胞增殖、凋亡等方面扮演重要角色[9]。
細(xì)胞的生長(zhǎng)速率、蛋白質(zhì)合成速率都與核糖體數(shù)目密切相關(guān)。生物在不同生長(zhǎng)階段、不同生長(zhǎng)環(huán)境以及應(yīng)激條件下都是通過對(duì)翻譯速率的調(diào)控實(shí)現(xiàn)對(duì)外界刺激迅速產(chǎn)生反應(yīng)。翻譯速率的探究有助于科研人員更清晰地了解細(xì)胞生命活動(dòng)的快速變化。因此,本文在概述真核、原核細(xì)胞內(nèi)翻譯機(jī)制的基礎(chǔ)上,從影響翻譯速率的主要因素和探究翻譯、翻譯速率的主要技術(shù)手段兩個(gè)方面綜述了mRNA 翻譯的研究現(xiàn)狀,旨在為更多學(xué)者進(jìn)一步了解生物體內(nèi)翻譯過程提供參考依據(jù)。
核糖體是mRNA 進(jìn)行翻譯的主要場(chǎng)所,主要由核糖體RNA(ribosomal RNA,rRNA)和多種核糖體蛋白構(gòu)成,是一類高度復(fù)雜的細(xì)胞器。核糖體內(nèi)部有3 個(gè)轉(zhuǎn)運(yùn)RNA(transfer RNA,tRNA)結(jié)合位點(diǎn),分別為E、P、A 位點(diǎn),A 是氨酰-tRNA 結(jié)合的位點(diǎn),P 是肽酰-tRNA 結(jié)合的位點(diǎn),E 是核糖體內(nèi)空載tRNA 釋放位點(diǎn)。攜有氨基酸的tRNA(氨酰-tRNA)會(huì)依次經(jīng)過A、P 位點(diǎn),隨后將氨基酸結(jié)合于多肽鏈末端,最后以空載tRNA 的形式從E 位點(diǎn)移出[10]。當(dāng)核糖體遇到終止密碼子時(shí),mRNA 翻譯結(jié)束,多肽形成[10]。以上是細(xì)胞內(nèi)mRNA 的翻譯過程,分為3 個(gè)階段:起始、延伸和終止。生物體內(nèi)細(xì)胞的翻譯過程是高度保守的[11],機(jī)制也十分相似。然而,由于真核、原核細(xì)胞內(nèi)mRNA 結(jié)構(gòu)的不同,因此兩類細(xì)胞的翻譯起始方式有明顯差異,但兩類細(xì)胞內(nèi)的翻譯延伸、終止是相似的[12]。因此本文將分別介紹真核細(xì)胞和原核細(xì)胞內(nèi)的翻譯機(jī)制。
真核細(xì)胞內(nèi)存在兩類核糖體識(shí)別機(jī)制,一類為5′端帽子識(shí)別機(jī)制,另一類為識(shí)別核糖體進(jìn)入位點(diǎn)(internal ribosome entry site,IRES)機(jī)制。有研究表明,細(xì)胞內(nèi)存在部分RNA(大多為非編碼RNA,如lncRNA、circRNA 等)是通過對(duì)IRES 的識(shí)別進(jìn)行翻譯,但真核細(xì)胞內(nèi)大多數(shù)mRNA 都是通過對(duì)5′端帽子結(jié)構(gòu)的識(shí)別進(jìn)行翻譯。因此,本文以5′端帽子識(shí)別機(jī)制為例進(jìn)行簡(jiǎn)要介紹。
首先,由支架蛋白eIF4G 和結(jié)合蛋白eIF4E 共同識(shí)別mRNA 的5′帽子結(jié)構(gòu)。隨后在eIF4G 因子的招募下,eIF4A 與mRNA 結(jié)合,eIF4A、eIF4E 和eIF4G 共同構(gòu)成eIF4F,并在eIF4B 的共同作用下破壞mRNA 5′端的二級(jí)結(jié)構(gòu)(如發(fā)夾結(jié)構(gòu)等),這為接下43S 前起始復(fù)合物的結(jié)合提供條件[13]。與此同時(shí),核糖體40S 小亞基也為mRNA 的結(jié)合做準(zhǔn)備。為使與eIF2-GTP 結(jié)合的甲硫氨酸起始子tRNA(MettRNAi)順利的結(jié)合在小亞基的P 位點(diǎn),翻譯起始因子eIF1 首先結(jié)合于小亞基E 點(diǎn),隨后eIF3、eIF5 依次與E 位點(diǎn)的eIF1 結(jié)合,共同占據(jù)E 位點(diǎn);而小亞基A 位點(diǎn)則由翻譯起始因子eIF1A 占據(jù)。翻譯起始因子eIF5、eIF3、eIF1 和eIF1A 不僅可以確保MettRNAi 準(zhǔn)確結(jié)合于核糖體P 位點(diǎn),而且可以阻止核糖體大、小亞基的結(jié)合,進(jìn)而確保翻譯的順利進(jìn)行。eIF2 以GTP 的形式(eIF2-GTP) 與Met-tRNAi 結(jié)合,并在eIF5 的作用下將Met-tRNAi 遷至小亞基P點(diǎn)。此時(shí),由核糖體40S 小亞基、eIF3、eIF5、eIF1和eIF1A 以及GTP、eIF2 和Met-tRNAi 構(gòu)成的復(fù)合物為43S 前起始復(fù)合物。eIF3(位于43S 前起始復(fù)合物內(nèi))被結(jié)合于mRNA 5′端的eIF4G 招募,從而形成48S 前起始前復(fù)合物[13-14];48S 前起始前復(fù)合物從5′→ 3′方向掃描,直至找到具有Kozak 序列特征的起始密碼子[15-16]。正確的堿基互補(bǔ)配對(duì)改變了48S 前起始復(fù)合物的構(gòu)象,促使翻譯起始因子從復(fù)合體中釋放,核糖體大亞基與小亞基結(jié)合。此時(shí),mRNA 翻譯起始結(jié)束,翻譯延伸開始。
在翻譯延伸階段,起始tRNA(Met-tRNAi)停留在具有延伸能力的核糖體的肽基(P)部位,而氨酰-tRNA 在延伸因子的“護(hù)送”下移至核糖體A 位點(diǎn),A 位點(diǎn)氨酰-tRNA 和P 位點(diǎn)的氨基酸相遇并形成肽鍵。肽鍵形成后,核糖體移至下一密碼子,P 位點(diǎn)的tRNA 從E 位點(diǎn)排出,A 位點(diǎn)的tRNA 帶著合成的肽鏈移至P 位點(diǎn),而A 位點(diǎn)空出,等待下一個(gè)氨基酸。翻譯延伸的過程一直持續(xù)到A 位點(diǎn)遇到終止密碼子(UAG、UGA 或UAA),一旦終止密碼子進(jìn)入核糖體的A 位點(diǎn),釋放因子則被招募到A 位點(diǎn),多肽鏈和tRNA 隨即被釋放,核糖體解離成亞單位,循環(huán)用于下一輪翻譯[17]。真核細(xì)胞內(nèi)mRNA 翻譯機(jī)制如圖1所示。
圖1 真核細(xì)胞內(nèi)mRNA 翻譯機(jī)制Fig.1 mRNA translation mechanism in eukaryotic cells
原核細(xì)胞內(nèi)mRNA 的5′ 端通常有SD 序列(Shine-Dalgarno sequence),該序列可與核糖體30S小亞基結(jié)合,進(jìn)而促進(jìn)mRNA 正確翻譯。此外有研究發(fā)現(xiàn),原核細(xì)胞內(nèi)也存在一類可以進(jìn)行翻譯且不含SD 序列的mRNA,但其翻譯起始速率低,且具體機(jī)制還不清晰。因此,本文以含有SD 序列的mRNA為例進(jìn)行簡(jiǎn)要介紹。
在翻譯起始階段,翻譯起始因子IF3、IF1 與IF2 的復(fù)合物質(zhì)分別占據(jù)30S 小亞基的E、A 位點(diǎn),其不僅促進(jìn)翻譯起始tRNA 正確的結(jié)合,也阻止核糖體大、小亞基的結(jié)合[18-19]。隨著3 個(gè)起始因子的加入,核糖體小亞基已準(zhǔn)備好與mRNA、起始tRNA結(jié)合。mRNA 的SD 序列與核糖體小亞基形成穩(wěn)定的SD:aSD 堿基對(duì),促使小亞基與mRNA 的結(jié)合;起始tRNA 則在IF2 的招募下,準(zhǔn)確地結(jié)合于小亞基的P 位點(diǎn)[20-21]。此時(shí),mRNA、核糖體小亞基、起始tRNA、IF3、IF1 以及IF2 共同構(gòu)成30S 起始復(fù)合物。隨著起始tRNA 的結(jié)合,核糖體小亞基的構(gòu)象發(fā)生變化,IF3 從E 位點(diǎn)脫落[16,22],促使核糖體50S 大亞基與30S 起始復(fù)合物結(jié)合。IF2 是大亞基初始對(duì)接位點(diǎn),與大亞基相互作用后可激活I(lǐng)F2-GTP 酶的活性,使IF2-GDP、IF1 被釋放,最終形成完整的70S起始復(fù)合物。此時(shí),mRNA 翻譯起始結(jié)束,翻譯延伸開始。
原核細(xì)胞內(nèi)mRNA 的翻譯延伸、終止機(jī)制與真核細(xì)胞高度相似,都是將攜有氨基酸的tRNA 進(jìn)行易位實(shí)現(xiàn)翻譯的延伸,通過核糖體識(shí)別終止密碼子并招募釋放因子實(shí)現(xiàn)翻譯的終止,因此不再做詳細(xì)介紹,原核細(xì)胞內(nèi)mRNA 翻譯機(jī)制如圖2所示。
圖2 原核細(xì)胞內(nèi)mRNA 翻譯機(jī)制Fig.2 mRNA translation mechanism in prokaryotic cells
蛋白質(zhì)是生命活動(dòng)的實(shí)際執(zhí)行者,其豐度主要由合成和降解兩方面決定[23]。研究發(fā)現(xiàn),蛋白質(zhì)的降解常數(shù)與蛋白質(zhì)豐度的R2僅為0.10[23],表明蛋白質(zhì)的降解對(duì)蛋白質(zhì)豐度的影響很?。?4],即蛋白質(zhì)的合成是蛋白質(zhì)豐度的決定因素。翻譯速率不僅是決定蛋白質(zhì)豐度的關(guān)鍵,也是決定蛋白質(zhì)折疊的關(guān)鍵因素之一,異常的翻譯速率將導(dǎo)致癌癥、神經(jīng)退行等多種疾?。?5-26]。關(guān)于核糖體翻譯速率參數(shù)的定義,目前國(guó)際尚無定論。2009年Ingolia 等[27]將核糖體的標(biāo)準(zhǔn)化read 數(shù)除以mRNA 的標(biāo)準(zhǔn)化read 數(shù),定義為翻譯效率。然而mRNA 的翻譯速率與其結(jié)合核糖體的數(shù)量并不總呈正相關(guān),當(dāng)翻譯至mRNA的某一位置停止或暫停時(shí),會(huì)導(dǎo)致核糖體聚集,若采用平均核糖體密度描述翻譯速率,將會(huì)高估這類基因的翻譯速率。同時(shí)大量研究表明,翻譯起始是mRNA 翻譯的主要限速步驟,其速率是決定細(xì)胞蛋白質(zhì)水平的關(guān)鍵[28]。在翻譯起始階段,除翻譯起始因子影響著翻譯的進(jìn)行,還有mRNA 的“特殊序列”(真核細(xì)胞Kozak 序列、原核細(xì)胞SD 序列)、mRNA的二級(jí)結(jié)構(gòu)和起始密碼子等因素決定著翻譯的起始速率。
2.1.1 真核細(xì)胞mRNA 的Kozak 序列 真核細(xì)胞mRNA 常以單順反子的形式存在,其鏈內(nèi)的5′帽子結(jié)構(gòu)或IRES 可以被核糖體小亞基識(shí)別并結(jié)合,進(jìn)而識(shí)別起始密碼子、開始翻譯。起始密碼子AUG之所以可以被核糖體小亞基識(shí)別,是因其兩側(cè)翼序列(通常為GCCACCAUGG)可以與翻譯起始因子結(jié)合,進(jìn)而介導(dǎo)5′帽子結(jié)構(gòu)的mRNA 翻譯,這段序列稱為Kozak 序列。Kozak 序列組成并不是完全一致的,但AUG 上游-3 位的A 或G,下游+4 位的G 卻是高度保守的;同時(shí)當(dāng)序列為GCCACCAUGG、GCCAUGAUGG 時(shí),mRNA 翻譯效率最高。有大量研究證明,Kozak 序列是影響起始密碼子識(shí)別的主要因素之一[29]。例如,釀酒酵母轉(zhuǎn)錄本中Kozak 序列是小核糖體亞單位穩(wěn)定結(jié)合位點(diǎn),其可促進(jìn)翻譯更快的啟動(dòng)[30];在Kozak 序列-6 位的G 以及-1、-2位的C 可以顯著地提高mRNA 翻譯起始效率[30-31];當(dāng)上游開放閱讀框(upstream open reading frames,uORF)的AUG 起始密碼子被放置在一個(gè)較不理想的Kozak 序列時(shí),uORF 編碼的肽段表達(dá)水平較低[32]。
2.1.2 原核細(xì)胞mRNA 的SD 序列 1974年John Shine 和Lynn Dalgarno 在大腸桿菌RBS 序列中發(fā)現(xiàn)有一段富含嘌呤的序列,其可促進(jìn)翻譯的起始[33],該序列被命名為Shine Dalgarno(SD)。SD 通常指存在于細(xì)菌和古細(xì)菌等原核生物中的位于翻譯起始密碼子AUG 上游約8-10 個(gè)堿基的核糖體結(jié)合位點(diǎn)序列,但也被發(fā)現(xiàn)存在于葉綠體和線粒體轉(zhuǎn)錄本[34]。SD 序列的組成并不完全相同,其可以與核糖體16S rRNA 的anti-SD 序列(aSD)形成穩(wěn)定的SD:aSD堿基對(duì),進(jìn)而促進(jìn)核糖體的招募和mRNA 的翻譯。不同堿基組成的SD 序列與anti-SD 序列的配對(duì)程度不同,因此翻譯起始效率也有所不同。例如,藍(lán)球藻和萊茵衣藻psbD 基因的SD 序列或起始密碼子中引入突變會(huì)大大降低翻譯效率[35];Barrick 等[36]研究了4 種堿基隨機(jī)分布的185 種不同組成的SD 序列,以β-半乳糖苷酶為目標(biāo)蛋白在大腸桿菌中進(jìn)行表達(dá),其表達(dá)量最高和最低相差3 000 多倍。以上表明,SD 序列通過SD:aSD 堿基配對(duì)促進(jìn)翻譯起始,且結(jié)合程度越強(qiáng)翻譯起始速率越高,但其并不是決定翻譯的必要條件。此外,SD 序列與起始密碼子的相對(duì)位置也影響著翻譯起始效率。例如,枯草芽孢桿菌的胞內(nèi)蛋白的SD 序列與起始密碼子間隔7-9 個(gè)核苷酸的翻譯起始效率是間隔4 個(gè)核苷酸翻譯效率的27 倍[37];RelA 是一類核糖體依賴性合成酶,其通過與SD 序列中的GGAG 序列結(jié)合,干擾核糖體與mRNA 的結(jié)合,進(jìn)而抑制翻譯起始,但其抑制程度取決于GGAG 相對(duì)于AUG 的距離,縮短GGAG 與AUG 之間的距離則會(huì)消除RelA 介導(dǎo)的抑制作用[38](圖3)。因此,改變SD 序列的堿基組成或改變SD 序列與起始密碼子的相對(duì)位置都對(duì)mRNA翻譯起始速率有著重要影響。
圖3 ReIA 在SD 區(qū)介導(dǎo)的翻譯起始抑制Fig.3 Inhibition of translation initiation mediated by ReIA in SD region
在翻譯起始過程中,雖然翻譯起始因子可以消除mRNA 的二級(jí)結(jié)構(gòu)[33],但對(duì)于結(jié)構(gòu)穩(wěn)定的二級(jí)或高級(jí)結(jié)構(gòu)卻很難消除。因此,mRNA 二級(jí)結(jié)構(gòu)對(duì)于翻譯速率的影響占主導(dǎo)地位,其通過影響核糖體與mRNA 的結(jié)合能力阻礙翻譯起始[28]。5′非編碼區(qū)(untranslated region,UTR)是指mRNA 的5′末端帽子結(jié)構(gòu)到起始密碼子之間的一段序列,是核糖體識(shí)別重要元件之一[39]。該區(qū)域通常存在核糖體開關(guān)、miRNA 靶位點(diǎn)等可以調(diào)控mRNA 二級(jí)結(jié)構(gòu)穩(wěn)定性的調(diào)控元件。例如,在枯草芽孢桿菌中xpt-pbuX mRNA 的5′UTR 存在一個(gè)對(duì)鳥嘌呤高度敏感的核糖體開關(guān),當(dāng)鳥嘌呤濃度升高時(shí),適體結(jié)構(gòu)域(aptamer domain,AD)結(jié)合鳥嘌呤后構(gòu)象發(fā)生變化,表達(dá)結(jié)構(gòu)域(expression domain,EPD)的抗隔離子結(jié)構(gòu)消失,導(dǎo)致隔離子莖環(huán)結(jié)構(gòu)的形成,使SD 序列和翻譯起始密碼子 AUG 參與配對(duì),阻止核糖體的結(jié)合,抑制 xpt-pbuX 的翻譯[40](圖4);Gu 等[41]系統(tǒng)地對(duì)動(dòng)物和植物中5′UTR 的二級(jí)結(jié)構(gòu)的研究中發(fā)現(xiàn),被miRNA 靶向的mRNA 的5′UTR 往往具有更加穩(wěn)定的局部二級(jí)結(jié)構(gòu),這種趨勢(shì)往往存在于動(dòng)物中,植物中并不存在。此外有研究表明,miRNA 與靶向的mRNA結(jié)合后可招募Ago2蛋白沉積于mRNA的靶標(biāo);由于Ago2 蛋白的中心結(jié)構(gòu)域與翻譯起始因子eIF4E極為相似,因此被沉積于mRNA 靶標(biāo)上的Ago2 蛋白與m7G 帽子結(jié)合,阻止eIF4E 的招募,進(jìn)而阻止eIF4F 的形成,抑制翻譯的起始[42](圖5)。此外有研究發(fā)現(xiàn),mRNA 在同一密碼子偏好性的前提下,其二級(jí)結(jié)構(gòu)的改變可提高mRNA 的翻譯效率,而當(dāng)二級(jí)結(jié)構(gòu)不發(fā)生改變時(shí),僅使用偏好密碼子并不能提高蛋白質(zhì)的表達(dá),表明稀有密碼子的使用是通過弱化mRNA 的二級(jí)結(jié)構(gòu)進(jìn)而促進(jìn)其翻譯[43]。以上結(jié)果表明,5′UTR 區(qū)內(nèi)mRNA 的二級(jí)結(jié)構(gòu)影響著翻譯起始速率,且稀有密碼子對(duì)翻譯速率的影響也是通過強(qiáng)化/弱化mRNA 的二級(jí)結(jié)構(gòu)而實(shí)現(xiàn)。
圖4 核糖體開關(guān)對(duì)xpt-pbuX 的調(diào)控Fig.4 Regulation of xpt-pbuX by ribosomal switch
圖5 Ago2 蛋白對(duì)翻譯起始的抑制機(jī)制Fig.5 Mechanism of Ago2 protein on the inhibition of translation initiation
細(xì)胞內(nèi)蛋白質(zhì)的合成并不是從RNA 分子的任何堿基起始的,而是由存在特異序列的AUG 作為起始密碼子,開始多肽鏈的合成。如果沒有特異序列的存在,這個(gè)密碼子則會(huì)被單純地讀作鏈內(nèi)甲硫氨酸的密碼子。Ingoli 等[44]通過對(duì)小鼠5 647 個(gè)典型蛋白質(zhì)的起始密碼子研究發(fā)現(xiàn),有79%蛋白質(zhì)的起始密碼子是AUG,剩余的21%是同源起始密碼子;CUG、GUG、ACG 和UUG 是最常用的同源密碼子,而密碼子AUU、AUC、AUA 和AGG 出現(xiàn)頻率則較少[45]。有研究表明,起始密碼子及其后一位密碼子類型的改變都影響著mRNA 的翻譯起始速率。例如,在真核細(xì)胞中,與同源起始密碼子相比,翻譯起始因子在AUG 處持有更有效的翻譯起始[32];Stenstrom[46]在大腸桿菌中利用缺少明顯SD 序列特征的基因中發(fā)現(xiàn)改變起始密碼子下一位的密碼子可以促使基因翻譯量增加20 倍之多,證明基因表達(dá)量與蛋白序列第二位的密碼子有關(guān),并且高表達(dá)蛋白的第二位氨基酸傾向使用腺嘌呤含量高的密碼子編碼。此外,5′UTR 區(qū)的非AUG 起始的uORF 通常對(duì)下游基因的翻譯產(chǎn)生抑制作用;且該區(qū)的AUG 密碼子也會(huì)干擾核糖體的招募,從而導(dǎo)致翻譯起始效率降低[30]。
除探究mRNA“特殊序列”、mRNA 的二級(jí)結(jié)構(gòu)和起始密碼子對(duì)翻譯起始速率的影響外,整體評(píng)估m(xù)RNA 翻譯速率對(duì)于蛋白質(zhì)的表達(dá)有著重要的意義。mRNA 測(cè)序技術(shù)非常完善,通過高通量測(cè)序技術(shù)探究處于翻譯狀態(tài)的mRNA,既可以間接反應(yīng)蛋白質(zhì)的翻譯水平,又可以檢測(cè)到基因的可變剪接甚至發(fā)現(xiàn)新蛋白質(zhì)分子[1-2]。因此,利用高通量測(cè)序技術(shù)對(duì)正在翻譯的mRNA 測(cè)序和分析成為當(dāng)今研究的熱點(diǎn)。翻譯組研究最為常見的是多聚核糖體圖譜技術(shù)(polysome profiling),此外也有最近發(fā)展起來的翻譯譜分析技術(shù)(RNC-RNA-Seq)、核糖體圖譜技術(shù)(ribosome profiling)、核糖體親和純化技術(shù)(ribosome affinity purification,RAP)。翻譯組研究技術(shù)比較見表1。
表1 翻譯組研究技術(shù)比較Table 1 Comparison of techniques in translatome
核糖體是細(xì)胞內(nèi)部密度最大的生物分子,單條mRNA 可以同時(shí)與多個(gè)核糖體結(jié)合形成分子量更大的多聚復(fù)合物。利用抗生素放線菌酮可將正在翻譯的RNA 固定,阻止核糖體內(nèi)tRNA 釋放[47],進(jìn)而阻止翻譯延伸。隨后利用蔗糖密度梯度離心法將分布在不同梯度溶液中游離的RNA、核糖體大/小亞基以及結(jié)合有不同數(shù)目核糖體的mRNA 進(jìn)行分離。根據(jù)結(jié)合核糖體數(shù)目的不同對(duì)mRNA 進(jìn)行分離,并利用Northern 雜交、RT-qPCR[48-49]和微陣列分析[50-53]等方法對(duì)每組收集到的特定mRNA 進(jìn)行分析(圖6)。此外,若對(duì)正在翻譯的RNA 進(jìn)行整體分析,可以通過構(gòu)建RNA-Seq 文庫(kù)、高通量測(cè)序[54-56]實(shí)現(xiàn)。多聚核糖體圖譜技術(shù)在人類癌癥的治療、非編碼RNA 編碼小肽的發(fā)現(xiàn)及植物在逆境脅迫的應(yīng)答等多方面都得到廣泛應(yīng)用。例如,Polenkowski 等[57]通過多聚核糖體圖譜技術(shù)發(fā)現(xiàn)在肝癌細(xì)胞(HCC)中表達(dá)且可以編碼功能性小蛋白C20orf204-189AA 的Linc00176,其可能是HCC的特異性靶分子,且C20orf204-189AA 小蛋白也可以增強(qiáng)核糖體RNA 的轉(zhuǎn)錄,進(jìn)一步促進(jìn)HCC 的增殖;高溫脅迫是全球小麥生產(chǎn)的主要限制因素,通過CRISPR /Cas9 的基因編輯和多聚核糖體圖譜等技術(shù)分析發(fā)現(xiàn)基因TaMBF1c顯著影響著熱響應(yīng)因子的翻譯效率,且與熱休克蛋白的翻譯密切相關(guān),其結(jié)果揭示了TaMBF1c通過翻譯調(diào)控小麥的熱應(yīng)激反應(yīng)[58]。
圖6 翻譯組研究技術(shù)流程Fig.6 Technical process of translationomics
多聚核糖體圖譜技術(shù)能夠獲取正在翻譯的mRNA 的全長(zhǎng)信息,但沒有辦法獲知mRNA 內(nèi)部的翻譯信息,例如核糖體位置、閱讀框位置、翻譯暫停區(qū)、uORFs 等。該實(shí)驗(yàn)相對(duì)容易、適用范圍廣,但實(shí)驗(yàn)操作過程復(fù)雜、樣本需求量大[56]。此外,蔗糖密度離心的體積通常較大[27],且在高濃度的蔗糖溶液中常摻有脂筏、假多聚核糖體等高分子量復(fù)合物[59],這些都大大增加了獲取核糖體-新生肽鏈復(fù)合物(ribosome nascent-chain complex,RNC)中的mRNA 即翻譯成蛋白質(zhì)的mRNA 的難度,進(jìn)一步局限該技術(shù)的發(fā)展。
在評(píng)估細(xì)胞內(nèi)翻譯活躍程度方面,多聚核糖體圖譜可根據(jù)mRNA 結(jié)合核糖體數(shù)目判斷該mRNA 翻譯的活躍程度,且根據(jù)mRNA 在高濃度和低濃度蔗糖溶液的比例、正在翻譯的mRNA 與總mRNA 之間的比例共同判斷細(xì)胞的活躍程度。
有研究發(fā)現(xiàn),若一條mRNA 結(jié)合過多的核糖體則易發(fā)生核糖體“堆積”,阻礙翻譯延伸,降低翻譯速率。然而,部分mRNA 雖只結(jié)合單個(gè)核糖體,但其翻譯狀態(tài)卻異常的活躍。如在公認(rèn)的翻譯活躍的HEK293 細(xì)胞和處于富營(yíng)養(yǎng)培養(yǎng)基上對(duì)數(shù)生長(zhǎng)的大腸桿菌中,其單核糖體組分占有主要地位[60-61]。將單核糖體單體分離并放置于無細(xì)胞翻譯體系中,其核糖體可以繼續(xù)翻譯生成蛋白質(zhì)[61]。這都說明翻譯的活躍程度與mRNA 上核糖體的數(shù)量并不總呈正相關(guān),但只要mRNA 與核糖體結(jié)合即可表明其處于翻譯狀態(tài)[62]?;谠摾碚?,2013年張弓實(shí)驗(yàn)室開發(fā)了RNC-RNA-Seq[3],與多聚核糖體圖譜技術(shù)類似,利用超速離心的方法將正在翻譯的mRNA 與游離的mRNA 分離并對(duì)翻譯中的mRNA 測(cè)序建庫(kù),不同的是RNC-RNA-Seq 是采用單一濃度蔗糖溶液(30%蔗糖溶液)將正在翻譯的mRNA 與游離的mRNA 分離。該技術(shù)通常與RNA-Seq 技術(shù)相結(jié)合,共同探究動(dòng)植物及細(xì)菌等在體內(nèi)的轉(zhuǎn)錄和翻譯調(diào)控。例如,Luo 等[63]發(fā)現(xiàn)甜菜堿是通過調(diào)節(jié)基因的翻譯過程發(fā)揮降脂作用,其中Gpc1是降脂的關(guān)鍵基因;Zhang等[64]在膠質(zhì)母細(xì)胞中發(fā)現(xiàn)LINC-PINT 可編碼多肽,且該肽可直接與聚合酶相關(guān)因子復(fù)合物(PAF1c)相互作用,抑制多種癌基因的翻譯過程,進(jìn)而抑制膠質(zhì)母腫瘤細(xì)胞的增殖。
與多聚核糖體圖譜相比,RNC-RNA-Seq 簡(jiǎn)化了分離RNC-mRNA 的程序,有效地解決了多聚核糖體圖譜技術(shù)中溶液體積大、RNC-mRNA 濃度低的問題[27]。此外,實(shí)驗(yàn)中得到的RNC-mRNA 仍保留翻譯活性,給予合適的緩沖液即可恢復(fù)翻譯能力[61]。不足的是RNC-RNA-Seq 依舊沒有辦法獲取mRNA內(nèi)部翻譯信息,且單一濃度的蔗糖溶液使得沉淀物中不僅包含脂筏、假多聚核糖體等[59]高分子量復(fù)合物,還含有核糖體的大小亞基、單核糖體等,增加了獲取mRNA 信息的難度。
由于RNC-RNA-Seq 探究的是細(xì)胞內(nèi)mRNA 分子是否進(jìn)行翻譯,對(duì)某個(gè)基因或細(xì)胞內(nèi)整體翻譯速率的水平還無法探知。但該技術(shù)與RNA-Seq 結(jié)合可共同分析翻譯過程中細(xì)胞整體或某個(gè)基因的翻譯水平。
2009年由Weissman 課題組首次發(fā)表核糖體圖譜技術(shù)(Ribo-Seq)[65],其利用核糖核酸酶I(ribonuclease I,RNase I)降解游離和不被核糖體保護(hù)的RNA 片段,并通過蔗糖梯度超速離心法獲取被核糖體保護(hù)的RNA 片段(ribosome footprints,RFPs),隨后去除核糖體,并將RNA 片段進(jìn)行高通量測(cè)序和生物信息學(xué)分析,最終獲取正在翻譯的RNA 信息。Ribo-Seq 的精度是單密碼子級(jí)別,可精準(zhǔn)獲取某基因內(nèi)部的翻譯信息,如核糖體分布位置、起始密碼子位置、程序性框移動(dòng)、uORF 等[66]。除Ribo-Seq 外,Pelechano 等[67]建立的5PSeq 技術(shù)也可以在單堿基分辨率下高通量捕獲核糖體的位置信息。因此,上述兩種技術(shù)在開放閱讀框(open reading frames,ORF)的發(fā)現(xiàn)、翻譯起始位點(diǎn)的發(fā)現(xiàn)及翻譯暫停等方面有著得天獨(dú)厚的優(yōu)勢(shì)[62,65]。例如,Sotta 等[68]采用Ribo-Seq 確定了高粱全基因組中快速翻譯的閱讀框,檢測(cè)到4 843 個(gè)主開放閱讀框(main ORF,mORF),并發(fā)現(xiàn)許多未被注釋的翻譯事件;Van’t Spijker[69]在人類G4C2基因的上游內(nèi)含子中發(fā)現(xiàn)3 個(gè)起始位點(diǎn),且該基因在核糖體易位過程中出現(xiàn)停頓現(xiàn)象。
雖然Ribo-Seq 有諸多優(yōu)點(diǎn),但其存在樣本需求量大、成本高且操作要求高等問題[62]。此外,Ribo-Seq 也存在一定的局限性。例如,RNase I 不會(huì)降解與核糖體結(jié)合且被RNA 結(jié)合蛋白保護(hù)的或雙鏈的RNA[70],此類RNA 在實(shí)驗(yàn)中會(huì)被剔除,進(jìn)而遺漏部分正在翻譯的RNA 信息;該技術(shù)只分析與核糖體結(jié)合的區(qū)域,并不能獲得與翻譯調(diào)控相關(guān)的非翻譯區(qū)的信息[27];實(shí)驗(yàn)通常只選取25-35 nt 的RFPs,而核糖體保護(hù)的RNA 片段長(zhǎng)度差異很大(通常為19-75 nt),忽略其他大小的RFPs 片段,易造成翻譯信息的缺失。因此我們還需要從不同方面不斷優(yōu)化實(shí)驗(yàn),提出更加合理的實(shí)驗(yàn)方案。
通過Ribo-Seq,可以清楚地了解每條RNA 結(jié)合核糖體的數(shù)目、位置等信息,因此可以根據(jù)基因結(jié)合核糖體的數(shù)目初步判斷翻譯的活躍程度。此外,也可以結(jié)合轉(zhuǎn)錄組數(shù)據(jù)計(jì)算整體或某基因的翻譯水平。
核糖體親和純化技術(shù)(RAP)最早是由Gerbei課題組于2002年發(fā)表[27],與其他翻譯組技術(shù)不同,利用親和純化以及組織特異性啟動(dòng)子可在目的細(xì)胞內(nèi)特異性表達(dá)這兩大原理,實(shí)現(xiàn)對(duì)樣品中難以分離的目的細(xì)胞進(jìn)行翻譯水平的探究。其在核糖體內(nèi)RPL25p 或RPL16a 蛋白的C 末端連接親和標(biāo)簽(如His、FLAG 和eGFP 等),這兩類蛋白可被組織特異性啟動(dòng)子啟動(dòng),純化后獲得過表達(dá)核糖體蛋白細(xì)胞系,隨后采用抗體與抗原特異性結(jié)合的原理將含有標(biāo)簽的RNC-mRNA 進(jìn)行分離,最后將被標(biāo)記的mRNA 進(jìn)行測(cè)序建庫(kù)分析[24]。該技術(shù)在檢測(cè)組織中特異性表達(dá)的mRNA、細(xì)胞的分離和建系等方面有著舉足輕重的地位。例如,Heiman[71]在中樞神經(jīng)系統(tǒng)細(xì)胞中發(fā)現(xiàn)上千個(gè)在細(xì)胞中特異性表達(dá)的mRNA,這些mRNA 在RNA-Seq 中很難被檢測(cè)到;Corbacho[72]利用RAP 對(duì)斑馬魚細(xì)胞群中的核糖體進(jìn)行遺傳標(biāo)記,獲得基因在視網(wǎng)膜、骨骼肌、頜骨等組織中特異性表達(dá)的細(xì)胞系。
RAP 技術(shù)不需要對(duì)RNC-mRNA 進(jìn)行廣泛的固定、超速離心分離或酶消化,可以在最小體外刺激下保持較完整的翻譯中RNA 圖譜,而且可以準(zhǔn)確的定位在目的細(xì)胞,無需考慮來自其他組織、細(xì)胞的污染,獲得與該細(xì)胞表型相關(guān)性更高的數(shù)據(jù)信息。但實(shí)驗(yàn)流程繁瑣冗長(zhǎng)、成本昂貴,且不能獲得RNA的閱讀框位置、翻譯暫停區(qū)、uORFs 以及核糖體數(shù)量和位置等信息;此外,過表達(dá)核糖體蛋白會(huì)干擾正常生理狀況,攜有標(biāo)簽的核糖體的翻譯性能也與正常核糖體不同,因而不能準(zhǔn)確地反映正常生理狀況下的翻譯狀況[27]。
與RNC-RNA-Seq 相同,都不能獲取核糖體數(shù)目信息。因此,在計(jì)算整體或某基因的翻譯速率時(shí)都需要與RNA-Seq 數(shù)據(jù)相結(jié)合,共同分析細(xì)胞整體或單基因的翻譯水平。
中心法則闡述了遺傳信息從DNA 通過轉(zhuǎn)錄為RNA,再經(jīng)翻譯合成蛋白質(zhì)的基本生物學(xué)過程。蛋白質(zhì)是發(fā)揮生物學(xué)功能的實(shí)際執(zhí)行者,但其組成多樣、構(gòu)象復(fù)雜且結(jié)構(gòu)穩(wěn)定等都嚴(yán)重阻礙著蛋白質(zhì)組學(xué)的發(fā)展。翻譯速率是蛋白質(zhì)豐度的決定性因素,眾多學(xué)者通過mRNA 結(jié)合核糖體的數(shù)目判斷翻譯的快慢。事實(shí)上,該方法在一定條件下是準(zhǔn)確的;當(dāng)核糖體在mRNA 上“堆積”時(shí),過多的核糖體則會(huì)阻礙mRNA 的翻譯,利用該方法評(píng)估m(xù)RNA 的翻譯速率是不準(zhǔn)確的。值得注意的是,并非高速的翻譯就能獲得最佳的表達(dá)效果,高速的翻譯會(huì)使多肽鏈錯(cuò)誤折疊的概率增加,進(jìn)而形成無活性、不可溶的包涵體。所以翻譯速率應(yīng)當(dāng)與蛋白質(zhì)的折疊速率相“匹配”,這其中必然存在著某些重要的調(diào)控因子調(diào)控著二者的速率,還需進(jìn)一步的挖掘和發(fā)現(xiàn)。當(dāng)前,從基因組到轉(zhuǎn)錄組的調(diào)控機(jī)理研究得較為清楚,而從轉(zhuǎn)錄組到蛋白組的調(diào)控機(jī)理研究還非常薄弱,而翻譯組恰恰是連接轉(zhuǎn)錄組和蛋白組的橋梁。因此,通過翻譯組探究正在翻譯的mRNA 已經(jīng)成為當(dāng)前研究的熱點(diǎn)。利用該技術(shù)可幫助我們清晰地了解細(xì)胞內(nèi)RNA 的翻譯狀態(tài),有利于發(fā)現(xiàn)更多具有編碼能力的非編碼RNA,這為蛋白數(shù)據(jù)庫(kù)和分子生物學(xué)理論的補(bǔ)充和完善,對(duì)生命科學(xué)的發(fā)展具有重要的意義。