張躍博,王立剛,侯欣華,劉 欣,顏 華,張龍超*,王立賢*
(1.中國(guó)農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所,北京 100193; 2.湖南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院,長(zhǎng)沙 410128)
RNA編輯廣泛發(fā)生于細(xì)菌、真菌、病毒、動(dòng)植物等,具有改變氨基酸序列、影響可變剪接、導(dǎo)致內(nèi)含子滯留、影響RNA穩(wěn)定性等功能[1],為解釋諸多復(fù)雜生命過程提供了一個(gè)新的研究方向。在哺乳動(dòng)物中,A-to-I型RNA編輯最為普遍,所占比例可達(dá)90%以上[2-3]。研究顯示,大部分A-to-I編輯事件位于重復(fù)元件,僅有少數(shù)發(fā)生于編碼區(qū)[4-6],預(yù)示A-to-I編輯的功能可能以調(diào)控基因表達(dá)為主。已報(bào)道A-to-I編輯在癌癥、自身免疫性疾病、多種神經(jīng)性疾病中發(fā)揮重要作用[7-10]。目前,決定RNA中腺苷發(fā)生脫氨反應(yīng)的機(jī)制尚不清楚,但已知雙鏈RNA結(jié)構(gòu)(double-stranded RNA,dsRNA)和作用于RNA的腺苷脫氨酶(adenosine deaminases acting on RNA,ADARs)是A-to-I編輯發(fā)生的必要條件。次黃苷(inosine,I)在翻譯過程中會(huì)被識(shí)別為鳥苷(guanosine,G),因此A-to-I編輯也稱A-to-G編輯。
ADAR2是ADAR酶家族的一員,主要存在于細(xì)胞核,具有催化A-to-I編輯的活性,但對(duì)特異性編輯位點(diǎn)的親和力高于隨機(jī)性編輯位點(diǎn)[11],其編輯作用具有選擇性。敲除ADAR2的小鼠產(chǎn)后出現(xiàn)癲癇,并會(huì)于20~25日齡時(shí)死亡,但若同時(shí)將GluR2 Q/R位點(diǎn)上A替換為G,小鼠的壽命表現(xiàn)正常[12-14],表明ADAR2介導(dǎo)的A-to-I編輯具有影響機(jī)體生命活動(dòng)的潛力。高通量測(cè)序分析發(fā)現(xiàn),ADAR2 在人體動(dòng)脈中高表達(dá),同時(shí)有研究表明,編碼區(qū)的RNA編輯水平在人體動(dòng)脈中最高[15],預(yù)示著ADAR2可能與血管疾病密切相關(guān)。此外,ADAR2 過表達(dá)的小鼠會(huì)因食欲亢進(jìn)而引發(fā)肥胖[16]。豬的解剖特征、生理生化特點(diǎn)等與人類極為相似,可作為研究人類疾病的動(dòng)物模型,其相關(guān)研究勢(shì)必促進(jìn)人們對(duì)自身疾病致病機(jī)理的認(rèn)識(shí)。盡管如此,對(duì)豬ADAR2的研究仍然比較缺乏,其序列特征、表達(dá)模式尚未有相關(guān)報(bào)道。
本研究利用RACE技術(shù)克隆豬ADAR2 cDNA全長(zhǎng)序列,并對(duì)序列特征進(jìn)行分析,同時(shí)應(yīng)用實(shí)時(shí)熒光定量PCR(real-time quantitative PCR,qPCR)技術(shù)檢測(cè)大白豬不同組織中ADAR2的表達(dá)模式,為進(jìn)一步研究豬ADAR2的功能及其調(diào)控A-to-I編輯的機(jī)制奠定基礎(chǔ)。
本研究使用的4頭大白仔豬來自中國(guó)農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所昌平試驗(yàn)基地豬場(chǎng)。35日齡屠宰,采集心、肝、脾、肺、腎、腦、肌肉、小腸和背部脂肪組織,并經(jīng)液氮速凍后于-80 ℃冰箱保存?zhèn)溆谩?/p>
使用RNA提取試劑盒(天根,北京)提取大白豬9種組織的總RNA,并利用超微量分光光度計(jì)(NanoDrop2000)和1%瓊脂糖凝膠電泳對(duì)RNA純度、濃度和完整性進(jìn)行檢測(cè)。取1 μg質(zhì)量合格的RNA,參照PrimeScriptTMRT反轉(zhuǎn)錄試劑盒(TaKaRa,日本)說明書合成cDNA,用于克隆全長(zhǎng)cDNA序列的中間片段和檢測(cè)ADAR2在各組織中的表達(dá)情況。使用大白豬脾臟組織RNA,根據(jù)SMARTer RACE 5′/3′試劑盒(Clontech,日本)說明書分別合成5′- 和3′-RACE的cDNA模板,用于克隆5′和3′末端序列。
以GenBank中的豬ADAR2 mRNA預(yù)測(cè)序列(登錄號(hào):XM_021071524.1)為模板,利用NCBI中的Primer-BLAST工具設(shè)計(jì)用于克隆1 164 bp中間片段的引物(表1)。PCR反應(yīng)體系為25 μL,包括12.5 μL 2× Taq PCR Master Mix,1 μL cDNA模板,上、下游引物(10 μmol·L-1)各1 μL,以及9.5 μL ddH2O。PCR反應(yīng)條件:94 ℃ 3 min;94 ℃ 30 s,55 ℃ 30 s,72 ℃ 60 s,35個(gè)循環(huán);72 ℃ 10 min。 利用1.5%瓊脂糖凝膠電泳對(duì)反應(yīng)產(chǎn)物進(jìn)行檢測(cè),然后送北京諾賽基因組研究中心有限公司測(cè)序。以克隆獲得的中間序列為模板,應(yīng)用Primer-BLAST工具設(shè)計(jì)5′- 和3′-RACE所需的特異性引物(表1)。參照SMARTer RACE試劑盒說明,分別以合成的5′- 和3′-RACE的cDNA為模板,采用巢式PCR擴(kuò)增5′和3′末端序列。將獲得的PCR產(chǎn)物切膠回收,克隆到linearized pRACE載體,挑選陽性克隆送北京諾賽基因組研究中心有限公司測(cè)序。
利用DNAMAN軟件拼接組裝獲得cDNA序列,并分析物種間ADAR2 的CDS區(qū)核苷酸序列和氨基酸序列的一致性。使用ProtParam(https://web.expasy.org/protparam/)軟件分析豬ADAR2蛋白質(zhì)的理化性質(zhì)。利用ProtScale (https://web.expasy.org/protscale/)分析蛋白親-疏水性。分別使用PSIPRED(http://bioinf.cs.ucl.ac.uk/psipred/)和SWISS-MODEL(https://www.swissmodel.expasy.org/)預(yù)測(cè)豬ADAR2蛋白質(zhì)二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)。ADAR2系統(tǒng)進(jìn)化樹使用MEGA-X繪制。采用NCBI中的Batch CD-Search(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi) 預(yù)測(cè)ADAR2蛋白的結(jié)構(gòu)域。
以大白豬心、肝、肺、腎、脾、腦、小腸、背最長(zhǎng)肌和背部脂肪的cDNA為模板,GAPDH作內(nèi)參基因,采用qPCR方法檢測(cè)ADAR2的組織表達(dá)情況。反應(yīng)體系:2× SYBRRPremix ExTaqII 10 μL,cDNA 2 μL,10 μmol·L-1上、下游引物各0.4 μL,50× ROX Reference Dye II 0.4 μL和ddH2O 6.8 μL。 反應(yīng)條件:95 ℃ 30 s;95 ℃ 5 s,60 ℃ 34 s,40個(gè)循環(huán);反應(yīng)結(jié)束后分析熔解曲線。所需引物均利用Primer-BLAST設(shè)計(jì)(表1)。以脂肪組織為對(duì)照,用2-△△Ct法計(jì)算ADAR2在各組織中的表達(dá)量,并利用SAS 9.2的GLM過程進(jìn)行單因素方差分析。
表1 豬ADAR2基因cDNA克隆及qPCR引物
在PIGPAN(http://animal.nwsuaf.edu.cn/code/index.php/panPig)的GBrowse中檢索獲得ADAR2在梅山、金華、八眉、榮昌、皮特蘭、長(zhǎng)白、大白、漢普夏、巴克夏和藏豬不同組織中RNA-seq的表達(dá)數(shù)據(jù),利用TBtools[17]繪制熱圖。每個(gè)品種1個(gè) 個(gè)體,7~9種組織,包括背最長(zhǎng)肌、腰大肌、皮下脂肪、心、肝、脾、肺、腎和卵巢。
克隆獲得的cDNA序列片段經(jīng)DNAMAN拼接后,得到豬ADAR2 cDNA全長(zhǎng)序列,其長(zhǎng)度為6 305 bp, 其中5′ UTR、3′ UTR和CDS分別為548、3 616和2 115 bp,還有一個(gè)ploy(A)尾巴;編碼704個(gè)氨基酸,起始密碼子為ATG,終止密碼子為TGA。序列已提交到GenBank,登錄號(hào)為MW273927。利用Ensembl中的BLAST/BLAT在線工具對(duì)克隆獲得的cDNA全長(zhǎng)序列進(jìn)行分析發(fā)現(xiàn),豬ADAR2基因共包含12個(gè)外顯子(圖1),各外顯子長(zhǎng)度在75~3 796 bp之間,僅有1個(gè)內(nèi)含子的剪接位點(diǎn)序列不符合GT-AG法則,為GC-AG(表2)。
圖1 豬ADAR2基因結(jié)構(gòu)Fig.1 Gene structure of porcine ADAR2 gene
表2 豬ADAR2基因的剪接位點(diǎn)
核甘酸序列一致性分析表明,豬與偶蹄目家畜山羊(89.9%)、綿羊(89.7%)和牛(88.8%)的一致性最高,其次是人等靈長(zhǎng)目動(dòng)物(約84%),與斑馬魚(69.0%)的一致性最低(表3)。豬ADAR2基因預(yù)測(cè)的氨基酸序列與其他物種相應(yīng)序列的一致性分析發(fā)現(xiàn),豬與綿羊的一致性最高,高達(dá)93.3%;其次是牛,為92.0%;與斑馬魚的一致性最低,僅為69.0%(表3)。
預(yù)測(cè)的豬ADAR2蛋白共包含10 747個(gè)原子,分子量是76.35 ku,理論等電點(diǎn)9.03,不穩(wěn)定系數(shù)高達(dá)48.58。蛋白質(zhì)疏水性分析顯示,豬ADAR2蛋白在第358位氨基酸得分最高(2.0),表明此位點(diǎn)疏水性最強(qiáng);在第476位氨基酸得分最低(-3.0),表明此位點(diǎn)的親水性最高。該蛋白的疏水性平均得分為-0.34,因此推測(cè)其屬于親水性蛋白(圖2A)。二級(jí)結(jié)構(gòu)預(yù)測(cè)顯示,ADAR2共含有α-螺旋(28.0%)、β-折疊(13.9%)和無規(guī)則卷曲(58.1%)3種 二級(jí)結(jié)構(gòu)(圖2B)。利用SWISS-MODEL在線軟件獲得的豬ADAR2三級(jí)結(jié)構(gòu)構(gòu)象由第307~703位氨基酸構(gòu)成(圖2C)。
基于ADAR2的氨基酸序列,應(yīng)用MEGA-X軟件構(gòu)建系統(tǒng)進(jìn)化樹,以便系統(tǒng)性認(rèn)識(shí)該蛋白在種間的差異。如圖3所示,在進(jìn)化上豬ADAR2與偶蹄目家畜牛、綿羊和山羊的關(guān)系最近,與氨基酸的序列一致性分析結(jié)果基本吻合。保守結(jié)構(gòu)域預(yù)測(cè)發(fā)現(xiàn),所有物種的ADAR2都含有2個(gè)dsRNA結(jié)合基序和1個(gè)脫氨酶結(jié)構(gòu)域。豬ADAR2的dsRNA結(jié)合基序分別位于第82~146和第239~300位氨基酸,脫氨酶結(jié)構(gòu)域位于第325~701位氨基酸。
表3 豬ADAR2基因CDS區(qū)核酸序列和氨基酸序列與其他物種間的一致性
應(yīng)用qPCR檢測(cè)大白豬9種組織中ADAR2的mRNA表達(dá)量,結(jié)果顯示,ADAR2在被檢測(cè)的所有組織中均表達(dá);在肺中表達(dá)量最高,且顯著高于其他組織;在心、肌肉和小腸中的表達(dá)量都比較低(圖4A)。利用RNA-seq數(shù)據(jù)繪制的ADAR2在不同豬種的組織表達(dá)譜表明,豬ADAR2具有高度的表達(dá)保守性,其在不同品種間的表達(dá)規(guī)律基本一致,均在肺中高表達(dá)(圖4B)。
隨著高通量測(cè)序成本的不斷下降以及相關(guān)分析軟件的快速開發(fā),已知的RNA編輯位點(diǎn)數(shù)目大幅增加,現(xiàn)已鑒定出450多萬個(gè)人類的A-to-G編輯位點(diǎn)[18]。ADAR酶催化A-to-G編輯發(fā)生,該酶家族主要包括ADAR1、ADAR2和ADAR3。目前,僅發(fā)現(xiàn)ADAR1和ADAR2具有脫氨酶催化活性,但有報(bào)道稱,ADAR3可以通過競(jìng)爭(zhēng)性結(jié)合dsRNA從而抑制ADAR1和ADAR2的催化功能[19]。經(jīng)查詢發(fā)現(xiàn),NCBI數(shù)據(jù)庫中僅有豬ADAR2的不完整預(yù)測(cè)序列,在一定程度上阻礙了其功能的進(jìn)一步解析。
通過RACE技術(shù),本研究克隆獲得了豬ADAR2 基因的全長(zhǎng)cDNA,其長(zhǎng)度為6 305 bp,可編碼704個(gè)氨基酸,與人(701個(gè))、鼠(701個(gè))、雞(701個(gè))和斑馬魚(707個(gè))的ADAR2氨基酸序列長(zhǎng)度比較一致[20]。本研究克隆獲得的序列比NCBI中預(yù)測(cè)的mRNA序列(XM_021071524.1,5 803 bp) 在長(zhǎng)度上增加了502 bp,但編碼的氨基酸卻減少了9個(gè)。BLAT分析顯示,豬ADAR2基因含有12個(gè)外顯子,多于NCBI中的預(yù)測(cè)結(jié)果(9個(gè)), 并且僅有1對(duì)剪接供體和受體不符合GT-AG法則。據(jù)統(tǒng)計(jì),哺乳動(dòng)物中GT-AG剪切位點(diǎn)對(duì)占99.24%,GC-AG占0.7%,AT-AC占0.05%[21],說明非GT-AG 的剪切位點(diǎn)雖少但也是存在的。對(duì)于ADAR2 CDS區(qū)核苷酸序列而言,豬與同為偶蹄目家畜的牛、羊間的一致性最高(>88%),與人和鼠間的一致性也超過80%。ADAR2具有一個(gè)核定位信號(hào),其主要位于細(xì)胞核中[22-23],與其催化脫氨功能相符,但在未成熟的神經(jīng)元中卻位于細(xì)胞質(zhì)[24]。本研究未在豬ADAR2中預(yù)測(cè)到任何有利于其穿透細(xì)胞膜的跨膜結(jié)構(gòu)和信號(hào)肽,但發(fā)現(xiàn)與信號(hào)肽跨膜功能有關(guān)的α-螺旋含量較高[25]。疏水性分析發(fā)現(xiàn),該蛋白親水性較強(qiáng),可能有利于其通過親水性核質(zhì)交換通道——核孔,由細(xì)胞質(zhì)轉(zhuǎn)運(yùn)到細(xì)胞核,從而對(duì)新生成的RNA進(jìn)行編輯。多個(gè)物種間保守結(jié)構(gòu)域的預(yù)測(cè)顯示,ADAR2蛋白在結(jié)構(gòu)上高度保守,均具有2個(gè) dsRNA結(jié)合基序和1個(gè)脫氨酶活性結(jié)構(gòu)域,其中豬與哺乳動(dòng)物人、黑猩猩、獼猴、長(zhǎng)臂猿、牛、羊和小鼠的序列間具有高度一致性(>84%),表明ADAR2 在哺乳動(dòng)物中高度保守,推測(cè)豬ADAR2也具有RNA編輯的功能。ADAR2蛋白的系統(tǒng)進(jìn)化樹分析發(fā)現(xiàn),豬能夠與其他物種聚到一起,為ADAR2的物種間保守性提供支持。
A. 親疏水性分析;B. 二級(jí)結(jié)構(gòu)預(yù)測(cè);C. 三級(jí)結(jié)構(gòu)預(yù)測(cè) A. Hydrophilic-hydrophobic property prediction; B. Secondary structure prediction; C. Tertiary structure prediction圖2 豬ADAR2蛋白疏水性與結(jié)構(gòu)分析Fig.2 Hydrophobicity and structure analysis of the porcine ADAR2 protein
自展值和分支長(zhǎng)度分別列于節(jié)點(diǎn)右側(cè)和分支上側(cè) The bootstrap values and branch lengths are showed on the right of each node and above each branch, respectively圖3 ADAR2系統(tǒng)進(jìn)化樹Fig.3 Phylogenetic tree of ADAR2
A. ADAR2在大白豬9種組織中的表達(dá)分析:字母不同表示差異顯著(P<0.05),字母相同表示差異不顯著(P>0.05);B. ADAR2在不同豬種不同組織的RNA-seq表達(dá)差異 A. Expression analysis of ADAR2 in 9 tissues of Large White pigs: the different letters indicate statistically significant difference (P<0.05), the same letter indicates no statistically significant difference (P>0.05); B. The RNA-seq expression difference of ADAR2 in different tissues of different pig breeds圖4 豬ADAR2的組織表達(dá)分析Fig.4 Tissue expression analysis of porcine ADAR2
ADAR2基因表達(dá)于生物體的多種組織,已報(bào)道其在大腦中的表達(dá)量較高[26]。本研究同樣發(fā)現(xiàn),ADAR2 mRNA在檢測(cè)的9種大白豬組織中均表達(dá),但不同的是其在肺組織中的表達(dá)量最高,在雞中也發(fā)現(xiàn)了同樣的現(xiàn)象[27],并且該表達(dá)模式在豬種間高度保守。ADARs介導(dǎo)的RNA編輯可以將內(nèi)源性雙鏈RNA標(biāo)記成“自我”的分子,當(dāng)外源微生物入侵時(shí),免疫系統(tǒng)能夠準(zhǔn)確地識(shí)別“自我”和“非我”,對(duì)入侵病原體的外源RNA啟動(dòng)免疫[28-30]。肺是機(jī)體氣體交換的重要場(chǎng)所,易受病原微生物感染。同時(shí),前期的研究發(fā)現(xiàn),ADAR1在肺中也高表達(dá)[31]。因此,ADAR2在肺中高表達(dá)可能是肺部抗感染的需要。
ADAR2既能與自身形成同源二聚體,又可與另一具有催化活性的酶ADAR1形成異質(zhì)二聚體,其二聚體化可能是催化活性所必需的[32]。對(duì)ADARs 底物偏好性研究發(fā)現(xiàn),不同蛋白的RNA底物具有明顯差異[33],其中ADAR2主要負(fù)責(zé)非重復(fù)編碼區(qū)位點(diǎn)的編輯[15]。ADAR2催化的A-to-G編輯通常具有位點(diǎn)特異性,如GluR2 Q/R位點(diǎn)上的A-to-G編輯[34-35],且可以通過自編輯對(duì)自身活性進(jìn)行負(fù)調(diào)控[36]。ADAR2基因敲除小鼠的生存時(shí)間長(zhǎng)于ADAR1敲除小鼠,通常在出生數(shù)周內(nèi)死于癲癇[13]。但如果同時(shí)將GluR2 Q/R位點(diǎn)上的A變換為G,敲除鼠可繼續(xù)存活[13],表明該位點(diǎn)的編輯對(duì)于個(gè)體的生存是必須的。Terajima等[37]報(bào)道,在敲除ADAR2的小鼠中,由于RNA編輯的缺失導(dǎo)致生成的內(nèi)源性miRNA let-7 g減少,從而間接引起靶基因Cry2表達(dá)量的上調(diào),表型上出現(xiàn)運(yùn)動(dòng)節(jié)律縮短,說明ADAR2可以通過調(diào)節(jié)miRNA的表達(dá)影響正常的生理活動(dòng)。隨后的研究發(fā)現(xiàn),ADAR2在光照引起的生物鐘相移中發(fā)揮重要作用[38]。在正常人的腦膠質(zhì)細(xì)胞中ADAR2極弱表達(dá),但在高惡性膠質(zhì)瘤中則明顯表達(dá)[39]。同時(shí),也有研究報(bào)道,ADAR2在惡性膠質(zhì)瘤中的表達(dá)量并無明顯變化,但酶活性出現(xiàn)下降[40],可能是由于ADAR1與ADAR3表達(dá)量提高,與ADAR2競(jìng)爭(zhēng)性結(jié)合編輯底物造成的[41]。ADAR2的失調(diào)在癌癥的發(fā)生發(fā)展中具有重要意義,已發(fā)現(xiàn)多個(gè)ADAR2介導(dǎo)的RNA編輯的缺失與癌癥的發(fā)展密切相關(guān)。因此,還需深入挖掘ADAR2的功能,進(jìn)一步解析其對(duì)人類疾病和畜禽經(jīng)濟(jì)性狀的作用。
本研究成功克隆了豬ADAR2基因的全長(zhǎng)cDNA 序列,其長(zhǎng)度為6 305 bp,包含548 bp的5′ UTR,2 115 bp的 CDS,3 616 bp的3′ UTR和一個(gè)poly(A)尾巴,共編碼704個(gè)氨基酸。ADAR2在豬體內(nèi)廣泛表達(dá),且在肺中高表達(dá)。本研究結(jié)果對(duì)進(jìn)一步探索ADAR2的功能具有重要的理論意義和學(xué)術(shù)價(jià)值。