高曉敏,周舒簡,陳 晨,金 晶,胡 菜,張 晨,左其生,張亞妮,陳國宏,李碧春,2
(1.揚州大學動物科學與技術學院,中國教育部國際農(nóng)業(yè)與農(nóng)產(chǎn)品安全研究聯(lián)合實驗室,揚州 225009;2.江蘇科技大學生物技術學院,鎮(zhèn)江 212003)
長鏈非編碼RNA(long noncoding RNA,lncRNA)是一種不編碼蛋白質的RNA,在表觀遺傳、轉錄和轉錄后水平調(diào)控基因表達中發(fā)揮著重要作用[1]。近年來研究表明,lncRNA廣泛參與生命活動,包括細胞增殖、分化、凋亡[2],以及胚胎發(fā)育。因此,lncRNA的功能和調(diào)控機制的闡明對現(xiàn)代生命科學具有重要意義。原始生殖細胞是精子和卵子的祖細胞,雞原始生殖細胞(primordial germ cells,PGCs)有隨血液遷移的特點,受許多轉錄調(diào)控因素的調(diào)節(jié)。隨著高通量測序技術的發(fā)展,lncRNA在調(diào)控生殖細胞分化中起著非常重要的作用[3]。骨形態(tài)發(fā)生蛋白4(bone morphogenetic protein,BMP4)可誘導人胚胎干細胞(embryonic stem cells,ESCs)分化為生殖細胞,在胚胎干細胞培養(yǎng)液中加入BMP4可以導致生殖細胞標志物的表達[4]。本研究前期通過分析篩選雞ESCs、PGCs、精原干細胞(spermatogonial stem cells,SSCs)轉錄組測序結果,發(fā)現(xiàn)一條lncRNA(TCONS_00874170),預測其靶基因為BMP4,將其命名為lncRNA-BMP4[5]。其在PGCs上特異性高表達,但其表達調(diào)控機制并不清楚。lncRNA的表達具有時空特異性,而導致其特異性的主要原因是啟動子的活性不同[6]。
轉錄因子和表觀遺傳修飾是影響啟動子活性的主要因素[7]。Wang等[8]研究發(fā)現(xiàn),lncTCF7的啟動子區(qū)能與SWI/SNF復合物結合調(diào)節(jié)其表達,從而激活Wnt信號。除轉錄因子的影響外,表觀遺傳因素也會影響lncRNA啟動子的轉錄活性。DNA甲基化主要是與轉錄抑制有關的表觀遺傳修飾類型[9]。一些lncRNAs是通過其啟動子區(qū)域CpG位點的甲基化缺失而被表觀激活的[10]。研究表明,組蛋白乙?;揎検腔虮碛^轉錄調(diào)控的重要機制[11]。組蛋白H3k27乙酰化激活lncRNA PAXIP1-AS1可影響卵巢癌的發(fā)生[12]。多種物質可通過調(diào)控組蛋白乙?;接绊憀ncRNA的表達[13]。鑒于此,本研究通過雙熒光素酶報告系統(tǒng)確定lncRNA-BMP4的核心啟動子區(qū)域,并通過順反式驗證了影響啟動子核心區(qū)域表達的因素,以期為系統(tǒng)解析影響lncRNA的表達因素提供新思路,為詳細解析lncRNA-BMP4的功能和分子機制奠定理論基礎。
限制性內(nèi)切酶AseⅠ、XhoⅠ、Hind Ⅲ及2×SuperReal Color、PreMix Prime STAR Mix均購自TaKaRa公司;1×抗真菌/抗菌劑(100 μg/mL青霉素、100 μg/mL鏈霉素)購自Invitrogen公司;胰酶、高糖DMEM、10%胎牛血清(FBS)均購自Gibco公司;血液/細胞/組織基因組DNA提取試劑盒(DP304)、TRNzol Universal總RNA提取試劑(DP424)、FastKing一步法反轉錄-熒光定量試劑盒(SYBR Green,F(xiàn)P313)均購自天根生化科技(北京)有限公司;FuGENE?HD(E2311)和雙熒光素酶報告基因檢測系統(tǒng)均購自Promega公司;超級感受態(tài)、引物合成及測序均由北京擎科生物公司完成。pGL3-Basic載體、pEGFP-N1載體、雞成纖維細胞系(DF-1)均由中國教育部國際農(nóng)業(yè)與農(nóng)產(chǎn)品安全研究聯(lián)合實驗室保存。
超低溫離心機、超低溫冰箱、熒光酶標儀和細胞培養(yǎng)箱均購自Thermo公司;熒光倒置顯微鏡購自Olympus公司;熒光定量PCR儀、凝膠成像系統(tǒng)均購自Bio-Rad公司;水浴鍋購自上海精宏實驗設備有限公司。
根據(jù)軟件Softberry(http:∥linux1.softberry.com/berry.phtml topic=service)預測的lncRNA-BMP4啟動子序列設計啟動子全長擴增引物,引物序列為:F:5′-CCCATTAATGAGCCACTCTGTT-TCGCATT-3′(下劃線處為AseⅠ酶切位點);R:5′-CCCAAGCTTACCACTGAGCCATTCTTGGA-3′(下劃線處為Hind Ⅲ酶切位點)。引物由北京擎科生物科技有限公司合成。
通過血液/細胞/組織基因組DNA提取試劑盒(DP304)提取雞肌肉基因組DNA,并以此為模板進行PCR擴增。PCR擴增體系20 μL:Prime STAR Mix 10 μL,上、下游引物各1 μL,模板1 μL,ddH2O 7 μL。PCR擴增程序:94 ℃預變性5 min;94 ℃變性30 s,53 ℃退火30 s,72 ℃延伸40 s,共35個循環(huán);72 ℃延伸7 min。1.0%瓊脂糖凝膠電泳檢測PCR擴增產(chǎn)物。將鑒定正確的lncRNA-BMP4的PCR擴增產(chǎn)物回收純化后與pEGFP-N1載體連接,經(jīng)AseⅠ和Hind Ⅲ雙酶切,酶切鑒定正確后交于北京擎科生物公司測序,構建plncBMP4-N1載體。
以lncRNA-BMP4全長為模板,固定3′-端逐步縮短5′-端,分別設計啟動子不同缺失片段的引物,引物信息見表1。PCR擴增體系及程序同1.2。PCR擴增產(chǎn)物經(jīng)1.0%瓊脂糖凝膠電泳后進行目的產(chǎn)物純化回收,經(jīng)XhoⅠ和Hind Ⅲ雙酶切后連接到無啟動子的pGL3-Basic載體中,連接產(chǎn)物轉化超級感受態(tài)細胞,挑取陽性單克隆菌落進一步測序鑒定,構建雞lncRNA-BMP4的一系列5′-端缺失載體(圖1)。篩選到核心區(qū)域后,采用相同方法分別構建全長啟動子核心區(qū)域缺失的載體pGL3-DE-p4-p5,以及只含有核心區(qū)域的載體pGL3-p4-p5。將這2個載體與8個缺失載體分別轉染DF-1細胞,并進行雙熒光素報告基因檢測,進一步確定啟動核心區(qū)域位置。
表1 lncRNA-BMP4擴增引物序列
圖1 lncRNA-BMP4啟動子系列缺失載體引物設計模式圖
通過轉錄因子預測網(wǎng)站 Jaspar(http:∥jaspar.genereg.net/cgi-bin/jaspar_db.pl)預測lncRNA-BMP4核心啟動子區(qū)域可能發(fā)揮作用的轉錄因子,分別為性別決定區(qū)Y的盒內(nèi)基因17(SOX17)、環(huán)磷腺苷效應元件結合蛋白1(CREB1)、信號轉導與轉錄激活因子1(STAT1)。運用MethPrimer軟件對lncRNA-BMP4啟動子區(qū)進行分析,預測CpG島。使用GC含量在線計算網(wǎng)站(http:∥www.detaibio.com/tools/gc-content.html)對其啟動子區(qū)的GC含量進行分析。
在pGL3-p4-p5質?;A上分別將SOX17、CREB1、STAT1轉錄因子結合位點缺失,重新插入pGL3-Basic載體中,命名為pGL3-SOX17 mut、pGL3-CREB1 mut和pGL3-STAT1 mut。將pGL3-p4-p5、3個突變載體與內(nèi)參質粒sv40共轉染DF-1細胞。轉染48 h后,收集細胞樣品進行雙熒光素酶活性驗證,比較SOX17、CREB1、STAT1轉錄因子結合位點突變后是否影響lncRNA-BMP4的啟動子活性。
根據(jù)NCBI中雞STAT1基因序列(登錄號:NM_001012914.2)設計3條干擾序列及1條陰性對照序列(shNC)。將干擾靶點反向互補拼接,在其中插入Loop環(huán)(TTCAAGAGA),然后在上、下游引物的5′-端分別引入BamH Ⅰ和EcoR Ⅰ酶切位點,并在上游引物的3′-端插入AAAAAA,在下游引物的5′-端加入TTTTTT,形成shRNA Oligo,序列見表2。取shRNA Oligo上、下游引物各5 μL進行退火。退火程序:95 ℃ 30 s,72 ℃ 2 min,37 ℃ 2 min,25 ℃ 2 min。退火產(chǎn)物連接到經(jīng)BamH Ⅰ和EcoR Ⅰ酶切的pGLMV-SC5干擾載體上,重組載體分別命名為shSTAT1-1、shSTAT1-2和shSTAT1-3。
表2 轉錄因子STAT1干擾載體引物
續(xù)表
在37 ℃、5% CO2細胞培養(yǎng)箱中用含10%胎牛血清和1×抗真菌/抗菌劑(100 μg/mL青霉素、100 μg/mL鏈霉素)的DMEM高糖培養(yǎng)基培養(yǎng)DF-1細胞。將DF-1細胞以1×105/孔均勻地鋪在24孔板中,24 h后觀察細胞生長狀態(tài),選擇生長狀態(tài)良好且匯合度達70%左右時細胞進行質粒轉染。將目的質粒1 μg、sv40內(nèi)參質粒30 ng、Opti-MEM補足50 μL與3 μL FUGENE、47 μL Opti-MEM混勻至100 μL,37 ℃孵育15 min。在每個孔中輕輕加入100 μL轉染混合液,48 h后觀察熒光表達并拍照。
按照雙熒光素酶試劑盒操作步驟收集1.7中的細胞,去掉培養(yǎng)液,用預冷的1×PBS洗滌細胞。胰酶消化后轉移到1.5 mL離心管,離心棄上清,在每管中加入70 μL稀釋過的裂解液,重懸細胞后,室溫靜置10 min,再轉移到96孔酶標板中;設置好熒光參數(shù)后,分別在每個樣品孔中加入70 μL螢火蟲熒光液,于酶標儀中讀取550 nm下的螢火蟲熒光值;結束后再在板中加入同等體積的STOP液,淬滅螢火蟲熒光,激活海參熒光,于酶標儀中讀取480 nm下的海參熒光值。螢火蟲熒光值/海腎熒光值即為啟動子活性。所有試驗均進行3個獨立重復。
收集分別轉染shSTAT1-1、shSTAT1-2和shSTAT1-3的DF-1細胞,以不轉染組為空白對照,以轉染pGLMV-SC5-Negative組為陰性對照(NC),用Trizol法提取總RNA后反轉錄合成cDNA。PCR反應體系20 μL:2×SuperReal Color PreMix 10 μL,cDNA模板2 μL,上、下游引物(10 μmol/L)各0.6 μL,RNase-free ddH2O 6.8 μL。PCR反應程序:95 ℃預變性10 min;95 ℃變性15 s,65 ℃退火延伸30 s,共40個循環(huán)。
為了探究組蛋白乙?;欠裼绊憀ncRNA-BMP4的轉錄水平,將核心啟動子轉染DF-1細胞后,添加終濃度為1 μmol/L的曲古抑菌素(trichostatin,TSA),與同處理但不加TSA做對比,以轉染pGL3-Basic載體為空白對照。處理48 h后,各組收樣進行雙熒光素酶檢測組蛋白乙?;瘜?lncRNA-BMP4啟動子轉錄活性的影響。
為了探究DNA甲基化是否影響lncRNA-BMP4的轉錄水平,將核心啟動子轉染DF-1細胞后,添加終濃度為10 μmol/L的5′-Azadc(5′-Aza-2′-deoxycytidine),與同處理但不加5′-Azacd做對比,以轉染pGL3-Basic載體為空白對照。處理48 h后,各組收樣進行雙熒光素酶檢測DNA甲基化對lncRNA-BMP4啟動子轉錄活性的影響。
根據(jù)公式2―ΔΔCt計算相對表達量,統(tǒng)計學處理采用單因素方差分析(One-Way ANOVA)檢驗,并利用GraphPad Prism 9.0軟件進行作圖。結果以平均值±標準誤表示,P<0.05表示差異顯著;P<0.01表示差異極顯著。
通過PCR擴增得到1 288 bp的lncRNA-BMP4啟動子片段(圖2),測序結果顯示,plncBMP4-N1重組載體構建成功。將plncBMP4-N1載體轉染DF-1細胞48 h后觀察發(fā)現(xiàn),轉染了重組質粒的細胞表達綠色熒光,但其表達的亮度低于pEGFP-N1載體轉染組(圖3)。表明預測的lncRNA-BMP4啟動子有啟動活性。
M,DL5000 DNA Marker;1~8,lncRNA-BMP4啟動子序列擴增
圖3 plncBMP4-N1重組載體活性驗證(100×)
采用預設計的8對引物,以plncBMP4-N1為模板擴增系列缺失片段,電泳結果分別出現(xiàn)大小約為1 288、1 104、947、850、669、491、328和166 bp的8條帶(圖4),均與預期大小相符,表明啟動子系列缺失片段擴增成功。將系列缺失片段插入pGL3-Basic載體中,構建出8個重組熒光素缺失載體,采用雙熒光素報告基因檢測lncRNA-BMP4各片段啟動子活性的變化,結果顯示,從―1 270 bp逐步截短至―832 bp時啟動子的活性未發(fā)生顯著變化,而從―832 bp截短至―651 bp時啟動子的活性極顯著下降(P<0.01),且在后續(xù)繼續(xù)截短時啟動活性未出現(xiàn)顯著變化(圖5)。初步判斷―832~―651 bp為lncRNA-BMP4啟動子的核心區(qū)域。
M,DL5000 DNA Marker;1~16,P1~P4片段PCR擴增產(chǎn)物;17~32,P5~P8片段PCR擴增產(chǎn)物
*,差異顯著(P<0.05);**,差異極顯著(P<0.01);無*,差異不顯著(P>0.05)。下同
進一步構建只含有活性區(qū)域的pGL3-p4-p5載體和此區(qū)域完全缺失的pGL3-DE-p4-p5載體,雙酶切結果顯示分別切出約191和1 099 bp片段(圖6),將雙酶切成功的載體送測序,結果表明2個載體均構建成功。為驗證該區(qū)域是否為啟動子活性核心區(qū)域,試驗分別將后構建的載體轉入DF-1細胞中,發(fā)現(xiàn)僅含有活性區(qū)域(―832~―651 bp)的pGL3-p4-p5載體啟動活性極顯著高于核心啟動子區(qū)完全缺失的pGL3-DE-p4-p5載體(P<0.01)(圖7)。說明―832~―651 bp為lncRNA-BMP4啟動子的核心區(qū)域。
M,DL5000 DNA Marker;1、4,pGL3-p4-p5和pGL3-DE-p4-p5質粒;2、5,pGL3-p4-p5和pGL3-DE-p4-p5質粒單酶切;3、6,pGL3-p4-p5和pGL3-DE-p4-p5質粒雙酶切
圖7 雙熒光素酶試驗篩選啟動子核心區(qū)域
單酶切結果顯示在約5 000 bp處存在目的條帶,表明pGL3-SOX17 mut、pGL3-CREB1 mut和pGL3-STAT1 mut載體構建成功(圖8)。將3個缺失重組載體和野生型pGL3-p4-p5載體分別轉染DF-1細胞,雙熒光素酶結果顯示,與pGL3-p4-p5載體相比,缺失SOX17或CREB1轉錄因子結合位點均不能顯著影響核心啟動區(qū)域的活性;而缺失了STAT1轉錄因子結合位點的載體則極顯著降低了核心啟動區(qū)域活性(P<0.01)(圖9)。表明STAT1是影響lncRNA-BMP4轉錄活性的關鍵轉錄因子。
圖9 雙熒光素酶驗證轉錄因子SOX17、CREB1及STAT1的作用
本研究成功構建了3個STAT1干擾載體(shSTAT1-1、shSTAT1-2、shSTAT1-3),對其干擾效率進行檢測發(fā)現(xiàn),shSTAT1-1、shSTAT1-2和shSTAT1-3與陰性對照組間差異不明顯(圖10)。實時熒光定量PCR結果表明,與對照組相比,shSTAT1-1、shSTAT1-3極顯著干擾了STAT1的表達(P<0.01),shSTAT1-2顯著干擾了STAT1的表達(P<0.05),且shSTAT1-1干擾作用強于shSTAT1-3(圖11)。因此以shSTAT1-1干擾載體進行后續(xù)驗證試驗。
圖10 STAT1干擾載體活性驗證(100×)
圖11 STAT1干擾載體效率檢測
將shSTAT1-1干擾載體與啟動子核心區(qū)域pGL3-p4-p5載體共轉染,以單轉pGL3-p4-p5為對照,雙熒光素酶檢測結果顯示,與對照組相比,干擾STAT1后lncRNA-BMP4啟動子活性核心區(qū)域的啟動活性極顯著下降(P<0.01)(圖12)。提示轉錄因子STAT1能促進lncRNA-BMP4的轉錄。
圖12 雙熒光素酶驗證轉錄因子的作用
生物信息學預測發(fā)現(xiàn)在lncRNA-BMP4啟動子區(qū)存在高GC含量(圖13)。將核心啟動子轉染DF-1后添加DNA甲基化抑制劑5′-Azacd,與同處理但不加5′-Azacd進行對比,雙熒光素酶檢測結果顯示,添加5′-Azacd不影響lncRNA-BMP4的轉錄活性(P>0.05);將核心啟動子轉染DF-1細胞后,添加組蛋白去乙?;敢种苿㏕SA,與同處理但不加TSA進行對比,雙熒光素酶檢測結果顯示,添加TSA后極顯著提高了lncRNA-BMP4的轉錄活性(P<0.01,圖14)。
圖13 lncRNA-BMP4啟動子區(qū)域CpG島(A)和GC位點(B)預測
圖14 DNA甲基化和組蛋白乙?;瘜ncRNA-BMP4啟動活性的影響
基因表達的時空順序受多種表達調(diào)控機制,轉錄起始是最主要的調(diào)控方式之一,所以深入探究啟動子對基因表達的影響尤為重要。本研究使用擴增的lncRNA-BMP4啟動子替換pEGFP-N1載體的CMV啟動子,進一步采用固定3′-端、逐段縮短5′-端的逐段截短法,構建啟動子的系列缺失雙熒光素酶報告載體,分別鑒定每個片段的啟動活性。通過相鄰2個載體的活性差異,確定了―832~―651 bp是lncRNA-BMP4啟動子的活性核心區(qū)域,并在此基礎上通過Jaspar網(wǎng)站預測了可能發(fā)揮作用的轉錄因子,分別為SOX17、CREB1、STAT1。
轉錄因子是調(diào)控基因表達的重要因素,它可以結合到基因的啟動子區(qū)域,與RNA聚合酶形成復合物,來提高RNA聚合酶的轉錄效率。轉錄因子及與其結合的啟動子中的相關順式作用元件在基因表達方面起著開關作用[14]。轉錄因子既可以正向調(diào)控基因表達也可以抑制基因表達。研究發(fā)現(xiàn),轉錄因子ACSL1和ASCL2可激活家族序列相似性13成員A(family with sequence similarity 13 member A,F(xiàn)AM13A)基因的轉錄[15];轉錄抑制因子VIVIPAROUS1/ABI3-LIKE1(VAL1)和VAL2可抑制多梳抑制復合物2(polycomb repressive complex 2,PRC2)基因的轉錄[16]。轉錄因子是信號通路下游的效應器,通過接受信號通路的信號來啟動基因的表達。研究表明,STAT1可激活lncRNA的表達[17]。本研究發(fā)現(xiàn),轉錄因子STAT1能正向調(diào)控lncRNA-BMP4的表達,而前期研究表明,lncRNA-BMP4能夠正向調(diào)節(jié)PGCs的形成[5],而STAT1也是正向調(diào)控PGCs形成的重要轉錄因子[18]。綜上,STAT1可通過調(diào)控lncRNA-BMP4的表達來調(diào)控PGCs發(fā)育。
DNA甲基化是表觀遺傳修飾中調(diào)控基因表達最多的一個修飾。DNA甲基化是基因組DNA中胞嘧啶的共價修飾,在脊椎動物中主要發(fā)生在CpG二核苷酸,即CpG島上,一般與長期轉錄抑制有關[19]。CpG島位于基因的啟動子區(qū)域,因此又稱5′-CpG島,與其他CpG二核苷酸不同[20]。研究發(fā)現(xiàn),CpG位點甲基化可以促進多巴胺受體D2(dopamine receptor D2,DRD2)基因表達[21];P15基因啟動子區(qū)域5′-CpG島的異常甲基化是基因失活的主要機制[22]。因此,CpG甲基化是影響基因表達的重要因素。本研究發(fā)現(xiàn),在lncRNA-BMP4的啟動子區(qū)域中沒有發(fā)現(xiàn)CpG島,但是在它的啟動子區(qū)發(fā)現(xiàn)很多CG位點;而添加5′-Azacd發(fā)現(xiàn),DNA甲基化水平的改變不影響lncRNA-BMP4的啟動活性。推測CG位點可能不足以引起STAT1轉錄因子與啟動子的結合,從而無法影響lncRNA-BMP4的啟動活性。
組蛋白乙酰化修飾是表觀遺傳學研究的重要組成部分,與基因活化密切相關[23],它能使DNA與組蛋白八聚體的解離,核小體結構松弛,從而使各種轉錄因子和協(xié)同轉錄因子能與DNA結合位點特異性地結合,激活基因的轉錄。在細胞核內(nèi),組蛋白乙?;c組蛋白去乙酰化過程處于動態(tài)平衡,并由組蛋白乙?;D移酶(histone acetyltransferase,HAT)和組蛋白去乙?;?histone deacetylase,HDAC)共同調(diào)控。HAT可將乙酰輔酶A的乙?;D移到組蛋白N-末端特定的賴氨酸殘基上,HDAC可使組蛋白去乙?;?,與帶負電荷的DNA緊密結合,使染色質致密卷曲,基因的轉錄受到抑制[24]。研究發(fā)現(xiàn),H3K27乙?;梢约せ頻ncRNA TINCR[25]、lncRNA CCAT1[26]、lncRNA CRNDE[27]啟動子活性,說明組蛋白乙?;苷{(diào)控lncRNA的表達。本研究結果顯示,組蛋白乙?;_實可以激活lncRNA-BMP4的表達,而轉錄因子STAT1也能促進lncRNA-BMP4的表達。研究發(fā)現(xiàn),STAT1與DNA結合導致組蛋白乙?;?H3ac,H4ac)[28],STAT1也可以通過招募CBP/p300來增加組蛋白乙?;痆29]。表明STAT1的調(diào)節(jié)過程存在組蛋白乙?;瘏⑴c[30],而在lncRNA啟動子區(qū)是何種調(diào)控模式,仍有待于后續(xù)深入研究。
雞lncRNA-BMP4的核心啟動區(qū)域為―832~―651 bp,其中轉錄因子STAT1通過順反式調(diào)控lncRNA-BMP4的啟動活性;DNA甲基化不影響lncRNA-BMP4的轉錄,而組蛋白乙酰化可激活其表達。