李圣彥, 郎志宏, 黃大昉
中國(guó)農(nóng)業(yè)科學(xué)院生物技術(shù)研究所,農(nóng)業(yè)部農(nóng)業(yè)基因組學(xué)重點(diǎn)實(shí)驗(yàn)室(北京),北京100081
啟動(dòng)子是指RNA聚合酶識(shí)別、結(jié)合和啟始轉(zhuǎn)錄的一段DNA序列,通常位于基因上游。啟動(dòng)子是調(diào)控基因表達(dá)的“指揮棒”,它能夠控制基因表達(dá)的水平、部位及方式。深入研究啟動(dòng)子功能對(duì)于了解生物的生長(zhǎng)發(fā)育、防御系統(tǒng)、疾病等都有非常重要的意義。本文總結(jié)一些研究啟動(dòng)子的方法及研究進(jìn)展,以期能夠?yàn)閱?dòng)子的研究提供參考。
啟動(dòng)子捕獲技術(shù)是一種克隆啟動(dòng)子的方法。該方法最早應(yīng)用于大腸桿菌[1],后廣泛應(yīng)用于果蠅[2]、小鼠[3]和植物[4]等真核生物中。啟動(dòng)子捕獲載體通常是一個(gè)包含報(bào)告基因的載體,在報(bào)告基因上游插入不同基因序列,如果可以驅(qū)動(dòng)報(bào)告基因表達(dá),則可判斷插入片段具有啟動(dòng)子活性,進(jìn)而從報(bào)告基因上游序列中分離出啟動(dòng)子序列(圖1)[5]。
圖1 啟動(dòng)子捕獲載體示意圖[6]Fig.1 A promoter trap vector diagram[6].
啟動(dòng)子捕獲載體必須要正確的插入到外顯子中才能表達(dá),然而啟動(dòng)子捕獲載體插入到外顯子的頻率非常的低[3,7],比增強(qiáng)子捕獲載體的插入頻率至少低200倍。因此啟動(dòng)子捕獲載體通常含有篩選標(biāo)記基因,如新霉素抗性基因(neo)或β-半乳糖苷酶-NeoR融合報(bào)告基因(圖1),增加篩選的準(zhǔn)確性。啟動(dòng)子捕獲技術(shù)能夠產(chǎn)生大量的突變,從中可以篩選出大量的啟動(dòng)子序列。但是這種插入位點(diǎn)的選擇有一定的偏好性,因此該方法不能夠在全基因組范圍內(nèi)產(chǎn)生近乎飽和的突變。德國(guó)人類基因組計(jì)劃的基因捕獲項(xiàng)目中利用電穿孔和逆轉(zhuǎn)錄病毒兩種侵染方法將四種不同載體轉(zhuǎn)入小鼠胚胎干細(xì)胞中,從獲得的6 000個(gè)序列中捕獲了4 587個(gè)基因[8,9]。他們的結(jié)果表明,利用多重載體和不同侵染方法可以最大限度的減小這種選擇的偏好性。
基因的表達(dá)模式是由啟動(dòng)子控制的,那么了解了基因的表達(dá)模式就可以推測(cè)出其啟動(dòng)子的類型。由于技術(shù)手段的限制,之前多為研究一個(gè)或幾個(gè)基因的表達(dá)模式,而對(duì)于某一條件下所有基因的變化情況無法了解。隨著技術(shù)的發(fā)展,基因芯片(gene chip)和RNA測(cè)序(RNA-seq)技術(shù)使我們進(jìn)行物種內(nèi)某一條件下所有基因的表達(dá)量的研究成為可能。基因芯片,又稱 DNA微陣列(DNA micro-array),是在一個(gè)芯片上固定大量已知序列探針,待測(cè)的靶標(biāo)序列經(jīng)過標(biāo)記與芯片上特定位點(diǎn)的探針雜交,通過檢測(cè)雜交信號(hào),對(duì)生物細(xì)胞或組織中大量的基因信息進(jìn)行分析。其突出特點(diǎn)在于高度并行性、多樣性、微型化和自動(dòng)化[10]。Schena 等[11]首次利用基因芯片技術(shù)檢測(cè)不同擬南芥植株(野生型和轉(zhuǎn)基因)及同一植株不同器官的45個(gè)基因的表達(dá)水平。通過與Northern雜交結(jié)果比對(duì)證明該技術(shù)可以實(shí)現(xiàn)自動(dòng)化、高通量且準(zhǔn)確地檢測(cè)目的基因的表達(dá)水平。RNA-seq的研究對(duì)象為特定細(xì)胞或組織在某一功能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA的總和,主要包括mRNA和非編碼RNA。RNA-seq能夠在全基因組范圍內(nèi)檢測(cè)基因表達(dá)情況,進(jìn)行差異基因篩選分析。該技術(shù)具有通量高、可重復(fù)性高、檢測(cè)范圍寬、定量準(zhǔn)等特點(diǎn),目前已被廣泛應(yīng)用。Lu等[12]利用RNA-seq技術(shù)全面分析秈稻和粳稻的轉(zhuǎn)錄組,鑒定出15 708個(gè)新的轉(zhuǎn)錄活性區(qū)(nTARs),其中51.7%與公開的蛋白數(shù)據(jù)無同源性,>63%推測(cè)為單外顯子轉(zhuǎn)錄本。Zhang等[13]則利用該技術(shù)對(duì)栽培稻的8個(gè)器官的轉(zhuǎn)錄組進(jìn)行了深度測(cè)序,發(fā)現(xiàn)約33%的水稻基因可發(fā)生可變順式剪接,鑒定出234個(gè)推測(cè)的嵌合轉(zhuǎn)錄本。通過RNA-seq獲得的大量新的轉(zhuǎn)錄本,對(duì)于我們發(fā)掘新的水稻啟動(dòng)子提供了很好的數(shù)據(jù)參考。對(duì)于研究基因的表達(dá)量而言基因芯片和RNA-seq這兩種技術(shù)相比各有優(yōu)缺點(diǎn),基因芯片價(jià)格低廉,但是只能檢測(cè)已知序列的信息而不能檢測(cè)未知序列的信息;RNA-seq無需預(yù)先針對(duì)已知序列設(shè)計(jì)探針即可對(duì)任何生物整體轉(zhuǎn)錄活動(dòng)進(jìn)行檢測(cè),得到的數(shù)據(jù)也更加全面,但是價(jià)格比較昂貴。在研究中我們可以將兩種方法結(jié)合起來使用,對(duì)于研究的物種先進(jìn)行RNA-seq,利用RNA-seq得到的基因信息設(shè)計(jì)序列探針,然后利用基因芯片測(cè)定不同組織、不同條件下或不同處理后基因表達(dá)量的變化?,F(xiàn)在許多基因芯片和RNA-seq結(jié)果都已共享,可以在相關(guān)數(shù)據(jù)庫(kù)中下載到,例如GEO(http://www.ncbi.nlm.nih.gov/geo/)和 ArrayExpress(http://www.ebi.ac.uk/arrayexpress/)。通過分析已有的數(shù)據(jù)獲得待選基因的表達(dá)量及表達(dá)模式,可以篩選出高表達(dá)及特異表達(dá)的基因,其相關(guān)的啟動(dòng)子序列即可通過PCR方法克隆獲得。
對(duì)獲得的啟動(dòng)子序列首先利用生物信息學(xué)方法進(jìn)行分析和預(yù)測(cè),這將有利于我們了解啟動(dòng)子序列可能含有的一些功能元件,為下一步功能研究奠定基礎(chǔ)。常用的植物啟動(dòng)子預(yù)測(cè)相關(guān)的數(shù)據(jù)庫(kù)主要有:TRANSFAC、PLACE、PlantCARE、EPD及TRRD數(shù)據(jù)庫(kù)等(表1)。
分析和預(yù)測(cè)植物啟動(dòng)子元件最常用的兩個(gè)數(shù)據(jù)庫(kù)是 PLACE和 PlantCARE。Hong等[19]及 Xu等[20]利用 PLACE數(shù)據(jù)庫(kù)分別分析了擬南芥TPS11和TPS21基因以及棉花CAD1基因的啟動(dòng)子序列,發(fā)現(xiàn)擬南芥TPS11和TPS21基因的啟動(dòng)子序列中含有bHLH蛋白MYC2結(jié)合的E-box元件,通過實(shí)驗(yàn)證明MYC2能夠直接與 TPS11和TPS21基因的啟動(dòng)子結(jié)合驅(qū)動(dòng)這兩個(gè)基因的表達(dá),而在myc2突變體中,這兩個(gè)基因的表達(dá)水平與野生型相比明顯降低;分析棉花CAD1基因的啟動(dòng)子序列,發(fā)現(xiàn)其含有與 WRKY蛋白結(jié)合的G-box元件,在實(shí)驗(yàn)中從棉花中克隆10個(gè)WRKY基因,比較這10個(gè)基因在棉花品種 G.hirsutum L.cv Zhong-12(含棉酚)和 G.hirsutum L.cv GL-5(無棉酚)的表達(dá)情況,發(fā)現(xiàn)只有GaWRKY1在G.hirsutum L.cv Zhong-12中表達(dá)水平很高,其他9個(gè)基因沒有明顯差異或表達(dá)水平很低檢測(cè)不到,推測(cè)GaWRKY1轉(zhuǎn)錄因子調(diào)控CAD1基因的表達(dá)。酵母單雜交試驗(yàn)則證明了GaWRKY1與CAD1基因啟動(dòng)子的G-box元件結(jié)合。在轉(zhuǎn)基因擬南芥中過表達(dá)GaWRKY1基因也能夠激活CAD1基因啟動(dòng)子連接的報(bào)告基因的表達(dá),再次證明GaWRKY1轉(zhuǎn)錄因子能夠調(diào)控CAD1基因的表達(dá)。上述研究均通過生物信息學(xué)分析獲取基因啟動(dòng)子的重要功能元件信息,然后通過實(shí)驗(yàn)進(jìn)行驗(yàn)證,發(fā)現(xiàn)了相應(yīng)的轉(zhuǎn)錄因子等調(diào)控元件,對(duì)基因功能及調(diào)控的研究非常有益。
表1 植物啟動(dòng)子預(yù)測(cè)相關(guān)數(shù)據(jù)庫(kù)Table 1 Database of plant promoter prediction.
利用生物信息學(xué)預(yù)測(cè)和分析啟動(dòng)子序列后,需要進(jìn)行啟動(dòng)子缺失突變轉(zhuǎn)化分析,目的是縮小啟動(dòng)子功能序列的范圍。缺失突變主要有5'缺失、3'缺失、中間缺失及點(diǎn)突變,而常用的方法是構(gòu)建一系列5'缺失的啟動(dòng)子片段連接報(bào)告基因的植物表達(dá)載體以確定啟動(dòng)子的功能序列的位置。目前所選擇使用的報(bào)告基因主要有:β-葡萄糖苷酸酶基因(β-glucuronidase,GUS)、綠色熒光蛋白基因(green fluorescent protein,GFP)、氯霉素乙酰轉(zhuǎn)移酶基因(chloramphenicol acetyl transferase,CAT)、熒光素酶基因(luciferase,Luc)和花青素基因(anthocyanin)等[21~23]。其中,GUS 和 GFP 報(bào)告基因因其操作方便、易于檢測(cè)和定性而被廣泛使用。Pan等[24]克隆了毛白楊4CL2基因的啟動(dòng)子,構(gòu)建5'缺失啟動(dòng)子融合GUS報(bào)告基因表達(dá)載體轉(zhuǎn)化煙草進(jìn)行組織化學(xué)檢測(cè),發(fā)現(xiàn)當(dāng)Pto4CL2啟動(dòng)子-317~-292 nt區(qū)域缺失后GUS基因不能在表皮和花瓣表達(dá),而-266~-252 nt區(qū)域缺失導(dǎo)致組織特異性的喪失并且GUS活性也極大的降低。張文香等[25]從棉花中克隆了GhMADS29基因的啟動(dòng)子序列(1 316 bp)連接GUS報(bào)告基因構(gòu)建植物表達(dá)載體轉(zhuǎn)化擬南芥,組織化學(xué)染色分析發(fā)現(xiàn)其在14 d幼苗的根和葉中都有表達(dá),在萼片、花瓣、雌蕊、果瓣中也表達(dá),而在雄蕊和種子中不表達(dá)。推測(cè)GhMADS29可能與各種開花途徑有關(guān),與萼片、花瓣、雌蕊等花器官的發(fā)育有關(guān),還可能與果實(shí)是否開裂有關(guān)。Brown等人[26]克隆了擬南芥PDF1.2基因的啟動(dòng)子序列(1 183 bp),構(gòu)建了5'缺失啟動(dòng)子融合GUS報(bào)告基因的表達(dá)載體轉(zhuǎn)化擬南芥,通過GUS活性檢測(cè)發(fā)現(xiàn)缺失-261至-255的GCC box后轉(zhuǎn)基因株系對(duì)茉莉酸的反應(yīng)降低,這表明GCC box在PDF1.2啟動(dòng)子應(yīng)對(duì)茉莉酸反應(yīng)的過程中起著非常重要的作用。
轉(zhuǎn)化材料的選擇在啟動(dòng)子轉(zhuǎn)化分析中非常重要。目前轉(zhuǎn)化材料大多選用模式植物,如擬南芥和煙草。異源啟動(dòng)子在模式植物中分析的優(yōu)點(diǎn)主要有:轉(zhuǎn)化方法比較成熟,轉(zhuǎn)化率較高;研究背景清晰,易于后續(xù)試驗(yàn)分析;生長(zhǎng)周期較短等。缺點(diǎn)主要為由于種間差別,異源啟動(dòng)子在模式植物中表達(dá)模式并不能完全的模擬真實(shí)物種中的表達(dá)情況,并且對(duì)于一些物種特異的啟動(dòng)子可能在模式植物中并不表達(dá)或者表達(dá)模式迥異。
與原核生物啟動(dòng)子相比,真核生物啟動(dòng)子要更為復(fù)雜,DNA的轉(zhuǎn)錄除了需要RNA聚合酶的作用外,還需要多種輔助因子。RNA聚合酶起始轉(zhuǎn)錄需要的輔助因子(蛋白質(zhì))稱為轉(zhuǎn)錄因子(transcription factor,TF),它能夠識(shí)別并結(jié)合DNA的順式作用位點(diǎn),從而調(diào)控目的基因以特定的強(qiáng)度并在特定的時(shí)間與空間表達(dá)。因此研究轉(zhuǎn)錄因子-啟動(dòng)子之間的相互作用關(guān)系,對(duì)于了解啟動(dòng)子的功能具有重要意義。傳統(tǒng)研究蛋白質(zhì)-DNA互作分析的方法主要有電泳遷移率變動(dòng)分析(electrophoretic mobility shift assay,EMSA)、DNase I足跡法(DNase I footprinting)和甲基化干擾實(shí)驗(yàn)(Methylation interference assay)等,現(xiàn)在這些方法也在該領(lǐng)域中發(fā)揮著重要的作用。目前,應(yīng)用較廣的方法有酵母單雜交(yeast one-hybrid)實(shí)驗(yàn)及染色質(zhì)免疫共沉淀法(chromatin immunoprecipitation,ChIP)。這兩種方法出發(fā)點(diǎn)不同,酵母單雜交實(shí)驗(yàn)是利用已知的DNA序列篩選與該序列結(jié)合的蛋白質(zhì),而ChIP是利用已知蛋白分析該蛋白結(jié)合的DNA序列。
3.2.1 酵母單雜交 該技術(shù)可用來分析DNA與細(xì)胞內(nèi)蛋白質(zhì)相互作用,通過構(gòu)建蛋白與轉(zhuǎn)錄激活區(qū)的融合表達(dá)載體,對(duì)酵母細(xì)胞內(nèi)報(bào)告基因表達(dá)情況進(jìn)行分析來篩選與DNA有特異結(jié)合的蛋白,該蛋白即對(duì)應(yīng)一個(gè)基因文庫(kù)中的編碼核苷酸序列,因此廣泛用于獲得難于分離純化的特定轉(zhuǎn)錄因子的蛋白質(zhì)序列[27]。Spyropoulou 等[28]利用酵母單雜交技術(shù)以番茄SlTPS5基因啟動(dòng)子207 bp序列為靶標(biāo),從番茄cDNA文庫(kù)中篩選出轉(zhuǎn)錄因子SlEOT1,該轉(zhuǎn)錄因子是一個(gè)類鋅指蛋白,在番茄腺毛處表達(dá),能夠特異地轉(zhuǎn)錄激活SlTPS5基因。
但是該技術(shù)也存在一些缺陷。由于酵母自身蛋白可能與靶標(biāo)DNA序列結(jié)合,或所用報(bào)告基因His或LacZ存在自泄露表達(dá),在實(shí)際操作中常常出現(xiàn)漏檢和假陽性現(xiàn)象。如果表達(dá)的融合蛋白對(duì)酵母有毒性、不能穩(wěn)定存在或錯(cuò)誤折疊等則會(huì)造成蛋白質(zhì)不能與靶序列結(jié)合而產(chǎn)生假陰性現(xiàn)象。此外,酵母單雜交使用的cDNA文庫(kù)是含有所有編碼基因的文庫(kù),而編碼轉(zhuǎn)錄因子的基因只占到很小的一部分,這也大大降低了酵母單雜交篩選的成功率。
為了提高酵母單雜交的成功率,科學(xué)家們研究出擬南芥的高效(或增強(qiáng)型)酵母單雜交系統(tǒng)[29~31]。該系統(tǒng)將擬南芥已知的轉(zhuǎn)錄因子克隆出來構(gòu)建TF文庫(kù)轉(zhuǎn)入酵母Mata型菌株,誘餌載體轉(zhuǎn)入酵母Matα型菌株,利用兩種酵母交配型(Mata,Matα)能夠接合實(shí)現(xiàn)酵母單雜交。該方法極大地提高了酵母單雜交的成功率,降低假陽性。但目前只見于擬南芥TF文庫(kù),其他植物物種的TF文庫(kù)還未見報(bào)道。
3.2.2 染色質(zhì)免疫共沉淀法 該方法簡(jiǎn)單而言就是利用甲醛等化學(xué)方法固定蛋白質(zhì)-染色質(zhì)復(fù)合體,然后通過超聲波將染色質(zhì)切割成大小適當(dāng)?shù)钠危ㄟ^特異抗體將目的蛋白-DNA片段的復(fù)合體免疫沉淀,獲得的DNA片段可以克隆到適當(dāng)?shù)妮d體上經(jīng)過測(cè)序即可得知目的蛋白結(jié)合的DNA 序列[32]。李玲等[33]利用 ChIP 證明轉(zhuǎn)錄因子RIN與LeACS2和LeACS4啟動(dòng)子區(qū)域的CArG-box序列結(jié)合。
隨著測(cè)序技術(shù)和基因芯片的發(fā)展,在ChIP基礎(chǔ)上發(fā)展出 ChIP-chip 和 ChIP-seq 技術(shù)[34~36]。但是由于DNA濃度及DNA片段的不均一性導(dǎo)致出現(xiàn)假陽性、漏檢和mapping時(shí)位點(diǎn)不精確,為了提高精確度并降低 ChIP-chip的假陽性,Rhee等[37]又發(fā)展出ChIP-exo技術(shù)。該技術(shù)的主要原理為:蛋白質(zhì)和DNA的復(fù)合物經(jīng)過λ核酸外切酶(5'→3')處理后,裸露的DNA片段的5'序列會(huì)被降解至蛋白質(zhì)結(jié)合位點(diǎn)處,3'序列保留做mapping,經(jīng)過深度測(cè)序后與參考基因組比對(duì),就能夠得到蛋白結(jié)合DNA的準(zhǔn)確位點(diǎn),該方法能夠精確到1個(gè)堿基。ChIP法檢測(cè)靈敏,可直接顯現(xiàn)DNA與蛋白質(zhì)之間的體內(nèi)動(dòng)態(tài)結(jié)合,但難以同時(shí)得到多個(gè)轉(zhuǎn)錄因子對(duì)同一序列結(jié)合的信息。另外,如果研究的轉(zhuǎn)錄因子是間接的與啟動(dòng)子結(jié)合,也無法通過ChIP得到相關(guān)信息。
除了轉(zhuǎn)錄因子結(jié)合到啟動(dòng)子上參與基因的表達(dá)調(diào)控外,啟動(dòng)子的甲基化(promoter methylation)和多態(tài)性(promoter polymorphism)都會(huì)影響基因的表達(dá),因此對(duì)啟動(dòng)子甲基化和多態(tài)性的研究也非常廣泛。
DNA甲基化是最早發(fā)現(xiàn)的表觀遺傳學(xué)修飾途徑之一。DNA甲基化在真核生物和原核生物中均有發(fā)現(xiàn),其對(duì)基因的表達(dá)具有非常重要的調(diào)控作用[38]。真核生物中DNA甲基化主要以5-甲基胞嘧啶的形式存在[39]。DNA甲基化通過改變?nèi)旧|(zhì)結(jié)構(gòu)、DNA構(gòu)象、DNA穩(wěn)定性或者蛋白質(zhì)與 DNA 相互作用方式[40,41],從而激活或抑制相關(guān)基因的表達(dá)。Zhang等[42]對(duì)擬南芥全基因組范圍的DNA甲基化進(jìn)行了檢測(cè),結(jié)果發(fā)現(xiàn)DNA甲基化主要存在于染色體的異染色質(zhì)區(qū)域,如著絲粒;而在擬南芥已注釋的30 334個(gè)基因中DNA甲基化更多的存在于假基因和非表達(dá)基因中,而不是在表達(dá)基因中。啟動(dòng)子甲基化調(diào)節(jié)基因表達(dá)的機(jī)制可能為啟動(dòng)子的甲基化區(qū)域能夠與甲基化DNA結(jié)合蛋白相互結(jié)合,通過改變?nèi)旧|(zhì)的構(gòu)象或者占據(jù)轉(zhuǎn)錄因子的結(jié)合位點(diǎn)從而阻斷了轉(zhuǎn)錄因子與順式元件的結(jié)合而導(dǎo)致轉(zhuǎn)錄的抑制[43]。
啟動(dòng)子多態(tài)性主要是指在基因組水平上由于單個(gè)核苷酸的變異所引起的啟動(dòng)子序列多態(tài)性。啟動(dòng)子多態(tài)性調(diào)控基因表達(dá)的原理可能為單個(gè)核苷酸的變異引起轉(zhuǎn)錄因子的結(jié)合位點(diǎn)的改變,從而影響基因的表達(dá)及表達(dá)方式。研究發(fā)現(xiàn),人類的很多疾病都跟啟動(dòng)子的多態(tài)性有關(guān)系。Liu等[44]研究發(fā)現(xiàn)血管內(nèi)皮細(xì)胞啟動(dòng)子-2578 C/A的多態(tài)性和-1154 G/A的多態(tài)性對(duì)于是否患有老年癡呆癥有負(fù)相關(guān)效應(yīng)。許多凋亡基因的啟動(dòng)子單核苷酸多態(tài)性(SNPs)會(huì)破壞細(xì)胞的程序性死亡過程,從而導(dǎo)致癌癥的發(fā)生。FAS是一個(gè)轉(zhuǎn)膜受體,屬于腫瘤壞死因子(tumor necrosis factor,TNF)受體亞家族的一員,許多類型的細(xì)胞的凋亡信號(hào)傳輸都需要FAS的介導(dǎo)。Zhou等[45]研究發(fā)現(xiàn)FAS-1377G/A SNP能夠改變FAS基因啟動(dòng)子的轉(zhuǎn)錄活性,在啟動(dòng)子-1377 G到A的轉(zhuǎn)換破壞了刺激蛋白1(stimulatory protein 1,SP1)和信號(hào)轉(zhuǎn)換激活轉(zhuǎn)錄蛋白1(signal transducer and activator of transcription 1,STAT1)的結(jié)合位點(diǎn),衰弱啟動(dòng)子的活性進(jìn)而降低FAS的表達(dá),因此G能夠保護(hù)細(xì)胞免受癌變而A可能是導(dǎo)致癌癥的一個(gè)危險(xiǎn)因子。
除了從自然界中發(fā)掘新的啟動(dòng)子外,還可以進(jìn)行人工合成啟動(dòng)子。合成的啟動(dòng)子由核心啟動(dòng)子序列,主要的內(nèi)含子,近端和遠(yuǎn)端的啟動(dòng)子序列組成,這些序列中可能含有特定的調(diào)節(jié)元件。合成的啟動(dòng)子與自然存在的啟動(dòng)子有非常大的不同,因?yàn)楹铣傻膯?dòng)子可以提供自然存在的啟動(dòng)子所沒有的表達(dá)模式[46]。這種方法已經(jīng)被成功的用于鑒定影響基因表達(dá)的調(diào)節(jié)元件和序列,并且由于合成的啟動(dòng)子所含元件都是根據(jù)需要安排進(jìn)去的,所以合成的啟動(dòng)子能夠做到非常準(zhǔn)確的表達(dá)[47]。例如,DR5植物生長(zhǎng)素啟動(dòng)子是一個(gè)高效的合成啟動(dòng)子,它含有串聯(lián)的植物生長(zhǎng)素響應(yīng)元件TGTCTC,在植物中該啟動(dòng)子被用于研究植物生長(zhǎng)素的響應(yīng)機(jī)制[48]。
啟動(dòng)子作為基因表達(dá)的重要調(diào)控元件,它的調(diào)控方式是多個(gè)層次多個(gè)因素共同作用的結(jié)果。近年來國(guó)內(nèi)外對(duì)啟動(dòng)子的功能做了許多研究,也取得了很多進(jìn)展。但由于現(xiàn)有的試驗(yàn)方法的局限性及啟動(dòng)子元件的復(fù)雜性,我們還不能完全了解啟動(dòng)子的功能。隨著基因組學(xué)研究的不斷深入和分子生物學(xué)研究方法的不斷進(jìn)步,會(huì)有更多更好的研究方法出現(xiàn)以解決目前啟動(dòng)子研究中存在的問題,推動(dòng)啟動(dòng)子研究的發(fā)展。
[1]Casadaban M J,Cohen S N.Lactose genes fused to exogenous promoters in one step using a Mu-lac bacteriophage:in vivo probe for transcriptional control sequences[J].Proc.Natl.Acad.Sci.USA,1979,76(9):4530-4533.
[2]O'Kane C J,Gehring W J.Detection in situ of genomic regulatory elements in Drosophila [J].Proc.Natl.Acad.Sci.USA,1987,84(24):9123-9127.
[3]Friedrich G,Soriano P.Promoter traps in embryonic stem cells:a genetic screen to identify and mutate developmental genes in mice[J].Genes Dev.,1991,5(9):1513-1523.
[4]Chen S Y,Wang A M,Li W,et al..Establishing a gene trap system mediated by T-DNA(GUS)in rice.[J].J.Integr.Plant Biol.,2008,50(6):742-751.
[5]聶麗娜,夏蘭琴,徐兆師,等.植物基因啟動(dòng)子的克隆及其功能研究進(jìn)展[J].植物遺傳資源學(xué)報(bào),2008,9(3):385-391.
[6]Stanford W L,Cohn J B,Cordes S P.Gene-trap mutagenesis:past,present and beyond [J].Nat.Rev.Genet.,2001,2(10):756-768.
[7]Von Melchner H,DeGregori J,Rayburn H,et al..Selective disruption of genes expressed in totipotent embryonal stem cells[J].Genes Dev.,1992,6(6):919-927.
[8]de Angelis M H,F(xiàn)laswinkel H,F(xiàn)uchs H,et al..Genomewide,large-scale production ofmutantmice by ENU mutagenesis[J].Nat.Genet.,2000,25(4):444-447.
[9]Wiles M V,Vauti F,Otte J,et al..Establishment of a genetrap sequencetaglibrarytogeneratemutantmicefrom embryonic stem cells[J].Nat.Genet.,2000,24(1):13-14.
[10]滕曉坤,肖華勝.基因芯片與高通量DNA測(cè)序技術(shù)前景分析[J].中國(guó)科學(xué) (C輯:生命科學(xué)),2008,38(10):891-899.
[11]Schena M,Shalon D,Davis R W,et al..Quantitative monitoring of gene expression patterns with a complementary DNA microarray[J].Science,1995,270(5235):467-470.
[12]Lu T,Lu G,F(xiàn)an D,et al..Function annotation of the rice transcriptome at single-nucleotide resolution by RNA-seq [J].Genome Res.,2010,20(9):1238-1249.
[13]Zhang G,Guo G,Hu X,et al..Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome[J].Genome Res.,2010,20(5):646-654.
[14]Matys V,F(xiàn)ricke E,Geffers R,et al..TRANSFAC:transcriptional regulation,from patterns to profiles[J].Nucleic Acids Res.,2003,31(1):374-378.
[15]Higo K,Ugawa Y,Iwamoto M,et al..Plant cis-acting regulatory DNA elements(PLACE)database:1999[J].Nucleic Acids Res.,1999,27(1):297-300.
[16]Lescot M,Déhais P,Thijs G,et al..PlantCARE,a database of plant cis-acting regulatory elements and a portal to tools for in silico analysis of promoter sequences[J].Nucleic Acids Res.,2002,30(1):325-327.
[17]Périer R C,Junier T,Bucher P.The eukaryotic promoter database EPD [J].Nucleic Acids Res.,1998,26(1):353-357.
[18]Kolchanov N A,Ananko E A,Podkolodnaya O A,et al..Transcription regulatory regions database(TRRD):its status in 1999 [J].Nucleic Acids Res.,1999,27(1):303-306.
[19]Hong G J,Xue X Y,Mao Y B,et al..Arabidopsis MYC2 interacts with DELLA proteinsin regulating sesquiterpene synthase gene expression[J].Plant Cell,2012,24(6):2635-2648.
[20]Xu Y H,Wang J W,Wang S,et al..Characterization of GaWRKY1,a cotton transcription factor that regulates the sesquiterpene synthase gene(+)-δ-cadinene synthase-A [J].Plant Physiol.,2004,135(1):507-515.
[21]李 強(qiáng).植物基因工程中常用的報(bào)告基因[J].生物學(xué)雜志,1995,(1):12-13.
[22]包滿珠.植物花青素基因的克隆及應(yīng)用[J].園藝學(xué)報(bào),1997,24(3):279-284.
[23]薛麗香,童坦君,張宗玉.報(bào)告基因的選擇及其研究趨勢(shì)[J].生理科學(xué)進(jìn)展,2002,33(4):364-366.
[24]Pan X,Li H,Wei H,et al..Analysis of the spatial and temporal expression pattern directed by the Populus tomentosa 4-coumarate:CoA ligase Pto4CL2 promoter in transgenic tobacco[J].Mol.Biol.Rep.,2013,40(3):2309-2317.
[25]張文香,范術(shù)麗,宋美珍,等.棉花 GhMADS29啟動(dòng)子克隆及表達(dá)分析[J].棉花學(xué)報(bào),2013,25(4):309-315.
[26]Brown R L,Kazan K,McGrath K C,et al..A role for the GCC-box in jasmonate-mediated activation of the PDF1.2 gene of Arabidopsis [J].Plant Physiol.,2003,132(2):1020-1032.
[27]馬洪波,杜 堅(jiān).酵母雙雜交系統(tǒng)的研究進(jìn)展與應(yīng)用[J].中國(guó)國(guó)境衛(wèi)生檢疫雜志,2004,27(2):119-123.
[28]Spyropoulou E A,Haring M A,Schuurink R C.Expression of Terpenoids 1,a glandular trichome-specific transcription factor from tomato that activates the terpene synthase 5 promoter[J].Plant Mol.Biol.,2014,84(3):345-57.
[29]Mitsuda N,Ikeda M,Takada S,et al..Efficient yeast one-/two-hybrid screening using a library composed only of transcription factors in Arabidopsis thaliana [J].Plant Cell Physiol.,2010,51(12):2145-2151.
[30]Ou B,Yin K Q,Liu S N,et al..A high-throughput screening system for Arabidopsis transcription factors and its application to Med25-dependent transcriptional regulation [J].Mol.Plant,2011,4(3):546-555.
[31]Gaudinier A,Zhang L,Reece-Hoyes J S,et al..Enhanced Y1H assays for Arabidopsis [J].Nat.Methods,2011,8(12):1053-1055.
[32]Wells J,F(xiàn)arnham P J.Characterizing transcription factor bind-ing sites using formaldehyde crosslinking and immunoprecipitation[J].Methods,2002,26(1):48-56.
[33]李玲,傅達(dá)奇,朱毅,等.利用染色質(zhì)免疫共沉淀技術(shù)確定轉(zhuǎn)錄因子 RIN調(diào)控的靶基因[J].生物技術(shù)通報(bào),2011,(12):166-170.
[34]Ren B,Robert F,Wyrick J J,et al..Genome-wide location and function of DNA binding proteins[J].Science,2000,290(5500):2306-2309.
[35]Albert I,Mavrich T N,Tomsho L P,et al..Translational and rotational settings of H2A.Z nucleosomes across the Saccharomyces cerevisiae genome[J].Nature,2007,446(7135):572-576.
[36]Johnson D S,Mortazavi A,Myers R M,et al..Genome-wide mapping of in vivo protein-DNA interactions[J].Science,2007,316(5830):1497-1502.
[37]Rhee H S,Pugh B F.Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution [J].Cell,2011,147(6):1408-1419.
[38]Klose R J,Bird A P.Genomic DNA methylation:the mark and its mediators[J].Trends Biochem.Sci.,2006,31(2):89-97.
[39]Cao X,Jacobsen S E.Locus-specific control of asymmetric and CpNpG methylation by the DRM andcmT3 methyltransferase genes[J].Proc.Natl.Acad.Sci.USA,2002,99:16491-16498.
[40]Razin A.CpG methylation,chromatin structure and gene silencing—a three‐ way connection [J].EMBO J.,1998,17(17):4905-4908.
[41]Arnaud P,Goubely C,Pélissier T,et al..SINE retroposons can be used in vivo as nucleation centers for de novo methylation[J].Mol.Cell Biol.,2000,20(10):3434-3441.
[42]Zhang X,Yazaki J,Sundaresan A,et al..Genome-wide highresolution mapping and functional analysis of DNA methylation in Arabidopsis[J].Cell,2006,126(6):1189-1201.
[43]Curradi M, Izzo A, Badaracco G, et al.. Molecular mechanisms of gene silencing mediated by DNA methylation[J].Mol.Cell Biol.,2002,22(9):3157-3173.
[44]Liu S Y,Zeng F F,Chen Z W,et al..Vascular endothelial growth factor gene promoter polymorphisms and Alzheimer's disease risk:a meta-analysis[J].CNS Neurosci.Ther.,2013,19(7):469-476.
[45]Zhou Z X,Mi Y Y, Ma H Z, et al.. FAS-1377 G/A(rs2234767)polymorphism and cancer susceptibility:a metaanalysis of 17,858 cases and 24,311 controls[J].PloS ONE,2013,8(8):e73700.
[46]Hernandez-Garcia C M,F(xiàn)iner J J.Identification and validation of promoters and cis-acting regulatory elements[J].Plant Sci.,2014,(217-218):109-119.
[47]Rushton P J,Reinst?dler A,Lipka V,et al..Synthetic plant promoters containing defined regulatory elements provide novel insights into pathogen-and wound-induced signaling[J].Plant Cell,2002,14(4):749-762.
[48]Ulmasov T,Murfett J,Hagen G,et al..Aux/IAA proteins repress expression of reporter genes containing natural and highly active synthetic auxin response elements [J].Plant Cell,1997,9(11):1963-1971.