張浩東,趙清梅,薛佳祺,于 鯤,崔省委,余永濤
(1.寧夏大學(xué) 農(nóng)學(xué)院,寧夏 銀川 750021;2.北方民族大學(xué) 生物科學(xué)與工程學(xué)院,寧夏 銀川 750021;3.國(guó)家民委發(fā)酵釀造工程生物技術(shù)重點(diǎn)實(shí)驗(yàn)室,寧夏 銀川 750021)
絲狀真菌統(tǒng)稱為霉菌,多為真菌界子囊菌門子囊菌亞門真菌[1],是以腐生或寄生的形式普遍存在于自然環(huán)境中的低等真核生物,廣泛分布在空氣、土壤、水和動(dòng)植物中。絲狀真菌具有來源廣泛、易于工業(yè)化生產(chǎn)、種類豐富以及功能多樣等特點(diǎn),因此被廣泛應(yīng)用于科研和生產(chǎn)[2]。在醫(yī)療衛(wèi)生領(lǐng)域,利用產(chǎn)黃青霉(Penicillium chrysogenum)合成青霉素[3],利用土曲霉(Aspergillus terreus)合成降血脂藥物洛伐他汀等[4]。在食品加工行業(yè),常利用絲狀真菌制作糕點(diǎn)、豆制品等[5]。在農(nóng)業(yè)生產(chǎn)中,條形柄銹菌(Puccinia striiformis)、玉米大斑菌(Setosphaeria turcica)等絲狀真菌會(huì)引起小麥、玉米等農(nóng)作物發(fā)生病害[6-7]。部分植物的內(nèi)生真菌會(huì)對(duì)人體及動(dòng)物產(chǎn)生嚴(yán)重危害[8-9]。綜上所述,絲狀真菌與人和動(dòng)物健康、工農(nóng)業(yè)生產(chǎn)、社會(huì)經(jīng)濟(jì)發(fā)展關(guān)系緊密,絲狀真菌的合理利用具有重要的社會(huì)經(jīng)濟(jì)價(jià)值。
絲狀真菌的轉(zhuǎn)錄調(diào)控是絲狀真菌及其開發(fā)利用研究的熱點(diǎn)。在絲狀真菌的基因轉(zhuǎn)錄調(diào)控中,作為順式作用元件的啟動(dòng)子發(fā)揮著重要作用。啟動(dòng)子參與基因轉(zhuǎn)錄的起始,通過與轉(zhuǎn)錄因子結(jié)合來調(diào)控基因轉(zhuǎn)錄活性。深入了解啟動(dòng)子不僅能夠拓展啟動(dòng)子的應(yīng)用,還有助于絲狀真菌基因表達(dá)調(diào)控機(jī)制及基因轉(zhuǎn)錄相關(guān)網(wǎng)絡(luò)調(diào)控研究[1]。岑由飛等[10]對(duì)Tri5和Ttri2啟動(dòng)子功能進(jìn)行研究,為Paramyrothecium roridum中單端孢霉烯毒素生物合成基因轉(zhuǎn)錄調(diào)控的研究奠定了基礎(chǔ);王小龍等[11]對(duì)畢赤酵母AOX1啟動(dòng)子進(jìn)行研究,初步提出Paox1在葡萄糖、甘油和甲醇的調(diào)控模型,為畢赤酵母AOX1啟動(dòng)子的開發(fā)利用提供了參考。絲狀真菌啟動(dòng)子被廣泛應(yīng)用于基因工程載體構(gòu)建、轉(zhuǎn)基因以及目的基因表達(dá)等方面[12]。本文對(duì)絲狀真菌啟動(dòng)子分類、預(yù)測(cè)、篩選方法及功能研究進(jìn)行綜述,以期為絲狀真菌啟動(dòng)子以及基因表達(dá)調(diào)控研究提供參考。
1.1.1 I類啟動(dòng)子I類啟動(dòng)子,又稱rRNA基因啟動(dòng)子,可結(jié)合RNA聚合酶Ⅰ,參與rRNA前體基因的轉(zhuǎn)錄調(diào)控,其產(chǎn)物會(huì)被加工成成熟的5.8S rRNA、18S rRNA、28S rRNA[13]。Ⅰ類啟動(dòng)子的結(jié)構(gòu)主要包括位于轉(zhuǎn)錄起始位點(diǎn)-45 bp至20 bp的核心啟動(dòng)子元件和位于轉(zhuǎn)錄起始位點(diǎn)-156 bp至-107 bp的上游調(diào)控元件,在轉(zhuǎn)錄調(diào)控中發(fā)揮著重要作用,但該類啟動(dòng)子保守性相對(duì)較差[14]。I類啟動(dòng)子具有種屬差異性和高轉(zhuǎn)錄活性,常被應(yīng)于構(gòu)建病毒表達(dá)載體[15]。
1.1.2 Ⅱ類啟動(dòng)子Ⅱ類啟動(dòng)子結(jié)合RNA聚合酶Ⅱ,主要參與sn RNA和編碼蛋白質(zhì)基因的轉(zhuǎn)錄起始。該類啟動(dòng)子結(jié)構(gòu)較為復(fù)雜,主要由基因近側(cè)啟動(dòng)子和位于轉(zhuǎn)錄起始位點(diǎn)-200 bp內(nèi)的核心啟動(dòng)子組成[16]。核心啟動(dòng)子的結(jié)構(gòu)與功能多種多樣,含有不同的序列基序組成的保守元件,如TFⅡB識(shí)別元件、TATA box、CAAT box、起始子(Inr)、下游啟動(dòng)子元件(DPE)等(表1)[17-21]。Ⅱ類啟動(dòng)子的核心啟動(dòng)子是調(diào)控基因轉(zhuǎn)錄的核心元件,在基因表達(dá)調(diào)控中發(fā)揮著重要作用[18]。
表1 核心啟動(dòng)子元件組成及功能
1.1.3 Ⅲ類啟動(dòng)子Ⅲ類啟動(dòng)子結(jié)合RNA聚合酶Ⅲ,主要參與tRNA、ssRNA、snRNA和某些小分子RNA的轉(zhuǎn)錄調(diào)控[22]。Ⅲ類啟動(dòng)子可分為基因內(nèi)啟動(dòng)子和基因外啟動(dòng)子,基因內(nèi)啟動(dòng)子又分為Ⅰ型內(nèi)部啟動(dòng)子和Ⅱ型內(nèi)部啟動(dòng)子。Ⅰ型內(nèi)部啟動(dòng)子含有分開的box A(序列為RGYNNRRYGG)和box C(序列為CGGTCGANNCC),Ⅰ型內(nèi)部啟動(dòng)子僅存在于5S rRNA的基因中[23]。Ⅱ型內(nèi)部啟動(dòng)子含有分開的box A和box B(序列為GA/TTCRANNC),tRNA啟動(dòng)子為Ⅱ型內(nèi)部啟動(dòng)子?;蛲鈫?dòng)子位于轉(zhuǎn)錄起始位點(diǎn)上游,含有3個(gè)上游元件,分別為TATA box、近次端序列元件(PSE)、八聚體OTC元件,目前僅在snRNA啟動(dòng)子中發(fā)現(xiàn)了基因外啟動(dòng)子[23]。
根據(jù)啟動(dòng)子的轉(zhuǎn)錄活性將其分為強(qiáng)啟動(dòng)子和弱啟動(dòng)子。有研究表明,里氏木霉能高效生產(chǎn)大量的纖維素酶[24],是因?yàn)槠鋯?dòng)子與RNA聚合酶有較強(qiáng)的結(jié)合能力,能促進(jìn)纖維素酶的高效表達(dá)。曲霉中也存在許多強(qiáng)啟動(dòng)子,如磷酸丙糖異構(gòu)酶PtpiA啟動(dòng)子、乙醛脫氫酶PadhA啟動(dòng)子以及淀粉糖化酶PglaA啟動(dòng)子等[25],上述啟動(dòng)子常用于提高目的蛋白的表達(dá)效率。弱啟動(dòng)子轉(zhuǎn)錄起始能力相對(duì)較低,與RNA聚合酶結(jié)合能力較弱[26]。
能使基因持續(xù)表達(dá)的啟動(dòng)子叫做組成型啟動(dòng)子,在基因表達(dá)調(diào)控中該類啟動(dòng)子可使目的產(chǎn)物穩(wěn)定表達(dá),不易受外界環(huán)境因素影響[27]。在絲狀真菌中存在許多組成型啟動(dòng)子,如構(gòu)巢曲霉中的GpdA基因啟動(dòng)子[28]、綠僵菌中PMagpd啟動(dòng)子、木霉屬Pki1啟動(dòng)子等均為組成型啟動(dòng)子[1]。絲狀真菌組成型啟動(dòng)子在基因工程中常用于異源基因的表達(dá)[29]。
能被誘導(dǎo)表達(dá)的啟動(dòng)子叫做誘導(dǎo)型啟動(dòng)子,該類啟動(dòng)子在基因表達(dá)調(diào)控中會(huì)受到外界刺激或誘導(dǎo)因素的影響[27]。當(dāng)特定刺激或誘導(dǎo)因素存在時(shí),誘導(dǎo)型啟動(dòng)子會(huì)使其對(duì)應(yīng)基因的轉(zhuǎn)錄水平發(fā)生顯著變化,這些刺激或誘導(dǎo)因素包括碳源、環(huán)境因素、化學(xué)信號(hào)和其他因素[30]。研究者在絲狀真菌中也挖掘出許多誘導(dǎo)型啟動(dòng)子,如曲霉屬的GlaA啟動(dòng)子、里氏木霉中Cbh1啟動(dòng)子、纖維二糖水解酶Cel7A啟動(dòng)子、橡膠樹白粉病Wy195啟動(dòng)子[31]、構(gòu)巢曲霉中AlcA啟動(dòng)子[1]等。目前,人們利用AlcA啟動(dòng)子已成功表達(dá)了多種異源基因蛋白[29]。
啟動(dòng)子的預(yù)測(cè)主要是利用啟動(dòng)子數(shù)據(jù)庫(kù)對(duì)某段序列進(jìn)行對(duì)比和分析,從而判斷該序列是否存在啟動(dòng)子并分析啟動(dòng)子的各種結(jié)構(gòu)。啟動(dòng)子因組成結(jié)構(gòu)和功能復(fù)雜,需要利用數(shù)據(jù)庫(kù)或軟件對(duì)其進(jìn)行生物學(xué)信息分析。
在研究啟動(dòng)子的結(jié)構(gòu)和功能前,首先要根據(jù)啟動(dòng)子序列信息,利用生物學(xué)信息數(shù)據(jù)庫(kù)或者軟件對(duì)啟動(dòng)子序列、啟動(dòng)子核心區(qū)域、順式作用元件、轉(zhuǎn)錄因子結(jié)合位點(diǎn)、CPG island等進(jìn)行預(yù)測(cè),為進(jìn)一步明確絲狀真菌啟動(dòng)子功能提供參考。啟動(dòng)子結(jié)構(gòu)分析和功能預(yù)測(cè)常用的主要數(shù)據(jù)庫(kù)如下。
EPD數(shù)據(jù)庫(kù)(eukaryotic promoter database)(http://epd.vital-it.ch)由瑞士生物信息研究所建立,其中包含動(dòng)物、植物、真菌、無脊椎動(dòng)物等的RNA聚合酶Ⅱ型啟動(dòng)子的序列注釋資源,還有經(jīng)實(shí)驗(yàn)驗(yàn)證的轉(zhuǎn)錄起始位點(diǎn)。近年,EPD數(shù)據(jù)庫(kù)被合并到了EPDnew數(shù)據(jù)庫(kù)中,涵蓋范圍更廣,真菌數(shù)據(jù)庫(kù)中收集到5 117個(gè)釀酒酵母類啟動(dòng)子和4 802個(gè)粟酒裂殖酵母類啟動(dòng)子,具有更高的精確度和覆蓋率。EPDnew數(shù)據(jù)庫(kù)與信號(hào)搜索分析(SSA)和ChIP-Seq數(shù)據(jù)庫(kù)關(guān)聯(lián),可以作為DNA基序?qū)蚍治?、探索和下載與啟動(dòng)子有關(guān)的功能基因組學(xué)數(shù)據(jù)的工具[32]。該數(shù)據(jù)庫(kù)操作簡(jiǎn)單,輸入相關(guān)基因ID即可搜索到啟動(dòng)子的有關(guān)信息。
TRRD數(shù)據(jù)庫(kù)(transcription regulatory regions database)(http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/)是一個(gè)獨(dú)特的并經(jīng)過實(shí)驗(yàn)驗(yàn)證的轉(zhuǎn)錄調(diào)控區(qū)數(shù)據(jù)庫(kù),收集了真核基因轉(zhuǎn)錄調(diào)控區(qū)的結(jié)構(gòu)和功能組織信息。通過該數(shù)據(jù)庫(kù),可以查詢?nèi)?、?dòng)物、真菌等基因的轉(zhuǎn)錄因子結(jié)合位點(diǎn)、啟動(dòng)子、增強(qiáng)子和沉默子的位置及基因表達(dá)調(diào)控模式等信息。TRRD數(shù)據(jù)庫(kù)主要由TRRDGENES、TRRDLCR、TRRDUNITS、TRRSSITES、TRRDFACTORS、TRRDEXP和TRRDBIB 7個(gè)子數(shù)據(jù)庫(kù)構(gòu)成[33]。該數(shù)據(jù)庫(kù)操作簡(jiǎn)單,不需注冊(cè),用戶可根據(jù)自身需求選擇其中一個(gè)數(shù)據(jù)庫(kù),填寫好相關(guān)信息后即可進(jìn)行瀏覽或搜索。
TRANSFAC數(shù)據(jù)庫(kù)(http://www.gene-regulation.com/pub/databases.html)是真核生物轉(zhuǎn)錄調(diào)控?cái)?shù)據(jù)庫(kù),包括人、酵母菌、植物、鼠等真核生物轉(zhuǎn)錄因子及經(jīng)實(shí)驗(yàn)驗(yàn)證的轉(zhuǎn)錄因子結(jié)合位點(diǎn),由site、factor、cell、matrix、gene等多個(gè)數(shù)據(jù)表構(gòu)成。利用該數(shù)據(jù)庫(kù)能夠預(yù)測(cè)和分析啟動(dòng)子和轉(zhuǎn)錄因子結(jié)合位點(diǎn)。該數(shù)據(jù)庫(kù)分公開版和專業(yè)版,目前專業(yè)版包含48 098個(gè)真核生物轉(zhuǎn)錄因子、68 917個(gè)真核生物轉(zhuǎn)錄因子結(jié)合位點(diǎn)以及453 601個(gè)真核生物啟動(dòng)子等,數(shù)量比公開版更加充足[34-35],但使用專業(yè)版需要支付昂貴的費(fèi)用。由于公開版長(zhǎng)時(shí)間未更新,使用公開版數(shù)據(jù)庫(kù)分析絲狀真菌啟動(dòng)子可能會(huì)造成較大誤差。
JASPAR數(shù)據(jù)庫(kù)(http://jaspar.genereg.net/)包括整理的轉(zhuǎn)錄因子及結(jié)合位點(diǎn),目前已更新到第8版,分為脊椎動(dòng)物、線蟲、昆蟲、植物、真菌5類數(shù)據(jù)庫(kù),包含184個(gè)真菌類轉(zhuǎn)錄因子的位置頻率矩陣[36]。該數(shù)據(jù)庫(kù)公開、免費(fèi)使用,可用于真菌轉(zhuǎn)錄因子及結(jié)合位點(diǎn)的預(yù)測(cè)。
Plant CARE數(shù)據(jù)庫(kù)(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)常用的功能是預(yù)測(cè)植物順式作用元件。輸入目的基因序列,需等待一段時(shí)間才能獲得預(yù)測(cè)結(jié)果。使用該數(shù)據(jù)庫(kù)預(yù)測(cè)絲狀真菌啟動(dòng)子順式作用元件時(shí)可將其結(jié)果作為參考,并聯(lián)合多個(gè)數(shù)據(jù)庫(kù)共同分析。
Promoter 2.0 Prediction Server數(shù)據(jù)庫(kù)(http://www.cbs.dtu.dk/services/Promoter/)可用于預(yù)測(cè)啟動(dòng)子所在的位置以及轉(zhuǎn)錄起始位點(diǎn),預(yù)測(cè)分值越高,預(yù)測(cè)結(jié)果可信度越大。用戶只需提交或者輸入fasta格式的DNA序列,即可獲得預(yù)測(cè)結(jié)果,操作簡(jiǎn)單、快捷。
Laboratory of Molecular Medicine數(shù)據(jù)庫(kù)(https://www.urogene.org/cgi-bin/methprimer/methprimer.cgi)由北京中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)院維護(hù),可以用于啟動(dòng)子CPG island的預(yù)測(cè)及甲基化PCR引物的設(shè)計(jì),操作方法簡(jiǎn)單,輸入目的序列即可獲得結(jié)果。
由于目前專門用于絲狀真菌啟動(dòng)子預(yù)測(cè)的數(shù)據(jù)庫(kù)較少,與啟動(dòng)子有關(guān)的真核生物數(shù)據(jù)庫(kù)收錄的信息數(shù)量還不夠充足,部分?jǐn)?shù)據(jù)庫(kù)存在長(zhǎng)時(shí)間未更新等問題,在對(duì)絲狀真菌啟動(dòng)子進(jìn)行預(yù)測(cè)或者生物信息學(xué)分析時(shí),為減少誤差,可以使用多個(gè)數(shù)據(jù)庫(kù)進(jìn)行聯(lián)合分析,再結(jié)合實(shí)驗(yàn)方法對(duì)啟動(dòng)子進(jìn)一步驗(yàn)證。
啟動(dòng)子是位于基因非編碼區(qū)5’端上游的特定DNA序列,通常在轉(zhuǎn)錄起始位點(diǎn)上游-100 bp至-1 000 bp內(nèi)。為了確定啟動(dòng)子所在位置及其序列,常應(yīng)用啟動(dòng)子捕獲技術(shù)、啟動(dòng)子探針篩選技術(shù)、基因芯片技術(shù)、高通量測(cè)序等來挖掘、篩選啟動(dòng)子[34,37]。
啟動(dòng)子捕獲技術(shù)又稱為啟動(dòng)子陷阱技術(shù)。該技術(shù)不僅用于確定基因啟動(dòng)子區(qū)域以及克隆啟動(dòng)子,還可用于基因功能以及表達(dá)模式的研究。應(yīng)用啟動(dòng)子捕獲技術(shù)時(shí),首先需要構(gòu)建不含啟動(dòng)子但是含有報(bào)告基因和標(biāo)記基因的啟動(dòng)子捕獲載體,然后將捕獲載體正確插入到不同基因序列的外顯子中[38]。若報(bào)告基因能夠表達(dá),則表明該序列中含有啟動(dòng)子序列,以此來確定啟動(dòng)子。該技術(shù)可獲得大量單基因突變體庫(kù),但被捕獲的基因較難分離,插入的DNA序列具有偏向性[39]。鄧晟等[40]構(gòu)建雙向啟動(dòng)子捕獲載體,成功確定了棉花黃萎病菌中6個(gè)基因的啟動(dòng)子。劉小紅等[41]應(yīng)用該技術(shù),成功構(gòu)建了稻瘟病菌突變體庫(kù)。
啟動(dòng)子探針技術(shù)由Rachael等[42]首次提出,他通過該技術(shù)構(gòu)建了啟動(dòng)子探針型質(zhì)粒載體,并獲得了一些真核生物的啟動(dòng)子片段。該技術(shù)利用限制性核酸內(nèi)切酶將DNA序列隨機(jī)切割成大小不等的片段,在DNA連接酶的作用下,將DNA片段與不含啟動(dòng)子的表達(dá)載體連接,然后將其轉(zhuǎn)化給宿主細(xì)胞,并構(gòu)建報(bào)告基因文庫(kù)。通過檢測(cè)報(bào)告基因的表達(dá)活性,篩選出具有轉(zhuǎn)錄起始活性的啟動(dòng)子片段。該方法適用于未知序列基因啟動(dòng)子的篩選,不需設(shè)計(jì)引物,能快速篩選出啟動(dòng)子;但其工作量較大,篩選到的啟動(dòng)子數(shù)量多,特異性相對(duì)較差。李維等[43]利用該技術(shù)成功篩選出黃孢原毛平革菌基因的啟動(dòng)子片段。徐良向等[44]應(yīng)用該技術(shù)快速檢測(cè)到橡膠樹白粉病菌HO-73基因啟動(dòng)子。
基因芯片技術(shù)又稱為DNA微陣列技術(shù),具有全自動(dòng)化、高精確與高精密、高靈敏、高度并行性、多樣性等特點(diǎn)[45]?;蛐酒饕獙⒍喾N特定的寡聚核苷酸或DNA探針固定在芯片的特定位置,將待測(cè)基因用熒光標(biāo)記后與芯片進(jìn)行雜交,通過檢測(cè)雜交信號(hào)來分析樣本基因序列信息及表達(dá)信息。使用聚類分析和主元分析等分析方法處理基因序列信息,根據(jù)基因的啟動(dòng)子組成特性,通過多重序列比對(duì),在基因序列的上游區(qū)域?qū)ふ页鰡?dòng)子[46]。Yuko等[47]根據(jù)裂殖酵母的基因組分析結(jié)果,制備了幾種DNA微陣列,對(duì)裂殖酵母未知基因功能進(jìn)行探索,并且尋找其可能用于異源蛋白表達(dá)的啟動(dòng)子。
在檢測(cè)啟動(dòng)子前,可通過高通量測(cè)序技術(shù)對(duì)絲狀真菌進(jìn)行全基因組重測(cè)序,利用Weka等數(shù)據(jù)挖掘軟件結(jié)合生物學(xué)信息技術(shù)對(duì)高通量測(cè)序數(shù)據(jù)進(jìn)行分析,以篩選出啟動(dòng)子[48]。近年來,研究人員利用高通量測(cè)序技術(shù)開發(fā)出RNA測(cè)序技術(shù)(RNA-seq),此技術(shù)可以檢測(cè)基因在全基因組內(nèi)的表達(dá)情況,具有高通量、高重復(fù)性、檢測(cè)范圍廣泛等特點(diǎn)[49],但價(jià)格昂貴。亓飛等[50]使用RNA-seq技術(shù),在畢赤酵母中發(fā)現(xiàn)了2個(gè)新型強(qiáng)啟動(dòng)子。
通過生物學(xué)信息的預(yù)測(cè)和對(duì)啟動(dòng)子的篩選,能夠了解絲狀真菌啟動(dòng)子的序列信息和結(jié)構(gòu)特點(diǎn),但還需進(jìn)一步研究和驗(yàn)證啟動(dòng)子元件的功能,以便對(duì)啟動(dòng)子進(jìn)行開發(fā)與利用,這需要對(duì)啟動(dòng)子進(jìn)行克隆。
4.1.1 PCR方法對(duì)于已知序列的啟動(dòng)子,可以根據(jù)其序列設(shè)計(jì)特異性引物,利用PCR方法對(duì)啟動(dòng)子進(jìn)行擴(kuò)增與克隆。PCR克隆啟動(dòng)子的方法包括巢式PCR、熱不對(duì)稱PCR、反向PCR等,詳見表2[34,51]。
表2 PCR克隆啟動(dòng)子的方法及其特點(diǎn)
葉偉等[52]利用巢氏PCR技術(shù)獲得深海真菌埃德菌gliG、gliI、gliO基因的啟動(dòng)子片段。胡建坤等[53]采用熱不對(duì)稱PCR技術(shù)得到稻曲病菌的一段含有啟動(dòng)子的序列。王德培等[54]利用長(zhǎng)引物嵌套式反向PCR技術(shù)克隆出隆雅致枝霉Δ6-脂肪酸脫氫酶基因上游1.3 kb序列。Fang等[55]利用YADE法,成功克隆出類球孢白僵菌類枯草桿菌蛋白酶基因CDEP-1的啟動(dòng)子。克隆絲狀真菌啟動(dòng)子的PCR方法多種多樣,研究者可結(jié)合實(shí)際狀況選擇合適的方法。
4.1.2 TA克隆通過PCR方法獲得啟動(dòng)子片段后,可將其克隆到T載體上。TA克隆操作方法,首先將經(jīng)純化的啟動(dòng)子片段與T載體連接,再將其轉(zhuǎn)入至感受態(tài)大腸桿菌中,經(jīng)藍(lán)白斑篩選、PCR及測(cè)序即可驗(yàn)證啟動(dòng)子片段是否成功連接在T載體上[56]。利用此方法可以克隆大量的同種啟動(dòng)子。黎晨等[57]使用熱不對(duì)稱PCR方法獲得了玉米黑粉菌Cyp51基因啟動(dòng)子片段后,成功將其連接在pMD-18-T載體上,為后續(xù)研究分析啟動(dòng)子功能奠定了基礎(chǔ)。
作為真核生物的絲狀真菌,周圍存在大量順式作用元件的啟動(dòng)子,其序列的跨越范圍、結(jié)構(gòu)與功能比原核啟動(dòng)子復(fù)雜。在對(duì)啟動(dòng)子進(jìn)行克隆后,需要通過實(shí)驗(yàn)的方法研究啟動(dòng)子功能,啟動(dòng)子功能的研究包括預(yù)測(cè)及確認(rèn)啟動(dòng)子周圍的順式作用元件、確定啟動(dòng)子片段的轉(zhuǎn)錄起始活性、啟動(dòng)子核心區(qū)域的位置、啟動(dòng)子與轉(zhuǎn)錄因子的相互作用等。目前常用的研究方法有定點(diǎn)突變分析、逐段缺失活性分析、轉(zhuǎn)錄因子-啟動(dòng)子互作分析、啟動(dòng)子甲基化和多態(tài)性分析等。
4.2.1 定點(diǎn)突變分析啟動(dòng)子定點(diǎn)突變是指通過盒式突變、PCR介導(dǎo)等方法使啟動(dòng)子片段發(fā)生單堿基替換或堿基的添加、刪除等。通過該方法可以分析啟動(dòng)子的調(diào)節(jié)位點(diǎn),還能研究啟動(dòng)子功能,確定啟動(dòng)子中的TATA box、CAT box、CAAT box等參與基因轉(zhuǎn)錄調(diào)控的重要的順式作用元件[58]。通過構(gòu)建突變的啟動(dòng)子重組載體,將重組的質(zhì)粒轉(zhuǎn)染至細(xì)胞,分析細(xì)胞中報(bào)告基因的表達(dá)活性,可確定啟動(dòng)子突變前后的轉(zhuǎn)錄起始活性。宮亞娟等[59]對(duì)瑞氏木霉Cbh1啟動(dòng)子進(jìn)行點(diǎn)突變分析,成功構(gòu)建了5個(gè)啟動(dòng)子定點(diǎn)突變載體,分析了Cbh1啟動(dòng)子點(diǎn)突變前后對(duì)其轉(zhuǎn)錄活性的影響。Matsushita等[60]對(duì)米曲霉Hsp30啟動(dòng)子進(jìn)行定點(diǎn)突變,發(fā)現(xiàn)了位于Hsp30啟動(dòng)子-342~-272的熱休克反應(yīng)順式作用元件HSE1和HSE2。
4.2.2 逐段缺失活性分析當(dāng)預(yù)測(cè)啟動(dòng)子序列后,可采用啟動(dòng)子逐段缺失的方法來研究不同啟動(dòng)子片段的轉(zhuǎn)錄起始活性,以此來判定啟動(dòng)子的核心區(qū)域。常用的研究方法有5’端逐段缺失、3’端逐段缺失、中間缺失及點(diǎn)突變等,其中5’端逐段缺失方法應(yīng)用較為普遍。首先構(gòu)建啟動(dòng)子5’端逐段缺失的含有熒光素酶基因(Luc)、β-葡萄糖苷酸酶(GUS)、綠色熒光蛋白基因(GFP)等報(bào)告基因的表達(dá)載體[61]。然后將構(gòu)建好的表達(dá)載體轉(zhuǎn)染至細(xì)胞中,通過分析報(bào)告基因的表達(dá)活性判斷目的基因啟動(dòng)子轉(zhuǎn)錄起始活性最強(qiáng)的區(qū)域。殷金瑤等[62]構(gòu)建了5個(gè)5’端逐段缺失的橡膠樹白粉菌(HO-73)啟動(dòng)子片段載體,確定了不同啟動(dòng)子片段的活性強(qiáng)弱。
4.2.3 轉(zhuǎn)錄因子-啟動(dòng)子互作分析絲狀真菌基因的轉(zhuǎn)錄除了受到啟動(dòng)子的影響外,與啟動(dòng)子專一結(jié)合的轉(zhuǎn)錄因子也參與絲狀真菌基因的轉(zhuǎn)錄調(diào)控,使目的基因以特定的強(qiáng)度在特定的時(shí)間參與空間表達(dá)[63]。研究啟動(dòng)子與轉(zhuǎn)錄因子的相互作用,將有助于了解啟動(dòng)子對(duì)絲狀真菌基因的轉(zhuǎn)錄調(diào)控功能。目前,常見的分析轉(zhuǎn)錄因子與啟動(dòng)子相互作用的方法有酵母單雜交實(shí)驗(yàn)(Y1H)、凝膠阻滯遷移率實(shí)驗(yàn)(EMSA)、DNaseⅠ足跡實(shí)驗(yàn)、染色質(zhì)免疫共沉淀法(CHIP)等。
酵母單雜交可研究蛋白質(zhì)和特定DNA的相互作用,通過構(gòu)建蛋白與轉(zhuǎn)錄激活區(qū)融合表達(dá)的載體,并使其在酵母中表達(dá),根據(jù)報(bào)告基因在酵母細(xì)胞內(nèi)表達(dá)活性的強(qiáng)弱,分析轉(zhuǎn)錄因子與DNA結(jié)合的情況[64]。劉兵等[65]利用酵母單雜交實(shí)驗(yàn)驗(yàn)證了WRKY40和WRKY75轉(zhuǎn)錄因子能與葡萄抗霜病VpPR4b基因啟動(dòng)子結(jié)合。懷寶玉等[66]對(duì)小麥條銹菌Tastp3啟動(dòng)子進(jìn)行酵母單雜交,成功篩選出5個(gè)候選轉(zhuǎn)錄因子。
凝膠阻滯遷移率實(shí)驗(yàn)是研究DNA或RNA與蛋白質(zhì)相互作用的常用技術(shù)。其主要原理是蛋白質(zhì)與探針復(fù)合物結(jié)合后分子質(zhì)量變大,在凝膠電泳過程中遷移率較慢。DNaseⅠ足跡實(shí)驗(yàn)可用于鑒別RNA聚合酶等蛋白質(zhì)在DNA上的結(jié)合位點(diǎn),能找到與DNA特異結(jié)合的目的蛋白,以此來確定轉(zhuǎn)錄因子。其原理是與轉(zhuǎn)錄因子結(jié)合的DNA不會(huì)被DNase破壞,在電泳凝膠的放射性自顯影圖片上,使其沒有放射性標(biāo)記帶。凌敏等[67]通過EMSA技術(shù)確定了康氏木霉纖維素酶轉(zhuǎn)錄因子ACEI和Xyr。呂新星等[68]通過EMSA和酵母單雜交實(shí)驗(yàn)分析出里氏木霉纖維素酶基因轉(zhuǎn)錄因子Xyr1。
染色質(zhì)免疫共沉淀法是在活細(xì)胞內(nèi)固定DNA與蛋白質(zhì)的復(fù)合物,將其隨機(jī)切割成染色質(zhì)小片段,利用免疫學(xué)方法沉淀,特異性地富集與目的蛋白結(jié)合的DNA片段,經(jīng)純化、測(cè)序即可獲得蛋白質(zhì)結(jié)合的DNA序列[64,69]。曹艷麗等[70]通過EMSA、DNaseⅠ足跡實(shí)驗(yàn)鑒定了里氏木霉中的轉(zhuǎn)錄因子Rce1在Cbh1啟動(dòng)子上的結(jié)合位點(diǎn),通過染色質(zhì)免疫共沉淀實(shí)驗(yàn)發(fā)現(xiàn)轉(zhuǎn)錄因子Rce1在纖維素誘導(dǎo)表達(dá)過程中與轉(zhuǎn)錄因子Xyr1相競(jìng)爭(zhēng)結(jié)合纖維素酶基因啟動(dòng)子,進(jìn)而實(shí)現(xiàn)對(duì)纖維素酶表達(dá)的抑制作用。
4.2.4 啟動(dòng)子的甲基化和多態(tài)性分析DNA甲基化最早是由Hotchkiss等[71]發(fā)現(xiàn)的。真核生物主要以5-甲基胞嘧啶(5mC)的形式存在[72]。絲狀真菌啟動(dòng)子DNA甲基化是一種重要的可遺傳的表觀遺傳修飾[73]。啟動(dòng)子DNA甲基化能改變?nèi)旧|(zhì)結(jié)構(gòu)、DNA構(gòu)像的穩(wěn)定性以及DNA與蛋白質(zhì)的互作方式,從而調(diào)控基因表達(dá)[74]。檢測(cè)DNA甲基化的方法主要有限制性內(nèi)切酶法、重亞硫酸鹽法、芯片技術(shù)等[75]。限制性內(nèi)切酶法比較敏感,主要利用部分限制性核酸難以將甲基化DNA序列切開的原理。SmaI-XmaI能識(shí)別并切開序列CCCGGG(SmaI-XmaI識(shí)別序列較少而不常用),HpaⅡ-MspⅠ能識(shí)別CCGG序列進(jìn)行酶切,當(dāng)序列中的胞嘧啶產(chǎn)生甲基化時(shí),CCGG序列便不能被HpaⅡ切開,通過southern、PCR等方法可以確定甲基化狀態(tài)[76-77]。HpaⅡ-MspⅠ可作為分析甲基化的工具,此法操作簡(jiǎn)單、成本低,但有較大缺點(diǎn)。重亞硫酸鹽法將非甲基化的胞嘧啶C轉(zhuǎn)化為尿嘧啶U,經(jīng)PCR反應(yīng)形成TA配對(duì)。重亞硫酸鹽不能將已甲基化的胞嘧啶U改變,DNA中的甲基化信息通過DNA序列的差異表現(xiàn)出來。基因芯片方法是將能識(shí)別甲基化和非甲基化CpG的探針固定在芯片上,經(jīng)過重亞硫酸鹽轉(zhuǎn)化后的DNA片段經(jīng)擴(kuò)增后與探針結(jié)合,從而檢測(cè)甲基化位點(diǎn)[78]。
啟動(dòng)子由于單個(gè)核苷酸的變化會(huì)出現(xiàn)多態(tài)性(SNPs)。啟動(dòng)子序列的變化可能會(huì)引起轉(zhuǎn)錄因子結(jié)合位點(diǎn)發(fā)生改變,從而影響基因表達(dá)。SNP與生物的性狀及某些疾病密切相關(guān),SNP標(biāo)記在遺傳學(xué)研究、致病基因定位、易感基因檢測(cè)、絲狀真菌致病機(jī)制研究中具有重要作用[79]。
在基因的轉(zhuǎn)錄調(diào)控中,啟動(dòng)子作為順式作用元件的重要組成部分,控制著基因表達(dá)時(shí)間、表達(dá)部位、表達(dá)強(qiáng)度及表達(dá)方式[1]。在研究基因功能前,應(yīng)先對(duì)啟動(dòng)子的結(jié)構(gòu)、功能等進(jìn)行研究。近年來對(duì)啟動(dòng)子的研究已經(jīng)形成了一套較為完整的體系。在獲取啟動(dòng)子的序列后,利用各種在線數(shù)據(jù)庫(kù)對(duì)啟動(dòng)子進(jìn)行生物信息分析及預(yù)測(cè),從而了解啟動(dòng)子的轉(zhuǎn)錄起始位點(diǎn)、順式作用元件、核心啟動(dòng)子區(qū)域、轉(zhuǎn)錄因子結(jié)合位點(diǎn)等信息。然而專門用于絲狀真菌啟動(dòng)子研究的數(shù)據(jù)庫(kù)及分析工具還很少,研究者們往往需要借鑒一些真核生物數(shù)據(jù)庫(kù),這往往使得預(yù)測(cè)結(jié)果的準(zhǔn)確性不夠高,需要使用多個(gè)數(shù)據(jù)庫(kù)進(jìn)行聯(lián)合分析,并通過各種實(shí)驗(yàn)方法對(duì)預(yù)測(cè)結(jié)果加以驗(yàn)證。
啟動(dòng)子的篩選可以使人們準(zhǔn)確了解啟動(dòng)子的序列及位置信息,啟動(dòng)子的PCR克隆為研究啟動(dòng)子的功能提供了材料支撐。通過點(diǎn)突變分析、逐段缺失分析、啟動(dòng)子與轉(zhuǎn)錄因子互作分析等各種方法對(duì)啟動(dòng)子功能進(jìn)行研究,從而判斷該啟動(dòng)子轉(zhuǎn)錄活性的強(qiáng)弱,研究啟動(dòng)子轉(zhuǎn)錄活性最強(qiáng)的區(qū)域,某個(gè)順式作用元件對(duì)基因是正向調(diào)節(jié)還是負(fù)向調(diào)節(jié)、某個(gè)轉(zhuǎn)錄因子能否與啟動(dòng)子結(jié)合。這些研究為絲狀真菌啟動(dòng)子的開發(fā)利用提供了參考依據(jù),如利用誘導(dǎo)型強(qiáng)啟動(dòng)子、構(gòu)建雙向啟動(dòng)子或改造啟動(dòng)子構(gòu)建過表達(dá)載體來高效表達(dá)目的產(chǎn)物[25]。近年在絲狀真菌中發(fā)現(xiàn)的U6啟動(dòng)子能有效提高基因編輯效率[80]。隨著基因組學(xué)、計(jì)算機(jī)科學(xué)、分子生物學(xué)的不斷發(fā)展,進(jìn)行絲狀真菌啟動(dòng)子研究的方法會(huì)更加簡(jiǎn)便、快捷,在未來將會(huì)有更多絲狀真菌啟動(dòng)子被挖掘出來,不斷推動(dòng)絲狀真菌啟動(dòng)子的應(yīng)用與發(fā)展。