周正 李卿 陳萬(wàn)生 張磊
(1. 海軍特色醫(yī)學(xué)中心,上海 200433;2. 海軍軍醫(yī)大學(xué)附屬長(zhǎng)征醫(yī)院藥學(xué)部,上海 200003;3. 海軍軍醫(yī)大學(xué)藥學(xué)院,上海 200433)
天然產(chǎn)物根據(jù)其生源途徑,分為初生代謝產(chǎn)物和次生代謝產(chǎn)物。初生代謝產(chǎn)物大多由生物大分子(多糖、核酸、脂類和蛋白質(zhì))的合成和降解形成,對(duì)維持植物基本的生命活動(dòng)具有不可替代的作用,貫穿生命的全程;次生代謝產(chǎn)物則是生物體特有的代謝途徑中所產(chǎn)生的各種特殊分子類型,其骨架往往比初生代謝產(chǎn)物更為復(fù)雜,往往發(fā)生在生命過(guò)程的某一階段。
控制天然產(chǎn)物生物合成的基因決定了不同種類天然產(chǎn)物的產(chǎn)生與累積,即基因的多樣性導(dǎo)致天然產(chǎn)物結(jié)構(gòu)多樣性。目前,藥用植物天然產(chǎn)物的研究中最前沿的科學(xué)問(wèn)題是:各種復(fù)雜的天然產(chǎn)物是如何形成的?能否通過(guò)調(diào)控,大量獲得提取困難、結(jié)構(gòu)復(fù)雜、應(yīng)用需求廣泛的天然產(chǎn)物。為了解決這些問(wèn)題,需要解析天然產(chǎn)物生物合成途徑中關(guān)鍵酶的功能,了解這些基因的表達(dá)和調(diào)控,進(jìn)而對(duì)整個(gè)代謝網(wǎng)絡(luò)進(jìn)行調(diào)控,甚至將不同來(lái)源的生物合成相關(guān)的代謝途徑模塊化,在底盤細(xì)胞上進(jìn)行組裝,利用合成生物學(xué)的手段,實(shí)現(xiàn)各種重要的藥用植物天然產(chǎn)物的高效生物合成和規(guī)?;a(chǎn)。而所有問(wèn)題的本源便是生物合成途徑和關(guān)鍵催化酶的解析。
本文針對(duì)藥用植物天然產(chǎn)物生物合成及關(guān)鍵催化酶的研究策略進(jìn)行系統(tǒng)綜述,從藥用植物天然產(chǎn)物生物合成途徑的推測(cè)、天然產(chǎn)物生物合成關(guān)鍵催化酶的發(fā)現(xiàn)與預(yù)測(cè)、酶的表達(dá)特征研究、體內(nèi)酶功能研究、酶催化特征研究、酶結(jié)構(gòu)解析與優(yōu)化、合成生物學(xué)研究這6個(gè)方面進(jìn)行總結(jié)和討論。
通過(guò)目標(biāo)代謝產(chǎn)物的結(jié)構(gòu),推測(cè)目標(biāo)化合物的生物合成途徑,是目標(biāo)天然產(chǎn)物生物合成途徑催化酶研究的基礎(chǔ)。20世紀(jì)下半葉,隨著初生代謝途徑的解析基本完成,萜類、生物堿、苯丙素類等天然產(chǎn)物的組裝化學(xué)原理開始呈現(xiàn)。根據(jù)基本的化學(xué)反應(yīng)原理,結(jié)合研究物種中所分離到的天然產(chǎn)物,首先提出目標(biāo)化合物的生物合成途徑假說(shuō)。接下來(lái)則通過(guò)同位素示蹤實(shí)驗(yàn),即通過(guò)穩(wěn)定重原子標(biāo)記初生代謝產(chǎn)物作為底物進(jìn)行飼喂,再利用核磁共振或者高分辨質(zhì)譜,動(dòng)態(tài)監(jiān)測(cè)并追蹤含有同位素原子代謝物的流向,進(jìn)而驗(yàn)證所提出的天然產(chǎn)物生物合成途徑假說(shuō)的正確性。
同位素示蹤法廣泛應(yīng)用于解析藥用植物天然產(chǎn)物生物合成途徑的研究中。如在紫杉醇生物合成途徑的推測(cè)中,Eisenreich等[1]對(duì)紅豆杉(Taxus chinensis)的懸浮細(xì)胞飼喂前體[U-13C6]葡萄糖、[1-13C6]葡萄糖、[1,2-13C12]醋酸,發(fā)現(xiàn)產(chǎn)物 [1,2-13C12]醋酸僅轉(zhuǎn)化到taxuyunnanine C的4個(gè)乙?;鶄?cè)鏈,卻未轉(zhuǎn)移到紫杉烷的環(huán)形骨架上;而兩個(gè)被標(biāo)記的葡萄糖不僅轉(zhuǎn)移到了taxuyunnanine C的乙?;校瑫r(shí)也轉(zhuǎn)移到了紫杉烷的環(huán)形骨架。以上結(jié)果表明,紫杉烷的環(huán)形骨架來(lái)源于DXP/MEP途 徑(deoxyxylulose phosphate or methylerythritol phosphate pathway)。在莨菪堿的生物合成途徑推測(cè)中,Robins等[2]以3-苯基-[2-13C,2-2H]乳酸、苯基- [1,3-13C2]乳酸以及[1',3'-13C,甲基-2H3]海螺堿飼喂曼陀羅毛狀根(Datura innoxia),通過(guò)2D-NMR檢測(cè)13C、1H、2H,發(fā)現(xiàn)托品和來(lái)自苯丙氨酸的苯乳酸通過(guò)縮合反應(yīng)生成海螺堿。在丹酚酸途徑生物合成途徑推測(cè)中,Di等[3]用13C標(biāo)記的苯丙氨酸飼喂丹參(Salvia miltiorrhiza)毛狀根,通過(guò)高分辨質(zhì)譜對(duì)丹酚酸成分的天然產(chǎn)物進(jìn)行分析,發(fā)現(xiàn)丹參中迷迭香酸的產(chǎn)生途徑可能與已報(bào)道的彩葉草途徑有差異,同時(shí)預(yù)測(cè)迷迭香酸可能是丹酚酸B的前體化合物;而在丹參酮生物合成途徑的研究中,Guo等[4]利用13C標(biāo)記的次丹參酮二烯飼喂丹參毛狀根,通過(guò)檢測(cè)發(fā)現(xiàn)了隱丹參酮和鐵銹醇的生成,證明了兩種物質(zhì)是丹參酮合成的中間產(chǎn)物。
大量的研究表明,同樣類型的化合物大多共用一套生物合成途徑,骨架合成酶和后修飾酶的種類,在特定結(jié)構(gòu)天然產(chǎn)物的形成中基本一致[5-8]。因此,在后基因組時(shí)代,如苯丙素類、萜類、生物堿、黃酮等主要類型的藥用植物天然產(chǎn)物的生物合成途徑已逐步完善,基于同位素飼喂推斷代謝產(chǎn)物生物合成途徑的方法不像之前使用那樣頻繁。隨著生物信息學(xué)的發(fā)展,大量生信工具通過(guò)基因組、轉(zhuǎn)錄組、蛋白質(zhì)組學(xué)以及代謝組學(xué)的分析及計(jì)算,便可以提供化學(xué)原理和酶學(xué)機(jī)制的高通量信息,幫助解析目標(biāo)化合物的生物合成途徑。但是,對(duì)于一些基因組數(shù)據(jù)龐大、轉(zhuǎn)錄組與蛋白質(zhì)組學(xué)研究較為復(fù)雜的物種,同位素標(biāo)記仍然發(fā)揮著極其重要的作用,比如在2016年Anttila等[9]利用同位素標(biāo)記法標(biāo)記[13C-甲基]蛋氨酸研究海洋甲藻(Alexandrium ostenfeldii)中聚酮類螺亞胺的生物合成途徑。
目標(biāo)天然產(chǎn)物的生物合成途徑明確之后,則需要對(duì)目標(biāo)關(guān)鍵催化酶進(jìn)行挖掘和篩選。早期科研工作者僅是通過(guò)蛋白質(zhì)分離對(duì)酶的活性進(jìn)行驗(yàn)證,但是受制于檢測(cè)手段和測(cè)序技術(shù),酶的挖掘和鑒定過(guò)程非常緩慢。
隨著高通量測(cè)序技術(shù)的飛速發(fā)展,對(duì)于關(guān)鍵酶的發(fā)現(xiàn)不再局限于傳統(tǒng)的分離純化和鑒定,而是基于各種生物信息學(xué)數(shù)據(jù),通過(guò)酶的氨基酸序列與酶結(jié)構(gòu)的相似性進(jìn)行挖掘。相比于已經(jīng)通過(guò)實(shí)驗(yàn)驗(yàn)證功能的酶,絕大多數(shù)酶的功能仍然是未知的。根據(jù)未知酶和已知酶之間的相似性,對(duì)未知酶的功能進(jìn)行預(yù)測(cè),已經(jīng)成為酶學(xué)研究中非常普遍的研究手段。盡管序列相似性預(yù)測(cè)不能完全找到整個(gè)酶家族中所有進(jìn)化和功能的聯(lián)系,但是對(duì)于催化酶的挖掘來(lái)說(shuō)具有十分重要的意義。此外,為了縮小候選基因的范圍,常常通過(guò)多種組學(xué)數(shù)據(jù)相結(jié)合的分析方法,如轉(zhuǎn)錄組學(xué)與基因組學(xué)、代謝組學(xué)相結(jié)合的方法,并輔助以酶的表達(dá)特征分析,如亞細(xì)胞定位實(shí)驗(yàn)、GUS實(shí)驗(yàn)、組織器官表達(dá)水平分析等,對(duì)生物合成途徑的關(guān)鍵催化酶進(jìn)行篩選。
酶的提取、分離、純化是指把酶從組織或者細(xì)胞內(nèi)外提取出并使之達(dá)到相應(yīng)程度的過(guò)程,一般包括5個(gè)步驟,包括細(xì)胞破碎、酶液提取、酶分離純化、酶濃縮、酶檢測(cè)與保存。其中最重要的的步驟便是分離純化,目前常用的分離純化方法包括離心分離、過(guò)濾分離、沉淀分離、層析分離、電泳分離、萃取分離和結(jié)晶分離等。以嗎啡生物合成途徑解析為例,從1967年提出嗎啡的生物合成途徑假說(shuō)以來(lái),數(shù)十年來(lái)科學(xué)家們通過(guò)蛋白分離純化鑒定出了數(shù)種關(guān)鍵催化酶。如Roswitha于1993年利用7步程序,從罌粟(Papaver somniferum)的細(xì)胞懸浮液中分離純化得到了可以將罌粟生物堿salutaridine還原成(7S)-salutaridinol的氧化NADPH-7-氧化還原酶[10]。1995年,Rainer又從罌粟細(xì)胞懸液中分離得到了Salutaridinol-7-O-?;D(zhuǎn)移酶,解析了嗎啡前體蒂巴因生成過(guò)程[11]。隨著分子生物學(xué)的發(fā)展和組學(xué)數(shù)據(jù)的應(yīng)用,僅十幾年的時(shí)間,嗎啡的生物合成途徑便已經(jīng)基本闡明,甚至成功在酵母中進(jìn)行了前體的異源合成[12],這將在后文詳細(xì)說(shuō)明。
共表達(dá)分析(Co-expression analysis)是通過(guò)大量基因表達(dá)數(shù)據(jù)庫(kù)構(gòu)建基因之間的相關(guān)性,從而篩選、挖掘基因功能的一類分析方法。研究表明,在植物體內(nèi)同一個(gè)代謝通路上的基因,在受到體外或體內(nèi)刺激后,這些基因在表達(dá)量變化上會(huì)出現(xiàn)共表達(dá)的趨勢(shì)。通過(guò)這一特性,對(duì)轉(zhuǎn)錄組測(cè)序后所獲得的龐大數(shù)據(jù)進(jìn)行篩選、注釋和可視化,對(duì)目標(biāo)催化關(guān)鍵酶進(jìn)行挖掘。
Di等[3]利用茉莉酸甲酯和脫落酸誘導(dǎo)丹參的毛狀根,根據(jù)酚酸基因表達(dá)水平的變化,尋找到了丹參迷迭香酸合成酶(SmRAS)、細(xì)胞色素P450單加氧酶(SmCYP98A14)和細(xì)胞色素P450還原酶(SmCPR)。Li等[13]利用茉莉酸甲酯處理菘藍(lán)毛狀根,并進(jìn)行轉(zhuǎn)錄組測(cè)序,首次從菘藍(lán)(Isatis indigotica)發(fā)現(xiàn)了Dirigent蛋白家族19個(gè)基因,并對(duì)其進(jìn)行了序列特征和表達(dá)分析,這為該類蛋白的進(jìn)一步研究提供了基礎(chǔ)。
此外,通過(guò)共表達(dá)分析結(jié)合代謝數(shù)據(jù)的方法,Xiao等同樣使用茉莉酸甲酯處理菘藍(lán)毛狀根,研究落葉松脂素生物合成途徑的基因表達(dá)水平,并結(jié)合木脂素成分的積累水平,繪制了“基因與化合物”關(guān)聯(lián)性熱圖,篩選出27個(gè)與菘藍(lán)木脂素合成相關(guān)的基因,并對(duì)菘藍(lán)松脂醇還原酶IiPLR1基因進(jìn)行研究,發(fā)現(xiàn)其在落葉松脂素的積累中發(fā)揮重要的作用[14-15]。Wang等[16]對(duì)不同紫草素積累量的新疆紫草(Arnebia euchroma)進(jìn)行轉(zhuǎn)錄組分析,并結(jié)合新疆紫草不同器官中的基因表達(dá)水平、關(guān)鍵酶的亞細(xì)胞定位實(shí)驗(yàn),鑒定出了催化香葉基氫醌轉(zhuǎn)變?yōu)樽喜菟厍绑w的關(guān)鍵羥化酶CYP76B74。
相比于基于轉(zhuǎn)錄組數(shù)據(jù)通過(guò)基因的表達(dá)量挖掘關(guān)鍵催化酶,高質(zhì)量的基因組數(shù)據(jù)提供了更為全面準(zhǔn)確的信息,其可以在群體水平上揭示個(gè)體之間基因的變化差異,從分子水平理解基因的結(jié)構(gòu)、組成、功能和進(jìn)化。
Zhao等[17]通 過(guò) 黃 芩(Scutellaria baicalensis)基因組測(cè)序,揭示了漢黃芩素完整的生物合成途徑。根據(jù)基因組,共注釋了28 930個(gè)基因,并在黃芩特有的串聯(lián)重復(fù)區(qū)內(nèi)找到6個(gè)氧甲基轉(zhuǎn)移酶(SbPFOMT)候選基因。通過(guò)組織器官表達(dá)分析以及茉莉酸誘導(dǎo)黃芩毛狀根實(shí)驗(yàn),對(duì)篩選到的PFOMT進(jìn)行進(jìn)一步篩選。最終結(jié)合體外酶催化和體內(nèi)RNA抑制實(shí)驗(yàn),確認(rèn)了PFOMT5是催化漢黃芩素生成的關(guān)鍵酶。Ma等[18]對(duì)自交6代純合的丹參株系進(jìn)行基因組測(cè)序發(fā)現(xiàn),形成丹參酮前體母核的二萜合酶與細(xì)胞色素P450基因以基因簇的方式存在于鼠尾草屬植物中。利用基因擴(kuò)張和收縮分析,聚焦于丹參中明顯擴(kuò)張的SmCYP71D亞家族,并篩選到了4個(gè)候選基因。后續(xù)研究表明,SmCYP71D373和SmCYP71D375可以催化丹參酮特征五元呋喃環(huán)的生成,SmCYP71D411與丹參酮類化合物C20位脫甲基化過(guò)程相關(guān)。Guo等[19]利用多種測(cè)序技術(shù)組裝獲得了罌粟的基因組,發(fā)現(xiàn)罌粟中那可丁和嗎啡類生物堿合成途徑中15個(gè)基因在11號(hào)染色體上形成超級(jí)基因簇(BIA基因簇),從而高效合成罌粟中的各種次生代謝產(chǎn)物,同時(shí)結(jié)合轉(zhuǎn)錄組數(shù)據(jù)分析發(fā)現(xiàn)BIA通路基因在根和莖中特異性表達(dá)且共表達(dá)。此外,根據(jù)序列同源性分析,發(fā)現(xiàn)P450和氧化還原酶基因融合形成了一個(gè)STORR基因,該基因?qū)τ诶浰谥袉岱鹊纳锖铣删哂嘘P(guān)鍵作用。該研究揭示了罌粟基因組的復(fù)制、重排及基因融合導(dǎo)致了罌粟有效成分合成途徑的進(jìn)化。
目前,越來(lái)越多的研究結(jié)合基因組、轉(zhuǎn)錄組和代謝組,對(duì)藥用植物天然產(chǎn)物生物合成途徑中的關(guān)鍵催化酶進(jìn)行挖掘。通過(guò)轉(zhuǎn)錄組挖掘差異基因,快速圈定核心調(diào)控網(wǎng)絡(luò)和關(guān)鍵候選基因;通過(guò)代謝組尋找目標(biāo)化合物的差異累積,將候選基因與表型進(jìn)行關(guān)聯(lián);通過(guò)基因組對(duì)候選基因進(jìn)行定位,結(jié)合序列的多態(tài)性全面對(duì)目標(biāo)基因進(jìn)行描述;通過(guò)酶表征數(shù)據(jù),對(duì)酶基因的性質(zhì)進(jìn)行確認(rèn)。通過(guò)多組學(xué)聯(lián)合的方法,達(dá)到高效、快速挖掘、鑒定天然產(chǎn)物生物合成途徑催化酶基因的目的。
在挖掘到一系列參與天然產(chǎn)物生物合成的關(guān)鍵候選酶基因后,接下來(lái)需要對(duì)酶的功能進(jìn)行研究。首先對(duì)目標(biāo)酶分離、純化或通過(guò)分子生物學(xué)的手段進(jìn)行異源表達(dá)、純化;然后對(duì)酶的理化性質(zhì)進(jìn)行分析;接下來(lái)對(duì)酶進(jìn)行功能表征,檢測(cè)是否在適當(dāng)?shù)臈l件下催化底物生成相應(yīng)的產(chǎn)物;最后開展酶催化的動(dòng)力學(xué)性質(zhì)研究,多角度描述酶的催化特征。
在藥用植物關(guān)鍵酶的研究中,常見的異源表達(dá)宿主有大腸桿菌、酵母和煙草,其它不太常用的表達(dá)系統(tǒng)還包括一些真菌、昆蟲及哺乳動(dòng)物細(xì)胞。
大腸桿菌作為原核生物,具有繁殖速度快、實(shí)驗(yàn)操作簡(jiǎn)單、培養(yǎng)成本較低和遺傳背景清晰等優(yōu)點(diǎn),常常作為酶蛋白異源表達(dá)的首選宿主。但是原核表達(dá)系統(tǒng)也存在一些局限,如分泌表達(dá)能力弱、二硫鍵形成困難導(dǎo)致蛋白折疊錯(cuò)誤、無(wú)翻譯后修飾等缺點(diǎn),限制了其在復(fù)雜酶的表達(dá)中的應(yīng)用。而真核生物表達(dá)系統(tǒng)則主要是以酵母為主體,常用酵母宿主有釀酒酵母和畢赤酵母。相比于原核表達(dá)宿主,酵母系統(tǒng)具有外源基因整合穩(wěn)定、易于調(diào)控表達(dá)、重組蛋白以胞內(nèi)積累或胞外分泌的形式表達(dá)、存在翻譯后修飾、發(fā)酵密度極高等優(yōu)勢(shì)。煙草作為近些年來(lái)興起的植物表達(dá)宿主,通過(guò)農(nóng)桿菌介導(dǎo)的瞬時(shí)表達(dá)體系,使外源基因無(wú)需整合在煙草基因組中就可以進(jìn)行表達(dá),不受基因位置效應(yīng)以及沉默的影響。基于煙草的瞬時(shí)表達(dá)系統(tǒng),即可以作為酶體外功能快速驗(yàn)證的平臺(tái),又可以作為酶體內(nèi)功能研究的輔助,具有快速、高效的特點(diǎn)。
Fu等[20]利用大腸桿菌為宿主,表達(dá)出了紫錐菊(Echinacea purpurea)中菊苣酸合成的BAHD家族酰基轉(zhuǎn)移酶,EpHTT、EpHQT和EpHCT;同時(shí)利用釀酒酵母表達(dá)出SCPL家族?;D(zhuǎn)移酶,EpCAS。根據(jù)體外酶促反應(yīng)結(jié)果發(fā)現(xiàn),EpHTT催化咖啡酰輔酶A和酒石酸反應(yīng)生成咖啡酰酒石酸,EpHQT催化咖啡酰輔酶A及奎寧酸反應(yīng)生成綠原酸,兩個(gè)產(chǎn)物再進(jìn)一步被EpCAS催化,生成菊苣酸和奎寧酸,該研究完整解析了紫錐菊中菊苣酸的生物合成途徑,并對(duì)關(guān)鍵催化酶進(jìn)行了確認(rèn)。Tu等[21]通過(guò)釀酒酵母表達(dá)出雷公藤(Tripterygium wilfordii)中P450單加氧酶,TwCYP728B70并發(fā)現(xiàn)該單加氧酶可以催化三步氧化反應(yīng)生成雷公藤甲素中間體脫氫樅酸,為雷公藤甲素生物合成途徑的解析奠定了基礎(chǔ)。Fei等[22]通過(guò)底物拓品和苯乳酸共注射的方式,在煙草中瞬時(shí)表達(dá)從顛茄(Atropa belladonna)中篩選到的苯乳酸UDP-糖基轉(zhuǎn)移酶AbUGT1和海螺堿合成酶AbLS,確認(rèn)了AbUGT1和AbLS的功能,AbUGT1催化苯乳酸和UDP-葡萄糖生成苯乳酰葡萄糖,進(jìn)一步和托品在AbLS的催化下酯化縮合生成海螺堿。
由于絕大部分的酶是蛋白質(zhì),所以酶理化性質(zhì)研究本質(zhì)是蛋白質(zhì)理化性質(zhì)研究。根據(jù)化學(xué)組成的差異分為單純蛋白質(zhì)和結(jié)合蛋白質(zhì),結(jié)合蛋白質(zhì)中的非蛋白部分稱為酶的輔助因子,包括有機(jī)化合物(糖類、脂質(zhì)等)和金屬離子。
酶理化性質(zhì)研究主要研究包括分子量、等電點(diǎn)以及輔助因子的確定。酶的分子量一般通過(guò)其氨基酸序列便可預(yù)測(cè),通過(guò)SDS-PAGE電泳進(jìn)行驗(yàn)證,分子量大小的單位以道爾頓(Da)表示。等電點(diǎn)的含義是,使蛋白質(zhì)解離成正、負(fù)離子的趨勢(shì)相等的兼性離子時(shí),酶溶液的pH。該數(shù)值同樣可以根據(jù)氨基酸序列進(jìn)行預(yù)測(cè),通過(guò)等電聚焦電泳技術(shù)進(jìn)行測(cè)定。輔助因子可通過(guò)化學(xué)顯色法、酶處理學(xué)或借助質(zhì)譜、核磁等儀器檢測(cè)來(lái)確定。
Ma等[23]從鹽膚木(Rhus chinensis)中篩選到了苯丙氨酸解氨酶基因,通過(guò)大腸桿菌進(jìn)行異源表達(dá),獲得了PcPAL重組蛋白。通過(guò)SDS-PAGE電泳,驗(yàn)證了表達(dá)出蛋白的大小約為77 kDa。接下來(lái)對(duì)PcPAL的穩(wěn)定性進(jìn)行研究,發(fā)現(xiàn)該酶的最適反應(yīng)溫度為45℃、最適反應(yīng)pH為9.0,本研究首次從漆樹科植物中克隆了PAL基因并對(duì)該酶的基本理化性質(zhì)進(jìn)行了探究。Su等[24]從羅漢果(Siraitia grosvenorii)中克隆出了由417個(gè)氨基酸構(gòu)成的鯊烯合酶SgSQS,其可以催化法尼基焦磷酸生成鯊烯。通過(guò)大腸桿菌為宿主表達(dá)出SgSQS,通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)蛋白大小為47 kD,等電點(diǎn)為7.3。隨后又對(duì)該酶的最適反應(yīng)溫度和pH進(jìn)行研究,結(jié)構(gòu)表明在37℃ 以及 pH 7.5的條件下,鯊烯合酶的活性最高。
酶對(duì)底物的選擇性研究是判斷酶專一性或雜泛性的重要依據(jù)。當(dāng)酶只催化一種物質(zhì)或某一類特定物質(zhì)發(fā)生一定反應(yīng)時(shí)顯示出專一性。反之酶催化雜泛性則表現(xiàn)為具有底物的寬泛性與反應(yīng)的多樣性。
Wang等[25]在傳統(tǒng)中藥黃芩中發(fā)現(xiàn)了一個(gè)黃酮3號(hào)位氧糖基化酶Sb3GT1(UGT78B4)。該酶可以接受5種不同的糖供體,包括:二磷酸尿苷葡萄糖、半乳糖、乙酰氨基葡萄糖、木糖、阿拉伯糖。同時(shí)Sb3GT1也可以催化17種黃酮醇類化合物,轉(zhuǎn)換率達(dá)到98%以上,并催化形成5個(gè)全新的黃酮苷類化合物,表明該酶具有較強(qiáng)的雜泛性。Gao等[26]從桑樹(Morusalba)愈傷組織中鑒定出兩個(gè)FAD依賴的單加氧酶MaMO以及MaDA。MaDA能高效、選擇性地催化分子間[4+2]環(huán)加成反應(yīng)(Diels-Alder反應(yīng))生成環(huán)己烯結(jié)構(gòu)單元,且對(duì)二烯體及親二烯體具有較寬的底物雜泛性;MaMO則可以催化異戊烯基氧化形成二烯體,兩者共同完成桑中活性成分chalcomoracin的生物合成。
酶催化的動(dòng)力學(xué)性質(zhì)研究通常在酶催化反應(yīng)的最適條件下進(jìn)行。通過(guò)考察不同pH、溫度和金屬離子濃度對(duì)酶反應(yīng)速率的影響確定最適反應(yīng)條件。
Wu等[27]從馬尿泡(Przewalskia tangutica)中分離純化了兩個(gè)托品酮還原酶基因PtTRI 和 PtTRII,并于最適pH測(cè)定了兩個(gè)托品酮還原酶的動(dòng)力學(xué)參數(shù),根據(jù)Kcat、Km、Kcat/Km的比較,發(fā)現(xiàn)相對(duì)于PtTRI,托品酮是PtTRII的最適底物,且根據(jù)其它物種托品酮還原酶的報(bào)道,PtTRI對(duì)托品酮表現(xiàn)出更高的親和力。Yu等[28]通過(guò)茉莉酸甲酯誘導(dǎo)紅景天(Rhodiola sachalinensis)細(xì)胞培養(yǎng)體系,挖掘了紅景天苷生物合成途徑中的兩個(gè)葡萄糖基轉(zhuǎn)移酶RsUGT72B14 和RsUGT74R1。根據(jù)Kcat/Km比較兩個(gè)酶對(duì)于底物對(duì)羥苯基乙醇催化效率,發(fā)現(xiàn)RsUGT72B14的催化效率是RsUGT74R1的6倍。結(jié)合不同器官中兩個(gè)葡萄糖基轉(zhuǎn)移酶的表達(dá)量,明確了RsUGT72B14在紅景天苷的生成發(fā)揮重要的作用。Xiang等[29]從川西獐牙菜(Swertia mussotii)中篩選并鑒定了兩個(gè)環(huán)烯醚萜合成酶SmIS1和SmIS2,其中SmIS1的大小約為88 kD,SmIS2的大小約為46 kD。以8-oxogeranial為底物,NADPH為輔因子,測(cè)定SmIS1和SmIS2的動(dòng)力學(xué)參數(shù),結(jié)果表明,相比于SmIS1,SmIS2對(duì)底物有著較低的親和力,卻對(duì)NADPH有著較高的親和力。并且與長(zhǎng)春花(Catharanthus roseus)和油橄欖(Olea europaea)中的環(huán)烯醚萜合成酶相比,SmIS1的催化效率降低。
通過(guò)體外實(shí)驗(yàn)明確了天然產(chǎn)物生物合成關(guān)鍵酶的催化功能后,需要對(duì)目標(biāo)基因在生物體內(nèi)的功能進(jìn)行研究。常用的酶體內(nèi)功能研究策略是通過(guò)基因的敲除或抑制,使目標(biāo)酶基因在體內(nèi)的表達(dá)量降低,以及通過(guò)基因的過(guò)表達(dá)操作增加目標(biāo)酶基因在體內(nèi)的表達(dá)量。通過(guò)酶表達(dá)量的變化,結(jié)合轉(zhuǎn)錄、代謝、表型等方面的數(shù)據(jù),研究酶在藥用植物體內(nèi)的功能。但是,由于遺傳轉(zhuǎn)化體系的限制,部分無(wú)法獲得目標(biāo)酶基因穩(wěn)定表達(dá)的轉(zhuǎn)基因物種,則可以通過(guò)瞬時(shí)表達(dá)技術(shù)或者將基因在其它相近物種中進(jìn)行表達(dá),根據(jù)表型的變化,驗(yàn)證酶的體內(nèi)功能。
CRISPR/Cas9技術(shù)是指在gRNA的引導(dǎo)下靶向基因組特定區(qū)域,并指導(dǎo)Cas9蛋白切割基因雙鏈,形成移碼突變或片段敲除的方法,該技術(shù)可以使基因永久性的表達(dá)沉默。
Zhou等[30]利 用CRISPR/Cas9技 術(shù) 敲 除 了丹參中酚酸生物合成的關(guān)鍵酶—迷迭香酸合成酶SmRAS,發(fā)現(xiàn)迷迭香酸和丹酚酸的含量顯著降低,證明了SmRAS在丹酚酸途徑中的發(fā)揮重要的作用;而Li等[31]則利用CRISPR/Cas9技術(shù)敲除了丹參酮生物合成途徑中丹參二萜合酶—SmCPS1,發(fā)現(xiàn)在純合敲除株系丹參酮IIA、隱丹參酮的積累幾乎消失,證明了SmCPS1在丹參酮生源途徑中的作用。通過(guò)基因編輯技術(shù),Dinkins等[32]敲除紅車軸草(Trifolium pratense)中的異黃酮合酶TpIFS1,獲得了單鏈突變的雜合突變植株,后利用雜交獲得TpIFS1敲除的純合突變株系。對(duì)突變的純合株系進(jìn)行研究發(fā)現(xiàn),其異黃酮芒柄花黃素、鷹嘴豆素A還有金雀異黃酮的積累顯著下降。對(duì)黃酮生物合成途徑基因的表達(dá)量進(jìn)行分析,發(fā)現(xiàn)TpIFS1敲除后,其上游基因泵丙氨酸裂解酶、查爾酮合酶的表達(dá)量顯著提高,而下游基因的表達(dá)量沒有顯著變化。
基因沉默的方法主要有RNA干擾(RNA inference,RNAi)和病毒誘導(dǎo)的基因沉默(Virus Induced Gene Silencing,VIGS)兩種方法。RNAi指利用同源性的RNA雙鏈(dsRNA)誘導(dǎo)與之互補(bǔ)的同源目標(biāo)序列mRNA降解,阻斷體內(nèi)靶基因的表達(dá),使植物出現(xiàn)目標(biāo)基因缺失的表型,該技術(shù)一般用于轉(zhuǎn)基因體系成熟的物種研究。VIGS是指攜帶目標(biāo)基因片段的病毒侵染植物后,可誘導(dǎo)植物內(nèi)源基因沉默、引起表型變化,該方法一般用于未建立轉(zhuǎn)基因體系的物種研究。
Zhao等[33]利用RNAi技術(shù)抑制人參(Panax ginseng)中β-香樹酯醇合成酶,獲得了轉(zhuǎn)基因毛狀根,發(fā)現(xiàn)β-AS的表達(dá)量降低后,β-香樹脂醇以及齊墩果烷型的人參皂甙R0的含量顯著降低,而總?cè)藚⒃碥疹惢衔锏暮棵黠@提高,表明β-AS在人參皂苷的合成中具有重要的催化作用。同樣是在人參中,Lu等[34]也從人參和西洋參(Panax quinquefolius)中鑒定到了兩個(gè)高度同源的糖基轉(zhuǎn)移酶,Pq3-O-UGT2 and PgUGT94Q2,兩個(gè)糖基轉(zhuǎn)移酶分別可以將UDP葡萄糖上的葡萄糖部分轉(zhuǎn)移到人參皂苷Rh2和F2來(lái)產(chǎn)生人參皂苷Rg3和Rd。通過(guò)轉(zhuǎn)基因毛狀根轉(zhuǎn)化體系,獲得人參和西洋參中兩個(gè)糖基轉(zhuǎn)移酶抑制的RNAi轉(zhuǎn)基因毛狀根,分析發(fā)現(xiàn)這兩個(gè)基因分別抑制后,人參皂苷Rd、原人參二醇和總?cè)藚⒍嫉姆e累均出現(xiàn)了下降,此外原人參二醇合酶和元人參三醇合酶的表達(dá)量也顯著提高,表明兩個(gè)糖基轉(zhuǎn)移酶分別在人參和西洋參人參皂苷的合成中具有關(guān)鍵調(diào)控作用。Sarma等[35]利用VIGS技術(shù)沉默長(zhǎng)春花中牻牛兒基焦磷酸合酶CrGGPP,研究其功能,發(fā)現(xiàn)CrGGPP的表達(dá)量降低后,單萜吲哚生物堿類相關(guān)的轉(zhuǎn)錄因子以及合成途徑相關(guān)的基因表達(dá)量明顯降低,同時(shí)單萜吲哚生物堿類的含量也隨之下降。而通過(guò)對(duì)CrGGPP-VIGS葉片進(jìn)行化學(xué)互補(bǔ)實(shí)驗(yàn)可以恢復(fù)CrGGPP抑制后的表型,證明了CrGGPP在長(zhǎng)春花單萜吲哚生物堿類物質(zhì)的合成中具有重要作用。
基因過(guò)表達(dá)研究主要有兩種,一種是將目標(biāo)基因克隆到攜帶有強(qiáng)啟動(dòng)子和抗性篩選標(biāo)記等元件的載體上,然后轉(zhuǎn)入植物體內(nèi),這樣宿主細(xì)胞會(huì)獲得較高量的目標(biāo)mRNA轉(zhuǎn)錄水平和蛋白表達(dá)水平。另一種則是病毒介導(dǎo)的過(guò)表達(dá)系統(tǒng)(virus mediated gene overexpression,VMGO)瞬時(shí)轉(zhuǎn)化技術(shù)。該技術(shù)亦可以將外源基因在植物體內(nèi)大量表達(dá)。通過(guò)分析目標(biāo)基因過(guò)表達(dá)后轉(zhuǎn)基因植物的表型,便可以研究該基因的功能。
Yuan等[36]對(duì)黃花蒿(Artemisia annua)中青蒿素生物合成途徑關(guān)鍵酶基因—青蒿醛△11(13)雙鍵還原酶AaDBR2進(jìn)行過(guò)表達(dá)操作,發(fā)現(xiàn)轉(zhuǎn)基因黃花蒿植株青蒿素和其前體二氫青蒿酸的含量顯著提高,該研究為獲得高產(chǎn)青蒿素的黃花蒿代謝工程策略奠定了基礎(chǔ)。Chung等[37]從鬼針草(Bidens pilosa)挖掘到了油酸脫氫酶BpOD和脂肪酸乙炔酶BpFAA,通過(guò)病毒介導(dǎo)的瞬時(shí)轉(zhuǎn)化技術(shù),在鬼針草葉片中分別過(guò)表達(dá)這兩個(gè)基因,都可以提升聚炔類化合物的含量,表明兩種酶均可以催化長(zhǎng)鏈脂肪酸前體脫飽和,在天然活性產(chǎn)物聚乙炔的合成中作用顯著。為了研究銀杏(Ginkgo biloba)中黃酮類成分的生物合成途徑,Wu等[38]通過(guò)轉(zhuǎn)錄組測(cè)序,從黃酮中發(fā)現(xiàn)了一個(gè)類黃酮3',5'-羥化酶GbF3',5' H1。由于銀杏缺少成熟的轉(zhuǎn)基因材料的體系,為了研究該基因的功能,將GbF3',5' H1于楊樹(Populus)中進(jìn)行過(guò)表達(dá)后發(fā)現(xiàn),轉(zhuǎn)基因植株黃酮類成分櫻桃甙、表兒茶素、沒食子兒茶素的含量顯著高于野生型植株,表明GbF3',5' H1在銀杏黃酮類成分的生物合成中發(fā)揮作用。
確認(rèn)了催化酶在藥用植物天然產(chǎn)物生物合成途徑中的功能后,為了探究酶發(fā)揮催化功能的機(jī)理或進(jìn)一步對(duì)酶催化功能進(jìn)行定向改造,首先需要對(duì)酶蛋白晶體進(jìn)行結(jié)構(gòu)解析,闡明底物選擇性的結(jié)構(gòu)基礎(chǔ),解釋酶催化底物的反應(yīng)機(jī)制。而后對(duì)發(fā)現(xiàn)的關(guān)鍵氨基酸位點(diǎn)進(jìn)行理性設(shè)計(jì),獲得一系列底物特異性或催化效率發(fā)生改變的突變體,對(duì)突變體的功能進(jìn)行解析,最終獲得特定功能的酶,實(shí)現(xiàn)酶功能的定向改造。
C-糖苷在自然界中分布局限、結(jié)構(gòu)多樣性不足,同時(shí)化學(xué)法C-糖基化面臨選擇性差,因此藥用植物天然產(chǎn)物生物合成途徑中C-糖基轉(zhuǎn)移酶研究成為近些年來(lái)的熱點(diǎn)問(wèn)題。第一個(gè)被解析晶體結(jié)構(gòu)的C-糖基轉(zhuǎn)移酶來(lái)自于金蓮花(Trollius chinensis),He等[39]發(fā)現(xiàn)了催化黃酮C-8位糖基化的碳糖基轉(zhuǎn)移酶TcCGT1,研究表明該酶可以催化合成牡荊苷等36種碳苷類化合物。又初步闡明了TcCGT1催化C-、O-糖基化的分子機(jī)制,并通過(guò)定點(diǎn)突變實(shí)現(xiàn)了由C-糖基化向O-糖基化的功能轉(zhuǎn)變。Zhang等[40]從光果甘草(Glycyrrhiza glabra)鑒定出一條雙C-糖基轉(zhuǎn)移酶GgCGT(UGT708B4)。該雙C-糖基轉(zhuǎn)移酶能夠高效催化含有弗洛丙酮結(jié)構(gòu)單元的化合物發(fā)生連續(xù)兩步的C-糖基化反應(yīng),生成相應(yīng)的雙碳苷產(chǎn)物。為了闡明該酶的催化機(jī)制,解析了GgCGT分別與二磷酸尿苷葡萄糖、尿苷二磷酸半乳糖等底物結(jié)合后所形成復(fù)合物的晶體結(jié)構(gòu)。結(jié)果發(fā)現(xiàn)相較于葡萄糖,半乳糖的結(jié)合位置的偏轉(zhuǎn)導(dǎo)致糖基部分與周圍氨基酸形成氫鍵作用的強(qiáng)弱發(fā)生變化,影響酶與糖供體的結(jié)合作用強(qiáng)弱,決定了糖基供體的偏好性的順序。Xie等[41]通過(guò)轉(zhuǎn)錄組學(xué)等方法從蘆薈(Aloe barbadensis)中發(fā)掘了一個(gè)C-糖基轉(zhuǎn)移酶(AbCGT),該酶可以高效催化多種不含?;姆枷丬赵牡孜镞M(jìn)行C-糖基化。以GgCGT為模板,通過(guò)同源建模的方法構(gòu)建AbCGT的三維立體結(jié)構(gòu),利用分子對(duì)接預(yù)測(cè)了該酶與底物2-羥基柚皮素的反應(yīng)口袋,發(fā)現(xiàn)183位的纈氨酸為酶關(guān)鍵活性位點(diǎn)催化殘基。通過(guò)定點(diǎn)將該位點(diǎn)突變天冬氨酸、谷氨酸或者脯氨酸后,AbCGT催化的底物選擇性有明顯提升。
由于多數(shù)藥用植物天然產(chǎn)物在原植物中積累較低,且獲得受到植物生長(zhǎng)狀態(tài)、采收時(shí)間、提取方法、遺傳操作困難等諸多因素的限制。因此,天然產(chǎn)物合成生物學(xué)則是基于工程化的原理,通過(guò)設(shè)計(jì)改造自然界已存在的微生物或植物,或者于這些生物體內(nèi),重新構(gòu)建一套完整系統(tǒng),高效快速的生產(chǎn)藥用植物活性成分。實(shí)現(xiàn)這一策略首先需要推測(cè)目標(biāo)天然產(chǎn)物的生物合成途徑,其次明確每一步催化反應(yīng)所需要的關(guān)鍵酶及輔因子,再將生物合成途徑整合于底盤細(xì)胞內(nèi),最終對(duì)整個(gè)代謝網(wǎng)絡(luò)進(jìn)行優(yōu)化調(diào)控。目前,藥用植物天然產(chǎn)物合成生物學(xué)常用的底盤有大腸桿菌、酵母及本氏煙草等,下文將針對(duì)不同底盤構(gòu)建細(xì)胞工廠進(jìn)行藥用天然產(chǎn)物的合成進(jìn)行簡(jiǎn)要綜述。
Li等[42]通過(guò)來(lái)源于7個(gè)物種的11個(gè)基因整合進(jìn)大腸桿菌,構(gòu)建了能夠?qū)⒈奖彼峄蚶野彼醿煞N不同的前體,定向合成黃芩素或野黃芩素的菌株。后針對(duì)丙二酰輔酶A這一重要前體的供應(yīng)進(jìn)行了優(yōu)化,搖瓶水平黃芩素和野黃芩素的產(chǎn)量分別達(dá)到了23.6 mg/L 和106.5 mg/L。Yao等[43]在丹參素生物合成途徑未被解析的情況下,利用大腸桿菌內(nèi)源的羥基化酶和植物乳桿菌中的D-乳酸脫氫酶,在大腸桿菌中構(gòu)建了丹參素生物合成途徑。再采取模塊化策略優(yōu)化,加強(qiáng)底物的供給;對(duì)底盤細(xì)胞編輯,敲除競(jìng)爭(zhēng)基因,篩選出高產(chǎn)丹參素的人工大腸桿菌,丹參素產(chǎn)量達(dá)7.14 g/L。
斯坦福大學(xué)的Christina課題組利用酵母實(shí)現(xiàn)了多種藥用植物活性天然產(chǎn)物的生物合成,其中最具代表性的工作便是2015年于釀酒酵母中合成蒂巴因和氫可酮,以及2020年在面包酵母中合成托品烷生物堿。Galanie等將來(lái)自酵母本身、植物、細(xì)菌以及嚙齒動(dòng)物的21種酶,在不影響酵母正常生長(zhǎng)的情況下,整合進(jìn)釀酒酵母中,通過(guò)輔因子循環(huán)利用、嵌合蛋白的蛋白質(zhì)折疊等方法,獲得了嗎啡類藥物的關(guān)鍵前體—蒂巴因。之后又整合了另外兩種催化酶,使得產(chǎn)生蒂巴因的酵母進(jìn)一步生成了氫可酮[12]。Prashanth通過(guò)5個(gè)生物合成功能模塊的設(shè)計(jì),從糖和氨基酸出發(fā),在面包酵母中實(shí)現(xiàn)了莨菪堿和東莨菪堿的合成[44]。
依托泊苷作為拓?fù)洚悩?gòu)酶 II 抑制劑,廣泛應(yīng)用于肺癌、睪丸癌、淋巴瘤和其它惡性腫瘤的化療。目前,依托泊苷主要從桃兒七(Sinopodophyllum hexandrum)中分離鬼臼毒素,并以此為前體合成依托泊苷。但對(duì)桃兒七過(guò)度的砍伐導(dǎo)致其現(xiàn)已瀕臨滅絕。目前常用的替代方法是通過(guò)植物組織培養(yǎng)方法合成(-)-鬼臼毒素,并以此為前體合成依托泊苷,但該方法不便于進(jìn)行規(guī)?;a(chǎn)。2015年Elizabeth課題組的Lau. W通過(guò)轉(zhuǎn)錄組和代謝組的分析,解析了依托泊苷糖苷配基完整的生物合成途徑,并報(bào)道了其前體脫氧鬼臼毒素在煙草中的重構(gòu),達(dá)到11.4±3.8 μg/g干重的產(chǎn)量,為煙草作為天然產(chǎn)物的生物合成底盤研究奠定了基礎(chǔ),表明煙草的瞬時(shí)表達(dá)可以用于獲得毫克級(jí)的植物源小分子并生物合成其類似物[45]。2019年,同課題組的Schultz. BJ等利用煙草為底盤,實(shí)現(xiàn)了脫氧鬼臼毒素的異源合成。通過(guò)在煙草中表達(dá) 8 個(gè)松柏醇和 8 個(gè)依托泊苷苷元的酶基因之后,脫氧鬼臼毒素在煙草中的積累量達(dá)到了 4.3 mg/g。該研究表明可以在煙草植物底盤細(xì)胞中表達(dá)難培養(yǎng)的藥用植物中較長(zhǎng)的生物合成途徑,并達(dá)到毫克級(jí)產(chǎn)量[46]。
隨著藥用植物天然產(chǎn)物的市場(chǎng)需求的不斷增加,藥用植物的資源供求矛盾也越來(lái)越明顯,而通過(guò)生物技術(shù)手段是解決這一矛盾的有效方法。對(duì)藥用植物天然產(chǎn)物的生物合成化學(xué)原理和酶學(xué)機(jī)制進(jìn)行探究的最終目的,便是為藥用植物資源的可持續(xù)利用和發(fā)展提供一條全新而高效的途徑。
在生物信息學(xué)飛速發(fā)展的今天,通過(guò)基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、表型組學(xué)等組學(xué)技術(shù)聯(lián)合分析,對(duì)藥用植物天然產(chǎn)物的生物合成途徑及關(guān)鍵催化酶進(jìn)行挖掘和解析,利用結(jié)構(gòu)生物學(xué)對(duì)獲得的酶進(jìn)行改造,再應(yīng)用合成生物學(xué)的方法,將生物合成途徑和關(guān)鍵酶整合到底盤中,從而異源高效生產(chǎn)各種目標(biāo)天然產(chǎn)物。這一系列的研究方法,已經(jīng)成為藥物植物天然產(chǎn)物的生物合成研究的通用策略。
然而這一策略在應(yīng)用時(shí)也會(huì)遇到一些問(wèn)題。比如在研究一些關(guān)鍵催化酶的體內(nèi)功能時(shí),由于許多藥用植物缺乏穩(wěn)定的遺傳轉(zhuǎn)化體系,只能借助模式植物瞬時(shí)轉(zhuǎn)化等手段進(jìn)行替代,所以仍需要在藥用植物的遺傳轉(zhuǎn)化體系的研究中加以突破。此外,植物的基因組中編碼了數(shù)目眾多且功能各異的催化酶,并且常以家族基因的形式存在,這些酶有的可以催化多種化合物的產(chǎn)生,有的只能催化單一天然產(chǎn)物的生成,還有的需要和其它酶或者輔因子共同作用才能發(fā)揮其催化效應(yīng)。這是由于在高等植物在進(jìn)化的過(guò)程中,酶的進(jìn)化形成了復(fù)雜而精巧的結(jié)構(gòu),導(dǎo)致其催化功能多樣性,進(jìn)而出現(xiàn)了物種的多樣性和代謝產(chǎn)物的多樣性。利用這一策略,不僅可以去探索未知天然產(chǎn)物的生物合成途徑及關(guān)鍵催化酶的功能,對(duì)于已知的途徑,仍可能會(huì)有全新的發(fā)現(xiàn)和認(rèn)知。這一策略為更好的挖掘天然產(chǎn)物生物合成途徑提供了基礎(chǔ),也將為合成生物學(xué)的研究提供豐富的元件,進(jìn)而推動(dòng)藥用植物天然產(chǎn)物提取、合成、臨床應(yīng)用等各領(lǐng)域的進(jìn)步。