洪園淑 周玉梅 李文娟劉 萍?
(1.寧夏優(yōu)勢特色作物現(xiàn)代分子育種重點(diǎn)實(shí)驗(yàn)室,寧夏銀川 750021;2.寧夏大學(xué)農(nóng)學(xué)院,寧夏銀川 750021)
密碼子使用偏好性,即編碼同種氨基酸的密碼子在不同物種中使用頻率不完全相同的現(xiàn)象[1]。有研究表明高表達(dá)基因傾向于使用最優(yōu)密碼子,密碼子使用偏好性與基因表達(dá)水平之間的關(guān)系已在擬南芥、豌豆和云杉等植物中報(bào)道[2-4];對于擬南芥和水稻的密碼子使用模式也已得到廣泛研究,雖然這2 種植物的密碼子使用模式不同,但研究發(fā)現(xiàn)其使用偏好性均與基因堿基組成、表達(dá)水平和CDS長度等有關(guān)[5]。密碼子使用偏好性直接影響蛋白的表達(dá),充分利用密碼子的使用偏好性策略可提高異源蛋白表達(dá)水平[6]。密碼子優(yōu)化技術(shù)對一些重要功能蛋白質(zhì)和關(guān)鍵酶的生物學(xué)結(jié)構(gòu)和功能研究有重要作用,可有效提高丙酮酸脫羧酶[7]、脂肪酶[8]、T4 溶菌酶[9]等多種異源蛋白質(zhì)的表達(dá),也為利用大腸桿菌等模式菌株工業(yè)化高效生產(chǎn)異源蛋白質(zhì)提供了很好的發(fā)展前景。
苦豆子Sophora alopecuroides L.中苦參堿和氧化苦參堿具有抗炎、抗腫瘤、調(diào)節(jié)免疫功能等多種作用[10],賴氨酸脫羧酶基因是合成苦參堿和氧化苦參堿的關(guān)鍵酶基因,有學(xué)者對東北石松、蛇足石杉、狹葉羽扇豆、桑樹、苦參、野決明等植物的賴氨酸脫羧酶基因開展研究,發(fā)現(xiàn)其通過催化賴氨酸脫羧生成尸胺,最終轉(zhuǎn)化為苦參堿和氧化苦參堿[11-15]。目前關(guān)于賴氨酸脫羧酶基因的研究大多是探討基因表達(dá)與代謝產(chǎn)物尸胺之間的關(guān)系,鮮有從密碼子角度研究其在翻譯進(jìn)程中的調(diào)控機(jī)制和調(diào)節(jié)自身表達(dá)水平。楊毅等[16]克隆獲得了苦豆子的賴氨酸脫羧酶基因(SaLDC),發(fā)現(xiàn)SaLDC 的表達(dá)和氧化苦參堿的積累均受干旱脅迫影響,且該基因的表達(dá)量與氧化苦參堿積累呈正相關(guān)關(guān)系。本研究在已有苦豆子SaLDC 編碼區(qū)的基礎(chǔ)上,從分析SaLDC 和宿主大腸桿菌細(xì)胞對密碼子的使用偏好性和適應(yīng)性入手,對SaLDC 進(jìn)行OptimumGeneTM密碼子優(yōu)化,并將優(yōu)化后獲得的optSaLDC 在大腸桿菌細(xì)胞中表達(dá),獲得純化蛋白,為后續(xù)深入研究SaLDC 功能奠定基礎(chǔ)。
1.1 材料 原核表達(dá)載體pET-28a(+)由寧夏優(yōu)勢特色作物現(xiàn)代分子育種重點(diǎn)實(shí)驗(yàn)室保存;苦豆子SaLDC 完整CDS(Coding DNA sequence,CDS)序列(GenBank 登錄號KM249871)由本實(shí)驗(yàn)室克隆得到,該CDS 序列位于其mRNA 的44~1 381 bp之間,全長1 368 bp。
1.2 方法
1.2.1 密碼子偏好性分析 運(yùn)用EMBOSS 在線程序(http:/ /vmbioinfo.toulouse.inra.fr/emboss)中的CHIPS、CUSP 及CodonW 軟件分析SaLDC 密碼子偏好性相關(guān)指標(biāo),包括有效密碼子數(shù)(Effective number of codon,ENC)、CDS 序列的GC含量、第3 位堿基的GC 含量(GC3s)、同義密碼子相對使用度(Relative synonymous codon usage,RSCU)和密碼子使用頻率。大腸桿菌(Escherichia coli T.)、酵母(Saccharomyces cerevisiae H.)、煙草(Nicotiana tabacum L.)、水稻(Oryza sativa L.)和擬南芥基因組的密碼子偏好性數(shù)據(jù)來源于密碼子使用數(shù)據(jù)庫Codon Usage Database(http:/ /www.kazusa.or.jp/codon/)。
1.2.2 optSaLDC 序列合成及原核表達(dá)載體構(gòu)建參照大腸桿菌密碼子使用模式,在不改變基因編碼氨基酸序列前提下,綜合考慮密碼子使用頻率、GC 含量、限制性內(nèi)切酶位點(diǎn)等因素,通過在線軟件(http:/ /61.191.165.20:96/CommonTools/Optimization.aspx)對SaLDC 使用頻率低的密碼子進(jìn)行同義突變,提高密碼子使用指數(shù),改變其mRNA的空間結(jié)構(gòu)并調(diào)節(jié)與大腸桿菌tRNA 水平的匹配度。優(yōu)化后的序列命名為optSaLDC,由生工生物工程(上海)股份有限公司合成。原核表達(dá)載體pET-28a(+)經(jīng)NdeI / XhoI 雙酶切,回收載體大片段并與optSaLDC(1 377 bp)序列重組連接,構(gòu)建pET-28a(+)-optSaLDC 重組質(zhì)粒(6 668 bp),擴(kuò)繁后用XhoI /ApaI 雙酶切,對目的片段測序驗(yàn)證。
1.2.3 重組optSaLDC 蛋白的誘導(dǎo)表達(dá)及優(yōu)化 測序無誤的pET-28a(+)-optSaLDC 重組質(zhì)粒轉(zhuǎn)化E.coli BL21(DE3)感受態(tài)細(xì)胞,根據(jù)預(yù)實(shí)驗(yàn)設(shè)置IPTG 為0、0.2、1.0 mmol/L 3 個終濃度,分別于37 ℃誘導(dǎo)4 h、15 ℃誘導(dǎo)16 h 后收集菌液,SDS-PAGE 電泳分析蛋白上清和沉淀。對表達(dá)最優(yōu)的克隆菌株擴(kuò)大培養(yǎng),誘導(dǎo)后離心收集菌體,超聲破碎并對上清進(jìn)行Ni 柱親和層析純化。
1.2.4 重組optSaLDC 蛋白的Western blot 檢測和LC-MS/MS 鑒定
1.2.4.1 Western blot 檢測 誘導(dǎo)獲得的蛋白經(jīng)SDS-PAGE 電泳后轉(zhuǎn)印至聚偏二氟乙烯膜(polyvinylidine difluoride,PVDF ),抗體孵育后用BeyoECL Plus 試劑覆蓋PVDF 膜,靜置、拍照觀察。
1.2.4.2 LC-MS/MS 鑒定 純化后的重組蛋白用SDS-PAGE 分離,考馬斯亮藍(lán)染色,目的條帶送上海中科新生命生物科技有限公司做LC-MS/MS鑒定。
2.1 密碼子偏好性分析
2.1.1 有效密碼子數(shù)及GC 含量分析 有效密碼子數(shù)(ENC)反映密碼子家族中同義密碼子非均衡使用的偏離程度,其范圍一般為20~61,越接近20,表明密碼子偏好性越強(qiáng)[17];GC3s 表示密碼子第3 位堿基中GC 含量與第3 位堿基總量的比值。本研究用CodonW 軟件計(jì)算獲得SaLDC 的ENC 值、GC 含量和GC3s 值分別是55.890、0.489、0.465。ENC 值偏大接近于61,遠(yuǎn)離20,表明該基因密碼子偏好性較弱;GC 和GC3s 含量均小于0.500,表明在整個編碼區(qū)序列中AT 含量大于GC 含量,且SaLDC 稍微偏好使用以A/T 結(jié)尾的密碼子。
2.1.2 相對同義密碼子使用度(RSCU)分析RSCU 是指一個氨基酸所對應(yīng)的密碼子與該氨基酸所有同義密碼子個數(shù)的比值,如果RSCU 值接近1,表明該密碼子沒有偏好性;RSCU>1.00,表示隨機(jī)使用該密碼子的頻率相對較高;RSCU<1.00,則隨機(jī)使用該密碼子的頻率較低[18]。運(yùn)用CodonW軟件計(jì)算SaLDC 中每個密碼子的RSCU 值,結(jié)果顯示,除了起始密碼子AUG 和終止密碼子UAA外,SaLDC 的所有密碼子中有28 個密碼子的RSCU值>1.00,其中偏好性最強(qiáng)的密碼子是AUC 和AGA(RSCU>2.00),見表1;編碼Trp 的密碼子UGG 的RSCU 值等于1.00,表明Trp 在SaLDC 中沒有偏好性;此外,在28 個密碼子中有17 個以A/T 結(jié)尾,可見SaLDC 偏好使用以A/T 結(jié)尾的密碼子,與“2.1.1”項(xiàng)下結(jié)果一致。
表1 SaLDC 密碼子RSCU 值分析Tab.1 RSCU value analysis for SaLDC
2.1.3 SaLDC 密碼子與模式生物基因組密碼子使用頻率比較分析 不同物種間密碼子使用偏好性的差異一般用各物種間密碼子使用頻率比值來衡量,當(dāng)2 個物種密碼子使用頻率比值≤0.5 或≥2 時,認(rèn)為2 個物種間密碼子使用偏好性差異較大[19]。比較分析SaLDC 與大腸桿菌、酵母、擬南芥、煙草和水稻5 個模式生物基因組的密碼子使用頻率,見表2,發(fā)現(xiàn)SaLDC 與擬南芥、煙草和水稻基因組差異較大的密碼子分別是13、16、20 個,而與大腸桿菌、酵母基因組差異較大的密碼子分別有28、21 個,由此可見,SaLDC 密碼子使用頻率與大腸桿菌基因組密碼子使用頻率差別甚大,若要使該基因在大腸桿菌中高效表達(dá),必須對其密碼子給予優(yōu)化;擬南芥基因組與SaLDC 密碼子使用偏好性最接近,適合作為SaLDC 遺傳轉(zhuǎn)化的受體物種,用于后續(xù)轉(zhuǎn)基因植株的功能研究。
表2 苦豆子SaLDC 密碼子與模式生物密碼子使用偏好性比較Tab.2 Comparisons of codon usage preference between SaLDC and model organisms
2.2 optSaLDC 序列的獲得和原核表達(dá)載體構(gòu)建根據(jù)大腸桿菌密碼子的偏好性,對SaLDC 序列進(jìn)行密碼子優(yōu)化,得到新基因optSaLDC 序列。優(yōu)化后的optSaLDC 核苷酸序列見圖1。分析表明優(yōu)化前SaLDC 密碼子的適應(yīng)指數(shù)為0.72,GC 含量為0.489,優(yōu)化后optSaLDC 密碼子的適應(yīng)指數(shù)達(dá)到0.97,明顯高于優(yōu)化前,但0.493 的GC 含量與優(yōu)化前并無明顯差異。
圖1 優(yōu)化前SaLDC 與優(yōu)化后optSaLDC 序列對比圖Fig.1 Sequence comparison of SaLDC and optSaLDC
對構(gòu)建好的重組質(zhì)粒pET28a(+)-optSaLDC經(jīng)XhoI/ApaI 雙酶切,電泳條帶測序結(jié)果證實(shí)opt-SaLDC 基因序列與設(shè)計(jì)的優(yōu)化基因序列完全一致,表明原核表達(dá)重組質(zhì)粒pET28a(+)-optSaLDC 構(gòu)建成功。
2.3 重組optSaLDC 蛋白誘導(dǎo)表達(dá)和純化 SDSPAGE 電泳發(fā)現(xiàn)在終濃度為0.2、1.0 mmol/L 的IPTG 誘導(dǎo)下,37 ℃、4 h 和15 ℃、16 h 均能誘導(dǎo)產(chǎn)生大小約為49 kDa 的重組蛋白,其中以1.0 mmol/L IPTG 在15 ℃下誘導(dǎo)16 h 沉淀中蛋白的表達(dá)量最大(圖2A),表明optSaLDC 重組蛋白在細(xì)胞內(nèi)表達(dá)時主要以包涵體形式存在。在上述條件下對optSaLDC 蛋白進(jìn)行大量誘導(dǎo),收集上清液并用Ni 柱親和層析純化,得到條帶單一的純化蛋白(圖2B)。
2.4 optSaLDC 重組蛋白的Western blot 檢測和LCMS/MS 鑒定 Western blot 分析顯示重組蛋白o(hù)pt-SaLDC 在43~55 kDa 間出現(xiàn)1 條特異性條帶(圖3A)。LC-MS/MS 鑒定結(jié)果表明蛋白復(fù)雜度高(圖3B),肽段序列覆蓋度(檢測到的肽段氨基酸數(shù)目占該蛋白質(zhì)全部氨基酸數(shù)目的比例)高達(dá)47.03%,分子量48 990.51 Da,等電點(diǎn)5.60,與預(yù)測結(jié)果相符,GO 注釋認(rèn)為該蛋白的主要生物學(xué)功能是催化賴氨酸脫羧形成尸胺。
核苷酸組成是影響基因密碼子使用的重要因素之一,在自然界大多數(shù)生物中,密碼子的使用具有一定的偏好性,其中密碼子的第3 個位置被認(rèn)為是最有可能反映基因組堿基組成的位置[20]。本研究發(fā)現(xiàn)SaLDC 對編碼絲氨酸的TCT、TCA、AGT,精氨酸的AGA,賴氨酸的AAA 等密碼子偏好性較強(qiáng),對第3 位堿基為A/T 的密碼子使用頻率較高。同義密碼子使用偏差與基因組AT 或GC 含量有關(guān),在小麥和水稻基因組中富含GC,密碼子的第3 位也偏好使用G/C[21]。此外,富含AT 的生物在密碼子的第3 位也偏好使用A/T,如蘋果和楊梅[22-23],在本研究中 SaLDC 的 GC(48.9%)和 GC3s(46.5%)含量表明該基因AT 含量略高于GC 含量,因而偏好使用以A/T 結(jié)尾的密碼子,這也恰好符合雙子葉植物密碼子的使用特性[24]。
圖2 optSaLDC 重組蛋白的表達(dá)鑒定(A)和純化(B)Fig.2 Expression(A)and purification(B)of optSaLDC fusion protein
轉(zhuǎn)基因研究中經(jīng)常會涉及到基因的異源表達(dá),然而異源受體物種的選擇往往會影響外源基因表達(dá)效率的高低。因此,適當(dāng)改造或優(yōu)化外源基因密碼子,使其與選擇的受體物種密碼子使用特性相似,可有效提高該基因的表達(dá)水平[25]。本研究通過比較SaLDC 與5 種模式生物基因組中不同密碼子的使用偏好性,發(fā)現(xiàn)SaLDC 密碼子與大腸桿菌基因組密碼子使用偏差最大,若要以大腸桿菌為宿主進(jìn)行SaLDC 的原核表達(dá),則需要對其密碼子進(jìn)行優(yōu)化;SaLDC 密碼子與擬南芥基因組密碼子使用偏好性差異最小,由此表明擬南芥真核表達(dá)系統(tǒng)相比其他模式植物更適合作為SaLDC 的外源表達(dá)系統(tǒng)。本研究分析的SaLDC 密碼子使用偏好性不僅為通過密碼子優(yōu)化提高其在外源表達(dá)系統(tǒng)中的表達(dá)水平,也可為尋找最佳外源表達(dá)系統(tǒng)提供參考。
圖3 optSaLDC 重組蛋白的Western blot 檢測(A)和LC-MS/MS 鑒定(B)Fig.3 Western Blot detection(A)and LC-MS/MS identification(B)of optSaLDC fusion protein
大腸桿菌具有生長迅速、細(xì)胞密度高、轉(zhuǎn)化方法簡單等特點(diǎn),在原核蛋白表達(dá)系統(tǒng)中最為常用,影響大腸桿菌表達(dá)融合蛋白的因素包括表達(dá)載體、目的基因密碼子偏好性、誘導(dǎo)溫度、IPTG 濃度和誘導(dǎo)時間等[26]。pET-28a(+)載體常用于外源基因的誘導(dǎo)表達(dá),具有培養(yǎng)簡單、高效和快速等優(yōu)勢[27]。因此,本研究通過對目的基因密碼子和誘導(dǎo)條件的優(yōu)化,成功制備并純化獲得了大量的opt-SaLDC 可溶性蛋白。研究結(jié)果表明,苦豆子opt-SaLDC 蛋白最佳誘導(dǎo)條件是 IPTG 終濃度1.0 mmol/L,在15 ℃下誘導(dǎo)16 h;Western blot 分析顯示在43~55 kDa 之間出現(xiàn)一條帶,由于Western blot 使用的是預(yù)染Maker,與在SDS-PAGE膠用的非預(yù)染Maker 有一定差距,因而對該蛋白進(jìn)行LC-MS/MS 鑒定,結(jié)果顯示分子量是48 990.51 Da,與預(yù)測結(jié)果吻合。