章鴻宇,張燎原
(福建農(nóng)林大學(xué)生命科學(xué)學(xué)院, 福建 福州 350002)
靈芝Ganodermalucidum屬多孔菌科高等真菌,是我國(guó)傳統(tǒng)藥用真菌,具有補(bǔ)氣安神,止咳平喘的功效。靈芝多糖是靈芝重要的活性成分,具有調(diào)節(jié)免疫作用、抗腫瘤作用、促進(jìn)體內(nèi)核酸與蛋白質(zhì)的代謝、抗衰老作用、鎮(zhèn)靜作用等功能[1-2]。
尿苷二磷酸葡萄糖脫氫酶(UDPglucose dehydrogenase,UDP-GlcDH)廣泛分布于微生物及動(dòng)植物的組織中,是多糖合成中糖醛酸途徑的限速酶,參與糖代謝,催化尿苷二磷酸葡萄糖(UDP-Glc)反應(yīng)生成尿苷二磷酸葡萄糖醛酸(UDP-GlcUA),UDP-GlcUA是細(xì)胞生長(zhǎng)代謝和形成結(jié)構(gòu)多糖必不可少的前體物質(zhì)[3]。
截至目前,靈芝UDP-GlcDH基因的cDNA序列尚未見(jiàn)報(bào)道。本研究利用靈芝表達(dá)序列標(biāo)簽數(shù)據(jù)庫(kù)(EST)資源和生物信息學(xué)分析方法,電子克隆了靈芝UDP-GlcDH基因的cDNA,并對(duì)其表達(dá)的蛋白序列的理化性質(zhì)、結(jié)構(gòu)特征以及系統(tǒng)進(jìn)化關(guān)系進(jìn)行預(yù)測(cè)和分析,為進(jìn)一步開(kāi)展靈芝多糖生物合成機(jī)制等相關(guān)研究奠定基礎(chǔ)。
靈芝GanodermalucidumCurtis:Fr.P.Karst 由福建農(nóng)林大學(xué)菌物研究中心保藏。
1.2.1靈芝UDP-GlcDH基因的電子克隆 以黃曲霉AspergillusflavusAF70的UDP-GlcDH蛋白序列(GenBank accession: KOC08495.1)作為探針,利用NCBI中的tBLASTn工具與靈芝Ganodermalucidam的EST數(shù)據(jù)庫(kù)進(jìn)行相似性搜索,選擇與探針序列同源性較高的序列。利用BioEdit軟件進(jìn)行拼接,將拼接后的基因序列在NCBI的ORF finder進(jìn)行開(kāi)放閱讀框查詢,結(jié)合SmartBLAST分析,確認(rèn)UDP-GlcDH基因。
1.2.2靈芝UDP-GlcDH基因序列的驗(yàn)證 按照北京鼎國(guó)昌盛生物技術(shù)有限責(zé)任公司的Trigol試劑提取靈芝細(xì)胞的RNA,再用反轉(zhuǎn)錄劑盒將mRNA反轉(zhuǎn)錄成cDNA。以電子克隆所得的基因序列為模板,用 Primer 5.0軟件設(shè)計(jì)正向引物F:5′-ATGGCCCCCGTCAAGGTCTC-3′,反向引物R:5′-TCAAAGGCGGTCTCC ACGACCA-3′,預(yù)計(jì)產(chǎn)物大小為1 416 bp。以反轉(zhuǎn)錄的cDNA作為模板進(jìn)行PCR反應(yīng),PCR條件為:95℃預(yù)變性5 min,循環(huán)35次(95℃、30 s,55℃、30 s,72℃、90 s),最后72℃充分延伸10 min,4℃保存。用1.0%瓊脂糖凝膠電泳鑒定PCR產(chǎn)物,并將PCR產(chǎn)物交上海生工測(cè)序。
1.2.3生物信息學(xué)分析 利用生物信息學(xué)軟件對(duì)所得的UDP-GlcDH基因序列進(jìn)行分析,并對(duì)基因編碼的蛋白質(zhì)進(jìn)行理化性質(zhì)、親/疏水性、跨膜區(qū)結(jié)構(gòu)、信號(hào)肽、二級(jí)結(jié)構(gòu)、活性中心及底物結(jié)合位點(diǎn)等生物信息學(xué)的分析和預(yù)測(cè)[4],具體分析內(nèi)容和工具軟件見(jiàn)表1。
表1 預(yù)測(cè)基因結(jié)構(gòu)功能所用到的網(wǎng)站及軟件
經(jīng)過(guò)相似性搜索、拼接、驗(yàn)證、延伸等電子克隆過(guò)程,獲得1條全長(zhǎng)為1 591 bp的基因序列,ORF finder分析顯示,該序列從13~1 428 bp包含一個(gè)長(zhǎng)度為1 416 bp的完整的開(kāi)放閱讀框,該序列編碼471個(gè)氨基酸,起始密碼子和終止密碼子分別為ATG和TGA。電子克隆獲得的靈芝UDP-GlcDH基因序列及其編碼的氨基酸序列見(jiàn)圖1。
圖1 靈芝UDP-GlcDH基因cDNA序列及其編碼的氨基酸序列
提取靈芝mRNA,經(jīng)過(guò)RT-PCR驗(yàn)證,得到電泳圖,從圖2可知,電泳條帶與預(yù)計(jì)的1 416 bp相符。將PCR產(chǎn)物進(jìn)行測(cè)序,結(jié)果也與電子克隆得到的基因相序列符,確定所克隆的基因確實(shí)為靈芝UDP-GlcDH基因。
圖2 RT-PCR電泳結(jié)果
2.2.1靈芝UDP-GlcDH蛋白的保守結(jié)構(gòu)域預(yù)測(cè)與分析 利用NCBI中的conserved domain search 工具分析蛋白序列,結(jié)果見(jiàn)圖3,可以看出該蛋白的Specfic hits為UDPG_MGDP_dh_N、UDPG_MGDP_dh、UDPG_MGDP_dh_C,分別屬于F420_oxidored superfamily、UDPG_MGDP_dh和UDPG_MGDP_dh_C的超家族,是一個(gè)Multi domains蛋白,編號(hào)為PLN02353,是UDPglucose dehydrogenase。
圖3 蛋白質(zhì)的保守結(jié)構(gòu)域預(yù)測(cè)結(jié)果
從上述結(jié)果可以得出,電子克隆出的序列所編碼的蛋白確為UDP glucose dehydrogenase,說(shuō)明電子克隆的結(jié)果是準(zhǔn)確的。
2.2.2蛋白質(zhì)理化性質(zhì)預(yù)測(cè)與分析 利用Protparam軟件對(duì)蛋白質(zhì)的理化性質(zhì)進(jìn)行分析,得出該蛋白包含471個(gè)氨基酸,含有20種基本氨基酸,每種氨基酸的含量見(jiàn)表2。
表2 UDP-GlcDH蛋白的氨基酸含量
結(jié)果表明,該蛋白相對(duì)分子質(zhì)量為51 764.4 Da,等電點(diǎn)為6.29。該蛋白中含量較高的氨基酸是Ala(A)11.0%和Val(V)9.1%,含量較低的是His(H)1.1%和Met(M)1.3%。另外,該蛋白含有55個(gè)帶負(fù)電荷的殘留物(天冬氨酸+谷氨酸),含有53個(gè)帶正電荷的殘留物(精氨酸+賴氨酸),其分子表達(dá)式為C2317H3683N627O685S15。
該蛋白質(zhì)水溶液在280 nm處所有成對(duì)的半胱氨酸形成半胱氨酸吸光系數(shù)為59 400,吸光度為1.148,所有半胱氨酸藏殘留減少吸光系數(shù)58 900,吸光度為1.138。估計(jì)其半衰期在哺乳動(dòng)物體內(nèi)為30 h。不穩(wěn)定系數(shù)(II)為25.52,是穩(wěn)定蛋白。脂肪指數(shù)高達(dá)96.31,蛋白質(zhì)流動(dòng)性好,平均親水性為0.010,表明該蛋白總體上親水性和疏水性比較平衡。
2.2.3蛋白質(zhì)親/疏水性預(yù)測(cè)與分析 利用ProtScale在線分析蛋白質(zhì)親/疏水性,結(jié)果見(jiàn)圖4,可知波動(dòng)在0上下,說(shuō)明該蛋白質(zhì)蛋白總體上親水性和疏水性比較平衡。
圖4 親/疏水性分析結(jié)果
2.2.4蛋白質(zhì)信號(hào)肽預(yù)測(cè)和分析 采用SignalP 4.1 Server軟件預(yù)測(cè)靈芝UDP-GlcDH蛋白的信號(hào)肽,結(jié)果見(jiàn)圖5,根據(jù)馬爾可夫模型,由于C、S、Y峰值分別為0.166、0.157、0.288,均不達(dá)到0.5,沒(méi)有發(fā)現(xiàn)信號(hào)肽的存在,所以基本可以推測(cè)此蛋白不是分泌蛋白。
圖5 信號(hào)肽預(yù)測(cè)結(jié)果
2.2.5蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)與分析 利用PSORT軟件,對(duì)蛋白質(zhì)的亞細(xì)胞定位進(jìn)行預(yù)測(cè)與分析,結(jié)果見(jiàn)表3,該蛋白質(zhì)的亞細(xì)胞定位在內(nèi)質(zhì)網(wǎng)膜的概率最大。
表3 亞細(xì)胞定位預(yù)測(cè)結(jié)果
2.2.6蛋白質(zhì)跨膜區(qū)域結(jié)構(gòu)預(yù)測(cè)與分析 使用TMHMM在線預(yù)測(cè)工具對(duì)蛋白質(zhì)進(jìn)行跨膜分析,結(jié)果見(jiàn)圖6,在1.0處為細(xì)胞膜外分界線,0是細(xì)胞膜內(nèi),本試驗(yàn)的UD-PGlcDH蛋白在此范圍內(nèi)并無(wú)發(fā)現(xiàn)跨膜結(jié)構(gòu),其主要是胞內(nèi)活動(dòng),與細(xì)胞質(zhì)之外缺少關(guān)聯(lián),其結(jié)果表明靈芝UDP-GlcDH蛋白不存在跨膜區(qū)。
圖6 跨膜區(qū)域預(yù)測(cè)結(jié)果
2.2.7蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)與分析 使用GOR secondary structure prediction method version IV(GOR4)軟件對(duì)蛋白質(zhì)二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)與分析。
結(jié)果見(jiàn)圖7,可知其中無(wú)規(guī)則卷曲(random coil)的比例最高,為42.25%,其次是α螺旋(Alpha helix),占41.83%,而延伸鏈(extended strand)則只占15.92%。
注:豎線從長(zhǎng)到短依次為α螺旋、β折疊與轉(zhuǎn)角、隨機(jī)卷曲
2.2.8蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)與分析 采用SWISSMODEL 在線同源建模方法,對(duì)UDP-GlcDH蛋白進(jìn)行分析,預(yù)測(cè)其三級(jí)結(jié)構(gòu),并利用3D Molecule Viewer 軟件查看該三維立體分子結(jié)構(gòu)[5],見(jiàn)圖8,可知UDP-GlcDH蛋白的空間結(jié)構(gòu)主要由無(wú)規(guī)則卷曲和α螺旋構(gòu)成,延伸鏈數(shù)量比較少,這與二級(jí)結(jié)構(gòu)所預(yù)測(cè)的結(jié)果相一致。
圖8 靈芝UDP-GlcDH蛋白的空間構(gòu)象
2.2.9蛋白質(zhì)進(jìn)化樹(shù)分析 通過(guò)ORF finder數(shù)據(jù)庫(kù)BLAST出來(lái)的結(jié)果(圖9),選取同源性較高的15條序列,使用clustal X軟件和MEGA軟件進(jìn)行靈芝UDP-GlcDH蛋白與15種高等真菌的系統(tǒng)進(jìn)化樹(shù)分析,從圖9可知,本試驗(yàn)拼接的UDP-GlcDH基因是靈芝UDP-GlcDH基因的家族成員,與污叉絲孔菌和云芝等真菌中的UDP-GlcDH基因編碼的氨基酸序列高度同源。
圖9 靈芝UDP-GlcDH蛋白與16種真菌的系統(tǒng)進(jìn)化關(guān)系
與傳統(tǒng)基因克隆方法相比,電子克隆具有高效、快速、針對(duì)性強(qiáng)、技術(shù)要求低等[6-7]。本研究使用的探針為黃曲霉的UDP-GlcDH序列,與靈芝的同源性較高,并且靈芝的ESTs序列比較豐富,目前已報(bào)道靈芝ESTs數(shù)量達(dá)到48 334條,本試驗(yàn)采用電子克隆的可行性是很高的。
利用NCBI豐富的EST數(shù)據(jù)庫(kù)資源,以米黃霉的UDP-GlcDH蛋白質(zhì)序列為探針,經(jīng)BLAST相似性檢索和Bioedit軟件拼接得到靈芝UDP-GlcDH蛋白相應(yīng)的基因序列,通過(guò)RT-PCR試驗(yàn)進(jìn)行驗(yàn)證,其確實(shí)是靈芝的UDP-GlcDH序列。該cDNA序列長(zhǎng)度為1 591 bp,其中包含能編碼471個(gè)氨基酸的序列,分子量為51.8 kD,PI為6.29,存在于內(nèi)質(zhì)網(wǎng)膜中,不屬于分泌蛋白,不存在跨膜區(qū)域,UDP-GlcDH蛋白的二級(jí)結(jié)構(gòu)主要以無(wú)規(guī)則卷曲和α螺旋構(gòu)成。系統(tǒng)進(jìn)化樹(shù)分析可知,靈芝UDP-GlcDH基因的家族成員,與污叉絲孔菌和云芝等真菌中的UDP-GlcDH基因編碼的氨基酸序列高度同源,可見(jiàn)其在進(jìn)化上相對(duì)比較保守,可能與該蛋白家族的功能有密切關(guān)系。本研究成功克隆了靈芝多糖合成途徑中關(guān)鍵酶之一的UDP-GlcDH基因序列,這為今后繼續(xù)研究靈芝多糖合成奠定了良好的基礎(chǔ)。