戴世鯤,何 慧,李 濤,吳華蓮,向文洲,曾海心
(中國(guó)科學(xué)院南海海洋研究所/中國(guó)科學(xué)院熱帶海洋生物資源與生態(tài)重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510301)
螺旋藻基因組中糖苷酶類(lèi)基因的序列分析
戴世鯤,何 慧,李 濤,吳華蓮,向文洲,曾海心
(中國(guó)科學(xué)院南海海洋研究所/中國(guó)科學(xué)院熱帶海洋生物資源與生態(tài)重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510301)
在NCBI基因組數(shù)據(jù)庫(kù)中可檢索到3個(gè)鈍頂螺旋藻藻株、1個(gè)極大螺旋藻藻株、1個(gè)鹽澤螺旋藻藻株和1個(gè)螺旋藻屬未定種的藻株基因組序列。6個(gè)螺旋藻基因組序列來(lái)源的糖苷酶基因共計(jì)32個(gè),編碼蛋白含260~1 084個(gè)氨基酸,BLAST序列比對(duì)顯示,與非螺旋藻種屬來(lái)源的已知序列的相似性在49%~84%之間。系統(tǒng)進(jìn)化分析表明,32個(gè)糖苷酶基因聚類(lèi)成8個(gè)簇,另有3個(gè)基因分別單獨(dú)構(gòu)成進(jìn)化分支。酶學(xué)功能預(yù)測(cè)顯示,這些糖苷酶基因分別屬于8個(gè)糖苷酶家族(GH3、GH9、GH13、GH23、GH25、GH38、GH57、GH104),具有8種糖苷酶催化活性(纖維素酶、溶菌酶、α-甘露糖苷酶、α-淀粉酶、普魯蘭酶、1,4-α-葡聚糖分支酶、肽聚糖結(jié)合功能、β-葡萄糖苷酶)。
螺旋藻;基因組;糖苷酶
螺旋藻(Spirulina)是一種多細(xì)胞絲狀微藻,是微藻產(chǎn)業(yè)的重要藻種,具有極高的開(kāi)發(fā)價(jià)值。螺旋藻屬于藍(lán)藻門(mén)(Cyanophyta)、段殖藻目(Hormogonales)、顫藻科(Oscillatoriaceae)、螺旋藻屬(Spirulina)。螺旋藻現(xiàn)已改名為節(jié)旋藻(Arthrospira),但由于螺旋藻這一名稱(chēng)一直被廣泛使用,因而這兩種名稱(chēng)被同時(shí)使用。目前,用于工業(yè)化生產(chǎn)的螺旋藻主要有鈍頂螺旋藻(S.platensis)和極大螺旋藻(S.maxima)[1]。
研究發(fā)現(xiàn),螺旋藻含有60%~71%的蛋白質(zhì)以及其他豐富而獨(dú)特的生物活性物質(zhì),如γ-亞麻酸、藻藍(lán)蛋白、β-胡蘿卜素、肌醇、螺旋藻多糖、維生素B12和大量礦質(zhì)元素等,是一種國(guó)際公認(rèn)的超級(jí)營(yíng)養(yǎng)食品[1]。
多糖一般由10個(gè)以上的單糖聚合成,單糖以醛糖或酮糖的形式通過(guò)糖苷鍵線(xiàn)性或分枝連接,分為同多糖和雜多糖。螺旋藻多糖是一類(lèi)重要的天然生物活性物質(zhì),是從螺旋藻藻體中提取分離出來(lái)的水溶性生物大分子,螺旋藻多糖占藻體2%~3%,具有免疫調(diào)節(jié)、抗腫瘤、抗輻射、抗衰老、抗病毒等多種生物學(xué)功能,是目前國(guó)內(nèi)外海洋藥物研究的熱點(diǎn)之一[2]。螺旋藻多糖屬于酸性雜多糖,組成結(jié)構(gòu)復(fù)雜。一般認(rèn)為,一部分多糖與蛋白質(zhì)結(jié)合形成糖蛋白,多糖鏈有支鏈結(jié)構(gòu),單糖之間多數(shù)以α-糖苷鍵相連,也有發(fā)現(xiàn)存在β-糖苷鍵,其多糖鏈由巖藻糖、L-鼠李糖、D-半乳糖、D-木糖、D-甘露糖、D-葡萄糖以及葡萄糖醛酸等分子組成[3-5]。
目前對(duì)螺旋藻多糖的研究包括其生物學(xué)活性評(píng)價(jià)、多糖的提取工藝和多糖的結(jié)構(gòu)組成等,但是對(duì)于螺旋藻多糖的生物學(xué)代謝過(guò)程及其相關(guān)酶類(lèi)的酶學(xué)機(jī)制缺乏研究。
糖苷酶是多糖生物學(xué)代謝過(guò)程中的重要組成酶類(lèi)。糖苷酶(Glycosidase)又稱(chēng)為糖基水解酶(Glycoside hydrolase),具有催化糖苷鍵水解的活性,不需要任何輔酶或輔助因子,在國(guó)際酶學(xué)命名中歸位序號(hào)為EC3.2.1,根據(jù)氨基酸序列的進(jìn)化關(guān)系,分為133個(gè)家族[6]。
本研究對(duì)NCBI基因組數(shù)據(jù)庫(kù)中的6個(gè)不同螺旋藻基因組中的糖苷酶基因序列進(jìn)行生物信息學(xué)檢索和分析,為進(jìn)一步對(duì)這些糖苷酶酶學(xué)性質(zhì)及其螺旋藻多糖的生物代謝過(guò)程和基因工程研究提供一定理論依據(jù)。
1.1 試驗(yàn)材料
在NCBI(http:// www.ncbi.nlm.nih.gov/)基因組數(shù)據(jù)庫(kù)中可檢索到6個(gè)不同的螺旋藻基因組序列,分別是Arthrospira platensis NIES-39、Arthrospira platensis C1、Arthrospira platensis str.Paraca、Arthrospira maxima CS-328、Arthrospira sp.PCC 8005、Spirulina subsalsa PCC 9445。根據(jù)這些基因組序列的基因注釋信息可檢索到27個(gè)序列不同的糖苷酶基因,在NCBI數(shù)據(jù)庫(kù)中的編號(hào)分別是WP_006621369、WP_006670090、Y P_0 0 5 0 6 8 5 7 3、W P_0 3 5 7 3 6 8 5 5、W P_0 0 6 6 1 6 9 3 8、W P_0 0 8 0 5 7 1 2 6、W P_0 0 6 6 2 1 4 7 0、W P_0 0 6 6 1 7 8 6 1、W P_0 0 6 6 2 5 7 8 4、W P_0 0 6 6 6 9 1 4 0、W P_0 3 3 3 7 4 2 5 8、W P_0 3 3 3 7 5 4 2 5、W P_0 0 6 6 2 5 8 1 0、W P_0 0 8 0 5 2 4 4 2、W P_0 0 6 6 1 9 7 7 5、W P_0 1 7 3 0 5 6 3 2、W P_0 0 6 6 1 7 7 2 8、W P_0 0 6 6 2 2 8 3 9、WP_006668919、YP_005069303、YP_005071301、EKD07789.1、YP_005066672、WP_014274076、YP_005068490、EKD10749.1、WP_008057264。
1.2 試驗(yàn)方法
在NCBI網(wǎng)站中使用Protein BLAST工具在GenBank的NR數(shù)據(jù)庫(kù)中對(duì)27個(gè)糖苷酶氨基酸序列進(jìn)行同源性比對(duì),驗(yàn)證基因注釋信息的正確性。并將這些氨基酸序列提交到糖苷酶類(lèi)研究的相關(guān)網(wǎng)站dbCAN(http://csbl.bmb.uga.edu/dbCAN/annotate.php)和CAZymes Analysis Toolkit(http://cricket.ornl.gov/cgi-bin/cat.cgi)中,進(jìn)行檢索和比對(duì),推測(cè)糖苷酶的家族和酶學(xué)功能[7-8]。使用Clustal X軟件對(duì)糖苷酶基因的氨基酸序列進(jìn)行多序列比對(duì)。由MEGA軟件根據(jù)鄰位相連法(NeighborJointing method,NJ)構(gòu)建系統(tǒng)進(jìn)化樹(shù),用Bootstrap進(jìn)行檢驗(yàn),重復(fù)次數(shù)為1 000次,分析其可靠性[9]。
2.1 螺旋藻基因組序列概況
目前在NCBI基因組數(shù)據(jù)庫(kù)中可檢索到3個(gè)鈍頂螺旋藻藻株(Arthrospira platensis NIES-39、Arthrospira platensis C1、Arthrospira platensis str.Paraca)、1個(gè)極大螺旋藻藻株(Arthrospira maxima CS-328)和另外2個(gè)螺旋藻種屬(Arthrospira sp.PCC 8005、Spirulina subsalsa PCC 9445鹽澤螺旋藻)的基因組序列(表1)。典型的螺旋藻基因組大小為5.0~6.7 Mb,平均GC含量為44.3%~44.8%,基因組中被注釋的基因數(shù)有4 515~6 094個(gè)[10-13]。2個(gè)鈍頂螺旋藻藻株A.platensis NIES-39和A.platensis C1已經(jīng)得到整個(gè)基因組圖譜。
表1 NCBI數(shù)據(jù)庫(kù)中螺旋藻基因組序列的基本信息
2.2 螺旋藻基因組中糖苷酶基因的多樣性
來(lái)源于上述6個(gè)螺旋藻基因組序列的糖苷酶基因共計(jì)32個(gè),其中來(lái)自A.platensis NIES-39有5個(gè),來(lái)自A.platensis C1有7個(gè),來(lái)自A.platensis str.Paraca有6個(gè),來(lái)自A.maxima CS-328有5個(gè),來(lái)自Arthrospira sp.PCC 8005有6個(gè),來(lái)自Spirulina subsalsa PCC 9445有3個(gè)。其中來(lái)源于A.platensis C1的3條基因的氨基酸序列與來(lái)源于Arthrospira sp.PCC 8005的3條序列兩兩完全一致,分別是WP_006621369、WP_006625784、WP_006622839;A.platensis C1的另外2條基因與來(lái)源于A.maxima CS-328的2條序列兩兩完全一致,分別是WP_006621470、WP_006625810。因此,32條糖苷酶基因中具有不同氨基酸序列的有27條。
圖1 6個(gè)螺旋藻基因組中糖苷酶基因的系統(tǒng)進(jìn)化樹(shù)
糖苷酶基因系統(tǒng)進(jìn)化樹(shù)(圖1)中代表序列(表2)的比對(duì)分析結(jié)果表明,這些糖苷酶基因編碼蛋白含260~1 084個(gè)氨基酸,與非螺旋藻種屬來(lái)源的已知序列的相似性為49%~84%,既具有較高的同源性,也存在很大的差異,其酶學(xué)性質(zhì)均未得到充分闡明。序列比對(duì)中同源性最高的非螺旋藻種屬序列均來(lái)自藍(lán)藻門(mén)(表2),分別為L(zhǎng)yngbya(鞘絲藻屬)、Oscillatoria(顫藻屬)、Crinalium(發(fā)毛針藻屬)、Filamentous cyanobacterium(絲狀藍(lán)藻)、Tolypothrix(單歧藻屬)、Planktothrix(浮游藍(lán)絲藻屬)。
表2 糖苷酶基因系統(tǒng)進(jìn)化樹(shù)中代表序列的比對(duì)分析
系統(tǒng)進(jìn)化分析結(jié)果(圖1)表明,32個(gè)糖苷酶基因聚類(lèi)成8個(gè)簇,另有Arthrospira platensis NIES-39的1條基因和Spirulina subsalsa PCC9445的2條基因分別單獨(dú)構(gòu)成1個(gè)進(jìn)化分支。同一進(jìn)化簇中的基因同源性很高,但是8個(gè)簇和3個(gè)單獨(dú)分支之間的同源性很低,同一簇中均為來(lái)自不同藻株的基因。進(jìn)化簇與非螺旋藻種屬來(lái)源的已知序列相似性高于70%的只有簇Ⅴ和簇Ⅷ,其他6個(gè)簇和3個(gè)單獨(dú)分支的序列相似性均低于70%。
2.3 螺旋藻基因組中糖苷酶基因的功能預(yù)測(cè)
選取8個(gè)進(jìn)化簇的代表序列和3個(gè)單獨(dú)分支序列在GenBank的NR數(shù)據(jù)庫(kù)中進(jìn)行氨基酸序列比對(duì)分析,對(duì)酶蛋白保守的結(jié)構(gòu)功能域進(jìn)行分析,并將序列提交至糖苷酶類(lèi)的分析網(wǎng)站dbCAN和CAZymes Analysis Toolkit,對(duì)糖苷酶的酶學(xué)功能進(jìn)行預(yù)測(cè),結(jié)果(表2)表明,這些糖苷酶基因分別歸屬于GH3、GH9、GH13、GH23、GH25、GH38、GH57、GH104等8個(gè)糖苷酶家族,具有的酶催化活性包括纖維素酶、溶菌酶、α-甘露糖苷酶、α-淀粉酶、普魯蘭酶、1,4-α-葡聚糖分支酶、肽聚糖結(jié)合功能、β-葡萄糖苷酶。
將屬于GH3家族的簇Ⅶ和Ⅷ的5條序列進(jìn)行同源性比對(duì)分析,在2個(gè)簇內(nèi)部分別具有非常高的同源性,同時(shí)2個(gè)簇之間在53個(gè)氨基酸位點(diǎn)具有保守性(圖2),這與2個(gè)簇屬于同一個(gè)糖苷酶家族但具有2種不同的酶活性的預(yù)測(cè)結(jié)果一致。而屬于GH57家族的7條序列具有3種不同的糖苷酶活性,序列比對(duì)分析顯示,7條序列僅存在18個(gè)保守位點(diǎn),同時(shí)S.subsalsa PCC9445來(lái)源的2條單獨(dú)分支的序列之間同源性很低(圖3)。
圖2 GH3家族糖苷酶基因的氨基酸序列比對(duì)
圖3 GH57家族糖苷酶基因的氨基酸序列比對(duì)
在NCBI基因組數(shù)據(jù)庫(kù)中可檢索到6個(gè)螺旋藻基因組序列,包含糖苷酶基因32個(gè),其中具有不同氨基酸序列的有27條。系統(tǒng)進(jìn)化分析顯示,32個(gè)糖苷酶基因聚類(lèi)成8個(gè)簇和3個(gè)單獨(dú)的進(jìn)化分支。對(duì)這些糖苷酶基因的酶學(xué)功能進(jìn)行預(yù)測(cè),結(jié)果顯示分別屬于8個(gè)糖苷酶家族,具有8種糖苷酶催化活性。6個(gè)螺旋藻藻株中的4個(gè)藻株(A.platensis C1、A.platensis str.Paraca、A.maxima CS-328、Arthrospira sp.PCC 8005)的5個(gè)糖苷酶基因共同歸于進(jìn)化簇Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ,顯示這4個(gè)藻株的糖苷酶基因具有很高的同源性。而A.platensis NIES-39藻株的5個(gè)糖苷酶基因則有明顯差異,分別歸于簇Ⅰ、Ⅵ、Ⅶ、Ⅷ和1個(gè)單獨(dú)的進(jìn)化分支。Spirulina subsalsa PCC 9445藻株(鹽澤螺旋藻)的3個(gè)糖苷酶基因尤為特殊,均屬于GH57家族,其中2條序列為單獨(dú)的進(jìn)化分支,另一條序列在簇Ⅴ中與其他4條序列的進(jìn)化關(guān)系也比較遠(yuǎn)。
糖苷酶在生物體的糖和糖綴合物的水解與合成過(guò)程中具有重要作用,對(duì)其性質(zhì)和功能的研究一直是生物學(xué)和糖生物學(xué)研究的熱點(diǎn)。螺旋藻多糖組成結(jié)構(gòu)復(fù)雜,由于多糖類(lèi)物質(zhì)分離純化困難,以及各種分離檢測(cè)方法等存在一定差異,導(dǎo)致可能得出不同的結(jié)果,因此僅通過(guò)螺旋藻多糖準(zhǔn)確的一級(jí)結(jié)構(gòu)推測(cè)多糖的生物合成過(guò)程具有很大難度。利用螺旋藻基因組信息,從多糖合成相關(guān)酶類(lèi)基因的角度,通過(guò)對(duì)螺旋藻糖苷酶酶學(xué)催化機(jī)制的闡明,可為螺旋藻多糖生物學(xué)合成過(guò)程的研究及其基因工程提供有力支撐。
糖苷酶具有很高的應(yīng)用價(jià)值,可用于酶法制備功能性低聚糖。低聚糖又稱(chēng)寡糖(Oligosaccharide),由2~10個(gè)單糖聚合成。功能性低聚糖有利于人體腸道中的雙歧桿菌等有益菌群,調(diào)節(jié)腸道微生態(tài)系統(tǒng),從而促進(jìn)健康。此外,還具有非致齲齒性和良好的口感等特點(diǎn),因此被用作功能性食品添加劑[14]。目前,利用糖苷酶水解天然多糖或利用糖苷酶酶法合成是功能性低聚糖生產(chǎn)的重要方式[15]。32條螺旋藻糖苷酶基因中有24條序列與非螺旋藻種屬來(lái)源的已知序列的相似性均低于70%,這些酶基因必然具有未知的、不同的酶學(xué)性質(zhì)和催化活性。通過(guò)深入研究這些螺旋藻糖苷酶,能夠?yàn)槁菪瀹a(chǎn)業(yè)多元化發(fā)展提供一定的應(yīng)用基礎(chǔ)。
[1] 向文洲,李濤,吳華蓮,等.我國(guó)大力發(fā)展海水螺旋藻(節(jié)旋藻)產(chǎn)業(yè)的戰(zhàn)略思考[J].廣西科學(xué),2014,21(6):1-7.
[2] 崔葉潔,胡濱.螺旋藻多糖的生理功能及其修飾改性研究[J].食品工業(yè)科技,2010,31(4):405-407.
[3] 孫鵬,胡君艷,李瑞強(qiáng).螺旋藻多糖的結(jié)構(gòu)及生物學(xué)活性研究[J].中國(guó)生化藥物雜志,2005,26(3):185-187.
[4] 涂芳,楊芳,鄭文杰.螺旋藻多糖的研究進(jìn)展[J].天然產(chǎn)物研究與開(kāi)發(fā),2005,17(1):115-118.
[5] 張芳,王旻,尹洪萍.螺旋藻多糖的性質(zhì)結(jié)構(gòu)研究[J].藥物生物技術(shù),2004,11(6):389-391.
[6] Vuong T V,Wilson D B.Glycoside hydrolases:catalytic base/nucleophile diversity[J].Biotechnol Bioeng,2010,107(2):195-205.
[7] Yin Y,Mao X,Yang J C,et al.dbCAN:a web resource for automated carbohydrate-active enzyme annotation[J].Nucleic Acids Res,2012,40:W445-W451.
[8] Park B H,Karpinets T V,Syed M H,et al.CAZymes Analysis Toolkit(CAT):web service for searching and analyzing carbohydrate-active enzymes in a newly sequenced organism using CAZy database[J].Glycobiology,2010,20(12):1574-1584.
[9] Tamura K 1,Peterson D,Peterson N,et al.MEGA5:molecular evolutionary genetics analysis using maximum likelihood,evolutionarydistance,and maximum parsimony methods[J].Molecular Biology and Evolution,2011,28:2731-2739.
[10] Cheevadhanarak S,Paithoonrangsarid K,Prommeenate P,et al.Draft genome sequence of Arthrospira platensis C1(PCC9438)[J].Stand Genomic Sci,2012,6(1):43-53.
[11] Janssen P J,Morin N,Mergeay M,et al.Genome sequence of the edible cyanobacterium Arthrospira sp.PCC 8005[J].J Bacteriol,2010,192(9):2465-2466.
[12] Fujisawa T,Narikawa R,Okamoto S,et al.Genomic structure of an economically important cyanobacterium,Arthrospira(Spirulina)platensis NIES-39[J].DNA Res,2010,17(2):85-103.
[13] Lefort F,Calmin G,Crovadore J,et al.Whole-Genome Shotgun Sequence of Arthrospira platensis Strain Paraca,a Cultivated and Edible Cyanobacterium[J].Genome Announc,2014,2(4).pii:e00751-14.
[14] 張雪云.功能性低聚糖制備研究進(jìn)展[J].糧食與油脂,2012(10):45-48.
[15] Honda Y,F(xiàn)ushinobu S,Hidaka M,et al.Alternative strategy for converting an inverting glycoside hydrolase into a glycosynthase[J].Glycobiology,2008,18(4):325-30.
(責(zé)任編輯 崔建勛)
Sequence analysis of glycosidase genes in Spirulina (Arthrospira) genome
DAI Shi-kun,HE Hui,LI Tao,WU Hua-lian,XIANG Wen-zhou,ZENG Hai-xin
(South China Sea Institute of Oceanology,Chinese Academy of Sciences/ Key Laboratory of Tropical Marine Bio-resources and Ecology,Guangzhou 510301,China)
There are genome sequences of three Arthrospira platensis strains,an Arthrospira maxima strain,a Spirulina subsalsa strain,an Arthrospira sp.strain in the NCBI genome database up to date.32 glycosidase genes can be retrieved from the 6 Spirulina genome sequences,which have 260-1 084 amino acids in length.By BLAST analysis in GenBank,the similarity with the known sequences from the non-Spirulina species was 49%-84%.Phylogenetic analysis indicated that the 32 glucosidase genes were divided into 8 groups,and the other 3 genes constituted an independent evolutionary branch,respectively.The enzyme function prediction of these glucosidase genes showed that they belonged to 8 glucosidase families: GH3,GH9,GH13,GH23,GH25,GH38,GH57,GH104,and 8 kinds of glycosidase catalytic activity: cellulase,lysozyme,α-mannosidase,α-amylase,pullulanase,1,4-α-glycogen branching enzyme,peptidoglycan binding function,β-glucosidase.
Spirulina; genome; glycosidase
Q754
A
1004-874X(2016)12-0115-07
10.16768/j.issn.1004-874X.2016.12.020
2016-08-11
海南省科技興海專(zhuān)項(xiàng)(2015XH04);廣東省海洋漁業(yè)科技與產(chǎn)業(yè)發(fā)展專(zhuān)項(xiàng)(A201501C09)
戴世鯤(1977-),男,博士,助理研究員,E-mail:deepseabio@163.com
戴世鯤,何慧,李濤,等.螺旋藻基因組中糖苷酶類(lèi)基因的序列分析[J].廣東農(nóng)業(yè)科學(xué),2016,43(11):115-121.