夏雄飛,陳云芳,覃 悅,韓長志,3
(1.西南林業(yè)大學(xué) 生物多樣性保護(hù)學(xué)院,云南 昆明 650224;2.中華人民共和國蘇州海關(guān),江蘇 蘇州 215000;3.云南省森林災(zāi)害預(yù)警與控制重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650224)
分泌蛋白、碳水化合物活性酶(CAZymes)和次生代謝產(chǎn)物等致病因子顯著影響真菌、細(xì)菌和卵菌等諸多植物病原物對植物的侵入、定殖和擴(kuò)展等過程[1-3],其中,分泌蛋白在病原菌種間競爭和侵染寄主植物的過程中起重要作用。近年來,基于全基因組序列相關(guān)數(shù)據(jù)的公布,前人開展了植物病原物中有關(guān)分泌蛋白的諸多研究工作[4],明確了葡萄座腔菌(Botryosphaeria dothidea)[5]、香蕉枯萎病菌(Fusarium oxysporum)[6]、核盤菌(Sclerotinia sclerotiorum)[7]、梨火疫病菌(Erwinia amylovora)[8]、可可毛色二孢(Lasiodiplodia theobromae)[9]、尖孢鐮刀菌(Fusarium oxysporumf)[10]、柑橘黃龍病菌(Citrus Huanglongbing)[11]、甘薯長喙殼(Ceratocystis fimbriata)[12]、小麥葉銹菌(Puccinia triticina)[13]、黃單胞菌(Xanthomonas campestris)[14]和細(xì)菌性黑斑病菌(Xanthomonas arboricola)[15]等植物病原菌中的分泌蛋白情況。CAZymes 主要包括碳水化合物酯酶、糖苷水解酶、糖基轉(zhuǎn)移酶、多糖裂解酶和碳水化合物結(jié)合模塊等類別,對目標(biāo)細(xì)胞壁的降解具有重要意義。陳相永等[16]通過對不同營養(yǎng)型植物病原真菌的分泌蛋白及CAZymes 進(jìn)行預(yù)測比對,明確活體、半活體和死體營養(yǎng)型真菌的潛在分泌蛋白數(shù)量有差異性,且非專性寄生真菌的CAZymes 數(shù)量和分泌蛋白占比顯著高于專性寄生真菌。然而,目前尚未見有關(guān)不同類型植物病原物在實(shí)現(xiàn)其侵染植物過程中分泌蛋白及CAZymes 的對比研究。為明確不同類型植物病原物分泌蛋白及CAZymes 分布情況,本研究選擇隸屬于真菌、細(xì)菌和卵菌的23種具有全基因組序列的病原物作為研究對象,根據(jù)分泌蛋白信號肽、亞細(xì)胞定位和跨膜結(jié)構(gòu)域等典型特征,利用多種分析工具明確不同類型病原物中的分泌蛋白數(shù)量差異性,并基于CAZymes數(shù)據(jù)庫對已篩選的分泌蛋白進(jìn)行比對。研究結(jié)果對于解析不同營養(yǎng)型病原物的入侵作用機(jī)制具有重要的指導(dǎo)意義,以期為深入解析不同類型植物病原物中CAZymes 的致病機(jī)制和相關(guān)驗(yàn)證試驗(yàn)等研究奠定理論基礎(chǔ)。
利用NCBI (美國國立衛(wèi)生院數(shù)據(jù)庫)搜索并下載真菌、細(xì)菌和卵菌的23 種植物病原物蛋白序列共290 884 個(gè)。經(jīng)統(tǒng)計(jì),這些病原物所含蛋白數(shù)量范圍為2 169~26 824 個(gè),平均含有11 635個(gè)蛋白,其中,卵菌平均含有蛋白最多(16 529個(gè)),細(xì)菌平均含有蛋白最少(4 994 個(gè)),真菌平均含有蛋白13 063 個(gè)(表1)。
表1 不同類型植物病原物的基本信息Tab.1 Basic information of different types of plant pathogens
根據(jù)分泌蛋白的基本特征[4],利用SignalPv5.0[17]、ProtComp v9.0[18]和TMHMM v2.0[19]分 別對23 種植物病原物進(jìn)行蛋白信號肽、亞細(xì)胞定位和跨膜結(jié)構(gòu)域預(yù)測分析,排除不具有分泌蛋白特征的蛋白,再通過big-PI predictor 排除具有糖基磷脂酰肌醇 (gly-cosylphosphatidylinositol,GPI)的錨定蛋白[20],最終獲取23 種植物病原物的分泌蛋白。
利用在線工具dbCAN[21]中的HMMER、DIAMOND 和Hotpep 數(shù)據(jù)庫,按照CAZymes 蛋白序列之間同源比對的標(biāo)準(zhǔn),分別對前期獲取的分泌蛋白進(jìn)行CAZymes 預(yù)測。
利用Microsoft Excel 2010 統(tǒng)計(jì)和分析分泌蛋白及CAZymes 基本情況,并采用Origin 2021 軟件制圖。
由圖1 可知:真菌、細(xì)菌和卵菌中含有信號肽的蛋白數(shù)量為337~2 374 個(gè),占比為5.20%~17.10%,平均為1 135 個(gè),平均占比9.87%。其中,真菌、細(xì)菌和卵菌含有的信號肽蛋白數(shù)量分別為337~1 739、400~870 和589~2 374 個(gè),平均分別為1 119、636 和1 429 個(gè),占比分別為5.20%~13.39%、10.62%~17.10%和7.59%~10.80%,平均占比分別為9.70%、13.17%和8.22%。
圖1 不同類型植物病原物中的信號肽Fig.1 Signal peptides in different types of plant pathogens
由圖2 可知:在已篩選具有信號肽的蛋白中,真菌、細(xì)菌和卵菌所具有的胞外蛋白數(shù)量分別為75~537、106~232 和130~816 個(gè),分別占總蛋白數(shù)的0.85%~4.13%、2.08%~4.00%和1.07%~3.10%,平均占比分別為2.38%、3.03%和2.07%。
圖2 不同類型植物病原物中的胞外蛋白Fig.2 Extracellular proteins in different types of plant pathogens
由圖3 可知:在已篩選的具有信號肽的胞外蛋白中,除隱襲腐霉(P.insidiosum)、致病疫霉(P.infestans)、煙草疫霉(P.parasitica)、大豆疫霉(P.sojae)及萵苣盤霜霉(B.lactucea)具有68、15、9、8 和7 個(gè)跨膜結(jié)構(gòu)域的蛋白外,其余菌株蛋白僅有少量跨膜結(jié)構(gòu)域在不具有跨膜結(jié)構(gòu)域的胞外蛋白中,僅有解淀粉歐文氏菌(E.amylovora)、黃單胞菌(X.campestris)和隱襲腐霉(P.insidiosum)不具有GPI 錨定蛋白,其余病原物均具有0.94%~11.57%的GPI 錨定蛋白。
圖3 不同類型植物病原物中具有跨膜結(jié)構(gòu)域的蛋白和GPI 錨定蛋白Fig.3 Transmembrane domains and GPI-anchored proteins in different types of plant pathogens
由圖4 可知:篩選獲取分泌蛋白共計(jì)6 194個(gè),其中真菌、細(xì)菌和卵菌分別有分泌蛋白71~510、105~227 和119~768 個(gè),分別占總蛋白數(shù)量的0.74%~3.93%、2.05%~3.91%和0.96%~2.90%。
圖4 不同類型植物病原物的分泌蛋白Fig.4 Secretory proteins in different types of plant pathogens
HMMER 數(shù)據(jù)庫對不同植物病原物中的CAZymes 預(yù)測結(jié)果顯示:23 種病原物中共有433 個(gè)CAZymes,大豆疫霉(P.sojae)菌株具有的CAZymes 數(shù)量最多(55 個(gè)),其次分別為串珠鐮孢(F.fujikuroi)、稻瘟菌(P.oryzae)和煙草疫霉(P.parasitica),分別為47、46 和45 個(gè),而白銹菌(A.candida)僅具有1 個(gè)(圖5 a)。進(jìn)一步分析發(fā)現(xiàn):上述菌株具有的CAZymes 共計(jì)99 個(gè)種類(圖5b,未完全顯示),除解淀粉歐文氏菌(E.amylovora)、熒光假單胞菌(P.fluorescens)、黃單胞菌(X.campestris)、發(fā)根農(nóng)桿菌(A.rhizogenes)、隱襲腐霉(P.insidiosum)和白銹菌(A.candida)僅具有1~3 種CAZymes 外,其他菌株均具有5 種以上,其中PL3_2 的數(shù)量最多(52 個(gè)),其次為AA9、GH17 和GH6 等。此外,真菌、細(xì)菌和卵菌的CAZymes 數(shù)量分別為238、15 和214 個(gè),分屬于68、14 和36 種。
圖5 不同類型植物病原物中的CAZymes (HMMER 數(shù)據(jù)庫)Fig.5 CAZymes in different types of plant pathogens (HMMER database)
DIAMOND 對CAZymes 的查詢結(jié)果顯示:23 種不同植物病原物含有311 個(gè)CAZymes,尤以串珠鐮孢(F.fujikuroi)具有的數(shù)量最多(54 個(gè)),其次為稻瘟菌(P.oryzae)、大豆疫霉(P.sojae)和禾谷鐮刀菌(F.graminearum),分別為49、42 和40 個(gè),而白銹菌(A.candida)、黃單胞菌(X.campestris)、隱襲腐霉(P.insidiosum)不具有CAZymes。進(jìn)一步分析發(fā)現(xiàn):上述菌株具有的CAZymes 共計(jì)93 個(gè)種類,其中CBM1 的數(shù)量最多(31個(gè)),其次為PL3_2、AA9 和GH28 等。真菌、細(xì)菌和卵菌的CAZymes 數(shù)量分別為204、10 和97個(gè),分屬于76、8 和24 種。Hotpep 對CAZymes 的短保守基序查詢結(jié)果顯示:23 種不同植物病原物含有332 個(gè)CAZymes,其中大豆疫霉(P.sojae)具有的CAZymes 短保守基序的蛋白數(shù)量最多(49 個(gè)),其次為串珠鐮孢(F.fujikuroi)和稻瘟菌(P.oryzae),均為40 個(gè),而白銹菌(A.candida)不具有CAZymes 短保守基序。進(jìn)一步分析發(fā)現(xiàn):上述菌株具有的CAZymes 短保守基序共計(jì)85 個(gè)種類,其中CBM1 的數(shù)量最多(72 個(gè)),其次為PL3、CBM13、AA9 和GH28 等。真菌、細(xì)菌和卵菌的CAZymes 數(shù)量分別為 164、17 和104 個(gè),分屬于62、14 和35 種。
綜合HMMER、DIAMOND 和Hotpep 對CAZymes 的預(yù)測可知:23 種不同植物病原物中共含有489 個(gè)CAZymes。其中,大豆疫霉(P.sojae)、串珠鐮孢(F.fujikuroi)和稻瘟菌(P.oryzae)具有的CAZymes 數(shù)量較多,分別為58、54、50 個(gè);稻瘟菌(P.oryzae)、禾谷鐮刀菌(F.graminearum)和串珠鐮孢(F.fujikuroi)的CAZymes 占總蛋白數(shù)量比例較高,分別為0.38%、0.32%和0.36%;而白銹菌(A.candida)、解淀粉歐文氏菌(E.amylovora)和根癌土壤桿菌(A.tumefacines)僅有1~3 個(gè)CAZymes。由圖6 可知:真菌、細(xì)菌和卵菌的CAZymes 數(shù)量分別為7~54、2~5 和5~58 個(gè),平均數(shù)量分別為26、4 和26 個(gè)??梢?,真菌和卵菌所具有的CAZymes 數(shù)量與種類均多于細(xì)菌,推測上述差異與病原物致病能力和寄生類型之間的差異有關(guān)。
圖6 不同類型植物病原物中的CAZymesFig.6 CAZymes in different types of plant pathogens
在當(dāng)前的植物病原菌相關(guān)研究中,分泌蛋白和CAZymes 等還有許多亟待研究的重點(diǎn)和難點(diǎn)[4]。隨著植物病原菌全基因組序列的釋放以及生物信息學(xué)分析方法的應(yīng)用,已經(jīng)對尖孢鐮刀菌[10]、黃單胞菌[22]、柑橘黃龍病菌[23]、枯草芽孢桿菌[24]和細(xì)菌性黑斑病菌[15]等進(jìn)行了大量的分泌蛋白預(yù)測和生物信息學(xué)分析,為病原菌致病基因的進(jìn)一步研究夯實(shí)了理論基礎(chǔ)。前人研究表明:不同植物的不同類型病原菌所含的分泌蛋白數(shù)量和占比不盡相同[20]。其中,不同真菌中分泌蛋白占總蛋白的3.65%~9.58%,CAZymes 的數(shù)量為64~438 個(gè),且不同活體營養(yǎng)型病菌之間存在著一定差異[16,25];不同細(xì)菌中分泌蛋白約占總蛋白的5.05%~5.41%[15];不同卵菌中分泌蛋白約占總蛋白的2.96%~4.01%[16]。上述研究結(jié)果與本研究結(jié)果有一定差異,推測原因在于分泌蛋白篩選的方法不同,因此,有待于進(jìn)一步深化對比分析差異蛋白的數(shù)量和種類。此外,本研究明確了不同類型植物病原物中分泌蛋白和CAZymes 的數(shù)量及種類差異,尚未明確分泌蛋白表達(dá)量差異以及冗余性問題,均有待于后續(xù)進(jìn)一步開展科學(xué)研究驗(yàn)證。
一般而言,植物病原物在與寄主協(xié)同進(jìn)化的過程中,為了克服侵染過程中的組織障礙,進(jìn)化出復(fù)雜的細(xì)胞壁降解機(jī)制,包括分泌蛋白及CAZymes 的功能強(qiáng)化、與植物細(xì)胞壁降解相關(guān)酶類的數(shù)量擴(kuò)增等,以達(dá)到侵染寄主植物的目的。例如:病原真菌在侵染寄主植物的過程中分泌多種糖苷水解酶,將植物多糖分解成寡糖或單糖,破壞細(xì)胞壁結(jié)構(gòu)以突破表皮障礙,并吸收利用其繁殖所需的營養(yǎng)物質(zhì)[4]。本研究以生物信息學(xué)為研究工具,明確真菌、細(xì)菌和卵菌等不同植物病原物中分泌蛋白和CAZymes 的數(shù)量和種類差異,為進(jìn)一步解析不同病原物侵染植物過程中分泌蛋白和CAZymes 的功能及表達(dá)具有重要的理論價(jià)值,但造成CAZymes 的種類差異是否與菌株的生長環(huán)境、致病能力以及寄生類型等有關(guān)還有待于驗(yàn)證。此外,侵染過程中諸多植物病原物的分泌蛋白和CAZymes 功能尚不清楚,嚴(yán)重制約著新型農(nóng)藥的開發(fā),對于CAZymes 的預(yù)測還有待進(jìn)一步通過生物學(xué)試驗(yàn)進(jìn)行驗(yàn)證。
不同菌種之間、或同一類型病原物不同物種之間、或同屬真菌、細(xì)菌和卵菌的不同種之間,所含有的分泌蛋白和CAZymes 存在數(shù)量和種類差異,暗示不同植物病原物在與植物協(xié)同進(jìn)化過程中存在著共性化和差異化策略,從而實(shí)現(xiàn)其對植物的侵染及營養(yǎng)物質(zhì)的利用。本研究為進(jìn)一步開展不同物種、不同群體以及同一群體不同物種間分泌蛋白和CAZymes 的功能共性化和差異化研究提供了重要參考。