曹淑芬 李 文 何 穎 鄒澤紅 李林梅 艾云燦
(中山大學生命科學學院/有害生物控制與資源利用國家重點實驗室,廣州510275)
?
·中醫(yī)中藥與免疫·
歐洲女貞花粉主要過敏原Lig v 1理化性質(zhì)與結(jié)構(gòu)的生物信息學分析①
曹淑芬李文②何穎②鄒澤紅②李林梅艾云燦
(中山大學生命科學學院/有害生物控制與資源利用國家重點實驗室,廣州510275)
目的:運用生物信息學相關(guān)軟件,預測歐洲女貞花粉主要過敏原Lig v 1的理化性質(zhì)和結(jié)構(gòu),為Lig v 1重組表達系統(tǒng)的選擇和過敏原性改造提供參考。方法:查詢文獻獲得Lig v 1的氨基酸序列,運用生物信息學軟件分析其理化性質(zhì)(ProtParam)、信號肽(SignalP 4.1 Server)、跨膜區(qū)(TMHMM Server v.2.0)、二級結(jié)構(gòu)(GOR4)、MHCⅡ類抗原表位(NetMHCⅡ 2.2 Server)、B細胞抗原表位(ProteanTM5.01)以及系統(tǒng)發(fā)生樹(MEGA 6)。結(jié)果:Lig v 1在大腸桿菌中穩(wěn)定性較好,不存在信號肽與跨膜區(qū);二級結(jié)構(gòu)中無規(guī)則卷曲占大多數(shù);Lig v 1潛在MHCⅡ類抗原表位為30~44區(qū)域;B細胞抗原表位既具有連續(xù)的氨基酸序列,也具有不連續(xù)的氨基酸序列;Lig v 1與歐洲白蠟以及木犀欖的同源蛋白進化距離最近。結(jié)論:大腸桿菌是適合重組Lig v 1的表達系統(tǒng),Lig v 1抗原表位分析為低過敏原性改造提供參考。
歐洲女貞;過敏原;生物信息學軟件;Lig v 1;抗原表位
過敏性疾病是當今世界性的重大衛(wèi)生學問題。世界變態(tài)反應組織對30個國家過敏性疾病流行病調(diào)查結(jié)果表明,在這些國家的12億人口中,22%的人口患有依賴于IgE介導的各類過敏性疾病,如過敏性哮喘、過敏性鼻炎、食物過敏、藥物過敏,過敏性疾病嚴重影響了人們的生活質(zhì)量,甚至威脅人類生命[1]。過敏原特異性免疫治療是唯一可以改變過敏性疾病自然進程的治療方法,成功的過敏原特異性免疫治療取決于標準化、可持續(xù)生產(chǎn)、高質(zhì)量的過敏原疫苗;過敏原提取物的質(zhì)量對臨床特異性診斷的準確性及治療的有效性都是至關(guān)重要的[2]。國際上使用的過敏原疫苗有過敏原提取物和重組過敏原,過敏原提取物成分復雜,過敏原標準化程序繁瑣,而重組過敏原成分明確,有利于標準化生產(chǎn),可以保證治療的療效和安全性,同時重組過敏原可以有針對性地改造過敏原的抗原表位,降低過敏原性,從而獲得低過敏原性的過敏原疫苗,提高疫苗的安全性[3,4]。
前期研究中,我們對510個過敏原進行聚類分析,并將蛋白質(zhì)數(shù)據(jù)庫中不同物種來源的60條主要過敏原序列聚類成有著明顯差異的7個簇以后,逐步聚類縮減到21個氨基酸序列無任何相關(guān)性的代表性過敏原,大大減少了重組過敏原的工作量[5,6]。歐洲女貞(Ligustrum vulgare) 花粉主要過敏原Lig v 1是21個代表性過敏原之一,有關(guān)Lig v 1的結(jié)構(gòu)與功能報道較少。本研究利用生物信息學技術(shù)分析Lig v 1的理化性質(zhì)和結(jié)構(gòu),為Lig v 1重組表達系統(tǒng)的選擇和低過敏原性改造提供參考。
1.1 Lig v 1的氨基酸序列獲取查詢文獻,搜索歐洲女貞花粉主要過敏原Lig v 1的氨基酸序列。
1.2Lig v 1的理化性質(zhì)預測使用ProtParam(http://web.expasy.org/protparam/),預測Lig v 1的理化性質(zhì),包括分子量、等電點、氨基酸組成、原子組成、消光系數(shù)、半衰期、不穩(wěn)定指數(shù)、脂肪指數(shù)以及總平均親水值。預測Lig v 1水溶液(1 g/L)在280 nm處光吸收。不穩(wěn)定指數(shù)小于40,則預測該蛋白為穩(wěn)定;不穩(wěn)定指數(shù)大于40,則預測該蛋白為不穩(wěn)定。
1.3Lig v 1的信號肽預測通過SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP)[7],預測Lig v 1的信號肽。C-score表示原始切割位點評分,用于判斷信號肽切割位點,緊隨信號肽切割位點后的位置(即成熟蛋白的第一個氨基酸殘基)具有C-score高峰。S-score表示信號肽評分,用于區(qū)分信號肽與成熟蛋白以及無信號肽的蛋白。Y-score表示綜合切割位點評分,通過幾何平均綜合S-score的斜率與C-score而獲得。一段氨基酸序列中可能存在多個C-score高峰,選擇同時具有C-score高峰與S-score高斜率的位點作為切割位點。S平均值表示信號肽(第一個氨基酸殘基至Y-score的前一個氨基酸殘基)的S-score平均值。D-score表示區(qū)別評分,為S平均值與Y-score最高峰的加權(quán)平均數(shù),用于區(qū)別信號肽與非信號肽序列。對于非分泌蛋白,以上評分均極低,接近陰性值0.1。
1.4Lig v 1的跨膜區(qū)預測運行TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMH-MM)[8],預測Lig v 1的跨膜區(qū)。若預測獲得的跨膜區(qū)多于18個氨基酸,則該蛋白極可能具有跨膜區(qū)或信號肽。蛋白前60個氨基酸中,若存在數(shù)個跨膜氨基酸,則需考慮N端的跨膜區(qū)是否為信號肽。若整個序列被標注為inside或outside(不能用于預測蛋白定位),則表示該蛋白不存在跨膜區(qū)。
1.5Lig v 1的二級結(jié)構(gòu)預測采用GOR4(http://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_gor4.html)[9],預測Lig v 1的二級結(jié)構(gòu)。
1.6Lig v 1的MHCⅡ類抗原表位預測運用NetMHCⅡ 2.2 Server(http://www.cbs.dtu.dk/services/NetMHCⅡ/),預測Lig v 1 的MHCⅡ類抗原表位[10,11]。以每13個相鄰氨基酸為一段待測多肽,預測其與MHCⅡ類親和力(Affinity),強親和力閾值50 nmol/L,弱親和力閾值500 nmol/L,轉(zhuǎn)化為數(shù)值1-log(Affinity)/log(50 000),分別為0.638 4與0.425 6[12]。
1.7Lig v 1的B細胞抗原表位預測采取ProteanTM5.01(DNASTAR,Madison,WI)中的Jameson-Wolf方案預測Lig v 1的抗原指數(shù),選取抗原指數(shù)不低于1的位點作為B細胞抗原表位[13]。
1.8Lig v 1的交叉過敏反應預測選擇BLAST工具(http://www.uniprot.org/blast/),搜索Lig v 1潛在的同源蛋白,入選標準:連續(xù)80個氨基酸同一性大于35%[14]。經(jīng)由Clustal Omega工具(http://www.ebi.ac.uk/Tools/msa/clustalo/)進行氨基酸序列比對。選取MEGA 6軟件中的鄰位相連(N-J)方法得到系統(tǒng)發(fā)生樹[15]。
2.1Lig v 1的氨基酸序列獲取Batanero等[16]報道了歐洲女貞花粉主要過敏原Lig v 1的氨基酸序列,該過敏原被UniProt數(shù)據(jù)庫收錄為O82015。
2.2Lig v 1的理化性質(zhì)預測Lig v 1等電點為5.91,由145個氨基酸組成,含有18個帶負電氨基酸(天冬氨酸與谷氨酸)、17個帶正電氨基酸(精氨酸與賴氨酸),谷氨酸含量(12個,占8.3%)最高,其次為甘氨酸、亮氨酸、賴氨酸、脯氨酸、蘇氨酸以及纈氨酸(均為11個,分別占7.6%)。分子式為C732H1147N191O218S9,分子量為16 399.8 Da。若半胱氨酸均形成胱氨酸,則其消光系數(shù)為13 325 M-1cm-1,吸光度為0.813;若半胱氨酸均不形成胱氨酸,則其消光系數(shù)為12 950 M-1cm-1,吸光度為0.79。Lig v 1在大腸桿菌、哺乳動物網(wǎng)狀細胞(體外)以及酵母中半衰期分別為10 h以上、1 h以及30 min。Lig v 1不穩(wěn)定指數(shù)為40.3,提示其為不穩(wěn)定蛋白。Lig v 1脂肪系數(shù)為75.17,提示其不耐熱。Lig v 1總平均親水值為-0.376,提示其易溶于水。
2.3Lig v 1的信號肽預測Lig v 1信號肽預測結(jié)果(圖1)顯示,第25個位點精氨酸的C-score為最大值0.137;第25個位點精氨酸的Y-score為最大值0.114;第38個位點甘氨酸的S-score為最大值0.137;第1至24個位點的S平均值為0.095;第1至24個位點的D-score為0.104,遠低于D-score閾值0.45,預測Lig v 1不存在信號肽。
2.4Lig v 1的跨膜區(qū)預測Lig v 1跨膜區(qū)預測結(jié)果(圖2)顯示,跨膜區(qū)氨基酸數(shù)目、蛋白前60個位點存在的跨膜氨基酸數(shù)目,以及N端存在于細胞質(zhì)一側(cè)的可能性均約為0,整個序列被標注為outside,因此不存在跨膜區(qū)。
2.5Lig v 1的二級結(jié)構(gòu)預測Lig v 1二級結(jié)構(gòu)預測結(jié)果(圖3)顯示,無規(guī)則卷曲占大多數(shù)(64.83%);其次為延伸鏈(27.59%);α-螺旋所占比例最少(7.59%),集中于第60至第69位氨基酸。
2.6Lig v 1的MHCⅡ類抗原表位預測MHCⅡ類抗原表位預測結(jié)果(圖4)顯示,Lig v 1有43個肽段與MHCⅡ具有強親和力,包括以下區(qū)域:22~45,52~92、99~145,親和力最強為32~44區(qū)域;具有弱親和力的肽段為102個。潛在MHCⅡ類抗原表位為30~44區(qū)域。與強親和力相關(guān)的基因型為HLA-DQA10501-DQB10301、HLA-DRB10101、HLA-DRB10301、HLA-DRB10401、HLA-DRB10404、HLA-DRB10405、HLA-DRB10701、HLA-DRB10901、HLA-DRB11101、HLA-DRB11302與HLA-DRB50101,提示具有以上基因型的人對Lig v 1產(chǎn)生過敏反應的可能性較高。
圖1 Lig v 1的信號肽預測Fig.1 Prediction of signal peptide:Lig v 1
圖2 Lig v 1的跨膜區(qū)預測Fig.2 Prediction of transmembrane helix:Lig v 1
2.7Lig v 1的B細胞抗原表位預測預測結(jié)果(圖5)顯示,Lig v 1的B細胞抗原表位存在連續(xù)的氨基酸序列與單個氨基酸,推測B細胞抗原表位由線性表位與構(gòu)象表位組成。潛在B細胞抗原表位存在于以下氨基酸位點:1~7、21~23、26、42~50、52、84~95、97~99、102、103、111~113、126~131。
2.8Lig v 1的交叉過敏反應預測在UniProt數(shù)據(jù)庫中搜索獲得Lig v 1潛在的同源蛋白,所屬物種及登錄號如下:梣屬歐洲白蠟(Q7XAV4)、木犀欖屬木犀欖(P19963)、擬南芥屬擬南芥(Q9LP44)、蕓苔屬歐洲油菜(A0A078EG50)、鼠耳芥屬琴葉擬南芥(D7MCQ3)、可可屬可可樹(A0A061GFS0)、樺木屬垂枝樺(O49813)以及苜蓿屬蒺藜苜蓿(B7FGN2)。Lig v 1與歐洲白蠟及木犀欖中同源蛋白的序列相似度較高,分別為91.0%及86.9%,并且系統(tǒng)發(fā)生樹(圖6)顯示,Lig v 1與這兩種蛋白進化距離最近,更可能發(fā)生交叉過敏反應。
圖3 Lig v 1的二級結(jié)構(gòu)預測Fig.3 Prediction of secondary structure:Lig v 1
圖4 Lig v 1的MHCⅡ類抗原表位預測Fig.4 Prediction of MHCⅡ epitopes:Lig v 1
圖5 Lig v 1的B 細胞抗原表位預測Fig.5 Prediction of B-cell epitopes:Lig v 1
圖6 Lig v 1的系統(tǒng)發(fā)生樹Fig.6 Phylogenetic tree for Lig v 1
常見的重組蛋白表達系統(tǒng)包括大腸桿菌、枯草芽孢桿菌、鏈霉菌、酵母、昆蟲、杜氏鹽藻、植物和哺乳動物細胞,其中大腸桿菌、酵母表達重組蛋白具有流程簡單、成本低和產(chǎn)量高的特點,廣泛應用于過敏原的重組表達[16,17]。Lig v 1在大腸桿菌中半衰期大于10 h,而在酵母中半衰期僅為30 min,這提示用大腸桿菌表達Lig v 1更穩(wěn)定,表達重組過敏原Lig v 1優(yōu)先選擇大腸桿菌。不穩(wěn)定指數(shù)與脂肪系數(shù)預測結(jié)果提示,Lig v 1可能不穩(wěn)定且不耐熱,在蛋白表達、純化與保存等操作中應在低溫下進行。Lig v 1的總平均親水值預測其為親水蛋白,可能較易溶于水溶液,如生理鹽水和磷酸鹽緩沖液,利于動物模型建立與細胞實驗等方面的應用。此外,Lig v 1不存在信號肽與跨膜區(qū)(圖1、2),這提示該蛋白不是分泌蛋白和跨膜蛋白。
自從Freeman首次使用過敏原特異性免疫治療成功治療枯草熱,過敏原特異性免疫治療已經(jīng)有100多年歷史[18]。傳統(tǒng)的過敏原特異性免疫治療都采用過敏原提取液,最近人們開始探索表位疫苗和低過敏原性的過敏原疫苗的應用。Chen等[19]構(gòu)建屋塵螨過敏原Der p 1/Der p 2的多表位疫苗,該疫苗缺乏IgE反應性,但保留T細胞反應性,能夠誘導產(chǎn)生IgG,從而阻斷IgE反應,具有潛在治療效果。Marazuela等[17]在樺樹花粉中發(fā)現(xiàn)一種與Ole e 1同源的非過敏性蛋白,在此基礎(chǔ)上對Ole e 1過敏原4個氨基酸位點進行突變,獲得的Ole e 1突變體T細胞反應性不變而IgE反應性降低。設計表位疫苗或低過敏原性的過敏原疫苗首先要求對過敏原的抗原表位進行分析和鑒定。Karplus等[20]認為,蛋白質(zhì)結(jié)構(gòu)中柔韌性大的區(qū)域易形成抗原表位。由于α-螺旋與延伸鏈這兩種二級結(jié)構(gòu)由氫鍵維系,結(jié)構(gòu)穩(wěn)定,柔韌性低于無規(guī)則卷曲,所以抗原表位常見于無規(guī)則卷曲。本研究利用生物信息學軟件預測Lig v 1的MHCⅡ類抗原表位和B細胞抗原表位,發(fā)現(xiàn)大部分均由無規(guī)則卷曲組成(圖4、5)。后續(xù)研究將對Lig v 1的MHCⅡ類抗原表位進行定點突變,降低其過敏原性,為歐洲女貞花粉過敏性疾病提供安全有效的候選疫苗。系統(tǒng)發(fā)生樹分析表明,Lig v 1與歐洲白蠟以及木犀欖的同源蛋白進化距離最近(圖6),且這三者同屬于木犀科植物,提示這三種過敏原可能存在交叉過敏反應,未來通過定點突變獲得低過敏原性Lig v 1突變體,將對三種過敏原引起的過敏性疾病都有潛在的治療效果。
本研究利用生物信息學軟件分析歐洲女貞花粉主要過敏原Lig v 1的理化性質(zhì)和結(jié)構(gòu),為蛋白克隆表達及純化提供理論支持,而MHCⅡ類抗原表位及系統(tǒng)發(fā)生樹分析為后續(xù)Lig v 1 的單克隆抗體設計、抗原表位疫苗設計、過敏原性改造乃至脫敏治療等深入研究提供了參考。
[1]Warner JO,Kaliner MA,Crisci CD,etal.Allergy practice worldwide:a report by the World Allergy Organization Specialty and Training Council[J].Int Arch Allergy Immunol,2006,139(2):166-174.
[2]Bousquet J,Lockey R,Malling HJ.Allergen immunotherapy:therapeutic vaccines for allergic diseases.A WHO position paper[J].J Allergy Clin Immunol,1998,102(4 Pt 1):558-562.
[3]Valenta R,Niespodziana K,Focke-Tejkl M,etal.Recombinant allergens:what does the future hold?[J].J Allergy Clin Immunol,2011,127(4):860-864.
[4]Valenta R,Linhart B,Swoboda I,etal.Recombinant allergens for allergen-specific immunotherapy:10 years anniversary of immunotherapy with recombinant allergens[J].Allergy,2011,66(6):775-783.
[5]陶愛林,鄒澤紅,賴荷,等.主要過敏原的物種分布及逐步聚類分析[J].中華微生物學和免疫學雜志,2007,27(5):451-456.
[6]He Y,Liu X,Huang Y,etal.Reduction of the number of major representative allergens:from clinical testing to 3-dimensional structures[J].Mediators Inflamm,2014,2014(1):1-11.
[7]Petersen TN,Brunak S,von Heijne G,etal.SignalP 4.0:discri minating signal peptides from transmembrane regions[J].Nat Methods,2011,8(10):785-786.
[8]Sonnhammer EL,von Heijne G,Krogh A.A hidden Markov model for predicting transmembrane helices in protein sequences[J].Proc Int Conf Intell Syst Mol Biol,1998,6:175-182.
[9]Combet C,Blanchet C,Geourjon C,etal.NPS@:network protein sequence analysis[J].Trends Biochem Sci,2000,25(3):147-150.
[10]Nielsen M,Lund O.NN-align.An artificial neural network-based alignment algorithm for MHC class Ⅱ peptide binding prediction[J].BMC Bioinformatics,2009,10(296):1-10.
[11]Nielsen M,Lundegaard C,Lund O.Prediction of MHC class II binding affinity using SMM-align,a novel stabilization matrix alignment method[J].BMC Bioinformatics,2007,8(238):1-12.
[12]Nielsen M,Lundegaard C,Worning P,etal.Reliable prediction of T-cell epitopes using neural networks with novel sequence representations[J].Protein Sci,2003,12(5):1007-1017.
[13]Jameson BA,Wolf H.The antigenic index:a novel algorithm for predicting antigenic deter minants[J].Comput Appl Biosci,1988,4(1):181-186.
[14]Goodman RE.Practical and predictive bioinformatics methods for the identification of potentially cross-reactive protein matches[J].Mol Nutr Food Res,2006,50(7):655-660.
[15]Tamura K,Stecher G,Peterson D,etal.MEGA6:molecular evolutionary genetics analysis version 6.0[J].Mol Biol Evol,2013,30(12):2725-2729.
[16]Batanero E,González de la Pea MA,Villalba M,etal.Isolation,cDNA cloning and expression of Lig v 1,the major allergen from privet pollen[J].Clin Exp Allergy,1996,26(12):1401-1410.
[17]Marazuela EG,Hajek R,Villalba M,etal.A non-allergenic Ole e 1-like protein from birch pollen as a tool to design hypoallergenic vaccine candidates[J].Mol Immunol,2012,50(1-2):80-90.
[18]Freeman J.Vaccination against hay fever:report of results during the first three years[J].Lancet,1914,183(4730):1178-1180.
[19]Chen KW,Blatt K,Thomas WR.Hypoallergenic Der p 1/Der p 2 combination vaccines for immunotherapy of house dust mite allergy[J].J Allergy Clin Immunol,2012,130(2):435-443.
[20]Karplus PA,Schulz GE.Prediction of chain flexibility in proteins[J].Naturwissenschaften,1985,72(4):212-213.
[收稿2015-11-06修回2015-11-30]
(編輯倪鵬)
In silico prediction for physicochemical properties and structure of major pollen allergen Lig v 1 in Ligustrum vulgare
CAO Shu-Fen,LI Wen,HE Ying,ZOU Ze-Hong,LI Lin-Mei,AI Yun-Can.
School of Life Sciences/State Key Laboratory of Biocontrol,Sun Yat-Sen University,Guangzhou 510275,China
Objective:To analyse the physicochemical properties and structure of major privet pollen allergen Lig v 1 using bioinformatics software and provide a reference for choosing suitable recombinant expression system for Lig v 1 and modifying the allergen Lig v 1 experimentally.Methods: The physicochemical properties were analysed by ProtParam,the signal peptide by SignalP 4.1 Server,the transmembrane helix by TMHMM Server v.2.0,the secondary structure by GOR4,MHCⅡ epitopes by NetMHCⅡ 2.2 Server,B-cell epitopes by ProteanTM5.01 and the phylogenetic tree by MEGA 6.Results: Privet major pollen allergen Lig v 1 was stable in Escherichia coli and it doesn′t possess any signal peptide and transmembrane helix.Most secondary structures of Lig v 1 were random coils.Potential region of MHCⅡ epitope of Lig v 1 was 30-44.Potential B-cell epitopes possess discontinuous and continuous a mino acid sequences.Lig v 1 and its counterparts from Fraxinus excelsior and Olea europaea were clustered into one group.Conclusion: Escherichia coli is the suitable expression system for recombinant Lig v 1.In silico prediction of the epitopes of Lig v 1 provides a reference for modifying the allergen Lig v 1 experimentally.
Ligustrum vulgare;Allergen;Bioinformatics software;Lig v 1;Epitope
10.3969/j.issn.1000-484X.2016.09.010
曹淑芬(1990年-),女,在讀碩士,主要從事重組過敏原蛋白的過敏原性評價方面的研究,E-mail: caosf@hotmail.com。
及指導教師:艾云燦(1963年-),男,博士,教授,主要從事微生物學方面的研究,E-mail: lssayc@mail.sysu.edu.cn。
R392.8
A
1000-484X(2016)09-1291-05
①本文為國家重大科技專項(2014ZX0801105B)。
②呼吸疾病國家重點實驗室變態(tài)反應研究室/變態(tài)反應國家臨床重點專科/廣東省過敏反應與免疫重點實驗室/廣州醫(yī)科大學附屬第二醫(yī)院,廣州510260。