陳慧彬
(河南工業(yè)大學 糧油食品學院,河南 鄭州 450001)
芝麻是一種經濟效益好、營養(yǎng)價值高的食品。芝麻含油率達45%~57%,蛋白質含量約21%,是優(yōu)質的不飽和脂肪酸和蛋白質來源。此外,芝麻還富含木脂素及維生素E等抗氧化成分,素有“八谷之冠”的美譽[1]。然而,芝麻蛋白又是一種不容忽視的食品過敏原。2014年,美國公共事務科學中心(CSPI)要求美國食品藥品監(jiān)督管理局(FDA)將芝麻制品納入食源性過敏原加以管理。
食品過敏原通過胃腸道初次進入機體后,被抗原提呈細胞吞噬消化為小分子肽段,由MHCⅡ(T細胞表位,主要負責提呈外源抗原)提呈到細胞質膜表面,與TH2細胞的TCR結合,形成MHCⅡ-抗原-TCR復合體,被激活的T細胞產生細胞因子,IL4和IL10可刺激B細胞釋放IgE抗體(B細胞表位),IgE結合至肥大細胞和嗜堿性粒細胞表面,使機體處于致敏狀態(tài),當機體再次接觸過敏原,可迅速引發(fā)Ⅰ型超敏反應,進而觸發(fā)過敏癥。
芝麻過敏原主要包括醇溶蛋白超家族的Ses i 1和Ses i 2,Cupin超家族的Ses i 3、Ses i 6和 Ses i 7,以及油質蛋白超家族的Ses i 4和Ses i 5[2]。其中Ses i 6和Ses i 7占芝麻蛋白質總量的60%~70%,因其具有較強的熱穩(wěn)定性和抗消化能力,容易通過胃腸道屏障薄弱部位進入循環(huán)系統(tǒng),被免疫細胞識別消化觸發(fā)Ⅰ型超敏反應,是芝麻中的主要過敏原。國內關于芝麻過敏原的研究仍為空白,為此,探究Ses i 6的致敏表位、致敏機理、檢測方法、脫敏加工等尤為重要。本研究采用生物信息學軟件對Ses i 6的抗原表位進行模擬預測,以期為后續(xù)的研究工作奠定基礎。
登錄NCBI-Protein數據庫,查詢Ses i 6的氨基酸序列(編號:Q9XHP0.1),獲取如下FASTA序列:MVAFKFLLALSLSLLVSAAIAQTREPRLTQGQQCRFQRISGAQPSLRIQSEGGTTELWDERQEQFQCAGIVAMRSTIRPNGLSLPNYHPSPRLVYIERGQGLISIMVPGCAETYQVHRSQRTMERTEASEQQDRGSVRDLHQKVHRLRQGDIVAIPSGAAHWCYNDGSEDLVAVSINDVNHLSNQLDQKFRAFYLAGGVPRSGEQEQQARQTFHNIFRAFDAELLSEAFNVPQETIRRMQSEEEERGLIVMARERMTFVRPDEEEGEQEHRGRQLDNGLEETFCTMKFRTNVESRREADIFSRQAGRVHVVDRNKLPILKYMDLSAEKGNLYSNALVSPDWSMTGHTIVYVTRGDAQVQVVDHNGQALMNDRVNQGEMFVVPQYYTSTARAGNNGFEWVAFKTTGSPMRSPLAGYTSVIRAMPLQVITNSYQISPNQAQALKMNRGSQSFLLSPGGRRS。Ses i 6共459個氨基酸殘基,以此為基礎進行接下來的表位分析。
登錄UniProtKB,查詢Ses i 6(編號:Q9XHP0)的基本信息和功能注釋。
將Ses i 6的FASTA格式序列導入EXPASY的ProtParam工具,預測分析Ses i 6蛋白的物理化學性質。
1.2.1 B細胞線性表位預測
1.2.1.1 基于Ses i 6二級結構的生物信息學預測
將氨基酸序列導入在線預測軟件SOPMA,依據二級結構算法預測分析潛在的B細胞線性表位。
1.2.1.2 基于Ses i 6分子特征的生物信息學預測
使用DNAstar子程序Protean分析Ses i 6的蛋白質特性。其中,Kyte-Doolittle Hydropathy方案可以根據氨基酸序列得出Ses i 6的親水性分布;Karplus-Schultz方案可以通過分析Ses i 6的主鏈柔性預測潛在的抗原表位;Emini方案可以預測Ses i 6的表面可及性;Jameson-Wolf方案可以直接得出Ses i 6的抗原分布,綜合四種方案預測分析Ses i 6潛在的優(yōu)勢表位。
1.2.1.3 基于Ses i 6與已知過敏原的比對預測
登錄BepiPred 1.0 Server,輸入氨基酸序列,結合氨基酸的性質(親水性、柔韌性、可及性、極性、暴露表面、轉角)和隱馬爾可夫模型預測潛在的B細胞線性表位[3]。研究表明,同那些僅依賴于氨基酸性質的預測方法相比,隱馬爾可夫模型可提高BepiPred預測結果的準確性。
1.2.2 B細胞構象表位預測
1.2.2.1 Ses i 6三維模型的構建
在SWISS-MODLE中通過序列比對尋找模板,需要注意的是,尋找的模板蛋白與Ses i 6的序列相似性應高于30%[4],以模板結構為基礎進行三維建模,下載三維模型的PDB文件以評估其穩(wěn)定性。
1.2.2.2 Ses i 6三維模型穩(wěn)定性評價
在Deep View 4.1中導入SWISS-MODLE構建的三維模型PDB文件,獲取拉氏圖(Ramachandran Plot),評定三維模型的穩(wěn)定性。
1.2.2.3 基于Ses i 6三維模型的生物信息學預測
DiscoTope 2.0 Server通過計算抗原抗體接觸數和氨基酸傾向得出致敏原潛在的構象表位,采用新型的空間可及性算法預估表面暴露的可能性,增加了預測的準確性。導入SWISS-MODLE的PDB文件,分析同源模型中的構象表位。在Pymol軟件中標注獲取的構象表位,分析其空間位置關系。
人類白細胞抗原(Human Leukocyte Antigen,HLA)是表達于人體免疫細胞質膜表面的主要相容組織復合體(Major histocompatibility complex,MHC)[5],具有廣泛的群體多態(tài)性,與食品過敏的個體差異性密切相關,根據差異大小,可分為安全群體和敏感群體。因此,根據HLA基因型與Ses i 6的相關關系分析敏感人群分布格外重要。外源抗原(CD4+T細胞呈遞)的T細胞表位由12~17個氨基酸殘基組成,主要是線性表位,與肽段的空間位置沒有關系,可分布于分子內部,研究具體的T細胞表位可為敏感人群提供安全保障。
1.3.1 敏感人群分析
使用在線分析軟件NetMHCII 2.3 Server[6]分析Ses i 6與HLA-DR(共25種)、HLA-DQ(共20種)、HLA-DP(共9種)的結合能力,篩選出高親和性肽段(SB)和低親和性肽段(WB),并判斷敏感人群。
1.3.2 敏感人群的T細胞表位預測
根據1.3.1中敏感人群的高親和肽段分析其T細胞表位。
NCBI數據庫顯示,Ses i 6的1aa-21aa為信號肽,22aa-277aa為酸性亞基,278aa-459aa為堿性亞基,第24位和第67位的Cys形成二硫鍵,此外,第110位和第284位的Cys形成的二硫鍵連接酸性亞基和堿性亞基。20aa-454aa屬于Cupin蛋白超家族,該蛋白家族擁有β-伴大豆球蛋白、7S豌豆球蛋白及花生主要過敏原Ara h 1等眾多致敏原。
UniProtKB數據庫顯示,Ses i 6是一種同源六聚體貯存蛋白,2007年被世界衛(wèi)生組織(WHO)和國際過敏協會聯合會(IUIS)正式定名為過敏原Ses i 6.0101。
通過ProtParam分析,Ses i 6的分子式為C2246H3560N682O692S20,分子量為51830.33Da,等電點為7.73,脂肪蛋白系數(AI)為74.36,平均親水指數(GRAVY)為-0.537,AI和GRAVY共同指示Ses i 6具有很強的親水性。Ses i 6的氨基酸組成如圖1所示。
2.2.1 線性表位
2.2.1.1 基于Ses i 6二級結構的生物信息學預測
根據二級結構預測理論,紅色區(qū)域和紫色區(qū)域因暴露于蛋白質分子的外表面,從抗原抗體的可及性觀測,容易被識別,是致敏原分子中的優(yōu)勢表位。Ses i 6酸性亞基含有更多的無規(guī)則卷曲片段,而堿性亞基的各種二級結構分散,難以形成穩(wěn)定的抗原表位。SOPMA分析的Ses i 6的二級結構分布如圖2所示。
圖2 Ses i 6的二級結構分布
以多于5個氨基酸殘基(B細胞線性表位通常含有5-15個氨基酸殘基)為標準,SOPMA共預測出圖3所示的21個潛在優(yōu)勢抗原表位,其中,12個分布于酸性亞基。另外9個分布于堿性亞基,根據表位分布情況可知,Ses i 6的酸性亞基抗原性略高于堿性亞基。
圖3 基于Ses i 6二級結構的預測結果
2.2.1.2 基于Ses i 6分子特征的生物信息學預測
圖4展示了DNAstar預測的Ses i 6分子特征。整體上酸性亞基親水性強于堿性亞基,往往致敏原的親水性基團暴露在蛋白質表層,易與免疫細胞質膜受體結合,觸發(fā)過敏癥,因此,從親水性角度觀測,酸性亞基抗原性較強。65.6%的肽段抗原指數高于0,部分片段達1.7,顯示出較強的抗原性。Ses i 6的表面可及性與親水性預測結果基本保持一致,酸性亞基環(huán)繞在分子外表面的可能性更大,是Ses i 6潛在抗原表位的優(yōu)勢集中區(qū)。
圖4 DNAstar預測結果分布
DNAstar預測出10個潛在的優(yōu)勢抗原表位(見表1),其中,7個表位分布于酸性亞基,3個表位分布于堿性亞基,前者抗原性強于后者,與SOPMA預測結果一致。
表1 DNAstar預測結果
2.2.1.3 基于Ses i 6與已知過敏原的比對預測
Bepipred預測出13個抗原表位(見表2),其中,8個表位分布于酸性亞基,5個表位分布于堿性亞基,與SOPMA和DNAstar預測結果一致。
表2 Bepipred預測結果
使用單一的數據庫或生物信息學軟件進行預測,結果往往有較大的偏差,結合SOPMA、DNAstar及Bepipred三款軟件的不同算法,得出B細胞線性表位的綜合預測結果(見表3)。綜合來看,所有潛在的優(yōu)勢抗原表位都分布于酸性亞基。
表3 B細胞線性表位的綜合預測結果
2.2.2 構象表位
2.2.2.1 Ses i 6三維模型的構建
在PDB數據庫中搜尋模板,得到序列相似度為39.21%的籽粒莧(AmaranthushypochondriacusL.)11S貯存蛋白(3qac),構建Ses i 6三維模型(見圖5)。堿性亞基和酸性亞基各自形成一個β-桶結構域,該結構是Cupin蛋白超家族的典型特征,主要由β-折疊構成。圖中顯示的β-轉角結構和酸性亞基向外延伸的無規(guī)則卷曲片段已在2.2.1.1中被預測為潛在的線性抗原表位。
圖5 Ses i 6三維模型
2.2.2.2 Ses i 6三維模型穩(wěn)定性評價
Deep View 4.1通過分析相鄰氨基酸的二面角(φ,ψ)大小評估Ses i 6三維結構的穩(wěn)定性。圖6中的深綠色區(qū)域為允許區(qū),淺綠色區(qū)域為不完全允許區(qū),其他區(qū)域為不允許區(qū)。拉氏圖顯示93.41%以上的二面角符合穩(wěn)定性要求。因此,SWISS-MODLE預測結果可用于Ses i 6構象表位的預測,并對Ses i 6的立體結構解析有指導意義。
圖6 Ses i 6三維結構的Ramachandran Plot
2.2.2.3 基于Ses i 6三維模型的生物信息學預測
以穩(wěn)定的三維模型為基礎,DiscoTope 2.0分析出10個潛在抗原表位(見表4),其中,8個位于酸性亞基的構象表位,2個位于堿性亞基的構象表位,與線性表位分布一致。
表4 DiscoTope 2.0預測結果
Ses i 6的B細胞構象表位分布如圖7所示。使用Pymol標注出10個抗原表位的空間位置,優(yōu)勢表位全部位于Ses i 6表面,容易被免疫細胞識別,其中,表位1、2、5、6、7和8位于酸性亞基的無規(guī)則卷曲部位,表位9和10位于堿性亞基的無規(guī)則卷曲部位。因為酸性亞基向外延伸較多,表面可及性強,所以與IgE的接觸數較多,相反,堿性亞基在形成六聚體時被臨近亞基遮擋,只有暴露在表面的位點可被IgE識別。
圖7 Ses i 6的B細胞構象表位分布
2.3.1 敏感人群分析
通過分析445個十五肽段與HLA的親和性高低得到圖8—圖10所示結果。25種HLA-DR中有23種(92%)強親和肽段,20種HLA-DQ中有18種(90%)強親和肽段,9種HLA-DP中有4種(44.4%)強親和肽段,其中,HLA-DQ的敏感性整體高于HLA-DR,HLA-DP的親和性最弱。由此可見,HLA-DQ攜帶者對Ses i 6有很強的敏感性。其中,HLA-DQA10601-DQB10402的結合能力最強,可強親和32個十五肽段,攜帶該基因型的人群極有可能在誤食加工不完全的Ses i 6產品后觸發(fā)過敏癥。
圖8 Ses i 6與HLA-DR基因型的相關性分析
圖9 Ses i 6與HLA-DQ基因型的相關性分析
2.3.2 敏感人群的T細胞表位預測
分析2.3.1中敏感人群的T細胞表位發(fā)現,Ses i 6與HLA-DQA10601-DQB10402、HLA-DQA10201-DQB10402、HLA-DQA10303-DQB10402、HLA-DRB1*1601親和性最強的T細胞表位分別為FVVPQYYTSTARAGN、AGYTSVIRAMPLQVI、FVVPQYYTSTARAGN、AFKFLLALSLSLLVS,其中HLA-DQA10601-DQB10402和HLA-DQA10303-DQB10402的強親和表位一致,同時含有這兩個HLA亞型的人群,對FVVPQYYTSTARAGN過敏的可能性極大。
2007年,Beyer等[2]首次證實了Ses i 6可與54%過敏患者的IgE牢固結合反應,但之后關于Ses i 6的致敏性研究一直處于停滯期。本研究成功預測出的Ses i 6 B抗原表位,將為其致敏性研究做出貢獻。研究發(fā)現,B細胞表位中有90%為構象表位,加工變性的方式可以使一維不連續(xù)的構象表位解聚脫敏,但難以通過打斷蛋白質一級結構破壞線性表位,因此,Ses i 6致敏性研究的關注點應在其線性表位上。Wallowitz等[7]研究發(fā)現,Ses i 6可激活人體嗜堿性粒細胞。在測試的19名患者中,有58%受試者的IgE抗體可與Ses i 6結合反應,并且與核桃過敏原存在交叉反應,即多數對核桃等食物過敏的人群極有可能對芝麻制品也過敏。T細胞表位的成功預測,可以避免臨床的皮膚點刺過敏試驗,通過HLA的基因型判斷即可確診。敏感人群應該避免攝入Ses i 6制品和與Ses i 6存在交叉反應的過敏原(如核桃),或者食用符合加工標準的Ses i 6制品。