陳占玉,黃永亮,王維民,李 沖,王國秀,李明月
(甘肅農(nóng)業(yè)大學動物科學技術(shù)學院,甘肅 蘭州 730070)
熱休克蛋白(Heat Shock Proteins,HSPs)是由機體受損、受寒、紫外線暴露、組織修復等各種應激誘導表達的蛋白[1]。該蛋白由Ritossa 于1962年在果蠅體內(nèi)發(fā)現(xiàn),直至1974 年經(jīng)Tissieres 證實并命名。HSPs 按大小可分為五大類,分別為HSP110(90-110KDa)、HSP90(83-90KDa)、HSP70(68-78KDa)、HSP60(40-60KDa)以及sHSP(12-34 KDa)[2]。HSPs 廣泛存在于從低等生物到高等動物的機體中,當生物有機體暴露于高溫時,就會由熱激發(fā)合成HSPs 來保護機體細胞免受熱損傷[3]。除高溫環(huán)境以外,其他應激源如缺氧、嚴寒、中毒等惡劣環(huán)境也能誘發(fā)機體細胞生成HSPs,從而幫助每個細胞維持正常的生理活動,阻截影響細胞健康的蛋白質(zhì)相互作用。也有研究發(fā)現(xiàn),HSPs對維持綿羊心臟的正常功能也有重要作用[4]。
HSPA1L(heat shock protein family A member 1 like)是HSP70 蛋白中的一員,HSP70 是HSP 家族中穩(wěn)定性最高含量最多的一類蛋白[5]。HSPA1L 與HSPA1A、HSPA1B 都屬于HSP70 家族中的編碼蛋白質(zhì)基因,HSPA1L 基因編碼蛋白有90%的氨基酸序列與HSP70 家族一致。HSP70 作為重要的應激蛋白,在保護細胞免于凋亡、氧化損傷和基因損傷中起著關(guān)鍵作用[6]。由于HSPA1L 基因是編碼HSP70 的3 個基因之一,所以HSPA1L 基因?qū)d羊抗應激和免疫功能也極為重要。但HSP70 增強耐熱力的作用機制模糊,如何通過技術(shù)措施誘導HSP70 基因在局部合理表達以提高免疫效率仍需進一步研究[7]。
目前針對HSPA1L 基因的研究集中在人類醫(yī)學方面,有研究表明HSPA1L 編碼蛋白與細胞損傷、腫瘤干細胞樣特性和精子質(zhì)量等有關(guān)[8]。綿羊雖然有較強的耐受性和抗逆能力,但熱適應性較差,溫度過高會對其健康和生長造成影響,如誘導機體發(fā)生氧化應激、降低干物質(zhì)的采食量、損害腸道組織等[9],目前,國內(nèi)外對綿羊HSPA1L基因的理論研究和生物信息學分析極少,缺乏實質(zhì)性的參考信息。我們用生物信息學方法和程序軟件對綿羊HSPA1L 基因的開放閱讀框、蛋白質(zhì)親/疏水性、基因基本理化性質(zhì)進行分析,預測HSPA1L 基因的初級和高級結(jié)構(gòu)、跨膜區(qū)和亞細胞定位,旨在對綿羊的抗熱應激和免疫等方面的研究提供理論基礎和依據(jù)。
從美國國立生物技術(shù)信息中心(NCBI)數(shù)據(jù)庫中查詢了綿羊HSPA1L 基因的mRNA 序列(登錄號:XM_027958817.2),該序列來自愛荷華大學綿羊全基因組鳥槍測序(WGS)項目及綿羊基因組功能注釋計劃項目,綿羊品種為蘭布萊綿羊(Rambouillet)。同時下載了除綿羊以外的其他11 個物種的HSPA1L 基因編碼蛋白質(zhì)序列(表1)。
表1 12 個物種的HSPA1L 基因編碼蛋白質(zhì)序列
綿羊HSPA1L 基因開放閱讀框(Open reading frame,ORF)采用NCBI 的ORF Finder 程序分析(https://www.ncbi.nlm.nih.gov/orffinder/)。采用Bioedit軟件預測HSPA1L 基因編碼產(chǎn)物的基本理化性質(zhì)(https://www.expasy.org/resources/protparam)。蛋白親疏水性采用ProtScale 工具進行分析(http://ca.expasy.org/tools/protscale.html)。蛋白潛在信號肽預測采用SignalP 方法分析(http://www.cbs.dtu.dk/services/SignalP-3.0/)。蛋白質(zhì)亞細胞定位預測采用PSORT 方法預測(https://psort.hgc.jp/form2.html)??缒ぢ菪齾^(qū)域的預測采用TMHMM Server v.2.0 程序分析(http://www.cbs.dtu.dk/services/TMHMM)。采用DNAMAN 軟件對多序列比對和同源性分析進行預測。HSPA1L 基因的保守結(jié)構(gòu)域采用網(wǎng)站分析http://smart.embl-heidelberg.de/。蛋白二級結(jié)構(gòu)的預測采用Jpred 軟件分析,三級結(jié)構(gòu)的預測使用SWISS-MODEL 在線工具進行分析(https://www.swissmodel.expasy.org/)。
開放閱讀框(Open reading frame,ORF)是一段可編碼蛋白質(zhì)中間無終止序列打斷,從啟動子到終止子的堿基序列,通過識別ORF 可以快速識別出基因序列中的編碼區(qū)域[10]。從ORF 分析結(jié)果可以看出(圖1),序列中共識別的綿羊HSPA1L 基因有20 個ORF,其中最大長度的ORF 有1 926 bp,推測其編碼641 個氨基酸殘基。
圖1 綿羊HSPA1L 基因序列的ORF 分析
蛋白質(zhì)基本性質(zhì)主要包括氨基酸組成、相對分子質(zhì)量和等電點[11-13]。本文采用Bioedit 軟件預測綿羊HSPA1L 基因編碼蛋白質(zhì)的理化特性并分析該基因編碼產(chǎn)物的氨基酸組成,結(jié)果顯示(表2),綿羊HSPA1L 基因可編碼641 個氨基酸,其中Ala 的比例最高,為9.0%;含量最少的是Trp,為0.3%。負電荷殘基總數(shù)(Asp+Glu)為89,正電荷殘基總數(shù)(Arg+Lys)為83,分子式為C3094H4985N859O969S20,理論等電點pI 為5.89,不穩(wěn)定指數(shù)為32.56。
表2 綿羊HSPA1L 基因編碼產(chǎn)物的氨基酸組成
蛋白質(zhì)的親疏水性取決于氨基酸序列,一般高度易溶的蛋白質(zhì)袒露在最外側(cè)的都為親水蛋白,最內(nèi)側(cè)的都為疏水蛋白[14]。采用ProtScale 程序分析綿羊HSPA1L 基因編碼蛋白質(zhì)的親/ 疏水性分析,(圖2)表明,綿羊HSPA1L 基因編碼蛋白的疏水性最大值為2.211(第397 位),最小值為-3.056(第250 位),故綿羊HSPA1L 基因編碼的蛋白是親水蛋白。
圖2 綿羊HSPA1L 基因蛋白質(zhì)親/疏水性分析
信號肽序列是分布在分泌蛋白基因的編碼序列中的位于起始密碼子之后的一段含有較多疏水氨基酸多肽的序列[15]。綿羊HSPA1L 基因編碼產(chǎn)物的C 值為0.088,Y 值為0.114,S 值為0.515(圖3)。表明綿羊HSPA1L 基因的編碼產(chǎn)物不存在信號肽。
圖3 綿羊HSPA1L 基因蛋白潛在信號肽預測結(jié)果
采用PSORT 方法預測綿羊HSPA1L 蛋白質(zhì)亞細胞定位。綿羊HSPA1L 蛋白分布在細胞質(zhì)中的可能性是69.6%,在細胞核內(nèi)的可能性是26.1%,在線粒體中為4.3%(表3)。表明綿羊HSPA1L 基因在細胞核中發(fā)揮的作用較小,主要是在細胞質(zhì)中發(fā)揮生物學作用。
表3 綿羊HSPA1L 蛋白質(zhì)亞細胞定位預測分析
應用TMHMM Server v.2.0 程序分析了綿羊HSPA1L 基因的信號肽,結(jié)果顯示(圖4),綿羊HSPA1L 基因編碼產(chǎn)物沒有跨膜區(qū)。
圖4 綿羊HSPA1L 基因跨膜螺旋結(jié)構(gòu)分析結(jié)果
HSPA1L 基因在很多物種中均有表達。本文采用DNAMAN 軟件對水牛、人、普通牛、綿羊、豬、狗、猴、馬、兔子、小鼠、山羊和貓的HSPA1L 蛋白多序列進行比對的結(jié)果顯示(圖5),HSPA1L 基因在以上12 個物種中都有表達,且綿羊與普通牛和豬的HSPA1L 氨基酸序列同源性最高,說明綿羊與普通牛和豬在進化過程中有較近的親緣關(guān)系。由HSPA1L 編碼產(chǎn)物的同源樹可以證明,在分析選擇的12 個物種中,綿羊與普通牛和豬的同源性最高(圖6)。
圖5 12 個物種的HSPA1L 基因編碼產(chǎn)物的同源樹
圖6 12 個物種的HSPA1L 基因編碼序列的同源性分析
采用Smart 軟件分析HSPA1L 蛋白保守結(jié)構(gòu)域,綿羊HSPA1L 蛋白包含2 個結(jié)構(gòu)域,分別位于370~380 和393~405 位,均為低復雜性結(jié)構(gòu)域(lowcomplexity domain)(圖7)。
圖7 綿羊HSPA1L 蛋白保守結(jié)構(gòu)域分析
蛋白質(zhì)的二級結(jié)構(gòu)是2 條核苷酸鏈反向平行盤繞所生成的雙螺旋結(jié)構(gòu)。采用Jpred 軟件對其進行預測,綿羊HSPA1L 蛋白二級結(jié)構(gòu)中無規(guī)則卷曲(Cc)占58.81%,為綿羊HSPA1L 蛋白二級結(jié)構(gòu)的主要組成部分;其次是α-螺旋(Hh),占比28.86%;β-折疊(Ee)占比最少,為12.32%(圖8)。
圖8 綿羊HSPA1L 基因編碼蛋白質(zhì)二級結(jié)構(gòu)預測
蛋白質(zhì)的三級結(jié)構(gòu)是在二級結(jié)構(gòu)的基礎上進一步盤繞折疊所形成的特定空間結(jié)構(gòu)。使用SWISS-MODEL 在線工具對其進行預測分析結(jié)果顯示(圖9),HSPA1L 基因編碼蛋白的三級結(jié)構(gòu)中主要由無規(guī)則卷曲構(gòu)成,結(jié)構(gòu)較為復雜。
圖9 綿羊HSPA1L 蛋白三級結(jié)構(gòu)的預測分析
本研究分析結(jié)果表明,綿羊HSPA1L 基因最長ORF 有1 926 個bp,其編碼產(chǎn)物穩(wěn)定,編碼的蛋白以親水性區(qū)域為主,是一種易溶的弱酸性蛋白質(zhì),不存在信號肽,無跨膜結(jié)構(gòu),主要在細胞質(zhì)中發(fā)揮生物學作用。與普通牛、和豬的同源性最高,該蛋白二級結(jié)構(gòu)和三級結(jié)構(gòu)中占主導地位的都是無規(guī)則卷曲,結(jié)構(gòu)較為復雜。
有研究表明,熱休克蛋白1L(HSPA1L)是一種免疫性和保守性較強的蛋白[16]。通過生物信息學分析可知,綿羊HSPA1L 基因序列中最大長度的ORF 有1 926 個bp,可編碼641 個氨基酸殘基,呈弱酸性,較穩(wěn)定,屬于親水蛋白且不存在信號肽。哺乳動物在熱應激條件下,熱休克細胞中的許多核蛋白會變的不可溶并成為基質(zhì)的一部分,而在應激過程中合成的HSP70蛋白可向細胞核遷移,加速細胞核熱休克的應激恢復[17]。本研究表明,HSPA1L 基因編碼蛋白穩(wěn)定性較強,二級結(jié)構(gòu)和三級結(jié)構(gòu)中占主導地位的都是無規(guī)則卷曲,結(jié)構(gòu)較復雜。較強的穩(wěn)定性和在結(jié)構(gòu)上較高的保守性,是其在熱應激條件下保持結(jié)構(gòu)和功能穩(wěn)定的分子基礎。本研究還證實,HSPA1L 編碼蛋白屬于親水蛋白。有研究表明熱應激條件下HSP70 蛋白以親水的方式結(jié)合到基質(zhì)上在細胞核集中,以修復基質(zhì)上變性的核蛋白[18]。
HSPA1L 基因主要在細胞質(zhì)中發(fā)揮作用,基因編碼產(chǎn)物沒有跨膜區(qū)。有研究表明,正常生理狀態(tài)下HSPs 主要存在于細胞質(zhì)中[19],這與本研究一致。雖然細胞核對熱更加敏感,但本文研究顯示,綿羊HSPA1L 蛋白分布于細胞核的可能性僅為26.1%,而在細胞質(zhì)中可能性高達69.6%,原因在于HSP70 中的HSPA9 蛋白是一個主要的線粒體伴侶蛋白,可通過線粒體的雙層膜將細胞核中的HSPA1L 轉(zhuǎn)移到細胞質(zhì)中,從而使細胞質(zhì)中HSPA1L 基因表達更加明顯[20]。由于熱休克蛋白基因具有高度應激性和高表達性,在應激源刺激下HSPA1L 基因有可能在細胞質(zhì)中快速表達合成。應激條件下,HSP70 蛋白會迅速從細胞質(zhì)進入到細胞核和核仁,而應激恢復期,又迅速從其他組織返回細胞質(zhì)[17]。
在不同物種間綿羊與普通牛和豬的HSPA1L基因同源性最高為100%,這說明在進化過程中它們在該基因上具有較近的親緣關(guān)系。但綿羊與山羊HSPA1L 基因同源性相對較低。綿羊與山羊的物種親緣關(guān)系較近,但生活環(huán)境和適應性有較大差異,山羊的熱適應性更強。這有可能是環(huán)境差異導致的自然選擇過程中HSPA1L 基因在進化中出現(xiàn)了變異,但具體的進化機制,以及差異位點對該基因在抗熱應激中發(fā)揮的作用和機理的影響仍需研究。
HSPA1L 基因作為編碼HSP70 蛋白的基因,有可能對綿羊在熱耐力形成過程中維持細胞內(nèi)環(huán)境的穩(wěn)定具有重要作用,并對綿羊在各種環(huán)境應激條件下的適應性具有重要影響[10]。以HSPA1L基因作為綿羊抗應激能力的分子標記選育開展分子標記輔助選育,有可能加快綿羊育種進程,改善綿羊的適應性,減少生產(chǎn)中降低應激,提高效益,節(jié)約成本,從而推動養(yǎng)羊業(yè)的發(fā)展。然而,HSPA1L 基因編碼蛋白的生物學功能、表達調(diào)控以及HSPA1L 基因多態(tài)性與綿羊健康與生長發(fā)育的關(guān)系仍有待進一步研究。