黃明捷,張 勇,陳 祥,陳 偉,莫先艇,郭 勇,王天松
(1.貴州大學(xué) 高原山地動(dòng)物遺傳育種與繁殖教育部重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550025;2.貴州大學(xué) 貴州省動(dòng)物遺傳育種與繁殖重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550025;3.貴州大學(xué) 動(dòng)物科學(xué)學(xué)院,貴州 貴陽 550025)
檸檬酸循環(huán)的中間體如檸檬酸鹽、琥珀酸鹽和α-酮戊二酸鹽等是重要的能源和生物合成前體,同時(shí)還具有信號(hào)傳導(dǎo)作用,如檸檬酸鹽能作為大腦中用于感知能量和營養(yǎng)物的調(diào)節(jié)信號(hào)[1]。檸檬酸循環(huán)中間體從質(zhì)膜轉(zhuǎn)運(yùn)到細(xì)胞中是通過溶質(zhì)載體13(Solute carrier 13,SLC13)家族轉(zhuǎn)運(yùn)蛋白介導(dǎo)。SLC13蛋白家族是在原核生物和真核生物中均被發(fā)現(xiàn)的超級(jí)轉(zhuǎn)運(yùn)蛋白家族[2],它屬于SLC家族中的一個(gè)亞族,對調(diào)節(jié)動(dòng)物機(jī)體組織、血漿以及尿液中代謝物含量極其重要。脊椎動(dòng)物SLC13家族由5個(gè)基因構(gòu)成,根據(jù)其作用底物的特性可分為Na-羧酸鹽協(xié)同轉(zhuǎn)運(yùn)蛋白(Na+-carboxylate cotransporters,NaC)和Na-硫酸鹽協(xié)同轉(zhuǎn)運(yùn)蛋白(Na+-sulfate cotransporters,NaS)[3]。NaC包括SLC13A2、SLC13A3和SLC13A5蛋白,它們在腎皮質(zhì)、小腸、肝臟、大腸有一定分布[4-6]。SLC13A2基因敲除小鼠會(huì)表現(xiàn)出腎臟再吸收缺陷[7],NaC參與檸檬酸循環(huán)中間體的介導(dǎo)轉(zhuǎn)運(yùn),還可以直接影響代謝酶。NaS包括SLC13A1和SLC13A4蛋白,SLC13A1蛋白存在于腎臟近端小管和腸上皮細(xì)胞[8],SLC13A4蛋白存在于胎盤和睪丸中[9]。NaS介導(dǎo)轉(zhuǎn)運(yùn)陰離子如硫酸鹽、硒酸鹽和硫代硫酸鹽,它對維持機(jī)體硫酸鹽穩(wěn)態(tài)具有重要意義[10],SLC13A1基因敲除小鼠表現(xiàn)出硫酸鹽血癥,其生長遲緩、生育能力降低[11]。
鑒于SLC13蛋白家族具有調(diào)節(jié)機(jī)體檸檬酸循環(huán)中間體以及代謝物穩(wěn)態(tài)的功能,其對牛生長發(fā)育狀況以及代謝疾病的產(chǎn)生有不可忽視的作用,但目前關(guān)于牛SLC13蛋白的生物信息學(xué)方面的研究尚未見報(bào)道。為此,應(yīng)用生物信息學(xué)方法分析牛SLC13蛋白,初步探究其理化性質(zhì)、疏水性、二級(jí)結(jié)構(gòu)及三級(jí)結(jié)構(gòu)、保守基序、亞細(xì)胞定位、跨膜區(qū)、蛋白質(zhì)互作情況和系統(tǒng)進(jìn)化,以期為揭示牛SLC13蛋白的生物學(xué)功能、提高牛生長性能和代謝疾病防控提供參考。
本研究所用數(shù)據(jù)均來源于NCBI數(shù)據(jù)庫,各物種SLC13蛋白信息見表1。
表1 各物種SLC13蛋白信息Tab.1 Information of SLC13 protein of each species
通過在線軟件ExPASy中的ProtParam(https://web.expasy.org/protparam)分析牛SLC13基因家族蛋白的氨基酸序列組成和理化性質(zhì);應(yīng)用Pepwheel(http://www.bioinformatics.nl/cgi-bin/emboss/pepwheel)和ProtScale(https://web.expasy.org/cgi-bin/protscale/protscale.pl),構(gòu)建蛋白質(zhì)的螺旋輪,并分析氨基酸殘基的親疏水性;通過在線軟件SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)和SWISS-MODEL(http://swissmodel.expasy.org/interactive)預(yù)測牛SLC13家族蛋白的二級(jí)結(jié)構(gòu)及三級(jí)結(jié)構(gòu);利用CSDS(http://gsds.cbi.pku.edu.cn)繪制蛋白質(zhì)結(jié)構(gòu)圖,使用MEME(http://meme-suite.org/index.html)對牛SLC13蛋白序列基序進(jìn)行分析;利用在線軟件PsortⅡ(https://psort.hgc.jp/form2.html)對牛SLC13蛋白的亞細(xì)胞定位進(jìn)行預(yù)測;利用TMHMM Server.2.0(http://www.cbs.dtu.dk/services/TMHMM)進(jìn)行跨膜區(qū)分析;應(yīng)用STRING(https://string-db.org)分析SLC13蛋白的互作網(wǎng)絡(luò);利用MEGA 6.05軟件中的最大似然法(Maximum likelihood,ML)構(gòu)建各物種間SLC13蛋白的系統(tǒng)進(jìn)化樹。
使用在線軟件ExPASy中的ProtParam分析牛SLC13蛋白的氨基酸序列組成和理化性質(zhì),結(jié)果見表2。從表2和圖1可以看出,牛SLC13基因家族成員編碼的氨基酸數(shù)目在520~626個(gè),氨基酸組分中亮氨酸(Leu)含量最高,組氨酸含量最低(His);SLC13蛋白氨基酸分子質(zhì)量從57.80~68.96 ku不等,等電點(diǎn)介于7.01~8.67,親水性總平均值(Grand average of hydropathicity,GRAVY)均大于0;SLC13A2為不穩(wěn)定蛋白,SLC13A1、SLC13A3、SLC13A4、SLC13A5均為穩(wěn)定蛋白(不穩(wěn)定系數(shù)小于40,為穩(wěn)定蛋白)[12-13]。
表2 牛SLC13蛋白理化性質(zhì)分析Tab.2 Physicochemical properties of bovine SLC13 protein
圖1 牛SLC13蛋白的氨基酸組成Fig.1 Amino acid content of bovine SLC13 protein
構(gòu)成蛋白質(zhì)的多聚氨基酸能組成復(fù)雜的結(jié)構(gòu)并產(chǎn)生特定功能,這些氨基酸總體的疏水性起著重要作用。構(gòu)成蛋白質(zhì)的多肽鏈中親水性氨基酸與疏水性氨基酸的比例,表明該蛋白質(zhì)的親水或疏水性[14-15]。利用Pepwheel構(gòu)建牛SLC13蛋白的螺旋輪(圖2),以識(shí)別疏水性和親水性殘基的分布情況,脂肪族殘基用正方形標(biāo)記,親水性殘基用菱形標(biāo)記,帶正電荷的殘基用八邊形標(biāo)記。應(yīng)用ProtScale對牛SLC13蛋白進(jìn)行預(yù)測分析(表3、圖3),根據(jù)親水性氨基酸與疏水性氨基酸的比例可知,牛SLC13蛋白均為疏水性蛋白,與ProtParam預(yù)測結(jié)果一致。
圖2 牛SLC13蛋白的螺旋輪Fig.2 Spiral wheel of bovine SLC13 protein
表3 牛SLC13蛋白疏水性分析Tab.3 Hydrophobicity analysis of bovine SLC13 protein
注:親/疏水性氨基酸值小于1,表示多肽鏈親水性總氨基酸數(shù)小于疏水性總氨基酸數(shù),則為疏水性蛋白。
Note:The pro-/hydrophobic amino acid value is less than 1,indicating that the total hydrophilic amino acid number of the polypeptide chain is less than the total number of hydrophobic amino acids,and the protein is a hydrophobic protein.
圖3 牛SLC13蛋白親水性/疏水性預(yù)測結(jié)果Fig.3 Prediction results of hydrophilicity/hydrophobicity of bovine SLC13 protein
通過SOPMA在線軟件預(yù)測牛SLC13蛋白的二級(jí)結(jié)構(gòu),構(gòu)成不同SLC13蛋白二級(jí)結(jié)構(gòu)的α-螺旋、伸展鏈、β-轉(zhuǎn)角以及無規(guī)卷曲均由數(shù)量相近的氨基酸組成(表4)。應(yīng)用SWISS-MODEL在線軟件預(yù)測牛SLC13蛋白的三級(jí)結(jié)構(gòu)(圖4),發(fā)現(xiàn)牛SLC13蛋白有較多α-螺旋結(jié)構(gòu)富集域,以β-轉(zhuǎn)角和無規(guī)卷曲連接形成其特定結(jié)構(gòu)。
表4 牛SLC13蛋白二級(jí)結(jié)構(gòu)組成Tab.4 Secondary structure of bovine SLC13 protein
圖4 牛SLC13蛋白三級(jí)結(jié)構(gòu)預(yù)測Fig.4 Tertiary structure prediction of boivine SLC13 protein
利用CSDS繪制蛋白質(zhì)結(jié)構(gòu)圖,并使用MEME(參數(shù):Motif最大值為10)對牛SLC13蛋白序列保守基序進(jìn)行分析(圖5)。SLC13A2、SLC13A3和SLC13A5基因均有5′UTR和3′UTR,SLC13A1和SLC13A4基因僅有3′UTR,牛SLC13基因家族均含有11段以上的外顯子;除SLC13A3蛋白無Motif 10、SLC13A5蛋白無Motif 8外,SLC13A1、SLC13A2、SLC13A4蛋白均存在Motif 1—10。
圖5 牛SLC13基因家族的系統(tǒng)進(jìn)化樹(A)、結(jié)構(gòu)(B)及蛋白質(zhì)基序分析(C)Fig.5 Phylogenetic tree(A),gene structure(B) and protein motif structure(C) of bovine SLC13 gene family
蛋白質(zhì)只有處于特定亞細(xì)胞區(qū)間才能發(fā)揮其功能,利用在線軟件預(yù)測蛋白質(zhì)亞細(xì)胞區(qū)間位置,可以了解蛋白質(zhì)的功能和性質(zhì)、認(rèn)識(shí)蛋白質(zhì)間的相互作用[16]。使用在線軟件Psort Ⅱ 對牛SLC13基因家族編碼蛋白進(jìn)行預(yù)測分析(表5),發(fā)現(xiàn)牛SLC13蛋白在細(xì)胞內(nèi)主要分布在質(zhì)膜、內(nèi)質(zhì)網(wǎng)和線粒體,僅有SLC13A3蛋白在高爾基體中有一定分布。
表5 牛SLC13蛋白的亞細(xì)胞定位 Tab.5 Subcellular localization of bovine SLC13 protein %
鑲嵌在生物膜上蛋白質(zhì)的功能和性質(zhì)決定其生物膜的絕大部分功效,膜蛋白是在各種細(xì)胞中普遍存在并具有獨(dú)特結(jié)構(gòu)的蛋白質(zhì),對維持生命活動(dòng)有極其重要的作用。使用在線軟件TMHMM Server.2.0對牛SLC13蛋白進(jìn)行跨膜區(qū)分析(圖6)可知,牛SLC13蛋白均為多次跨膜螺旋的內(nèi)在膜蛋白(Integral protein)。構(gòu)成跨膜區(qū)蛋白的氨基酸大部分是疏水性氨基酸,與牛SLC13蛋白的疏水性區(qū)域分析結(jié)果基本一致。
圖6 牛SLC13蛋白跨膜區(qū)域預(yù)測Fig.6 Transmembrane region analysis of bovine SLC13 protein
利用STRING構(gòu)建牛SLC13蛋白的互作網(wǎng)絡(luò)并進(jìn)行GO功能注釋。選擇15個(gè)直接或間接互作節(jié)點(diǎn)、25條互作關(guān)系構(gòu)建牛SLC13蛋白的互作網(wǎng)絡(luò)(圖7)。牛SLC13蛋白GO通路富集結(jié)果顯示,其在生物學(xué)層面上主要參與羧酸跨膜運(yùn)輸(Carboxylic acid transmembrane transport);在分子功能層面主要富集于羧酸跨膜轉(zhuǎn)運(yùn)蛋白活性(Carboxylic acid transmembrane transporter activity)和次級(jí)活性跨膜轉(zhuǎn)運(yùn)蛋白活性(Secondary active transmembrane transporter activity)。
圖7 牛SLC13蛋白互作網(wǎng)絡(luò)Fig.7 Interaction network of bovine SLC13 protein
用MEGA 6.05軟件對14個(gè)物種的SLC13氨基酸序列共計(jì)69條進(jìn)行分析,采用最大似然法比對后構(gòu)建進(jìn)化樹,結(jié)果如圖8所示。14個(gè)物種的SLC13A1蛋白與SLC13A4蛋白處于同一個(gè)較大分支,SLC13A2、SLC13A3和SLC13A5蛋白處于另一個(gè)較大分支,SLC13A2、SLC13A3、SLC13A5分支中SLC13A2和SLC13A5在14個(gè)物種中的進(jìn)化上親緣關(guān)系較近。普通牛均與瘤牛、水牛、牦牛聚為一類,具有較高的同源性,與雞的距離最遠(yuǎn)。
在人和小鼠中,硫酸鹽在回腸中被吸收,然后通過腎臟維持其穩(wěn)態(tài)。妊娠期母體對高循環(huán)硫酸鹽水平的生理需求在物種間是保守的[17],SLC13A1蛋白能維持母體正常血漿硫酸鹽生理水平,而SLC13A4蛋白能將胎盤外的硫酸鹽轉(zhuǎn)運(yùn)供給胎兒,并且SLC13A1和SLC13A4敲除小鼠會(huì)表現(xiàn)蛋白的出妊娠中晚期胎兒死亡現(xiàn)象[18-19]。因而,SLC13A1和SLC13A4的正常表達(dá)對胎兒發(fā)育至關(guān)重要。檸檬酸鹽是鈣的重要螯合劑,SLC13A2蛋白能調(diào)節(jié)尿液中檸檬酸鹽的濃度,而許多腎結(jié)石患者表現(xiàn)出低檸檬酸鹽,這表明SLC13A2蛋白與腎結(jié)石的發(fā)生有關(guān)[20]。SLC13A5蛋白抑制肝臟細(xì)胞外檸檬酸鹽攝取,被認(rèn)為是治療代謝性疾病一種方法[21-22]。檸檬酸鹽作為一種關(guān)鍵的調(diào)節(jié)代謝中間體,對整合糖酵解和脂質(zhì)合成過程極其重要,利用SLC13A5特異性抑制劑可以減少進(jìn)入肝臟的檸檬酸鹽流量,進(jìn)而治療代謝紊亂[23]。
圖8 不同物種SLC13蛋白系統(tǒng)發(fā)育樹Fig.8 SLC13 protein phylogenetic tree of different species
本研究利用生物信息學(xué)技術(shù)對牛SLC13家族蛋白的理化性質(zhì)、疏水性、二級(jí)結(jié)構(gòu)及三級(jí)結(jié)構(gòu)、保守基序、亞細(xì)胞定位、跨膜區(qū)、互作網(wǎng)絡(luò)以及進(jìn)化關(guān)系進(jìn)行預(yù)測和分析,結(jié)果表明:牛SLC13基因家族編碼的氨基酸數(shù)介于520~626個(gè),亮氨酸含量最高,組氨酸含量最低,分子質(zhì)量介于57.80~68.96 ku,除SLC13A2外的4個(gè)蛋白質(zhì)均為穩(wěn)定蛋白,其編碼蛋白均為疏水性蛋白;牛SLC13蛋白的二級(jí)結(jié)構(gòu)主要由α-螺旋、β-轉(zhuǎn)角以及無規(guī)卷曲組成。組成蛋白質(zhì)的氨基酸的數(shù)量和性質(zhì)、蛋白質(zhì)二級(jí)以及更高級(jí)結(jié)構(gòu)決定其特性和功能,通過對蛋白質(zhì)理化性質(zhì)、二級(jí)和三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測分析利于對其結(jié)構(gòu)功能有更深了解[24]。檸檬酸鈉能有效抑制內(nèi)質(zhì)網(wǎng)應(yīng)激(Endoplasmic reticulum stress,ERS)[25],持續(xù)而強(qiáng)烈的ERS對內(nèi)質(zhì)網(wǎng)穩(wěn)態(tài)(Endoplasmic reticulum homoeostasis)有害,會(huì)導(dǎo)致細(xì)胞凋亡[26]。牛SLC13蛋白能調(diào)控檸檬酸鹽水平,該蛋白質(zhì)亞細(xì)胞定位于內(nèi)質(zhì)網(wǎng)??梢?,牛SLC13蛋白對維持胞內(nèi)內(nèi)質(zhì)網(wǎng)穩(wěn)態(tài)、保持細(xì)胞正常生命活動(dòng)具有一定作用。利用最大似然法對14個(gè)物種的SLC13蛋白進(jìn)行聚類分析,發(fā)現(xiàn)普通牛與瘤牛、水牛、牦牛親緣關(guān)系相近,與雞親緣關(guān)系最遠(yuǎn)。家牛屬(普通牛、瘤牛)、牦牛屬和水牛屬與野豬親緣關(guān)系相對較近,這與王玲玉[27]的研究結(jié)果一致。NaC與NaS是作用底物特性不同的2種蛋白質(zhì),14個(gè)物種的SLC13A1、SLC13A4蛋白處于同一個(gè)較大分支,而SLC13A2、SLC13A3和SLC13A5蛋白處于另一個(gè)較大分支。由此推測,NaC和NaS有著各自的進(jìn)化機(jī)制,這一現(xiàn)象值得進(jìn)一步探究。本研究綜合各種生物信息學(xué)軟件,使用生物信息學(xué)方法對牛SLC13蛋白分析的理化性質(zhì)、結(jié)構(gòu)和生物學(xué)特性進(jìn)行分析,同時(shí)對其系統(tǒng)進(jìn)化情況展開探討,可以為后續(xù)深入研究中SLC13基因家族參與的代謝疾病、胚胎發(fā)育等方面提供理論依據(jù)。