蒙愛, 魏思昂,, 丁志文, 馮焱*
(1.山西農業(yè)大學生命科學學院, 太谷 030801; 2.復旦大學中山醫(yī)院心血管病研究所, 上海 200032)
短鏈脂肪酸 (short chain fatty acids, SCFAs) 是特定結腸厭氧菌發(fā)酵膳食纖維后產生的主要細菌代謝產物,主要包括:乙酸、丙酸、丁酸、戊酸和己酸[1],SCFAs 通過擴散或者被結腸上皮細胞主動吸收后進入血液循環(huán)系統(tǒng),一方面大部分的 SCFAs 可作為能量物質參與機體新陳代謝,另一方面作為 HDACi 調控基因的表觀遺傳[2]。目前大量的研究表明 SCFAs 對機體外周免疫及中樞神經系統(tǒng) (central nervous systerm, CNS) 免疫反應的調節(jié)發(fā)揮重要作用。膳食纖維的攝入減少或腸道微生物群的限制與炎性腸疾病和心血管疾病的發(fā)展有關[3-6],這強調了SCFAs是重要的免疫調節(jié)代謝物。
SCFAs可通過結合SCFAs受體發(fā)揮作用。目前,已發(fā)現(xiàn)的SCFAs受體主要為G蛋白偶聯(lián)受體 (G-protein-coupled receptors, GPR),包括GPR41、GPR43和GPR109[7- 8]。GPR41和GPR43又被稱為游離脂肪酸受體3 (free fatty acid receptor 3, FFAR3) 和FFAR2,廣泛存在于免疫細胞和腸上皮內分泌細胞等多種類型的細胞中。如GPR43可在腸內分泌細胞、免疫細胞、脂肪細胞中大量表達[9];GPR41在平滑肌細胞、腸內分泌細胞、神經細胞等多種細胞中廣泛表達;GPR109A可在大腸上皮細胞、結腸細胞、肝細胞、脂肪細胞和免疫細胞中大量表達[10]。其中,GPR43和GPR41可被乙酸、丙酸和丁酸激活,GPR109A可被丁酸激活。通過激活GPCRs受體,SCFAs可激活免疫反應的信號轉導途徑,在腸黏膜中發(fā)揮抗炎作用[11]。乙酸、丙酸和丁酸均可結合并激活GPR41和GPR43,參與調節(jié)器官的代謝、免疫和能量穩(wěn)態(tài)。在缺血性腦梗死的研究中表明,梗死降低了 SCFAs 在腸道內的水平[12]。乙酸是消化道內生物代謝的中間產物或最終產物,其濃度對動物的腸道健康發(fā)揮著巨大作用[13];與其他種類 SCFAs相比,丙酸可通過血液吸收到達不同器官,作為脂肪生成和糖質新生的底物,并能通過與G蛋白偶聯(lián)受體GPR41和GPR43結合來調節(jié)不同基因的表達;丁酸的腦保護作用最強補充丁酸治療缺血性模型可以過重塑腸道菌群,豐富有益的乳酸菌,修復腸道屏障,是治療缺血性腦梗死的有效方法[14]。
嗅覺感受受體 (olfactory receptor, Olfr) 78 (也稱為OR51E2) 為一種新發(fā)現(xiàn)的SCFAs受體,主要分布于腎臟和血管,參與調節(jié)腎素的分泌,可與GPR41、GPR43相互拮抗共同調節(jié)機體的血壓水平[15]。迄今為止,關于OR51E2基因家族全基因組的分析仍然缺乏?;诖?,現(xiàn)采用生物信息學方法對人源OR51E2基因家族基因序列進行分析,進一步比較其蛋白組分、結構、理化特性、系統(tǒng)發(fā)育和直腸腺癌關系,以期為OR51E2基因家族在遺傳進化過程和疾病治療研究提供有力的基礎支撐。
從NCBI數(shù)據庫下載人源OR51E2基因家族序列,主要包括OR51E1、OR51E2。從NCBI數(shù)據庫下載人、大鼠、小鼠、雞、蛙和G.bichir(塞內加爾多鰭魚) 等脊椎動物蛋白序列構建系統(tǒng)進化樹。
利用MEGA-X軟件對人源OR51E2基因家族蛋白序列比對,首先使用 Blast P 和 T Blast N 算法搜索智人,預測基因的蛋白序列和基因組序列,常數(shù)e閾值選擇10-5。然后將獲得的序列與 Pfam 數(shù)據庫進行比較, 檢測是否存在OR51E2保守結構域。接然后提交到 MEME 在線網站對其保守基序進行分析,參數(shù)為默認設置。
用Expasy 數(shù)據庫對基因蛋白氨基酸組成和相關理化性質分析獲得蛋白的等電點和相對分子質量的信息。采用 Protparam-tool工具對編碼氨基酸序列和氨基酸組成分析。采用SWISS-model工具對下載的氨基酸序列預測蛋白二級結構,使用PYMOL軟件將OR51E1和OR51E2結構可視化。
采用鄰接法 (neighbor-joining, NJ) 構建系統(tǒng)發(fā)育樹,并對生成的系統(tǒng)發(fā)育樹進行校正,校驗參數(shù) Bootstrap 重復1 000次,得到最終的系統(tǒng)發(fā)育樹。
使用GeneMIANA軟件分析OR51E2相關的共表達、相互作用、共定位、共享蛋白結構域網絡和信號通路等相關生物學作用。
通過GEPIA2分析OR51E2在直腸腺癌患者和正常健康人基因表達和預后。設置條件為總體生存,95%置信區(qū)間,基于COX PH模型計算危險度。
人源OR51E2基因家族一共包含兩種,即OR51E1和OR51E2。氨基酸組成 (圖1) 分析顯示含量最高和最低的分別為亮氨酸和色氨酸,但是其他氨基酸在蛋白含量有所差異,如異亮氨酸在OR51E1蛋白中含量 (9.7%) 在第二位,但在OR51E2蛋白中含量第二位的是纈氨酸 (10.6%),序列比對結果 (圖2) 顯示,二者在整體氨基酸組成上基本保守,為了進一步體現(xiàn)二者在結構域生物學作用的保守性,用MEME軟件分析展示了3種基序 (圖3)。蛋白結構 (圖4) 顯示,人源OR51E1、OR51E2為單鏈結構,且α-螺旋結構占主導地位,OR51E1蛋白N端α-螺旋結構較OR51E2長,表明OR51E1、OR51E2在功能上存在差異。理化特性顯示 (表1),OR51E1包含318個氨基酸,分子質量為35 402.40,等電點為8.71,無信號肽;OR51E2包含320個氨基酸,分子質量為35 492.64,等電點為9.16,無信號肽,OR51E1、OR51E2為非分泌蛋白。此外,結構域顯示OR51E1、OR51E2均包含一個7tm4功能結構域,分別在氨基酸33~310和30~309區(qū)段。
A為丙氨酸;R為精氨酸;N為天冬酰胺;D為天冬氨酸;C為半胱氨酸;Q為谷氨酰胺;E為谷氨酸;G為甘氨酸;H為組氨酸;I為異亮氨酸;L為亮氨酸;K為賴氨酸;M為甲硫氨酸;F為苯丙氨酸;P為脯氨酸;S為絲氨酸;T為蘇氨酸;W為色氨酸;Y為酪氨酸; V為頡氨酸圖1 人源OR51E1、OR51E2氨基酸組成分析 Fig.1 Amino acid composition analysis of human OR51E1 and OR51E2
圖2 人源OR51E1、OR51E2序列比對結果Fig.2 Sequence alignment results of human OR51E1 and OR51E2
圖3 人源OR51E1、OR51E2保守基序Fig.3 Conserved motifs of human OR51E1 and OR51E2
圖4 人源OR51E1、OR51E2高級結構Fig.4 Advanced structure of human OR51E1 and OR51E2
表1 人源OR51E1、OR51E2理化特性分析Table 1 Analysis of physicochemical properties of human OR51E1 and OR51E2
2.2 OR51E2蛋白家族系統(tǒng)進化樹
為了研究OR51E2蛋白家族系統(tǒng)狀況,從公共數(shù)據庫下載了人、大小鼠、雞、兔、蛙和G.bichir等14條蛋白序列構建OR51E2蛋白家族系統(tǒng)進化樹(圖5),進化樹為有根樹,根源動物為G.bichir,進化樹主要分為三簇,OR51E1、OR51E2和OR51E2_ (G.bichir的一類蛋白)。OR51E1包含5類:人、兔、狗、牛和蛙,OR51E2包含6類:人、大小鼠、狗、雞、牛,OR51E2_包含OR51E2三種亞型。在OR51E1簇中人與兔親緣性最近,OR51E2簇中人與狗親緣性最近,而大小鼠親緣性最近。OR51E2_簇中OR51E2_1與OR51E2_2親緣性最近。從整體進化樹來看,OR51E2蛋白家族系統(tǒng)進化樹動物親緣性從水生動物 (G.bichir)-兩棲動物 (蛙)-陸生動物 (人)。
M.musculus為小鼠;Rat為大鼠;Dog為狗;H.sapiens為 人;Cattle為 牛; Chichen為 雞;Frog為蛙;Rabbit為 兔; G.bichir為塞內 加爾多鰭魚 圖5 OR51E2蛋白家族系統(tǒng)進化樹Fig.5 Phylogenetic tree of OR51E2 protein family
用Gene MANIA軟件分析OR51E2的生物學作用 (圖6)。OR51E2共表達基因包含:AKT3、NRL、GNGT1、PRAC1、SLC45A3、ANO7、NKX3-1、KLK4、OR51E1、PAEP、NPY、KLK2、KLK3、TGM4、SEMG2、FAM159A、OR51E2、CPNE4。預測發(fā)現(xiàn)OR51E2與AKT3、NRL相互作用,并且AKT3、NRL為OR51E2上下游作用因子。共蛋白結構域和信號通路顯示OR51E2與GNB1、GNGT1、GNAL、ARRB2存在同一個群體之中。
圖6 OR51E2生物相互作用網絡Fig.6 Biological interaction network of OR51E2
由于OR51E2是一種SCFAs受體蛋白,在腸道的生理功能發(fā)揮重要的功能,研究OR51E2基因在直腸腺癌中的表達和預后至關重要。采用GEPIA2軟件對OR51E2基因在直腸腺癌患者和健康人的mRNA和預后分析,結果如圖7(a)所示,OR51E2mRNA表達量在直腸腺癌患者顯著降低,生存曲線分析[圖7(b)] 顯示OR51E2差異表達對預后有影響,高風險比值為1.5,但是時序檢驗logrankP=0.38,無生物統(tǒng)計學意義。結腸癌患者共納入92例,健康患者318例,紅色盒子為直腸癌患者OR51E2mRNA表達量;灰色盒子為健康人OR51E2mRNA表達量。
TPM為每百萬轉錄;logrank為時序檢驗;HR為高風險比值;n為數(shù)量圖7 OR51E2基因在直腸腺癌中表達和預后分析Fig.7 Expression and prognosis of OR51E2 gene in rectal adenocarcinoma
OR51E2基因家族是動物特有的基因,負責氣味信號的識別和G蛋白介導的轉導,在免疫、炎癥和結直腸癌均起著重要作用[16]。而現(xiàn)今,關于OR51E2基因研究相對較少,現(xiàn)基于生物信息學對人源OR51E2基因家族綜合分析,在人源OR51E1、OR51E2基因中包含3個保守基序?;蚪M的氨基酸組成、結構是展示功能差異的主要區(qū)別。人源OR51E2基因家族中OR51E1氨基酸組成和α-螺旋結構較OR51E2存在某些差異,說明這些氨基酸和α-螺旋結構改變了基因的功能,可能在基因的進化過程中將基因序列改變和丟失以產生各種機體需要的功能。OR51E1、OR51E2開放閱讀框含有大量相同的保守基序,表明在參與機體的生物學功能中二者存在一定的相似性。
進化樹中相同分支的基因可能有相似的功能,OR51E1、OR51E2與嗅覺氣味分子相互作用,啟動一種神經元反應,觸發(fā)對氣味的感知。同樣位于OR51E2_簇中的G.bichir中的 OR51E2基因家族成員,可能也有類似的功能;大小鼠也通過OR51E2蛋白在嗅覺相關功能發(fā)揮重要作用。
從拓撲結構進化樹可以發(fā)現(xiàn),OR51E2基因家族系統(tǒng)發(fā)育樹包含三簇,OR51E1簇中人與兔親緣性最近,OR51E2簇中人與狗親緣性最近。OR51E2_簇中OR51E2_1與OR51E2_2親緣性最近。從整體進化樹來看,OR51E2蛋白家族系統(tǒng)進化樹動物親緣性從水生動物 (G.bichir)-兩棲動物(蛙)-陸生動物 (人)。基因在進化過程中為了更利于生存進化和改變一些原有的功能是普遍現(xiàn)象,可能是自然選擇和蛋白質相互作用的結果。
Jovancevic等[17]研究發(fā)現(xiàn)OR51E2的活化誘發(fā)ERK1/2和AKT的激活,從而激活后視網膜色素上皮細胞細胞遷移和增殖增加。NRL編碼Maf亞家族的基本基序-亮氨酸拉鏈轉錄因子,編碼的蛋白在脊椎動物中是保守的,并且是光感受器發(fā)育和功能的關鍵內在調節(jié)劑。臨床研究顯示布哈拉猶太人NRL突變增加可能增加了眼肌型肌營養(yǎng)不良癥患病風險[18]。本文研究中的蛋白相互作用網絡顯示,OR51E2與AKT3、NRL在同一信號通路發(fā)揮生物學功能,暗示 OR51E2可能在腸道細胞的營養(yǎng)代謝和細胞增殖有關。
嗅覺感受器屬于G蛋白偶聯(lián)受體家族,在介導多種細胞功能的非感覺性組織中均有異位表達。Gelis等[19]研究表明OR51E2激活后細胞內Ca2+和cAMP升高,從而介導黑色素合成的增加。抑制腫瘤細胞的OR51E2表達能夠有效抑制這種癌細胞增加的轉移擴散[20]。先前研究表明OR51E2在前列腺瘤和黑色素瘤中癌細胞增殖和遷移的調控[21-23]。但是關于OR51E2在腸道疾病的報道并不多,Kotlo等[24]研究結果表明Olfr-78基因敲除小鼠感染、免疫、炎癥和結直腸癌相關基因發(fā)生了顯著變化,在葡聚糖硫酸鈉和2,4,6-三硝基苯磺酸誘導的結腸炎中表達下調。這與本文研究發(fā)現(xiàn)在直腸腺癌患者的OR51E2顯著降低相一致。暗示OR51E2可能在腸道炎癥中發(fā)揮重要作用。需要進一步研究了解OR51E2在人腸道是如何調節(jié)腸道的病理生理過程。
對人源OR51E2基因家族做了全基因組的生物信息學鑒定和分析,一共發(fā)現(xiàn)了OR51E1和OR51E2兩個基因。進一步分析人源OR51E2基因家族基因氨基酸組成、結構、保守結構域、理化特性等。系統(tǒng)進化樹結構表明OR51E2基因家族經歷了自然選擇。最后通過基因表達和生存曲線分析顯示OR51E2在直腸腺癌的病理學過程中起著重要作用,這為進一步研究OR51E2基因家族的功能和在病理學過程起到的作用奠定了基礎。