沈小芳 王曉軍 趙 鑫 梁煒耀 姚勁松 周蘭庭 翟立紅 肖 娟*
(湖北文理學院醫(yī)學院,湖北 襄陽441053)
九次跨膜超家族蛋白(Transmembrane 9 superfamily protein,TM9SF)是一類含有9 個跨膜區(qū)以及1 個非胞質(zhì)區(qū)的蛋白,并且該類蛋白在生物的進化過程中保守性較高[1]。九次跨膜超家族蛋白1 (TM9SF1)又稱為MP70,位于人類第十四號染色體長臂,全長6 594 bp,編碼606 個氨基酸,屬于九次跨膜超家族成員之一。王成東在TM9SFl 基因的研究中發(fā)現(xiàn),該基因在破裂的顱內(nèi)動脈瘤中表達量較高,因此推測顱內(nèi)動脈瘤的形成和破裂過程相關(guān)的炎性以及血管壁蛋白質(zhì)降解過程與持續(xù)高表達的TM9SFl 基因有關(guān),但并未揭示其具體機制[2]。TM9SF1 于1997 年被初次克隆,在人體組織中和多種細胞系廣譜表達。目前,僅有少數(shù)相關(guān)研究報道,TM9SF1 與癌癥、神經(jīng)退行性疾病和心肌病等疾病有關(guān),關(guān)于TM9SF1 蛋白在多種細胞或組織內(nèi)的功能研究尚未見報道,現(xiàn)階段關(guān)于TM9SF1 的研究多數(shù)集中在表達方面,總體上來說,關(guān)于該基因功能的研究性文章較少,該基因潛在的功能及其具體機制還有待發(fā)現(xiàn)。
本研究將對TM9SF1 基因的結(jié)構(gòu)、蛋白的理化性質(zhì)等結(jié)構(gòu)與功能采用生物信息學的方法進行分析預測,通過軟件預測,以便更好地了解該基因,同時也為在該基因上進行的后續(xù)研究提供幫助。
人的TM9SF1 基因、核酸序列、蛋白序列以及基因的外顯子序列等基本信息從NCBI 數(shù)據(jù)庫中獲取,且以此數(shù)據(jù)為研究材料。
利用Bioedit 中的ProtParam 進行TM9SF1 氨基酸組成分析;利用ExPASy 網(wǎng)站中的PrortScale 軟件預測TM9SF1 蛋白的親水性和疏水性;通過Signal P 4.1 在線工具對人TM9SF1 蛋白質(zhì)信號肽進行預測;從NCBI 網(wǎng)站上獲取人TM9SF1 蛋白質(zhì)在不同組織中的表達數(shù)據(jù)。
人TM9SF1 基因位于14 號染色體14q12,全長6 594 bp,含6 個外顯子。通過 ExPASy ProtParam 在線軟件(https://web.expasy.org/protparam/)對TM9SF1 蛋白氨基酸序列進行分析,分子量為68 860.65 kD,分子式為:C3197H4823N811O848S21,等電點(pI)為6.70。人TM9SF1 基因由606 個氨基酸組成,其中亮氨酸占整個序列的11.7%,是序列含量最高的氨基酸(圖1)。酸性氨基酸包括谷氨酸(Glu)和天冬氨酸(Asp)總共有50 個,堿性氨基酸包括賴氨酸(Lys)和精氨酸(Arg)總共有47 個,因此推測TM9SF1 為酸性蛋白質(zhì)分子;TM9SF1 在哺乳動物網(wǎng)織紅細胞中的半衰期為30 h,不穩(wěn)定系數(shù)為42.99,脂肪系數(shù)為101.75;TM9SF1 蛋白的平均親水性系數(shù)為0.256,因此推測該蛋白為疏水蛋白質(zhì)。
利用ExPASy 網(wǎng)站中的PrortScale 在線軟件工具對TM9SF1蛋白的親水性和疏水性進行預測并分析,可以發(fā)現(xiàn)位于第218位的天冬氨酸(Asp)和位于第219 位的精氨酸(Arg)是親水性最強的氨基酸,其親水性分值為-3.411;位于第504 位的纈氨酸(Val)是疏水性最強的氨基酸,其疏水性分值為3.444。TM9SF1 序列中疏水性的區(qū)域多于親水性的區(qū)域,表明該多肽屬于疏水蛋白。
圖1 氨基酸組成分析
運用Signal P 4.1 在線軟件工具預測TM9SF1 基因的蛋白質(zhì)信號肽(圖2),人TM9SF1 蛋白質(zhì)的C(剪切位點)得分0.509,Y(綜合剪切位點)得分0.613,S(信號肽)得分0.944。當C、Y、S 值計算的結(jié)論是“YES”時表明預測結(jié)果較好。該蛋白的信號肽位于1~32 位氨基酸,其切割位點在第32 位和第33 位氨基酸之間。
圖2 人TM9SF1 信號肽預測
利用TMHMM Server v.2.0 在線工具對TM9SF1 進行跨膜區(qū)域分析,人TM9SF1 蛋白存在9 個跨膜區(qū)結(jié)構(gòu)由此推測該蛋白可能是跨膜蛋白。并采用PSORT II 在線軟件預測人TM9SF1蛋白的亞細胞定位,發(fā)現(xiàn)人TM9SF1 蛋白有65.2%位于質(zhì)膜上,26.1%位于內(nèi)質(zhì)網(wǎng)中,4.3%位于空泡中,4.3%位于線粒體內(nèi)。
從NCBI 上獲取人TM9SF1 基因在不同組織中的表達,可以得出人TM9SF1 基因在甲狀腺、前列腺、膽囊、腎臟等組織中表達量較高,在骨髓、胰腺、心臟、腦等組織中表達量較少,這為接下來進一步研究TM9SF1 基因提供了基礎(chǔ)。
通過利用生物信息學的方法對TM9SF1 基因核酸序列和蛋白質(zhì)序列等方面進行預測和分析發(fā)現(xiàn),TM9SF1 基因位于染色體14q12,大小為6 594 bp;TM9SF1 蛋白由606 個氨基酸組成,含有9 個跨膜區(qū)的疏水蛋白,主要定位于細胞內(nèi),通過在線工具預測人TM9SF1 蛋白質(zhì)在不同組織中的表達,人TM9SF1 在甲狀腺、前列腺、膽囊、腎臟等組織中表達量較高。TM9SF1 蛋白65.2%位于質(zhì)膜上,26.1%位于內(nèi)質(zhì)網(wǎng)中,4.3%位于空泡中,4.3%位于線粒體內(nèi)。
TM9SF1 基因是TM9 超家族的成員,在人體組織中廣泛表達,并且可能與多種疾病的發(fā)生發(fā)展機制有關(guān)。作為帕金森病模型的PC12 細胞應(yīng)用神經(jīng)毒素處理時可誘導TM9SF1 基因的表達[3]。且TM9SF1 在顱內(nèi)破裂動脈瘤血管壁組織蛋白中表達量高,隨后王寶龍在組織中對其進行染色驗證,推測其可能參與了顱內(nèi)動脈瘤的發(fā)病機制[4]。張國英等采用實時熒光定量PCR(qPCR)檢驗特異性siRNA 對TM9SF1 基因的干擾效果,證明了干擾內(nèi)源性TM9SF1 可明顯抑制HUVEC(人臍靜脈血管內(nèi)皮細胞)中炎癥因子ⅠL-1β(白介素1)、IL-8(白介素8)及血管收縮相關(guān)基因ACE1(血管緊張素轉(zhuǎn)化酶抑制劑)的表達[5]。李良忠等發(fā)現(xiàn)氟作用于成骨細胞后能夠影響TM9SF1 mRNA 基因表達的含量,低劑量可以促進其表達,高劑量可以抑制其表達[6]。目前對于TM9SF1 在疾病的發(fā)生發(fā)展中的分子機制還不太清楚,因此,明確TM9SF1 的生物學信息對深入研究該基因的功能有著很重要的意義。