洪躍輝,李文哲,陳棟華,薛金滿,王江海
(1.廣東江門中醫(yī)藥職業(yè)學院,廣東江門 529000;2.中山大學海洋科學學院,廣東廣州 510006)
細胞色素P450是一類分布廣泛的血紅素蛋白超家族末端單加氧酶,是生物界中最具催化多樣性的催化劑[1-2],能使多種難降解物質轉化為可生物降解的化合物,在環(huán)境保護(如石油污染修復、化學制藥廢水的處置)和農(nóng)業(yè)等領域中具有廣闊的應用前景[3]。其中P450在環(huán)境修復方面的應用探索是近年來國際上的研究熱點之一。例如,近年來有不少學者將P450基因導入植株中,用于清除殺蟲劑、除草劑等環(huán)境污染物[4]。
雖然目前已分離鑒定出不少P450酶,但目前已知的天然P450酶對難降解物質的催化活性較低[4]。因此,在面臨環(huán)境污染物種類和數(shù)量依然不斷增加的情況下,尋找具有新催化活性的P450酶或通過基因改造來改善現(xiàn)有酶的性質具有非常重要的科學意義。目前已經(jīng)有一些對P450基因進行改造的成功例子。例如,李紅梅[5]以P450 BM-3為研究對象,從該親本酶改造出具有新催化特性的酶,并且提高了酶活性,使其應用前景變得更加廣闊。為了對P450基因進行有針對性的改造,必須對其基本性質有較深入的認識。
無色桿菌HZ01(Achromobacter sp.HZ01)是能高效降解石油烴和合成新型脂肽類表面活性劑的海洋新菌株[6-7]。Hong等[8-9]采用全基因組和轉錄組測序剖析了該細菌的遺傳背景,預測出一種P450酶在該細菌降解正構烷烴的末端氧化途徑中發(fā)揮重要作用。該研究雖然已經(jīng)獲得了無色桿菌HZ01的細胞色素P450基因序列,但該P450的性質仍未明晰。本研究通過生物信息學分析揭示該P450的基本性質,為后續(xù)基因克隆表達、基因改造以及酶的工業(yè)化生產(chǎn)等深入研究和應用奠定基礎。
從NCBI網(wǎng)站下載無色桿菌HZ01的細胞色素P450基因序列和蛋白序列。基因序列編號為LWKV01000001.1:c1088606-1086252,蛋白序列編號為WP_111825096.1。
采用ProtParam(http://web.expasy.org/protparam/)分析菌株HZ01_P450的理化性質,包括氨基酸組成、等電點、消光系數(shù)、不穩(wěn)定指數(shù)、親水性平均系數(shù)等[10]。分析時與Alcanivoraxborkumensis SK2的P450進行比較。
采用NCBI網(wǎng)站的ORFfinder工具(https://www.ncbi.nlm.nih.gov/orffinder/)查找HZ01_P450基因的開放閱讀框。
采用MEGA 6.06軟件對細胞色素P450序列進行系統(tǒng)進化樹分析。
使用ProtScale(http://web.expasy.org/protscale/)分析HZ01_P450的親疏水性特點[11],并與Alcanivoraxborkumensis SK2的P450進行比較。
采用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)對P450進行跨膜區(qū)分析[12]。
采用SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP-4.1/)對P450進行信號肽預測[13],參數(shù)設置選擇神經(jīng)網(wǎng)絡法。
使用SOPMA對P450進行二級結構預測[14]。
使用SWISS-MODEL(http://swissmodel.expasy.org)預測P450的三級結構[15]。
使用SMART軟件(http://smart.embl-heidelberg.de/)預測P450的功能域。
采用ProtParam對細胞色素P450的理化性質進行分析,結果如表1所示。P450序列中亮氨酸殘基含量最高,占9.1%。與Alcanivoraxborkumensis SK2比較,菌株HZ01_P450的氨基酸殘基數(shù)目、分子量和原子總數(shù)都大于前者。AlcanivoraxborkumensisSK2是廣泛存在的一種海洋細菌,能以石油烴為唯一碳源和能源。Schneiker等[16]采用高通量測序從該細菌中鑒定出與烷烴降解相關的細胞色素P450。前期通過比較基因組分析發(fā)現(xiàn),菌株SK2的基因組比HZ01小,且基因組較精簡[9]。菌株SK2_P450的氨基酸殘基數(shù)目、分子量和原子總數(shù)較小的原因可能與其基因組精簡性有一定關系。
表1 細胞色素P450的理化性質
從表1的理化參數(shù)結果可知,兩種P450的親水性平均系數(shù)(GRAVY)都為負數(shù),這說明這兩種P450屬于親水性蛋白。預測等電點都小于6.50,這一數(shù)據(jù)在后續(xù)對HZ01_P450進行分離純化或電泳鑒定時,可作為一個重要的參考信息,有助于選擇合適的緩沖液。不穩(wěn)定指數(shù)(instability index)可用于評估蛋白質的穩(wěn)定性,當某種蛋白的不穩(wěn)定指數(shù)小于40時,被預測為穩(wěn)定蛋白;當不穩(wěn)定指數(shù)大于40時,則該蛋白可能是不穩(wěn)定的[17]。表1顯示,兩種P450的不穩(wěn)定指數(shù)估測值分別為49.15(菌株HZ01)和40.12(菌株SK2),表明它們可能是不穩(wěn)定蛋白。這一結果提示,在后續(xù)HZ01_P450的應用中,需要考慮其不穩(wěn)定性,這一性質可作為基因改造的一個著手點。
開放閱讀框查找結果如表2所示,在HZ01_P450基因中查找到13個ORF,有6個ORF位于正鏈,ORF1最長(2355 nt/784 aa),位于<1至2355 bp區(qū)域。
系統(tǒng)進化樹分析結果如圖1所示,無色桿菌HZ01的細胞色素P450與木糖氧化無色桿菌(Achromobacterxylosoxidans)的P450聚在一起,為一個單獨分支,說明這兩種P450的親緣關系較近;而菌株HZ01_P450與菌株SK2_P450的親緣關系則較遠。從圖中還可以看出,與無色桿菌屬(Achromobacter)的P450聚類較近,而與其他種屬細菌的P450聚類相距較遠。
圖1 P450的系統(tǒng)進化樹
使用ProtScale分析了細胞色素P450的親疏水性,結果如圖2所示。圖中的橫軸表示氨基酸序列的位置,縱軸代表氨基酸的標度值(得分),標度值為負數(shù)時代表親水性,標度值為正數(shù)時表示疏水性。在HZ01_P450的氨基酸序列中,標度值小于-2.30的位置分別在第49、197、213、214、215、359、447、763位氨基酸,這些位置可能是HZ01_P450的主要親水分布區(qū),其中第215位的精氨酸(Arg)具有最低分值(-2.667)。標度值大于2.30的位置分別在第476、477、478、581、582位氨基酸,這些位置可能是HZ01_P450的主要疏水分布區(qū),其中第477位的絲氨酸(Ser)具有最高分值(3.100)。在菌株SK2的P450序列中,第390位的精氨酸(Arg)具有最低分值(-2.956);第302位的丙氨酸(Ala)具有最高分值(2.500)。兩種P450氨基酸序列的最低分值都出現(xiàn)在精氨酸(Arg)位置(雖然分值有微小差別)。在兩種P450序列中,有較多區(qū)域表現(xiàn)為親水性,與理化參數(shù)分析推測兩種P450都屬于親水性蛋白的結果一致。
蛋白跨膜區(qū)是指蛋白質序列中跨越細胞膜的區(qū)域,跨膜蛋白的疏水區(qū)往往也是其跨膜區(qū)[18]。采用TMHMM Server v.2.0進行跨膜區(qū)分析時,若整條序列被預測為“inside”或“outside”,則說明該序列不含跨膜螺旋。如圖3所示,HZ01_P450序列從頭至尾被預測為“outside”的概率值幾乎都為1,而且預測的跨膜螺旋數(shù)(TMHs)為0,表明該P450不存在跨膜區(qū)。目前在原核生物中發(fā)現(xiàn)的細胞色素P450系統(tǒng)組分都是可溶的,屬于非膜結合型蛋白[19]。根據(jù)本研究的理化參數(shù)、親疏水性和跨膜區(qū)分析結果推測,海洋新菌株HZ01的細胞色素P450是可溶的親水性非跨膜蛋白。
采用SignalP 4.1對細胞色素P450序列進行了信號肽預測,選用的神經(jīng)網(wǎng)絡法涉及C、S、Y值,含義分別是:信號肽區(qū)域的S值較高,信號肽剪切位點處C值最高,max.Y是綜合考慮C值和S值的一個參數(shù)。如圖4的結果顯示,C、S、Y值都較低,且signal peptide參數(shù)結果為NO,說明該P450不存在信號肽。
圖3 細胞色素P450的跨膜區(qū)分析
圖4 信號肽預測分析
使用SOPMA軟件預測了細胞色素P450的二級結構,結果如圖5所示。發(fā)現(xiàn)該P450含有4種二級結構:α螺旋(Hh),所占比例是35.08%;延伸鏈(Ee),占比15.82%;β-轉角(Tt),占比6.12%;無規(guī)卷曲(Cc),占比最高,為42.98%。
圖5 細胞色素P450的二級結構預測
使用SWISS-MODEL對菌株HZ01_P450進行了三級結構預測,結果如圖6所示。從三級結構模型可推斷,海洋新菌株HZ01的細胞色素P450屬于球狀蛋白,主要由無規(guī)卷曲和α螺旋組成,與二級結構預測結果一致。
采用SMART軟件在HZ01_P450中預測出2個功能域,結果如圖7所示。2個低復雜區(qū)域(low complexity region,LCR)分別位于氨基酸序列的2~17和574~586,長度分別為16 aa(LCR1)和13 aa(LCR2)。目前認為,LCR在蛋白質間的功能性結合等多種生物學功能中發(fā)揮關鍵作用,LCR在序列中的具體位置可能與其結合性質和生物學作用密切相關[20]。
圖6 細胞色素P450的三級結構
圖7 細胞色素P450的功能域
本研究通過生物信息學分析首次剖析了無色桿菌HZ01細胞色素P450的基本性質。分析結果主要表明:(1)P450基因中最長的ORF長度為2355 nt;(2)HZ01_P450與木糖氧化無色桿菌的P450親緣關系較近;(3)在P450序列中有較多區(qū)域表現(xiàn)出親水性,且序列中不存在信號肽;(4)該P450可能是可溶性非跨膜蛋白,二級結構中無規(guī)卷曲所占比例最高,三級結構分析結果可推斷HZ01_P450屬于球狀蛋白;(5)SMART軟件預測出該P450含有2個低復雜區(qū)域。這些結果為無色桿菌HZ01_P450的應用(如環(huán)境修復等)奠定了基礎,有助于后續(xù)進行基因改造、酶的工業(yè)化生產(chǎn)等更深入的研究。