吳小霞 許天委 李國寅
(瓊臺師范學院,瓊臺兒童認知與行為發(fā)展研究中心,???571127)
位于人類22號染色體上的七個APOBEC3(apolipoprotein B mRNA editing enzyme-catalytic polypeptide like3,亦稱APOBEC3)蛋白是一個通過控制外源性逆轉(zhuǎn)錄病毒復制和內(nèi)源性逆轉(zhuǎn)錄因子轉(zhuǎn)座而廣泛參與固有免疫的胞苷脫氨酶家族[1,2],分別是APOBEC3A(簡稱A3A)、APOBEC3B(簡稱A3B)、APOBEC3C(簡稱A3C)、APOBEC3DE(簡稱A3DE)、APOBEC3F(簡稱A3F)、APOBEC3G(簡稱A3G)和APOBEC3H(簡稱A3H)[1-3]。
脫氨酶活性會引起人類基因組的不穩(wěn)定和癌癥,A3A是目前這一家族中最活躍的[4],也是IAP和MusD以及其他逆轉(zhuǎn)錄轉(zhuǎn)座,如LINE-1的有效抑制劑[5]。A3G是該家族中第一個被證實限制逆轉(zhuǎn)錄病毒的家庭成員[5]。A3B在正常組織內(nèi)不表達或表達較低,而在乳腺癌、宮頸癌、膀胱癌、肺癌、卵巢癌等腫瘤組織卻過量表達,盡管機制仍不太清楚,但A3B被認為是癌細胞內(nèi)驅(qū)動腫瘤發(fā)展的體細胞突變源頭[6-9]。A3C抑制病毒和內(nèi)源性逆轉(zhuǎn)錄元件的功能較弱[10,11],但Wittkopp等[10]分析發(fā)現(xiàn)A3C在靈長類進化抵御病原體時起非常重要的作用。而A3DE、A3F和A3H在Vif缺陷的細胞限制HIV-1感染,也在Vif成熟的細胞內(nèi)對病毒基因組進行催化導致亞致死水平的突變[9]。
本文利用生物信息學方法對人類七個APOBEC3蛋白質(zhì)序列進行理化性質(zhì)、蛋白質(zhì)定位等結構和功能的分析,尋找人類APOBEC3蛋白的相似及不同之處,為進一步深入研究和分析人類APOBEC3蛋白的結構與功能的相互關系提供思路。
1.1材料 本文中的人類APOBEC3蛋白序列來自NCBI數(shù)據(jù)庫,A3A(檢索號:AKE33285),包含199個氨基酸,A3B(檢索號:AAH53859)包含251個氨基酸,A3C(檢索號:AAH11739)包含190個氨基酸,A3DE(檢索號:ACB32248)包含386個氨基酸,A3F(檢索號:AAH38808 )包含373個氨基酸,A3G(檢索號:AAZ38722 )包含384個氨基酸以及 A3H(檢索號:ACK77778)包含154個氨基酸。
1.2方法
1.2.1APOBEC3多重序列比對 進入主頁https://www.ebi.ac.uk/Tools/msa/,選擇Launch Clustal Omega,輸入人類APOBEC3的蛋白序列fasta格式,點擊submit。
1.2.2APOBEC3理化性質(zhì)分析 進入網(wǎng)頁http://web.expasy.org,然后點擊Proteomics,找到ExPASy數(shù)據(jù)分析系統(tǒng)中的ProtParam工具,輸入NCBI數(shù)據(jù)庫中獲得的APOBEC3的蛋白序列,點擊computer parameters,從而對APOBEC3的分子量、分子式、酸堿性和穩(wěn)定性等理化性質(zhì)進行分析。在網(wǎng)頁https://www.expasy.org/proteomics,點擊Protsc-ale,使用Protscale工具,輸入APOBEC3蛋白序列,對APOBEC3的親疏水性進行分析。
1.2.3APOBEC3亞細胞定位 進入網(wǎng)頁http://psort.hgc.jp/,選擇PSORTⅡ工具,輸入AOBEC3序列,點擊Submit,進行APOBEC3蛋白亞細胞定位預測。
1.2.4APOBEC3結構分析 進入網(wǎng)頁使用http://www.cbs.dtu.dk/,點擊Prediction Servers,找到TMHMM2.0工具,輸入APOBEC3蛋白序列,分析APOBEC3蛋白的跨膜區(qū)域。
進入https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl網(wǎng)頁,輸入APOBEC3蛋白序列,使用SOPMA工具,預測APOBEC3的二級結構及各成分所占比例。進入網(wǎng)頁http://pfam.xfam.org/,點擊search,輸入APOBEC3序列,點擊submit,預測APOBEC3蛋白的結構域。進入網(wǎng)頁http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index,利用Phyre2工具,進行APOBEC3蛋白質(zhì)三維結構的預測。
1.2.5APOBEC3蛋白相互作用分析 使進入http://string-db.org/,點擊protein by sequence,輸入APOBEC3蛋白質(zhì)序列,選擇Homo sapiens物種,點擊search,構建與APOBEC3蛋白相互作用的蛋白網(wǎng)絡。
1.2.6APOBEC蛋白進化分析 使用MEGA 7.0軟件,Neighbor-joining方法設置Boot-strap分析重復數(shù)為1 000,構建人類APOBEC3分子進化樹。
2.1APOBEC3多重序列比對結果 以A3H(ACK77778)作為參考序列,經(jīng)過Clustal Omega比對運算,結果見表1。
表1 Clustal Omega比對結果Tab.1 Sequence alignment results of clustal omega
2.2理化性質(zhì)分析 利用ProtParam工具,可以分析人類APOBEC3七個蛋白質(zhì)的理化性質(zhì),結果見表2。可以看出人類A3A、A3DE、A3G和A3H含量最高的氨基酸均為Leu,A3B、A3DE、A3G和A3H為堿性蛋白質(zhì),而A3A、A3C和A3F均為弱酸性蛋白質(zhì),A3A、A3B和A3F均為穩(wěn)定蛋白質(zhì),而A3C、A3DE、A3G和A3H為不穩(wěn)定蛋白質(zhì)。
表2 APOBEC3的理化性質(zhì)Tab.2 Physical and chemical properties of APOBEC3
利用ProtScale在線工具分析APOBEC3的親疏水性,結果見表3及圖1,可以看出APOBEC3七個蛋白質(zhì)的親水區(qū)域多于疏水區(qū)域,所以均為親水性蛋白質(zhì)。
2.3亞細胞定位分析 利用PSORTⅡ分析APOBEC3蛋白的亞細胞定位,結果見表4,可看出除A3H可能主要定位于細胞核外,其余APOBEC3可能主要定位于細胞質(zhì)。
2.4跨膜結構分析 經(jīng)TMHMM2.0工具預測結果表5和圖2所示,A3A、A3B、A3C、A3DE、A3F、A3G及A3H均為不跨膜蛋白。圖2中紅色細線表示跨膜區(qū)域,A3A、A3DE、A3F、A3G及A3H位于膜外(粉色細線)的概率幾乎為100%,位于膜內(nèi)(藍色細線)和跨膜區(qū)域(紅色細線)的概率幾乎為0,而A3B、A3C位于膜外的概率接近80%。粉色粗線代表多肽鏈中跨膜區(qū)域所在位置,因沒有跨膜區(qū)域,所以不顯示相應標記。
表5 APOBEC3 TMHMM分析結果Tab.5 TMHMM analysis of APOBEC3 protein
圖2 APOBEC3的跨膜結構分析Fig.2 Analysis of transmembrane structure of APOBEC3Note:In the figure,1 is a red thin line for the transmembrane,2 is a blue thin line for the inside,and 3 is a pink thin line for the outside.
2.5空間結構分析 利用 SOPMA工具分析APOBEC3蛋白的二級結構如圖3,與相應二級結構占比見表6。由此可見,APOBEC3蛋白的二級結構比例相差不大,結構相似,只有A3Fα螺旋所占比例最高,其余蛋白均為無規(guī)則卷曲所占比例最高。
圖3 APOBEC3蛋白二級結構分析Fig.3 Secondary structure analysis of APOBEC3 proteinNote:Blue represents the α helix,red represents the Extended strand,green represents the β turn,and purple represents the Random curl.
表6 APOBEC3蛋白二級結構類型及占比Tab.6 Secondary structure types and proportions of APOBEC3 protein
利用pfam工具得出,A3A、A3B、A3C、A3DE、A3F和A3G都屬于NAD2家族,一個新的AID/APOBEC分支,而A3H屬于APOBEC家族;A3A、A3B、A3C、A3H有一個結構域,而A3DE、A3F和A3G有兩個結構域,A3F和A3G的結構域相似性極高,具體結果如表7。
表7 APOBEC3 Pfam-A的重要匹配Tab.7 Signifitant Pfam-A matches of APOBEC3
利用Phyre2工具,進行APOBEC3蛋白質(zhì)三維結構的預測結果如圖4,三維結構中的二級結構預測結果如圖5。A3A的模板為c2m65A,為人類A3A的NMR結構,可信度100%,覆蓋面為100%;A3B的模板為c5k83C,為靈長類A3G N-結構域的晶體結構,可信度100%,覆蓋面為75%;A3C的模板為c3vowB,為具有HIV-1 vif結合界面的人A3C的晶體結構,可信度為100%,覆蓋面為98%;A3DE的模板為c5k83C,為靈長類A3G N-結構域的晶體結構,可信度為100%,覆蓋面為49%;A3F模板為c5k83C,為靈長類A3G N-結構域的晶體結構,可信度為100%,覆蓋面為51%;A3G的模板為 c2kboA,為野生型A3G結構,可信度為100%,覆蓋面為50%;A3H的模板為c6b0bE,是人類A3H的晶體結構,可信度100%,覆蓋面為90%。
圖4 APOBEC3蛋白三維結構Fig.4 Three-dimensional structure of APOBEC3 protein
圖5 APOBEC3蛋白三維結構下的二級結構Fig.5 Secondary structure of Three-dimensional APOBEC3 protein
2.6APOBEC3蛋白質(zhì)相互作用分析 利用STRING數(shù)據(jù)庫預測APOBEC3的蛋白相互作用網(wǎng)絡,結果如圖6。與A3A、A3B和A3C相互作用的蛋白網(wǎng)絡是一樣的,包括APOBEC1、APOBEC2、APOBEC4等,主要參與胞嘧啶脫氨酶作用(GO:0009972)、DNA去甲基化(GO:0080111)及DNA修飾等過程(GO:0006304),具有有水解酶活性(GO:0016814)、胞嘧啶脫氨酶活性(GO:0004126)及脫氨酶活性(GO:0019239)等。A3A、A3B與A3C都可構成細胞內(nèi)線粒體呼吸鏈復合物Ⅳ(GO:0005751),KEGG通路主要是心肌收縮(hsa04260)、亨廷頓氏病(Huntington′s disease,hsa05016)及帕金森病 (Parkinson′s disease,hsa05012)等,反應途徑有編輯體的形成(HSA-75094)、TP53調(diào)節(jié)代謝基因(HSA-5628897)、呼吸鏈中的電子傳輸(HSA-611105)。
與A3DE相互作用的蛋白質(zhì)主要有CYCS(cytochrome c,somatic,簡稱CYCS)、COX5A(cytochrome c oxidase subunit 5A,簡稱COX5A)、CUL5(cullin 5,簡稱CUL5)等,主要參與電子傳遞鏈(GO:0022900)、線粒體細胞色素c到氧的電子傳遞(GO:0006123)以及線粒體ATP合成耦合電子輸運(GO:0042775)等,具有電子轉(zhuǎn)移活性(GO:0009055)、水解酶活性(GO:0016814)及細胞色素c氧化酶活性(GO:0004129)等。細胞色素c是一種定位于線粒體內(nèi)膜的約12 kD血紅素蛋白,在多種細胞過程中起著關鍵作用,例如在線粒體呼吸復合物Ⅲ和Ⅳ之間傳遞電子,在固有細胞凋亡途徑中是必需的[12]。A3DE可能是細胞內(nèi)呼吸體(GO:0070469)、細胞色素復合體(GO:0070069)及線粒體內(nèi)膜(GO:0005743)等的組成部分,KEGG通路主要是帕金森病 (Parkinson′s disease,hsa05012)、阿爾茨海默病(Alzheimer′s disease,hsa05010)及非酒精性脂肪性肝病(hsa04932)等,反應途徑有TP53調(diào)節(jié)代謝基因(HSA-5628897)、呼吸鏈中的電子傳輸(HSA-611105)及新陳代謝(HSA-1430728)。
圖6 與APOBEC3相互作用的蛋白網(wǎng)絡Fig.6 Protein network interacting with APOBEC3
與A3F相互作用的蛋白質(zhì)有A3G、A1CF(APOBEC1 complementation factor,簡稱A1CF)、CYC1(cytochrome c1,簡稱CYC1)等,主要參與堿基轉(zhuǎn)換或替換編輯(GO:0016553)、胞嘧啶脫氨酶作用(GO:0009972)以及電子傳遞鏈(GO:0022900)等生物過程,具有水解酶活性(GO:0016814)、胞嘧啶脫氨酶活性(GO:0004126)及電子轉(zhuǎn)移活性(GO:0009055)等。A3F可能是細胞內(nèi)細胞色素復合體(GO:0070069)、載脂蛋白B mRNA編輯酶復合物(GO:0030895)及呼吸鏈復合體(GO:0098803)等的組成部分,KEGG通路主要是心肌收縮(hsa04260)、帕金森病 (Parkinson′s disease,hsa05012)及非酒精性脂肪性肝病(hsa04932)等,反應途徑有呼吸鏈中的電子傳輸(HSA-611105)、編輯體的形成(HSA-75094)及Vif介導的A3G降解(HSA-180585)等。與A3G相互作用的蛋白質(zhì)有A3F、SAMHD1(Sterile alpha motif and HD domain-containing protein 1,簡稱SAMHD1)、CDA(cytidine deaminase,簡稱CDA)等,主要參與病毒生命周期負調(diào)節(jié)(GO:1903901)、病毒防御應答(GO:0051607)及胞嘧啶脫氨酶作用(GO:0009972)等生物過程,具有水解酶活性(GO:0016814)、胞嘧啶脫氨酶活性(GO:0004126)以及細胞色素c氧化酶活性(GO:0004129)。SAMHD1是一種dNTPs水解酶,通過在非分化細胞降解細胞內(nèi)dNTPs來限制HIV-1等逆轉(zhuǎn)錄病毒及幾種DNA病毒的復制[13,14]。人類CDA是一個由完全相同的15 kD亞基組成的四聚體,每個亞基都在活性部位含有必不可少的鋅原子,是參與嘧啶修復的酶之一,可利用通過胞嘧啶和脫氧胞嘧啶的水解脫氨基作用分別催化形成尿嘧啶和脫氧尿嘧啶[15]。A3G是細胞內(nèi)載脂蛋白B mRNA編輯酶復合物(GO:0030895)、細胞質(zhì)處理小體(P-body,GO:0000932)及線粒體呼吸鏈復合物Ⅳ(GO:0005751)的組成部分,KEGG通路主要是心肌收縮(hsa04260)、亨廷頓氏病(Hun-tington′s disease,hsa05016)及帕金森病 (Parkinson′s disease,hsa05012)等,反應途徑有編輯體的形成(HSA-75094)、干擾素信號(HSA-913531)及TP53調(diào)節(jié)代謝基因(HSA-5628897)等。
與A3H相互作用的蛋白質(zhì)有A3A、APOBEC2、A3B等,主要參與胞嘧啶脫氨酶作用(GO:0009972)、DNA去甲基化(GO:0080111)及轉(zhuǎn)座負調(diào)控(GO:0010529)等過程,具有脫氧胞苷脫氨酶活性(GO:0047844)、水解酶活性(GO:0016814)及胞嘧啶脫氨酶活性(GO:0004126)等。A3H的反應途徑有編輯體的形成(HSA-75094)。
2.7APOBEC3進化分析 利用MEGA 7.0軟件分析結果如圖7,A3F和A3G的親緣關系更近一些,A3B和A3C的親緣關系更近一些,而A3H與A3A親緣關系要親近一些,而A3DE與A3B和A3C可能源于親緣關系更接近的祖先。
圖7 人類APOBEC3的進化樹Fig.7 Evolution tree of human APOBEC3
本文利用生物信息學方法對人類APOBEC3七個蛋白進行分析和預測,發(fā)現(xiàn)A3A、A3C和A3F為弱酸性蛋白質(zhì),A3B、A3DE、A3G和A3H為堿性蛋白質(zhì),A3A、A3B和A3F為穩(wěn)定的親水蛋白,而A3C、A3DE、A3G和A3H為不穩(wěn)定的親水性蛋白質(zhì);A3H可能主要定位于細胞核外,其余APOBEC3可能主要定位于細胞質(zhì),所有APOBEC3蛋白均為不跨膜蛋白。
APOBEC3蛋白的二級結構比例相差不大,結構極為相似,其中α螺旋和無規(guī)則卷曲所占比例最高。pfam工具分析發(fā)現(xiàn)A3A、A3B、A3C、A3DE、A3F和A3G都屬于NAD2家族,這是一個新的AID/APOBEC分支,而A3H屬于APOBEC家族;A3A、A3B、A3C、A3H有一個結構域,而A3DE、A3F和A3G有兩個結構域,其中A3F和A3G的結構域相似性極高,同時利用Phyre2工具,對APOBEC3蛋白質(zhì)三維結構進行預測。
利用STRING分析發(fā)現(xiàn)APOBEC3除具有已知的胞嘧啶脫氨酶活性外,還具有水解酶活性;A3DE、A3F可能還參與了細胞色素C的電子傳遞;A3A、A3B、A3C參與DNA修飾過程,A3H參與DNA去甲基化過程,這暗示A3A、A3B、A3C和A3H可能參與基因突變,導致基因組的不穩(wěn)定與癌癥等疾病發(fā)生;A3G參與病毒的防御應答,暗示A3G具有廣譜抗病毒功能。而最近的研究表明A3G除了有助于抵抗病毒感染外,A3G在癌癥中也發(fā)揮著重要的非抗病毒功能[16]。利用MEGA 7.0軟件分析顯示A3F和A3G的親緣關系更近一些,A3B和A3C的親緣關系更接近,而A3H與其他A3成員的親緣關系要遠一些。
本文通過對人類APOBEC3七個蛋白理化性質(zhì)和結構功能的分析,為進一步研究APOBEC3的功能及抗病毒藥物的研發(fā)提供參考。