黃志剛,洪秋娜,陳婷婷,李戈楠,何 臻,倫嘉欣,林 婉,賴玉仙,楊 威,鄧俏蓮
(廣東醫(yī)學(xué)院公共衛(wèi)生學(xué)院東莞市環(huán)境醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室,廣東東莞 523808)
?
食管癌易感基因C20orf54的生物信息學(xué)分析*
黃志剛,洪秋娜#,陳婷婷,李戈楠,何臻,倫嘉欣,林婉,賴玉仙,楊威,鄧俏蓮
(廣東醫(yī)學(xué)院公共衛(wèi)生學(xué)院東莞市環(huán)境醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室,廣東東莞 523808)
目的利用生物信息學(xué)方法對食管癌易感新基因C20orf54進(jìn)行特征分析和功能預(yù)測,以獲得該基因及其編碼蛋白更多的功能提示。方法應(yīng)用Blat、Blast、ProtParam、SOPMA、ScanProsite、SignalP4.1、TMHMM、PSORT和UniGene等軟件或數(shù)據(jù)庫,進(jìn)行染色體定位、序列的相似性比較、理化性質(zhì)、二級結(jié)構(gòu)、亞細(xì)胞定位、功能位點(diǎn)識別。采用逆轉(zhuǎn)錄-聚合酶鏈反應(yīng)(RT-PCR),驗(yàn)證C20orf54基因在食管癌細(xì)胞和鼻咽癌細(xì)胞中的表達(dá)情況。結(jié)果C20orf54基因進(jìn)化保守,蛋白質(zhì)不穩(wěn)定,具有疏水性,定位于細(xì)胞膜的可能性最高,序列中預(yù)測有蛋白激酶C、酪蛋白激酶Ⅱ磷酸化位點(diǎn)和N-糖基化位點(diǎn)及N-豆蔻?;稽c(diǎn)。二級結(jié)構(gòu)主要是α螺旋和無規(guī)則卷曲。C20orf54基因可在食管癌細(xì)胞和鼻咽癌細(xì)胞中表達(dá)。結(jié)論人類C20orf54蛋白是定位于細(xì)胞膜上的不穩(wěn)定疏水蛋白,可能在體內(nèi)參與多種生物學(xué)過程,但可能并不是在食管癌組織特異表達(dá)的分子標(biāo)志。
食管腫瘤;生物信息學(xué);C20orf54
食管鱗狀細(xì)胞癌(簡稱食管癌)是全世界十大惡性腫瘤之一,具有特定區(qū)域高發(fā)的特點(diǎn)。世界上食管癌發(fā)病率和病死率最高的地區(qū)集中在我國的河南、河北和山西三省交界的太行山地區(qū),食管癌仍是這些地區(qū)腫瘤相關(guān)死亡的主要原因[1]。盡管普遍認(rèn)為食管癌的發(fā)生是由環(huán)境、遺傳等多種因素綜合作用的結(jié)果,但其致癌的分子機(jī)制至今未明。新近的全基因組關(guān)聯(lián)研究(GWAS)在鑒定復(fù)雜性疾病易感基因方面取得的成就,為揭示食管癌的發(fā)病機(jī)制提供了重要證據(jù)。以我國人群為基礎(chǔ)的食管癌GWAS發(fā)現(xiàn),核黃素轉(zhuǎn)運(yùn)基因又稱C20orf54基因的rs13042395位點(diǎn)是食管癌的易感位點(diǎn),C20orf54成為新的食管癌易感基因而備受研究者重視[2]。
目前已有多篇文獻(xiàn)報道了C20orf54基因的功能性遺傳變異與食管癌的發(fā)生有關(guān)[3-5],但也有兩項(xiàng)獨(dú)立的研究認(rèn)為C20orf54基因與食管癌無關(guān)[6-7]。因此,C20orf54基因的生物學(xué)功能是什么,其在食管癌的發(fā)生、發(fā)展過程中發(fā)揮什么作用等問題,亟待進(jìn)一步研究解決。本研究利用生物信息學(xué)方法對C20orf54基因及其編碼的蛋白進(jìn)行了分析和功能預(yù)測,并觀察C20orf54基因在不同上皮細(xì)胞內(nèi)的表達(dá)情況,為進(jìn)一步深入研究C20orf54基因的生物學(xué)功能提供參考依據(jù)。
1.1基因組定位及外顯子分析用UCSC Genome Bioinformatics 的Blat數(shù)據(jù)庫進(jìn)行基因組定位及外顯子分析(http:// genome.ucsc.edu/cgi-bin/hgBlat)。
1.2序列比對利用NCBI的Blastn程序進(jìn)行C20orf54基因的核苷酸序列同源性分析;用BlastP程序進(jìn)行氨基酸同源性對比(http://blast.ncbi.nlm.nih.gov/)。
1.3理化性質(zhì)分析利用ExPASy 的ProtParam Tool 軟件(http://web.expasy.org/protparam)預(yù)測等電點(diǎn)、分子量、疏水性、電荷分布等。
1.4蛋白質(zhì)結(jié)構(gòu)預(yù)測利用SOPMA程序(http://npsa-pbil.ibcp.fr/cgi-bin/ npsa_automat.pl?page= npsa_sopma.html)分析C20orf54蛋白的二級結(jié)構(gòu);利用ExPASy 的ScanProsite tool工具(http://prosite.expasy.org/scanprosite/)預(yù)測蛋白質(zhì)的功能性位點(diǎn);信號肽剪切位點(diǎn)利用SignalP4.1(http://www.cbs.dtu.dk/services/SignalP/)預(yù)測;TMHMM程序預(yù)測跨膜信息(http://www.cbs.dtu.dk/services/TMHMM/);保守結(jié)構(gòu)域及其功能用NCBI/CDD預(yù)測。
1.5亞細(xì)胞定位分析利用PSORT (http://psort.hgc.jp/form2.html) 進(jìn)行亞細(xì)胞定位預(yù)測。
1.6RT-PCR擴(kuò)增C20orf54基因編碼區(qū)Trizol法提取食管癌細(xì)胞(ECA109)、鼻咽癌細(xì)胞(CNE-2Z)總RNA,按逆轉(zhuǎn)錄試劑盒(QIAGEN)操作步驟進(jìn)行逆轉(zhuǎn)錄。以cDNA為模板,擴(kuò)增C20orf54 基因編碼區(qū)序列,上游引物:5′-ATG GCC TTC CTG ATG CAC C-3′,下游引物:5′-CTA GGC TGG ACA GTG CAG AT-3′。擴(kuò)增條件:94 ℃ 4 min;94 ℃ 50 s,58 ℃ 50 s,72 ℃ 1 min,共30個循環(huán);72 ℃ 10 min。取5 μL PCR產(chǎn)物進(jìn)行1.5%瓊脂糖凝膠電泳鑒定。將擴(kuò)增產(chǎn)物送上海立菲生物技術(shù)有限公司(廣州分公司)測序,并將序列登錄GenBank數(shù)據(jù)庫。
2.1基因組定位及外顯子分析將C20orf54基因序列(NM_033409)與人類基因組草圖庫進(jìn)行比對,該cDNA 序列定位于20號染色體740,724~749,228區(qū)域(20p13),基因組跨越8,505 bp。外顯子分析發(fā)現(xiàn),C20orf54基因由5個外顯子和4個內(nèi)含子所組成,內(nèi)含子和外顯子交界區(qū)均符合AG-GT規(guī)則。
2.2序列比對結(jié)果經(jīng)BLASTn在nr核苷酸序列數(shù)據(jù)庫在線同源性分析C20orf54基因序列,發(fā)現(xiàn)人與大猩猩、長臂猿、恒河猴等靈長類哺乳動物的相似性在95%以上,其中大猩猩最高達(dá)98%;而人與狼犬、家貓、虎鯨及小鼠等物種的相似性分別為85%、85%、85%和83%。經(jīng)對C20orf54的多物種氨基酸序列相似性比較發(fā)現(xiàn),人與大猩猩、黑長臂猿的相似性最高達(dá)到99%,與松鼠猴、狨毛猴的相似性為94%,與家豚鼠、狼犬、海豚、小鼠和青將魚的相似性分別為84%、82%、81%、74%和47%。C20orf54蛋白的氨基酸組成在脊椎動物中保守性較高。
2.3C20orf54蛋白的理化性質(zhì)C20orf54基因編碼的蛋白質(zhì)氨基酸長度為469 aa,相對分子質(zhì)量為50 805.1,理論等電點(diǎn)為5.46,pH7.0時帶負(fù)電荷(-10.947)。該蛋白質(zhì)的半衰期在哺乳動物網(wǎng)織紅細(xì)胞中為30 h,在酵母體內(nèi)超過20 h,大腸桿菌體內(nèi)可超過10 h;不穩(wěn)定指數(shù)為43.92(>40為不穩(wěn)定),屬于不穩(wěn)定蛋白質(zhì);脂肪指數(shù)為119.06,總體平均親水值為0.882,屬于疏水蛋白質(zhì)。
2.4蛋白質(zhì)結(jié)構(gòu)預(yù)測及亞細(xì)胞定位分析C20orf54蛋白二級結(jié)構(gòu)預(yù)測發(fā)現(xiàn),含α螺旋(Hh)36.46%,β折疊(Tt)5.12%,延伸鏈(Ee)和無規(guī)則卷曲(Cc)分別占15.35%、43.07%。 ScanProsite tool工具尋找蛋白質(zhì)的功能性位點(diǎn),結(jié)果發(fā)現(xiàn)在該蛋白質(zhì)氨基酸序列中存在1個蛋白激酶C磷酸化位點(diǎn)、3個酪蛋白激酶Ⅱ磷酸化位點(diǎn)、3個N-糖基化位點(diǎn)及10個N-豆蔻?;稽c(diǎn),未發(fā)現(xiàn)其他基序及保守結(jié)構(gòu)域存在。TMHMM程序預(yù)測C20orf54蛋白可能存在11個跨膜區(qū)域,N末端在膜內(nèi)的概率為99.621%。亞細(xì)胞定位分析認(rèn)為,C20orf54蛋白在細(xì)胞膜表達(dá)的可能性最高(73.9%),其次為內(nèi)質(zhì)網(wǎng)(21.7%)和線粒體(4.3%)。而SignalP4.1未預(yù)測出信號肽剪切位點(diǎn)。
2.5RT-PCR結(jié)果本研究選擇食管癌(ECA109)和鼻咽癌(CNE-2Z)兩種細(xì)胞株,抽提細(xì)胞總RNA,進(jìn)行RT-PCR,發(fā)現(xiàn)均可擴(kuò)增出約1 400 bp的C20orf54基因編碼區(qū)片段。瓊脂糖凝膠電泳結(jié)果見圖1、2。測序證實(shí)擴(kuò)增片段與C20orf54基因編碼區(qū)序列一致。
1:LD2000 Marker;2:擴(kuò)增產(chǎn)物。
圖1食管癌細(xì)胞ECA109擴(kuò)增結(jié)果
1:LD2000 Marker;2:擴(kuò)增產(chǎn)物。
圖2鼻咽癌細(xì)胞CNE-2Z擴(kuò)增結(jié)果
食管癌GWAS發(fā)現(xiàn),C20orf54基因rs13042395位點(diǎn)的遺傳變異與食管癌有關(guān),C20orf54基因作為新的食管癌易感基因成為研究熱門[2]。C20orf54是人類核黃素轉(zhuǎn)運(yùn)基因,該基因定位于20p13,其編碼產(chǎn)物為核黃素轉(zhuǎn)運(yùn)蛋白。目前,人類核黃素轉(zhuǎn)運(yùn)蛋白的生物學(xué)功能尚未闡明,因其與鼠核黃素轉(zhuǎn)運(yùn)蛋白有83%的相似性,所以推測人類核黃素轉(zhuǎn)運(yùn)蛋白與鼠相似,在小腸和結(jié)腸中高表達(dá),在腸組織對核黃素的吸收中發(fā)揮重要作用[8]。
利用Blast程序在多個物種內(nèi)發(fā)現(xiàn)與人C20orf54蛋白相似的序列,其相似度從高等靈長類動物大猩猩、類人猿到海洋哺乳動物海豚、從嚙齒類動物小鼠到低等脊椎動物青將魚等依次降低。說明人C20orf54基因進(jìn)化上相對保守,其可能參與基本生物學(xué)過程。對C20orf54蛋白質(zhì)的二級結(jié)構(gòu)預(yù)測發(fā)現(xiàn),其肽鏈上α螺旋和無規(guī)則卷曲水平較高,表明該蛋白具有較好的可塑性。理化性質(zhì)分析發(fā)現(xiàn),C20orf54蛋白是不穩(wěn)定的疏水蛋白質(zhì),可能定位在細(xì)胞膜上(73.9%),發(fā)揮其多種生物學(xué)作用。C20orf54蛋白可能存在11個跨膜區(qū)域,而跨膜結(jié)構(gòu)多構(gòu)成受體、通道,執(zhí)行信號傳導(dǎo)等重要功能[9-10]。
對C20orf54蛋白進(jìn)行功能性位點(diǎn)分析發(fā)現(xiàn),其氨基酸序列中存在蛋白激酶C磷酸化位點(diǎn)、酪蛋白激酶Ⅱ磷酸化位點(diǎn)、N-糖基化位點(diǎn)及N-豆蔻?;稽c(diǎn)。蛋白激酶C和酪蛋白激酶Ⅱ磷酸化位點(diǎn)是信號傳導(dǎo)調(diào)控中的常見分子結(jié)構(gòu),在細(xì)胞增殖及細(xì)胞周期中有著廣泛的調(diào)節(jié)作用[11]。N-糖基化位點(diǎn)是蛋白質(zhì)糖基化修飾的識別位點(diǎn),蛋白質(zhì)的糖基化修飾使糖鏈與糖結(jié)合蛋白相互作用,參與眾多生理或病理過程,也可以作為微生物和有毒物質(zhì)的結(jié)合位點(diǎn)。蛋白質(zhì)的糖基化修飾是生物體調(diào)控蛋白質(zhì)在組織和細(xì)胞中的定位、功能、活性、壽命和多樣性的一種普遍的翻譯后方式[12]。而豆蔻?;稽c(diǎn)可參與細(xì)胞生長發(fā)育、信號傳導(dǎo)和腫瘤發(fā)生等重要生理過程。由于蛋白質(zhì)結(jié)構(gòu)特異性識別相關(guān)分子是其行使功能的關(guān)鍵,故該蛋白可能通過磷酸化、糖基化及豆蔻酰化而發(fā)揮多種重要的生物學(xué)作用。
本研究發(fā)現(xiàn),食管癌(ECA109)和鼻咽癌(CNE-2Z)均可擴(kuò)增出約1 400 bp的片段,經(jīng)測序證實(shí)與C20orf54基因編碼區(qū)序列一致,說明C20orf54基因在食管癌及鼻咽癌細(xì)胞中均是有表達(dá),C20orf54基因可能不是在食管癌組織特異表達(dá)的分子標(biāo)志。
在發(fā)現(xiàn)C20orf54基因與食管癌的關(guān)系之前,已有多篇報道認(rèn)為,C20orf54基因突變與Brown-Vialetto-Van Laere綜合征(BVVLS)有關(guān)。BVVLS是一種罕見的以進(jìn)行性橋延麻痹伴有耳聾為特點(diǎn)的神經(jīng)障礙疾病。目前認(rèn)為,C20orf54基因突變是導(dǎo)致BVVLS發(fā)生的重要致病因素,盡管其具體致病機(jī)制尚不清楚[13-16]??梢?,人類C20orf54基因可能在體內(nèi)多種生理、病理過程中發(fā)揮作用,有必要對其進(jìn)行更深入的研究。本文通過生物信息學(xué)分析初步揭示了人類食管癌新易感基因C20orf54及其編碼產(chǎn)物的基本特性,為進(jìn)一步開展C20orf54基因的功能和相關(guān)分子機(jī)制研究奠定了基礎(chǔ)。
[1]鄒小農(nóng).食管癌流行病學(xué)[J].中華腫瘤防治雜志,2006,13(18):1445-1448.
[2]Wang LD,Zhou FY,Li XM,et al.Genome-wide association study of esophageal squamous cell carcinoma in Chinese subjects identifies susceptibility loci at PLCE1 and C20orf54[J].Nat Genet,2010,42(9):759-763.
[3]Wei W,Ji A,Wang J,et al.Functional single nucleotide polymorphism in C20orf54 modifies susceptibility to esophageal squamous cell carcinoma[J].Dis Esophagus,2013,26(1):97-103.
[4]Ji A,Wang J,Yang J,et al.Functional SNPs in human C20orf54 gene influence susceptibility to esophageal squamous cell carcinoma[J].Asian Pac J Cancer Prev,2011,12(12):3207-3212.
[5]紀(jì)愛芳,魏武,楊建洲,等.核黃素轉(zhuǎn)運(yùn)蛋白基因位點(diǎn)單核苷酸多態(tài)性與食管鱗癌遺傳易感性的關(guān)系[J].中華內(nèi)科雜志,2012,51(12):982-986.
[6]Palmer AJ,Lochhead P,Hold GL,et al.Genetic variation in C20orf54,PLCE1 and MUC1 and the risk of upper gastrointestinal cancers in Caucasian populations[J].Eur J Cancer Prevention,2012,21(6):541-544.
[7]Gu H,Ding G,Zhang W,et al.Replication study of PLCE1 and C20orf54 polymorphism and risk of esophageal cancer in a Chinese population[J].Mol Biol Rep,2012,39(9):9105-9111.
[8]Yamamoto S,Inoue K,Ohta KY,et al.Identification and functional characterization of rat riboflavin transporter 2[J].J Biochem,2009,145(4):437-443.
[9]Breton G,Danyluk J,Charron JB,et al.Expression profiling and bioinformatic analyses of a novel stress-regulated multispanning transmembrane protein family from cereals and Arabidopsis[J].Plant Physiol,2003,132(1):64-74.
[10]White SH,Von Heijne G.Transmembrane helices before,during,and after insertion[J].Curr Opin Struct Biol,2005,15(4):378-386.
[11]姜錚,王芳,何湘,等.蛋白質(zhì)磷酸化修飾的研究進(jìn)展[J].生物技術(shù)通訊,2009,20(2):233-237.
[12]周蕾,顧建新.N-糖基化位點(diǎn)鑒定方法和非經(jīng)典N-糖基化序列[J].生命科學(xué),2011,23(6):605-611.
[13]Bandettini Di Poggio M,Gagliardi S,Pardini M,et al.A novel compound heterozygous mutation of C20orf54 gene associated with Brown-Vialetto-Van Laere syndrome in an Italian family[J].Eur J Neurol,2013,20(7):e94-95.
[14]Houlden H.A commentary on four novel C20ORF54 mutations identified in Brown-Vialetto-Van laere syndrome patients[J].J Hum Genet,2012,57(9):555.
[15]Dezfouli MA,Yadegari S,Nafissi S,et al.Four novel C20orf54 mutations identified in Brown-Vialetto-Van Laere syndrome patients[J].J Hum Genet,2012,57(9):613-617.
[16]Koy A,Pillekamp F,Hoehn T,et al.Brown-Vialetto-Van laere syndrome:a riboflavin-unresponsive patient with a novel mutation in the C20orf54 gene[J].Pediatr Neurol,2012,46(6):407-409.
東莞市社會科技發(fā)展項(xiàng)目(2013108101052);廣東省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項(xiàng)目(2KY12023)。作者簡介:黃志剛(1971-),副教授,博士,主要從事腫瘤流行病學(xué)研究。#并列第一作者。
·經(jīng)驗(yàn)交流·10.3969/j.issn.1671-8348.2016.22.035
R735.1
B
1671-8348(2016)22-3121-03
2016-02-08
2016-03-15)