郭冬梅,張蜀敏,易芳,唐珍
(川北醫(yī)學(xué)院生物化學(xué)教研室,四川 南充 637000)
蛋白激酶基因在不同癌基因組中的變異頻率及表達變化*
郭冬梅,張蜀敏,易芳,唐珍
(川北醫(yī)學(xué)院生物化學(xué)教研室,四川 南充 637000)
目的探討蛋白激酶基因突變與癌癥發(fā)生的關(guān)系。方法本研究通過搜索癌基因組數(shù)據(jù)庫,獲得人類全部514個蛋白激酶基因在不同癌基因組中的變異頻率及表達變化。結(jié)果基因表達搜索結(jié)果顯示,絕大多數(shù)基因的表達上調(diào)?;蜃儺愃阉鹘Y(jié)果顯示,512個成員發(fā)生變異,變異頻率最高為90%。其中,基因擴增頻率要高于突變頻率和刪除頻率,且刪除頻率最低。12個成員的突變頻率>30%,功能研究相關(guān)的文獻資料顯示,其中的8個成員可能與癌癥產(chǎn)生密切相關(guān)。結(jié)論筆者推測高頻突變的蛋白激酶基因可能具有重要功能,其很可能是癌基因或者抑癌基因。本研究結(jié)果為進一步深入研究相關(guān)蛋白激酶基因的功能,尤其是功能未知的成員,及其與癌癥發(fā)生的關(guān)系提供重要參考。
蛋白激酶,基因突變,癌基因組學(xué)
癌癥已成為導(dǎo)致人類死亡的首要原因[1]。在過去幾十年中,人們已經(jīng)鑒定出許多與癌癥發(fā)生密切相關(guān)的基因,如肉瘤基因(sarcoma gene,Src)、骨髓細(xì)胞瘤病毒癌基因同源基因、大鼠肉瘤病毒癌基因等[2-4]。盡管導(dǎo)致癌癥發(fā)生的遺傳背景復(fù)雜多樣,但是根據(jù)人類大規(guī)模癌基因組測序結(jié)果顯示,腫瘤組織中突變頻率最高的蛋白常常是蛋白激酶[5-7]。此外,許多原癌基因(突變后成為致癌基因)或抑癌基因(遏制腫瘤形成的基因)的編碼產(chǎn)物也都是蛋白激酶[8]。因此,蛋白激酶突變與癌癥發(fā)生之間有著千絲萬縷的關(guān)系。
在真核細(xì)胞中,蛋白激酶參與絕大多數(shù)的細(xì)胞內(nèi)及細(xì)胞間信號轉(zhuǎn)導(dǎo)途徑。蛋白激酶通過調(diào)節(jié)底物水平的磷酸化或者去磷酸化狀態(tài)進而調(diào)控細(xì)胞內(nèi)的許多發(fā)育過程,包括細(xì)胞的新陳代謝、細(xì)胞周期進程、細(xì)胞骨架重建,以及細(xì)胞的運動、凋亡和分化等。另外,蛋白激酶還參與生物發(fā)育、應(yīng)激反應(yīng)、激素調(diào)控、神經(jīng)系統(tǒng)及免疫系統(tǒng)發(fā)揮作用時的細(xì)胞間信號轉(zhuǎn)導(dǎo)途徑[9-10]。真核生物中編碼蛋白激酶的基因構(gòu)成一個非常龐大的超基因家族,該超家族在人類中擁有516個成員,占人類所有基因數(shù)目的1.7%[11]。已有研究結(jié)果顯示,在某些情況下,首先是某些蛋白激酶成員突變,然后才導(dǎo)致人類疾病產(chǎn)生;而在另外一些情況下,首先是某些疾病已經(jīng)發(fā)生,然后激酶基因再隨之發(fā)生突變[12]。
由于蛋白激酶在細(xì)胞信號轉(zhuǎn)導(dǎo)途徑中的重要作用,該家族在最近幾十年得到廣泛研究。然而,目前該超基因家族中仍然有大量成員的功能不清楚。據(jù)FEDOROV等[8]統(tǒng)計,該家族中有>100個成員(約占總數(shù)的25%)的功能不甚清楚,其中近50%成員的功能完全沒有被研究過。此外,LAHIRY等[13]也對已有激酶蛋白的功能研究進行分類統(tǒng)計,結(jié)果顯示,與疾病有關(guān)聯(lián)的激酶突變類型高達近千種,其中77%的突變類型為錯義突變,而>80%的突變發(fā)生在蛋白激酶的催化結(jié)構(gòu)域及其周圍,這意味著該突變類型很可能會影響相應(yīng)蛋白的功能。已有的研究結(jié)果促使學(xué)者們思考以下2個問題:①蛋白激酶超家族中功能未知的成員是否具有重要功能呢?②如何從眾多成員中挑選出合適的候選基因,作為進一步功能研究的目標(biāo)基因呢?
為探討上述,2個問題,本研究通過搜索相關(guān)癌基因組數(shù)據(jù)庫,獲得人類513個蛋白激酶基因在不同癌基因組中的突變頻率。在此基礎(chǔ)上,通過廣泛查閱有關(guān)蛋白激酶基因功能研究的文獻,進而總結(jié)出在癌基因組中突變頻率較高的基因多具有重要功能,很可能與癌癥的產(chǎn)生密切相關(guān)。因此,筆者可以挑選一些在癌基因組中突變頻率較高,但是目前缺乏清晰功能研究的成員,作為進一步功能研究的候選基因。該研究結(jié)果將為進一步深入研究相關(guān)蛋白激酶基因,尤其是功能未知成員的功能打下堅實基礎(chǔ)。
以人類全部蛋白激酶家族成員為模板[10],利用cBio Portal(www.cbioportal.org)平臺獲取人類全部516個蛋白激酶基因在不同癌基因組數(shù)據(jù)庫中的變異情況。該網(wǎng)站提供一個挖崛、查看以及分析不同層面的癌基因組數(shù)據(jù)庫綜合平臺,其整合目前主要癌基因組數(shù)據(jù)庫資源如癌癥基因組圖譜、癌癥體細(xì)胞突變數(shù)據(jù)庫、國際癌癥基因組聯(lián)盟等,對于檢索基因在不同癌基因組中的變異情況提供便利條件。筆者對516個成員在不同癌基因組中的變異頻率(包括突變、刪除及擴增)進行由高到低的排序。依次從突變頻率最高的基因開始,通過廣泛的文獻及基因數(shù)據(jù)庫檢索,如美國國家醫(yī)學(xué)圖書館,美國國立生物技術(shù)信息中心等,獲取相關(guān)基因的功能研究結(jié)果。另外,筆者還統(tǒng)計每一個基因的表達變化,包括基因表達是上升還是下降,又或者是兩者兼有之。最后綜合分析基因功能與基因突變頻率的關(guān)系。
MANNING等[11]報道人類有516個蛋白激酶基因,但有2個成員信息有誤,未檢索到相關(guān)信息,因此本研究只分析514個成員。蛋白激酶基因在不同癌癥中表達變化的統(tǒng)計發(fā)現(xiàn),514個基因中有3個基因的表達未檢測到任何變化,1個基因表達下降,157個基因的表達既有上調(diào)也有下降,353個基因的表達上調(diào)。癌癥類型與最高變異頻率激酶基因數(shù)的統(tǒng)計發(fā)現(xiàn),514個成員的最高變異率分布在25種癌癥中。其中,乳腺癌和黑色素瘤是擁有最高變異率基因數(shù)最多的癌癥,分別有184和183個激酶基因的最高變異率。筆者推測數(shù)據(jù)庫中乳腺癌標(biāo)本,黑色素瘤較多,因此得到的數(shù)據(jù)多或者激酶基因變異更易發(fā)生。見圖1。
蛋白激酶基因在不同癌癥組織中的變異頻率統(tǒng)計發(fā)現(xiàn),514個成員中有512個成員在相關(guān)癌癥組織中發(fā)生變異,2個成員在已有的癌基因組數(shù)據(jù)庫中未檢測到變異。在本研究中,基因變異包含以下3種情況:突變、刪除及擴增?;蜃儺愵l率等于有基因變異的癌癥組織樣本數(shù)除以總癌癥樣品數(shù)目,而突變頻率、刪除頻率及擴增頻率的計算采用相似的計算公式。對于每一個基因,筆者分別統(tǒng)計其在各種癌癥組織中最高變異率、最高突變率、最高刪除頻率,以及最高擴增頻率。每個成員均在≥1種癌癥組織中發(fā)生變異?;蜃罡咦儺惵视锌赡芡瑫r包含3種變異,即突變、刪除及擴增,或者只包含其中1或2種情況。在3種類型的變異中,頻率的分布具有較大差異??偟恼f來,擴增頻率要比其他兩種變異頻率高,有231個成員的最高擴增頻率>20%,而只有39個成員的最高突變率及4個成員的最高刪除率>20%。該結(jié)果與大量基因表達上調(diào)具有一致性,極有可能是基因擴增導(dǎo)致相應(yīng)的基因表達上調(diào)?;騽h除頻率最低,451個成員的最高刪除率<10%,61個成員在10.1%~20%,僅有3個成員在20.1%~30%,1個成員為31%。突變頻率中,504個基因的最高突變率<30%,12個成員的突變頻率>30%,其中9個成員最高突變率在30.1~40.0%,3個成員是高突變頻率基因,分別是DNA依賴蛋白激酶(protein kinase,DNA-activated,catalytic polypeptide,PRKDC)(44.8%),編碼絲氨酸/蘇氨酸激酶的乳腺和卵巢原癌基因(BRafproto-oncogene,serine/threoninekinase,BRAF)(62.8%)和肌聯(lián)蛋白(Titin,TTN)(90%)。在癌細(xì)胞中,染色體非整倍化的結(jié)果常常是染色體的加倍,由此引起大量基因拷貝數(shù)目的增加,即基因擴增[14],筆者很難確定基因擴增到底是導(dǎo)致癌癥的原因,還是癌癥發(fā)生后的相應(yīng)結(jié)果。因此,在本研究中,筆者著重探討基因突變與癌癥發(fā)生的關(guān)系。見圖1和附表。
圖1 不同癌癥擁有的高變異頻率激酶基因數(shù)目
附表基因最高變異頻率分布個
基因突變導(dǎo)致所編碼蛋白質(zhì)結(jié)構(gòu)和功能的改變是原癌基因的活化的一種重要機制,越來越受到人們的重視。近年來,癌癥研究的一個熱門領(lǐng)域是癌基因組學(xué)。其研究思路是首先對同一個體的癌癥組織與正常癌旁組織的基因組進行比較,從而找到那些與癌癥產(chǎn)生密切相關(guān)的候選基因,再進一步對該候選基因進行功能驗證。癌基因組學(xué),將為研究癌癥發(fā)生的原因和癌癥治療等提供重要線索。例如,在一項有關(guān)急性髓細(xì)胞白血病的癌基因組學(xué)研究中,研究人員通過對患者癌癥組織和正常癌旁組織(皮膚)的基因組序列進行比較分析,從而發(fā)現(xiàn)一些重要的經(jīng)常性突變的基因,進一步分析認(rèn)為該突變極有可能與該癌癥的發(fā)生有關(guān)[15]。因此在本研究中,筆者首先關(guān)注的對象是在癌基因組中具有較高突變頻率的基因。突變頻率最高的成員是TTN基因,在許多癌癥中該基因都具有較高突變頻率,其中在黑色素瘤的腫瘤組織中的突變頻率高達90%。通過檢索文獻,得知該基因?qū)S持染色體的結(jié)構(gòu)具有重要的功能[15],這與最新有關(guān)癌癥形成的新理論—癌細(xì)胞染色體的非整倍化是癌癥的驅(qū)動者相吻合[16]。突變頻率第二高的成員BRAF基因(62.8%)是一個研究較多并且已被確認(rèn)的原癌基因,也被認(rèn)為是癌癥產(chǎn)生的驅(qū)動基因[17]。突變頻率第三高的基因PRKDC(44.8%)參與DNA的損傷與修復(fù),在腫瘤組織中常常過表達,很可能是一個癌癥相關(guān)基因[18]。突變頻率為30%~40%的9個成員中,有5個基因的功能研究結(jié)果顯示,其可能與癌癥發(fā)生相關(guān);2個基因功能研究結(jié)果顯示,可能與癌癥無關(guān);剩下2個成員功能未知。以上2個功能未知成員,或者初步功能研究顯示,與癌癥有一定相關(guān)性的基因,都可作為進一步功能研究的候選基因。在突變率<20%的基因中,也有成員是癌基因或者抑癌基因。例如,廣為人知的原癌基因Src,其最高突變頻率僅為4.5%。這與已有的功能研究結(jié)果相吻合—Src基因致癌是通過表達量的上升完成[3,19-20],因此,與該基因功能密切相關(guān)的區(qū)域在其調(diào)控區(qū),而非編碼區(qū)。此外,筆者通過挖崛Src基因在癌基因組數(shù)據(jù)庫中的相關(guān)信息,也發(fā)現(xiàn)該基因的mRNA數(shù)量在許多癌組織中顯著上調(diào)。見圖2、3。
圖2 TTN基因在不同癌癥細(xì)胞中的變異頻率
圖3 BRAF基因在不同癌組織中的變異頻率
結(jié)合以上基因突變頻率及基因功能研究的文獻報道,筆者認(rèn)為,具有較高突變頻率的基因很可能行使重要的生理功能,也有可能是癌基因或抑癌基因。另外在腫瘤組織中的基因序列突變頻率不高,但是表達量變化巨大的基因,也有可能是癌癥相關(guān)基因。該基因都可作為癌癥研究的候選基因,進而通過分子生物學(xué)實驗技術(shù)驗證其功能。本研究結(jié)果為進一步深入研究相關(guān)蛋白激酶基因,尤其是功能未知成員的功能打下堅實的基礎(chǔ),也將為研發(fā)相關(guān)蛋白激酶抑制劑,即為相關(guān)藥物研究提供重要的理論指導(dǎo)。
[1]International Agency for Research on Cancer,World Health Organization.GLOBOCAN 2012:estimated cancer incidence,mortality and prevalence worldwide in 2012[EB/OL].[2012-05-03]. http://globocan.iarc.fr.
[2]BELL D W.Our changing view of the genomic landscape of cancer[J].J Pathol,2010,202(2):231-243.
[3]BLUME-JENSEN P,HUNTER T.Oncogenic kinase signalling[J]. Nature,2001,411(6835):355-365.
[4]VOGT P K.Retroviral oncogenes:a historical primer[J].Nat Rev Cancer,2012,12(9):639-648.
[5]GREENMAN C,WOOSTER R,FUTREAL P A,et al.Statistical analysis of pathogenicity of somatic mutations in cancer[J].Genetics,2006,173(4):2187-2198.
[6]LIN J,GAN C M,ZHANG X S,et al.A multidimensional analysis of genes mutated in breast and colorectal cancers[J].Genome Res,2007,17(9):1304-1318.
[7]WOOD L D,PARSONS D W,JONES S,et al.The genomic landscapes of human breast and colorectal cancers[J].Sci,2007,318: 1108-1113.
[8]FEDOROV O,MULLER S,KNAPP S.The(un)targeted cancer kinome[J].Nat Chem Biol,2010,6:166-169.
[9]RAKSHAMBIKAI R,MANOHARAN M,GNANAVEL M,et al. Typical and atypical domain combinations in human protein kinases:functions,disease causing mutations and conservation in other primates[J].RSC Adv,2015,5:25132-25148.
[10]LAI S,SAFAEI J,PELECH S.Evolutionary ancestry of eukaryotic protein kinases and choline kinases[J].J Biol Chem,2016, 291:5199-5205.
[11]MANNING G,WHYTE D B,MARTINEZ R,et al.The protein kinase complement of the human genome[J].Science,2002,298 (5600):1912-1934.
[12]COHEN P.Protein kinases-the major drug targets of the twenty-first century[J].Nat Rev Drug Discov,2002,1(4):309-315.
[13]LAHIRY P,TORKAMANI A,SCHORK N J,et al.Kinase mu-tations in human disease:interpreting genotype-phenotype relationships[J].Nat Rev Genet,2010,11(1):60-74.
[14]HACKMAN J P,VIHOLA A K,UDD A B.The role of titin in muscular disorders[J].Ann Med,2003,35(6):434-441.
[15]MARDIS E R,DING L,DOOLING D J,et al.Recurring mutations found by sequencing an acute myeloid leukemia genome[J]. N Engl J Med,2009,361(11):1058-1066.
[16]DAVOLI T,XU A W,MENGWASSER K E,et al.Cumulative haploinsufficiency and triplosensitivity drive aneuploidy patterns and shape the cancer genome[J].Cell,2013,155(4):948-962.
[17]DAVIES H,BIGNELL G R,COX C,et al.Mutations of the BRAF gene in human cancer[J].Nature,2002,417:949-954.
[18]KOTULA E,BERTHAULT N,AGRARIO C,et al.DNA-PKcs plays role in cancer metastasis through regulation of secreted proteins involved in migration and invasion[J].Cell Cycle,2015, 14(12):1961-1972.
[19]CHATZIZACHARIAS N A,KOURAKLIS G P,GIAGINIS C T, et al.Clinical significance of Src expression and activity in human neoplasia[J].Histol Histopathol,2012,27(6):677-692.
[20]CHOI C W,KIM Y H,SOHN J H,et al.Focal adhesion kinase and Src expression in premalignant and malignant skin lesions [J].Exp Dermatol,2015,24:361-364.
(童穎丹 編輯)
Mutation frequency and expression variation of protein kinase genes in different types of cancers*
Dong-mei Guo,Shu-min Zhang,Fang Yi,Zhen Tang
(Department of Biochemistry,North Sichuan Medical College, Nanchong,Sichuan 637000,China)
Objective To study the relationship between mutation of protein kinase(PK)genes and cancer occurrence.Methods In this study,the frequency of sequence alteration and gene expression variation of 514 PK genes in different types of cancers were obtained by searching the databases of cancer genomes.Results Results of gene expression search indicated that most of the PK genes have overexpression.Results of gene alteration search indicated that 512 genes have mutations;among which the frequency of amplification is higher than mutation and deletion,and deletion has the lowest frequency.The highest alteration frequency is 90%. Mutation frequency of 12 genes is higher than 30%,and 8 of them are associated with cancer occurrence according to the functional studies from bibliographic databases.Conclusions We suggest that PK genes with high mutation frequency might have vital functions,and they could be oncogenes or tumor suppressor genes. This study will shed light on our understanding of the function of PK genes(especially those members without functional studies)and their roles in cancer occurrence.
protein kinase;gene mutation frequency;cancer genomics
R730
B
10.3969/j.issn.1005-8982.2016.21.009
1005-8982(2016)21-0045-05
2016-03-14
四川省教育廳自然科學(xué)基金(No:15ZA0213);川北醫(yī)學(xué)院博士啟動基金(No:CBY13-QD-10);川北醫(yī)學(xué)院科研發(fā)展計劃項目(No:CBY13-A-ZP04);川北醫(yī)學(xué)院校級科研課題(No:CBY15-A-YB27)
唐珍,E-mail:tzhbird@163.com;Tel:18808171213