來怡君,陳 紅,章印紅,張 杰,朱寶生,唐新華
(1.昆明理工大學醫(yī)學院,昆明 650500;2.昆明理工大學附屬醫(yī)院/云南省 第一人民醫(yī)院遺傳診斷中心,昆明 650032)
苯丙酮尿癥(phenylketonuria,PKU)是一種常見的氨基酸代謝障礙性疾病,屬常染色體隱性遺傳病,臨床表現(xiàn)為智力低下、自閉癥、運動障礙等[1]。該病主要因肝臟中的苯丙氨酸羥化酶(phenylalanine hydroxylase,PAH)缺乏或者活性不足導(dǎo)致苯丙氨酸不能正常代謝為酪氨酸而產(chǎn)生[2]。早在1983年P(guān)AH基因就被成功分離和克隆,并被公認為是PKU的致病基因[3]。近幾年,隨著基因組和外顯子組測序的發(fā)展,很多新發(fā)突變,特別是一些癥狀相對較輕的突變也逐漸被檢測出來[4]。截至目前,已經(jīng)在患有PKU的患者中鑒定了約1 000種不同的PAH基因突變體[5]。并且PAH基因具有突變異質(zhì)性,不同種族與地區(qū)的突變位點及分布有較大差異[6]。本研究采用云南省漢族PKU患者中發(fā)現(xiàn)的6例PAH基因新發(fā)突變?yōu)椴牧?,從生物信息學角度分析PAH基因的錯義突變與蛋白結(jié)構(gòu),以及進一步可能導(dǎo)致的功能改變的關(guān)系,并利用生物信息學方法嘗試探討新發(fā)剪接突變的發(fā)生機制,為以后關(guān)于PKU的研究提供有價值的信息。
1.1材料 (1)6例數(shù)據(jù)庫中未收錄的PAH基因新突變見表1。(2)使用的網(wǎng)絡(luò)資源,包括美國國立生物技術(shù)信息中心(NCBI,網(wǎng)址:https://www.ncbi.nlm.nih.gov/)、Swiss-Model軟件(https://www.swissmodel.expasy.org/)、CRYP-SKIP(http://cryp-skip.img.cas.cz/)、BDGP軟件(http://www.fruitfly.org/seq_tools/splice.html)、HSF(http://www.umd.be/HSF/)等。
表1 云南地區(qū)PKU患者PAH基因新突變[7]
1.2方法
1.2.1獲取人類PAH基因全序列及其分析 從NCBI的GenBank中基因數(shù)據(jù)庫獲取人類PAH基因組定位和其編碼的蛋白質(zhì)序列信息。
1.2.2PAH新發(fā)錯義突變及插入突變位點所在外顯子的同源建模及功能分析 利用Swiss-model在線工具對1例錯義突變和2例插入突變所在外顯子區(qū)域進行外顯子同源建模,分析基因突變對其所在外顯子的蛋白結(jié)構(gòu)和功能的影響。
1.2.3PAH新發(fā)剪接突變的生物學效應(yīng)分析 采用3種基于不同網(wǎng)絡(luò)算法的生物信息學工具分析新發(fā)現(xiàn)的剪接變異。其中,在CRYP-SKIP界面上直接將變異序列按其要求的格式輸入即可獲得預(yù)測結(jié)果,包括因剪接變異導(dǎo)致的隱蔽剪接位點激活(PCR-E)和外顯子跳躍(1-PCR-E)的可能性大小兩個結(jié)果[8]。柏克萊果蠅基因組項目(Berkeley Drosophila Genome Project,BDGP)和人類剪接查找服務(wù)器(the Human Splicing Finder,HSF)可預(yù)測可能存在的隱蔽剪接位點及基因變異對剪接位點的改變,使用時分別將野生型基因序列和變異型基因序列進行在線分析,即可獲得變異前后目標基因序列所有可能的剪接位點及分值。
2.1PAH結(jié)構(gòu) 在GenBank中基因數(shù)據(jù)庫查找PAH基因可知:PAH基因全長79 278 bp,位于人類12號染色體長臂上(12q23.2),包含13個外顯子,12個內(nèi)含子,CDS編碼452個氨基酸,在66~1 421 bp見圖1。
圖1 人類PAH基因結(jié)構(gòu)
2.2PAH突變位點外顯子的同源建模及功能分析 由于本研究中的3例突變分別發(fā)生在外顯子1、外顯子6和外顯子11上,而外顯子1因其序列太短未找到同源序列,因此將外顯子1,2結(jié)合起來對外顯子1處發(fā)生的點突變(c.59A>C,60G>C)進行同源建模,并對突變后的外顯子6和外顯子11分別進行同源建模,見圖2。其中,圖2A是正常的外顯子1,2結(jié)構(gòu),圖2B是點突變(c.59A>C,60G>C)突變后的外顯子1,2預(yù)測結(jié)構(gòu),可以看出突變導(dǎo)致外顯子的一處β片層消失。圖3A是正常的外顯子6的空間結(jié)構(gòu),圖3B中由于(c.690-691insG),導(dǎo)致移碼突變S231fsX51,即該三聯(lián)密碼子下游第51位氨基酸處蛋白合成終止,致使外顯子6的空間構(gòu)象發(fā)生明顯改變。外顯子11上的第1 119位和1 120位插入堿基T(c.1119-1120insG),導(dǎo)致移碼突變I374fsX,即374位后第20位氨基酸處蛋白合成終止,由于此處突變可能會影響外顯子12和13的合成,因此選擇從正常的外顯子10開始到外顯子13進行同源建模,同時對(c.1119-1120insG)突變后的外顯子10之后的部分進行同源建模。圖4A是正常的外顯子10,11,12,13的結(jié)構(gòu);圖4B是正常的外顯子10,11的結(jié)構(gòu);圖4C是(c.1119-1120insG)突變后外顯子10,11,12,13的結(jié)構(gòu),可以看出(c.1119-1120insG)的突變導(dǎo)致外顯子11三級結(jié)構(gòu)部分缺失。
2.3PAH新發(fā)剪接突變的生物學效應(yīng)分析 經(jīng)3種生物信息學軟件綜合分析上述突變,CRYP-SKIP預(yù)測值中,PCR-E(在右邊的刻度盤上用紅色指針表示)取值介于0和1之間,較高的值表示支持隱蔽剪接位點激活,較低值則表示支持外顯子跳躍。突變預(yù)測結(jié)果顯示c.441+2T>A突變后第4外顯子5′端產(chǎn)生隱蔽剪接位點(PCR-E)的可能性為0.35,3′端的值接近于0,c.842+4A>T突變后第7外顯子5′端產(chǎn)生隱蔽剪接位點(PCR-E)的可能性為0.39,3′端的值接近于0。c.1200+1T>G突變后外顯子11中5′端產(chǎn)生隱蔽剪接位點(PCR-E)的可能性為0.66,3′端的值接近于0。
BDGP顯示正常PAH基因第4內(nèi)含子5′端剪接位點(AGgt,g為突變處)的預(yù)測值為0.94(預(yù)測值為0~1),c.441+2T>A突變后第4內(nèi)含子5′端剪接位點(AGgt,g為突變處)的預(yù)測值則為0.96(預(yù)測值為0~1),而IVS4+2T>A和IVS7+4A>T突變后BDGP預(yù)測值均消失(預(yù)測值為0)。
HSF預(yù)測中CV值高于80者具有較強剪接信號,CV值為70~80的剪接位點剪接信號較弱,少部分剪接位點的CV值為65~70[9](預(yù)測值為0~100)。預(yù)測結(jié)果顯示c.441+2T>A使第4內(nèi)含子的5′剪接供體共識值(CV值)由正常的83.22變?yōu)?6.39。c.842+4A>T使第7內(nèi)含子的5′剪接供體CV值為由82.11變?yōu)?3.32,而3′剪接受體CV值由68.35變?yōu)?9.4。c.1200+1T>G突變使第11內(nèi)含子的5′剪接供體CV值為由95.95變?yōu)?9.12,而3′剪接受體CV值并無明顯變化。
A:正常的外顯子1,2結(jié)構(gòu);B:外顯子1處點突變突變后的預(yù)測結(jié)構(gòu)
圖2外顯子1,2的同源建模結(jié)果
A:正常外顯子6的空間結(jié)構(gòu);B:外顯子6空間構(gòu)象發(fā)生改變
圖3外顯子6的同源建模結(jié)果
A:正常的外顯子10,11,12,13的結(jié)構(gòu);B:正常的外顯子10,11的結(jié)構(gòu);C:突變后外顯子10,11,12,13的結(jié)構(gòu)
圖4外顯子10-13的同源建模
一般認為,PKU是由于PAH基因突變引起PAH蛋白功能損壞或喪失而導(dǎo)致的,PAH基因中細微的改變都會引起酶蛋白三維結(jié)構(gòu)的改變,并可造成PAH活性降低甚至完全喪失,導(dǎo)致在臨床上產(chǎn)生PKU病患。而PAH蛋白的三級結(jié)構(gòu)是一個同源四聚體。此前對于PKU基因型與表型關(guān)系的研究多是利用質(zhì)譜技術(shù)和 X射線衍射技術(shù)構(gòu)建PAH的3D晶體結(jié)構(gòu)模型來進行的[10],而最新研究發(fā)現(xiàn)了全長哺乳動物(大鼠)PAH的第1個X射線晶體結(jié)構(gòu)[11]。本研究中使用Swiss-model對1例錯義突變和2例插入突變所在的第1、第6和第11外顯子的同源建模分析中發(fā)現(xiàn)(c.59A>C,60G>C)突變導(dǎo)致外顯子1,2區(qū)域的片層結(jié)構(gòu)消失,另外此突變位于外顯子與內(nèi)含子的交界處,可能會嚴重影響PAH基因后續(xù)的轉(zhuǎn)錄、翻譯和蛋白折疊等[6]。(c.690-691insG)突變導(dǎo)致外顯子6的空間構(gòu)象發(fā)生改變;而外顯子11上的(c.1119-1120insG)突變不僅影響了外顯子11的空間構(gòu)象,并且嚴重影響了后續(xù)外顯子12和外顯子13的構(gòu)象,這3例突變預(yù)測的結(jié)果顯示突變會直接影響PAH單體的結(jié)構(gòu)完整性。而最近有研究揭露PKU相關(guān)的基因突變會對PAH同源四聚體的穩(wěn)定性產(chǎn)生影響,造成PAH蛋白不同程度的降解,從而導(dǎo)致嚴重的PKU表型[12]。例如PAH基因R408W突變后導(dǎo)致翻譯的蛋白質(zhì)極易降解,最終在患者體內(nèi)或體外測不出PAH,從而導(dǎo)致嚴重的PKU表型,而R413P突變則導(dǎo)致PAH四聚體結(jié)構(gòu)的高度不穩(wěn)定,影響正常的單體狀態(tài)和蛋白酶的功能,臨床表現(xiàn)為嚴重代謝障礙型PKU。所以作者大膽推測,這3例突變甚至有可能導(dǎo)致突變體的穩(wěn)定性受到影響,致使PAH蛋白降解,從而影響其功能。
目前,在PKU相關(guān)的PAH基因缺陷中,約13%的突變影響保守的3′和5′剪接位點,而大多數(shù)報道的剪接突變都是通過影響5′端剪接供體位點從而引起疾病的[13]。本研究中對于3種剪接突變的多種預(yù)測結(jié)果顯示,第7內(nèi)含子處的c.842+4A>T突變可能導(dǎo)致外顯子的3′端發(fā)生了跳躍,第4內(nèi)含子的c.441+2T>A突變和第11內(nèi)含子處c.1200+1T>G的突變都有可能是由于外顯子的5′端影響剪接,其中第4內(nèi)含子的c.441+2T>A突變可能原因是其5′端發(fā)生了跳躍。在最近一項PAH基因外顯子11處兩個致病剪接突變(c.1199+17G>A和c.1199+20G>C)的研究中發(fā)現(xiàn),與5′剪接位點相結(jié)合的小核糖核蛋白顆粒U1 snRNA在與外顯子11的剪接過程中起著重要作用,而突變則會破壞U1 snRNA和內(nèi)含子5′剪接位點的結(jié)合,從而影響剪接。此外還證明了通過修飾U1 snRNA可以實現(xiàn)對剪接突變的校正[14]。本研究中第11內(nèi)含子處c.1200+1T>G突變的預(yù)測結(jié)果說明,突變可能降低了11內(nèi)含子5′端隱蔽剪接位點的活性,但c.1200+1T>G突變是否同樣破壞U1 snRNA和內(nèi)含子5′剪接位點的結(jié)合還不得而知,需要進一步的實驗驗證。
盡管本研究采用生物信息學方法對PAH基因突變進行了分析,但基因突變對功能的影響是一個復(fù)雜的過程,且生物信息學方法還有待提升,具體的基因突變與功能的關(guān)系及突變后的機制還要以實驗結(jié)果為準,這需要后續(xù)進一步的系統(tǒng)研究。