李明陽,馬春霞,吳翰欣,吳小海,俞建昆
1.中國醫(yī)學科學院北京協(xié)和醫(yī)學院 醫(yī)學生物學研究所 中心實驗室,云南 昆明 650118;2.昆明醫(yī)科大學 附屬第二醫(yī)院,云南 昆明 650118
鼻咽癌(nasopharyngealcarcinoma,NPC)是常見于我國南方及東南亞地區(qū)的鼻咽部惡性腫瘤,尤其高發(fā)于廣東省[1]。鼻咽癌的發(fā)病與Epstein-Barr病毒(EBvirus,EBV)感染、遺傳因素及環(huán)境因素密切相關[2-6]。隨著高通量測序技術及基因芯片技術的發(fā)展,從不同層次如基因組、轉錄組、蛋白質組,甚至代謝組等方面研究惡性腫瘤的發(fā)生發(fā)展及預后已成為全世界科學家的共識[7-9]。因此,我們利用生物信息學技術,在基因層面分析鼻咽癌組織與正常組織的差異,篩選表達差異明顯的核心基因,為將來臨床上提高診斷率以及針對新的靶點開發(fā)更高效的抗癌藥物奠定理論基礎。
鼻咽癌組織基因表達譜下載自NCBI-GEO DataSet數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov),編號為GSE13597,該芯片中共包含25例NPC和3例正常組織對照樣本。
利用R語言程序包(edgR包)篩選差異表達基因(differentiallyexpressedgenes,DEGs)并繪制基因表達熱圖和火山圖,標準設置為差異表達倍數(shù)∣FC∣>1,F(xiàn)DR<0.05,P<0.05。利用在線分析工具(https://david.ncifcrf.gov/;http://www.string-db.org/;https://www.geodiver.co.uk/analyse)對篩選出的候選基因進行GO富集、KEGG通路分析以及蛋白互作網(wǎng)絡分析,以確定核心基因。P<0.05被認為具有統(tǒng)計學意義。
如圖1所示,每個樣本總體基因表達無明顯差異,芯片檢測結果有效,可用于后續(xù)分析。
圖1 樣本數(shù)據(jù)總覽箱式圖
如圖2、3所示,從25例鼻咽癌組織樣本和3例正常組織對照樣本中共分析出1103個DEGs,包括600個上調基因和503個下調基因(P<0.05)。
圖2 基因表達熱圖
如圖4~6所示,GO分析結果顯示,DEGs在生物過程中顯著富集,包括細胞分裂、DNA復制、G1/S有絲分裂細胞周期的轉變和有絲分裂核分裂;在分子功能中,包括與蛋白質結合、與ATP結合、蛋白同二聚化活性、與DNA復制起點結合以及與受損的DNA結合;在細胞組分中,包括細胞質、核質、胞外體和船體中部。
圖4 生物過程分析結果(Top5)
KEGG通路分析(圖7)顯示,DEGs在細胞周期、DNA復制、癌癥途徑、p53信號通路、錯配修復、小細胞肺癌、卵母細胞減數(shù)分裂、氨基糖和核苷酸糖代謝、基部切除修復和Ⅰ型人T淋巴細胞病毒(HTLV-Ⅰ)感染等信號通路中顯著富集。
圖5 細胞組分分析結果(Top5)
圖6 分子功能分析結果(Top5)
圖7 基因通路分析結果(Top10)
在蛋白互作分析網(wǎng)絡中,CDC45、MCM10、MCM3、MCM5、MCM2、CDC7、CDT1、CDC6、SMC2和NCAPG節(jié)點度最高,即為核心基因(圖8)。
現(xiàn)代醫(yī)學治療鼻咽癌的有效方案多為放化療結合,而傳統(tǒng)的化療藥物在治療過程中對患者自身正常的細胞也會造成損傷[10],在提倡精準醫(yī)療的今天,通過生物信息學方法篩選鼻咽癌組織中的核心基因,可為研制新的抗癌藥物指明方向,也可降低藥物治療對非惡性細胞的副作用。
我們利用R語言軟件包對鼻咽癌患者組織基因芯片進行分析,發(fā)現(xiàn)差異表達的基因多富集于細胞周期和DNA復制等信號通路中,篩選出CDC45、MCM10、MCM3、MCM5、MCM2、CDC7、CDT1、CDC6、SMC2和NCAPG這 10個關鍵基因,其中復制起始蛋白質CDC45的高表達也提示鼻咽癌患者細胞中的DNA復制明顯異于正常人組織細胞。最新研究指出,DNA解旋酶B與CDC45相互作用并促進CDC45與染色質結合,進而影響細胞周期;而CDC45基因的突變會引起Meier-Gorlin綜合征和顱肩間窩骨折等病癥[11-12]。因此,進一步探討CDC45基因在鼻咽癌中高表達的調控機制顯得尤為重要,希望在治療癌癥的道路上,CDC45能成為有效的藥物新靶點。
參考文獻