陳曉娟,劉朝霞
(1.江西省鷹潭市婦幼保健院,江西 鷹潭 335000;2.南昌大學第二附屬醫(yī)院,江西 南昌 330000)
卵巢癌是女性生殖系統(tǒng)的惡性腫瘤,它的死亡率在婦科惡性腫瘤中排名第一。卵巢位于盆腔深處,早期通常無癥狀,這使得卵巢早期診斷較難,且易發(fā)生轉移和復發(fā),導致卵巢癌的死亡率高[1-2]。目前的治療手段為卵巢癌帶來的效果僅僅是減輕腫瘤負擔,不能顯著提高卵巢癌患者的長期生存率。其根本原因在于卵巢癌的發(fā)病機制還不能夠完全明了[3-4]。卵巢癌的診斷和治療仍然成為臨床上的棘手問題,主要原因是缺乏特異、敏感的卵巢癌篩查方法。找尋卵巢癌特異基因和新的治療方向對卵巢癌的預后是有很大幫助的。
近年來發(fā)現(xiàn),同源重組修復基因在腫瘤的發(fā)病機制上中扮演著重要角色。研究DNA損傷修復基因,并有針對性地聯(lián)合DNA損傷修復基因抑制劑和化療藥物,已逐漸成為包括卵巢癌在內的腫瘤研究新熱點[6]。RAD51AP1是同源重組修復基因,與多種惡性腫瘤的發(fā)生發(fā)展如三陰性乳腺癌(TNBC),肝細胞癌(HCC),食道癌(EC),腎細胞癌,乳頭狀甲狀腺癌,宮頸癌,轉移性黑色素瘤等有關[7-9]。但在卵巢癌的研究中缺乏系統(tǒng)評價,本文將從生物信息學角度研究RAD51AP1與卵巢癌的關系。
1.1 基因芯片數(shù)據(jù)。為GEO基因表達譜,它可以反映基因活動信息用于反應基因的調控機制及在不同表型和條件下基因的表達如何受影響等。它作為高通量實驗數(shù)據(jù)貯存庫,檢測mRNA、基因組DNA、蛋白質豐度和非陣列的表達水平技術。研究數(shù)據(jù)集的納入標準:①采用人類基因組表達譜芯片信息及人類基因組U133A陣列,②樣品組織有卵巢癌及非卵巢癌組織。③在基因表達譜數(shù)據(jù)庫中提取數(shù)據(jù)集。
1.2 腫瘤基因組數(shù)據(jù)。為TCGA數(shù)據(jù)庫,通過系統(tǒng)分析,可以查找所有癌癥相關的微效基因改變,從而了解基因的發(fā)生發(fā)展機制,以此作為基礎來指導腫瘤診斷和治療。
1.3 Kaplan-meier plotter數(shù)據(jù)庫。該數(shù)據(jù)庫包含卵巢癌在內的四中腫瘤信息,收集大量含有芯片的病例,可以用在生存預后分析中。
1.4 方法
1.4.1 基因表達譜數(shù)據(jù)預處理:基因芯片預處理包括質量控制、數(shù)據(jù)標準化、數(shù)據(jù)匯總。我們統(tǒng)一使用RAM算法對基因進行預先處理,通過預處理才能將探針水平的數(shù)據(jù)信息轉化成基因的表達數(shù)據(jù)信息,用于后續(xù)的meta分析。通過數(shù)據(jù)預處理提取基因芯片平臺中四種芯片共享的探針組ID,對符合標準的數(shù)據(jù)集的GEL文件內容進行預處理。
1.4.2 基因表達差異:通常指某個基因在兩個條件下表達水平的檢驗值,達到一定差異,同時具有生物學意義。本次研究運用R語言環(huán)境下R軟件,將腫瘤當中的非癌組織樣本當做對照組,癌組織作為實驗組,對基因表達譜做Meta分析,并通過zscore值篩選出差異基因。
1.4.3 基因表達程度和病患臨床病理特點間的聯(lián)系:利用SPSS 22.0將已獲得的TCGA數(shù)據(jù)進行分類、量化及統(tǒng)計分析。卵巢癌病患的表型及臨床病理信息從腫瘤基因數(shù)據(jù)庫獲得。通過χ2檢驗進行統(tǒng)計分析。該研究利用平均值作為卡梅爾曲線分析的臨界值,畫生存曲線。和采用Log-rank檢驗兩組間生存率及基因表達是否存在顯著性差異。
2.1 RAD51AP1在卵巢癌中過表達。符合條件的研究對象有7個,GEO編號分別為GSE6008,GSE18520,GSE26712,GSE27651,GSE29450,GSE36668,GSE52037的表達譜數(shù)據(jù)集,總共包括450個樣本(396個病例和54個對照)。從數(shù)據(jù)集篩查到RAD51AP1所對應探針(204146-at),在7個研究中與對照組比較均顯著上調(P<0.01),具體數(shù)據(jù)見表1。
我們用相同的手段對7個卵巢癌數(shù)據(jù)集的資料進行分析得到的13,294個基因的表達矩陣,并且顯示了基因表達譜數(shù)據(jù)庫中Meta分析的Zscore值頻數(shù)分布。RAD51AP1所對應探針(204146-at)與對照組織相比,表達量顯著上調(Zscore=10.226,P=1.51E-24),見圖1。
同時通過計算效應尺度加權均數(shù)差及其95%CI繪制出meta分析的森林圖證實RAD51AP1在多個研究中高表達穩(wěn)定,無異質性(SMD=1.51,95%CI=1.00-2.03,P=0.08),從圖2中可以看出與癌旁組織相比,癌組織中RAD51AP1是穩(wěn)定高表達。
表1 RAD51AP1所對應探針(204146-at)在7個卵巢癌數(shù)據(jù)集中表達情況
圖1 Zscore值頻數(shù)分布RAD51AP1所對應Zscore為10.226
圖2 RAD51AP1在癌組織和癌旁組織表達差異的森林圖
為了驗證以上結果,通過TCGA選取426例卵巢癌卵巢臨床樣本并且通過GTEx下載88例正常卵巢樣本,進行表達差異分析,RAD51AP1在卵巢癌組織中確實上調。
2.2 RAD51AP1與卵巢癌臨床病理因素及預后的關系。從腫瘤基因數(shù)據(jù)庫獲取卵巢癌患者相關的臨床病理特征信息及表達值信息,并對年齡、腫瘤組織學分級、腫瘤TNM分期進行歸納整理,詳情見表2。
RAD51AP1高表達與患者的年齡、腫瘤TNM分期、腫瘤組織學分級都無關(P>0.05),然而基于GEO數(shù)據(jù)集中患者的生存和預后信息的生存分析(圖3),RAD51AP1高表達確實與卵巢癌生存預后相關(P<0.01),高水平的RAD51AP1的患者生存能力差;且高水平的RAD51AP1的患者無病生存期也縮短,提示RAD51AP1與不良的生存預后顯著相關。以上結果提示,RAD51AP1很可能作為腫瘤不良生存預后的預測因子,在卵巢癌的發(fā)生過程中可能具有重要作用,RAD51AP1與不良的生存預后顯著相關可能作為卵巢癌發(fā)生過程中潛在的治療靶點。
表2 RAD51AP1表達情況臨床病理特征的相關性
圖3 生存分析
RAD51AP1基因位于人類第十五號染色體,該基因編碼的酶是RAD51蛋白質家族的成員,它參與DNA的同源重組和修復[10-11]。RAD51AP1 在人體多種組織器官中表達,尤其在睪丸,胸腺,結腸和小腸中更是大量表達[12-13]。RAD51AP1能夠連接同源重組酶RAD51和DMC1,在哺乳動物體內的有絲分裂和減數(shù)分裂中的同源重組起到至關重要的作用[14]。同源重組(homologous recombination,HR)在細胞遭受損傷時啟動,在損傷修復中占重要地位,同源重組修復遵循著模板進行修復,對保持基因穩(wěn)定很重要,如果修復出現(xiàn)缺陷,將可能導致基因突變,甚至能造成腫瘤的發(fā)生。HR修復的機制非常復雜,和很多蛋白有關,包括RAD51、RAD52、RAD54、BRCA1、BRCA2、MRN復合物等[15]。
本文通過生物信息學分析,利用基因表達譜數(shù)據(jù)庫和腫瘤基因數(shù)據(jù)庫獲得7個相關的數(shù)據(jù)集,發(fā)現(xiàn)RAD51AP1在卵巢癌組織中過表達,臨床樣本的基因差異性分析同樣證明其在卵巢癌中過表達,并且分析了這種過表達帶來的意義,雖然其與患者的臨床病理特征關系不甚密切,但它與患者的生存預后有關聯(lián),過表達的患者生存預后能力差,無病生存期縮短,提示其與腫瘤不良預后有關,這也展示了RAD51AP1在卵巢癌研究中發(fā)揮的作用,為今后卵巢癌的研究提供新的方向。
自從發(fā)現(xiàn)RAD51AP1以來,我們在更好地了解其生化和細胞生物學特性方面取得了重大進展。但RAD51AP1與卵巢癌發(fā)生和發(fā)展之間的聯(lián)系仍然知之甚少,本文從生物信息學的角度來闡述RD51AP1與卵巢癌之間的關系,為以后從細胞學及分子機制入手進一步深入發(fā)掘其與卵巢癌之間的確切聯(lián)系奠定了理論基礎。