(1 河北醫(yī)科大學(xué)第四醫(yī)院病理科,河北 石家莊 050011;2 河北醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院;3 河北省胸科醫(yī)院胸三科;4 河北醫(yī)科大學(xué)藥理學(xué)教研室)
乳腺癌是女性中最常見(jiàn)的腫瘤,是女性癌癥死亡的主要原因[1]。據(jù)預(yù)測(cè),到2021年我國(guó)35~49歲女性中乳腺癌病例將達(dá)到220萬(wàn)[2]。在我國(guó)乳腺癌患者診斷的平均年齡為48~49歲,比西方國(guó)家確診年齡低10歲以上[3]。乳腺癌的治療效果在很大程度上取決于患者激素受體和人表皮生長(zhǎng)因子受體2(HER2)的表達(dá)水平,而乳腺癌的不同的分子亞型(luminalA型、luminalB型、HER2過(guò)表達(dá)型及三陰型)預(yù)后差異很大[4]。HER2是受體酪氨酸激酶(RTK)的EGFR/ERBB家族的成員[5]。HER2癌基因在大約25%的乳腺癌中擴(kuò)增或高表達(dá),并且在大多數(shù)癌癥中是腫瘤細(xì)胞生長(zhǎng)的主要驅(qū)動(dòng)力[6]。臨床試驗(yàn)表明,HER2“上癮”是某些腫瘤行為的基礎(chǔ),HER2作為致癌基因,可促進(jìn)癌細(xì)胞的增殖與轉(zhuǎn)移,并且與腫瘤復(fù)發(fā)率和患者病死率增高有關(guān)[7]。X型膠原蛋白(COL10)是結(jié)構(gòu)大分子膠原超家族的一員,由COL10A1基因編碼[8]。COL10A1基因突變與日本型脊椎關(guān)節(jié)發(fā)育不良和Schmid型干骺端軟骨發(fā)育不良有關(guān)[9]。在大多數(shù)腫瘤組織中可觀(guān)察到COL10A1高表達(dá),并且其可能與腫瘤血管生成有關(guān)。在結(jié)直腸癌的早期診斷中,外周血液中COL10A1可被視為潛在的生物標(biāo)志物[10]。研究顯示COL10A1在結(jié)直腸癌組織中異常表達(dá)并參與結(jié)直腸癌的進(jìn)展和EMT過(guò)程[11]。此外,通過(guò)組織微陣列和基因表達(dá)譜分析顯示,COL10A1在乳腺癌中表達(dá)上調(diào)[12]。然而,COL10A1對(duì)HER2陽(yáng)性乳腺癌的影響尚不清楚。
腫瘤基因組圖譜計(jì)劃(TCGA)利用基因組測(cè)序技術(shù)研究33種癌癥類(lèi)型及20 000多種分子特征。目前TCGA已經(jīng)產(chǎn)生了大量的基因組學(xué)、表觀(guān)基因組學(xué)、轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)的大量數(shù)據(jù)[13]。本研究深入挖掘基于TCGA的腫瘤在線(xiàn)生物信息數(shù)據(jù)庫(kù)cBioPortal、Oncomine、UALCAN等,綜合分析COL10A1在HER2陽(yáng)性乳腺癌中的表達(dá)及與患者預(yù)后的關(guān)系,為進(jìn)一步研究COL10A1在乳腺癌治療中的作用提供一定的參考依據(jù)。
通過(guò)GEPIA[14](http://gepia.cancer-pku.cn/)搜集相對(duì)于正常乳腺組織乳腺癌中高表達(dá)的基因,數(shù)據(jù)集選擇“Differential Genes”,Dataset(Cancer name)選擇“BRCA”。在方差分析中,|log2FC|值高于預(yù)先設(shè)定的閾值,q值低于預(yù)先設(shè)定的閾值的基因被認(rèn)為是差異表達(dá)基因。對(duì)于前10個(gè)基因,|log2FC|值和百分比值高于閾值的基因被認(rèn)為是過(guò)表達(dá)基因。
登錄cBioPortal 網(wǎng)站(http://www.cbioportal.org)的首頁(yè)[15],數(shù)據(jù)集選擇 “Breast invasive carcinoma (TCGA,PanCancer Atlas) ”,病例組則選擇“Tumor Samples with mRNA data (RNA Seq V2) (1100)”,分別分析COL10A1的突變、mRNA 水平變化及與HER2表達(dá)的關(guān)系。
通過(guò)Oncomine數(shù)據(jù)庫(kù)[16](https://www.oncomine.org/)檢索COL10A1在不同腫瘤類(lèi)型中的差異性表達(dá),限定條件為:①基因:COL10A1;②數(shù)據(jù)類(lèi)型:mRNA;③顯著性:P<1E-4;④差異表達(dá)級(jí)別:大于2倍;⑤基因排序:前10%;⑥其他為數(shù)據(jù)庫(kù)默認(rèn)設(shè)定。
登錄UALCAN 網(wǎng)站(http://ualcan.path.uab.edu)首頁(yè)[17],數(shù)據(jù)庫(kù)類(lèi)型選擇 “Breast invasive carcinoma”,輸入基因名稱(chēng)“COL10A1”,分析不同類(lèi)型乳腺癌組織中COL10A1基因表達(dá)的變化。
數(shù)據(jù)庫(kù)類(lèi)型選擇 “Metastatic breast cancer[MET500 dataset]”,輸入基因名稱(chēng)“COL10A1”,分析COL10A1在HER2擴(kuò)增與非擴(kuò)增樣本中表達(dá)的差異。
登錄Kaplan-Meier Plotter數(shù)據(jù)分析平臺(tái)[18](http://kmplot.com/analysis/),檢索COL10A1基因,獲得COL10A1基因表達(dá)差異患者的生存曲線(xiàn)。限定條件為無(wú)疾病進(jìn)展生存,“HER2 status”設(shè)為“HER2 positive”或“HER2 negative”,對(duì)腫瘤病理類(lèi)型及臨床分期、分級(jí)等不做限制。
cBioPortal數(shù)據(jù)庫(kù)分析結(jié)果顯示,994例乳腺癌患者中,61例發(fā)生了COL10A1基因改變,改變的類(lèi)型包括突變、拷貝數(shù)畸變以及mRNA 水平上調(diào)等(圖1a)。GEPIA以及Oncomine數(shù)據(jù)庫(kù)分析結(jié)果顯示,COL10A1在乳腺癌中呈現(xiàn)高表達(dá)(表1、圖1b)。再利用UALCAN平臺(tái)進(jìn)一步分析TCGA數(shù)據(jù)庫(kù)中COL10A1在乳腺癌中的差異表達(dá)情況,在TCGA數(shù)據(jù)庫(kù)中總共涉及到正常乳腺組織114例,乳腺癌組織1 097例,COL10A1基因在乳腺癌中的表達(dá)水平大約為正常乳腺組織的177.85倍(P<1E-12)。圖2a。
UALCAN 分析顯示,luminal型與HER2陽(yáng)性乳腺癌患者中COL10A1表達(dá)高于其他類(lèi)型乳腺癌(P<0.05)。見(jiàn)圖2b。且COL10A1在HER2擴(kuò)增樣本中表達(dá)水平明顯高于無(wú)擴(kuò)增樣本(P<0.01)。見(jiàn)圖2c。GEPIA數(shù)據(jù)庫(kù)與cBioPortal數(shù)據(jù)分析顯示,COL10A1與HER2表達(dá)呈正相關(guān)(P<0.01)。見(jiàn)圖3a、b。HER2陽(yáng)性乳腺癌樣本中COL10A1表達(dá)與HER2陰性樣本比較,差異具有顯著性(P<0.05)。見(jiàn)圖3c。
表1 GEPIA 數(shù)據(jù)庫(kù)中乳腺癌組織中高表達(dá)的基因
a:cBioPortal數(shù)據(jù)庫(kù)分析COL10A1在乳腺癌中的突變位點(diǎn)及突變方式;b:Oncomine數(shù)據(jù)庫(kù)中COL10A1在不同腫瘤中的差異性表達(dá)
圖1COL10A1在不同腫瘤中的表達(dá)情況及突變方式
對(duì)Kaplan-Meier Plotter數(shù)據(jù)庫(kù)分析顯示,在全部乳腺癌樣本中,COL10A1與患者無(wú)復(fù)發(fā)生存率(RFS)無(wú)關(guān)。見(jiàn)圖4a。單獨(dú)篩查HER2陰性乳腺癌樣本,RFS也未見(jiàn)明顯差異。見(jiàn)圖4b。然而,在HER2陽(yáng)性乳腺癌患者中,相對(duì)于COL10A1低表達(dá)者,COL10A1高表達(dá)者RFS降低(P<0.01)。見(jiàn)圖4c。
乳腺癌是一種高度異質(zhì)性的惡性腫瘤,與之相關(guān)的分子標(biāo)志物種類(lèi)眾多[19]。其中HER2表達(dá)在乳腺癌進(jìn)展中發(fā)揮著重要作用。盡管目前有針對(duì)HER2陽(yáng)性乳腺癌患者的靶向藥物,但抗HER2治療的乳腺癌患者往往會(huì)產(chǎn)生耐藥性,致使出現(xiàn)新的進(jìn)展,預(yù)后仍不理想[20],因此本研究期望通過(guò)生物信息學(xué)數(shù)據(jù)分析發(fā)現(xiàn)HER2陽(yáng)性乳腺癌中的新的靶點(diǎn)。
研究顯示COL10A1在結(jié)直腸癌、食管癌和胰腺癌等腫瘤中高表達(dá)[21-23],并且免疫熒光染色表明COL10A1定位于乳腺癌的腫瘤脈管系統(tǒng),而在正常乳腺組織的脈管系統(tǒng)中水平較低[24]。有研究結(jié)合RNA表達(dá)譜以及免疫組織化學(xué)方法分析發(fā)現(xiàn),COL10A1在對(duì)化療無(wú)反應(yīng)的ER陽(yáng)性/HER2陽(yáng)性型乳腺癌樣本中表達(dá)上調(diào)[25]。但其在HER2陽(yáng)性乳腺癌中的特異性作用尚不清楚。
TCGA是迄今為止最具實(shí)力和最成功的癌癥基因組計(jì)劃之一。TCGA項(xiàng)目已經(jīng)生成、分析并提供了超過(guò)1.1萬(wàn)例代表30多種不同癌癥類(lèi)型的基因組和轉(zhuǎn)錄組數(shù)據(jù)。Oncomine數(shù)據(jù)庫(kù)是一個(gè)研究腫瘤相關(guān)基因的開(kāi)放數(shù)據(jù)庫(kù),其整合了TCGA、GEO和已發(fā)表文獻(xiàn)來(lái)源的DNA和RNA-seq數(shù)據(jù),能幫助人們篩選一些值得研究的靶分子,有利于提高對(duì)癌癥的診斷、治療和發(fā)生發(fā)展機(jī)制的深入研究。Ualcan數(shù)據(jù)門(mén)戶(hù)是為了促進(jìn)TCGA數(shù)據(jù)庫(kù)的基因查詢(xún)而開(kāi)發(fā)的交互式網(wǎng)絡(luò)資源,便于分析鑒定腫瘤相關(guān)的生物分子標(biāo)記物,從而分析腫瘤發(fā)生、進(jìn)展和轉(zhuǎn)移的相關(guān)分子機(jī)制,使癌癥研究人員更容易獲得TCGA數(shù)據(jù)和分析結(jié)果。此外,cBioPortal癌癥基因組學(xué)在線(xiàn)門(mén)戶(hù)網(wǎng)站是一個(gè)交互式探索多維癌癥基因組學(xué)數(shù)據(jù)集的開(kāi)放網(wǎng)站,對(duì)于腫瘤的診斷、治療及預(yù)后評(píng)估具有重要價(jià)值。
a:COL10A1在乳腺癌中基于樣本類(lèi)型的表達(dá);b:COL10A1在乳腺癌亞型中的表達(dá);c:基于HER2基因擴(kuò)增亞類(lèi)的COL10A1在乳腺癌中的表達(dá)
圖2COL10A1 mRNA在HER2基因擴(kuò)增樣本中的表達(dá)情況
a:GEPIA數(shù)據(jù)庫(kù)分析顯示,COL10A1與HER2 mRNA表達(dá)呈正相關(guān);b:cBioPortal分析顯示,COL10A1與HER2 mRNA表達(dá)水平呈正相關(guān);c:UALCAN分析結(jié)果顯示,HER2陽(yáng)性乳腺癌組織中有差異表達(dá)的基因
圖3COL10A1與HER2 mRNA表達(dá)水平的關(guān)系
a、b、c分別為Kaplan-Meier Plotter數(shù)據(jù)庫(kù)中所有乳腺癌樣本、HER2陰性乳腺癌樣本及HER2陽(yáng)性乳腺癌樣本
圖4COL10A1高表達(dá)與乳腺癌患者無(wú)復(fù)發(fā)生存率(RFS)的關(guān)系
本研究基于上述腫瘤在線(xiàn)生物信息數(shù)據(jù)庫(kù)分析COL10A1在乳腺癌中的表達(dá)及與患者預(yù)后的關(guān)系。首先通過(guò)GEPIA及Oncomine數(shù)據(jù)庫(kù)篩查發(fā)現(xiàn)COL10A1在乳腺癌中高表達(dá)。然后利用UALCAN進(jìn)一步分析TCGA數(shù)據(jù)庫(kù)中COL10A1在不同類(lèi)型的乳腺癌中的表達(dá)情況,發(fā)現(xiàn)COL10A1在HER2擴(kuò)增樣本中表達(dá)水平明顯高于無(wú)擴(kuò)增樣本,結(jié)果有統(tǒng)計(jì)學(xué)意義。為了探究COL10A1與HER2表達(dá)的關(guān)系,本研究利用GEPIA與cBioPortal數(shù)據(jù)庫(kù)篩查分析顯示,COL10A1與HER2表達(dá)呈顯著正相關(guān)。以上結(jié)果提示COL10A1在乳腺癌中可能為促癌因素,且與HER2相互作用,影響乳腺癌的進(jìn)展。同時(shí)Kaplan-Meier Plotter數(shù)據(jù)庫(kù)分析表明,COL10A1高表達(dá)與HER2陽(yáng)性乳腺癌患者預(yù)后較差有關(guān),而與HER2陰性乳腺癌患者預(yù)后無(wú)關(guān)。以上結(jié)果顯示COL10A1可能與HER2相互促進(jìn),共同影響乳腺癌患者的預(yù)后。
綜上所述,通過(guò)生物信息數(shù)據(jù)庫(kù)綜合分析發(fā)現(xiàn),COL10A1在乳腺癌中高表達(dá),且與HER2陽(yáng)性乳腺癌患者的不良預(yù)后相關(guān),可以作為HER2陽(yáng)性的乳腺癌患者臨床預(yù)后評(píng)估的潛在標(biāo)志物。鑒于COL10A1基因表達(dá)的種族和個(gè)體特異性,后續(xù)工作中應(yīng)在乳腺癌患者腫瘤組織樣本中進(jìn)行驗(yàn)證,并通過(guò)基礎(chǔ)實(shí)驗(yàn)驗(yàn)證靶基因COL10A1在HER2陽(yáng)性乳腺癌發(fā)生發(fā)展中的作用,為HER2陽(yáng)性乳腺癌患者的治療、診斷和預(yù)后提供新的依據(jù)。