康治理,劉曉偉,武振方,何 鵬,趙建寧,許 斌
骨肉瘤是最常見的惡性骨腫瘤,常發(fā)生于兒童和青少年[1]。骨肉瘤起源于間充質(zhì)細(xì)胞,常表現(xiàn)為成骨細(xì)胞及軟骨細(xì)胞分化,主要特征為腫瘤細(xì)胞產(chǎn)生的類骨質(zhì)[2]。骨肉瘤常為單發(fā)病變、癥狀隱匿,表現(xiàn)為局部疼痛和腫脹。在病變早期,病人有間歇性疼痛,尤其是在夜間,隨著病情的惡化,持續(xù)性疼痛頻繁發(fā)生。骨肉瘤常起源于長骨的干骺端,如股骨遠(yuǎn)端和肱骨近端[3]。有研究[4-5]顯示,病人在確診時(shí)有40%已發(fā)生遠(yuǎn)處轉(zhuǎn)移,預(yù)后較差。目前關(guān)于骨肉瘤的發(fā)病機(jī)制尚未完全闡明,但有較多的研究表明其發(fā)病機(jī)制與基因和遺傳因素密切相關(guān),且目前主要治療方式除手術(shù)外,大多需要接受藥物化療。基于闡明其發(fā)病機(jī)制及尋找更有效的化療藥物的需要,篩選和鑒定骨肉瘤生物標(biāo)志物成為目前研究的熱點(diǎn)。近年來隨著基因芯片及高通量測序技術(shù)的發(fā)展,應(yīng)用生物信息學(xué)的方法預(yù)測疾病靶標(biāo)基因,分析其可能的分子機(jī)制,為后續(xù)試驗(yàn)提供更加可行思路及方案,以期探明疾病的發(fā)病機(jī)制及研究出新的靶標(biāo)藥物。本研究利用GEO(Gene Expression Omnibus)數(shù)據(jù)庫中的基因芯片數(shù)據(jù),通過生物信息學(xué)方法分析骨肉瘤組織中的關(guān)鍵(Hub)基因,提高對骨肉瘤各種病理生理學(xué)要素及其眾多遺傳變異的認(rèn)識(shí),有助于推進(jìn)病人的個(gè)性化治療策略,為早期發(fā)現(xiàn)和改善預(yù)后提供了可靠的分子標(biāo)志及防治骨肉瘤遠(yuǎn)處轉(zhuǎn)移的有效藥物靶點(diǎn)。
1.1 基因芯片數(shù)據(jù) GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo)是一個(gè)主要由基因表達(dá)的微陣列和芯片研究產(chǎn)生的公共數(shù)據(jù)庫,隸屬于美國國立衛(wèi)生研究院的NCBI[6]。從 GEO上下載基因芯片GSE14359、GSE16088、GSE32964的數(shù)據(jù),根據(jù)平臺(tái)中的注釋信息,將探針轉(zhuǎn)換成相應(yīng)的基因符號。GSE14359數(shù)據(jù)包含10個(gè)骨肉瘤組織樣本和2個(gè)非腫瘤組織樣本。GSE16088含有3份骨肉瘤標(biāo)本和14份非腫瘤樣本。GSE32964含有31個(gè)骨肉瘤樣本和1個(gè)非癌樣本。
1.2 篩選差異表達(dá)基因(DEGs) 用GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r)在線分析工具對骨肉瘤和非腫瘤組織標(biāo)本進(jìn)行DEGs篩查。GEO2R是一個(gè)交互式的在線工具,可用于比較一個(gè)GEO系列中的兩個(gè)或多個(gè)數(shù)據(jù)集,從而識(shí)別出DEGs。錯(cuò)誤發(fā)現(xiàn)率和P值被用來平衡假陽性的局限性和發(fā)現(xiàn)有統(tǒng)計(jì)學(xué)意義的基因。通過數(shù)據(jù)篩選除去沒有相應(yīng)基因名稱的探針集或具有多個(gè)探針集的基因,logFC(fold change)≥1和P≤0.01具有統(tǒng)計(jì)學(xué)意義。
1.3 DEGs的KEGG和GO分析 DAVID 6.8(http://david.ncifcrf.gov)是一個(gè)集成了生物數(shù)據(jù)和分析工具,并提供了一套完整的基因和蛋白質(zhì)功能注釋信息供用戶提取的生物信息數(shù)據(jù)庫[7]。KEGG是一個(gè)用于從高通量實(shí)驗(yàn)技術(shù)生成的大規(guī)模分子數(shù)據(jù)集中了解高級功能和生物途徑的數(shù)據(jù)庫資源[8]。GO是一種用于注釋基因和分析這些基因的生物學(xué)過程的重要生物信息學(xué)工具[9]。DAVID在線數(shù)據(jù)庫被用于分析這些DEGs的生物學(xué)信息,P≤0.05認(rèn)為具有統(tǒng)計(jì)學(xué)意義。
1.4 PPI網(wǎng)絡(luò)構(gòu)建 蛋白-蛋白相互作用(PPI)網(wǎng)絡(luò)用 STRING(http://string-db.org)在線分析工具構(gòu)建[10]。通過分析蛋白質(zhì)之間的功能相互作用,深入了解疾病的發(fā)生或發(fā)展機(jī)制。在本研究中,選擇置信度>0.4來構(gòu)建PPI網(wǎng)絡(luò)。Cytoscape 3.6.1是一個(gè)開源的用來可視化分子相互作用網(wǎng)絡(luò)的生物信息學(xué)工具[11],其中的MCODE插件是從Cytoscape在線安裝用來對查找出的作用緊密的基因集合聚類分析的工具。本研究中PPI網(wǎng)絡(luò)是使用Cytoscape繪制的,其中最顯著的基因模塊使用MCODE和cytoHubba識(shí)別。
2.1 DEGs篩選 通過GEO2R在線分析及在線作Venn圖,在篩選GSE19345、GSE16088、GSE32964中具有統(tǒng)計(jì)學(xué)意義的探針后,取三者基因集合共計(jì)95個(gè)DEGs(見圖1)。
2.2 GO分析和KEGG分析 對95個(gè)DEGs進(jìn)行GO功能注釋KEGG通路富集分析,發(fā)現(xiàn)差異基因的生物學(xué)過程(biological process,BP)主要富集在免疫應(yīng)答、正向調(diào)節(jié)細(xì)胞分化、細(xì)胞黏附的調(diào)節(jié)等過程;細(xì)胞成分(cellular component,CC)主要集中在細(xì)胞質(zhì)膜、細(xì)胞基底外膜、黏著斑等部分;分子功能(molecular function,MF)主要富集在蛋白結(jié)合、蛋白質(zhì)異源二聚物活性、GTP酶激活劑活性等。KEGG主要富集在細(xì)胞黏附分子、抗原處理和呈遞等信號通路(見圖2)。
2.3 PPI網(wǎng)絡(luò)構(gòu)建和Hub基因篩選 將95個(gè)顯著差異表達(dá)的基因?qū)隨TRING在線工具,將所得數(shù)據(jù)結(jié)果輸入Cytoscape3.6.1軟件進(jìn)行可視化,利用Mcode插件篩選出作用最緊密的基因模塊,然后使用cytoHubba插件按照MCC算法找出排名前10的Hub基因,分別為CD74、LAPTM5、CD163、MS4A6A、HLA-DRA、CD86、FCER1G、C1QB、TYROBP、AIF1(見圖3)。
骨肉瘤是好發(fā)于兒童和青少年的最常見的惡性骨腫瘤,預(yù)后極差,5年生存率僅有60%~70%[12]。臨床上很多骨肉瘤病例失去了早期治療的機(jī)會(huì),因此,發(fā)現(xiàn)潛在的診斷標(biāo)志物和推進(jìn)精準(zhǔn)治療的進(jìn)行是目前亟待解決的問題,而這些發(fā)現(xiàn)能為骨肉瘤提供新的見解和潛在的治療目標(biāo)。近年來興起的基因芯片技術(shù)使得我們能夠探索骨肉瘤的基因改變,并已在其他疾病中被證明是一種識(shí)別新的生物標(biāo)記物的有效方法。
本研究分析了3個(gè)mRNA芯片數(shù)據(jù)集,獲得骨肉瘤組織與非癌組織間的差異,共鑒定出95個(gè)DEGs。GO和KEGG富集分析探討DEGs之間的相互作用。GO功能注釋發(fā)現(xiàn)生物學(xué)過程主要富集在免疫應(yīng)答、細(xì)胞黏附、蛋白結(jié)合、蛋白質(zhì)異源二聚物活性、GTP酶激活劑活性等過程,這些過程和腫瘤的發(fā)生、發(fā)展、復(fù)發(fā)及轉(zhuǎn)移密切相關(guān),如免疫應(yīng)答已在既往研究[13]中被證實(shí)與腫瘤的發(fā)生發(fā)展及在治療中發(fā)揮作用。KEGG結(jié)果顯示主要富集在細(xì)胞黏附分子、抗原處理和呈遞等信號通路,與GO功能注釋結(jié)果基本一致。
對95個(gè)DEGs進(jìn)行PPI網(wǎng)絡(luò)分析和Hub基因篩選得到鏈接度最高的前10個(gè)基因,分別是CD74、LAPTM5、CD163、MS4A6A、HLA-DRA、CD86、FCER1G、C1QB、TYROBP、AIF1。CD74是主要組織相容性復(fù)合物Ⅱ類的恒定鏈,也是巨噬細(xì)胞游走抑制因子的受體,為一種Ⅱ型跨膜蛋白,可在多種及癌前病變惡性腫瘤組織中表達(dá)[14-15]。有研究[16]表明,CD74為人膠質(zhì)母細(xì)胞瘤中表達(dá)上調(diào)最明顯的分子,可看作其陽性預(yù)后標(biāo)志物,成為治療人膠質(zhì)母細(xì)胞瘤的有吸引力的靶標(biāo)。有學(xué)者[17]認(rèn)為CD74在乳腺癌組織的細(xì)胞膜和細(xì)胞質(zhì)中比在對照組乳腺組織中表達(dá)升高,CD74下調(diào)減少了乳腺癌細(xì)胞的侵襲和遷移,提出針對CD74的新藥物和抗體可能是乳腺癌治療的有效策略的結(jié)論。但CD74是否參與骨肉瘤的發(fā)生、發(fā)展及復(fù)發(fā)轉(zhuǎn)移中,至今未有此類報(bào)道。既往很多研究揭示了CD74基因在人類惡性腫瘤演變進(jìn)程中的重要作用,證明了CD74在轉(zhuǎn)錄水平上調(diào)控骨肉瘤的相關(guān)分子作用機(jī)制,將對骨肉瘤的早期診斷和及時(shí)有效的治療以及治療方式的轉(zhuǎn)變具有極其重要的意義。
LAPTM5是一種溶酶體膜蛋白,主要表達(dá)于淋巴系和髓系來源的細(xì)胞,在免疫細(xì)胞和造血細(xì)胞中優(yōu)先表達(dá)[18]。LAPTM5的異位過表達(dá)導(dǎo)致溶酶體靶向并誘導(dǎo)人HeLa細(xì)胞中凋亡蛋白家族成員Mcl-1下調(diào),Bak活化和線粒體依賴性細(xì)胞凋亡[19]。LAPTM5降低引起G0/G1期的細(xì)胞周期停滯,從而導(dǎo)致膀胱癌細(xì)胞生長延遲,且下調(diào)LAPTM5的膀胱癌細(xì)胞中凋亡情況沒有明顯改變及顯著減少細(xì)胞轉(zhuǎn)移[20]。盡管LAPTM5在骨肉瘤的發(fā)生機(jī)制及進(jìn)展中的作用尚不明確,但從基因芯片分析的結(jié)果可以推測其與骨肉瘤有著密切相關(guān)性,因此,可從LAPTM5基因出發(fā),對骨肉瘤發(fā)生的分子機(jī)制和治療靶點(diǎn)進(jìn)行深入探索。
其他Hub基因如FCER1G,為IgE高親和力受體,在上調(diào)異位抗原提呈細(xì)胞fcεRI中起著重要作用[21]。FCER1G啟動(dòng)子去甲基化導(dǎo)致特應(yīng)性皮炎病人單核細(xì)胞FcεRI過度表達(dá)[22],且有證據(jù)表明該基因表達(dá)失控可能在癌癥發(fā)展中起重要作用[23]。
很多骨肉瘤病人發(fā)現(xiàn)時(shí)已經(jīng)發(fā)生遠(yuǎn)處轉(zhuǎn)移,尤其是肺部轉(zhuǎn)移,因此深入研究骨肉瘤轉(zhuǎn)移、侵襲的分子機(jī)制顯得尤為重要,對提高骨肉瘤的治療效果有極大的影響。LIN等[24]通過前瞻性研究分析指出CD163陽性表達(dá)與較差的5年生存率顯著相關(guān),pSTAT1/CD163表達(dá)狀態(tài)是肺癌5年生存率的唯一獨(dú)立預(yù)測因子。另外一項(xiàng)研究[25]中,肺癌病人的惡性胸腔積液中CD163+腫瘤相關(guān)巨噬細(xì)胞(TAMs)高表達(dá),經(jīng)治療后的胸腔積液中CD163+TAMs表達(dá)明顯降低,研究證明肺癌引起的惡性胸腔積液中CD163+TAMs的積累與預(yù)后不良密切相關(guān)。通過上述研究可知,CD163是腫瘤發(fā)生和轉(zhuǎn)移的關(guān)鍵調(diào)控基因,研究骨肉瘤侵襲、轉(zhuǎn)移的分子機(jī)制可以從CD163基因出發(fā),為解決骨肉瘤轉(zhuǎn)移這一臨床難題提供新途徑。
雖然近年來醫(yī)療水平不斷提高,治療方案不斷完善,但是骨肉瘤病人的生存率仍然沒有較大提高,5年生存率≤20%[26],其早期轉(zhuǎn)移及缺乏前體病變[27]等特點(diǎn)被認(rèn)為是導(dǎo)致病人高死亡率的主要原因。為了應(yīng)對其早期轉(zhuǎn)移,目前臨床上常早期發(fā)現(xiàn)骨肉瘤的時(shí)候即行胸部CT掃描,但是當(dāng)病人肺部轉(zhuǎn)移病灶較小時(shí)則難以檢出,從而延誤診治[28],且復(fù)發(fā)性肺轉(zhuǎn)移常需進(jìn)行多次肺部侵入性檢查或手術(shù),使得病人預(yù)后極差[29]。此外,骨肉瘤無明確的癌前病變,基于以上兩點(diǎn),更加靈敏且特異的篩查方法就顯得尤為重要。隨著基因芯片和二代測序技術(shù)等的廣泛開展,使研究人類癌癥的基因表達(dá)譜變得更加方便,為分子靶標(biāo)預(yù)測及分子靶向治療提供更加明確的方向[30]。
本研究通過生物信息學(xué)相關(guān)分析方法利用基因芯片數(shù)據(jù)和在線數(shù)據(jù)分析網(wǎng)站,得到與骨肉瘤發(fā)生機(jī)制有關(guān)系的Hub基因,但是缺乏相應(yīng)的實(shí)驗(yàn)數(shù)據(jù)作為支持驗(yàn)證,存在一定的局限性,故Hub基因的具體作用機(jī)制及在骨肉瘤發(fā)生、發(fā)展中的作用仍需進(jìn)一步研究證實(shí)。