張洪祿,滕 悅,湯唯艷,湯依群,吳劍秋
(1.江蘇省腫瘤醫(yī)院內(nèi)科,江蘇 南京 210000;2.中國藥科大學(xué)基礎(chǔ)醫(yī)學(xué)與臨床藥學(xué)學(xué)院,江蘇 南京 210000)
非特指性外周T 細(xì)胞淋巴瘤(PTCL-NOS)是外周T 細(xì)胞淋巴瘤(PTCL)中最常見的類型,超過30%的PTCL 患者被歸類于PTCL-NOS[1]。由于PTCL-NOS 具有高度異質(zhì)性和耐藥性,目前所采用的一線方案是沿襲B 細(xì)胞淋巴瘤治療方案而來,絕大部分治療方案缺乏高水平的證據(jù)或生物學(xué)基礎(chǔ)[2]。雖然近年來不斷有針對PTCL-NOS 的新藥面世,但此類患者與B 細(xì)胞淋巴瘤患者相比仍存在預(yù)后差、復(fù)發(fā)率高的問題,因此闡明PTCL-NOS 的分子機(jī)制和尋找有效藥物對該病的治療尤為重要。近年來,生物信息學(xué)技術(shù)在確定疾病潛在的關(guān)鍵基因靶點(diǎn)、信號途徑,疾病診斷和疾病發(fā)生的預(yù)測等多方面發(fā)揮著越來越重要的作用。本研究使用R 語言軟件與在線生物信息學(xué)分析工具,篩選影響PTCL-NOS 的關(guān)鍵信號通路和差異表達(dá)基因,并對可能對PTCL-NOS 產(chǎn)生治療作用的藥物進(jìn)行篩選,以期為PTCL-NOS 的研究和治療提供新的思路。
1.1 GEO 基因芯片的獲取和分析 登錄美國國立生物中心基因數(shù)據(jù)庫(NCBI-GEO)網(wǎng)站(https://www.ncbi.nlm.nih.gov/geo/),將篩選研究類型設(shè)置為expressionprofilingbyarray,篩選種屬為homospiens,檢索詞為expression data from PTCL 后,檢索到GSE132550 芯片數(shù)據(jù)集,GSE132550 芯片數(shù)據(jù)集中包含了68 個(gè)PTCL-NOS 患者的樣本,18 個(gè)Lennert淋巴瘤患者樣本和16 個(gè)來自于健康志愿者T 細(xì)胞的樣本。下載GSE132550 的表達(dá)譜(.txt 格式文件)和相關(guān)臨床信息(.soft 格式文件)。應(yīng)用GPL18281平臺對其進(jìn)行表達(dá)譜注釋分析。選取GSE132550 芯片數(shù)據(jù)集中PTCL-NOS 和健康志愿者的樣本進(jìn)行進(jìn)一步研究。
1.2 差異基因表達(dá)分析 通過R 語言對芯片數(shù)據(jù)進(jìn)行質(zhì)量分析和標(biāo)準(zhǔn)化處理。為提高差異基因分析的準(zhǔn)確性,將差異基因分析閾值設(shè)定為|Log2FC(foldchange)|>4,P<0.01。在R 語言中加載附加模塊Limma 包和affyPLM 包,對PTCL-NOS 樣本和健康T 細(xì)胞樣本進(jìn)行差異基因的表達(dá)分析[3]。
1.3 基因本體論與KEGG 途徑富集分析 將之前所獲得的差異基因上傳至生物信息學(xué)微陣列分析數(shù)據(jù)庫DAVID(https://david.ncifcrf.gov/tools.jsp)以獲得基因本體論(GO)和京都基因和基因組百科全書(KEGG)通路的分析結(jié)果。GO 的結(jié)果包括生物學(xué)的3 個(gè)方面:細(xì)胞構(gòu)成(cell components,CC)、分子功能(molecular functions,MF)和生物學(xué)過程(biological processes,BP)。
1.4 差異基因的蛋白質(zhì)交互網(wǎng)絡(luò)富集分析 STRING(11.0 版)(https://string-db.org/) 是一個(gè)在線數(shù)據(jù)庫,包含已知和預(yù)測的蛋白質(zhì)-蛋白質(zhì)相交互用(PPI)[4]。將所有差異基因上傳到STRING 中,并將最小交互分?jǐn)?shù)設(shè)置為0.9(最高條件)以上作為顯著閾值。將所獲得的PPI(.TSV 格式文件)上傳到Cytoscape 軟件以構(gòu)建PPI 網(wǎng)絡(luò)[5]。隨后,采用Cytoscape 軟件內(nèi)的分子復(fù)合物檢測(MCODE)-app技術(shù)來識別關(guān)鍵基因間的連接網(wǎng)絡(luò)。MCODE 中的所有參數(shù)設(shè)置為default。
1.5 藥物-基因相互作用分析 DGIdb(https://www.dgidb.org)是一個(gè)基于數(shù)十個(gè)可信數(shù)據(jù)庫的,用于篩選分析藥物-基因相互作用的在線數(shù)據(jù)庫[6]。將MCODE 獲得的關(guān)鍵基因上傳到DGIdb 中,以搜索現(xiàn)有的藥物-基因相互作用,并利用與藥物匹配的關(guān)鍵基因進(jìn)行功能富集分析。
1.6 統(tǒng)計(jì)學(xué)分析 所有的統(tǒng)計(jì)分析均由R 軟件(4.0.2)進(jìn)行,整個(gè)分析流程見圖1。
圖1 數(shù)據(jù)分析流程
2.1 差異表達(dá)基因的獲取 用R 軟件分析GSE132550 數(shù)據(jù)集中PTCL-NOS 樣本和健康T 細(xì)胞樣本,根據(jù)|Log2FC|>4,P<0.01 的篩選標(biāo)準(zhǔn),共獲得1139 個(gè)存在差異表達(dá)的基因,其中包括670 個(gè)上調(diào)基因和469 個(gè)下調(diào)基因,見圖2。
圖2 1139 個(gè)差異基因的火山圖
2.2 GO 與KEGG 信號通路的富集分析 將所有的差異基因上傳到DAVID 數(shù)據(jù)庫進(jìn)行GO 富集分析,得到差異基因的主要富集項(xiàng)目,包括KEGG 信號通路、BP、CC 和MF。在KEGG 信號通路中差異基因主要富集于PI3K-AKT 信號通路,細(xì)胞外基質(zhì)受體相互作用通路和阿米巴病相關(guān)信號通路,見圖3;BP注釋中差異基因主要存在于細(xì)胞外基質(zhì)組織、細(xì)胞外結(jié)構(gòu)組織和細(xì)胞連接組件,見圖4;CC 注釋中差異基因主要涉及膠原蛋白-細(xì)胞外間質(zhì)、基底膜和膠原三聚體的組成成分,見圖5;MF 注釋中差異基因與細(xì)胞外基質(zhì)結(jié)構(gòu)成分、生長因子結(jié)合和膠原蛋白結(jié)合密切相關(guān),見圖6。
圖3 KEGG 信號通路富集結(jié)果
圖4 BP 富集結(jié)果
圖5 CC 富集結(jié)果
圖6 MF 富集結(jié)果
2.3 PPI 富集分析 將1139 個(gè)差異基因上傳到STRING 數(shù)據(jù)庫進(jìn)行PPI 富集分析,得到包含552 個(gè)基因節(jié)點(diǎn)和1888 條連線的PPI 網(wǎng)絡(luò),使用Cytoscape軟件中的MCODE-app 篩選出包含顯著差異基因的模塊,交互模塊(分?jǐn)?shù):15.655)涉及30 個(gè)基因節(jié)點(diǎn)和227 條連線,模塊中的差異基因主要包含在G 蛋白偶聯(lián)受體信號通路、胞外區(qū)和質(zhì)膜中,見圖7。
圖7 30 個(gè)顯著基因組成的蛋白交互網(wǎng)絡(luò)
2.4 藥物與基因的相交互用及潛在基因功能富集分析 將2.3 中模塊1 的30 個(gè)MCODE 基因上傳到DGIdb 數(shù)據(jù)庫中進(jìn)行藥物-基因相交互用分析,在篩選出與基因存在特定交互關(guān)系的藥物后,發(fā)現(xiàn)了105 個(gè)藥物靶向9 個(gè)特定基因(其中包括90 種針對ADRA2A 的藥物),所有的藥物都有其初始適應(yīng)證,見表1;這些基因主要富集在G 蛋白偶聯(lián)受體信號通路(BP)、質(zhì)膜(CC)和神經(jīng)活性配體-受體相交互用(KEGG 通路),見圖8、表2。
圖8 9 個(gè)存在藥物-基因相交互用的基因富集弦圖
表1 基因-藥物相互作用
表2 具有基因-藥物交互結(jié)果的9 個(gè)基因富集分析
PTCL-NOS 是PTCL 最常見的亞型,通常表現(xiàn)出侵襲的臨床過程且分子機(jī)制尚未完全闡明[7]。幾乎所有PTCL-NOS 的治療方案都缺乏高水平的證據(jù)、分子或生物學(xué)基礎(chǔ)[8]。目前,其一線治療方案主要來源于侵襲性B 細(xì)胞淋巴瘤的治療方案,存在復(fù)發(fā)率高、遠(yuǎn)期療效差等問題[9]。近年來,隨著轉(zhuǎn)錄組學(xué)的發(fā)展,許多疾病的分子特征和靶向藥物的發(fā)現(xiàn),為個(gè)體化治療提供了可能。本研究旨在通過對PTCL-NOS 基因組學(xué)和轉(zhuǎn)錄組學(xué)的分析,采用生物信息學(xué)方法尋找TCL-NOS 關(guān)鍵基因和靶向藥物。
本研究發(fā)現(xiàn),PTCL-NOS 患者的部分KEGG 信號通路活動發(fā)生了明顯改變,其中PI3K-Akt 信號通路的改變最為顯著,共有36 個(gè)包含在該通路內(nèi)的基因發(fā)生了表達(dá)改變。磷脂酰肌醇-3 激酶(PI3K)/蛋白激酶B(AKTe)/雷帕霉素(mTOR)信號通路的哺乳動物靶點(diǎn)在包括代謝、凋亡、血管生成和細(xì)胞增殖在內(nèi)的生物調(diào)節(jié)中起著重要作用,也是人類癌癥中最常見的失調(diào)信號通路之一[10]。PI3K 是磷脂酰肌醇-3,4,5-三磷酸(PIP3)的脂類激酶。PIP3 是AKT的對接位點(diǎn),通過激活下游效應(yīng)子mTOR 信號通路促進(jìn)細(xì)胞生長、蛋白質(zhì)合成、細(xì)胞運(yùn)動和存活[11]。PTEN 是PI3K 的負(fù)性調(diào)節(jié)因子,能抑制PI3K 抑制腫瘤生長。在癌癥環(huán)境下,PTEN 的突變使其失去對PI3K 的調(diào)節(jié)能力,進(jìn)而失調(diào)下游通路[12]??傊?,在癌癥中,PI3K/AKT/mTOR 通路的過度激活增強(qiáng)了營養(yǎng)轉(zhuǎn)運(yùn)蛋白和代謝酶的活性,導(dǎo)致細(xì)胞代謝改變,從而為腫瘤細(xì)胞的生長提供了合成代謝需求,同時(shí)也增加了腫瘤細(xì)胞的耐藥性[13]。
根據(jù)DGIdb 數(shù)據(jù)庫的基因-藥物相交互用分析,共有105 種治療PTCL-NOS 的潛在藥物(其中有90 種藥物針對ADRA2A),靶向9 個(gè)基因(ADRA2A、S1PR1、S1PR3、S1PR4、CP、FN1、APOE、SERPINA1、C3)。ADRA2A 被認(rèn)為是多種腫瘤細(xì)胞系的潛在調(diào)節(jié)因子[14]。SERPINA1 過表達(dá)顯著改善了癌細(xì)胞遷移、集落形成和對細(xì)胞凋亡的抵抗力[15]。APOE 可通過與膜受體結(jié)合介導(dǎo)循環(huán)脂蛋白和組織之間的脂質(zhì)轉(zhuǎn)移[16]。APOE 可通過LR8 受體直接抑制循環(huán)髓源性抑制細(xì)胞的存活,并在激活免疫系統(tǒng)中發(fā)揮抗腫瘤作用[17]。FN1 在多種癌癥中上調(diào),沉默F(xiàn)N1 可促進(jìn)腫瘤生長和轉(zhuǎn)移[18,19]。S1P-S1PRs 信號通路誘導(dǎo)免疫細(xì)胞從淋巴器官流入血液,從而影響抗腫瘤免疫反應(yīng)[20,21]。西尼莫得是一種高效的S1PRs拮抗劑,已被批準(zhǔn)用于治療多發(fā)性硬化癥,其安全性和有效性已被證實(shí)。另一種S1PRs 抑制劑芬戈莫德也證明了其治療癌癥的潛力[20]。
綜上所述,本研究發(fā)現(xiàn)9 個(gè)與PTCL-NOS 有關(guān)的關(guān)鍵基因(ADRA2A、S1PR1、S1PR3、S1PR4、CP、FN1、APOE、SERPINA1、C3)和105 個(gè)FDA 批準(zhǔn)的藥物,如芬戈莫德、西尼莫得、氯化鋅、丙氯拉嗪等。另外PI3K-AKT 信號通路對于PTCL-NOS 疾病的作用也值得關(guān)注。但由于本研究獲得的關(guān)鍵基因和藥物是基于軟件統(tǒng)計(jì)處理和數(shù)據(jù)庫分析,它們是否能在PTCL-NOS 中發(fā)揮作用仍需進(jìn)一步的分子生物學(xué)實(shí)驗(yàn)來驗(yàn)證。