陳 路,李習平,胡 爽,戴周彤,何曉宏,王志文*
(1.岳陽職業(yè)技術學院 慢性病重點實驗室,中國湖南 岳陽 414000;2.湖南師范大學 附屬岳陽醫(yī)院/岳陽市二人民醫(yī)院,中國湖南 岳陽 414000;3.武漢科技大學 生命科學與健康學院,中國湖北 武漢 430065)
乳腺癌屬于全球健康問題,特別是對于女性而言[1~2]。全球癌癥觀察站指出,乳腺癌致死人數占2018年所有癌癥死亡人數的6%,是女性癌癥死亡的主要原因[2]。隨著乳腺癌患者從階段0和階段Ⅰ (100%)、階段Ⅱ和階段Ⅲ (分別為93%和72%)到階段Ⅳ(22%)的加重,其5年生存率大大降低[1~3]。目前,手術和化學療法被常用于治療乳腺癌[4~5]。但是,化學療法的使用已顯示出嚴重的不良情況,包括疼痛、惡心、神經認知功能障礙和心血管疾病等[6~7]。免疫治療為治療乳腺癌提供了一種新的方法。早在1983年就有研究發(fā)現(xiàn),T細胞能特異性地識別抗原[8]。但是,1992年Harding等[9]的研究顯示,T細胞的活化比以前想象的要復雜得多。例如:在增殖和功能分化的過程中,T細胞活化還刺激了一些抑制途徑,這些途徑可以減弱甚至消除T細胞應答[9]?,F(xiàn)在,人們認識到腫瘤具有抑制抗腫瘤免疫應答的機制,包括細胞因子的產生、免疫抑制細胞的募集和共抑制受體的上調,這些機制被稱為免疫檢查點[10]。
針對免疫檢查點的治療主要包括兩個途徑。其一為細胞毒性T淋巴細胞相關抗原4(cytotoxic T lymphocyte-associated antigen 4,CTLA-4)和共刺激分子B7。它們的結合能夠有效阻斷T細胞與抗原呈遞細胞(antigen-presenting cell,APC)的相互作用,下調T細胞活化能力,從而降低機體的抗腫瘤免疫力,使癌細胞免除被機體自身免疫系統(tǒng)殺死[11]。T細胞表面分子CD28也是免疫球蛋白相關受體家族的成員,負責T細胞免疫調節(jié)的各個方面[12~13]。但是,目前為止針對CD28的治療還在起步階段。而針對CTLA-4,在2011年,伊匹木單抗(ipilimumab)就被美國食品藥品監(jiān)督管理局(U.S.Food and Drug Administration,FDA)批準為首個在轉移性黑色素瘤中顯示總體生存獲益的藥物,其工作機制為靶向CTLA-4基因,阻斷CTLA-4/B7的信號通路,從而使免疫系統(tǒng)識別并殺死癌細胞[14]。第二個主要途徑為程序性死亡蛋白-1(programmed death-1,PD-1)。PD-1最早被發(fā)現(xiàn)于小鼠的T細胞,最初被認為主要起到活化T細胞等免疫細胞的作用[15~16]。其途徑包括PD-1及其配體程序性死亡蛋白配體-1(programmed death ligand-1,PD-L1)和PD-L2。研究報道,PD-1不會直接誘導細胞死亡,但會降低細胞生長因子以及存活信號;PDL1/2激活PD-1會誘導T細胞活性下調、細胞因子生成減少、T細胞裂解以及抗原的耐受性增強[17~20]。體內研究表明,PD-L1可增加腫瘤的發(fā)生和侵襲性,并使腫瘤細胞對特定CD8+T細胞的敏感性降低[21];使用特異性抗體阻斷PD-1/PD-L1途徑可導致腫瘤消退[22]。腫瘤細胞通過PD-1的高表達逃脫T細胞的殺傷已成為免疫耐受的機制之一,腫瘤細胞可通過阻斷效應子功能并降低T細胞殺傷能力來抑制抗腫瘤免疫反應[23]。在過去的幾年中,PD-1和PD-L1的抑制劑,例如納武單抗(nivolumab)、派姆單抗(pembrolizumab)、阿特珠單抗(atezolizumab)、阿維單抗(avelumab)和德瓦魯單抗(durvalumab),改變了癌癥治療的格局。這些藥物因其在許多癌癥治療中的空前優(yōu)勢而獲得FDA批準,包括黑色素瘤、肺癌、尿路上皮癌、腎細胞癌和頭頸癌等[24~30]??紤]到乳腺癌在女性中的高發(fā)生率、高轉移性以及PD-1/PD-L1阻斷劑在其他癌癥中的成功應用,在乳腺癌中使用其抑制劑似乎是一種合理的方法。
本研究旨在通過集成的大型數據庫,系統(tǒng)地研究乳腺癌患者PD-1相關信號通路的關鍵因子的表征:從表達模式到預后價值以及潛在的臨床病理學應用,以協(xié)助PD-1相關信號通路的藥物在乳腺癌中的應用。
所有病人的表達數據與臨床數據都是通過癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數據庫、GTEx(Genotype-Tissue Expression)數據庫和Oncomine數據庫獲得。GTEx數據庫是對健康人提供的組織進行RNA-seq測序的表達譜數據庫(https://www.gtexportal.org/)。TCGA數據庫包括33種癌癥的基因表達譜數據以及對應的臨床信息(https://portal.gdc.cancer.gov/)。Oncomine是在線癌癥微陣列數據庫,是可對全基因組表達進行分析的在線工具(https://www.oncomine.org/)[31]。
為了分析PD-1信號通路相關基因在33種腫瘤中的表達情況,我們訪問了Oncomine在線數據庫并可視化了基因表達。對于TCGA和GTEx數據庫獲取的數據,使用基因表達譜交互分析(Gene Expression Profiling Interactive Analysis,GEPIA)作為可視化工具(http://gepia.cancer-pku.cn/)[32],數據獲取中以 PD-1、PD-L1、CTLA-4、B7 和CD28作為關鍵詞,乳腺癌作為癌癥類型。對于Oncomine數據庫,以 PD-1、PD-L1、CTLA-4、B7 和 CD28 作為關鍵詞,以差異倍數(fold change,FC)的絕對值和表達差異P<0.05作為篩選條件。
人類蛋白質圖譜(The Human Protein Atlas,HPA)數據庫整合了人類組織和癌癥中蛋白質的免疫組織化學圖像(http://www.proteinatlas.org/)[33]。文中以PD-1和B7為關鍵詞,從HPA下載了乳腺癌和正常組織中目標蛋白質的免疫組織化學結果。
UALCAN(http://ualcan.path.uab.edu/)是用于深入分析TCGA數據的工具,用于驗證目的基因表達水平的差異[34]。文中以 PD-1、PD-L1、CTLA-4、B7和CD28作為關鍵詞,乳腺癌作為癌癥類型,分析了PD-1信號通路相關基因表達水平與基于美國癌癥聯(lián)合委員會的乳腺癌分期及患者年齡的關系。
使用GEPIA數據庫,按照目的基因表達的中位數將其分為高表達組與低表達組,繪制Kaplan-Meier生存曲線[32]。
STRING數據庫(https://string-db.org/)常被用于預測和分類協(xié)調基因所編碼蛋白質之間的相互作用[35]。設置STRING數據庫中置信區(qū)間的標準為≥0.900,獲取PD-1信號通路相關基因所編碼蛋白質的相互作用關系網絡。同時,使用GEPIA工具進一步分析PD-1信號通路相關基因與預測蛋白質之間的表達相關性。
采用t檢驗評估PD-1信號通路相關基因在不同組中的表達差異。使用Spearman相關分析探討PD-1信號通路相關基因表達與預測蛋白質之間的相關性。生存曲線是根據對數秩檢驗通過Kaplan-Meier方法生成的。P<0.05被認為具有統(tǒng)計學意義。
為了分析PD-1信號通路相關基因在泛癌中的表達情況,使用Oncomine在線數據庫分析了相關癌癥和正常組織之間的mRNA差異,結果如圖1所示。對于PD-1信號通路相關基因PD-1、PD-L1、B7、CTAL-4 和 CD28,Oncomine數據庫分別包含 293、176、329、303和 329個獨立研究。有趣的是,除了膀胱癌以外,上述5個基因在大多數癌癥類型中表達上調。進一步的分析發(fā)現(xiàn),在乳腺癌組織中,以上5個基因的表達顯著增加,而且PD-1和B7表達升高的研究數量多于任何其他癌癥類型。
圖1 PD-1信號通路相關基因在Oncomine數據庫中的表達情況紅色代表與正常組織相比,在癌癥中表達上升。藍色代表與正常組織相比,在癌癥中表達下降。數字代表具有統(tǒng)計學意義的數據集的數量。Fig.1 Expression of PD-1 related signal pathway genes based on Oncomine databaseRed represents increased expression in cancer compared with normal tissues.Blue represents decreased expression in cancer compared with normal tissues.The number represents the number of statistically significant data sets for the study.
使用UALCAN工具從TCGA數據庫查詢相關基因在乳腺癌中的表達水平。針對1 097個乳腺癌組織和114個正常乳腺組織的分析結果如圖2所示,與正常乳腺組織相比,乳腺癌組織中PD-1、B7和CTLA-4的表達顯著增加(P值分別為1.624×10-12、1.000×10-12和 5.350×10-8);令人驚奇的是,CD28的結果無統(tǒng)計學意義(P=0.881),而PD-L1的RNA-seq表達則下調(P=0.049)。結合Oncomine數據庫中的mRNA數據結果,我們推測PD-1、B7和CTLA-4的表達可能對乳腺癌有重要影響。
圖2 PD-1信號通路相關基因在乳腺癌中的表達Fig.2 Expression of PD-1 signaling pathway-related genes in breast cancer
為了驗證PD-1、B7和CTLA-4的表達在臨床中的潛在應用,我們從人類蛋白質圖譜中提取了特征化的免疫組織化學圖像。令人遺憾是,數據中沒有與CTLA-4相關的免疫組織化學圖像。PD-1與B7的免疫組織化學圖像如圖3所示,在正常的乳腺組織中,細胞核呈現(xiàn)不均勻的陽性染色,且混合模式較弱,相對表達量較低;但是在乳腺癌組織中,PD-1的表達存在明顯的區(qū)別,且相對表達量較高,而B7的表達無顯著差異。
圖3 PD-1和B7在乳腺癌中表達的典型免疫組化圖像Fig.3 Typical immunochemistry images of PD-1 and B7 expression in breast cancer
為了進一步探討PD-1信號通路相關基因PD-1、B7和CTLA-4在乳腺癌中的病理特征,使用UALCAN數據庫分析了它們在乳腺癌中的表達與不同階段、年齡及亞型的關系。從圖4可知,PD-1、B7和CTLA-4的表達與患者乳腺癌所處階段和年齡均無關(P≥0.05),說明PD-1、B7和CTLA-4在所有分期及年齡段的乳腺癌患者體內表達上升。從圖5可知,與正常組織相比,PD-1、B7和CTLA-4在luminal A型乳腺癌、人表皮生長因子受體2(human epidermal growth factor receptor 2,HER-2)陽性乳腺癌和三陰性乳腺癌(triple negative breast cancer,TNBC)3種乳腺癌細胞亞型中的表達量都有顯著變化;并且,B7和CTLA-4在TNBC亞型中顯示出最高的表達,預示PD-1信號通路相關基因在TNBC的發(fā)生發(fā)展中扮演著重要的角色。
圖4 PD-1信號通路相關基因的表達與乳腺癌分期和患者年齡的關系Fig.4 The relationship between the expression of PD-1 signaling pathway-related genes and breast cancer stage and patient age
圖5 PD-1信號通路相關基因在乳腺癌亞型中的表達分析Fig.5 Expression of PD-1 signaling pathway related genes in breast cancer subtypes
迄今為止,除了PD-1外,人們對于乳腺癌中PD-1信號通路其他相關基因的表達水平或其可能的預后價值所知甚少。為了系統(tǒng)研究PD-1信號通路相關基因的表達與預后之間的關系,通過GEPIA工具根據其mRNA表達進行了Kaplan-Meier生存分析。結果如圖6所示,CTLA-4、CD28、B7和PD-L1的結果不具有統(tǒng)計學意義,只有PD-1的結果具有顯著性差異,其高表達組具有更好的總體生存率。
圖6 PD-1信號通路相關基因在乳腺癌中的預后分析Fig.6 Analysis of correlation between PD-1 signaling pathway related genes and breast cancer prognosis
為了更好地研究PD-1信號通路相關蛋白質的功能與其作用機制,使用STRING數據庫預測與其相互作用的蛋白質網絡。根據設定的預測結合閾值,結果如圖7所示,預測到的互作蛋白質共有21個,其中多數蛋白質已有報道,例如CD4、CD3G及CD274。它們參與T細胞活化、淋巴細胞活化、白細胞遷移、T細胞凋亡、耐受誘導和細胞溶解等[15~16,36]。通過計算PD-1與其預測結合蛋白質的相關系數,我們發(fā)現(xiàn)正負相關系數最高的蛋白質為非受體型蛋白質酪氨酸磷酸酶6(protein tyrosine phosphatase non-receptor type 6,PTPN6)。但是,PTPN6與PD-1信號通路相關蛋白質之間相互作用的具體方式尚沒有闡明?;诖?我們通過GEPIA數據庫分析了PD-1與PTPN6的相關性。圖8的分析結果顯示,PD-1的表達與PTPN6呈正相關,與PTPN11呈負相關,而PTPN家族主要在各種受體和細胞質蛋白質酪氨酸激酶的下游起作用,參與從細胞表面到細胞核的信號轉導,因此推測PD-1可能還通過PTPN家族影響細胞的其他功能。
圖7 PD-1信號通路相關蛋白質與其預測結合蛋白質間的相互作用網絡Fig.7 The interaction network between PD-1 signaling pathway related proteins and their predicted binding proteins
眾所周知,腫瘤及其微環(huán)境可以影響癌細胞的侵襲、增殖和轉移功能[37~39]。盡管臨床已經將許多化學療法及外科手術應用于癌癥的治療,但是人們仍然認為人類的免疫系統(tǒng)是抵抗癌癥最基本的、有效的武器[40]。通過抑制免疫檢查點PD-1和PD-L1來治療癌癥是細胞毒性免疫反應最關鍵的生物學手段之一,其抗體已獲得FDA前所未有的快速授權[41~42]。然而,PD-1/PD-L1的抑制劑并不是對每個個體都有效,這就需要對PD-1及其信號通路相關基因調控的特定機制有全面的了解[43]。
在先前的研究中,研究基因的表達往往需要大量的基礎實驗,存在時間周期較長和樣品數量過少的缺點。生物信息學的出現(xiàn)為我們研究基因的表達提供了新的工具。大量研究顯示,生物信息已經被廣泛地應用于基因在正常組織與癌癥組織中的表達分析,以及基因表達與患者生存的研究。Ge等[44]通過薈萃分析TCGA的數據發(fā)現(xiàn),雌激素受體α和β在胃癌中異常表達,并且,雌激素受體β的高表達與淋巴結轉移呈負相關,雌激素受體α的表達可能與胃癌患者的預后不良有關。Qin等[45]通過TCGA數據庫分析發(fā)現(xiàn),USP37(ubiquitin-specific peptidase 37)在乳腺癌組織中的表達升高,其過表達與死亡率增加密切相關;進一步的GSEA分析顯示,在TCGA乳腺癌樣品中,USP37的表達與細胞生長和轉移呈正相關,而與細胞凋亡呈負相關。需要指出的是,以上生物信息學分析均得到了該研究團隊的實驗驗證?;谏镄畔W分析的高效性、可靠性,為了探討PD-1信號通路相關基因在癌癥中的意義,本研究使用Oncomine數據庫,首先揭示了包括乳腺癌等在內的不同癌癥中PD-1信號通路相關基因在mRNA水平上的表達,發(fā)現(xiàn) PD-1、PD-L1、B7、CTLA-4和CD28在多數癌癥中表達上調(圖1)。為了驗證結果的準確性,使用TCGA數據庫從mRNA水平對上述5個基因在乳腺癌中的表達進行了分析,發(fā)現(xiàn)除了PD-L1與CD28,其他基因的表達趨勢與Oncomine結果一致(圖2)。然而,TCGA數據庫是通過提取腫瘤組織的全部RNA進行芯片測序的結果。因此,基于我們的發(fā)現(xiàn),進一步從HPA數據庫中提取了相關蛋白質的免疫組織化學圖像(圖3),以驗證TCGA數據庫的分析結果?;虻呐R床表達特征分析顯示,PD-1通路相關基因的表達與乳腺癌不同臨床階段和年齡均無關(圖4),說明PD-1通路相關基因具有作為潛在標記物來治療乳腺癌的可行性。但是,這部分結論還需要通過收集大量的數據進行驗證。此外,蛋白質-蛋白質互作網絡分析顯示,PD-1通路相關基因可以通過多種途徑參與T細胞活化的生物學過程、淋巴細胞活化的調節(jié)、T細胞活化的調節(jié)和白細胞遷移(圖7),其中有的途徑已經被驗證,有的尚待發(fā)現(xiàn)。
在免疫治療中,PD-1/PD-L1作為免疫檢查點通常被上調,以創(chuàng)建免疫抑制性腫瘤微環(huán)境,并幫助癌細胞逃避免疫介導的破壞[46]。先前的研究表明,PD-1通路相關基因與預后之間的相關性在不同類型的腫瘤之間是不同的[47~50]。值得注意的是,在彌漫性大B細胞淋巴瘤中,低PD-1+的病人預后更差[51],而在肝內膽管癌患者中,PD-1的表達會對患者的生存產生負面影響[52]。在本研究中,通過使用TCGA數據庫中乳腺癌的生存數據,我們發(fā)現(xiàn)在PD-1信號通路相關基因中PD-1的表達與乳腺癌患者的生存情況呈正相關性(圖6)。研究顯示,在127例原發(fā)性乳腺癌中,PD-L1的高表達與良好臨床預后相關[53]。另一項針對乳腺癌患者的研究表明,PD-L1的表達與CD8+T細胞呈正相關,并具有良好的臨床效果[54]。但是,也有報道指出,PD-L1的高表達與三陰性乳腺癌患者的預后較差有關,這抵消了腫瘤浸潤淋巴細胞的作用[55]。與上述報道不同,本研究尚未發(fā)現(xiàn)PDL1的表達與乳腺癌患者生存的關系(圖6)。迄今為止,PD-1是否可預測乳腺癌患者的預后仍在爭論中。我們的研究為以后開展基于PD-1信號通路相關的基因治療提供了新的理論支持。但是,由于TCGA與Oncomine中主要的患者為美國生活的白種高加索人,黃色人種與黑色人種的數據量較少。因此,往后還需大量收集不同膚色、人種乳腺癌患者的預后和PD-1信號通路相關基因的表達數據,進一步確認PD-1信號通路相關基因的表達與乳腺癌患者預后的關系。
在本研究中,我們探討了PD-1信號通路相關基因在泛癌中的表達,發(fā)現(xiàn)PD-1、PD-L1、B7、CTLA-4和CD28在包括乳腺癌在內的大多數癌癥中表達上升;并通過對TCGA數據庫的臨床信息與表達信息的挖掘,證實上述5個基因在乳腺癌中表達異常,其中PD-1的表達結果通過HPA數據庫中的免疫組化圖像得到了驗證。同時,數據分析發(fā)現(xiàn),B7和CTLA-4在TNBC乳腺癌亞型中表達最高;蛋白質互作網絡分析顯示,PD-1/PD-L1信號通路與多種蛋白質存在結合的可能性;相關性分析發(fā)現(xiàn),PD-1表達與PTPN家族多個靶點蛋白質的表達有關。此外,基于乳腺癌患者臨床生存數據的Kaplan-Meier生存曲線顯示,PD-1高表達的乳腺癌患者的預后更好。