【摘要】 目的 通過(guò)表達(dá)數(shù)量性狀位點(diǎn)(eQTL)定位篩選乳腺癌免疫相關(guān)分子標(biāo)志物,旨在為乳腺癌的診斷和治療尋找潛在靶標(biāo)。方法 對(duì)來(lái)自GEO數(shù)據(jù)庫(kù)的3個(gè)乳腺癌數(shù)據(jù)集進(jìn)行系統(tǒng)分析,利用eQTL分析確定工具變量(IVs),利用公開(kāi)的乳腺癌全基因組關(guān)聯(lián)(GWAS)數(shù)據(jù)進(jìn)行孟德?tīng)栯S機(jī)化(MR)分析,得到與MR相關(guān)的基因并通過(guò)OR值確定基因的風(fēng)險(xiǎn)程度,與GEO數(shù)據(jù)集中識(shí)別的差異表達(dá)基因(DEGs)取交集得到疾病的關(guān)鍵基因。然后對(duì)關(guān)鍵基因進(jìn)行GO、KEGG、GSEA富集分析和免疫細(xì)胞浸潤(rùn)及基因免疫相關(guān)性分析,進(jìn)一步分析關(guān)鍵基因在乳腺癌中的作用。最后使用獨(dú)立的GEO數(shù)據(jù)集和TCGA數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果 通過(guò)差異分析得到307個(gè)上調(diào)基因,440個(gè)下調(diào)基因。利用MR分析和DEGs交叉共得到9個(gè)疾病的關(guān)鍵基因(PARP1、MUC1、LILRB2、TNNT1、CTNNAL1、DNASE1L3、HOXA9、PIK3R1、SLPI),這些基因參與了乳腺癌發(fā)生發(fā)展過(guò)程中的B細(xì)胞受體、細(xì)胞凋亡等信號(hào)通路。根據(jù)CIBERSORT分析得出,乳腺癌中CD4+ T細(xì)胞浸潤(rùn)顯著下降,M0巨噬細(xì)胞浸潤(rùn)顯著上升,且關(guān)鍵基因與nave B以及記憶B細(xì)胞之間存在負(fù)調(diào)控關(guān)系,與M0巨噬細(xì)胞及調(diào)節(jié)T細(xì)胞等存在正調(diào)控關(guān)系,表明關(guān)鍵基因與乳腺癌細(xì)胞免疫的關(guān)系密切。結(jié)論 篩選出來(lái)的關(guān)鍵基因尤其是DNASE1L3與乳腺癌的免疫進(jìn)程密切關(guān)聯(lián),未來(lái)可能會(huì)成為乳腺癌免疫治療的理想靶標(biāo)。
【關(guān)鍵詞】 表達(dá)數(shù)量性狀位點(diǎn)定位;乳腺癌;孟德?tīng)栯S機(jī)化;腫瘤免疫;生物標(biāo)志物
中圖分類號(hào):R734.2
文獻(xiàn)標(biāo)志碼:A
DOI:10.3969/j.issn.1003-1383.2025.02.002
Identification of immune-related markers of breast cancer based on eQTL
localization: a Mendelian randomization and transcriptomics study
HE Yaling1, ZHANG Xin1, WU Zeyuan1, ZHANG Pingxi1, YE Yalin1, PAN Yun2, LI Yan1,2▲
(1. School of Basic Medical Sciences, Dali University, Dali 671000, Yunnan, China; 2. Department of
Pathology, the First Affiliated Hospital of Dali University, Dali 671000, Yunnan, China)
【Abstract】 Objective To screen breast cancer immune-related molecular markers through"" expression quantitative trait loci (eQTL) localization, so as to provide potential targets for the diagnosis and treatment of breast cancer. Methods Systematic analysis was conducted on three breast cancer datasets from GEO database. eQTL analysis was utilized to identify instrumental variables (IVs). Subsequently, Mendelian randomization (MR) analysis was performed using publicly available genome-wide association study (GWAS) data of breast cancer. Genes associated with MR were obtained, and their risk levels were determined through odds ratios (OR). The intersection of these genes with differentially expressed genes (DEGs) identified from the GEO datasets was then taken to obtain key genes for the disease. And then, gene ontology (GO) and Kyoto encyclopedia of genes and genomes (KEGG) enrichment analyses, gene set enrichment analysis (GSEA), and immune cell infiltration and gene-immune correlation analyses were conducted on key genes to further elucidate their roles in breast cancer. Finally, independent GEO datasets and the cancer genome atlas (TCGA) data were used for validation. Results A total of 307 upregulated genes and 440 downregulated genes were identified through differential expression analysis. A total of 9 disease-critical genes were identified through MR analysis and the intersection of DEGs: PARP1, MUC1, LILRB2, TNNT1, CTNNAL1, DNASE1L3, HOXA9, PIK3R1, and SLPI. These genes were involved in signaling pathways such as B-cell receptor signaling and apoptosis, which play important roles in the development and progression of breast cancer. According to CIBERSORT analysis, there was a significant decrease in CD4+T cell infiltration and a significant increase in M0 macrophage infiltration in breast cancer. Moreover, the key genes exhibited negative regulatory relationship with nave B cells and memory B cells, and positive regulatory relationship with M0 macrophages and regulatory T cells, which indicated that key genes were closely related to breast cancer cell immunity. Conclusion The key genes identified, particularly DNASE1L3, are closely related to the immune processes in breast cancer and may potentially serve as ideal targets for breast cancer immunotherapy in the future.
【Keywords】 expression quantitative trait loci (eQTL) localization; breast cancer; Mendelian randomization(MR); tumor immunity; biomarker
乳腺癌(breast cancer, BC)是女性最常見(jiàn)的惡性腫瘤之一,具有高度的異質(zhì)性,是導(dǎo)致目前全球女性癌癥死亡的主要原因,同時(shí),由于其發(fā)病率和病死率均在不斷攀升,給臨床治療帶來(lái)了較大困難[1]。盡管針對(duì)BC的研究取得了重大的進(jìn)展,但敏感性和有效靶點(diǎn)的確定仍然是難以解決的問(wèn)題,這也是BC高死亡率的主要原因[2-3]。因此,對(duì)BC實(shí)施精準(zhǔn)治療的難題仍存在,迫切需要找到關(guān)鍵的診斷、預(yù)后以及治療的有效靶標(biāo)。表達(dá)數(shù)量性狀位點(diǎn)(expression quantitative trait loci,eQTL)是與特定單核苷酸多態(tài)性(SNP)基因表達(dá)水平之間具有統(tǒng)計(jì)相關(guān)性的遺傳變異[4]。eQTL通過(guò)檢測(cè)特定SNP與基因表達(dá)水平之間的關(guān)聯(lián),可揭示遺傳變異對(duì)復(fù)雜性狀和疾病之間的潛在影響機(jī)制[5]。其類似于隨機(jī)對(duì)照試驗(yàn),即遺傳變異遵循等位基因隨機(jī)分配給后代的原則,這使得其與觀察性的流行病學(xué)研究相比具有獨(dú)特的優(yōu)勢(shì)。孟德?tīng)栯S機(jī)化(Mendelian randomization, MR)是一種利用與暴露具有強(qiáng)相關(guān)的遺傳變異工具,對(duì)暴露因素與結(jié)局之間進(jìn)行可靠因果關(guān)系預(yù)測(cè)的高效分析方法,能很大程度減小傳統(tǒng)的實(shí)驗(yàn)研究操作不當(dāng)引起的誤差[6]。
在本研究中,使用MR分析預(yù)測(cè)eQTL數(shù)據(jù)與BC之間的聯(lián)系,同時(shí),通過(guò)轉(zhuǎn)錄組數(shù)據(jù)確定BC的關(guān)鍵基因,利用細(xì)胞免疫浸潤(rùn)分析算法“CIBERSORT”分析BC的免疫浸潤(rùn)情況,GSEA分析確定關(guān)鍵基因在BC發(fā)生發(fā)展中的病理生理機(jī)制。此外,還評(píng)估了9個(gè)關(guān)鍵基因與免疫細(xì)胞浸潤(rùn)之間的聯(lián)系以及浸潤(rùn)細(xì)胞之間的關(guān)聯(lián)性。希望通過(guò)以上鑒定的基因能作為診斷和治療BC的候選靶標(biāo),對(duì)它們潛在機(jī)制的研究可能是日后BC診斷試劑以及藥物研發(fā)的潛在靶標(biāo)。研究流程見(jiàn)圖1。
1 材料與方法
1.1 數(shù)據(jù)收集與整理 從GEO(https://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫(kù)獲取4組BC患者的mRNA微陣列數(shù)據(jù)集,主要包含以下信息:GSE9309(包含98個(gè)乳腺癌樣本,8個(gè)正常樣本),GSE18672(包含64個(gè)乳腺癌樣本,79個(gè)正常樣本),GSE24124 (包含99個(gè)腫瘤樣本,20個(gè)正常樣本),GSE32641(包含95個(gè)腫瘤樣本,7個(gè)正常樣本)。GSE9309、GSE24124、GSE32641均基于GPL887平臺(tái)[7],GSE18672基于GPL6848平臺(tái)[8]。將GSE9309、GSE18672、GSE24124數(shù)據(jù)集合并為訓(xùn)練集(其中乳腺癌樣本261個(gè),正常樣本107個(gè));將GSE32641作為驗(yàn)證數(shù)據(jù)集。數(shù)據(jù)集詳細(xì)信息見(jiàn)表1。在TCGA(https://cancergenome.nih.gov/abouttcga/overview)數(shù)據(jù)庫(kù)下載BC的mRNA表達(dá)數(shù)據(jù)(TCGA-BRCA.htseq_fpkm)作為外部獨(dú)立驗(yàn)證隊(duì)列。
1.2 基因表達(dá)差異分析 在R中使用“sva”和“l(fā)imma”包對(duì)GSE18672、GSE24124、GSE32641數(shù)據(jù)進(jìn)行合并[9-10],并采用主要成分(PCA)分析進(jìn)行批次校正。使用“l(fā)imma”包識(shí)別疾病與正常對(duì)照組之間的差異表達(dá)基因(differential expression genes, DEGs),顯著性閾值設(shè)為Plt;0.05,|Fold Change|gt;1。隨后,利用“ggplot2”軟件包繪制DEGs火山圖[11],“pheatmap”軟件包繪制DEGs熱圖。
1.3 孟德?tīng)栯S機(jī)化方法
1.3.1 孟德?tīng)栯S機(jī)化數(shù)據(jù)來(lái)源 使用全基因組關(guān)聯(lián)(GWAS)數(shù)據(jù)進(jìn)行了孟德?tīng)栯S機(jī)化分析以研究基因與BC之間潛在的因果關(guān)系。暴露的GWAS數(shù)據(jù)來(lái)自O(shè)penGWAS (https://gwas.mrcieu.ac.uk/)數(shù)據(jù)庫(kù)中的eQTL數(shù)據(jù)集,共收集了19 942個(gè)基因。結(jié)局的GWAS數(shù)據(jù)來(lái)自BCAC(https://bcac.ccge.medschl.cam.ac.uk/)數(shù)據(jù)庫(kù),共包含了228 951個(gè)樣本,且暴露和結(jié)局的GWAS數(shù)據(jù)均來(lái)自具有歐洲血統(tǒng)的人群。由于本研究MR分析所使用的是公開(kāi)的GWAS匯總數(shù)據(jù),因此,不需要額外的倫理批準(zhǔn)或知情同意書。
1.3.2 工具變量(IVs)選擇 根據(jù)以下步驟篩選IVs:(1)設(shè)置Plt;5e-08后,使用“TwoSampleMR”軟件包分析每個(gè)基因的eQTL數(shù)據(jù)集,用于評(píng)估SNP與基因表達(dá)水平之間的關(guān)聯(lián)性[12];(2)設(shè)置連鎖不平衡條件,其中(R2lt;0.001,10 000個(gè)堿基對(duì)的物理距離閾值)用于得到高度相關(guān)的SNP并保留與基因表達(dá)水平具有最強(qiáng)烈關(guān)聯(lián)性的SNP用于后續(xù)分析;(3)計(jì)算暴露的F值用于估算弱變量偏差,F(xiàn)值lt;10的工具變量表明偏差較弱,應(yīng)當(dāng)舍棄[13]。
1.3.3 孟德?tīng)栯S機(jī)化分析 通過(guò)以上步驟篩選出符合條件的IVs后,使用“TwoSampleMR”和“VariantAnnotation”包對(duì)暴露和結(jié)局進(jìn)行兩樣本MR分析[12-14]。采用5種分析方法[Inverse-variance weighted(IVW)、MR-Egger、weighted median、Weighted mode、Simple mode],其中IVW作為主要分析方法[15],但前提是用于分析的工具變量具有很強(qiáng)的因果關(guān)系檢測(cè)能力,且必須是有效的[16]。由于選定人群和實(shí)驗(yàn)條件不同,樣本之間可能存在異質(zhì)性,使最后的結(jié)果產(chǎn)生偏差,因此使用Cochran's Q檢驗(yàn)來(lái)檢測(cè)異質(zhì)性,當(dāng)Pgt;0.05時(shí)認(rèn)為所選的IVs不存在異質(zhì)性。而MR分析中的一個(gè)假設(shè)是:所選工具變量只能通過(guò)暴露來(lái)影響結(jié)局,因此,為使暴露與結(jié)局之間的結(jié)果更加穩(wěn)定、可信,測(cè)試水平多效性是必須的[17]。在本研究中使用MR-Egger截距檢驗(yàn)來(lái)測(cè)試水平多效性。當(dāng)MR-Egger截距偏離0時(shí),認(rèn)為此分析存在水平多效性,結(jié)果可信度是可疑的,這也表明SNP只與暴露有關(guān),與其他的混雜因素?zé)o關(guān)[18]。同時(shí)leave-one-out分析被用來(lái)檢測(cè)多效性檢驗(yàn)結(jié)果的一致性[19]。
1.4 乳腺癌關(guān)鍵基因篩選與驗(yàn)證 通過(guò)MR分析,根據(jù)OR值將基因分為高表達(dá)基因(ORgt;1)與低表達(dá)基因(ORlt;1),并利用“VennDiagram”軟件包將高低表達(dá)基因與差異分析上調(diào)和下調(diào)基因取交叉繪制Venn圖。同時(shí),排除具有多效性以及IVW Pgt;0.05的基因。使用“forestplot”包讀取IVW、weighted median兩種分析方法得出的OR值以及OR值的波動(dòng)范圍,以篩選出強(qiáng)相關(guān)性的關(guān)鍵基因。得到關(guān)鍵基因后,利用GSE32641數(shù)據(jù)集進(jìn)行關(guān)鍵基因表達(dá)驗(yàn)證。最后,為了展示出基因在染色體中的具體位置,使用“circlize”軟件包創(chuàng)建基因與染色體的基因組圈圖[20]。
1.5 疾病關(guān)鍵基因富集分析 使用“Cluster Profiler”軟件包(Plt;0.05,F(xiàn)DRlt;0.05)對(duì)其進(jìn)行基因本體(GO)功能富集分析,以研究其在細(xì)胞成分(CC)、分子功能(MF)以及生物過(guò)程(BP)中的作用;KEGG富集分析用于研究差異基因相關(guān)的信號(hào)通路。
1.6 GSEA富集分析 為了研究疾病組中關(guān)鍵基因高表達(dá)組、低表達(dá)組之間富集基因集的差異,使用“clusterProfiler”軟件包以及MSigDB數(shù)據(jù)庫(kù)(https://www.gsea-msigdb.org/gsea/)中的“c2.cp.kegg.Hs.symbols.gmt”文件進(jìn)行GSEA富集分析[21]。
1.7 免疫細(xì)胞以及免疫相關(guān)性分析 為了了解BC中免疫細(xì)胞的浸潤(rùn)情況以及關(guān)鍵基因與免疫細(xì)胞浸潤(rùn)的相關(guān)性?;凇癓M22”文件,使用“CIBERSORT”包分析對(duì)照組與實(shí)驗(yàn)組中免疫細(xì)胞的浸潤(rùn)水平[22](Plt;0.05),并采用箱型圖和柱狀圖觀察免疫細(xì)胞的差異水平。最后,使用“l(fā)inkET”和“ggplot2”包對(duì)疾病組浸潤(rùn)性免疫細(xì)胞類型及其與疾病關(guān)鍵基因之間的關(guān)聯(lián)進(jìn)行可視化分析[11]。
2 結(jié)果
2.1 差異基因分析 將數(shù)據(jù)去除批次效應(yīng)后(圖2A、B)。通過(guò)將BC訓(xùn)練集樣本進(jìn)行基因表達(dá)差異分析,共得到了747個(gè)DEGs,其中包含了上調(diào)基因307個(gè),下調(diào)基因440個(gè),均顯示在火山圖(圖2C)和熱圖中(圖2D)。
2.2 IVs和MR分析 在去除連鎖不平衡后,通過(guò)計(jì)算F值,去除了F值lt;10的SNP,共得到了26 152個(gè)與基因有強(qiáng)相關(guān)性的SNP作為有效的IVs。采用雙樣本孟德?tīng)栯S機(jī)化分析評(píng)估每個(gè)效應(yīng)SNP位點(diǎn)對(duì)BC的影響。對(duì)無(wú)多效性且IVW Plt;0.05的SNP進(jìn)行了敏感性分析,共鑒定出400個(gè)疾病關(guān)聯(lián)性基因。為了進(jìn)一步驗(yàn)證基因的風(fēng)險(xiǎn)程度,將差異上調(diào)基因與MR分析得出的高表達(dá)基因取交集,將差異下調(diào)基因與MR分析得出的低表達(dá)基因取交集,共得到了9個(gè)疾病相關(guān)的共表達(dá)基因并將它們?cè)谌旧w中的位置進(jìn)行標(biāo)注(圖3A-C)。其中,PARP1、MUC1、LILRB2、TNNT1基因與疾病高風(fēng)險(xiǎn)相關(guān),CTNNAL1、 DNASE1L3、HOXA9、PIK3R1、SLPI基因與疾病的低風(fēng)險(xiǎn)相關(guān)(圖4)。隨后,對(duì)篩選出的9個(gè)關(guān)鍵基因與BC的因果關(guān)系進(jìn)行了MR分析,結(jié)果顯示上調(diào)的共表達(dá)基因與BC之間存在顯著的正調(diào)控關(guān)系,其中PARP1(OR=1.031;95% CI:1.006~1.056;P=0.016), MUC1(OR=1.047;95% CI:1.007~1.088;P=0.022),LILRB2(OR=1.047;95% CI: 1.005~1.090;P=0.027),TNNT1(OR=1.034;95% CI: 1.008~1.061;P=0.011);相反,下調(diào)的共表達(dá)基因則表現(xiàn)出與BC之間的負(fù)調(diào)控關(guān)系,主要包括CTNNAL1(OR=0.973;95% CI:0.951~0.994;P=0.014),DNASE1L3(OR=0.952;95% CI: 0.921~0.984;P=0.004),HOXA9(OR=0.964;95% CI:0.930~0.999;P=0.044),PIK3R1(OR=0.904;95% CI:0.836~0.977;P=0.011),SLPI(OR=0.954;95% CI:0.924~0.985;P=0.004)。
2.3 關(guān)鍵基因敏感性分析及驗(yàn)證 為了驗(yàn)證結(jié)果的可靠性,采用MR-Egger回歸和Cochran's Q檢驗(yàn)對(duì)9個(gè)關(guān)鍵基因進(jìn)行敏感性分析(見(jiàn)表2)。敏感性分析顯示,在整個(gè)分析中均沒(méi)有發(fā)現(xiàn)多效性和異質(zhì)性的證據(jù),表明分析結(jié)果是可靠的。同時(shí),漏斗圖分析證明單個(gè)SNP不會(huì)對(duì)結(jié)局產(chǎn)生影響,表明單個(gè)的SNP未違反和偏倚估計(jì)不存在方向多效性,分析未發(fā)現(xiàn)存在水平多效性的證據(jù)。這表明我們的分析方法和結(jié)果都是可信的(圖5)。最后,對(duì)9個(gè)關(guān)鍵基因在GSE32641數(shù)據(jù)集以及TCGA數(shù)據(jù)庫(kù)中乳腺癌的基因表達(dá)數(shù)據(jù)集進(jìn)行外部驗(yàn)證。結(jié)果顯示,關(guān)鍵基因在BC中的表達(dá)具有差異,并與前期研究結(jié)果一致。這些結(jié)果更有力地證明了9個(gè)關(guān)鍵基因在BC中的顯著差異(圖6)。
2.4 疾病關(guān)鍵基因功能及通路富集分析 通過(guò)GO分析研究關(guān)鍵基因在BP、CC和MF方面的富集情況。結(jié)果顯示,在生物過(guò)程中,關(guān)鍵基因主要在內(nèi)在細(xì)胞凋亡途徑以及細(xì)胞器組織負(fù)調(diào)控等富集;在細(xì)胞成分中,未發(fā)現(xiàn)關(guān)鍵基因在分子功能上的富集具有差異性;而在分子功能方面,則是與蛋白磷酸酶結(jié)合最為顯著。此外,KEGG分析顯示,關(guān)鍵基因在B細(xì)胞受體信號(hào)通路、細(xì)胞凋亡、破骨細(xì)胞分化和糖尿病心肌病通路中富集(圖7)。
2.5 關(guān)鍵基因GSEA富集分析 為了探究高表達(dá)和低表達(dá)的關(guān)鍵基因在疾病組中富集基因的差異,對(duì)關(guān)鍵基因進(jìn)行了GSEA富集分析。結(jié)果顯示,關(guān)鍵基因高表達(dá)組中,細(xì)胞因子-細(xì)胞因子受體相互作用通路富集程度最高,其次是嘧啶代謝和蛋白輸出(圖8)。在關(guān)鍵基因低表達(dá)組中,氧化磷酸化是共同富集最為顯著的,其次為細(xì)胞因子相互作用(圖9)??傮w來(lái)說(shuō),無(wú)論在高表達(dá)組還是低表達(dá)組中,細(xì)胞因子受體互相作用和氧化磷酸化通路都被大多數(shù)關(guān)鍵基因富集,這表明關(guān)鍵基因的變化可能對(duì)BC的免疫狀態(tài)以及能量代謝產(chǎn)生關(guān)鍵影響。
2.6 BC中免疫細(xì)胞浸潤(rùn)分析以及關(guān)鍵基因免疫學(xué)特征 為了進(jìn)一步研究正常組與疾病組之間免疫細(xì)胞浸潤(rùn)情況,采用CIBERSORT算法測(cè)定BC與非BC之間免疫細(xì)胞浸潤(rùn)的差異。結(jié)果顯示,兩組之間免疫細(xì)胞浸潤(rùn)情況具有顯著差異(圖10A-B)。其中,在疾病組中靜息的CD4+記憶T細(xì)胞比例相較于正常組顯著減少,而M0巨噬細(xì)胞比例與正常組相比則顯著上升,這表明CD4+ T細(xì)胞與巨噬細(xì)胞可能在BC中發(fā)揮著關(guān)鍵作用。通過(guò)研究關(guān)鍵基因與免疫細(xì)胞浸潤(rùn)之間的相關(guān)性以了解關(guān)鍵基因的免疫學(xué)特征,結(jié)果顯示,疾病關(guān)鍵基因與各免疫細(xì)胞浸潤(rùn)之間存在顯著相關(guān)性(圖10C)。值得注意的是,naive B細(xì)胞與記憶B細(xì)胞之間呈現(xiàn)出顯著的負(fù)相關(guān),而M0巨噬細(xì)胞和調(diào)節(jié)性T細(xì)胞、中性粒細(xì)胞和激活的肥大細(xì)胞之間存在顯著的正相關(guān)。另外,研究發(fā)現(xiàn),靜息肥大細(xì)胞與CTNNAL1、DANSE1L3、HOXL9、PIK3R1之間呈正相關(guān)關(guān)系,與PARP1、SLPI之間呈負(fù)相關(guān)關(guān)系;調(diào)節(jié)T細(xì)胞與CTNNAL1、DANSE1L3、LILRB2、PIK3R1之間存在負(fù)調(diào)控關(guān)系,與MUC1、PARP1之間則是存在正調(diào)控關(guān)系。這些發(fā)現(xiàn)提示,疾病關(guān)鍵基因與BC中免疫細(xì)胞之間的相互作用具有重要聯(lián)系。此外,發(fā)現(xiàn)DANSE1L3與大多數(shù)免疫細(xì)胞之間存在著廣泛的聯(lián)系,說(shuō)明其在BC中具有重要的免疫學(xué)特性。
3 討論
乳腺癌是全球女性腫瘤占比中最高的惡性腫瘤,以年輕女性居多[23]。而乳腺癌的耐藥性強(qiáng),容易復(fù)發(fā)和轉(zhuǎn)移,是導(dǎo)致治療效果不佳的主要原因[24]。雖然目前雌激素受體(ER)、孕酮(PR)、人表皮生長(zhǎng)受體因子2(HER2)以及Ki67能有效地指導(dǎo)臨床上對(duì)BC的治療,但是效果依舊欠佳[25-26]。由于BC的遺傳具有高度的復(fù)雜性,因此,對(duì)其生物標(biāo)志物的開(kāi)發(fā)一直都十分困難[27]。所以,針對(duì)這一難題,我們?cè)O(shè)計(jì)了本研究,以期望對(duì)乳腺癌的早期診斷和臨床診治提出新的見(jiàn)解。
在本研究中利用MR分析方法,系統(tǒng)分析了19 942個(gè)基因的eQTL數(shù)據(jù)與BC之間的因果關(guān)系,共得到了392個(gè)與疾病具有關(guān)聯(lián)的基因,并根據(jù)OR值將其分為高表達(dá)組與低表達(dá)組,隨后采用Veen圖將DEG_up與ORgt;1取交集,共得到4個(gè)高表達(dá)的疾病關(guān)鍵基因,將DEG_down與ORlt;1取交集,共得到5個(gè)低表達(dá)的疾病關(guān)鍵基因。這是我們團(tuán)隊(duì)首次利用基因eQTL數(shù)據(jù)結(jié)合轉(zhuǎn)錄組學(xué)以及MR分析篩選出BC的關(guān)鍵基因,并分析了它們的免疫相關(guān)性。這一發(fā)現(xiàn)為乳腺癌的臨床診治提供了有意義的參考,并可能成為靶向治療BC的潛在靶標(biāo)。
乳腺癌作為一種中度或弱免疫原性、低突變負(fù)荷的腫瘤,對(duì)其免疫治療的研究雖然起步較晚,但是卻十分迅速[28],這足以體現(xiàn)免疫環(huán)境在BC中有很重要的作用。在本研究中,正常組與疾病組之間免疫細(xì)胞浸潤(rùn)的差異主要表現(xiàn)為靜息的CD4+記憶T細(xì)胞在BC中減少,而巨噬細(xì)胞M0在BC中升高。CD4+ T細(xì)胞在控制感染、調(diào)節(jié)組織穩(wěn)態(tài)以及修復(fù)或執(zhí)行免疫調(diào)節(jié)中發(fā)揮重要作用,而記憶CD4+ T細(xì)胞不僅可保護(hù)組織免受再感染,其對(duì)腫瘤的免疫作用也同樣重要[29]。記憶CD4+ T細(xì)胞在BC中減少說(shuō)明了其在BC中發(fā)揮的防護(hù)作用是極其關(guān)鍵的,換句話說(shuō),機(jī)體記憶CD4+ T細(xì)胞的減少,導(dǎo)致機(jī)體對(duì)BC的防御減弱,從而促進(jìn)BC的發(fā)生和發(fā)展。巨噬細(xì)胞是體內(nèi)重要的腫瘤組織特異性免疫細(xì)胞,早期認(rèn)為巨噬細(xì)胞具有抑癌作用[30]。但是后續(xù)研究發(fā)現(xiàn)其在膠質(zhì)瘤、肝細(xì)胞癌中表現(xiàn)出促癌作用[31]。根據(jù)我們的研究結(jié)果,巨噬細(xì)胞M0在BC中顯著上升,表明其在BC中發(fā)揮促進(jìn)作用,但目前尚未有研究揭示這種促進(jìn)作用產(chǎn)生的機(jī)制。
聚腺苷二磷酸核糖聚合酶-1(PARP1)是一種在細(xì)胞的DNA損傷修復(fù)和細(xì)胞存活中具有關(guān)鍵作用的蛋白質(zhì),主要定位于細(xì)胞核。PARP1能夠抑制同源重組缺陷細(xì)胞的死亡,并參與許多的細(xì)胞功能[32]。此外,PARP1具有腫瘤促炎作用,參與上皮細(xì)胞間質(zhì)轉(zhuǎn)化、細(xì)胞壞死、細(xì)胞凋亡等過(guò)程[33]。因此,PARP1作為抗癌治療靶點(diǎn)的熱度持續(xù)上升。許多研究證實(shí)了其在BC中的關(guān)鍵作用。一項(xiàng)研究顯示PARP1可作為上游基因,參與BC的侵襲過(guò)程,PARP1與趨化因子2(CCL2)之間存在明顯的串?dāng)_關(guān)系,CCL2的表達(dá)水平及其細(xì)胞侵襲在BC細(xì)胞中具有重要作用[34]。黏蛋白1(MUC1)是一種異二聚體跨膜蛋白,呈極性分布并提供保護(hù)屏障的功能,目前廣泛認(rèn)為其結(jié)構(gòu)中有潛在的致癌MUC1 C末端[35],因此MUC1在腫瘤中的機(jī)制研究逐漸受到重視。在正常的上皮細(xì)胞中,MUC1以高度糖基化的形式存在;而在惡性腫瘤細(xì)胞中,MUC1則以糖基脫落的形式特異性地過(guò)表達(dá)于多種癌細(xì)胞表面,從而減少細(xì)胞之間和細(xì)胞外基質(zhì)之間的相互作用,促進(jìn)腫瘤轉(zhuǎn)移。研究表明,MUC1在超過(guò)90%的乳腺癌病例中呈現(xiàn)過(guò)表達(dá)[36],這一點(diǎn)與我們的研究結(jié)果一致。有學(xué)者對(duì)MUC1相關(guān)的lncRNA和MicroRNA進(jìn)行系統(tǒng)的研究,發(fā)現(xiàn)circ_0009910/miR-145-5p/MUC1調(diào)節(jié)軸對(duì)BC的發(fā)生發(fā)展起著關(guān)鍵作用,具有成為治療BC有效靶點(diǎn)的潛力[37]。淋巴免疫球蛋白樣受體2(LILRB2)是一種Ⅰ型跨膜糖蛋白,包含細(xì)胞外Ig樣區(qū)、跨膜區(qū)和含有ITIM的細(xì)胞內(nèi)區(qū),被認(rèn)為是一種免疫抑制分子,是癌癥免疫治療潛在的免疫檢查點(diǎn)[38-39]。最新研究表明,LILRB2與BC的免疫逃逸有關(guān),高表達(dá)的LILRB2與BC不良預(yù)后相關(guān),且作為上游基因,通過(guò)下調(diào)HLA-A促進(jìn)BC的免疫逃逸發(fā)揮促癌作用[40]。骨骼慢肌鈣蛋白1(TNNT1)是肌鈣蛋白(TnT)的同源特異性亞型之一,參與維持肌肉收縮和松弛過(guò)程中的鈣調(diào)節(jié)[41]。近期研究發(fā)現(xiàn),TNNT1在幾種腫瘤組織中顯著上調(diào),并與腫瘤的分期密切相關(guān)。特別是在乳腺癌中,TNNT1通過(guò)促進(jìn)G1/S期過(guò)渡,促進(jìn)了BC細(xì)胞的增殖[42]。目前的研究表明,PARP1、MUC1、LILRB2和TNNT1 均是BC的高表達(dá)基因,促進(jìn)了乳腺癌的發(fā)展,這與我們的研究結(jié)果高度一致。因此,針對(duì)這些高表達(dá)基因開(kāi)發(fā)抑制劑,為治療BC提供了堅(jiān)實(shí)的理論依據(jù)。
連環(huán)素(catenin)家族成員CTNNAL1(cation alpha-like1)是一種已知參與細(xì)胞黏附的蛋白,在細(xì)胞黏附和信號(hào)轉(zhuǎn)導(dǎo)中發(fā)揮作用,能夠調(diào)節(jié)細(xì)胞遷移和入侵能力。CTNNAL1在肺癌和膠質(zhì)瘤中高表達(dá),且與不良預(yù)后有關(guān),被認(rèn)為是癌癥驅(qū)動(dòng)因子[43]。在乳腺癌中,CTNNAL1被報(bào)道為抑癌基因,但其具體作用機(jī)制仍需進(jìn)一步研究[44]。DNA酶Ⅰ樣蛋白3(DNASE1L3)是一種Ca2+/Mg2+依賴性的核酸內(nèi)切酶,能夠消化細(xì)胞在惡性轉(zhuǎn)變或死亡時(shí)釋放的DNA,這一過(guò)程與腫瘤的發(fā)生和發(fā)展密切相關(guān)[45]。在腎癌細(xì)胞系中過(guò)表達(dá)DNASE1L3后,抑制了腫瘤細(xì)胞的增殖和侵襲能力。此外,在結(jié)腸癌中,DNASE1L3能增強(qiáng)抗腫瘤免疫并抑制結(jié)腸癌的進(jìn)展[46]。研究還發(fā)現(xiàn),DNASE1L3的缺乏與人類自身免疫性疾病的發(fā)展相關(guān)。DNASE1L3可能與腫瘤微環(huán)境中的免疫浸潤(rùn)相互作用,從而影響腫瘤患者的預(yù)后,并與多種腫瘤浸潤(rùn)免疫細(xì)胞的基因標(biāo)記相關(guān)[47]。DNASE1L3的功能恢復(fù)或其作為免疫治療靶點(diǎn)的調(diào)控,有望提升免疫系統(tǒng)對(duì)腫瘤的識(shí)別和清除,成為乳腺癌治療的新方向[48]。雖然目前研究仍處于初期階段,但其在免疫逃逸和腫瘤免疫微環(huán)境中的重要作用,使其成為未來(lái)乳腺癌免疫治療中值得關(guān)注的靶標(biāo)。同源盒基因A9(HOXA9)是多種生物過(guò)程的調(diào)節(jié)因子,研究揭示HOXA9中發(fā)生了廣泛表觀遺傳學(xué)變異,這賦予了其在腫瘤中重要的生物學(xué)意義[49]。有研究表明,HOXA9在三陰性乳腺癌(TNBC)中出現(xiàn)低表達(dá),增加HOXA9的表達(dá)可以顯著抑制癌細(xì)胞的增殖和遷移,同時(shí)促進(jìn)癌細(xì)胞的凋亡[50]。磷脂酰肌醇-3激酶調(diào)節(jié)亞基1(PIK3R1)是PI3K的主要調(diào)節(jié)亞基,而PI3K與細(xì)胞存活、增殖、遷移密切相關(guān)[51]。低表達(dá)的PIK3R1與BC的不良預(yù)后有關(guān),使用miR-221-3p抑制劑靶向PIK3R1使其表達(dá)上升后,可以減弱細(xì)胞對(duì)阿霉素的耐藥性[52]。分泌性白細(xì)胞蛋白酶抑制因子(SLPI)是一種由黏膜上皮細(xì)胞等分泌的具有抗菌和抗炎功能的非糖基化陽(yáng)離子蛋白[53]。研究發(fā)現(xiàn),SLPI在乳腺癌中下調(diào),并與SLPI共表達(dá)的基因具有重要的關(guān)系。利用生物信息學(xué)方法,系統(tǒng)揭示了SLPI在乳腺癌中的預(yù)后價(jià)值[54]。結(jié)合現(xiàn)有研究,本研究中所獲得的低表達(dá)基因在乳腺癌中具有潛在的應(yīng)用前景。無(wú)論是我們的研究結(jié)果還是已有研究,都表明CTNNAL1、DNASE1L3、HOXA9、PIK3R1和SLPI屬于乳腺癌的低表達(dá)基因。
值得注意的是,不管是高表達(dá)還是低表達(dá)的基因,它們?cè)贐C中的機(jī)制作用都應(yīng)該被重視,對(duì)于高表達(dá)基因設(shè)計(jì)合適的抑制劑降低基因的表達(dá)在目前看來(lái)是最可能對(duì)BC的臨床治療產(chǎn)生積極作用的方式。而低表達(dá)基因找到其激活劑尤為重要,現(xiàn)有研究發(fā)現(xiàn),絕大多數(shù)的低表達(dá)基因的表達(dá)水平降低代表著BC的不良預(yù)后,因此,增加低表達(dá)基因的表達(dá)對(duì)延長(zhǎng)BC患者的生存率也許是有幫助的。無(wú)論如何,本研究所獲得的疾病關(guān)鍵基因均與腫瘤的免疫相關(guān),預(yù)示著它們成為BC免疫治療理想靶點(diǎn)的潛力,正確地開(kāi)發(fā)它們的價(jià)值也許對(duì)未來(lái)BC的診治具有光明的應(yīng)用前景。
然而,本研究存在著一些不可避免的局限性。首先,eQTL基因數(shù)據(jù)集的樣本量欠佳,因?yàn)镮Vs的準(zhǔn)確性高度依賴于GWAS的樣本量。其次,MR分析所使用的GWAS數(shù)據(jù)均來(lái)自歐洲人群,這可能導(dǎo)致結(jié)果在其他人群中的適用是有限的。最后,本研究得出了一個(gè)包含9個(gè)基因的預(yù)測(cè)模型,為了提高預(yù)測(cè)精準(zhǔn)性還應(yīng)對(duì)基因進(jìn)行分析和篩選出最適合的關(guān)鍵基因,并通過(guò)實(shí)驗(yàn)驗(yàn)證。
參 考 文 獻(xiàn)
[1] SIEGEL R L, MILLER K D, FUCHS H E, et al. Cancer statistics, 2022 [J]. CA Cancer J Clin, 2022, 72(1): 7-33.
[2] LI X, JIN Y, XUE J. Unveiling collagen's role in breast cancer:insights into expression patterns,functions and clinical implications[J]. Int J Gen Med,2024,17:1773-1787.
[3] LEE Y, NI J, BERETOV J, et al. Recent advances of small extracellular vesicle biomarkers in breast cancer diagnosis and prognosis[J]. Mol Cancer,2023,22(1):33.
[4] ZHU Z, ZHANG F, HU H, et al. Integration of summary data from GWAS and eQTL studies predicts complex trait gene targets[J]. Nat Genet,2016,48(5):481-487.
[5] RATNAPRIYA R, SOSINA O A, STAROSTIK M R, et al. Author Correction:Retinal transcriptome and eQTL analyses identify genes associated with age-related macular degeneration[J]. Nat Genet,2019,51:1067.
[6] EMDIN C A, KHERA A V, KATHIRESAN S. Mendelian randomization[J]. JAMA,2017,318(19):1925-1926.
[7] LIU L Y, CHANG L Y, KUO W H, et al. Major functional transcriptome of an inferred center regulator of an ER (-) breast cancer model system[J]. Cancer Inform,2012,11:87-111.
[8] HAAKENSEN V D, BIONG M, LINGJRDE O C, et al. Expression levels of uridine 5'-diphospho-glucuronosyltransferase genes in breast tissue from healthy women are associated with mammographic density[J]. Breast Cancer Res,2010,12(4):R65.
[9] CHEN C, GRENNAN K, BADNER J, et al. Removing batch effects in analysis of expression microarray data: an evaluation of six batch adjustment methods[J]. PLoS One,2011,6(2):e17238.
[10] RITCHIE M E, PHIPSON B, WU D, et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies[J]. Nucleic Acids Res,2015,43(7):e47.
[11] ITO K, MURPHY D. Application of ggplot2 to pharmacometric graphics[J]. CPT Pharmacometrics Syst Pharmacol,2013,2:e79.
[12] HEMANI G, ZHENG J, ELSWORTH B, et al. The MR-Base platform supports systematic causal inference across the human phenome[J]. Elife,2018,7:e34408.
[13] BURGESS S, THOMPSON S G. Bias in causal estimates from Mendelian randomization studies with weak instruments[J]. Stat Med,2011,30(11):1312-1323.
[14] OBENCHAIN V, LAWRENCE M, CAREY V, et al. Variant annotation: a bioconductor package for exploration and annotation of genetic variants[J]. Bioinformatics,2014,30(14):2076-2078.
[15] LIN Z, DENG Y, PAN W. Combining the strengths of inverse-variance weighting and Egger regression in Mendelian randomization using a mixture of regressions model[J]. PLoS Genet,2021,17(11):e1009922.
[16] YAVORSKA O O, BURGESS S. Mendelian Randomization:an R package for performing Mendelian randomization analyses using summarized data[J]. Int J Epidemiol,2017,46(6):1734-1739.
[17] VAN KIPPERSLUIS H, RIETVELD C A. Pleiotropy-robust mendelian randomization[J]. Int J Epidemiol,2018,47(4):1279-1288.
[18] BOWDEN J, DEL GRECO M F, MINELLI C, et al. Assessing the suitability of summary data for two-sample Mendelian randomization analyses using MR-Egger regression:the role of the I2 statistic[J]. Int J Epidemiol,2016,45(6):1961-1974.
[19] YIN K J, HUANG J X, WANG P, et al. No genetic causal association between periodontitis and arthritis:a bidirectional two-sample mendelian randomization analysis[J]. Front Immunol,2022,13:808832.
[20] GU Z G, GU L, EILS R, et al. Circlize implements and enhances circular visualization in R[J]. Bioinformatics,2014,30(19):2811-2812.
[21] LIBERZON A, SUBRAMANIAN A, PINCHBACK R, et al. Molecular signatures database (MSigDB) 3.0[J]. Bioinformatics,2011,27(12):1739-1740.
[22] NEWMAN A M, LIU C L, GREEN M R, et al. Robust enumeration of cell subsets from tissue expression profiles[J]. Nat Meth,2015,12:453-457.
[23] LI C J, TZENG Y T, CHIU Y H, et al. Pathogenesis and potential therapeutic targets for triple-negative breast cancer[J]. Cancers:Basel,2021,13(12):2978.
[24] SUPPAN C, BALIC M. Current standards and future outlooks in metastatic Her2-positive breast cancer[J]. Breast Care:Basel,2023,18(1):69-75.
[25] LI C J, CHU P Y, YIANG G T, et al. The molecular mechanism of epithelial-mesenchymal transition for breast carcinogenesis[J]. Biomolecules,2019,9(9):E476.
[26] TZENG Y T, TSUI K H, TSENG L M, et al. Integrated analysis of pivotal biomarker of LSM1,immune cell infiltration and therapeutic drugs in breast cancer[J]. J Cell Mol Med,2022,26(14):4007-4020.
[27] RAKHSHANINEJAD M, FATHIAN M, SHIRKOOHI R, et al. Refining breast cancer biomarker discovery and drug targeting through an advanced data-driven approach[J]. BMC Bioinformatics,2024,25(1):33.
[28] NANDA R, CHOW L Q, DEES E C, et al. Pembrolizumab in patients with advanced triple-negative breast cancer:phase ib KEYNOTE-012 study[J]. J Clin Oncol,2016,34(21):2460-2467.
[29] KüNZLI M, MASOPUST D. CD4+ T cell memory[J]. Nat Immunol,2023,24(6):903-914.
[30] MATSUI T, TANIGUCHI S, ISHII M. Function of alveolar macrophages in lung cancer microenvironment[J]. Inflamm Regen,2024,44(1):23.
[31] DE SIMONE G, ANDREATA F, BLERIOT C, et al. Identification of a Kupffer cell subset capable of reverting the T cell dysfunction induced by hepatocellular priming[J]. Immunity,2021,54(9):2089-2100.e8.
[32] BASTOS I M, REBELO S, SILVA V L M. A review of poly(ADP-ribose)polymerase-1 (PARP1) role and its inhibitors bearing pyrazole or indazole core for cancer therapy[J]. Biochem Pharmacol,2024,221:116045.
[33] DULANEY C, MARCROM S, STANLEY J, et al. Poly(ADP-ribose) polymerase activity and inhibition in cancer[J]. Semin Cell Dev Biol,2017,63:144-153.
[34] DUTTA P, PAICO K, GOMEZ G, et al. Transcriptional regulation of CCL2 by PARP1 is a driver for invasiveness in breast cancer[J]. Cancers:Basel,2020,12(5):E1317.
[35] SINGH R, BANDYOPADHYAY D. MUC1:a target molecule for cancer therapy[J]. Cancer Biol Ther,2007,6(4):481-486.
[36] RAJABI H, HIRAKI M, KUFE D. MUC1-C activates polycomb repressive complexes and downregulates tumor suppressor genes in human cancer cells[J]. Oncogene,2018,37:2079-2088.
[37] ABTIN M, NAFISI N, HOSSEINZADEH A, et al. Inhibition of breast cancer cell growth and migration through siRNA-mediated modulation of circ_0009910/miR-145-5p/MUC1 axis[J]. Non Coding RNA Res,2024,9(2):367-375.
[38] LI D P, HUANG L, KAN R R, et al. LILRB2/PirB mediates macrophage recruitment in fibrogenesis of nonalcoholic steatohepatitis[J]. Nat Commun,2023,14:4436.
[39] WANG Y, JOHNSON K C C, GATTI-MAYS M E, et al. Emerging strategies in targeting tumor-resident myeloid cells for cancer immunotherapy[J]. J Hematol Oncol,2022,15(1):118.
[40] JIANG Z Y, HUANG Q R, CHANG Y J, et al. LILRB2 promotes immune escape in breast cancer cells via enhanced HLA-a degradation[J]. Cell Oncol,2024,47(5):1679-1696.
[41] WEI B, JIN J P. TNNT1 TNNT2 and TNNT3 Isoform genes,regulation,and structure–function relationships[J]. Gene,2016,582(1):1-13.
[42] SHI Y W, ZHAO Y, ZHANG Y J, et al. TNNT1 facilitates proliferation of breast cancer cells by promoting G1/S phase transition[J]. Life Sci,2018,208:161-166.
[43] KAHM Y J, JUNG U, KIM R K. Regulation of cancer stem cells and epithelial-mesenchymal transition by CTNNAL1 in lung cancer and glioblastoma[J]. Biomedicines,2023,11(5):1462.
[44] T?KéS A M, SZáSZ A M, JUHáSZ E, et al. Expression of tight junction molecules in breast carcinomas analysed by array PCR and immunohistochemistry[J]. Pathol Oncol Res,2012,18(3):593-606.
[45] WILBER A, LU M, SCHNEIDER M C. Deoxyribonuclease I-like III is an inducible macrophage barrier to liposomal transfection[J]. Mol Ther,2002,6(1):35-42.
[46] LI W, NAKANO H, FAN W, et al. DNASE1L3 enhances antitumor immunity and suppresses tumor progression in colon cancer[J]. JCI Insight,2023,8(17):e168161.
[47] DENG Z, XIAO M, DU D, et al. DNASE1L3 as a prognostic biomarker associated with immune cell infiltration in cancer[J]. Onco Targets Ther,2021,14:2003-2017.
[48] SHENOY U S, ADIGA D, ALHEDYAN F, et al. HOXA9 transcription factor is a double-edged sword:from development to cancer progression[J]. Cancer Metastasis Rev,2024,43(2):709-728.
[49] WANG S M, PANG J, ZHANG K J, et al. LncRNA MIR503HG inhibits cell proliferation and promotes apoptosis in TNBC cells via the miR-224-5p/HOXA9 axis[J]. Mol Ther Oncolytics,2021,21:62-73.
[50] HIRSCH E, CIRAOLO E, FRANCO I, et al. PI3K in cancer-stroma interactions:bad in seed and ugly in soil[J]. Oncogene,2014,33(24):3083-3090.
[51] HONG X, PAN X. Exosome-derived microRNA-221-3p desensitizes breast cancer cells to adriamycin by regulating PIK3r1-mediated glycose metabolism[J]. Cancer Biother Radiopharm,2024,39(6):463-475.
[52] MAJCHRZAK-GORECKA M, MAJEWSKI P, GRYGIER B, et al. Secretory leukocyte protease inhibitor (SLPI),a multifunctional protein in the host defense response[J]. Cytokine Growth Factor Rev,2016,28:79-93.
[53] ZHONG Q Q, WANG X, LI Y F, et al. Secretory leukocyte protease inhibitor promising protective roles in obesity-associated atherosclerosis[J]. Exp Biol Med:Maywood,2017,242(3):250-257.
[54] XIE W, ZHANG H, QIN S, et al. The expression and clinical significance of secretory leukocyte proteinase inhibitor (SLPI) in mammary carcinoma using bioinformatics analysis[J]. Gene,2019,720:144088.
(收稿日期:2024-09-26 修回日期:2024-12-09)
(編輯:潘明志)