戴永剛,程世亮,王玨,錢景榮,王洪亞
山東省立第三醫(yī)院檢驗(yàn)科,濟(jì)南 250031
葡萄膜炎又稱色素膜炎,是虹膜、睫狀體及脈絡(luò)膜組織炎癥的總稱,可引起嚴(yán)重的并發(fā)癥和后遺癥,是主要的致盲原因之一[1]。按發(fā)病部位可分為前葡萄膜炎、中間葡萄膜炎、后葡萄膜炎,按臨床表現(xiàn)可分為漿液性葡萄膜炎、纖維素性葡萄膜炎、化膿性葡萄膜炎及肉芽腫性葡萄膜炎。葡萄膜炎的病因復(fù)雜,一般分為外因和內(nèi)因兩個(gè)方面。其中,外因包括外傷、理化損傷或鄰近組織疾病蔓延引起;內(nèi)因歸結(jié)于兩大類,一類是各種病原體感染,主要是細(xì)菌或真菌感染,另一類是自身免疫性疾病,并與HLA-B27陽(yáng)性以及中樞骨關(guān)節(jié)病如強(qiáng)直性脊柱炎有關(guān)[2]。外周血白細(xì)胞在細(xì)胞免疫中具有重要作用,并與自身免疫性葡萄膜炎(AU)的發(fā)生密切相關(guān)[3]。因此,本研究選擇HLA-B27 陽(yáng)性的AU 患者作為研究對(duì)象。轉(zhuǎn)錄組學(xué)是從RNA 水平上研究基因的表達(dá),其利用高通量測(cè)序技術(shù)對(duì)組織或細(xì)胞中全部mRNA反轉(zhuǎn)錄后的cDNA 分子進(jìn)行測(cè)序,從而全面快速獲得某一特定樣本特定時(shí)間內(nèi)幾乎所有的mRNA 序列信息。該技術(shù)可解決轉(zhuǎn)錄圖譜的繪制、基因差異表達(dá)模式、可變剪切調(diào)控、代謝途徑、基因家族鑒定及進(jìn)化分析等方面的問(wèn)題。隨著大規(guī)模基因測(cè)序、人工智能、各種云平臺(tái)分析的應(yīng)用,轉(zhuǎn)錄組學(xué)可研究疾病在mRNA 水平上的分子機(jī)制,而轉(zhuǎn)錄組又是連接基因組與蛋白組的紐帶[4-6]。本研究分析了HLA-B27 陽(yáng)性AU 患者外周血轉(zhuǎn)錄組差異表達(dá)基因?,F(xiàn)報(bào)告如下。
1.1 臨床資料 選擇2022 年6 月—2023 年5 月山東省立第三醫(yī)院收治的初診AU 患者4 例,男2 例、女2 例,年齡35~65 歲,體質(zhì)量51~85 kg?;颊呔胁煌潭妊奂t、眼痛、畏光、流淚、視物模糊等臨床表現(xiàn),裂隙燈下可見不同程度瞳孔縮小或后黏連、前房閃輝、角膜后見呈塵狀或羊脂狀沉著物、睫狀體充血、晶狀體表面色素沉著。本研究經(jīng)山東省立第三醫(yī)院倫理委員會(huì)審核通過(guò)(倫理編號(hào):KYLL-20211112),患者均知情同意并簽署書面知情同意書。
1.2 標(biāo)本總RNA 提取與質(zhì)量鑒定 采集外周靜脈血4 mL,取全血200 μL,加入TRIzol 1 mL,反復(fù)吹打混勻,室溫靜置20 min。4 ℃下加入氯仿200~300 μL,振蕩混勻,室溫靜置5 min。4 ℃下15 000 × g 離心10~15 min。取上清液600~700 μL,加入1 倍體積-20 ℃異丙醇,混勻后置于-20 ℃冰箱過(guò)夜。4 ℃下15 000 × g 離心30 min,去上清,加入-20 ℃ 75%乙醇的DEPC 水1 mL 洗滌沉淀,4 ℃下15 000 × g 離心5 min,去上清。RNA 沉淀經(jīng)適當(dāng)干燥,加入DEPC水溶解,經(jīng)紫外可見分光光度計(jì)鑒定,OD260/OD280為1.8~2.0,濃度為200~500 ng/μL。
1.3 文庫(kù)構(gòu)建與測(cè)序 使用帶有Oligo的磁珠富集真核生物mRNA。隨后加入fragmentation buffer 將mRNA 隨機(jī)切斷。用六堿基隨機(jī)引物并以mRNA 為模板合成cDNA 第一鏈,之后加入緩沖液、dNTPs 和DNA polymeraseⅠ合成cDNA第二鏈,然后用AMPure XP beads純化雙鏈cDNA。純化后的雙鏈cDNA 經(jīng)末端修復(fù)、加A 尾并連接測(cè)序接頭,隨后用AMPure XP beads 選擇片段大小,最后經(jīng)PCR 富集得到最終的cDNA 文庫(kù)。文庫(kù)構(gòu)建完成后,檢測(cè)文庫(kù)的有效濃度和插入片段的長(zhǎng)度,以確保文庫(kù)質(zhì)量[7]。不同文庫(kù)按照目標(biāo)測(cè)序數(shù)據(jù)進(jìn)行pooling,上機(jī)測(cè)序。
1.4 轉(zhuǎn)錄組差異表達(dá)基因分析流程
1.4.1 原始測(cè)序數(shù)據(jù) 經(jīng)高通量測(cè)序得到的原始圖像數(shù)據(jù)文件經(jīng)CASAVA 堿基識(shí)別分析轉(zhuǎn)化為原始測(cè)序序列,最終結(jié)果以FASTQ 格式文件存儲(chǔ),包括測(cè)序序列(reads)信息和相對(duì)應(yīng)的測(cè)序質(zhì)量信息。
1.4.2 原始數(shù)據(jù)組成 原始測(cè)序序列包含低質(zhì)量的reads 和帶接頭的reads,為了確保后續(xù)分析質(zhì)量,應(yīng)去除接頭序列,同時(shí)過(guò)濾掉低質(zhì)量(堿基平均質(zhì)量值小于20)的reads和N(無(wú)法確定的堿基)數(shù)量大于5的reads,得到可用于后續(xù)分析的clean reads。
1.4.3 基因水平計(jì)算 基因水平的直接展現(xiàn)是其轉(zhuǎn)錄本的豐度信息,轉(zhuǎn)錄本豐度越高,其基因水平越高。使用featureCounts 軟件得到各基因在每個(gè)樣本中的表達(dá)量(FPKM)。
1.4.4 差異表達(dá)基因篩選 差異表達(dá)基因分析所用的數(shù)據(jù)為基因表達(dá)水平分析中獲得的read count。無(wú)生物學(xué)重復(fù)樣本,采用edgeR 軟件分析;有生物學(xué)重復(fù)樣本,采用DESeq2軟件分析。在RNA-seq中的差異表達(dá)基因解析是對(duì)大量基因進(jìn)行獨(dú)立的統(tǒng)計(jì)假設(shè)測(cè)試,致使造成總體假陽(yáng)性偏高的情況,在差異分析過(guò)程中,應(yīng)對(duì)原本假設(shè)實(shí)驗(yàn)得到的P-value 進(jìn)行更正。即將padj≤0.05、|log2(Fold Change)|≥1 作為篩選差異表達(dá)基因的標(biāo)準(zhǔn)。
1.4.5 差異表達(dá)基因的GO功能富集與KEGG通路富集分析 差異表達(dá)基因的功能富集分析是根據(jù)GO 功能的注釋結(jié)果將全部差異表達(dá)基因與參考物種的基因組進(jìn)行比對(duì),經(jīng)過(guò)Fisher 精確檢驗(yàn),獲得雙方顯著性的差異,進(jìn)而得到全部差異表達(dá)基因富集的功能類別(P-value<0.05)。KEGG 通路富集分析方法是以KEGG 通路為單位,以參考基因組為基礎(chǔ),經(jīng)過(guò)Fisher 精確檢驗(yàn),用P-value 排列通路富集水平的顯著性,取值為0~1,越接近于零,表示富集越顯著,最終確定受顯著影響的代謝和信號(hào)轉(zhuǎn)導(dǎo)途徑。
1.4.6 差異表達(dá)基因的蛋白-蛋白互作網(wǎng)絡(luò)(PPI)分析 采用STRING 蛋白質(zhì)互作數(shù)據(jù)庫(kù)中的相互作用關(guān)系,針對(duì)數(shù)據(jù)庫(kù)中包括的物種,在數(shù)據(jù)庫(kù)中提取出目標(biāo)基因集(如差異表達(dá)基因list)的互作聯(lián)系構(gòu)建網(wǎng)絡(luò);如數(shù)據(jù)庫(kù)中不包括的物種,應(yīng)首先將目標(biāo)基因集序列用blastx(閾值:E-value<1e-10)比對(duì)到STRING 數(shù)據(jù)庫(kù)中包括的參考物種蛋白質(zhì)序列上,同時(shí)利用參考物種的蛋白質(zhì)互作關(guān)系構(gòu)建互作網(wǎng)絡(luò)。
1.5 統(tǒng)計(jì)學(xué)方法 從Illumina或BGI平臺(tái)上生成的數(shù)據(jù)用于生物信息學(xué)分析。由上海中科新生命生物科技有限公司完成統(tǒng)計(jì)分析。
2.1 原始數(shù)據(jù)組成 樣本有效濃度均達(dá)標(biāo),Q20、Q30 符合測(cè)序質(zhì)量要求,GC 含量無(wú)明顯偏倚,表明測(cè)序結(jié)果有效。各樣本數(shù)據(jù)質(zhì)量見表1。
表1 各樣本數(shù)據(jù)質(zhì)量一覽表
2.2 基因水平計(jì)算結(jié)果 不同F(xiàn)PKM 水平下基因的數(shù)量見表2。
表2 不同F(xiàn)PKM 水平下基因的數(shù)量(個(gè))
2.3 差異表達(dá)基因分析結(jié)果
2.3.1 篩選的差異表達(dá)基因結(jié)果 將基因水平分析中得到的read count 作為輸入數(shù)據(jù)。結(jié)果顯示,在32 778個(gè)基因中共篩選出差異表達(dá)基因2 638個(gè),其中表達(dá)上調(diào)基因1 876 個(gè)(前10 位依次為CXCL8、FFAR2、HBB、HBA2、JUN、KCNJ15、ADGRG3、SLC25A37、CXCR2、CXCR1)、表達(dá)下調(diào)基因762 個(gè)(前10 位依次為SLC4A10、CD27、PAQR8、TRBV28、TRDC、TRAC、GZMK、LDLRAP1、IL-32、GSTM1)。
2.3.2 差異表達(dá)基因的聚類分析結(jié)果 依據(jù)樣本中基因表達(dá)情況的相似程度,對(duì)差異表達(dá)基因進(jìn)行聚類分析,結(jié)果顯示組內(nèi)樣本差異表達(dá)基因的高低表達(dá)分布集中,組間樣本則距離較遠(yuǎn),提示差異表達(dá)基因的聚類性較好。
2.3.3 差異表達(dá)基因的GO 富集分析結(jié)果 以校正后P<0.05 為標(biāo)準(zhǔn),篩選出顯著上調(diào)的GO。挑選具有顯著性差異的GO 富集分析中排序前30 位的BP、CC 和MF 條目,包括免疫應(yīng)答、白細(xì)胞激活、細(xì)胞活化、刺激反應(yīng)、細(xì)胞通信、髓系白細(xì)胞活化、信號(hào)轉(zhuǎn)導(dǎo)和細(xì)胞過(guò)程調(diào)節(jié)、細(xì)胞外周環(huán)境、細(xì)胞膜、三級(jí)顆粒、T 細(xì)胞受體復(fù)合物和分泌顆粒。具有顯著性差異的GO富集分析主要與免疫應(yīng)答過(guò)程有關(guān)。
2.3.4 差異表達(dá)基因的KEGG 通路富集分析結(jié)果 差異表達(dá)基因的KEGG 通路富集分析主要集中于破骨細(xì)胞分化信號(hào)通路、NF-κB信號(hào)通路、趨化因子信號(hào)通路、卡波西肉瘤相關(guān)的皰疹病毒感染、細(xì)胞因子與細(xì)胞因子受體的相互作用、弓形蟲病、壞死性凋亡信號(hào)通路、脂質(zhì)和動(dòng)脈粥樣硬化、美洲錐蟲病、TNF 信號(hào)通路、利什曼病、結(jié)核、瘧疾、MAPK 信號(hào)通路、幽門螺桿菌感染中的上皮細(xì)胞信號(hào)通路、IL-17信號(hào)通路、PD-L1 在癌癥中的表達(dá)和PD-1 檢查點(diǎn)通路、神經(jīng)營(yíng)養(yǎng)因子信號(hào)通路和癌癥途徑。
2.3.5 差異表達(dá)基因的PPI 分析結(jié)果 利用STRING 數(shù)據(jù)庫(kù)對(duì)30 個(gè)差異表達(dá)基因構(gòu)建PPI,以E-value<1e-10為閾值。PPI分析發(fā)現(xiàn),POLR2A、RBPJ、SUPT5H、ATP6VOD1、JUND、FOS、JUN、PCNA 和CAD 等基因處于PPI 的核心位置,對(duì)AU 的發(fā)生、發(fā)展可能具有重要的調(diào)控作用。
本研究通過(guò)轉(zhuǎn)錄組學(xué)GO 富集分析,篩選出具有顯著性差異的生物學(xué)過(guò)程,包括子網(wǎng)絡(luò)與免疫系統(tǒng)反應(yīng)、免疫響應(yīng)、白細(xì)胞激活、細(xì)胞活化、刺激反應(yīng)、細(xì)胞通信、髓系白細(xì)胞活化、信號(hào)轉(zhuǎn)導(dǎo)和細(xì)胞過(guò)程調(diào)節(jié)等。這些生物學(xué)過(guò)程幾乎都與免疫系統(tǒng)有關(guān),為下一步AU的研究提供了方向。
本研究通過(guò)轉(zhuǎn)錄組學(xué)KEGG 通路富集分析發(fā)現(xiàn),差異表達(dá)基因的KEGG 通路富集主要集中于破骨細(xì)胞分化信號(hào)通路、NF-κB信號(hào)通路、趨化因子信號(hào)通路、細(xì)胞因子與細(xì)胞因子受體的相互作用、壞死性凋亡信號(hào)通路、脂質(zhì)和動(dòng)脈粥樣硬化、TNF信號(hào)通路、MAPK 信號(hào)通路、IL-17 信號(hào)通路、PD-L1 在癌癥中的表達(dá)和PD-1檢查點(diǎn)通路等。
NF-κB 是一種蛋白質(zhì)復(fù)合物,NF-κB 的不當(dāng)調(diào)節(jié)與癌癥、炎癥和自身免疫性疾病、感染性休克、病毒感染等有關(guān)。NF-κB還可介導(dǎo)正常的免疫應(yīng)答過(guò)程。機(jī)體受到感染引起炎癥反應(yīng)時(shí),需要開啟NF-κB 信號(hào)通路,轉(zhuǎn)錄部分細(xì)胞因子來(lái)介導(dǎo)免疫應(yīng)答,從而清除入侵的病原菌[8-9]。
TNF 家族、IL-17、IFN 家族以及血管內(nèi)皮生長(zhǎng)因子等炎癥細(xì)胞因子是引起AU 進(jìn)而導(dǎo)致黃斑水腫的重要原因。TNF 作為關(guān)鍵的促炎癥因子,可誘導(dǎo)炎癥細(xì)胞活化,上調(diào)趨化因子及血管黏附因子表達(dá),促進(jìn)白細(xì)胞遷移與細(xì)胞凋亡、淋巴細(xì)胞浸潤(rùn),阻斷視網(wǎng)膜血管內(nèi)皮細(xì)胞之間的緊密連接,增加血管通透性,從而導(dǎo)致血-房水屏障及血-視網(wǎng)膜屏障被破壞,繼而形成黃斑水腫。這可能是AU 的發(fā)病機(jī)制之一[10-12]。
根據(jù)篩選出的差異表達(dá)基因發(fā)現(xiàn),表達(dá)上調(diào)前10 位的基因有趨化因子家族及其受體CXCL8、CXCR2、CXCR1 以及與趨化因子有重要關(guān)聯(lián)的G 蛋白偶聯(lián)受體(ADGRG3),提示AU同趨化因子家族的關(guān)系密切;而表達(dá)下調(diào)前10 位的基因多集中在T 淋巴細(xì)胞受體(TRBV28、TRDC、TRAC)、溶酶體(SLC4A10、GZMK)、脂代謝相關(guān)基因(PAQR8、LDLRAP1、GSTM1),這可能體現(xiàn)了機(jī)體對(duì)免疫反應(yīng)的負(fù)性調(diào)控以及骨質(zhì)破壞與修復(fù)等過(guò)程。而促炎癥因子IL-32表達(dá)下調(diào),則體現(xiàn)了免疫調(diào)控的復(fù)雜性。
通過(guò)轉(zhuǎn)錄組KEGG 通路富集分析,篩選出了卡波西肉瘤相關(guān)的皰疹病毒感染、弓形蟲病、美洲錐蟲病、利什曼病、結(jié)核、瘧疾、幽門螺桿菌感染中的上皮細(xì)胞信號(hào)通路、神經(jīng)營(yíng)養(yǎng)因子信號(hào)通路和癌癥途徑等信號(hào)通路。這些信號(hào)通路涵蓋了細(xì)菌、真菌、病毒等微生物,說(shuō)明感染要素豐富且復(fù)雜,需要進(jìn)一步研究。富集出的這些信號(hào)通路不一定是相應(yīng)病原體的感染途徑,而是感染后機(jī)體免疫反應(yīng)的共同途徑。因此推測(cè),病原體感染在AU 的發(fā)生、發(fā)展中具有重要作用,提示在日常的臨床診療中要重視患者的感染史。
通過(guò)PPI 分析篩選出10 個(gè)關(guān)鍵節(jié)點(diǎn)基因,結(jié)果發(fā)現(xiàn)細(xì)胞凋亡相關(guān)基因是重要的PPI 節(jié)點(diǎn)基因,包括溶酶體激活(ATP6V0D1)、異常增殖相關(guān)基因(RBPJ、PCNA、FOS 家族、POLR2A)。說(shuō)明在AU 的疾病過(guò)程中伴隨著細(xì)胞凋亡與異常增殖,甚至與血液腫瘤有一定的相關(guān)性[13-14]。另外,通過(guò)轉(zhuǎn)錄組KEGG 通路富集分析篩選出了PD-L1和PD-1檢查點(diǎn)通路,這也符合抗PD-L1 和PD-1 單抗能夠?qū)е滤幬镌葱云咸涯ぱ走@一臨床實(shí)踐[15-16]。