張立俊,于帆,陳科諺,湯希,國世星,袁新華,何海洪
南方醫(yī)科大學深圳醫(yī)院檢驗科,廣東 深圳 518110
2019 年12 月,武漢出現(xiàn)不明原因的肺炎患者,我國科學家通過對肺炎患者的樣本進行測序發(fā)現(xiàn)一種新型冠狀病毒。2020 年2 月11 日,世界衛(wèi)生組織(WHO)將該病毒命名為嚴重急性呼吸系統(tǒng)綜合征冠狀病毒2(SARS-CoV-2),并將此類病毒統(tǒng)稱為2019冠狀病毒(COVID-19)[1]。目前的疾病傳播學表明,該病毒的臨床癥狀或許不如SARS-CoV 以及MERS-CoV表現(xiàn)得嚴重,但其在病例數(shù)量上升速度以及傳播方式則更為嚴峻。例如,因家庭性聚集而導致的日益增加感染病例就表明了該病毒相比SARS-CoV 以及MERS-CoV更具有感染性與傳播性[2-3]。
盡管SARS-CoV-2 的病原體機制尚未查明,人們目前主要認為,與SARS 的致病原理相似,ACE2 可作為刺突糖蛋白[spike(s) glycoprotein]的受體從而允許病毒與細胞薄膜相結合[4-5]。因此,人體中表達ACE2蛋白質的細胞則更有容易被感染上SARS-CoV-2。多位學者所開展的研究表明,對于SARS患者而言,血糖水平與糖尿病分別是發(fā)病率與死亡率的預測因素[6]。根據(jù)初步報告,在感染SARS-CoV-2 的41 例患者中,有8 例患者患有糖尿病,占感染人數(shù)的20%。而鐘南山醫(yī)學小組所得的數(shù)據(jù)則表明,在173 例重癥患者之中,28 例患有糖尿病,占總人數(shù)的16.2%[7-8]。以上研究都表明,糖尿病患者更容易感染SARS-CoV-2。而在那些COVID-19 的死亡病例中,糖尿病為其第三大常見病癥[9]。
現(xiàn)有研究表明,ACE2 在胰腺內(nèi)分泌腺體內(nèi)表達較少,而其在胰腺外分泌腺體內(nèi)則表達較多。此外,強陽性細胞也相對集中[10]。人們目前也需要對特定細胞進行更深一步的了解。而單細胞RNA 測序(scRNA-Seq)技術的快速發(fā)展則為人們揭示人體單獨組織中的每一細胞類型的ACE2 表達水平提供了可能,并提供了有關單細胞分辨的大量信息。目前,人們尚未針對胰腺外分泌腺細胞中的ACE2表達開展系統(tǒng)性的研究。
為此,本研究首先對成年人胰腺中的單細胞分辨層面的ACE2的RNA表達信息進行了研究。此外,其還利用了基因組富集分析(GESA)方法對與表達ACE2 的陽性細胞中病毒轉錄相關的基因組表達進行了分析,并對ACE2 陽性標記基因進行了基因概念網(wǎng)絡分析。
1.1 倫理 本研究的數(shù)據(jù)主要來源于公開數(shù)據(jù)庫,故予以豁免患者知情同意。
1.2 基因數(shù)據(jù)庫 該研究使用了單細胞表達信息數(shù)據(jù)庫(https://www.ebi.ac.uk/gxa/sc/home)中的人體胰腺組織的單細胞測序數(shù)據(jù)來開展表達ACE2的陽性細胞的聚類分析[11]。根據(jù)初步篩選結果,對GEO數(shù)據(jù)庫中的人體胰腺導管細胞的scRNA-seq數(shù)據(jù)組進行了系統(tǒng)性分析,且其基因庫序列號為GSE131886。
1.3 Scanpy 軟件分析 使用Scanpy 軟件(版本1.4.6)分析整個scRNA-seq 的下游數(shù)據(jù),其中Filter-Cells 和FilterGene 函數(shù)用于讀取過濾和作圖,而Kallisto 函數(shù)用于基因/轉錄本定量。采用t-分布隨機鄰居嵌入(t-SNE)算法降低歸一化后的標準化數(shù)據(jù)的維數(shù),進行小區(qū)聚類,將“困惑度”值設置為20,Kinds(k)=7。細胞中的基因表達水平以每百萬計(CPM)的形式所表示,并利用CellMarker (http://biocc.hrbmu.edu.cn/CellMarker)數(shù)據(jù)庫中的數(shù)據(jù)進行了比較,以識別出胰腺聚類細胞。
1.4 CellRanger 軟件分析 使用CellRanger(1.1.0版)將從每個樣本生成的原始基因表達矩陣導入R(4.0.0 版),并使用Seurat R 軟件包(3.1.5 版)進行進一步的數(shù)據(jù)分析。在數(shù)據(jù)集中測量的基因少于200個的細胞、少于3 個細胞的基因和線粒體基因表達率大于5%的細胞被過濾。FindVariableFeatures 函數(shù)可識別在細胞之間具有高度可變表達水平的基因。主成分分析(PCA)使用Seurat RunPCA 功能進行。統(tǒng)一流形逼近和投影(Uniform manifold approximation and projection)非線性降維技術用于可視化和探索細胞聚類。然后,使用FindMarker函數(shù)識別用于細胞聚類的標記基因,并基于這些標記基因使用Panglao DB數(shù)據(jù)庫(https://panglaodb.se/)進行細胞注釋。
1.5 群集細胞進行基因本體(GO)功能分析 Org.Hs.eg.db(3.11.4 版)程序包和topGO(2.40.0 版)程序包(3.11.4 版)用于對群集細胞進行基因本體(GO)功能分析。分子特征數(shù)據(jù)庫(MSigDB)上的基因集富集分析(GSEA)通過presto 軟件包(版本1.0.0)和fgsea 軟件包(版本1.14.0)執(zhí)行了GO 功能富集的C5 GO 基因集(版本7.0)。
1.6 基因概念網(wǎng)絡可視化 基于ACE2陽性細胞標記基因與疾病和基因注釋數(shù)據(jù)庫(DGA)數(shù)據(jù)資源相結合,對基因與疾病之間的基因概念網(wǎng)絡進行了可視化。用來進行可視化的R 軟件安裝包包括:Pathview軟件包(1.28.0版本),Enrichplot軟件包(1.8.1版本)以及DOSE軟件包(3.14.0版本)。
2.1 ACE2 在胰腺細胞中的表達 為了闡明ACE2 在胰腺細胞中的表達,本次實驗分析了來自單細胞表達圖譜數(shù)據(jù)庫的數(shù)據(jù)。細胞聚集后,胰腺細胞主要聚集成7種類型的細胞(圖1A)。進一步的數(shù)據(jù)分析表明,ACE2 陽性細胞主要集中在簇2 細胞中(圖1B)。通過注釋簇2細胞的細胞亞型,發(fā)現(xiàn)它們主要由胰腺腺泡細胞和胰腺導管細胞組成(圖1C)。比較腺泡細胞和導管細胞中ACE2陽性表達的CPM值,發(fā)現(xiàn)胰腺導管細胞的CPM 值高于腺泡細胞的CPM 值,差異具有統(tǒng)計學意義(P=0.006 1),見圖1D。
圖1 胰腺與聚類2細胞中的ACE2陽性表達的單細胞測序細胞聚類分析
2.2 ACE2陽性細胞在腺泡細胞和導管內(nèi)皮細胞中富集 采用UMAP方法對570個細胞進行細胞聚類分析。散點圖顯示總共形成了8 個簇(圖2A)。小提琴圖的結果表明,表達ACE2 的陽性細胞主要富集在簇2和簇6中(圖2B)。群集2包含100個單元(圖2C),群集6包含36個單元(圖2D)。ACE2陽性細胞約占聚類2 細胞的1%,約占聚類6 細胞的2.8%(圖2E)。對每個細胞簇的標記基因進行計數(shù)以注釋簇(圖2F),最后將簇2 確定為腺泡細胞,而簇6 確定為內(nèi)皮細胞(圖2G、2H)。
圖2 胰腺細胞的單細胞測序分析
2.3 ACE2陽性細胞的功能富集分析 對腺泡細胞和內(nèi)皮細胞標記基因進行功能富集分析的結果表明,兩種類型細胞中最富集的前5 個GO 項為SRP 依賴的共翻譯蛋白,靶向膜易位,核轉錄mRNA 分解代謝過程無義介導的衰變、翻譯起始、病毒轉錄和細胞質翻譯。
2.4 基因集富集分析(GSEA) 基于功能富集分析的結果,繼續(xù)分析腺泡細胞和內(nèi)皮細胞在病毒轉錄中的潛在功能,并應用GSEA分析ACE2陽性細胞富集的途徑。結果表明,ACE2 陽性腺泡細胞中最豐富的4個基因組是靶向膜的共翻譯蛋白、胞漿核糖體、內(nèi)質網(wǎng)蛋白質定位的建立和核糖體的結構成分(圖3A)。在對表達ACE2的陽性細胞進行GSEA分析后,前4個基因組中的3個與腺泡細胞相同,第四個基因組是內(nèi)質網(wǎng)的蛋白質定位,內(nèi)質網(wǎng)不是核糖體的結構成分(圖3B)。
圖3 使用了GSEA方法對ACE2陽性細胞的基因組進行了可視化處理
2.5 標記基因與疾病的基因概念網(wǎng)絡分析 通過分析表達ACE2 的陽性細胞的標記基因,研究人員發(fā)現(xiàn),這些基因與多種胰腺炎有關。這其中,包括慢性胰腺炎、胰腺炎、急性胰腺炎和其他疾病(圖4A)。而Circos圖顯示了不同類型胰腺炎與基因之間的基因概念網(wǎng)絡關系(圖4B)。這其中,BNIP3、PNLIP、PRSS2、PRSS3、CLU、MUC1、ALB 與多種胰腺炎病發(fā)的聯(lián)系最為密切。對ACE2陽性內(nèi)皮細胞標記基因的分析表明,這些基因與膽管癌、癌前病變、胰腺腺癌等腫瘤疾病密切相關(圖4C)。Circos圖顯示了基因與疾病之間的基因概念網(wǎng)絡關系(圖4D)。其中,AGR2、ISG20、HMGA1、CIB1、MMP1、S1OOP 與腫瘤的發(fā)生關系最為密切。
圖4 ACE2陽性細胞的基因-概念網(wǎng)絡分析
隨著疫情的進一步蔓延,世界衛(wèi)生組織也在2020年3 月11 日對COVID-19 進行了斷定,預測其為一種流行病[12]。自2020年5月以來,美國、歐洲國家、韓國、伊朗、日本和其他國家的COVID-19 患者人數(shù)急劇上升,這表明該病毒具有潛在的風險,可能會影響周圍人群的健康和生活。目前,COVID-19 的致病機制尚不清楚。有限的研究表明,它具有與SARS 相同的受體ACE2,而ACE2確實是SARS-CoV-2感染細胞所必需的分子[13]。
動物模型表明,ACE2mRNA 在患有糖尿病的實驗鼠的胰腺上高度表達,并證實了ACE2 參與糖代謝的調節(jié)[14-15]。胰腺分為兩部分,即外分泌腺與內(nèi)分泌腺。其中,外分泌腺主要是由腺泡與腺管組成的,而內(nèi)分泌腺則主要是由胰島組成。而胰島則主要是由4種細胞組成:A細胞、B細胞、D細胞以及PP細胞[16]。目前胰腺組織細胞的異質性相對具有典型性,而ACE2在人類不同胰腺細胞中的表達在相關研究中鮮有報道[17]。對2 209 個胰腺細胞的單細胞測序數(shù)據(jù)進行了分析。經(jīng)tSNE 聚類分析,主要分為7 個細胞簇,其中ACE2則主要分布于簇2 中,而簇2 中的細胞主要由胰腺外分泌腺的腺泡細胞和導管細胞組成。2003 年爆發(fā)嚴重呼吸綜合征(SARS)時,病理解剖顯示SARS 冠狀病毒存在于患者尸體的胰腺腺泡細胞中[18]。此外,其還在動物實驗中發(fā)現(xiàn),ACE2 在胰腺外分泌腺中高度表達[19-20]。進一步研究胰腺導管細胞的scRNA-seq 數(shù)據(jù)表明,ACE2 再次在胰腺腺泡細胞和內(nèi)皮細胞中陽性表達,其陽性表達率分別為1%和2.8%。這些數(shù)據(jù)結果增加了人類胰腺外分泌腺也是SARS-CoV-2感染的潛在途徑的可能性。
GO分析基于胰腺腺泡細胞和導管內(nèi)皮細胞的標記基因,主要富集SRP 依賴性共翻譯蛋白,靶向膜易位、核轉錄mRNA分解代謝過程、無義介導的衰變、翻譯起始、病毒轉錄、細胞質翻譯。通過分析ACE2在病毒轉錄過程中在胰腺導管細胞中的表達模式,與ACE2陰性細胞相比,ACE2陽性腺泡細胞和導管內(nèi)皮細胞的基因組主要富集于靶向于膜的共翻譯蛋白、胞漿核糖體和內(nèi)質網(wǎng)蛋白質定位的建立。這些結果表明胰腺外分泌腺易受SARS-CoV-2 感染,感染細胞在病毒轉錄中起重要作用。
通過基因-概念網(wǎng)絡分析,對標記基因與疾病病發(fā)率之間的相關性進行了預測,并發(fā)現(xiàn)BNIP3、PNLIP、PRSS2、PRSS3、CLU、MUC1、ALB基因與多種胰腺炎的病發(fā)率密切相關。而AGR2、ISG20、HMGA1、CIB1、MMP1、S1OOP基因則與腫瘤發(fā)生息息相關。這些數(shù)據(jù)表明,感染SARS-CoV-2 的胰腺外分泌腺細胞可能導致各種類型胰腺炎的發(fā)生和進展,并且可能存在腫瘤的長期潛在風險。
由多位學者所開展的研究表明,在感染SARS 冠狀病毒的患者中,ACE2 在胰腺外分泌腺和胰島細胞中均有表達[21]。因此,猜測其原因可能是不同的組織和細胞來源可能導致結果的差異或ACE2 表達的變化[22-23]。根據(jù)最新文獻,在缺氧的條件下,胰島細胞中ACE2 的表達將上調[24-26]。而COVID-19 所引起的呼吸衰竭也很有可能會導致缺氧,這意味著健康人中ACE2陰性表達的胰島細胞可能在SARS-CoV感染后引起胰島細胞中ACE2 陽性表達,但尚需進一步研究來驗證這一推測。
總之,本研究通過對單細胞測序數(shù)據(jù)的數(shù)據(jù)分析提供了生物信息學證據(jù),證明胰腺外分泌腺可能易受SARS-CoV-2 感染。該研究表明,那些感染COVID-2019的患者應跟蹤并評估其胰腺外分泌腺功能,患者應定期監(jiān)測康復后腫瘤發(fā)展的風險。
本文作者承諾本文不涉及任何利益沖突。
本研究所涉及的所有數(shù)據(jù)均可從EMBL-EBI(https://www.ebi.ac.uk/gxa/sc/home)及高通量基因表達數(shù)據(jù)庫處獲取(序列號:GSE131886)。