王念,王博,冷媛媛,祁軼斐,李兵,張瑩瑩,雷蕾,王忠,劉駿
1.中國中醫(yī)科學院中醫(yī)臨床基礎醫(yī)學研究所,北京 100700;2.中國中醫(yī)科學院中藥研究所,北京 100700;3.北京中醫(yī)藥大學東直門醫(yī)院,北京 100700;4.中國中醫(yī)科學院中醫(yī)藥信息研究所,北京 100700
冠心病是影響全球人口的主要心血管疾病之一[1],屬中醫(yī)學“胸痹”范疇,依據(jù)勞倦、寒邪、情志、飲食等致病因素,可以辨為寒凝、痰濁、陰虛、陽虛、血瘀等不同證候[2]?,F(xiàn)代研究表明,血瘀證患者冠脈病變及血管內(nèi)皮損傷程度較其他證型重,不僅因為該病的發(fā)病關(guān)鍵在于心血瘀阻,也因為其他證型的冠心病在病情進展的過程中同樣會出現(xiàn)血瘀的病理特征,即血液凝滯等現(xiàn)象[2]。競爭性內(nèi)源RNA(competing endogenous RNA,ceRNA)包括信使RNA(mRNA)、長鏈非編碼RNA(lncRNA)、環(huán)狀RNA(cirRNA)、假基因等[3],能夠通過應答元件(MREs)相互作用,構(gòu)成ceRNA調(diào)控網(wǎng)絡,如微小RNA(miRNA)能夠結(jié)合mRNA導致基因沉默,ceRNA可以通過MREs與miRNA競爭性結(jié)合而解除其對基因的抑制作用,ceRNA調(diào)控機制存在于冠心病發(fā)生發(fā)展過程中。
中醫(yī)證候生物學機制是目前研究的熱點,但基于ceRNA調(diào)控網(wǎng)絡的研究仍然缺乏,網(wǎng)絡科學的進步促進了生物網(wǎng)絡中發(fā)現(xiàn)重要生物標志物及治療靶標的過程,能夠幫助分析復雜的疾病過程,以功能模塊的信息流變化體現(xiàn)生物反應,更加全面理解多種生物分子之間的相互作用[4]。模塊藥理學是在系統(tǒng)生物學指導下,對復雜生物網(wǎng)絡進行模塊化分析,能夠度量和整合模塊對網(wǎng)絡干預的特征[5]。從模塊藥理學角度分析ceRNA網(wǎng)絡是研究證候生物學機制的新思路,從而揭示血瘀證的復雜性和系統(tǒng)性。本研究通過構(gòu)建lncRNA相關(guān)ceRNA網(wǎng)絡,即lncRNA-miRNA-mRNA網(wǎng)絡,利用公共數(shù)據(jù)庫發(fā)表的冠心病血瘀證相關(guān)基因,以模塊藥理學方法尋找網(wǎng)絡中的關(guān)鍵節(jié)點,通過文獻預測關(guān)鍵節(jié)點之間的調(diào)控關(guān)系,形成調(diào)控軸,并進行序列驗證,從轉(zhuǎn)錄組學水平揭示冠心病血瘀證的潛在機制。
1.1.1 冠心病相關(guān)基因
以“coronary artery disease”為關(guān)鍵詞,分別通過HMDD3.2(http://www.cuilab.cn/hmdd/)[6-8]查找冠心病相關(guān)miRNA,通過DisGeNET7.0[9](https://www.disgenet.org/)、OMIM(http://www.omim.org/)、GeneCards 5.1(https://www.genecards.org/)、TTD[10](http://db.idrblab.net/ttd/)數(shù)據(jù)庫查找冠心病相關(guān)mRNA,通過lncRNADisease2.0(http://www.rnanut.net/lncrnadisease/index.php/)數(shù)據(jù)庫查找冠心病相關(guān)lncRNA。
1.1.2 血瘀證相關(guān)基因
以中國中西醫(yī)結(jié)合學會活血化瘀專業(yè)委員會制定的《冠心病血瘀證診斷標準》[11]的主要指標及次要指標為依據(jù),選擇血瘀證檢索詞。以“chest pain”(胸痛)、“oppression in chest”(胸悶)、“ecchymosis on tongue”(舌生瘀斑)、“palpitation”(心悸)為關(guān)鍵詞[12],通過OMIM數(shù)據(jù)庫檢索血瘀證癥狀表型的相關(guān)mRNA。
比較上述方法獲取的冠心病相關(guān)mRNA與血瘀證相關(guān)mRNA,以二者相同基因作為冠心病血瘀證基因。
利用starBase3.0[13](http://starbase.sysu.edu.cn/)平臺的miRNA-target interactions模塊、miRNAlncRNA interactions模塊、lncRNA-ceRNA interactions模塊預測lncRNA-miRNA-mRNA之間的靶標關(guān)系,建立相互作用網(wǎng)絡。
使用Cytoscape3.7.0軟件clusterMaker插件中的3種算法MCODE(molecular complex detection)、馬爾可夫聚類(Markov cluster,MCL)及GLay算法(均以默認參數(shù))對上述整合的冠心病血瘀證ceRNA網(wǎng)絡進行功能模塊識別。為得到相對穩(wěn)定可靠的結(jié)果,采用課題組前期提出的最小網(wǎng)絡結(jié)構(gòu)熵的方法[14]對以上3種模塊劃分方式進行比較,從而確定本研究所使用的模塊識別方法。計算公式:。式中,N為網(wǎng)絡中節(jié)點數(shù)目,Ii為第i個節(jié)點的重要度(節(jié)點的重要度定義為每個節(jié)點連接度占所有節(jié)點連接度總和的比例)[14]。
利用WebGestalt[15](http://www.webgestalt.org/)分析平臺對冠心病血瘀證ceRNA網(wǎng)絡中的mRNA進行GO及KEGG通路富集分析。
ceRNA調(diào)控軸預測條件:①miRNA、mRNA、lncRNA存在于同一模塊中;②檢索中文數(shù)據(jù)庫中國知識資源總庫(CNKI)、中文科技期刊數(shù)據(jù)庫(維普網(wǎng))、萬方數(shù)據(jù)知識服務平臺,以及英文數(shù)據(jù)庫PubMed、Web of Science,檢索時間范圍為建庫至2021年4月,中文檢索詞為miRNA、mRNA、lncRNA的基因symbol(如“UCA1”)與“冠心病”,英文檢索詞為基因symbol與“Coronary Artery Disease”“Coronary Heart Disease”。③篩選條件為單個節(jié)點冠心病生理病理相關(guān)文獻數(shù)量≥5篇,報道lncRNA-miRNAmRNA三者之間關(guān)系(檢索詞為lncRNA and miRNA and mRNA,如“UCA1 and miR-1 and G6PD”)的文獻數(shù)量≥5篇;如果沒有直接闡述三者之間調(diào)控關(guān)系的文章,則選擇分別報道lncRNA-miRNA、miRNAmRNA調(diào)控關(guān)系的文獻(檢索詞為lncRNA and miRNA,miRNA and mRNA,如“UCA1 and miR-1”“miR-1 and G6PD”),納入文獻數(shù)量≥5篇的靶標關(guān)系對。④閱讀文獻全文,篩選符合標準的節(jié)點及調(diào)控關(guān)系,納入進行組學檢測并驗證的臨床研究性文獻,記錄文獻中驗證的靶標關(guān)系。
MRE是ceRNA網(wǎng)絡發(fā)生相互作用的關(guān)鍵因素,是構(gòu)成調(diào)控作用的基礎[16]。starBase平臺中的miRNATarget版塊及l(fā)ncRNA-ceRNA版塊能夠分別基于CLIPsep對miRNA-mRNA、miRNA-lncRNA互作關(guān)系進行挖掘,并提供PITA、RNA22、miRmap、DIANAmicroT、miRanda、PicTar和TargetScan等數(shù)據(jù)庫中的MRE序列比對。在miRNA-Target版塊輸入miRNA與mRNA的名稱,以默認參數(shù)檢索兩者相互作用的MRE,在lncRNA-ceRNA版 塊 中 輸 入miRNA與lncRNA的名稱,以默認參數(shù)檢索相互作用的MRE,驗證miRNA-lncRNA與miRNA-mRNA兩者的MRE是否相同,從而確定調(diào)控軸能否存在。
以“coronary artery disease”為關(guān)鍵詞在HMDD數(shù)據(jù)庫檢索得到73個冠心病相關(guān)miRNA;在DisGeNET、GeneCards、OMIM、TTD數(shù)據(jù)庫分別檢索得到1 709、6 998、1 038、21個mRNA,去除重復后共得到8 158個mRNA;在lncRNADisease數(shù)據(jù)庫檢索得到冠心病相關(guān)lncRNA 130個。通過OMIM數(shù)據(jù)庫分別檢索得到16(chest pain)、2 713(oppression in chest)、521(ecchymosis on tongue)、2 343(palpitation)個血瘀證相關(guān)mRNA,去除重復后共得到5 197個mRNA。
冠心病相關(guān)基因及血瘀證相關(guān)基因共有1 211個相同的mRNA,作為冠心病血瘀證相關(guān)基因。
通過starBase篩選由HMDD數(shù)據(jù)庫預測出的73個miRNA相關(guān)的mRNA及l(fā)ncRNA,即冠心病相關(guān)基因之間所有的靶標關(guān)系對(miRNA-lncRNA,miRNAmRNA,lncRNA-mRNA)。HMDD數(shù) 據(jù) 庫 未 對miRNA的“-3p”“-5p”端臂加以區(qū)分,starBase數(shù)據(jù)庫對此加以區(qū)分,最終73個miRNA(不區(qū)分“-3p”“-5p”端臂)在starBase數(shù)據(jù)庫中共有72個miRNA(區(qū)分“-3p”“-5p”端臂)實現(xiàn)預測。此外,在ceRNA網(wǎng)絡構(gòu)建過程中,補充了lncRNA-mRNA之間的靶標關(guān)系,使網(wǎng)絡更加全面、穩(wěn)定。
由72個miRNA預測共得到miRNA-mRNA靶標關(guān)系271 817對,miRNA-lncRNA靶標關(guān)系82 616對,lncRNA-mRNA靶標關(guān)系58 761對。篩選同時存在于冠心病血瘀證中的mRNA及miRNA-mRNA、lncRNAmRNA靶標關(guān)系中的mRNA,交集結(jié)果見圖1。共有182個mRNA同時存在于以上三者之中,以此作為構(gòu)建冠心病血瘀證ceRNA網(wǎng)絡的mRNA,并在預測的靶標關(guān)系對中篩選與之有靶標關(guān)系的lncRNA、miRNA,得到72個miRNA、29個lncRNA。以上述步驟篩選出的182個mRNA、72個miRNA、29個lncRNA構(gòu) 建ceRNA網(wǎng)絡。通過Cytoscape3.7.0對網(wǎng)絡進行可視化處理(見圖2),并進行網(wǎng)絡拓撲結(jié)構(gòu)分析,包括節(jié)點、度、緊密度中心性、介數(shù)中心性以及平均最短路徑長度等。該網(wǎng)絡共有283個節(jié)點、4 990條邊,網(wǎng)絡中節(jié)點最大度值為154,其中有26個節(jié)點度值≥80。節(jié)點的拓撲參數(shù)見表1。
圖2 冠心病血瘀證ceRNA網(wǎng)絡
通過網(wǎng)絡拓撲分析可以看出,lncRNANEAT1(核旁斑點組裝轉(zhuǎn)錄本1)在網(wǎng)絡中度值最大,表明與之相連的節(jié)點數(shù)最多,NEAT1在乳腺癌等婦科癌癥中大量表達,其可通過抑制相應的miRNA或與調(diào)節(jié)蛋白相互作用促進腫瘤的發(fā)展,是一種重要的生物標志物,亦是有前景的治療靶點[17]。在冠心病患者中,NEAT1通過激活miR-140-3p/MAPK1通路增加細胞活力并抑制冠心病細胞凋亡,能夠作為冠心病的潛在治療靶點[18]。度值≥80的節(jié)點中有23個節(jié)點是miRNA,這不僅反映miRNA與冠心病的關(guān)系密切,同時也在ceRNA網(wǎng)絡中起到重要的連接作用。如hsa-miR-340-5p在冠心病患者的血小板中表達上調(diào)[19],hsa-miR-106-5p可作為炎癥標志物、hsa-miR-137可作為細胞損傷標志物,幫助診斷不穩(wěn)定型心絞痛患者心肌缺血并對缺血的嚴重程度進行分層[20]。
網(wǎng)絡結(jié)構(gòu)熵值能夠有效刻畫無尺度網(wǎng)絡的無序性。從大網(wǎng)絡中識別出功能模塊的過程是系統(tǒng)從無序到有序的變化,是系統(tǒng)能量分布從均勻到不均勻的變化,是一個熵減的過程,且熵越小,系統(tǒng)越穩(wěn)定。模塊識別的最終目的是要找到一種穩(wěn)定的模塊化狀態(tài),這種狀態(tài)具有最小的不確定性[21]。
分別計算MCODE、MCL、GLay模塊劃分的熵值,結(jié)果見表2。
表2 冠心病血瘀證ceRNA網(wǎng)絡3種模塊劃分方法比較
根據(jù)熵值最低原則,選擇MCODE作為模塊劃分方式。MCODE算法共識別出11個模塊(節(jié)點數(shù)≥3),見圖3。根據(jù)MCODE評分排序,最大模塊有31個節(jié)點和107條邊,評分7.133分;最小模塊有4個節(jié)點和4條邊,評分2.667分。
圖3 MCODE劃分出的冠心病血瘀證ceRNA網(wǎng)絡11個模塊
GO注釋包含生物過程(BP)、細胞組分(CC)、和分子功能(MF),對冠心病血瘀證ceRNA網(wǎng)絡富集分析共識別出211個RNA,其中BP涉及生物調(diào)節(jié)、代謝、細胞增殖、細胞復制等過程,CC顯示分布在20個細胞組分中,MF主要集中在蛋白質(zhì)結(jié)合、離子束縛、核酸結(jié)合、核苷酸結(jié)合等功能。FDR<0.05的前10個條目見圖4。KEGG分析顯示冠心病血瘀證ceRNA網(wǎng)絡富集到62條通路(FDR<0.05),集中在腫瘤、局部黏附、PI3K-Akt信號通路等方面,前10條通路見圖5。
圖4 冠心病血瘀證ceRNA網(wǎng)絡mRNA的GO富集分析
圖5 冠心病血瘀證ceRNA網(wǎng)絡mRNA的KEGG通路富集分析
模 塊1、2、6、7同 時 包 含3種RNA,因 此lncRNA-miRNA-mRNA調(diào)控軸可能存在于以上4個模塊中。對4個模塊中的基因分別進行文獻檢索,基于5個數(shù)據(jù)庫的檢索結(jié)果發(fā)現(xiàn),模塊1、2、7的節(jié)點未在文獻中發(fā)現(xiàn)冠心病生理病理相關(guān)的上下游調(diào)控關(guān)系,模塊6中節(jié)點具有調(diào)控關(guān)系,且符合調(diào)控軸預測原則。模塊1中節(jié)點PVT1、hsa-miR-370-5p、hsa-miR-16-5p、
hsa-miR-15b-5p、hsa-miR-23a-3p、TGFBR1、MTRR、MTHFR、OLR1、GCLC、APC、RAP1A均報道與冠心病生理相關(guān),但并無文獻報道節(jié)點之間的調(diào)控關(guān)系;模 塊2中 節(jié) 點hsa-miR-130a-5p、CD46、CXCL12、CAV1、H19均報道與冠心病生理相關(guān),但根據(jù)文獻報道的調(diào)控關(guān)系與冠心病無關(guān);模塊7中節(jié)點HOTAIR、hsa-miR-19b-3p、hsa-miR-214-3p均報道與冠心病生理相關(guān),但其之間存在的調(diào)控關(guān)系與冠心病生理病理無關(guān)。只有模塊6中UCA1、miR-1、G6PD3個節(jié)點符合調(diào)控軸預測條件,其中UCA1冠心病生理病理相關(guān)文獻報道5篇,miR-1文獻報道44篇,G6PD文獻報道5篇。UCA1-miR-1-G6PD三者之間相關(guān)關(guān)系的文獻共報道17篇,與冠心病生理病理相關(guān)的文獻5篇,符合調(diào)控軸預測要求,其中有4篇文獻經(jīng)過驗證。該軸靶向關(guān)系體現(xiàn)如下:miR-1能夠抑制G6PD的表達,導致心肌梗死、心肌缺血等冠狀動脈疾病的發(fā)生,而UCA1能夠通過解除miR-1的抑制恢復G6PD的正常表達。驗證三者之間關(guān)系的文獻報道見表3。
表3 UCA1-mir-1-G6PD與冠心病血瘀證實驗驗證
MRE是RNA的重要組成部分,在ceRNA網(wǎng)絡基因調(diào)控中發(fā)揮重要作用,具有相同的MRE的mRNA、lncRNA、miRNA存在ceRNA調(diào)控機制,而不具有相同MRE,則不能發(fā)生調(diào)控。StarBase數(shù)據(jù)庫提示lncRNA UCA1、mRNA G6PD分別與miRNA miR-1具有共同的MRE(見圖6),為通過網(wǎng)絡篩選調(diào)控軸提供了生物學依據(jù)。
圖6 冠心病血瘀證ceRNA網(wǎng)絡MRE驗證
中醫(yī)證候宜使用復雜系統(tǒng)方法學探究其生物學基礎,現(xiàn)有研究在質(zhì)量和數(shù)量上均無法滿足需求,其方法也尚未形成體系[26]。構(gòu)建ceRNA網(wǎng)絡,以模塊藥理學的方式挖掘證候的生物學基礎是分析病證結(jié)合機制的新方法之一,目前已有多項研究通過構(gòu)建無向的共表達網(wǎng)絡[27]或有向的基因調(diào)控網(wǎng)絡[28]、蛋白相互作用網(wǎng)絡[29]等探討證候與疾病的共同生物學機制,但基于構(gòu)建的整體網(wǎng)絡進行分析,難以直接找到其中的關(guān)鍵靶點及調(diào)控關(guān)系。模塊藥理學認為,復雜疾病的研究需要一種模塊化的靶點研究模式,強調(diào)對復雜生物網(wǎng)絡進行模塊化分析,用于度量和整合藥物干預網(wǎng)絡的特征。其中,靶點-靶點相互作用及動態(tài)平衡規(guī)律不僅是影響模塊化功能的關(guān)鍵結(jié)構(gòu)因素,也是疾病影響因素擾動的體現(xiàn)[30]。本研究在探討冠心病血瘀證生物學基礎過程中,考慮到lncRNA能夠直接作用于mRNA,補充了lncRNA與mRNA之間的相互作用關(guān)系,不僅豐富了ceRNA網(wǎng)絡,且使網(wǎng)絡結(jié)構(gòu)在空間上更加穩(wěn)定;對ceRNA網(wǎng)絡進行功能模塊劃分,依據(jù)熵值法篩選模塊劃分的最佳方法,確保網(wǎng)絡的有序性和功能性;利用功能模塊篩選出潛在調(diào)控軸,能夠基于已有的數(shù)據(jù)庫實驗數(shù)據(jù)快速篩選關(guān)鍵靶點及靶點之間的作用關(guān)系,為開展證候生物學機制研究提供新思路。
模塊6涉及 的lncRNA UCA1、miRNA miR-1、mRNA G6PD臨床報道較多。miR-1在心肌梗死患者中的表達水平顯著高于非心肌梗死患者,在急性胸痛發(fā)作3 h內(nèi)具有診斷價值,是心肌梗死預后的獨立危險因素,此外還參與心肌缺血再灌注損傷的治療過程中[31-32]。UCA1(尿路上皮癌相關(guān)蛋白1)能夠通過MAPK通路減少心肌梗死患者由于缺血缺氧引起的細胞凋亡和損傷,在成年人心臟中特異性表達,心肌梗死患者中表達量顯著降低[22-23,33]。G6PD參與冠狀動脈和肺動脈收縮和舒張的調(diào)節(jié),在冠心病中表達水平顯著降低[34],且能作為冠心病診斷的關(guān)鍵基因[35]。三者之間存在密切的調(diào)節(jié)關(guān)系:G6PD抑制或敲低時,血管平滑肌細胞限制性收縮蛋白、心肌蛋白及miR-1的表達增加[24]。miR-1能夠通過抗氧化網(wǎng)絡的轉(zhuǎn)錄后修飾加重心臟氧化應激,其過表達時能夠表現(xiàn)出較高的心肌細胞活性氧水平和對H2O2誘導的氧化應激的較低抵抗力,證實G6PD是miR-1轉(zhuǎn)錄后抑制的新型靶標[25]。
冠心病血瘀證ceRNA網(wǎng)絡富集分析得到多條通路,如PI3K-Akt信號通路、ErbB信號通路、GnRH信號通路、P53信號通路、MAPK信號通路、雌激素信號通路等?;罨腜I3K-Akt途徑中,PI3K和Akt表達及磷酸化水平顯著提高,可抑制磷酸酶和張力蛋白同源物對血管平滑肌細胞存活的抑制作用,使細胞增殖率增加,細胞凋亡水平降低,從而保護心肌細胞[36]。miRNA-26a-5p能夠通過靶向PTEN激活PI3K-Akt通路,影響內(nèi)皮細胞的增殖和凋亡[37]。動脈粥樣硬化中上皮脂肪組織p53表達水平較高,能夠通過mRNA和蛋白水平觀察到Sirt-1和p53之間存在負相關(guān),Sirt1-p53軸可能通過促進細胞凋亡參與動脈粥樣硬化[38]。
除相關(guān)通路外,KEGG還富集到18條癌癥相關(guān)通路,占富集通路總數(shù)的29%,考慮可能由于冠狀動脈疾病和癌癥通常通過共同的生物學途徑和危險因素在同一患者體內(nèi)發(fā)生[39],此外,也有通過生物信息學方式探討乳腺癌與冠心病共享生物標志物的篩選,發(fā)現(xiàn)NLN、POSTN、MAPT、MYO6、MAP1B、FBXO31、KIT、PIK3R等18個mRNA可作為檢測乳腺癌誘導冠心病的潛在標志物。模塊1中的PVT1是新發(fā)現(xiàn)的致癌因子,參與胃癌、膽囊癌等多種癌癥的發(fā)生過程,同時也能通過miR-128-3p-SP1-TGF-β1-Smad軸促進心房纖維化[40]。模塊2中的H19在正常動脈中檢測不到,但在損傷的血管和動脈粥樣硬化病變后的內(nèi)膜中高度表達[41],高表達H19會促進肝癌細胞的增殖,下調(diào)會抑制腫瘤細胞增殖[42]。同樣,模塊6中的UCA1不僅參與到UCA1-miR-1-G6PD軸,也能夠通過miR-143/MYO6軸促進大腸癌的發(fā)生,且UCA1還能作為結(jié)直腸癌的治療靶標[43]。
ceRNA調(diào)控理論代表了廣泛的基因表達轉(zhuǎn)錄后的調(diào)控模式,篩選冠心病血瘀證相關(guān)lncRNA、miRNA、mRNA,構(gòu)建基因間調(diào)控網(wǎng)絡,從轉(zhuǎn)錄組學機制層面研究冠心病血瘀證物質(zhì)基礎和病理機制,可為中醫(yī)證型相關(guān)研究提供一定的科學基礎。功能模塊識別很好地解決了生物網(wǎng)絡過于復雜難以分析的問題。通過構(gòu)建網(wǎng)絡,能夠更高效整合人體和疾病生物分子層面的數(shù)據(jù),從空間結(jié)構(gòu)層面找到關(guān)鍵調(diào)控節(jié)點,有助于闡釋疾病發(fā)生的機制,預測疾病的發(fā)生與發(fā)展,為早篩早檢早治療提供可能。本研究在構(gòu)建冠心病血瘀證相關(guān)ceRNA網(wǎng)絡時,補充了lncRNA與mRNA之間的聯(lián)系,并通過模塊藥理學理論劃分模塊,從模塊中篩選潛在lncRNA-miRNA-mRNA調(diào)控軸,可在一定程度上為挖掘冠心病血瘀證潛在的生物學基礎提供重要參考。