劉 迪,張洪春,李 穎★
(1.中日友好醫(yī)院 中醫(yī)肺病科,北京 100029;2.北京中醫(yī)藥大學(xué),北京 100029)
慢性阻塞性肺疾病 (chronic obstructive pulmonary disease,COPD,簡稱慢阻肺)是一種以持續(xù)性呼吸道癥狀和氣流受限為特征的疾病,是世界第四大死因,其發(fā)病與遺傳、 顆粒物暴露等相關(guān),發(fā)病機(jī)制包括氧化應(yīng)激、蛋白酶-抗蛋白酶失衡、炎癥細(xì)胞及炎癥介質(zhì)增多、細(xì)支氣管周圍及間質(zhì)纖維化等[1]。由于慢阻肺病因及發(fā)病的復(fù)雜性,選擇合適的動(dòng)物模型深入研究其生理、 病理和治療變得極為重要。小鼠、大鼠、豚鼠、猴等實(shí)驗(yàn)動(dòng)物模型可模擬慢性肺部炎癥細(xì)胞浸潤、呼吸道重塑、肺氣腫和肺功能受損等慢阻肺疾病特征[2]。但不同慢阻肺動(dòng)物模型的臨床差異較大,需要從基因差異上深入研究,有助于選擇更合適的模型動(dòng)物。
本文通過生物信息學(xué)方法,分析了人類、小鼠、大鼠等物種的慢阻肺易感基因差異,進(jìn)行了基因富集分析,并利用PolySearch2 挖掘慢阻肺易感基因相關(guān)的文獻(xiàn)。
慢阻肺易感基因差異性分析采用大鼠基因組數(shù) 據(jù) 庫 (rat genome database,RGD,https://rgd.mcw.edu),其整合了大鼠、小鼠、人類等8 個(gè)物種的大量結(jié)構(gòu)化和標(biāo)準(zhǔn)化數(shù)據(jù),包括基因的生物學(xué)過程及細(xì)胞成分、數(shù)量性狀基因座、序列、圖譜、品系、疾病關(guān)聯(lián)、表型、通路和分子功能等[3],以及一套用于查詢、分析和可視化這些數(shù)據(jù)的工具[4,5]。
易感基因在不同物種比較基因組學(xué)分析采用Ensembl 基因組數(shù)據(jù)庫(http://asia.ensembl.org/index.html),其包含了脊椎動(dòng)物基因組數(shù)據(jù),如基因、變異、調(diào)節(jié)和比較基因組學(xué)等[6]。
PolySearch2 多源文本挖掘系統(tǒng)(http://polysearch.cs.ualberta.ca) 可用于提取和分析人類疾病、基因、突變、藥物、代謝物等之間的文本派生關(guān)系[7,8]。本文使用PolySearch2 挖掘文獻(xiàn)中的慢阻肺易感基因,選擇Z-Score>8.00 相關(guān)度最高的基因進(jìn)行分析。按照相關(guān)性排序列出與慢阻肺相關(guān)的最可能的基因或蛋白質(zhì)。
RGD 數(shù)據(jù)庫可檢索到慢阻肺易感基因的數(shù)量,其中人類201 個(gè)(總數(shù)40 984 個(gè)),常用慢阻肺模型動(dòng)物中小鼠200 個(gè)(總數(shù)53 724 個(gè)),大鼠200 個(gè)(總數(shù)45 816 個(gè)),犬189 個(gè)(總數(shù)36 850個(gè)),豬188 個(gè)(總數(shù)30 414 個(gè))。從基因數(shù)量上看,小鼠、大鼠和人類的基因數(shù)是最接近的,犬和豬次之。將人類、小鼠、大鼠的慢阻肺易感基因?qū)С霾⑶蠼患Y(jié)果顯示共有的基因是Fam13a、Eefsec、Mtcl1、Faim2、Serpina3。
表1 FAM13A 在不同物種中的同源性分析
2.2.1 KEGG 通路富集分析
人類、小鼠、大鼠慢阻肺易感基因KEGG(Kyoto encyclopedia of genes and genomes) 通路富集分析結(jié)果按P 值從小到大排列,前30 條相關(guān)通路基本相同。以人類為例,富集程度較高的通路包括:①免疫相關(guān)通路:免疫相關(guān)信號(hào)通路、免疫反應(yīng)通路、先天免疫反應(yīng)通路;②疾病相關(guān)通路:傳染病通路、類風(fēng)濕關(guān)節(jié)炎通路;③細(xì)胞因子介導(dǎo)的信號(hào)通路:細(xì)胞因子和趨化因子介導(dǎo)的信號(hào)通路、白細(xì)胞介素介導(dǎo)的信號(hào)通路;④其他通路:Toll 樣受體信號(hào)通路等。
2.2.2 生物表型富集分析
人類慢阻肺易感基因的生物表型富集包括免疫系統(tǒng)異常、代謝/穩(wěn)態(tài)異常、免疫系統(tǒng)生理異常、呼吸系統(tǒng)異常等表型。小鼠主要富集在免疫系統(tǒng)生理異常、免疫系統(tǒng)表型、穩(wěn)態(tài)/代謝表型、異常炎癥反應(yīng)、細(xì)胞免疫異常等表型。大鼠主要富集在心血管系統(tǒng)生理異常、穩(wěn)態(tài)/代謝表型、全身動(dòng)脈血壓異常、血管生理異常、蛋白水平異常等表型。
2.2.3 分子功能富集分析
人類、小鼠、大鼠慢阻肺易感基因分子功能富集分析結(jié)果按P 值從小到大排列,前30 條相關(guān)通路基本相同。以人類為例,富集程度較高的通路包括:①細(xì)胞因子結(jié)合相關(guān):信號(hào)受體結(jié)合、細(xì)胞因子受體結(jié)合、G 蛋白偶聯(lián)受體結(jié)合、趨化因子受體結(jié)合;②細(xì)胞因子活性相關(guān):細(xì)胞因子活性、受體配體活性、信號(hào)受體激活活性、趨化因子活性、分子傳感器活性。
以FAM13A 基因?yàn)槔?,利用Ensembl 基因組數(shù)據(jù)庫,分析慢阻肺FAM13A 在不同物種中相對(duì)于人類基因的比較基因組學(xué)結(jié)果(表1)。
表2 PolySearch2 文本挖掘慢阻肺易感基因
為了驗(yàn)證慢阻肺易感基因分析結(jié)果的可靠性,使用PolySearch2 文本挖掘工具,以“Chronic Obstructive Pulmonary Disease”為關(guān)鍵詞,檢索到有文獻(xiàn)支持的81 個(gè)慢阻肺易感基因/蛋白,其中Z-Score>8.00 相關(guān)度最高的基因有14 個(gè)(表2)。
人類、小鼠、大鼠慢阻肺易感基因富集結(jié)果表明3 個(gè)物種在慢阻肺的相關(guān)疾病、 涉及的信號(hào)通路及作用靶點(diǎn)等方面具有相似性。免疫相關(guān)通路、細(xì)胞因子介導(dǎo)的信號(hào)通路及感染性疾病等相關(guān)通路在慢阻肺發(fā)病中共同發(fā)揮作用; 慢阻肺易感基因?qū)?yīng)的蛋白質(zhì)的主要功能集中在信號(hào)受體、細(xì)胞因子受體、趨化因子受體、G 蛋白偶聯(lián)受體等的活化及結(jié)合方面。人類、小鼠和大鼠的生物表型富集分析因?yàn)槲锓N的差別而有所差異,綜合來看慢阻肺的發(fā)病與免疫系統(tǒng)異常、 異常炎癥反應(yīng)、代謝/穩(wěn)態(tài)異常等相關(guān)。
在PolySearch2 查詢的慢阻肺易感基因研究中,依次為FAM13A、HHIP、ADAM33、PDE4A10、IL17、TNF-C 等。在小鼠和人肺組織中,F(xiàn)AM13A主要表達(dá)于氣道和肺泡Ⅱ型上皮細(xì)胞和巨噬細(xì)胞中。與Fam13a+/+小鼠相比,F(xiàn)am13a 陰性小鼠(Fam13a-/-) 對(duì)香煙煙霧及彈性蛋白酶誘發(fā)的肺氣腫具有抵抗性。條件遺傳關(guān)聯(lián)分析表明,人類FAM13A 中存在2 個(gè)獨(dú)立COPD 關(guān)聯(lián)信號(hào),并且該基因?yàn)镃OPD 與肺纖維化共有[9,10]。
HHIP 基因變異與慢阻肺的易感性和肺功能水平有關(guān)。10月齡Hhip 雜合子(Hhip+/-)小鼠出現(xiàn)肺順應(yīng)性增加和自發(fā)性肺氣腫,與Hhip 陽性小鼠相比,雜合子小鼠肺部的氧化應(yīng)激水平升高[11]。ADAM33 可能通過引發(fā)氣道炎癥和免疫反應(yīng)增加慢阻肺發(fā)病風(fēng)險(xiǎn),ADAM33 S1 基因多態(tài)性是中國和吸煙人群COPD 的危險(xiǎn)因素[12]。磷酸二酯酶4(PDE4)是治療哮喘和慢阻肺的藥物靶標(biāo)[13]。多種動(dòng)物模型在病毒和細(xì)菌感染的呼吸模型以及化學(xué)介導(dǎo)的肺損傷后顯示出PDE4 抑制劑(PDE4i)的強(qiáng)抗炎作用[14]。
目前,我們對(duì)驅(qū)動(dòng)和標(biāo)記慢阻肺產(chǎn)生和進(jìn)展的機(jī)制仍不夠明確[15]。分析慢阻肺易感基因有助于深入研究慢阻肺發(fā)展機(jī)制,制作更符合病理生理的基因工程動(dòng)物模型,并為闡明慢阻肺的發(fā)病機(jī)理和尋找新的治療策略提供依據(jù)。