劉 桐,高雅婷,張星星,鄭莉莉,童佳兵,,3,李澤庚,,3*
(1.安徽中醫(yī)藥大學 研究生院, 安徽 合肥 230038;2.安徽中醫(yī)藥大學第一附屬醫(yī)院 呼吸科,安徽 合肥230031;3.新安醫(yī)學教育部重點實驗室,安徽 合肥 230038)
肺癌是最常見的惡性癌癥之一,致死率較高[1-2]。根據(jù)組織學分類,肺癌分為小細胞肺癌(SCLC, Small Cell Lung Cancer) 和非小細胞肺癌(NSCLC, Non-Small Cell Lung Cancer)。肺癌的主要治療策略是手術切除、輔助化療、輔助放療等,雖然隨著針對EGFR、ALK、ROS1 和NTRK 突變的幾種酪氨酸激酶抑制劑的引入以及免疫檢查點抑制劑(ICIs, Immune Checkpoint Inhibitors)的出現(xiàn)極大地改變了肺癌治療的前景,然而患者的5 年生存率仍然很低[3-4],因此發(fā)現(xiàn)新的藥物和合適的治療技術是至關重要的。
肺癌在中醫(yī)學歸于“肺積”“肺巖”“積聚”等范疇。古醫(yī)籍中有關于其論述,如《難經(jīng)》曰:“肺之積,名曰息賁……喘咳,發(fā)肺壅?!薄锻庾C醫(yī)案》云“正氣虛則成巖。”中醫(yī)藥治療肺癌有悠久的歷史,能夠改善患者的癥狀及生存水平,預防肺癌的復發(fā)與轉移,延長患者的生存時間。本研究借助數(shù)據(jù)挖掘技術分析名老中醫(yī)治療肺癌的辨證用藥及用藥規(guī)律,采用網(wǎng)絡藥理學探討藥物和疾病靶點之間的潛在作用機制和具體的生物學意義,以期為中醫(yī)藥治療肺癌提供理論支撐。
根據(jù)第一屆至第三屆國醫(yī)大師名單、第一屆全國名中醫(yī)名單、第一批至第六批全國老中醫(yī)藥專家學術經(jīng)驗繼承工作指導老師名單,建立治療肺癌的醫(yī)家excel 表格。檢索中文數(shù)據(jù)庫中國知網(wǎng)、萬方、維普,收集excel 名單所列醫(yī)家使用中醫(yī)藥治療肺癌的醫(yī)案,建立數(shù)據(jù)庫。檢索語種限制為中文,檢索時限從數(shù)據(jù)庫建立至2021 年10 月31 日。以CNKI 檢索為例:(“肺癌”O(jiān)R“肺腫瘤”O(jiān)R“肺惡性腫瘤”)AND(“醫(yī)案”O(jiān)R“驗案”O(jiān)R“經(jīng)驗”)。
①納入診斷明確的患者,且醫(yī)案中具有肺癌的病理學診斷結果;② 納入有完整記錄的醫(yī)案,包括癥狀、舌脈、證型、中藥處方;③ 同一個醫(yī)案中有多次就診記錄,只納入首診記錄;④排除轉移性肺癌,或合并其他類型癌癥的患者;⑤排除文獻中記錄不完整的醫(yī)案;⑥排除重復的醫(yī)案。
參照2020 年版《中國藥典》、《中華本草》及中國中醫(yī)藥出版社的教材《中藥學》對中藥名稱進行規(guī)范。① 將具有多種別稱的中藥統(tǒng)一規(guī)范。如:將“七葉一枝花”“蚤休”改為“重樓”。② 將不同炮制方法,但是功效無明顯差別的同一種中藥進行規(guī)范。如:將“焦麥芽”“炒麥芽”改為“麥芽”。③ 將簡稱合并的中藥進行拆分。如:將“焦三仙”拆分為“麥芽、山楂、神曲”。④同一種中藥的不同炮制方法,以及同一種中藥的不同部位,但是中藥功效有一定差別的中藥不進行統(tǒng)一。如:“生地”和“熟地”,“瓜蔞皮”和“瓜蔞仁”。
統(tǒng)計每種藥物在所有處方中出現(xiàn)的頻數(shù)。在SPSS Modeler 18.0 選取關聯(lián)規(guī)則中Apriori 模型,最低條件支持度10%,最小規(guī)則置信度80%。在SPSS 22.0 進行k 均值聚類分析,設置目標聚類數(shù)為4,最大迭代次數(shù)為10。
基于TCMSP 數(shù)據(jù)庫[5]篩選核心組方4 的藥物活性成分。根據(jù)口服生物利用度(OB)≥30%和類藥性(DL)≥0.18,獲得有效活性成分。在TCMSP 中無法篩選到的藥物,則使用TCMID 數(shù)據(jù)庫進行分析。
從美國腫瘤基因組圖譜計劃數(shù)據(jù)庫(TCGA, The Cancer Genome Atlas)中搜集到501 例肺腺癌,535 例肺鱗癌患者,108 例正常肺部樣本的轉錄組基因表達譜。基于R 軟件平臺對樣本的基因表達水平進行數(shù)值矯正與批次效應的移除,以增強數(shù)據(jù)的有效性。據(jù)|logFC|≥2 和P≤0.05 篩選條件分析肺癌疾病靶點。將獲得的藥物活性成分靶點與疾病靶點繪制韋恩圖,篩選針對肺癌的潛在有效靶點。
使用STRING 在線工具對篩選得到的靶點信息,進行蛋白互作網(wǎng)絡構建,設置有效的作用信息來源為默認選項,其中包括文獻挖掘和實驗分析,并設置最低互作評分為0.4,而后將分析結果以tsv 文件形式導出。
基于Cytoscape 軟件,使用Network Analyzer 插件對蛋白互作網(wǎng)絡進行網(wǎng)絡結構的拓撲分析,獲得網(wǎng)絡評價指標:節(jié)點度值(Degree),中介中心性(Betweenness Centrality),近中心性(Closeness Centrality)。以所有節(jié)點度值中位數(shù)的2 倍為閾值,將度值大于該閾值的節(jié)點,視為網(wǎng)絡的核心靶點,并繪制互作網(wǎng)絡。
通過DAVID 數(shù)據(jù)庫對核心組方治療肺癌的潛在靶點進行生物學功能富集分析。輸入靶點名稱,設置物種類型為“Homo sapiens”。使用功能注釋工具,下載Gene_Ontology 選項和Pathways 選項的KEGG_PATHWAY 分析結果?;赗 軟件,篩選假陽性(False Discovery Rate, FDR)低于0.01 的基因富集內(nèi)容,并通過軟件包“ggplot”和“Goplot”進行可視化。
為進一步從PPI 網(wǎng)絡的核心靶點中,篩選有效影響NSCLC 細胞系增殖的基因,且用于后續(xù)的分子對接分析,可通過基因-癌癥依賴關系,分析上述潛在靶點對NSCLC 的癌癥生存依賴性。通過基因依賴關系數(shù)據(jù)庫(DepMap)下載22Q1 版所有細胞實驗數(shù)據(jù),收集CRISPR 類型的基因-腫瘤細胞依賴性和細胞系的基因表達,以及相應細胞系的基本信息。而后,選擇158 個NSCLC 細胞系的基因敲除數(shù)據(jù),使用上述潛在靶點的表達水平和敲除效果評分進行可視化分析。CRISPR 得分在0 分以下表示該基因的敲除作用將抑制腫瘤增殖,反之則表示該基因在腫瘤發(fā)展中起相反的作用。
對基因-癌癥依賴性分析獲得的核心6 個靶點,進行分子對接分析。從PDB 蛋白質數(shù)據(jù)庫中獲得蛋白晶體結構,即CCNB1(PDBID: 6GU2), CDK4(PDBID:2W96),CCNA2 (PDBID: 1E9H),CDK1(PDBID:4Y72),IL13 (PDBID: 3LB6),NFKBIA (PDBID:1IKN)。從PubChem 數(shù)據(jù)庫下載化合物芹菜素、鞣花酸、異鼠李素、山柰酚、羽扇豆醇、木犀草素、蛇床子素、槲皮素、開環(huán)異落葉松樹脂酚、烏蘇酸的3D結構用于配體對接。隨后通過Autodock Vina 進行分子對接,參數(shù)energy_range 為4,exhaustiveness 為25。全局搜索空間定義包含靶蛋白的所有殘基。在配體-受體對接后,計算結合親和力并進行排序,選擇適合的對接姿勢,同時對化合物與靶蛋白的配體-受體相互作用使用LigPlot 進行可視化。
根據(jù)文獻檢索結果,初步收集的中醫(yī)藥治療肺癌醫(yī)案共370 個。根據(jù)納入與排除標準,最終獲得有效醫(yī)案226 個。
在病理分型中腺癌138 例,鱗癌66 例,腺鱗癌5 例,小細胞肺癌17 例。NSCLC 發(fā)病率92.48%。性別分布中男性147 例,女性79 例,男女比例1.86 : 1,男性發(fā)病率高于女性。
在年齡分布上,最大年齡為86 歲,最小年齡為35 歲。其中,31 ~ 40 歲10 例,41 ~ 50 歲29 例,51 ~60 歲59 例,61 ~ 70 歲80 例,71 ~ 80 歲41 例,81 ~90 歲7 例。50 歲以上的病例187 例(82.74%),可發(fā)現(xiàn)50 歲上為高發(fā)病人群,結果見表1。
表1 基本資料Tab.1 Basic data
226 個治療肺癌的醫(yī)案中共包含中藥373 種,藥物總頻次3 983 次。統(tǒng)計前100 味中藥的藥性、藥味、歸經(jīng),并繪制熱圖,結果見圖1。
圖1 前100 味中藥性味歸經(jīng)分布圖Fig.1 Distribution map of nature, taste and channel tropism for 100 Chinese medicine
統(tǒng)計中藥頻次,得到高頻中藥25 種(頻次≥35)。高頻中藥的百分比=頻次/總處方數(shù)(即:頻次/226)。其中,補虛藥7 種,清熱藥7 種,化痰止咳平喘藥5 種,消食藥2 種,理氣藥1 種,利水滲濕藥2 種,止血藥1 種。排名前25 味的中藥結果見表2。
表2 高頻中藥頻次分布表Tab.2 Frequency distribution table of high frequency Chinese medicine
使用SPSS Modeler,將治療肺癌的高頻藥物即頻次≥35 的高頻中藥(共計25 種)進行關聯(lián)規(guī)則分析。關聯(lián)網(wǎng)絡圖采用SPSS Modeler 18.0 建立節(jié)點圖,結果見圖2。
圖2 高頻藥物關聯(lián)網(wǎng)絡圖Fig.2 High frequency drugs association network diagram
在關聯(lián)網(wǎng)絡圖中,網(wǎng)絡線粗細與關聯(lián)頻數(shù)成正比關系,關聯(lián)數(shù)越大,線條越粗。將圖中的強鏈接結果以表格的形式展示,結果見表3。建立Apriori 關聯(lián)模型,進行關聯(lián)規(guī)則分析。共挖掘的二項關聯(lián)規(guī)則2項,三項關聯(lián)規(guī)則29 項(表格展示前10 組)。結果見表4、5。
表3 關系網(wǎng)絡圖強鏈接結果分布表Tab.3 Strong link result distribution table of association network diagram
表4 二項關聯(lián)規(guī)則分布表Tab.4 Binomial association rule distribution table
表5 三項關聯(lián)規(guī)則分布表(前組)Tab.5 Three association rule distribution table (top 10)
運用SPSS 22.0 軟件對頻次≥35 的高頻中藥(共計25 種)進行k 均值聚類,生成4 個核心組方,結果見表6。
表6 均值聚類核心組方Tab.6 K-means clustering for core prescriptions
結合肺癌“整體正虛、局部積聚、夾雜癌毒”的病因病機,核心組方4 的藥物組成兼顧肺癌的各種病機,治則治法更全面,可以為中醫(yī)藥治療肺癌提供參考,因此后續(xù)進一步進行網(wǎng)絡藥理學分析。
據(jù)OB 和DL 參數(shù),從核心組方4 中獲得有效藥物活性成分93 個。去除重復和無效靶基因后,獲得藥物靶點共478 個。同時根據(jù)癌癥和正常樣本的轉錄組差異分析結果,提取肺癌疾病靶點2 743 個。兩者取交集后獲得核心組方4 治療肺癌的潛在有效靶點133 個,具體見圖3。
圖3 肺癌疾病靶點與核心組方藥物靶點交集Fig.3 The intersection of lung cancer disease targets and core prescription drug targets
對靶點進行蛋白互作網(wǎng)絡分析,結果表明核心組方的靶點度值最大值為54,最小值為1,中位數(shù)為8。按2 倍中位數(shù)作為閾值進行篩選,可獲得核心靶點30個,見圖4,排名前10 的見表7。圖中靶點的顯示面積越大,表明該節(jié)點的度值越高,其在整體互作網(wǎng)絡中更具有重要性。
圖4 30 個核心靶點的蛋白互作網(wǎng)絡Fig.4 Protein interaction network for 30 core targets
表7 核心組方網(wǎng)絡的核心靶點(前10)Tab.7 Core targets in the core Formulation network (top 10)
根據(jù)DAVID 分析結果,可獲得有效的生物學過程(Biological Process)、細胞組分(Cell Component)、分子功能(Molecular Function) 內(nèi)容各15 項,以及KEGG 功能富集通路13 條。圖5A 中靶點富集的前3條生物學過程,主要有:細胞對缺氧的反應(cellular response to hypoxia),正向調節(jié)凋亡過程(positive regulation of apoptotic process),炎癥反應(inflammatory response)。圖5D 中靶點富集的前3 條功能通路,主要涉及:MAPK 信號通路、PI3K-Akt 信號通路、TNF信號通路。
圖5 核心組方治療肺癌靶點的功能富集分析Fig.5 Enrichment of functional pathways of the core formula for the treatment of lung cancer targets
針對靶點網(wǎng)絡的30 個核心基因進行基因- 腫瘤細胞的依賴性分析。根據(jù)CRISPR 基因敲除數(shù)據(jù),篩選對NSCLC 細胞系具有明顯增殖抑制性的目標基因,并最終獲得6 個關鍵基因:CCNA2,CCNB1, CDK1, CDK4, IL13, NFKBIA。經(jīng)過基因敲除后,6 個基因在絕大部分的NSCLC 細胞系中均表現(xiàn)出抑制性,同時該抑制性效果與基因的表達水平無關(P>0.05)。見圖6。
圖6 6 個基因的表達水平與NSCLC 敲除效果Fig.6 Six genes expression levels and knock out effects of NSCLC
通過Autodock Vina 計算6 個核心靶蛋白與組方內(nèi)相應10 個化合物的結合親和力,具體見表8。選擇親和力效果最好的3 對化學物-靶蛋白復合物進行可視化分析。如圖7,化合物與其靶蛋白形成良好結合,結合親和力為NFKBIA-ursolic acid(-9.2 kcal/mol,形成6 個氫鍵),CCNB1-quercetin(-9.3 kcal/mol,形成1 個氫鍵),CDK4-ursolic acid(-9.3 kcal/mol,形成2 個氫鍵)。
圖7 分子對接圖Fig.7 Molecular docking diagram
表8 核心靶點與化合物的結合親和力Tab.8 Binding affinity of the core targets and the compounds
本次數(shù)據(jù)挖掘結果中,性別的頻數(shù)分布顯示男性的發(fā)病率高于女性,這可能與男性吸煙率以及男性較多的各種職業(yè)暴露因素有關[6]。年齡分布顯示50 歲以上為肺癌的高發(fā)病年齡段,據(jù)報道1990—2019 年50 ~ 69 歲和70 歲及以上人群的肺癌發(fā)病率均整體呈上升趨勢,年度變化百分比分別為0.58%和2.22%[7]。性味歸經(jīng)熱圖中用藥頻率前100 的中藥,歸經(jīng)于肺經(jīng)、胃經(jīng)、脾經(jīng)較多。肺癌病位在肺,脾土與肺金相生,肺氣不足、久病及脾,會導致脾氣虧虛,而顧護脾胃,能夠扶助正氣,可使患者自身機體抗癌有源。本次數(shù)據(jù)挖掘所涉及的醫(yī)案,超過半數(shù)患者接受過手術、放化療、靶向治療,耗損正氣,使臟腑氣血陰陽失調[8],所以高頻藥物中補虛藥較多。關聯(lián)規(guī)則的組合中,以補益藥組合為主,此類藥物能夠提高自身免疫方面,如在“扶正法”理論指導下的中藥復方能夠逆轉免疫逃逸,還能增強外周免疫T 細胞的殺傷作用[9-10]。“癌毒”是機體蓄積已久而形成的邪氣[11],會導致津液內(nèi)停,生成痰濁,導致血液運行不暢,生成瘀血,而癌毒日久則會郁而化熱。因此在辨證施治的基礎上,常選擇清熱解毒藥、化痰藥、活血化瘀藥等。
PPI 網(wǎng)絡圖表明核心組方4 能夠通過JUN、MMP9、PTGS2、FOS、IL1B 發(fā) 揮 治 療NSCLC 的 作用。c-JUN 是致癌轉錄因子[12],c-JUN 與自身或與原癌基因c-Fos 能夠形成同源或異源二聚體,調控細胞周期的進程,促進細胞增殖[13]。由PTGS2 編碼的蛋白質環(huán)氧化酶2(COX-2)在肺癌組織中可檢測到過表達,能夠影響腫瘤細胞的凋亡和侵襲,調節(jié)腫瘤血管形成過程[14]。且有研究表明在NSCLC 組織中COX-2 與c-Fos 的表達具有相關性[15]。MMP-9 是明膠酶之一,和腫瘤的侵襲和轉移以及血管生成有密切的關系[16]。IL-1β 被分泌到肺癌細胞周圍時,會誘導腫瘤周圍的血管增生,繼而促進腫瘤的進展、轉移[17]。研究發(fā)現(xiàn)調控PI3K/Akt 信號通路能夠抑制細胞增殖,Akt 磷酸化后能夠激活下游靶分子,使該通路活性增加[18]。而MAPK 信號通路在炎癥因子活化和腫瘤形成、進展、凋亡中發(fā)揮重要參與作用[19-20],p38 MAPK亦可調節(jié)細胞因子如IL-1、COX-2的產(chǎn)生。
針對篩選得到的6 個關鍵基因,其中CCNA2(Cyclin A2, 細胞周期蛋白A2), CCNB1(Cyclin B1, 細胞周期蛋白B1), CDK1, CDK4 均與細胞周期相關。如果細胞內(nèi)Cyclin A 表達受到抑制,細胞周期會停滯在S 期。此外Cyclin B1 在許多腫瘤組織如肝癌、乳腺癌等均存在過表達現(xiàn)象[20]。NFKBIA 是NF-κB 的抑制因子,而NF-κB 通路的持續(xù)激活會導致細胞生長失控,促進肺癌細胞增殖。還能夠轉錄具有抗凋亡活性的產(chǎn)物XIAP,繼而達到抑制凋亡的作用[21]。在分子對接結果中,一般認為化合物和靶蛋白的復合物構象穩(wěn)定時,兩者之間的結合能越低,表明結合越緊密。結果顯示蛇舌草/太子參/仙鶴草中的關鍵成分烏蘇酸、槲皮素與核心靶蛋白具有最佳的結合效果(<-9 kcal/mol),同時其他8 個化合物也存在優(yōu)異的對接效果(<-7 kcal/mol)。說明核心組方4 中關鍵成分烏蘇酸、槲皮素和關鍵疾病靶點NFKBIA、CCNB1、CDK4 有良好結合活性,對細胞周期過程、NF-κB 信號通路有潛在抑制作用。
治療肺癌的核心組方其功效主要以補益肺脾、清熱解毒化痰為主。其中,核心組方4 的作用機制可能是通過調節(jié)CCNA2、CCNB1、CDK1、CDK4、IL13和NFKBIA 的表達,繼而抑制炎癥相關通路、影響肺癌細胞周期而發(fā)揮抑制肺癌的作用。由于數(shù)據(jù)挖掘局限于已發(fā)表的文章中的總結,后續(xù)會納入更多的臨床治療肺癌的有效醫(yī)案及相關的實驗結果加以驗證,進一步探討名醫(yī)治療肺癌的相關機制,為中藥新藥研發(fā)提供新方向。