張民權,龔銘城,陳澤鍇,陳振華,周良良
(江西科技師范大學藥學院,江西省藥物分子設計與評價重點實驗室,南昌 330013)
藥物設計是一種高風險的研究,實驗周期長、投資成本高、失敗率高[1]。藥物分子通常是與蛋白質等生物大分子的靶點特異性結合發(fā)揮藥理作用,并且為了藥物的利用率和安全性,必須設計合適的藥物載體,僅通過實驗手段很難從微觀角度進行藥物分子設計并高效地篩選出與其最適合的載體材料。人工智能(artificial intelligence,AI)與分子模擬技術的融合為藥物設計研究帶來了新的契機,分子模擬能夠構建復雜的分子模型,解釋生物體系中藥物分子的運動過程[2],產(chǎn)生大量的數(shù)據(jù)信息,而AI技術能夠提取分子模擬計算結果中的有效信息[3],并反饋給人工神經(jīng)網(wǎng)絡進行學習。2種技術互補的特性為兩者在藥物設計研究領域的結合提供了許多可能,近幾年相關的研究成果也在不斷增多。
本文綜述聯(lián)用AI與分子模擬技術在藥物分子設計與藥物載體材料設計領域的研究成果,為未來藥物設計研究提供新的方法和思路。
隨著現(xiàn)代計算機技術的發(fā)展,計算機模擬已經(jīng)廣泛應用于藥物研究領域。通過模擬虛擬現(xiàn)實環(huán)境突破了現(xiàn)實實驗的局限性,提高了藥物研究效率。傳統(tǒng)計算機模擬有一些不足,如模擬結果缺乏統(tǒng)一可信的測量尺度,準確度較低,不同的軟件可能出現(xiàn)不同的結果,并且人為因素對模擬結果的影響是巨大且無法避免的。
AI是研究使計算機來模擬人的某些思維過程和智能行為的一門綜合科學。經(jīng)過幾十年的發(fā)展,AI已經(jīng)成為人工神經(jīng)網(wǎng)絡(artificial neural networks,ANN)[4]、機器學習(machine learning)[5]特別是深度學習(deep learning)[6]等技術的總稱,包含有隨機森林(random fost)、決策樹(decision tree)、支持向量機(support vector machines,SVM)[7]等AI算法。AI 基于多層神經(jīng)網(wǎng)絡結構,具有較強的獨立學習能力和邏輯推理能力,能夠模擬人腦的思維過程。AI 技術彌補了傳統(tǒng)計算機模擬的缺點,增加了AI 篩選、評價與學習的過程,降低了人為因素對模擬結果的影響,并且可以將模擬結果與眾多數(shù)據(jù)庫中的信息進行比對,提高了模擬結果的可信度,有效提升了計算機模擬效率,擴大了模擬范圍。
AI技術可優(yōu)化現(xiàn)有藥物設計模式[8],輔助分子模擬技術進行分子對接、藥物篩選、先導物的優(yōu)化等藥物設計方法[9],揭示藥物的作用機制,探索對應的分子運動的規(guī)律,提出合理的藥物設計優(yōu)化方案。
分子模擬從空間上可分為量子、分子、介觀等多個尺度,可以滿足不同實驗條件下的計算機模擬。量子尺度多用于大分子、酶、蛋白質等參與的化學反應[10],分子尺度多用于微觀尺度的聚合物單鏈[11],介觀尺度多用于較大的嵌段共聚物和共混體系等[12]。根據(jù)不同的實驗需要選擇適合的空間尺度,不僅可節(jié)約運算資源還可以避免實驗中復雜的操作以及多變的外界環(huán)境的影響。
分子模擬技術目前已經(jīng)開發(fā)了多種適用于不同尺度的模擬方法,如1976年WARSHEL和LEVITT提出的把量子力學和分子力學相結合的方法[13],適用于微觀尺度的耗散粒子動力學(dissipative particle dynamics,DPD)和介觀尺度分子模擬中的粗?;肿觿恿W(coarse-grained molecular dynamics,CGMD)等。常用力場有CHARMM、AMBER、GROMOS和COMPASS力場。
用分子模擬技術計算出大量數(shù)據(jù),通過AI 技術對數(shù)據(jù)進行挖掘,并建立相應模型,再利用分子模擬技術進行模擬分析,并將模擬結果反饋給AI 神經(jīng)網(wǎng)絡,這種研究方法符合未來藥物設計研發(fā)從計算機輔助藥物設計(computer-aided drug design,CADD)向人工智能輔助藥物研發(fā)(artificial intelligence drug discovery &design,AIDD)轉變的要求。
近年以來,藥物發(fā)現(xiàn)臨床研究的淘汰率高達90%[1]。研究表明,美國制藥公司花費大量成本在臨床藥物試驗上,如果失敗則會給公司帶來巨大的經(jīng)濟損失,極大地限制了藥物的研發(fā)和患者得到新療法救治的機會[14]。而且基于結構的藥物設計的難點是目標蛋白實際上呈現(xiàn)出一種變化的狀態(tài)[15],極大地限制了藥物研究的質量和效率,而通過AI預測篩選臨床前候選藥物可能只需要1年左右[16]。
隨著計算機計算能力的提高以及AI 技術的逐漸發(fā)展,藥物設計研發(fā)進入成熟合理化的階段,針對酶、受體、離子通道等特異性靶點,設計出結構合理、高效長效無毒的藥物分子。通過分子模擬,能直觀形象地觀察到藥物分子之間的相互作用過程,判斷藥物分子與受體結合的可能位點,預測藥物活性。
4.1分子對接(molecular docking) 分子對接是一種分析構象和取向(統(tǒng)稱為“姿態(tài)”)的方法[17]。通常,分子對接所關注的結合位點是已知的,如所需要的蛋白質結構可以到蛋白質結構數(shù)據(jù)庫(protein date bank,PDB)中搜索尋找。但對靶向區(qū)域的信息了解較少的情況下,有2種常用的方法:通過算法預測最有可能的結合位點和進行“盲對接”模擬。例如Moldock分子對接算法,它的評分功能是分段線性電位(piecewise linear potential,PLP)的拓展,采用這種算法可以準確地識別大部分復合物的正確結合模式[18]。具體分子對接操作流程見圖1(圖中蛋白質分子來自PDB)。
圖1 分子對接流程
RANDOUX等[19]使用一種分子探針對原子熱點進行采樣生成片段熱點圖,直觀地顯示出分子生長的位置。但是,當進行“盲對接模擬”時,在所有的目標結構中篩選出合適的姿態(tài)需要巨大的計算消耗,所以,將AI 技術運用到分子對接中,可以大大減小時間成本。XUE等[20]利用AI 技術和糖尿病患者皮膚的測序結果篩選出曲古抑菌素A和靶組蛋白脫乙酰酶4,分子對接模擬出兩者的相互作用,揭示兩者之間有效的結合情況,預測出其療效和安全性。SERRANO等[21]提出一種基于Q網(wǎng)絡的Q-N分子對接方法,這種方法在Q-learning的基礎上,通過結合ANNs和強化學習(reinforcement learning,RL)訓練強化實現(xiàn)評分功能,并可以將模擬結果拓展到其他配體配對。
AI技術能夠高效地預測分子對接可能的結合位點,解決了分子對接時資源耗費大的問題,達到了計算資源與計算準確度的平衡。
4.2藥物篩選 計算機輔助藥物篩選主要分為3類:基于受體、配體、蛋白質-配體相互作用,即虛擬篩選(virtual screening)。根據(jù)藥物相似性概念的規(guī)則,如GHOSE等[22]、VEBER等[23]提出的規(guī)則,通過AI 技術進行預篩選,減少了實際需要篩選的藥物分子數(shù),發(fā)現(xiàn)先導化合物的效率大大提高,同時可對藥物分子的可能活性進行預測,對潛在的化合物進行評價。進行虛擬篩選具體步驟見圖2。
圖2 虛擬篩選流程
ELEND等[24]聯(lián)用AI 和分子模擬技術以Mpro為藥物靶點設計了一種嚴重急性呼吸綜合征冠狀病毒2(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)主要蛋白酶抑制劑,先使用AI 算法篩選出針對Mpro的潛在候選藥物列表,再使用分子模擬技術篩選出與Mpro結合的最有效的配體。ZHANG等[25]先利用AI 技術檢索篩選出對SARS-CoV-2有效的化合物,對這些化合物的吸收、分布、代謝和排泄的計算機模型進行功能評估,再采用網(wǎng)絡藥理學預測藥物體內效應,最后使用Autodock進行分子對接模擬,篩選出合適的靶點-配體。GONG等[26]利用AI 技術篩選出10種化合物作為糖尿病候選治療藥,并使用機器學習和ANN預測化合物與二肽基酶-4的結合情況,最后篩選出最優(yōu)的化合物進行分子動力學模擬,對化合物的性能進行驗證。
聯(lián)用AI與分子模擬技術,解決了傳統(tǒng)虛擬篩選的不準確和低效率等問題[27],并且可以將模擬結果反饋給ANN,通過不斷的識別學習,產(chǎn)生具有相似性質的新分子。
4.3先導化合物的優(yōu)化 盡管AI和分子模擬技術能有效地避免化合物選擇性不夠、藥效強度不夠、毒副作用等問題,但這還不足以證明所得化合物可以直接用于臨床,需要對先導化合物進行結構修飾。DOMENICO等[28]在OLIVECRONA等[29]提出的Agent網(wǎng)絡基礎上,優(yōu)化了分子線性輸入規(guī)范(simplified molecular input line entry system,SMILES)生成算法,通過對神經(jīng)氨酸酶、乙酰膽堿酯酶、SARS-CoV-2主要蛋白酶以及所對應的化學庫進行研究,利用AI技術多目標優(yōu)化了生成的化合物,為藥物設計提供了一個效率更高更透明的框架。TANG等[30]利用高深度Q-learning網(wǎng)絡和基于片段的藥物設計,根據(jù)SARS-CoV-2的3CLpro靶點,自動生成靶向3CLpro的新化合物得到一個有效的先導化合物庫,再通過AI模型進行功能評分,篩選出最優(yōu)結構的化合物。
多項研究表明,在藥物分子設計的步驟流程中,聯(lián)用AI 技術和分子模擬的方法已經(jīng)成為藥物設計中重要的組成部分。AI 技術可以根據(jù)學習到的實驗信息不斷提出可以被驗證的有效的假設,有效地預測潛在的生物活性化合物,2種方法聯(lián)用比使用傳統(tǒng)計算機模擬進行藥物設計成本更低,效率更高。
藥物在供臨床使用前,需要制備符合給藥途徑的劑型,發(fā)揮最大的作用和療效。合適的藥物劑型可以促進藥物在人體內的吸收和分布,降低藥物的毒副作用等。通過整合分子模擬、AI、化學信息學等技術,能夠成功預測重要的藥物目標,提供可靠的關于藥物與載體交互的信息,選擇最佳的藥物-載體[31-33]。
5.1藥物粒子設計 藥物粉體的功能性質與粒子結構有關[34],可以通過粒子設計原理控制制備工藝參數(shù)得到重組粒子,實現(xiàn)粒子的功能設計。利用分子模擬技術模擬粒子與輔料之間的結合過程,得到參數(shù)反饋給AI 神經(jīng)網(wǎng)絡進行機器學習,優(yōu)化工藝過程參數(shù),篩選出最適合的藥物和輔料。粉體的粒子設計技術主要結合方式見圖3。
圖3 不同粉體粒子設計的表面結合作用
HATHOUT等[35]利用高斯過程模擬聚乳酸-羥基乙酸共聚物[poly(lactic-co-glycolic acid),PLGA]納米粒子的組成和理化性質描述符,推導出最優(yōu)參數(shù),選用阿司匹林和白藜蘆醇作為測試藥物,將實驗所測得的結合能與預測的結合能作對比,計算的百分比偏差為(12.38±2.10)%。WHITELAM等[36]通過研究粒子表面分子自組裝的粗粒度計算模型證明神經(jīng)進化學習算法可以識別材料粒子的自組裝性能,能夠定向設計所需特性的材料。
ALEXIADIS等[37]將“粒子”的概念進一步擴展,把人工神經(jīng)元抽象為“粒子”,產(chǎn)生了一種新的“粒子神經(jīng)元對偶”的AI 計算方法,這種算法兼顧了計算對粒子的建模能力和對數(shù)據(jù)的學習能力,通過對腸道膜和內容物的力學建模,成功地模擬出腸道的蠕動過程,為以后驗證藥物的活性提供了新的方法和思路。
5.2凝膠 水凝膠能夠容納小分子、聚合物等材料,具有生物相容性好、可降解等特點,是一種廣受關注的制劑類型[38]。水凝膠交聯(lián)分為物理交聯(lián)和化學交聯(lián)2種,通?;瘜W交聯(lián)更為緊密,見圖4。
圖4 水凝膠交聯(lián)方式示意圖
MOUHTADY等[39]提供了一種AI分析新策略,通過主成分分析法評估了35種不同水凝膠的吸附性能,根據(jù)不同使用場景篩選出不同的最適凝膠類型。LI等[40]利用分子模擬研究聚(N-異丙基丙烯酰胺)凝膠的相變機制,分析模擬數(shù)據(jù),發(fā)現(xiàn)這種多孔凝膠溶脹性能與交聯(lián)劑聚乙二醇呈正相關,適合充當藥物制劑中的釋放劑。WANG等[41]利用多功能水凝膠對慢性創(chuàng)面進行智能監(jiān)測,根據(jù)卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN)進行的高精度傷口模型,分析出傷口的實時狀態(tài)。
通過AI篩選、分子模擬分析數(shù)據(jù)得到最優(yōu)性能的材料和最適合的使用方法,這種多功能水凝膠和AI 的新型組合治療模式,為未來在對疾病的治療、反應和實時報告提供了重要的方法,是治療方式的一大進步。
5.3膠束 膠束是以表面活性劑或兩親性高分子在水中自組裝形成的藥物載體材料[42],具有靶向性好、生物相容性高和毒副作用小等特點,是有效的基因藥物載體。膠束又分為膠束和反膠束,見圖5。
圖5 載藥膠束結構
RAO等[43]利用計算機分析擬合的膠束化學模型,研究了Co(II)、Ni(II)、Cu(II) 和 Zn(II) 與L-天冬氨酸在不同pH膠束介質中的形態(tài),并通過計算機程序解釋了不同二元復合物在膠束中的穩(wěn)定性常數(shù)及其與介質摩爾分數(shù)的變化關系。TANG等[44]用聚乙二醇基反膠束研究活性染料在非水性介質的性能,并通過計算機配色進行分析,建立了校準染色數(shù)據(jù)庫。LIU等[45]提出了一種用于評估膠束電動毛細管色譜分離質量的方法——Q方法,該方法使用ANN模擬和優(yōu)化分離的選擇性和色譜分析時間,對ANN進行訓練,并與傳統(tǒng)方法所得結果進行對比分析,建立了一套新的評價標準。實驗證明[46],這套標準也適用于其他的分離方法。
通過將AI分子模擬技術與實驗設計相結合,不斷地完善對膠束的研究,能夠有效篩選或制備出最適合的聚合物膠束,解決了膠束不穩(wěn)定、載藥量低等缺點帶來的問題。
5.4脂質體 脂質體是一種將藥物包封在類脂雙分子層內形成的囊泡[47]。藥物脂質載體結構見圖6。
圖6 脂質體結構
但脂質體存在包封率低、不穩(wěn)定等缺點。ROUCO等[48]利用FormRules?v4.03 和INForm?v5.01 AI 軟件對負載疏水性藥物的納米脂質體模型進行充分表征得到相關參數(shù)并進行優(yōu)化,成功地對數(shù)據(jù)庫建模,獲得了一種可重復的、穩(wěn)定的納米脂質體合成方法。HATHOUT等[49]利用分子模擬和高斯過程機器學習模擬和預測固體脂質納米顆粒的載藥情況,再通過姜黃素固體脂質顆粒進行實驗驗證AI 和分子模擬技術預測的準確性,并使用高斯過程分析數(shù)據(jù),不斷優(yōu)化分子模擬過程。METWALLY等[50]先通過分子模擬技術構建出包含三棕櫚素的脂質納米顆粒模型,研究藥物與不同聚合物系統(tǒng)的相互作用,所得的結果通過姜黃素作為模型藥物進行實驗驗證,再使用AI 神經(jīng)網(wǎng)絡篩選確定對藥物負荷的影響因素,對藥物載體和藥物的結合進行優(yōu)化。
通過對藥物合成、分子模擬過程、藥物與載體結合不斷優(yōu)化,能夠有效地提高脂質體穩(wěn)定性和包封率,在增強療效、降低毒副作用的同時又減小了實驗成本。
AI與分子模擬技術在脂質體方面的應用相對較多[51-54],數(shù)據(jù)庫種類較為齊全,是未來最具有發(fā)展?jié)摿Φ囊环N藥物載體之一。
AI與分子模擬技術改變了藥物研發(fā)的方式,大大降低了藥物設計的成本,提高了藥物研發(fā)的效率。計算機輔助藥物設計的快速發(fā)展預示著藥學研究開始進入分子水平的精準藥物設計時代。但生物醫(yī)藥領域的復雜性高,藥物相關數(shù)據(jù)類型多樣,對各種化合物的表征預測數(shù)據(jù)較為匱乏,國際上AI 藥物設計也處于初級階段。隨著計算機算法與計算能力的不斷提高,AI 技術所構建的數(shù)據(jù)庫不斷完善,未來對藥物設計研究中質量和效率的把控更加準確,開發(fā)出安全有效、精準治療的最適合患者的藥物,是藥物研發(fā)從CADD向AIDD轉變的最重要的環(huán)節(jié)。