廖俊,徐潔潔,皮志鵬,竇智揚(yáng),尚靖
(1.中國(guó)藥科大學(xué)理學(xué)院,江蘇 南京211198;2.中國(guó)藥科大學(xué)中藥學(xué)院,江蘇 南京211198)
藥物研發(fā)過(guò)程主要包括藥物靶點(diǎn)確定、先導(dǎo)化合物的發(fā)現(xiàn)與優(yōu)化、候選藥物確定、臨床前研究和臨床研究[1]。整個(gè)藥物研發(fā)進(jìn)程,就是在驗(yàn)證某個(gè)靶點(diǎn)在人體中的生物學(xué)功能的過(guò)程。而藥物靶點(diǎn)的缺乏、動(dòng)物模型臨床轉(zhuǎn)化差、疾病異質(zhì)性及生物系統(tǒng)內(nèi)在的復(fù)雜性等問(wèn)題,使得藥物研發(fā)成為一個(gè)漫長(zhǎng)而又艱難的過(guò)程。開發(fā)一種新型處方藥,平均稅前支出約為25.58億美元[2],大約需要10 ~ 15年。盡管投入成本高,但在藥物研發(fā)過(guò)程中創(chuàng)新小分子的臨床批準(zhǔn)成功率卻只有13%,失敗的風(fēng)險(xiǎn)相對(duì)較高。早期藥物發(fā)現(xiàn)主要基于經(jīng)驗(yàn)嘗試,化合物篩選以及偶然發(fā)現(xiàn)獲得。在現(xiàn)代藥物研發(fā)中,機(jī)器學(xué)習(xí)在定量結(jié)構(gòu)-活性關(guān)系(quantitative structure activity relationship,QSAR)模型[3]、定量結(jié)構(gòu)-性質(zhì)關(guān)系(quantitative structure property relationship,QSPR)模型[4]等方面發(fā)揮重要作用。不同于傳統(tǒng)的機(jī)器學(xué)習(xí)方法使用手動(dòng)設(shè)計(jì)的特征,最新的深度學(xué)習(xí)(deep learning,DL)方法可以自動(dòng)從輸入數(shù)據(jù)中學(xué)習(xí)特征,通過(guò)多層特征提取將低層特征轉(zhuǎn)換為高層特征。由于其強(qiáng)大的泛化和特征提取能力,將其應(yīng)用在藥物開發(fā)的不同環(huán)節(jié),包括蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測(cè)、藥物代謝動(dòng)力學(xué)性質(zhì)預(yù)測(cè)、藥物有效性及安全性預(yù)測(cè)以及藥物相互作用預(yù)測(cè)等,顯示出巨大的前景。本綜述回顧了近幾年來(lái)DL在藥物研發(fā)中的應(yīng)用,并對(duì)當(dāng)前問(wèn)題提出建議以及展望。
DL的概念由Hinton等[5]于2006年提出,其概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。DL的結(jié)構(gòu)是一種含多隱層的多層感知器結(jié)構(gòu),其通過(guò)組合底層特征形成更加抽象的高層來(lái)表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。DL理論中包含了許多不同的深度神經(jīng)網(wǎng)絡(luò)模型,例如經(jīng)典的深層神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)、深層置信網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、深層玻爾茲曼機(jī)(deep boltzmann machines,DBM)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)等。不同結(jié)構(gòu)的網(wǎng)絡(luò)適用于處理不同的數(shù)據(jù)類型,例如CNN適用于圖像處理,RNN適用于語(yǔ)音識(shí)別等。同時(shí),通過(guò)與不同算法的聯(lián)用這些網(wǎng)絡(luò)模型還會(huì)產(chǎn)生一些不同的變種。
目前正處在醫(yī)藥產(chǎn)業(yè)發(fā)展的關(guān)鍵節(jié)點(diǎn),由于新藥物靶點(diǎn)和作用機(jī)制的發(fā)現(xiàn)越來(lái)越難,新藥研發(fā)需要投入更多的資金和精力。提升研發(fā)效率和深度挖掘已有數(shù)據(jù)來(lái)發(fā)現(xiàn)新的規(guī)律是解決該問(wèn)題的有效途徑之一,而DL在這2個(gè)方面都可以有廣泛的應(yīng)用,因此許多制藥公司和藥物研發(fā)機(jī)構(gòu)都將DL方法用于輔助藥物研發(fā)。例如:Berg公司基于人工智能的Interrogative Biology平臺(tái)技術(shù)[6]通過(guò)分析海量病人和正常人樣本(如蛋白相互作用網(wǎng)絡(luò))來(lái)尋找治療疾病的新靶點(diǎn)和診斷疾病的生物標(biāo)志物,以Berg公司進(jìn)行腫瘤藥物研究為例,通過(guò)收集大量生物樣本,如血液、腫瘤組織或腫瘤患者的尿液,同時(shí)也收集捐助者的健康組織樣本。研究人員會(huì)創(chuàng)建細(xì)胞株,然后將其放進(jìn)不同的模擬患者發(fā)病時(shí)的實(shí)際狀態(tài)環(huán)境下進(jìn)行觀察,有比如低氧環(huán)境,高血糖患者細(xì)胞及腫瘤細(xì)胞喜歡生活的環(huán)境。細(xì)胞株建立之后,對(duì)其中的基因、蛋白質(zhì)、代謝物和脂肪進(jìn)行標(biāo)識(shí)并形成節(jié)點(diǎn),不同節(jié)點(diǎn)的重要程度不同,重要程度越高與疾病的關(guān)聯(lián)越大。Narain等[7]曾基于此平臺(tái)介導(dǎo)發(fā)現(xiàn)胰腺癌的檢測(cè)、分層和預(yù)后的分子標(biāo)記; IBM Watson為IBM旗下的認(rèn)知計(jì)算系統(tǒng),技術(shù)平臺(tái)。認(rèn)知計(jì)算代表一種全新的計(jì)算模式,它包含信息分析,自然語(yǔ)言處理和機(jī)器學(xué)習(xí)領(lǐng)域的大量技術(shù)創(chuàng)新。該新藥發(fā)現(xiàn)系統(tǒng)[8]通過(guò)自然語(yǔ)言處理技術(shù)分析海量文獻(xiàn),尋找潛在的關(guān)聯(lián)性來(lái)預(yù)測(cè)新的假說(shuō)推動(dòng)新藥研發(fā);Engine Biosciences[9],也是利用人工智能技術(shù)來(lái)進(jìn)行老藥新用、新靶點(diǎn)開發(fā)以及精準(zhǔn)醫(yī)療等服務(wù)的互聯(lián)網(wǎng)產(chǎn)品。圖1列舉了目前DL在藥物研發(fā)不同階段已經(jīng)取得成果的相關(guān)應(yīng)用。
蛋白質(zhì)的功能研究在生命科學(xué)中占據(jù)重要的地位,大多數(shù)疾病的發(fā)生都與蛋白質(zhì)功能障礙有關(guān)。1973年,An finsen[10]發(fā)現(xiàn)變性的只保留了一級(jí)結(jié)構(gòu)的核糖核酸酶可以重新折疊并恢復(fù)生物活性,說(shuō)明代表蛋白質(zhì)一級(jí)結(jié)構(gòu)的氨基酸序列中隱含了蛋白質(zhì)二級(jí)、三級(jí)結(jié)構(gòu)的信息。而蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)又可為蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)和蛋白質(zhì)功能預(yù)測(cè)提供重要信息。因此從一級(jí)氨基酸序列預(yù)測(cè)二級(jí)結(jié)構(gòu)及蛋白質(zhì)的性質(zhì)是藥物研發(fā)中的重要任務(wù)。表1簡(jiǎn)要列舉了DL在蛋白質(zhì)結(jié)構(gòu)和功能預(yù)測(cè)中的應(yīng)用。
盡管近年來(lái)X-射線晶體學(xué)和冷凍電鏡技術(shù)的不斷發(fā)展在蛋白質(zhì)結(jié)構(gòu)解析上獲得突破,但其檢測(cè)蛋白質(zhì)的成本過(guò)高,利用DL對(duì)蛋白質(zhì)進(jìn)行預(yù)測(cè)顯然是一個(gè)更高效的方法。通過(guò)對(duì)數(shù)據(jù)庫(kù)提供的蛋白質(zhì)數(shù)據(jù)特征提取,預(yù)測(cè)出蛋白質(zhì)結(jié)構(gòu)與功能,為解決蛋白質(zhì)結(jié)構(gòu)和功能的預(yù)測(cè)問(wèn)題提供了可能的途徑,并在蛋白質(zhì)結(jié)構(gòu)和功能預(yù)測(cè)方面取得了較好的結(jié)果。
藥物靶點(diǎn)與疾病或生物分子的病理狀態(tài)相關(guān),藥物靶點(diǎn)的確定是藥物研究和開發(fā)的基礎(chǔ)。傳統(tǒng)的藥物發(fā)現(xiàn)主要遵循“一種藥物,一種靶點(diǎn),一種疾病”的觀念,最近越來(lái)越多的研究人員接受了藥物靶點(diǎn)是多種靶蛋白的觀點(diǎn)[15-16],并且多種靶蛋白傾向于出現(xiàn)在同一種疾病中[17]。因此,如何快速準(zhǔn)確地識(shí)別藥物與靶點(diǎn)之間復(fù)雜的相互作用已成為藥物開發(fā)的關(guān)鍵。
Pu等[18]采用CNN訓(xùn)練檢測(cè)和分類核苷酸與血紅素結(jié)合位點(diǎn),準(zhǔn)確度達(dá)到了95%,且實(shí)驗(yàn)?zāi)P湍軌蛲茝V到類固醇結(jié)合蛋白和肽酶。Hamanaka等[19]提出的DL模型在檢測(cè)藥物活性靶點(diǎn)時(shí)可以在保證98.2%的準(zhǔn)確率的情況下對(duì)400萬(wàn)個(gè)數(shù)據(jù)進(jìn)行計(jì)算。Wen等[20]首先對(duì)未處理的原始數(shù)據(jù)進(jìn)行預(yù)處理,標(biāo)記出已知的藥物靶點(diǎn)相互作用,然后應(yīng)用已知的標(biāo)記過(guò)的藥物靶點(diǎn)對(duì)來(lái)訓(xùn)練分類模型,該模型的10-折交叉驗(yàn)證的曲線下面積(area under curve,AUC)得分為0.915 8±0.005 9,該得分越趨近于1則說(shuō)明效果越好,該模型可進(jìn)一步用于預(yù)測(cè)新靶點(diǎn)。
表1 深度學(xué)習(xí)在蛋白質(zhì)結(jié)構(gòu)和功能預(yù)測(cè)中的應(yīng)用Table 1 Application of DL in the prediction of protein structure and function
Tian等[21]通過(guò)分層抽象學(xué)習(xí)藥物靶點(diǎn)對(duì)的有用特征,在平衡和不平衡數(shù)據(jù)集(平衡數(shù)據(jù)集是指各個(gè)樣本數(shù)量差距不大,而不平衡數(shù)據(jù)集則相反,在一些模型中數(shù)據(jù)集是否平衡對(duì)預(yù)測(cè)結(jié)果有著不同影響)上的預(yù)測(cè)性能均比現(xiàn)有方法更好。Tsubaki等[22]結(jié)合化合物的圖形神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)和蛋白質(zhì)的CNN開發(fā)了新的復(fù)合蛋白相互作用預(yù)測(cè)技術(shù)。此外,所提出的方法在不平衡數(shù)據(jù)集上明顯優(yōu)于現(xiàn)有方法。這表明由端到端GNN和CNN獲得的化合物和蛋白質(zhì)的數(shù)據(jù)驅(qū)動(dòng)表示比從數(shù)據(jù)庫(kù)獲得的傳統(tǒng)化學(xué)和生物學(xué)特征更穩(wěn)健。Zong等[23]采用DL算法DeepWalk基于異構(gòu)拓?fù)溆?jì)算藥物-藥物和靶點(diǎn)-靶點(diǎn)的相似性,基于“牽連犯罪”原則推斷藥物靶點(diǎn)關(guān)聯(lián),AUC得分為0.989 6。
Xie等[24]基于藥物干擾和基因敲除試驗(yàn)收集的藥物和藥物對(duì),靶點(diǎn)和靶點(diǎn)對(duì)的相似性數(shù)據(jù)庫(kù)L1 000中的轉(zhuǎn)錄組數(shù)據(jù)提出了活性藥物靶點(diǎn)的確定(drug target identi fication,DTI) 預(yù) 測(cè) 框 架,訓(xùn)練集達(dá)到98%以上的準(zhǔn)確率,驗(yàn)證集準(zhǔn)確率為90.53%±1.44%。同時(shí)使用其他DTI數(shù)據(jù)庫(kù)如STITCH、 DGIdb以及CTD驗(yàn)證了模型預(yù)測(cè)新DTI的能力,均取得較好的結(jié)果。
計(jì)算機(jī)在處理復(fù)雜運(yùn)算方面具有天然優(yōu)勢(shì),而DL可以進(jìn)一步發(fā)現(xiàn)對(duì)象之間的隱性聯(lián)系。DL的方法應(yīng)用于復(fù)雜的藥物與多靶點(diǎn)作用問(wèn)題,通過(guò)合適的網(wǎng)絡(luò)模型得到潛在靶點(diǎn),將大大提高藥物靶點(diǎn)研究的效率。
藥物代謝動(dòng)力學(xué)(pharmacokinetics,PK)分析是藥物研發(fā)過(guò)程的重要組成部分,調(diào)查顯示大約一半的候選藥物由于PK性質(zhì)或毒性不令人滿意而無(wú)法進(jìn)入市場(chǎng)[25]。DL正是PK分析的一項(xiàng)重要技術(shù)手段。
圖2分別從藥物的吸收、分布、代謝與毒性幾個(gè)方面舉例了DL應(yīng)用。以PK的關(guān)鍵性質(zhì)之一水溶性為例,藥物的水溶性將直接影響化合物在生物體中的吸收。Li等[26]建立了基于半監(jiān)督學(xué)習(xí)模型的多層深度信念網(wǎng)絡(luò)( deep belief network,DBN)來(lái)預(yù)測(cè)化合物的水溶性,準(zhǔn)確率達(dá)到85.9%。不只是吸收分布的PK性質(zhì),候選藥物的代謝毒性也是其后續(xù)能否成藥的關(guān)鍵因素。分析1 824種美國(guó)FDA批準(zhǔn)的藥物,其中29.6%的藥物經(jīng)計(jì)算確定具有潛在的hERG(human ether-à-go-go-related gene)抑制活性,突出了hERG風(fēng)險(xiǎn)評(píng)估在早期藥物發(fā)現(xiàn)中的重要性。為了在藥物發(fā)現(xiàn)階段和上市后監(jiān)測(cè)中對(duì)hERG介導(dǎo)的心臟毒性進(jìn)行風(fēng)險(xiǎn)評(píng)估,Cai等[27]開發(fā)了一種DNN模型用于預(yù)測(cè)藥物發(fā)現(xiàn)和上市后監(jiān)測(cè)過(guò)程中小分子的hERG阻滯劑。在驗(yàn)證集中,最佳模型的AUC為0.967。
DL為以傳統(tǒng)模型為基礎(chǔ)的PK分析帶來(lái)了新的模型以及新的分析方式,并且就特定的問(wèn)題給出了更為精確的答案。
當(dāng)藥物與另一種藥物共同服用時(shí),此藥物的預(yù)期功效可以發(fā)生顯著改變。因此,了解DDI對(duì)于減少意外的不良藥物事件(adverse drug event,ADE)的發(fā)生以及在治療疾病時(shí)產(chǎn)生最大化協(xié)同效益至關(guān)重要。另外由DDI引起的ADR是藥物退出市場(chǎng)的主要原因之一[28]。隨著用于疾病治療的多種藥物(至少2種藥物)的處方數(shù)量持續(xù)增加,了解DDI的意義越來(lái)越大。探索用于檢測(cè)相互作用藥物的大量藥物組合的最實(shí)用方法是通過(guò)計(jì)算機(jī)DDI檢測(cè)。
雖然一些已知的DDI可以在專門建立的數(shù)據(jù)庫(kù)中找到,但大多數(shù)信息仍然埋藏在文獻(xiàn)中。因此,迫切需要從生物醫(yī)學(xué)文本中自動(dòng)提取DDI。為了檢驗(yàn)僅使用字嵌入作為輸入特征的CNN是否可以成功應(yīng)用于生物醫(yī)學(xué)文本中的DDI分類,Suárez-Paniagua等[29]提出僅具有一個(gè)隱藏層的CNN架構(gòu),使得模型在計(jì)算上更有效。Jari等[30]使用CNN同時(shí)提取事件和關(guān)系,與不同的向量空間嵌入一起應(yīng)用于各種文本分類任務(wù)。Zhao等[31]提出語(yǔ)法卷積神經(jīng)網(wǎng)絡(luò)(syntax convolutional neural network ,SCNN),基于單詞嵌入、語(yǔ)法單詞嵌入來(lái)使用句子的句法信息,引入位置和詞性特征以擴(kuò)展每個(gè)單詞的嵌入,引入自動(dòng)編碼器來(lái)編碼傳統(tǒng)的特征文本詞袋(稀疏0-1向量)作為全連接向量。
除CNN外RNN也常用于生物醫(yī)學(xué)關(guān)系提取,Zhang等[32]基于候選句子的依賴圖生成最短依賴路徑(shortest dependent path,SDP),將SDP劃分為依賴詞序列和關(guān)系序列。RNN和CNN分別用于自動(dòng)學(xué)習(xí)句子序列和依賴序列的特征。最后,將RNN和CNN的輸出特征結(jié)合起來(lái)檢測(cè)和提取生物醫(yī)學(xué)關(guān)系。
Sahu等[33]提出了3種長(zhǎng)短時(shí)記憶模型(long short-term memory,LSTM)網(wǎng)絡(luò)模型,即雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(bi-directional long short-term memory,Bi-LSTM),基于Attention模型的Bi-LSTM(attention based bi-directional long short-term memory,AB-LSTM)和基于聯(lián)合模型的AB-LSTM(joint attention based bi-directional long short-term memory,joint AB-LSTM)。這3種模型都使用文字和位置嵌入作為潛在特征。此外,使用Bi-LSTM網(wǎng)絡(luò)允許從整個(gè)句子中提取隱含特征。2個(gè)模型AB-LSTM和joint AB-LSTM也在Bi-LSTM層輸出中應(yīng)用注意池,以便為特征分配權(quán)重。
Song等[34]利用支持向量機(jī)模型(support vector machine,SVM)建立了一個(gè)機(jī)器學(xué)習(xí)模型。所建立的相似性測(cè)度包括二維分子結(jié)構(gòu)相似性、三維結(jié)構(gòu)相似度、相互作用指紋圖譜相似性、靶標(biāo)相似性和ADE相似性。根據(jù)所建立的5種相似性度量方法,將已知有作用的藥物和可能有作用的藥物進(jìn)行處理,使結(jié)構(gòu)以數(shù)據(jù)形式表示,并將處理結(jié)果作為SVM的輸入向量。SVM模型建立的思路以及所用數(shù)據(jù)庫(kù)如圖3所示。最終,此SVM模型預(yù)測(cè)準(zhǔn)確率達(dá)到0.97,遠(yuǎn)高于之前的DDI模型。
ADR是一個(gè)嚴(yán)重的問(wèn)題,即盡管給予常規(guī)劑量的藥物,但仍會(huì)出現(xiàn)不良反應(yīng)。據(jù)估計(jì),住院患者中有超過(guò)200萬(wàn)例發(fā)生嚴(yán)重ADR,每年導(dǎo)致大于 100 000例患者死亡[35]。因此識(shí)別或預(yù)測(cè)潛在的ADR顯得尤為重要,表2介紹了4個(gè)DL在ADR方面的應(yīng)用,并對(duì)各自的結(jié)果進(jìn)行了簡(jiǎn)要評(píng)價(jià)。
表2 深度學(xué)習(xí)在ADR中的應(yīng)用Table 2 Application of DL in the prediction of ADR
DL幫助科研人員從龐大復(fù)雜的ADR報(bào)告中篩選并識(shí)別了可能具有臨床價(jià)值的ADR,輔助藥物的應(yīng)用并且可能會(huì)揭示未知的藥物代謝途徑。
人工智能通過(guò)分析海量的文獻(xiàn)、專利和臨床結(jié)果,找出潛在的、被忽視的通路、蛋白和機(jī)制等與疾病的相關(guān)性,從而提出新的可供測(cè)試的假說(shuō),通過(guò)實(shí)驗(yàn)驗(yàn)證已經(jīng)取得一定的成果,并顯著提高新藥研發(fā)流程中某些階段的效率。值得注意的是,DL提供了一種新的方法來(lái)探索基因組變異與藥物基因組學(xué)研究中的多種事件之間的復(fù)雜關(guān)聯(lián),為全基因組關(guān)聯(lián)分析的數(shù)據(jù)復(fù)雜性提供有效的解決方案。但是目前DL并不能直接預(yù)測(cè)一個(gè)化合物能否成為藥物,DL在發(fā)現(xiàn)藥物研發(fā)新機(jī)制和新靶點(diǎn)上的突破仍然面臨以下挑戰(zhàn):
1)基于大數(shù)據(jù)的人工智能,擅長(zhǎng)的是對(duì)已有知識(shí)的挖掘、重新組織和分配,為DL算法提供大量數(shù)據(jù),并且將需要解決的問(wèn)題正確地呈現(xiàn)出來(lái),它們才有可能捕捉到人類無(wú)法捕捉到的規(guī)律,在海量的數(shù)據(jù)中尋找已有知識(shí)的關(guān)聯(lián)性。在新藥研發(fā)過(guò)程中,新藥研發(fā)規(guī)則不明確,數(shù)據(jù)不明晰甚至含有錯(cuò)誤信息,而且充滿了高度不確定性等問(wèn)題,給以高質(zhì)量標(biāo)識(shí)數(shù)據(jù)集為基礎(chǔ)的DL人工智能帶來(lái)巨大的挑戰(zhàn);
2)DL依賴于高質(zhì)量、有標(biāo)識(shí)的大數(shù)據(jù)集。例如:Santos等[39]統(tǒng)計(jì)了美國(guó)FDA批準(zhǔn)的1 578個(gè)藥物總共的靶點(diǎn)數(shù)目是667個(gè),而Ensembl數(shù)據(jù)庫(kù)標(biāo)注的潛在藥物靶點(diǎn)就有4 479個(gè),藥物靶點(diǎn)數(shù)據(jù)庫(kù)(therapeutic target database,TTD)含有2 360個(gè)可成為藥物靶點(diǎn)的分子信息,包括388個(gè)已有相應(yīng)藥物上市的、461個(gè)處于臨床試驗(yàn)階段的以及其他正在研究的和已停止研究的藥物的靶點(diǎn)信息,由于數(shù)據(jù)庫(kù)涵蓋面不同,信息來(lái)源亦不同,導(dǎo)致有實(shí)驗(yàn)支持的信息和預(yù)測(cè)的信息混雜在一起,藥物和靶點(diǎn)的命名也未采用統(tǒng)一規(guī)則,如何整合成DL依賴的靶點(diǎn)數(shù)據(jù)是關(guān)鍵;
3)DL是非常出色的算法工具,能夠?qū)W習(xí)數(shù)據(jù),但無(wú)法判斷數(shù)據(jù)準(zhǔn)確性,尤其是遇到不常見(jiàn)的情況時(shí),它缺乏靈活性,表現(xiàn)并不算好。同時(shí)存在無(wú)法修正學(xué)習(xí)結(jié)果,除非重新訓(xùn)練的問(wèn)題;
4)DL的內(nèi)部機(jī)制一直是困擾現(xiàn)今科學(xué)家的難題,DL是一個(gè)“黑箱”,藥物在人體中作用的機(jī)制是另一個(gè)“黑箱”。通過(guò)DL研究藥理問(wèn)題被視為用一個(gè)“黑箱”代替另一個(gè)“黑箱”,也就是說(shuō)DL并沒(méi)有實(shí)際解決藥物機(jī)制這一重大難題。即DL僅展示了可能的結(jié)果,而沒(méi)找到真正的因果關(guān)系;
5)DL的評(píng)價(jià)機(jī)制仍然存在欠缺。DL具備發(fā)現(xiàn)隱藏在復(fù)雜的生物系統(tǒng)下的各種關(guān)系的能力,幫助藥物研發(fā)找到了一個(gè)模型來(lái)解釋生物復(fù)雜系統(tǒng)中發(fā)生的事情,但模型預(yù)測(cè)結(jié)果依然需要實(shí)驗(yàn)驗(yàn)證。如何用少量合適的實(shí)驗(yàn)使得藥物研發(fā)人員進(jìn)行有效驗(yàn)證和評(píng)價(jià)DL的結(jié)果是一個(gè)待解決的問(wèn)題。
綜上,面對(duì)藥物研發(fā)需要解決的問(wèn)題的多樣性,也需要有更為靈活和細(xì)致入微的思考方式,構(gòu)建適合藥物研發(fā)各階段的特殊DL模型,并且將這些模型整合才能在未來(lái)實(shí)現(xiàn)智能的藥物研發(fā)。