亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于結(jié)構(gòu)特征的藥物靶點(diǎn)親和力預(yù)測

        2024-06-03 00:00:00邵允昶張媛媛江明建
        現(xiàn)代信息科技 2024年5期
        關(guān)鍵詞:深度學(xué)習(xí)人工智能

        收稿日期:2023-08-24

        DOI:10.19850/j.cnki.2096-4706.2024.05.035

        摘" 要:預(yù)測藥物與其靶向蛋白的結(jié)合親和力是研發(fā)新藥的關(guān)鍵步驟。傳統(tǒng)的濕實(shí)驗(yàn)耗時長,成本高。隨著人工智能技術(shù)的快速發(fā)展,在藥物篩選階段應(yīng)用深度學(xué)習(xí)的技術(shù)可以大幅度提升研發(fā)效率。針對上述問題,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)預(yù)測藥物靶點(diǎn)親和力的方法。將蛋白質(zhì)和小分子的結(jié)構(gòu)特征分別轉(zhuǎn)換成對應(yīng)的三維矩陣,送入對應(yīng)的三維卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,然后再通過若干層全連接神經(jīng)網(wǎng)絡(luò)提取特征值,得到最終的親和力值。實(shí)驗(yàn)結(jié)果表明,該模型可有效地預(yù)測藥物靶點(diǎn)親和力,具有良好的應(yīng)用前景。

        關(guān)鍵詞:人工智能;深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);蛋白質(zhì)結(jié)構(gòu);藥物靶點(diǎn)親和力預(yù)測

        中圖分類號:TP39;T18" " 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2024)05-0162-05

        Prediction of Drug Target Binding Affinity Based on Structural Features

        SHAO Yunchang, ZHANG Yuanyuan, JIANG Mingjian

        (Qingdao University of Technology, Qingdao" 266520, China)

        Abstract: Predicting the binding affinity between drugs and their target proteins is a key steps in developing new drugs. Traditional wet experiments are time-consuming and expensive. With the rapid development of artificial intelligence technology, the application of Deep Learning technology in the drug screening phase has the potential to significantly enhance research and development efficiency. A method for predicting drug target binding affinity based on Convolutional Neural Networks is proposed to address the above issues. The structural features of proteins and small molecules are transformed into corresponding three-dimensional matrices, these matrices are fed into respective three-dimensional Convolutional Neural Networks for training. Then, feature values are extracted through several layers of fully connected neural networks to obtain the final binding affinity value. The experimental results indicate that the model can effectively predict the binding affinity of drug targets and has good application prospects.

        Keywords: Artificial Intelligence; Deep Learning; Convolutional Neural Networks; protein structure; prediction of drug target binding affinity

        0" 引" 言

        一款新藥物的研發(fā)需要投入大量的時間、昂貴的成本,且成功概率低。如在美國,新藥的研發(fā)大概需要投入26億美元[1],并且需要17年的時間才能獲得美國食品及藥物管理局(FDA)的批準(zhǔn)[2,3],因此找到一種新的方式來提升藥物研發(fā)的效率成為當(dāng)前的迫切需求。

        藥物靶點(diǎn)的相互作用是一種二元分類的問題,我們認(rèn)為藥物與靶點(diǎn)連續(xù)的親和力的值能夠更加直觀、準(zhǔn)確地反映出二者的結(jié)合程度,因此預(yù)測藥物與靶點(diǎn)的結(jié)合親和力是研發(fā)新藥的關(guān)鍵步驟,將結(jié)合親和力強(qiáng)的藥物靶點(diǎn)篩選出來進(jìn)行濕實(shí)驗(yàn),可大幅度提升研發(fā)效率。借助計(jì)算機(jī)來預(yù)測結(jié)合親和力成為當(dāng)前比較重要的一種方式。傳統(tǒng)的機(jī)器學(xué)習(xí)有RF-Score [4],其構(gòu)建完全依賴于數(shù)據(jù),借助非參數(shù)機(jī)器學(xué)習(xí)方法巧妙地規(guī)避了對存在問題的建模假設(shè)的需求。

        隨著進(jìn)入大數(shù)據(jù)時代以及計(jì)算機(jī)算力的高速發(fā)展,深度學(xué)習(xí)在圖像識別、自然語言處理等應(yīng)用中獲取了巨大成就,越來越多的方法也將藥物靶點(diǎn)親和力預(yù)測的問題用深度學(xué)習(xí)來處理。藥物小分子和蛋白質(zhì)分別都有兩種特征表達(dá)方式,一種是基于序列的特征,一種是基于結(jié)構(gòu)的特征?;谛蛄刑卣魈幚淼纳疃葘W(xué)習(xí)方法比較有代表性的是DeepDTA [5]、GraphDTA [6]。DeepDTA將蛋白質(zhì)序列和小分子的SMILES序列的字符分別用不同的數(shù)字表示,經(jīng)過嵌入層處理后,將小分子、蛋白質(zhì)分別送入相應(yīng)的一維卷積神經(jīng)網(wǎng)絡(luò)中訓(xùn)練,預(yù)測親和力值。GraphDTA根據(jù)小分子的特性首次將SMILES序列處理成圖的形式,并將小分子圖送入到圖神經(jīng)網(wǎng)絡(luò)中訓(xùn)練。比起基于序列特性的方法,基于結(jié)構(gòu)特性的方法在預(yù)測上往往更加準(zhǔn)確。如DeepSite [7]基于蛋白質(zhì)結(jié)構(gòu)的信息根據(jù)距離和體積重疊的方法進(jìn)行了蛋白質(zhì)配體結(jié)合位點(diǎn)的預(yù)測。KDEEP [8]使用DeepSite的思想并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)來預(yù)測藥物靶點(diǎn)結(jié)合親和力。

        在本文中,我們提出了一種新穎的基于蛋白質(zhì)和小分子結(jié)構(gòu)的方法來預(yù)測藥物靶點(diǎn)結(jié)合親和力。根據(jù)蛋白質(zhì)和小分子的結(jié)構(gòu)文件,分別將其網(wǎng)格化為兩個三維特征矩陣,再分別用兩個三維卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練兩個三維特征矩陣,最終得到結(jié)合親和力的值。實(shí)驗(yàn)結(jié)果表明我們提出的方法是可拓展、可優(yōu)化的,而且適用于任何已知三維結(jié)構(gòu)的蛋白質(zhì)和小分子。

        1" 處理方法

        本節(jié)介紹關(guān)于蛋白質(zhì)小分子特征處理方式。根據(jù)蛋白質(zhì)的.pdb文件和小分子的.sdf文件,我們可以獲取到蛋白質(zhì)和小分子的結(jié)構(gòu)特征信息,初始化分別代表蛋白質(zhì)和小分子的零矩陣,為了防止坐標(biāo)越界,蛋白質(zhì)或小分子零矩陣的大小根據(jù)數(shù)據(jù)集中蛋白質(zhì)或小分子坐標(biāo)的最大X軸值、Y軸值、Z軸值和最小X軸值、Y軸值、Z軸值的差值來定,具體內(nèi)容見小節(jié)4.2。通過小節(jié)1.1和小節(jié)1.2的方法分別將蛋白質(zhì)和小分子網(wǎng)格化成兩個三維矩陣,具體操作見圖1所示。

        1.1" 蛋白質(zhì)的表征方式

        根據(jù)蛋白質(zhì)的.pdb文件,我們使用Biopython獲取蛋白質(zhì)結(jié)構(gòu)信息。通過Biopython中提供的方法,遍歷蛋白質(zhì)的所有原子(atom),獲取到每個原子的三維坐標(biāo)信息、原子類型信息。根據(jù)原子的坐標(biāo)信息,我們獲取到X軸、Y軸以及Z軸的最小值(X,Y,Z),并以此為原點(diǎn)得到蛋白質(zhì)三維矩陣的坐標(biāo)。如原子用Biopython中atom.get_coord()方法獲取的坐標(biāo)為(X1,Y1,Z1),則在我們構(gòu)建的三維矩陣的坐標(biāo)為(X1-X,Y1-Y,Z1-Z),遍歷所有的蛋白質(zhì)原子,得到其在蛋白質(zhì)三維矩陣中的坐標(biāo)信息。三維矩陣的值是使用Biopython中的atom.element獲取原子類型,根據(jù)原子類型的不同,從1開始賦予不同的值,如{FE:1,NI:2,H:3},以此類推填寫初始化零矩陣的值。我們將得到的三維矩陣的尺寸縮小1 000倍,如若矩陣多個點(diǎn)合成一個,那么矩陣中的數(shù)值在縮小的過程中合并相加,得到最終的蛋白質(zhì)三維矩陣。

        1.2" 小分子的表征方式

        小分子的處理方式和1.1小節(jié)中蛋白質(zhì)處理的方式大致相同。根據(jù)小分子的.sdf文件來獲取小分子結(jié)構(gòu)的坐標(biāo)信息和類型信息。根據(jù)小分子的坐標(biāo)信息,我們獲取到X軸,Y軸以及Z軸的最小值(X,Y,Z),并以此為原點(diǎn)得到小分子三維矩陣的坐標(biāo)。如我們獲取的坐標(biāo)是(X2,Y2,Z2),則小分子的三維矩陣中的坐標(biāo)是(X2-X,Y2-Y,Z2-Z)。遍歷所有的小分子原子,得到其在小分子三維矩陣中的坐標(biāo)信息。三維矩陣的值根據(jù)原子類型的不同,從1開始賦予不同的值,如{Br:1,F(xiàn):2,C:3},以此類推填寫初始化零矩陣的值。我們將得到的三維矩陣的尺寸縮小8倍,矩陣中的數(shù)值與小節(jié)1.1中蛋白質(zhì)矩陣同樣的處理方式,得到最終的小分子三維矩陣。

        2" 神經(jīng)網(wǎng)絡(luò)

        小節(jié)1中我們介紹了關(guān)于結(jié)構(gòu)特征的處理方式,將蛋白質(zhì)和小分子結(jié)構(gòu)網(wǎng)格化,形成了兩個三維特征矩陣。這一節(jié)我們介紹處理兩個三維特征矩陣的神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),以及提取特征的步驟。我們將兩個三維特征矩陣分別送入對應(yīng)的三維卷積神經(jīng)網(wǎng)絡(luò)中提取特征,將獲得的特征平鋪后分別送入兩個全連接層進(jìn)一步提取特征,得到兩個分別代表蛋白質(zhì)和小分子的128維向量,將兩種向量進(jìn)一步融合為256維的向量,最后經(jīng)過全連接層得到一維的向量輸出值。2.1和2.2小節(jié)詳細(xì)介紹三維卷積神經(jīng)網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。具體的神經(jīng)網(wǎng)絡(luò)流程如圖2所示。

        2.1" 三維卷積神經(jīng)網(wǎng)絡(luò)

        首先使用三層三維卷積神經(jīng)網(wǎng)絡(luò)分別卷積蛋白質(zhì)的三維矩陣和小分子的三維矩陣。每層卷積神經(jīng)網(wǎng)絡(luò)的卷積核大小都是(3,3,3),為了防止矩陣邊緣信息在卷積過程中缺失,每層卷積神經(jīng)網(wǎng)絡(luò)我們都加大小為(2,2,2)的填充(padding),由于神經(jīng)網(wǎng)絡(luò)的輸入是一個蛋白質(zhì)矩陣或者小分子矩陣,所以第一層的三維卷積神經(jīng)網(wǎng)絡(luò)的輸入通道是1,輸出通道是16;第二層的三維卷積神經(jīng)網(wǎng)絡(luò)的輸入通道是16,輸出通道是32;第三層的三維卷積神經(jīng)網(wǎng)絡(luò)的輸入通道是32,輸出通道是1。為了特征提取更加精準(zhǔn),我們還引入了最大池化層(Maxpooling),池化層的卷積核為(2,2,2)。每層卷積后使用的激活函數(shù)是ReLU [9]。

        2.2" 全連接層

        經(jīng)過上述的三維卷積層后,我們得到了分別代表蛋白質(zhì)和小分子特征值,將特征值平鋪后我們將其分別送入兩個三層的全連接層。第一層將輸入的向量變?yōu)? 048維度,第二層由2 048維度變?yōu)? 024維度,第三層由1 024維度變?yōu)?28維度。激活函數(shù)使用的是ReLU,同時為了防止過擬合,我們還引入了Dropout層。至此我們獲得了分別代表蛋白質(zhì)和小分子的128維向量。將兩個128維向量融合成一個256維的特征向量送入下一個三層全連接層進(jìn)行訓(xùn)練,第一層特征向量由256維變成1 024維度,第二層由1 024維度變成512維度,最后一層得到的輸出是一個一維值,也就是我們所需要的親和力的特征表示。

        3" 數(shù)據(jù)集及衡量標(biāo)準(zhǔn)

        這一章節(jié)我們介紹實(shí)驗(yàn)所用到的數(shù)據(jù)集和衡量實(shí)驗(yàn)性能的公式。3.1小節(jié)介紹PDBbind數(shù)據(jù)集[10],3.2小節(jié)介紹了本文實(shí)驗(yàn)所使用的數(shù)據(jù)集劃分,3.3小節(jié)介紹我們對于實(shí)驗(yàn)所使用的衡量標(biāo)準(zhǔn)。

        3.1" PDBbind數(shù)據(jù)集的介紹

        PDBbind作為一個與蛋白質(zhì)-配體相互作用相關(guān)的數(shù)據(jù)庫,在測量解離常數(shù)(Kd)、抑制常數(shù)(Ki)或半濃度(IC50)等物理量以衡量相互作用強(qiáng)度的基礎(chǔ)上,為藥物設(shè)計(jì)、分子對接、虛擬篩選等計(jì)算生物學(xué)研究提供了必要的支持。在當(dāng)前研究中,PDBbind展現(xiàn)出其作為實(shí)驗(yàn)方法測試平臺的卓越選擇。PDBbind數(shù)據(jù)庫包含三個主要子集:通用集、精煉集和核心集。通用集包含大量蛋白質(zhì)-配體復(fù)合物數(shù)據(jù),囊括了多樣性的結(jié)構(gòu)與相互作用模式。該子集廣泛涵蓋多種復(fù)合物類型,為研究者提供多樣性數(shù)據(jù)樣本。精煉集是通用集的子集,經(jīng)過嚴(yán)格篩選以保留高質(zhì)量數(shù)據(jù),其所蘊(yùn)含的結(jié)構(gòu)與相互作用信息更為可靠。而核心集則是精煉集的更為精選子集,匯聚了代表性的蛋白質(zhì)-配體復(fù)合物數(shù)據(jù)。這些復(fù)合物在結(jié)構(gòu)生物學(xué)領(lǐng)域具備顯著的意義,能夠作為研究特定領(lǐng)域問題的基準(zhǔn)數(shù)據(jù)。

        3.2" 數(shù)據(jù)集的劃分

        在本文中我們進(jìn)行的實(shí)驗(yàn)使用到PDBbind2016。在PDBbind2016中精煉集包含4 057組數(shù)據(jù),核心集包含290組數(shù)據(jù),對于實(shí)驗(yàn)標(biāo)簽Kd、Ki、IC50,我們都根據(jù)Kd的處理方式,如式(1)所示。為了防止過擬合現(xiàn)象,我們要確保在訓(xùn)練集和測試集中不能出現(xiàn)同一組數(shù)據(jù),所以我們將在精煉集出現(xiàn)的核心集的數(shù)據(jù)全部刪除,得到3 767組數(shù)據(jù),將這3 767組數(shù)據(jù)作為實(shí)驗(yàn)的訓(xùn)練集,290組數(shù)據(jù)作為實(shí)驗(yàn)的測試集。

        (1)

        3.3" 衡量標(biāo)準(zhǔn)

        在本文中,我們使用了均方根誤差(RMSE),皮爾森相關(guān)系數(shù)(R),斯皮爾曼等級相關(guān)系數(shù)(Rs)來衡量我們的實(shí)驗(yàn)性能。以下是關(guān)于各個公式的詳細(xì)介紹。

        3.3.1" 均方根誤差RMSE

        RMSE用于衡量預(yù)測模型的性能,因此它的計(jì)算涉及預(yù)測值與實(shí)際觀測值之間的差異,RMSE的數(shù)值越小,說明模型的準(zhǔn)確率越高。RMSE的計(jì)算式如下:

        (2)

        式中n表示數(shù)據(jù)點(diǎn)的總數(shù);yi表示實(shí)際觀測值; 表示對應(yīng)的預(yù)測值。

        3.3.2" 皮爾森相關(guān)系數(shù)R

        皮爾森相關(guān)系數(shù)R被廣泛應(yīng)用于衡量兩個連續(xù)變量之間線性關(guān)系的強(qiáng)度和方向,其取值范圍被限制在-1到1之間。具體而言,當(dāng)R趨近于1時,暗示著兩變量之間存在著完全正向線性關(guān)系,即其中一個變量的增加伴隨著另一個變量的嚴(yán)格增加。相反地,當(dāng)R趨近于-1時,意味著兩個變量之間呈現(xiàn)明顯的負(fù)向線性關(guān)系,即一個變量的增加伴隨著另一個變量的嚴(yán)格減少。然而,當(dāng)R接近于0時,它表明兩變量之間的線性關(guān)系較為弱化,或者還存在其他可能的非線性關(guān)系。皮爾森相關(guān)系數(shù)在分析變量關(guān)聯(lián)性方面具有突出的價(jià)值,幫助研究者洞察變量之間的態(tài)勢與相互聯(lián)系,從而為更深入的分析提供了基礎(chǔ)。R的計(jì)算式如下:

        (3)

        式中xi和yi分別表示樣板第i個觀測值, 和" 分別表示x和y的均值。

        3.3.3" 斯皮爾曼等級相關(guān)系數(shù)Rs

        斯皮爾曼等級相關(guān)系數(shù)(Rs)是一項(xiàng)重要的統(tǒng)計(jì)工具,其用途在于測量兩個變量之間的關(guān)聯(lián)性。與先前提及的皮爾遜相關(guān)系數(shù)相異,Rs并不對變量間呈線性關(guān)系提出要求,而是以變量的等級或順序數(shù)據(jù)為基礎(chǔ)進(jìn)行分析。Rs的取值范圍界定于區(qū)間[-1,1]之內(nèi)。當(dāng)Rs等于1時,意味著存在著完全正相關(guān)關(guān)系,即兩變量的秩次排序完全一致;當(dāng)Rs趨近于0,則意味著變量之間缺乏顯著的秩次關(guān)聯(lián)性;而當(dāng)Rs為-1時,則指示出完全負(fù)相關(guān),揭示了兩變量秩次排序的完全逆序關(guān)系。不容忽視的是,斯皮爾曼等級相關(guān)系數(shù)不僅適用于分析非線性關(guān)系,還對數(shù)據(jù)集中存在離群值的情形表現(xiàn)出魯棒性。其所具有的尺度不變性使其能夠有效地克服數(shù)據(jù)尺度變換所引發(fā)的問題。如此特性使得Rs在解決無法滿足線性關(guān)系假設(shè)的問題時效果顯著。綜上所述,斯皮爾曼等級相關(guān)系數(shù)作為一種統(tǒng)計(jì)工具,應(yīng)用廣泛,主要用于測量變量之間的秩次關(guān)聯(lián)性。特別是在處理無法滿足線性關(guān)系假設(shè)的場景下,其優(yōu)越性愈加顯著。Rs的表示計(jì)算公式如下:

        (4)

        式中di表示每對數(shù)據(jù)點(diǎn)在兩個變量中的秩次差,n表示樣本數(shù)量。

        4" 實(shí)驗(yàn)及分析

        在小節(jié)3中我們介紹了關(guān)于本文的實(shí)驗(yàn)用到的數(shù)據(jù)集和衡量標(biāo)準(zhǔn),這一節(jié)我們運(yùn)用小節(jié)3的內(nèi)容進(jìn)行實(shí)驗(yàn)并且詳細(xì)介紹實(shí)驗(yàn)的操作步驟。

        4.1" 實(shí)驗(yàn)配置及其過程

        本實(shí)驗(yàn)基于Ubuntu操作系統(tǒng),數(shù)據(jù)集使用PDBbind2016。為了加快訓(xùn)練速度,我們采用顯卡(GPU)進(jìn)行訓(xùn)練。具體的配置如表1所示。

        表1" 關(guān)于本實(shí)驗(yàn)的各項(xiàng)配置

        參數(shù) 配置

        Epoch 50

        訓(xùn)練批次(Train Batch) 128

        測試批次(Test Batch) 128

        學(xué)習(xí)率 0.000 5

        優(yōu)化器(Optimizer) Adam

        損失函數(shù) MSELoss

        操作系統(tǒng) Ubuntu

        深度學(xué)習(xí)框架 PyTorch

        GPU NVIDIA GeForce RTX 4090

        首先我們需要將PDBbind數(shù)據(jù)集轉(zhuǎn)換成PyTorch格式。將.pdb文件和.sdf文件所提供的信息創(chuàng)建成分別代表蛋白質(zhì)和小分子的三維矩陣,并且將蛋白質(zhì)、小分子矩陣以及所對應(yīng)的親和力的值以三個一組的形式存儲起來。原始數(shù)據(jù)集形成PyTorch格式處理過的訓(xùn)練集和測試集,并保存成兩種文件,將訓(xùn)練集文件送到神經(jīng)網(wǎng)絡(luò)中訓(xùn)練50輪,并將得到的模型參數(shù)用于測試集文件測試。

        按照上述的實(shí)驗(yàn)流程,我們進(jìn)行一個完整的實(shí)驗(yàn),實(shí)驗(yàn)中Loss下降的過程如圖3所示。從圖中我們可以看出,橫坐標(biāo)訓(xùn)練輪次(Epoch)為50輪,縱坐標(biāo)Loss的數(shù)值隨著Epoch的增加而逐步減小。這表明我們所提出的模型,隨著訓(xùn)練次數(shù)的增加,預(yù)測結(jié)果與實(shí)際結(jié)果逐漸接近,可以有效地提升預(yù)測的準(zhǔn)確率。

        圖3" 實(shí)驗(yàn)Loss下降過程圖

        4.2" 基于PDBbind2016數(shù)據(jù)集的實(shí)驗(yàn)

        根據(jù)PDBbind2016數(shù)據(jù)集計(jì)算蛋白質(zhì)和小分子的原子分別在X、Y、Z軸上的最大坐標(biāo)值與最小坐標(biāo)值的差值,選出數(shù)據(jù)集中每個維度最大的差值作為初始化零矩陣的對應(yīng)維度的邊長,并且在最外層加以零填充,我們將蛋白質(zhì)零矩陣的大小定為(170,170,190),小分子零矩陣的大小定為(30,30,30),縮小后蛋白質(zhì)和小分子矩陣大小分別為(17,17,19),(15,15,15)。我們根據(jù)KDEEP的實(shí)驗(yàn)操作劃分了數(shù)據(jù)集,并使用KDEEP提供的實(shí)驗(yàn)數(shù)據(jù),有4種方法與我們的實(shí)驗(yàn)方法在RMSE、R、Rs的衡量標(biāo)準(zhǔn)上進(jìn)行對比,分別是KDEEP [8]、RF-Score [4]、X-Score [11]、cyScore [12],對比的詳細(xì)結(jié)果如表2所示。

        表2" 關(guān)于在PDBbind2016數(shù)據(jù)集的性能表現(xiàn)

        方法 RMSE R Rs

        KDEEP 1.27 0.82 0.82

        RF-Score 1.39 0.80 0.80

        X-Score 1.71 0.66 0.66

        cyScore 4.13 0.65 0.65

        本實(shí)驗(yàn)方法 1.62 0.67 0.68

        從表2中可以看出我們提出的方法RMSE是1.62,R是0.67,Rs是0.68。在RMSE、R、Rs上的表現(xiàn)都優(yōu)于傳統(tǒng)的評分方法X-Score,cyScore,這得益于我們的方法通過網(wǎng)格化結(jié)構(gòu)信息,用數(shù)字來代替原子類型,能夠更好地表達(dá)蛋白質(zhì)和小分子的特征信息。但是表現(xiàn)性能遜于KDEEP、RF-Score的方法,這可能是由于我們的方法在構(gòu)建矩陣時,為了防止矩陣的坐標(biāo)越界,初始化矩陣的每個維度的邊長都和數(shù)據(jù)集中所有原子矩陣所對應(yīng)維度的邊長的最大值有關(guān),這使得大部分矩陣的非零數(shù)值都集中在三維矩陣的坐標(biāo)的原點(diǎn)附近,其余部分有大量零值,雖然我們通過縮小矩陣來減小上述情況帶來的負(fù)面效果,但是也會伴隨著矩陣像素精度的較少??傊覀兲岢龅姆椒ㄔ谒蟹椒ㄖ袑儆谥械缺憩F(xiàn)水平,有很大的優(yōu)化空間。

        5" 結(jié)" 論

        預(yù)測藥物靶點(diǎn)親和力是新藥研發(fā)的關(guān)鍵步驟,本文中我們提出了一種基于結(jié)構(gòu)特征的深度學(xué)習(xí)方法,通過蛋白質(zhì)和小分子的原子坐標(biāo)信息分別網(wǎng)格化成兩個特征矩陣,并根據(jù)原子類型的信息賦予矩陣數(shù)值。本文在PDBbind數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明我們提出的方法在所有性能上都優(yōu)于X-Score和cyScore這兩種傳統(tǒng)的函數(shù)評分方法,是一項(xiàng)有前景的深度學(xué)習(xí)方法。

        參考文獻(xiàn):

        [1] MULLARD A. New drugs cost US$2.6 billion to develop [J].Nature Reviews Drug Discovery,2014,13(12):877.

        [2] ASHBURN T T,THOR K B. Drug Repositioning: Identifying and Developing New Uses for Existing Drugs [J].Nature Reviews Drug Discovery,2004:673-683.

        [3] ROSES A D. Pharmacogenetics in Drug Discovery and Development: A Translational Perspective [J].Nature Reviews Drug Discovery,2008(10):807-817.

        [4] BALLESTER P J,MITCHELL J B O. A Machine Learning Approach to Predicting Protein-Ligand Binding Affinity with Applications to Molecular Docking [J].Bioinformatics,2010,26(9):1169-1175.

        [5] ?ZTüRK H,?ZGüR A,OZKIRIMLI E. DeepDTA: Deep Drug-Target Binding Affinity Prediction [J].Bioinformatics,2018,34(17):i821-i829.

        [6] NGUYEN T,LE H,QUINN T P,et al. GraphDTA: Predicting Drug-Target Binding Affinity with Graph Neural Networks [J].Bioinformatics,2021,37(8):1140-1147.

        [7] JIMéNEZ J,DOERR S,MARTíNEZ-ROSELL G,et al. DeepSite: Protein-Binding Site Predictor Using 3D-Convolutional Neural Networks [J].Bioinformatics,2017,33(19):3036-3042.

        [8] JIMéNEZ J,SKALIC M,MARTINEZ-ROSELL G,et al. KDEEP: Protein-Ligand Absolute Binding Affinity Prediction via 3D-Convolutional Neural Networks [J].Journal of chemical information and modeling,2018,58(2):287-296.

        [9] NAIR V,HINTON G E. Rectified Linear Units Improve Restricted Boltzmann Machines [C]//Proceedings of the 27th Interational Conferenice on Machinse Learring,Haifa:[s.n.],2010.

        [10] WANG R X,F(xiàn)ANG X L,LU Y P,et al. The PDBbind Database: Methodologies and Updates [J].Journal of Medicinal Chemistry,2005,48(12):4111-4119.

        [11] WANG R X,LAI L H,WANG S M. Further Development and Validation of Empirical Scoring Functions for Structure-Based Binding Affinity Prediction [J].Journal of Computer-Aided Molecular Design,2002,16(1):11-26.

        [12] CAO Y,LI L. Improved Protein-Ligand Binding Affinity Prediction by Using a Curvature-Dependent Surface-Area Model [J].Bioinformatics,2014,30(12):1674-1680.

        作者簡介:邵允昶(1999—),男,漢族,山東青島人,碩士研究生在讀,研究方向:基于深度學(xué)習(xí)的藥物靶點(diǎn)親和力研究;張媛媛(1986—),女,漢族,山東德州人,副教授,博士研究生,研究方向:人工智能在藥物發(fā)現(xiàn)中的應(yīng)用;江明建(1991—),男,漢族,山東青島人,講師,博士研究生,研究方向:基于深度學(xué)習(xí)的蛋白質(zhì)組學(xué)研究。

        猜你喜歡
        深度學(xué)習(xí)人工智能
        我校新增“人工智能”本科專業(yè)
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
        軟件工程(2016年8期)2016-10-25 15:47:34
        婷婷色香五月综合激激情| 亚洲女同性恋在线播放专区| 91色综合久久熟女系列| 国产av一区二区三区无码野战| 亚洲日本中文字幕天天更新| 麻豆AV免费网站| 美腿丝袜中文字幕在线观看| 日韩av精品视频在线观看| 少妇丰满大乳被男人揉捏视频| 欧美日韩国产综合aⅴ| 偷柏自拍亚洲综合在线| 一本色道久久亚洲加勒比| 国内精品视频在线播放不卡| 亚洲免费视频播放| 久久九九av久精品日产一区免费 | 久久AⅤ无码精品色午麻豆| 人妻少妇被粗大爽视频| 久久久免费精品re6| 欧美视频二区欧美影视| 中文字幕色视频在线播放| 日本一区二区三区四区高清不卡 | 国产v精品成人免费视频400条| 国产丝袜一区丝袜高跟美腿| 欧美牲交a欧美牲交aⅴ| 日本亚洲国产一区二区三区| 国产精品玖玖资源站大全| 国产激情自拍在线视频| 99热这里有精品| 人妻AV无码一区二区三区奥田咲| 日本一二三区在线视频观看| 亚洲小说区图片区色综合网| 亚洲色无码播放| 亚洲AV色欲色欲WWW| 日本系列中文字幕99| 老师粉嫩小泬喷水视频90| 国产91对白在线观看| 综合成人亚洲网友偷自拍| 国产av夜夜欢一区二区三区| 亚洲熟妇少妇任你躁在线观看| 肉丝高跟国产精品啪啪| 米奇欧美777四色影视在线|