亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于異構(gòu)網(wǎng)絡(luò)算法的藥物-蛋白關(guān)聯(lián)性研究方法

        2019-01-11 06:02:18龔家瑜
        關(guān)鍵詞:關(guān)聯(lián)性相似性概率

        徐 婷, 龔家瑜, 宋 暉

        (東華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 201620)

        0 引 言

        在醫(yī)藥行業(yè)中,研究一種新的藥物所耗費(fèi)的周期長、投資大、風(fēng)險高,但成功率卻一直偏低?,F(xiàn)如今,網(wǎng)絡(luò)藥理學(xué)飛速發(fā)展,藥物重定位被認(rèn)為是藥物研發(fā)策略中風(fēng)險和效益比最好的策略之一。研究表明,導(dǎo)致相同類似藥理作用的分子一般在同一個生物模塊內(nèi),如蛋白質(zhì)復(fù)合體[1]、代謝通路[2]和蛋白質(zhì)網(wǎng)絡(luò)[3]。因此,可以利用這種模塊性及已知的藥物-蛋白作用特性預(yù)測潛在的新的關(guān)聯(lián)。目前,基于網(wǎng)絡(luò)的藥物-蛋白質(zhì)關(guān)聯(lián)性預(yù)測方法大致可劃分為2類,即單源網(wǎng)絡(luò)方法和多源網(wǎng)絡(luò)整合方法。單源網(wǎng)絡(luò)方法多采用蛋白質(zhì)網(wǎng)絡(luò)進(jìn)行藥物-蛋白質(zhì)的關(guān)聯(lián)性預(yù)測。多源網(wǎng)絡(luò)整合方法將多源網(wǎng)絡(luò)(如蛋白相似性網(wǎng)絡(luò)、藥物相似性網(wǎng)絡(luò))信息進(jìn)行潛在關(guān)聯(lián)性預(yù)測。如Lage[5]等人利用貝葉斯模型整合蛋白相似性網(wǎng)絡(luò)和藥物相似性網(wǎng)絡(luò),實(shí)現(xiàn)對藥物相關(guān)蛋白質(zhì)復(fù)合物的預(yù)測; Li等人[7]基于藥物-蛋白質(zhì)二元網(wǎng)絡(luò),提出二元網(wǎng)絡(luò)重啟隨機(jī)游走算法來實(shí)現(xiàn)關(guān)聯(lián)性預(yù)測,該方法可提高藥物-蛋白質(zhì)關(guān)聯(lián)性預(yù)測準(zhǔn)確率,但構(gòu)造的狀態(tài)轉(zhuǎn)移矩陣較為稀疏,這種策略可能遺漏蛋白質(zhì)網(wǎng)絡(luò)中的局部拓?fù)湫畔ⅲ瑢?dǎo)致預(yù)測性降低。本文提出一種異構(gòu)網(wǎng)絡(luò)異步重啟隨機(jī)游走算法,將藥物網(wǎng)絡(luò)、蛋白質(zhì)網(wǎng)絡(luò)及藥物-蛋白質(zhì)二分圖網(wǎng)絡(luò)三者構(gòu)建為異構(gòu)網(wǎng)絡(luò),并在內(nèi)進(jìn)行隨機(jī)游走和網(wǎng)絡(luò)間的跳轉(zhuǎn),最后驗(yàn)證算法的有效性。

        1 材料與方法

        蛋白質(zhì)相似性數(shù)據(jù)來源于UniProt數(shù)據(jù)庫,包含313個節(jié)點(diǎn),其鄰接矩陣用AP表示,該網(wǎng)絡(luò)反映蛋白質(zhì)與蛋白質(zhì)之間的量化相似性關(guān)系。蛋白-蛋白相似性網(wǎng)絡(luò)中的節(jié)點(diǎn)表示靶標(biāo)蛋白,而蛋白質(zhì)之間的相似程度則由鄰邊權(quán)重來量化,取值范圍為[0,1],越接近1則表示相似程度越高。

        圖1 藥物-蛋白質(zhì)異構(gòu)網(wǎng)絡(luò)模型

        DRWRP算法基本思想:在建立的多個網(wǎng)絡(luò)中,從某一節(jié)點(diǎn)出發(fā),按照一定概率向相鄰的節(jié)點(diǎn)跳轉(zhuǎn),下一個節(jié)點(diǎn)即為下一個狀態(tài),重復(fù)初始狀態(tài)行為。網(wǎng)絡(luò)中的所有節(jié)點(diǎn)都可進(jìn)行跳轉(zhuǎn)。具體過程類似于數(shù)學(xué)中的馬爾科夫鏈。算法的數(shù)學(xué)表示如下:

        Pt+1=(1-λ)MPt+λP0

        (1)

        其中,P0表示初始游走概率向量;Pt表示為t時刻的狀態(tài),這個狀態(tài)和初始狀態(tài)相似;λ是經(jīng)驗(yàn)參數(shù)[λ∈(0,1)],用來確定重啟概率;M是轉(zhuǎn)移矩陣,反映網(wǎng)絡(luò)的拓?fù)涮匦?。本文認(rèn)為當(dāng)t+1時刻的狀態(tài)Pt+1與前一時刻的狀態(tài)Pt的范數(shù)收斂到某個很小的值ε的時候,游走不再進(jìn)行,整個網(wǎng)絡(luò)處于靜止?fàn)顟B(tài),在實(shí)驗(yàn)中,將ε設(shè)為10-6。對靜止的網(wǎng)絡(luò)進(jìn)行得分計(jì)算,對于某一個節(jié)點(diǎn)來講,可以計(jì)算出下一步跳轉(zhuǎn)到任一節(jié)點(diǎn)的概率,根據(jù)把下一節(jié)點(diǎn)按照概率由大到小進(jìn)行排序,從而進(jìn)行推薦。本文采用的異構(gòu)網(wǎng)絡(luò)存在2種游走,第一種為同源節(jié)點(diǎn)網(wǎng)絡(luò)內(nèi)的游走,即藥物-藥物相似性網(wǎng)絡(luò)和蛋白-蛋白相似性網(wǎng)絡(luò),第二種為異源節(jié)點(diǎn)網(wǎng)絡(luò)間的游走,即藥物-蛋白質(zhì)相似性網(wǎng)絡(luò)中游走。DRWRP算法狀態(tài)轉(zhuǎn)移概率矩陣定義為:

        (2)

        其中,(1-α)為節(jié)點(diǎn)隨機(jī)游走后停止的概率;MP為蛋白相似性網(wǎng)絡(luò)狀態(tài)轉(zhuǎn)移矩陣;MD為藥物相似性網(wǎng)絡(luò)的狀態(tài)轉(zhuǎn)移矩陣;MPD為從蛋白相似性網(wǎng)絡(luò)到藥物相似性網(wǎng)絡(luò)的狀態(tài)轉(zhuǎn)移概率矩陣;MDP為從藥物性相似性網(wǎng)絡(luò)到蛋白相似性網(wǎng)絡(luò)的狀態(tài)轉(zhuǎn)移概率矩陣。

        蛋白pi跳轉(zhuǎn)到蛋白pj的轉(zhuǎn)移概率定義為:

        (MP)ij=P(pi|pj)=(AP)ij/∑j(AP)ij

        (3)

        藥物di跳轉(zhuǎn)到藥物dj的轉(zhuǎn)移概率定義為:

        (MD)ij=P(di|dj)=(AD)ij/∑j(AD)ij

        (4)

        蛋白pi跳轉(zhuǎn)到藥物dj的轉(zhuǎn)移概率定義為:

        (MPD)ij=P(dj|pi)=

        (5)

        藥物di跳轉(zhuǎn)到蛋白pj的轉(zhuǎn)移概率定義為:

        (MDP)ij=P(pj|di)=

        (6)

        初始游走概率向量定義為:

        (7)

        DRWRP算法具體描述如下:

        輸入:狀態(tài)轉(zhuǎn)移矩陣M,初始游走概率向量P0和重啟的概率λ。

        輸出:蛋白關(guān)聯(lián)性得分μ。

        步驟:

        (1)初始化P值為P0;

        (2)初始化Pt的值為P;

        (3)對Pt+1進(jìn)行迭代;

        (4)重復(fù)步驟(3)直至‖Pt+1-Pt‖1≤10-6;

        (5)將蛋白按照關(guān)聯(lián)性得分μ的值按照降序排列;

        (6)輸出排在前p%的蛋白作為算法識別的關(guān)聯(lián)性蛋白。

        2 實(shí)驗(yàn)結(jié)果與分析

        本文以藥物DB00619為例,根據(jù)DrugBank數(shù)據(jù)庫的記錄, 該藥物的靶標(biāo)蛋白有9個,在上述篩選的數(shù)據(jù)庫中有8個對應(yīng)的靶標(biāo)蛋白。本文選取準(zhǔn)確率作為評價指標(biāo),對計(jì)算結(jié)果先排序后篩選,選擇排列在前1%、5%、10%、15%的蛋白質(zhì)作為識別的關(guān)聯(lián)性蛋白,再與已知的靶標(biāo)蛋白數(shù)據(jù)集進(jìn)行比對。實(shí)驗(yàn)結(jié)果如圖2所示。

        圖2 DRWRP與其它關(guān)聯(lián)研究方法比較

        Fig.2ComparisonofDRWRPandothercorrelationresearchmethods

        從圖2可知,本文提出的DRWRP算法識別的關(guān)聯(lián)蛋白質(zhì)數(shù)量與采用DRCF算法、DPR算法和RWR算法識別的關(guān)聯(lián)蛋白質(zhì)數(shù)量相比明顯更多。無論是在前1%、前5%、前10%,還是前15%的樣本水平上,DRWRP算法的預(yù)測命中率都比其它算法高15%以上??傮w來說,DRWRP算法具有較好的預(yù)測性能。

        在上式中,對參數(shù)α和參數(shù)λ的取值都采用了經(jīng)驗(yàn)值0.5。為了研究這2個參數(shù)對DRWRP算法預(yù)測性能的影響,先固定其中一個為0.5,然后調(diào)整另一個參數(shù)。實(shí)驗(yàn)結(jié)果如圖3和圖4所示。結(jié)果表明,當(dāng)α=0.5,λ=0.5時,DRWRP算法的性能總體上最高。

        圖3 參數(shù)λ對DRWRP預(yù)測準(zhǔn)確性的影響

        圖4 參數(shù)α對DRWRP預(yù)測準(zhǔn)確性的影響

        3 結(jié)束語

        本文提出了一種異構(gòu)網(wǎng)絡(luò)異步重啟游走算法,構(gòu)建了藥物-蛋白質(zhì)異構(gòu)網(wǎng)絡(luò),深層次挖掘藥物與蛋白質(zhì)之間的潛在關(guān)聯(lián)性。該算法分別在藥物-藥物相似性網(wǎng)絡(luò)、蛋白質(zhì)-蛋白質(zhì)相似性網(wǎng)絡(luò)以及藥物-蛋白質(zhì)二分圖網(wǎng)絡(luò)中進(jìn)行隨機(jī)游走,然后在網(wǎng)絡(luò)間不停跳轉(zhuǎn),反復(fù)迭代后形成穩(wěn)態(tài)概率向量,最終得到藥物與蛋白質(zhì)間的潛在最優(yōu)關(guān)聯(lián)。對已知藥物靶標(biāo)蛋白的驗(yàn)證結(jié)果表明,與現(xiàn)有的隨機(jī)游走算法和推薦算法相比,DRWRP算法體現(xiàn)出更好的預(yù)測性能。

        猜你喜歡
        關(guān)聯(lián)性相似性概率
        一類上三角算子矩陣的相似性與酉相似性
        第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
        第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
        概率與統(tǒng)計(jì)(一)
        概率與統(tǒng)計(jì)(二)
        淺析當(dāng)代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        四物湯有效成分的關(guān)聯(lián)性分析
        中成藥(2017年3期)2017-05-17 06:09:05
        如何準(zhǔn)確認(rèn)定排污行為和環(huán)境損害之間的關(guān)聯(lián)性
        低滲透黏土中氯離子彌散作用離心模擬相似性
        CRP檢測與新生兒感染的關(guān)聯(lián)性
        国产精品久久久久久无码| 日韩精品视频高清在线| 欧美老肥婆牲交videos| 亚洲男人第一无码av网站| av超碰在线免费观看| 国内精品人人妻少妇视频| 国产精品人妻熟女男人的天堂| 好吊妞无缓冲视频观看 | 国产极品裸体av在线激情网| 一区二区三区日韩精品视频| 五月天国产成人av免费观看| 最新四色米奇影视777在线看| 亚洲 美腿 欧美 偷拍| 日韩精品视频免费在线观看网站 | av国产传媒精品免费| 国产精品va在线播放我和闺蜜 | 手机在线观看成年人视频| 女人无遮挡裸交性做爰| 亚洲av无码专区电影在线观看| 日本视频一区二区三区免费观看 | 激情久久av一区av二区av三区 | 久久99亚洲精品久久久久| 亚洲日韩精品欧美一区二区| 日韩不卡av高清中文字幕| 日本精品熟妇一区二区三区| 一区二区精品国产亚洲| 激情偷乱人成视频在线观看| 精品中文字幕久久久人妻| 激情 一区二区| 国产午夜精品av一区二区三| 久久精品国产成人午夜福利| 久久精品国产第一区二区三区| 男人阁久久| 久久精品国产69国产精品亚洲| 亚洲av无码乱码国产精品| 精品第一页| 精品女同一区二区三区亚洲| 超碰人人超碰人人| 亚洲中文字幕无码中字| 日产精品一区二区在线| 久久精品国产亚洲夜色av网站|