亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        熱傳導(dǎo)算法在致病miRNA 預(yù)測(cè)中的應(yīng)用分析

        2019-11-12 01:10:28杰,羅
        關(guān)鍵詞:正例熱傳導(dǎo)交叉

        楊 杰,羅 洪

        (西南民族大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,四川 成都 610041)

        大數(shù)據(jù)時(shí)代離不開以推薦算法為基礎(chǔ)的推薦系統(tǒng),各類推薦系統(tǒng)對(duì)人們?nèi)粘I畹挠绊懥⒃絹碓綇?qiáng).文獻(xiàn)[1]于2007 年提出了基于二分網(wǎng)絡(luò)的推薦算法,該算法和傳統(tǒng)的協(xié)同過濾推薦算法相比具有精度高等特點(diǎn),以此為基礎(chǔ)后來研究者又提出了一系列的基于二分網(wǎng)絡(luò)的推薦算法和相應(yīng)的優(yōu)化算法,例如以物質(zhì)擴(kuò)散算法和熱傳導(dǎo)算法為基礎(chǔ)的優(yōu)化算法就取得了不錯(cuò)的效果[2-3].熱傳導(dǎo)算法的基本思想源自物理學(xué)中的熱平衡方程,根據(jù)物理學(xué)中的熱傳導(dǎo)思想經(jīng)過改進(jìn)后的熱傳導(dǎo)算法已經(jīng)成功應(yīng)用在鏈路預(yù)測(cè)領(lǐng)域和推薦系統(tǒng)領(lǐng)域[4-6].miRNA 是一類內(nèi)源性非編碼小分子RNA.近年來,伴隨越來越多的miRNA 的發(fā)現(xiàn)和進(jìn)行的相關(guān)研究,研究結(jié)果表明miRNA 在基因表達(dá)、蛋白質(zhì)翻譯以及細(xì)胞分化、增殖與凋亡等生命過程中起重要的調(diào)控作用,它的異常表達(dá)能夠直接或間接的導(dǎo)致相關(guān)復(fù)雜疾病的產(chǎn)生,也就是說作為一種重要調(diào)控因子miRNA 參與了多種重要的生物過程并且與多種復(fù)雜疾病的發(fā)生和發(fā)展相關(guān)[7-9].與傳統(tǒng)的生物實(shí)驗(yàn)發(fā)現(xiàn)疾病相關(guān)的miRNA 的方法不同,采用計(jì)算機(jī)為基礎(chǔ)的計(jì)算方法能夠在大規(guī)模生物數(shù)據(jù)中完成相關(guān)的計(jì)算預(yù)測(cè),通過計(jì)算預(yù)測(cè)不僅可以指導(dǎo)生物實(shí)驗(yàn)還可以提高實(shí)驗(yàn)效率和降低實(shí)驗(yàn)成本. 近年來,很多計(jì)算模型和算法已經(jīng)被國(guó)內(nèi)外學(xué)者用于對(duì)疾病相關(guān)的miRN 的預(yù)測(cè)研究[10-12],然而熱傳導(dǎo)算法在預(yù)測(cè)miRNA-疾病的相關(guān)性方面應(yīng)用研究較少.文獻(xiàn)[13]融合二分網(wǎng)絡(luò)和物理學(xué)中的熱傳導(dǎo)原理提出了基于二分網(wǎng)絡(luò)的熱傳導(dǎo)算法(Heat Conduction Algorithm Based on the Bipartite Network)并應(yīng)用到推薦系統(tǒng)中, 該算法以下簡(jiǎn)稱HC 算法.文獻(xiàn)[14]在HC 算法的基礎(chǔ)上引入物品度的λ 次方提出了偏熱傳導(dǎo)算法(Biased Heat Conduction),該算法以下簡(jiǎn)稱BHC 算法.針對(duì)熱傳導(dǎo)算法在疾病相關(guān)的miRNAs 計(jì)算預(yù)測(cè)研究較少的情況,本文引入了BHC 熱傳導(dǎo)預(yù)測(cè)算法用于預(yù)測(cè)疾病相關(guān)的miRNAs,并把它與基本的熱傳導(dǎo)算法HC 進(jìn)行了比較. 經(jīng)過五折交叉驗(yàn)證得到的ROC 曲線下的面積等指標(biāo)驗(yàn)證了BHC 熱傳導(dǎo)算法在預(yù)測(cè)疾病相關(guān)miRNA 應(yīng)用方面的有效性.

        1 算法描述

        HC 熱傳導(dǎo)算法的熱量傳遞在二分網(wǎng)絡(luò)中主要包括兩個(gè)過程:熱量由商品向用戶擴(kuò)散的過程和熱量由用戶向商品擴(kuò)散的過程.相關(guān)算法描述如下:

        對(duì)于一個(gè)用戶和物品構(gòu)成的二分網(wǎng)絡(luò)G(U,O,E),其中U={u1, u2,,…. um}O={ o1, o2,,…. on}和E={e1, e2,,…. eq}分別代表m 個(gè)用戶節(jié)點(diǎn)、n 個(gè)物品節(jié)點(diǎn)和q 條連邊.該網(wǎng)絡(luò)可用一個(gè)鄰接矩陣A ={ali}表示,其中若用戶ul和物品oi存在連邊則ali=1, 反之a(chǎn)li=0.假定物品上的某種初始熱量表示為,每個(gè)物品將傳導(dǎo)熱量給所有和它鄰接的用戶,每個(gè)用戶又會(huì)從重新傳導(dǎo)它接收的熱量給相連的物品,經(jīng)過兩步熱量傳遞后物品上最后獲得的熱量可表示為:

        給出了轉(zhuǎn)移矩陣的描述后,熱傳導(dǎo)算法中用戶ul對(duì)各個(gè)物品的最終熱量傳導(dǎo)可描述為:

        基于HC 改進(jìn)的BHC 熱傳導(dǎo)算法,其基本思想和HC 相同,只不過轉(zhuǎn)移矩陣物品度參數(shù)上加入λ 次方作為調(diào)節(jié)因子,λ 取值范圍為0 到1,本文中λ 取值0.5.BHC 的轉(zhuǎn)移矩陣如下:

        BHC 算法和HC 算法相比較,它們基本原理相似,只不過BHC 通過可調(diào)因子調(diào)節(jié)大度節(jié)點(diǎn)的影響力,從而改善算法對(duì)冷門物品的推薦能力.

        2 實(shí)驗(yàn)分析

        采用文獻(xiàn)[15]中的數(shù)據(jù)集進(jìn)行熱傳導(dǎo)算法在致病miRNA 預(yù)測(cè)的應(yīng)用分析. 該數(shù)據(jù)集以MeSH 數(shù)據(jù)庫(kù)中獲得的標(biāo)準(zhǔn)疾病關(guān)系為基礎(chǔ),從HMDD v2.0 數(shù)據(jù)庫(kù)和相關(guān)文獻(xiàn)研究成果中整理獲得了495 個(gè)miRNA 和375 種疾病構(gòu)成的miRNA -disease 關(guān)系對(duì),再經(jīng)過整理去掉名稱不規(guī)范的疾病,最后獲得了495 個(gè)miRNA 和330 種疾病構(gòu)成的miRNA - disease 關(guān)系對(duì).本文就以此數(shù)據(jù)集為基礎(chǔ)構(gòu)建了miRNA 節(jié)點(diǎn)和disease 節(jié)點(diǎn)構(gòu)成的二分網(wǎng)絡(luò)對(duì)熱傳導(dǎo)算法進(jìn)行應(yīng)用分析.

        本文采用五折交叉驗(yàn)證方法來評(píng)價(jià)預(yù)測(cè)模型的性能,并對(duì)基本的熱傳導(dǎo)算法HC 和改進(jìn)的熱傳導(dǎo)算法BHC 的精確率、正確率、F1 值和ROC(Receiver Operating Characteristic)曲線下面積AUC(Area Under Curve)做比較.

        交叉驗(yàn)證是把數(shù)據(jù)集分割成包含訓(xùn)練集和測(cè)試集的較小較小子集的統(tǒng)計(jì)學(xué)方法.其基本思想是用訓(xùn)練集對(duì)相關(guān)模型進(jìn)行訓(xùn)練,用測(cè)試集驗(yàn)證模型的可靠性和穩(wěn)定性.常用的交叉驗(yàn)證方法有k -折交叉驗(yàn)證和留一驗(yàn)證交叉驗(yàn)證等方法. 若用FP(False Positive)表示預(yù)測(cè)為正例的負(fù)例,用FN((False Negative)表示預(yù)測(cè)為負(fù)的正例,用TN(True Negative)表示預(yù)測(cè)為負(fù)的負(fù)例,用TP(True Positive)表示預(yù)測(cè)為正的正例,則可獲得關(guān)于下面幾個(gè)指標(biāo)的計(jì)算公式.

        精確率(Precision)是評(píng)價(jià)預(yù)測(cè)為正例的樣本中真正的正例的指標(biāo).

        正確率(Accuracy)是評(píng)價(jià)正確預(yù)測(cè)的正負(fù)例數(shù)和樣本總數(shù)關(guān)系的指標(biāo).

        召回率(Recall)是評(píng)價(jià)在實(shí)際正樣本中能預(yù)測(cè)出多少正例的指標(biāo).

        F1值是表示精確率和召回率的一個(gè)調(diào)和均值指標(biāo).

        經(jīng)過五折交叉驗(yàn)證試驗(yàn)比較得到的HC 算法和BHC 算法的具體指標(biāo)如表1 所示, 得到的ROC 曲線如圖1 所示.

        圖1 ROC 曲線圖Fig. 1 Receiver operating characteristic curve

        表1 HC 和BHC 算法指標(biāo)比較表Table 1 The comparison results between HC and BHC in the indicators

        從表1 數(shù)據(jù)可以看出,BHC 算法獲得的曲線下面積AUC 值為0.8868,而HC 算法的AUC 值僅為0.8018.ROC 曲線具有在測(cè)試集中正負(fù)樣本分布變換時(shí)保持ROC 曲線不變的特性,從圖1 中可以看出BHC算法的ROC 曲線優(yōu)于HC 算法的ROC 曲線. 從表1中可以看出BHC 算法獲得的精確率、正確率和F1 值指標(biāo)也明顯優(yōu)于HC 算法.

        3 結(jié)論

        雖然基于二分網(wǎng)絡(luò)的熱傳導(dǎo)算法HC 和偏熱傳導(dǎo)算法BHC 在推薦系統(tǒng)中已經(jīng)有應(yīng)用研究,但在預(yù)測(cè)疾病相關(guān)的miRNA 方面應(yīng)用研究較少,本文在預(yù)測(cè)疾病相關(guān)的miRNA 中引入了HC 和BHC 算法并進(jìn)行了比較分析,實(shí)驗(yàn)結(jié)果顯示,BHC 算法在本文數(shù)據(jù)集下取得的多項(xiàng)評(píng)價(jià)指標(biāo)的值高于HC 算法,即BHC算法性能優(yōu)于HC 算法.鑒于BHC 算法和HC 算法在本文中僅使用了miRNA 和疾病構(gòu)成的二分網(wǎng)絡(luò)下的關(guān)聯(lián)關(guān)系進(jìn)行研究,因此在二分網(wǎng)絡(luò)的基礎(chǔ)上增加融入二分網(wǎng)絡(luò)的生物學(xué)相關(guān)屬性數(shù)據(jù)來進(jìn)一步改進(jìn)熱傳導(dǎo)算法的性能是未來的研究方向.

        猜你喜歡
        正例熱傳導(dǎo)交叉
        小學(xué)生舉例表現(xiàn)與概念理解的相關(guān)性研究
        一類三維逆時(shí)熱傳導(dǎo)問題的數(shù)值求解
        基于概念形成的教學(xué)研究
        “六法”巧解分式方程
        熱傳導(dǎo)方程解的部分Schauder估計(jì)
        一類非線性反向熱傳導(dǎo)問題的Fourier正則化方法
        連一連
        高中數(shù)學(xué)概率教學(xué)中的誤區(qū)與應(yīng)對(duì)策略分析
        基于Fast-ICA的Wigner-Ville分布交叉項(xiàng)消除方法
        “絕不”與“決不”的區(qū)別
        欧美性xxx久久| 欧美熟妇另类久久久久久多毛 | 91免费国产高清在线| 青青草成人免费播放视频| 偷拍色图一区二区三区| 成视频年人黄网站免费视频| 中出人妻中文字幕无码| 最新亚洲人成无码网www电影| 狠狠综合亚洲综合亚色 | 亚洲另类激情专区小说婷婷久| 日本亚洲成人中文字幕| av在线播放免费观看| 亚洲精品无码精品mv在线观看| 风韵多水的老熟妇| 国产做无码视频在线观看浪潮| 肉体裸交137日本大胆摄影| av片在线观看免费| 激情 一区二区| 成年男女免费视频网站点播| 看日本全黄色免费a级| 九色九九九老阿姨| 国产亚洲精品bt天堂精选| 日韩AV有码无码一区二区三区| 久久亚洲精品国产精品婷婷| 国产黑丝美女办公室激情啪啪| 我要看免费久久99片黄色| 国产午夜福利精品一区二区三区| 成人欧美一区二区三区a片| 国产成人av综合色| 国产尤物自拍视频在线观看| 国产麻豆精品传媒av在线| 日本做受120秒免费视频| 九九视频在线观看视频6| 国产成人AV乱码免费观看| 国产一区二区三区免费视| 婷婷综合另类小说色区| 亚洲精品综合一区二区三| 一区二区三区国产高潮| 大陆成人精品自拍视频在线观看 | 欧美伊人亚洲伊人色综| 人妻中出中文字幕在线|