亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        抗乳腺癌候選藥物活性值模型建立和分析

        2023-03-21 02:21:48亓凱航仲梁維
        計算機時代 2023年3期
        關(guān)鍵詞:權(quán)值適應(yīng)度遺傳算法

        亓凱航,仲梁維

        (上海理工大學(xué),上海 200093)

        0 引言

        乳腺癌是世界上最常見,致死率較高的癌癥之一。目前,抗激素治療經(jīng)常用于ERα表達的乳腺癌患者,其通過調(diào)節(jié)雌激素受體活性來控制人體內(nèi)雌激素水平[1]。ERα被公認(rèn)為是治療乳腺癌的重要靶標(biāo),能夠拮抗ERα活性的化合物是治療乳腺癌的候選藥物[2]。在藥物研發(fā)中,為了節(jié)約時間及經(jīng)費成本,通常采用建立化合物活性預(yù)測模型的方法來篩選潛在活性化合物。本文采用遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)結(jié)合斯皮爾曼等級相關(guān)系數(shù)建立化合物活性預(yù)測模型。該模型能較為準(zhǔn)確地預(yù)測化合物活性值。

        1 樣本數(shù)據(jù)處理

        生物活性值作為因變量,分子描述符信息作為自變量。分析數(shù)據(jù)可知,將所有操作變量輸入,可能會導(dǎo)致過擬合,影響結(jié)果。因此采用斯皮爾曼等級相關(guān)系數(shù)對分子描述符和生物活性值進行相關(guān)性分析計算,求得分子描述符和生物活性值之間的斯皮爾曼等級相關(guān)系數(shù),將系數(shù)由大到小排序并返回索引值,得到前20個對生物活性最具有顯著影響的分子描述符,詳見表1。

        表1 前20個對生物活性最具顯著影響的分子描述符

        2 生物活性值預(yù)測模型

        2.1 模型選擇

        用前20 個對生物活性最具顯著影響的分子描述符及pIC50值構(gòu)建BP 神經(jīng)網(wǎng)絡(luò)模型。BP 神經(jīng)網(wǎng)絡(luò)是一種單向傳播多層的前饋神經(jīng)網(wǎng)絡(luò),過程主要可分為兩個階段,第一階段是信號的前向傳播,再從輸入層經(jīng)過隱含層,最后到達輸出層;第二階段是誤差的反向傳播,從輸出層到隱含層,最后到輸入層,依次調(diào)節(jié)隱含層到輸出層的權(quán)重和偏置,輸入層到隱含層的權(quán)重和偏置[4]。

        一個神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層和輸出層,如圖1所示。輸入層神經(jīng)元個數(shù)應(yīng)該與輸入數(shù)據(jù)的維數(shù)相同,輸出層神經(jīng)元個數(shù)與要擬合的數(shù)據(jù)維數(shù)相同,而隱含層神經(jīng)元的個數(shù)與層數(shù)按照設(shè)計者的目標(biāo)和需求決定[5]。深度學(xué)習(xí)隱含層的層數(shù)一般為三層,由可修正的權(quán)值互聯(lián),一般使用的神經(jīng)網(wǎng)絡(luò)都是三層網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射能力、高度自學(xué)習(xí)和自適應(yīng)的能力、一定的容錯能力,但是BP 算法是一種基于梯度的最速下降法,因此存在不可避免的缺陷,學(xué)習(xí)過程收斂速度比較慢,網(wǎng)絡(luò)結(jié)構(gòu)不易確定,甚至網(wǎng)絡(luò)訓(xùn)練很容易陷入局部極小值[6]。故針對BP神經(jīng)網(wǎng)絡(luò)算法存在的缺點,提出利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),避免陷入局部最優(yōu)解的方案,充分利用BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和遺傳算法的全局搜索能力,二者相互補償。

        圖1 神經(jīng)網(wǎng)絡(luò)

        遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)包含種群初始化、適應(yīng)度函數(shù)、選擇操作、交叉操作和變異操作五個要素[7]。

        ⑴種群初始化

        種群初始化運用實數(shù)進行編碼,將每個個體當(dāng)作一個實數(shù)串,包括輸入層與隱含層連接權(quán)值、隱含層閾值、隱含層與輸出層連接權(quán)值以及輸出層閾值四部分。種群個體都包括神經(jīng)網(wǎng)絡(luò)的全部權(quán)值和閾值。在已知網(wǎng)絡(luò)節(jié)點結(jié)構(gòu)的情況下,構(gòu)建結(jié)構(gòu)、權(quán)值、閾值確定的BP神經(jīng)網(wǎng)絡(luò)[7]。

        ⑵適應(yīng)度函數(shù)

        將個體得到BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,用訓(xùn)練集訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)后預(yù)測系統(tǒng)輸出,把預(yù)測輸出和期望輸出間的誤差絕對值和作為個體適應(yīng)度值F,計算公式為:

        其中,n為網(wǎng)絡(luò)輸出節(jié)點數(shù);yi為BP 神經(jīng)網(wǎng)絡(luò)第i個節(jié)點的期望輸出;oi為第i個節(jié)點的預(yù)測輸出;k為系數(shù)[7]。

        ⑶選擇操作

        常見的遺傳算法的選擇操作,大多數(shù)使用輪盤賭法、錦標(biāo)賽法等方法,本文考慮到適應(yīng)度比例,因此選用輪盤賭法,得到個體i的選擇概率pi為:

        其中,fi為個體i的適應(yīng)度值,為了使適應(yīng)度值盡量小,會采用在個體選擇前對適應(yīng)度值求倒數(shù)的形式;k為系數(shù);N為種群個體數(shù)目[7]。

        ⑷交叉操作

        因為種群個體編碼采用的是實數(shù)編碼,所以交叉操作選用實數(shù)交叉法,第k個染色體ak和第l個染色體al在j位的交叉操作方法如下[8]:

        其中,b是[ 0,1 ]之間的隨機數(shù)。

        ⑸變異操作

        選取第i個個體的第j個基因aij進行變異,變異操作方法如下:

        其中,amax為基因aij的上界;amin為基因aij的下界;r2為一個隨機數(shù);g是當(dāng)前迭代次數(shù);Gmax為最大進化次數(shù);r為[ 0,1 ]間的隨機數(shù)[8]。

        利用遺傳算法來優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)得到最優(yōu)個體的權(quán)值和閾值,種群中的每個個體都包含了一個網(wǎng)絡(luò)所有的權(quán)值和閾值,個體利用適應(yīng)度函數(shù)計算個體適應(yīng)度值,遺傳算法使用選擇、交叉和變異操作找到最優(yōu)適應(yīng)度值對應(yīng)的個體[9]。BP神經(jīng)網(wǎng)絡(luò)預(yù)測就是使用遺傳算法得到最優(yōu)個體對網(wǎng)絡(luò)初始權(quán)值和閾值賦值,網(wǎng)絡(luò)經(jīng)過訓(xùn)練后對函數(shù)輸出預(yù)測。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程如圖2所示。

        圖2 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程

        2.2 模型建立

        建立BP神經(jīng)網(wǎng)絡(luò)模型,步驟如下。

        ⑴數(shù)據(jù)輸入及處理

        針對前20 個對生物活性最具顯著影響的分子描述符及生物活性值,在1974 個化合物中預(yù)留出474 個化合物的數(shù)據(jù)進行之后的BP 神經(jīng)網(wǎng)絡(luò)系統(tǒng)的測試和檢驗。

        ⑵網(wǎng)絡(luò)訓(xùn)練

        用歸一化的1500組數(shù)據(jù)進行網(wǎng)絡(luò)訓(xùn)練,構(gòu)建該網(wǎng)絡(luò)結(jié)構(gòu)模型需要20個輸入?yún)?shù)、1個輸出參數(shù),所以設(shè)置的BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為20->41->1,即輸入層有20個節(jié)點,隱含層有41 個節(jié)點,輸出層有1 個節(jié)點,共有20 × 41+1=821 個權(quán)值,41+1=42 個閾值,所以遺傳算法個體編碼長度為821+42=863,均方誤差為0.065;學(xué)習(xí)率為0.1;訓(xùn)練結(jié)果與實際結(jié)果對比如圖3。

        圖3 GA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)輸出

        ⑶BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化

        本文采用遺傳算法對BP 神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進行優(yōu)化尋求最優(yōu)個體,在一定范圍內(nèi)對遺傳算法的參數(shù)設(shè)定,進化代數(shù)為50,種群規(guī)模是50,交叉概率選擇為0.4,變異概率為0.3;適應(yīng)度曲線和預(yù)測誤差如圖4所示。

        圖4 適應(yīng)度曲線和預(yù)測誤差

        ⑷網(wǎng)絡(luò)性能評估

        均方誤差作為評價點估計最經(jīng)典的標(biāo)準(zhǔn),均方誤差越小,越能說明點估計精確性。所謂均方誤差,就是預(yù)測數(shù)據(jù)和原始數(shù)據(jù)對應(yīng)點誤差的平方和的均值,計算公式為:

        其中,n為樣本個數(shù),SSE為和方差[8]。

        優(yōu)化前后BP 神經(jīng)網(wǎng)絡(luò)誤差對比如圖5。首先,將未優(yōu)化前的BP 神經(jīng)網(wǎng)絡(luò)與優(yōu)化后的神經(jīng)網(wǎng)絡(luò)性能評估對比,對二者的最小均方誤差值作比較,優(yōu)化前的MSE值為0.22097,優(yōu)化后的MSE值為0.06923,經(jīng)過遺傳算法優(yōu)化后的BP 神經(jīng)網(wǎng)絡(luò)的MSE 值更小。其次,觀察預(yù)測輸出與期望輸出對比圖,遺傳算法優(yōu)化的輸出與期望輸出比較接近,擬合效果比較好。通過預(yù)測誤差得知,當(dāng)樣本數(shù)在100左右時,預(yù)測誤差最小。因此,經(jīng)過遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)對生物活性值的預(yù)測結(jié)果更加準(zhǔn)確。

        圖5 優(yōu)化前后BP神經(jīng)網(wǎng)絡(luò)誤差對比

        ⑸神經(jīng)網(wǎng)絡(luò)預(yù)測

        通過上述訓(xùn)練好的模型,將數(shù)據(jù)導(dǎo)入,得到50 個化合物的生物活性值,用公式pIC50=-lg(IC50× 10-9)將生物活性值(pIC50)轉(zhuǎn)化為IC50,最后得到生物活性值,詳見表2。

        表2 生物活性預(yù)測值

        3 結(jié)論

        本文針對BP 神經(jīng)網(wǎng)絡(luò)預(yù)測化合物生物活性值存在學(xué)習(xí)過程收斂速度比較慢,容易陷入局部最優(yōu)解的缺陷,提出了基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,可以有效降低均方誤差,遺傳算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)能夠較為準(zhǔn)確地預(yù)測化合物的生物活性值,預(yù)測結(jié)果符合預(yù)期值。

        猜你喜歡
        權(quán)值適應(yīng)度遺傳算法
        改進的自適應(yīng)復(fù)制、交叉和突變遺傳算法
        計算機仿真(2022年8期)2022-09-28 09:53:02
        一種融合時間權(quán)值和用戶行為序列的電影推薦模型
        CONTENTS
        基于自適應(yīng)遺傳算法的CSAMT一維反演
        一種基于遺傳算法的聚類分析方法在DNA序列比較中的應(yīng)用
        基于權(quán)值動量的RBM加速學(xué)習(xí)算法研究
        基于遺傳算法和LS-SVM的財務(wù)危機預(yù)測
        基于空調(diào)導(dǎo)風(fēng)板成型工藝的Kriging模型適應(yīng)度研究
        中國塑料(2016年11期)2016-04-16 05:26:02
        基于改進的遺傳算法的模糊聚類算法
        少數(shù)民族大學(xué)生文化適應(yīng)度調(diào)查
        精品无码人妻一区二区三区| 欧美人与动人物牲交免费观看久久| a级国产乱理伦片| 欧美人做人爱a全程免费| 48沈阳熟女高潮嗷嗷叫| 日韩精品中文字幕无码一区| 免费人成黄页在线观看视频国产 | 亚洲欧美国产精品久久| 欧美日韩视频在线第一区| 末发育娇小性色xxxxx视频| 四月婷婷丁香七月色综合高清国产裸聊在线 | 国产精品无码翘臀在线观看| 99热在线观看| 欧美日韩精品| 久久成人麻豆午夜电影| 传媒在线无码| 少妇av免费在线播放| 日本老熟女一区二区三区| 日本a级黄片免费观看| 爽爽影院免费观看| 亚洲精品无码av中文字幕| 免费啪啪视频一区| 亚洲区一区二区中文字幕| 成人自拍三级在线观看| 亚洲精一区二区三av| 国产午夜手机精彩视频| 婷婷五月综合丁香在线| 波多野结衣国产一区二区三区| 丝袜美腿网站一区二区| 伊人亚洲综合影院首页| 久久久亚洲av成人乱码| 久久久久久久久无码精品亚洲日韩| 制服丝袜中文字幕在线| 亚洲av成人无码久久精品 | 久久人妻中文字幕精品一区二区 | 国产精品国产三级农村妇女| 人妻熟女妇av北条麻记三级| 国产三级精品和三级男人| 亚洲国产精品一区二区www| 日韩免费小视频| 国产黄色精品高潮播放|