亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        農(nóng)藥對蚯蚓急性毒性的分類建模研究

        2023-11-13 11:18:50楚留意叢建業(yè)魏寵芝任月英
        蘭州交通大學(xué)學(xué)報 2023年5期
        關(guān)鍵詞:描述符蚯蚓毒性

        楚留意,叢建業(yè),劉 洋,魏寵芝,任月英

        (蘭州交通大學(xué)環(huán)境與市政工程學(xué)院,蘭州 730070)

        蚯蚓被譽(yù)為“生態(tài)系統(tǒng)的工程師”[1],是土壤生態(tài)系統(tǒng)的重要組成部分[2]。蚯蚓在土壤改良、有機(jī)物質(zhì)分解、土壤養(yǎng)分提高和促進(jìn)農(nóng)作物生長等方面發(fā)揮著至關(guān)重要的作用[3]。蚯蚓的數(shù)量可以作為評價土壤健康狀況和衡量農(nóng)業(yè)可持續(xù)發(fā)展的一個非常有效的指標(biāo)[4-5]。因此,歐洲聯(lián)盟和經(jīng)濟(jì)合作與發(fā)展組織選擇蚯蚓作為化學(xué)品環(huán)境危險的非目標(biāo)生物[6]。

        中國作為全球農(nóng)藥生產(chǎn)和使用的大國,農(nóng)藥在預(yù)防生物蟲害和農(nóng)業(yè)生產(chǎn)安全保障方面起著非常重要的作用[2],但是農(nóng)藥長期大規(guī)模的使用也對我們的生態(tài)環(huán)境產(chǎn)生了一定的負(fù)面影響[7]。中國農(nóng)藥管理相關(guān)部門一直關(guān)注著農(nóng)藥的使用對生態(tài)環(huán)境產(chǎn)生的影響,但是針對農(nóng)藥對鳥類、魚類影響的研究較多,農(nóng)藥對蚯蚓等土壤動物的影響的相關(guān)研究還未受到重視[8]。近些年來,國內(nèi)已經(jīng)有一些科研工作者開展了關(guān)于農(nóng)藥對蚯蚓毒性的相關(guān)研究,主要針對的是殺蟲劑和殺菌劑[9-10]。蚯蚓在土壤中能通過皮膚接觸或者食用被污染的食物而直接接觸到農(nóng)藥[11-12],因此導(dǎo)致蚯蚓死亡或者影響其生長[13]。土壤中殘留的農(nóng)藥會通過不同的途徑和毒性機(jī)制產(chǎn)生毒性作用,在蚯蚓毒性測試實(shí)驗(yàn)中最大的問題就是確定哪種化合物會對蚯蚓產(chǎn)生致死效果。但是,要想對市面上的數(shù)10萬種化學(xué)品逐一進(jìn)行毒性測試是非常耗時的。利用定量構(gòu)效關(guān)系(quantitative structure-activity relationship,QSAR)方法建模來預(yù)測化合物的毒性則具有一定的優(yōu)勢,但該方面對于蚯蚓毒性的研究則報道較少。目前可見文獻(xiàn)報道的兩例相關(guān)研究均來自于印度賈達(dá)普大學(xué)的喬伊教授等人,針對化合物對蚯蚓的毒性,分別建立了一個分類模型[14]和回歸模型[15]。分類模型中共有163種物質(zhì),用隨機(jī)分組方法將117種物質(zhì)作為訓(xùn)練集,建立了包含8 個結(jié)構(gòu)參數(shù)的線性判別方法(linear discriminant analysis,LDA)模型。該模型可以正確劃分83.96%的訓(xùn)練集物質(zhì),對測試集數(shù)據(jù)的劃分正確率為71.74%,但是對于測試集數(shù)據(jù)的靈敏度較低(僅為58.82%)。

        在本研究中,使用DRAGON 描述符[16]來表征化合物的結(jié)構(gòu)信息??紤]到生物毒性/活性與結(jié)構(gòu)參數(shù)之間的關(guān)系比較復(fù)雜,用非線性方法一般更能準(zhǔn)確地表述這種關(guān)系。因此,在本文中除采用LDA選擇結(jié)構(gòu)參數(shù)重新建模外,我們還嘗試采用SVM來建立非線性模型用于農(nóng)藥對蚯蚓毒性的分類研究,并將二者結(jié)果進(jìn)行對比。本研究的目的是建立一個準(zhǔn)確可靠的對蚯蚓毒性物質(zhì)分類的QSAR 模型,同時分析影響此類物質(zhì)對蚯蚓毒性作用的重要結(jié)構(gòu)信息特征。此外,采用主成分分析(principle component analysis,PCA)方法進(jìn)行數(shù)據(jù)分組,使得訓(xùn)練集樣本具有更廣泛的代表性。與前人的工作相比,本研究在數(shù)據(jù)集分組以及建模方法上均有改進(jìn)。

        1 材料與方法

        1.1 實(shí)驗(yàn)數(shù)據(jù)

        本研究中數(shù)據(jù)來源于文獻(xiàn)[14],共包含163種物質(zhì)(化合物編號6因結(jié)構(gòu)信息不足擯棄不用),其種類涵蓋了烷烴、烯烴、醇、醛、酮、酰胺、酚以及酯等。毒性數(shù)據(jù)用LC50(mg/kg)表示;根據(jù)OECD關(guān)于“蚯蚓急性毒性實(shí)驗(yàn)”[17],把實(shí)驗(yàn)濃度為1 000 mg/kg作為極限實(shí)驗(yàn)濃度。故本文中物質(zhì)毒性類別與文獻(xiàn)[14]相同,將163種物質(zhì)劃分為兩類。其中“1”代表有毒化合物(LC50<1 000 mg/kg)共106個,“0”代表無毒化合物(LC50>1 000 mg/kg),共57個。

        在QSAR 的研究中最關(guān)鍵的一步是訓(xùn)練集和測試集的劃分,因?yàn)樗⒛P偷姆夯芰σ蕾囉跀?shù)據(jù)集的劃分[18]。主成分分析(PCA)是一種基于降維思想產(chǎn)生的高維數(shù)據(jù)處理方法[19]。本文應(yīng)用意大利Talete公司研發(fā)的Dragon軟件[20]計算得到的分子結(jié)構(gòu)描述符對全部化合物作了主成分分析。取本征值大于1時,前3個主成分的總方差達(dá)到了51.78%,各自的方差貢獻(xiàn)率分別為38.3%、8.316%和5.164%。根據(jù)主成分分析的結(jié)果,我們挑選了131個化合物作為訓(xùn)練集,用來調(diào)節(jié)模型的結(jié)構(gòu)和訓(xùn)練參數(shù);剩余的32個化合物作為測試集,用于測試模型的泛化能力。從圖1中可以看出樣本分布比較均勻,訓(xùn)練集中的樣本能夠代表測試集中樣本的結(jié)構(gòu)特點(diǎn)和信息,說明訓(xùn)練集和測試集的數(shù)據(jù)劃分是合理的。

        圖1 主成分分析載荷圖Fig.1 Principal component analysis load diagram

        1.2 方法

        線性判別分析是一種模式判別方法,LDA 理論可參考相關(guān)文獻(xiàn)[21-22]。

        支持向量機(jī)由數(shù)學(xué)家Vapnik于1995年首先提出來[23-24],是一類可用于回歸和分類的有監(jiān)督的機(jī)器學(xué)習(xí)模型。它在解決非線性、小樣本及高維模式識別等問題中具有獨(dú)特的優(yōu)勢[25],如今SVM 已被廣泛使用于函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中[26]。關(guān)于SVM 算法理論可參考相關(guān)文獻(xiàn)[26-27],這里不再贅述。本研究中SVM 算法由R 語言實(shí)現(xiàn)。

        2 結(jié)果與討論

        2.1 LDA模型結(jié)果

        逐步線性判別分析得到了包含12個描述符的最佳模型(見表1)。其統(tǒng)計參數(shù)如下:n=131,AWilk’s-λ=0.393,BEigenvalue=1.546,OCanonicalCorr=0.779,SChisquare=114.932,p<0.000 1。從表1中最右一列可知,所有描述符的方差膨脹因子(variance inflation factor,VIF)值都小于5,說明它們之間是相互獨(dú)立的。這些描述符都能反映了不同的分子結(jié)構(gòu)特征,其具體含義見表1。

        本研究中涉及到的分子結(jié)構(gòu)呈多樣化,所以化合物對蚯蚓的毒性作用與分子結(jié)構(gòu)之間的關(guān)系就顯得較為復(fù)雜。在所選擇的12個描述符中,Sp MAD_L(spectral mean absolute deviation from Laplace matrix)屬于二維矩陣描述符,NssS(number of atoms of type ssS)是原子型電子狀態(tài)指數(shù)描述符,表述分子中含-S-片段的個數(shù)[20]。F03[O-O](frequency of O-O at topological distance 3)、B04[CO](presence/absence of C-O at topological distance 4)和F09[F-Cl](frequency of F-Cl at topological distance 9)是二維原子對描述符,表示分子結(jié)構(gòu)中特定鍵或結(jié)構(gòu)片段對毒性的影響[20]。F03[OO]與F09[F-Cl]分別指在拓?fù)渚嚯x3對應(yīng)的O-O結(jié)構(gòu)片段的頻率和在拓?fù)渚嚯x9對應(yīng)的F-Cl結(jié)構(gòu)片段的頻率,這些結(jié)構(gòu)片段的存在意味著會增強(qiáng)電負(fù)性從而物質(zhì)表現(xiàn)的毒性更強(qiáng),這一點(diǎn)從其在模型中系數(shù)為正可以解釋。GGI5(topological charge index of order 5)、GATS8i(Geary autocorrelation of lag 8 weighted by ionization potential)、JGI2(mean topological charge index of order 2)和MATS8i(Moran autocorrelation of lag 8 weighted by ionization potential)是二維自相關(guān)描述符,由原子物理化學(xué)性質(zhì)加權(quán)化的含氫拓?fù)浞肿咏Y(jié)構(gòu)計算而得,均和分子內(nèi)部的電子信息和分子幾何形狀有關(guān)[20]。對于GATS8i而言,值越小表明存在較強(qiáng)的空間自相關(guān),所以取值在0~1之間意味著是正相關(guān),而大于1時意味著負(fù)相關(guān),值為零則不存在相關(guān)。而對MATS8i則情況相反,該參數(shù)值為正意味著存在正相關(guān),取值為負(fù)則為負(fù)相關(guān)。GGI5等于分子中5級最大拓?fù)渚嚯x值的電荷指數(shù),而JGI2則由GGI5除以分子中對應(yīng)級數(shù)總電荷指數(shù)計算得到。MEcc(molecular eccentricity)屬于幾何描述符,表述分子形狀信息;Mor14s(signal 14/weighted by I-state)和Mor13p(signal 13/weighted by polarizability)是3D-MoRSE 描述符(3D-molecule representation of structures based on electron diffraction),這些描述符都是剔除了氫原子,考慮其他原子對分子幾何結(jié)構(gòu)的影響,包括極性和離子勢的作用[20]。綜上所述,這些描述符主要包含了分子幾何形狀、電荷分布特征以及極性等多方面的信息,其中對于分子毒性影響最大的是GATS8i和GGI5。

        該模型對于訓(xùn)練集的準(zhǔn)確率可達(dá)91.60%,無毒物質(zhì)有81個被正確區(qū)分,有毒物質(zhì)有39個被正確區(qū)分。模型對于測試集準(zhǔn)確率為75.00%,無毒物質(zhì)有19個被正確區(qū)分,有毒物質(zhì)有5個被正確區(qū)分;統(tǒng)計結(jié)果見表2。

        表2 LDA和SVM 模型的統(tǒng)計驗(yàn)證參數(shù)Tab.2 Statistical validation parameters of LDA and SVM models

        2.2 SVM 結(jié)果

        SVM 模型的結(jié)果取決于容量因子C,核函數(shù)K以及γ。但是要如何選擇最優(yōu)的參數(shù),目前還沒有明確的理論指導(dǎo)。本研究中采用留一法交互檢驗(yàn)的結(jié)果確定最優(yōu)模型的參數(shù)為C=334,Ggamma=0.036。該模型對訓(xùn)練集的準(zhǔn)確率可達(dá)96.18%,其中83個無毒物質(zhì)被正確區(qū)分,43個有毒物質(zhì)被正確區(qū)分;對測試集的準(zhǔn)確率達(dá)到了81.25%,其中20個無毒物質(zhì)被正確區(qū)分,6個有毒物質(zhì)被正確區(qū)分。

        2.3 LDA和SVM 結(jié)果比較

        上述可知,SVM 模型的預(yù)測結(jié)果要明顯優(yōu)于LDA 模型。比較兩模型的ROC 曲線(見圖2)可以看出,LDA 模型訓(xùn)練集和測試集的曲線下的面積(AUC)分別為0.964 和0.705;而SVM 模型則分別為0.991和0.732,均優(yōu)于LDA 模型。這意味著有機(jī)物對蚯蚓毒性作用的因素是復(fù)雜的,并非都與毒性作用成線性相關(guān);而應(yīng)用同樣的描述符,非線性模型更能準(zhǔn)確地識別出毒性作用與結(jié)構(gòu)因素之間的關(guān)系。

        圖2 LDA和SVM 模型的ROC曲線圖Fig.2 ROC curve of LDA and SVM models

        此外我們還對兩個模型對有毒物質(zhì)和無毒物質(zhì)的預(yù)測結(jié)果做了比較。SVM 模型對無毒物質(zhì)和有毒物質(zhì)預(yù)測的準(zhǔn)確率分別是92.79% 和94.23%,均高于LDA模型的88.50%和88.00%;SVM 和LDA 模型的結(jié)果均優(yōu)于文獻(xiàn)中的80.19% 和80.70%。

        在評價物質(zhì)毒性危害的時候,錯誤的否定要比錯誤的肯定更難令人接受,因前者會直接導(dǎo)致危害,而后者起到了警示作用[22]。SVM 模型對有毒物質(zhì)預(yù)測的準(zhǔn)確率達(dá)到了94.23%,高于LDA 的88.00%和文獻(xiàn)中的80.70%。在這種意義上說,我們在本文中建立的模型有利于風(fēng)險評估。

        兩個模型的敏感度、特異性、靈敏度等見表2。

        3 結(jié)論

        本文基于分子結(jié)構(gòu)描述符,應(yīng)用線性判別分析(LDA)和支持向量機(jī)(SVM)對163種有機(jī)物做了蚯蚓急性毒性的分類研究,所得兩模型的預(yù)測結(jié)果都是令人滿意的。與前人工作相比較,本文所建立的LDA 模型結(jié)果有所提高,而SVM 模型的結(jié)果更優(yōu)于LDA 模型結(jié)果。這說明化合物對蚯蚓的毒性作用是復(fù)雜的,非線性方法更能準(zhǔn)確地描述化合物的結(jié)構(gòu)因素與化合物毒性之間的關(guān)系。

        猜你喜歡
        描述符蚯蚓毒性
        基于結(jié)構(gòu)信息的異源遙感圖像局部特征描述符研究
        動物之最——毒性誰最強(qiáng)
        “害羞”的小蚯蚓
        Linux單線程并發(fā)服務(wù)器探索
        挖蚯蚓
        挖蚯蚓
        快樂語文(2017年9期)2017-06-15 20:28:36
        利用CNN的無人機(jī)遙感影像特征描述符學(xué)習(xí)
        RGD肽段連接的近紅外量子點(diǎn)對小鼠的毒性作用
        PM2.5中煤煙聚集物最具毒性
        吸入麻醉藥的作用和毒性分析
        涩涩国产在线不卡无码 | 乱色熟女综合一区二区三区| 精品视频一区二区三三区四区| 人妻系列无码专区久久五月天| 手机在线播放成人av| 激情内射亚洲一区二区三区| 蜜桃视频一区二区三区在线观看 | 精品人妻69一区二区三区蜜桃| 黑人巨茎大战俄罗斯美女| 免费无码成人av在线播放不卡| 仙女白丝jk小脚夹得我好爽| 美女和男人一起插插插| 国产国语亲子伦亲子| 丰满女人又爽又紧又丰满| 人妻少妇精品无码系列| 午夜影院免费观看小视频| 亚洲欧洲国产成人综合在线| 免费夜色污私人影院在线观看| 无码一区二区三区人| 人妻少妇中文字幕,久久精品| 亚洲 中文 欧美 日韩 在线| 亚洲国际无码中文字幕| 一区二区高清视频在线观看| 国产精品美女久久久网站三级| 国产女人高潮叫床视频| 亚洲AV一二三四区四色婷婷| 人妻乱交手机在线播放| 国产精品久久国产精麻豆99网站| 黄色视频免费在线观看| 偷拍区亚洲区一区二区| 桃色一区一区三区蜜桃视频| 久久天天躁狠狠躁夜夜av| 亚洲综合网在线观看首页| 亚洲av成人久久精品| 国产女人好紧好爽| 丰满少妇在线观看网站| 久久久久久无码AV成人影院| 手机在线看片国产人妻| 色橹橹欧美在线观看视频高清| 亚洲AⅤ无码片一区二区三区| 亚洲av无吗国产精品|