亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于定量結(jié)構(gòu)-性質(zhì)相關(guān)性的烴類物質(zhì)爆炸下限預(yù)測(cè)*

        2010-02-26 06:32:08蔣軍成
        爆炸與沖擊 2010年3期
        關(guān)鍵詞:分子結(jié)構(gòu)結(jié)構(gòu)方法

        潘 勇,蔣軍成,王 睿

        (1.中國科學(xué)技術(shù)大學(xué)火災(zāi)科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,安徽 合肥230026;2.南京工業(yè)大學(xué)城市建設(shè)與安全工程學(xué)院,江蘇 南京210009)

        1 引 言

        爆炸極限是評(píng)價(jià)可燃?xì)怏w或蒸氣爆炸危險(xiǎn)性的重要參數(shù)之一,在防爆技術(shù)中應(yīng)用廣泛。它是風(fēng)險(xiǎn)評(píng)估以及確定可燃物質(zhì)儲(chǔ)存、運(yùn)輸、生產(chǎn)、使用安全性的依據(jù)之一;在監(jiān)測(cè)監(jiān)控技術(shù)中,它是一個(gè)重要的爆炸指示參量。因此,掌握各類可燃物質(zhì)的爆炸極限數(shù)據(jù)具有重要的現(xiàn)實(shí)意義。

        通過實(shí)驗(yàn)測(cè)定是目前獲取爆炸極限數(shù)據(jù)的有效方法。但實(shí)驗(yàn)方法對(duì)設(shè)備要求高、工作量大;實(shí)驗(yàn)結(jié)果影響因素眾多,差別較大。同時(shí),對(duì)于測(cè)量上有困難或尚未合成的物質(zhì),也無法基于實(shí)驗(yàn)進(jìn)行測(cè)定。因此,有必要開發(fā)簡(jiǎn)便可靠的爆炸極限理論預(yù)測(cè)模型,以彌補(bǔ)實(shí)驗(yàn)方法的不足。已有的爆炸極限理論預(yù)測(cè)方法主要包括經(jīng)驗(yàn)關(guān)聯(lián)法和基團(tuán)貢獻(xiàn)法2 大類[1],這些方法具有計(jì)算簡(jiǎn)單、使用簡(jiǎn)便等優(yōu)點(diǎn)。然而,在實(shí)際使用過程中也存在明顯的缺陷:經(jīng)驗(yàn)關(guān)聯(lián)法需要使用臨界壓力、等張比容等不常見的物化參數(shù),而這些參數(shù)的實(shí)驗(yàn)數(shù)據(jù)往往本身就比較缺乏;基團(tuán)貢獻(xiàn)法的應(yīng)用范圍則受研究體系的影響較大,如果某個(gè)基團(tuán)不在建模時(shí)選取的那組基團(tuán)范圍之內(nèi),那么對(duì)于含有該基團(tuán)的化合物就無法應(yīng)用該模型進(jìn)行預(yù)測(cè)。因此,上述方法的應(yīng)用范圍都具有較大的局限性,限制了在實(shí)際工程中的進(jìn)一步應(yīng)用。

        相關(guān)研究[2-3]表明,定量結(jié)構(gòu)-性質(zhì)相關(guān)性研究是一種能夠根據(jù)分子結(jié)構(gòu)實(shí)現(xiàn)有機(jī)物理化性質(zhì)預(yù)測(cè)的有效方法,它根據(jù)化合物性能與分子結(jié)構(gòu)密切相關(guān)的原理,尋求分子結(jié)構(gòu)與物質(zhì)性質(zhì)之間的內(nèi)在定量關(guān)系。其基本假設(shè)是有機(jī)物的性能與分子結(jié)構(gòu)密切相關(guān),分子結(jié)構(gòu)不同,性能就不同。而分子結(jié)構(gòu)可以用反映分子結(jié)構(gòu)特征的各種參數(shù)來描述,即有機(jī)物的理化性質(zhì)可用化學(xué)結(jié)構(gòu)的函數(shù)來表示。根據(jù)對(duì)分子結(jié)構(gòu)參數(shù)和實(shí)驗(yàn)數(shù)據(jù)的內(nèi)在定量關(guān)系,采用合適的統(tǒng)計(jì)建模方法進(jìn)行關(guān)聯(lián),建立分子結(jié)構(gòu)參數(shù)與理化性質(zhì)之間的關(guān)系模型。一旦建立了可靠的QSPR 模型,僅需分子的結(jié)構(gòu)信息,就可預(yù)測(cè)新的或尚未合成的有機(jī)物的各種性質(zhì)。目前,該方法已被廣泛應(yīng)用于有機(jī)物理化性質(zhì)及生物活性的預(yù)測(cè)研究[3]。

        本文中根據(jù)QSPR 研究基本原理,從分子結(jié)構(gòu)角度出發(fā),對(duì)354 種烴類物質(zhì)的爆炸下限與其分子結(jié)構(gòu)間的內(nèi)在定量關(guān)系進(jìn)行研究,建立根據(jù)分子結(jié)構(gòu)預(yù)測(cè)烴類物質(zhì)爆炸下限的理論模型。

        2 研究方法

        2.1 數(shù)據(jù)來源

        實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)確度直接影響到所建QSPR 模型的預(yù)測(cè)精度。爆炸下限實(shí)驗(yàn)值與其測(cè)定方法和測(cè)定裝置有關(guān),由于不同研究者采用的實(shí)驗(yàn)裝置和方法不同,測(cè)定的爆炸下限數(shù)據(jù)之間存在一定的差異。為排除這些因素可能對(duì)預(yù)測(cè)結(jié)果帶來的影響,確保實(shí)驗(yàn)樣本的可靠性和標(biāo)準(zhǔn)化,本文中統(tǒng)一選用美國化學(xué)工程師協(xié)會(huì)下屬DIPPR 數(shù)據(jù)庫中的354 種烴類化合物的爆炸下限數(shù)據(jù)作為實(shí)驗(yàn)樣本。這些化合物涵蓋廣泛的化學(xué)多樣性空間,為建立有效的預(yù)測(cè)模型奠定了基礎(chǔ)。

        2.2 結(jié)構(gòu)參數(shù)的計(jì)算和刪減

        要想尋求化合物性能與其分子結(jié)構(gòu)間的相關(guān)性,必須首先對(duì)反映化合物分子結(jié)構(gòu)特征和信息的各種結(jié)構(gòu)參數(shù)(如拓?fù)鋮?shù)、組成參數(shù)、電性參數(shù)以及幾何參數(shù)等)進(jìn)行計(jì)算,以獲取分子的結(jié)構(gòu)信息,實(shí)現(xiàn)分子結(jié)構(gòu)的參數(shù)化描述。本文中首先將所有樣本化合物結(jié)構(gòu)輸入Hyperchem 7.0 程序中,采用分子力學(xué)方法MM+進(jìn)行初步優(yōu)化,在此基礎(chǔ)上用半經(jīng)驗(yàn)方法AM1 進(jìn)一步進(jìn)行幾何優(yōu)化。隨后將優(yōu)化完的分子結(jié)構(gòu)輸入Dragon 2.1 程序中,對(duì)化合物的各種結(jié)構(gòu)參數(shù)進(jìn)行計(jì)算。通過計(jì)算,每個(gè)化合物均得到1 481 種結(jié)構(gòu)參數(shù)。

        同時(shí),為避免建模過程中“機(jī)會(huì)相關(guān)”現(xiàn)象的發(fā)生,必須預(yù)先對(duì)眾多的結(jié)構(gòu)參數(shù)進(jìn)行刪減,以剔除那些不能為模型提供有用信息的參數(shù)。首先,對(duì)于那些對(duì)所有化合物來說數(shù)值為常數(shù)或者近似常數(shù)(變化較小)的結(jié)構(gòu)參數(shù),由于無法對(duì)導(dǎo)致性質(zhì)差別的結(jié)構(gòu)差異性進(jìn)行有效表征,因此被刪除;同時(shí),對(duì)于兩者之間相關(guān)系數(shù)大于0.96 的任意2 個(gè)結(jié)構(gòu)參數(shù),由于存在“共線性”,因此其中之一也被刪除。經(jīng)過刪減,共剩下445 種結(jié)構(gòu)參數(shù)進(jìn)行下一步的特征變量篩選。

        2.3 基于遺傳算法的特征變量選擇

        如何從眾多的結(jié)構(gòu)參數(shù)中應(yīng)用特征變量選擇方法篩選出與目標(biāo)性質(zhì)最密切相關(guān)的結(jié)構(gòu)參數(shù),是QSPR 研究非常關(guān)鍵的問題。目前常用的特征變量選擇方法主要包括3 類:(1)基于多元線性回歸(M LR)的變量篩選方法,如向前/后選擇變量法、逐步回歸法等;(2)基于偏最小二乘(PLS)的變量篩選法,包括修正PLS 權(quán)重或系數(shù)以消除模型中無用變量的方法等;(3)基于搜索算法的變量篩選方法,如模擬退火法、遺傳算法(GA)等搜索算法和M LR、PLS 等多種建模方法相結(jié)合的變量篩選方法。其中,第1 類方法適用于變量間不存在多重共線性數(shù)據(jù)的變量篩選,優(yōu)點(diǎn)是方法簡(jiǎn)單直觀,缺點(diǎn)是它們不能遍歷所有的變量組合,也就不能保證尋找到變量空間里的最優(yōu)解。第2 類方法與第1 類方法類似,僅搜索變量空間的某些范圍,而不具備全局搜索能力,因此他們得到的常常是變量空間的局部最優(yōu)解,而非全局最優(yōu)解。

        遺傳算法是J.H.Holalnd[3]于1975 年最早提出的一種模擬生物在自然環(huán)境下的遺傳和進(jìn)化過程而形成的一種自適應(yīng)全局優(yōu)化概率搜索方法。它對(duì)需要解決問題的參量進(jìn)行編碼運(yùn)算,并沿多種路線進(jìn)行平行搜索,一般不會(huì)陷入局部最優(yōu)的陷阱中,能夠在多個(gè)局部較優(yōu)中找到全局最優(yōu)解。由于GA 具有相當(dāng)強(qiáng)的搜索能力,當(dāng)它與MLR、PLS 等建模方法相結(jié)合后,在一定條件下能夠在有限的時(shí)間內(nèi)搜尋到變量空間的最佳模型。因此,近年來GA 在QSPR 研究中得到了較為廣泛的應(yīng)用[5]。

        本研究將GA 與PLS 相結(jié)合(GA-PLS),對(duì)剩余的445 種結(jié)構(gòu)參數(shù)進(jìn)行優(yōu)化篩選,找出與爆炸下限最密切相關(guān)的結(jié)構(gòu)參數(shù)作為分子描述符,表征化合物的結(jié)構(gòu)特征。GA-PLS 程序通過Matlab 軟件實(shí)現(xiàn),選用“留1/10 法”交互驗(yàn)證的均方根誤差(RMS)作為適應(yīng)度函數(shù)。“留1/10 法”交互驗(yàn)證是指從訓(xùn)練集中每次篩除訓(xùn)練樣本數(shù)的1/10 個(gè)化合物,用其余的化合物建模,來預(yù)測(cè)所篩除化合物的性質(zhì),這樣得到一個(gè)交互驗(yàn)證的RMS 來評(píng)價(jià)模型性能的好壞。GA-PLS 所選用的其他相關(guān)參數(shù)為:種群規(guī)模30;初始染色體串長(zhǎng)度5;最大染色體串長(zhǎng)度30;突變概率1%;最大主成分?jǐn)?shù)由對(duì)包含所有自變量的模型進(jìn)行交互驗(yàn)證確定(≤15);最大進(jìn)化代數(shù)100。

        2.4 預(yù)測(cè)模型的建立

        最優(yōu)分子描述符確定以后,以它為輸入變量,分別采用多元線性回歸和支持向量機(jī)2 種方法,對(duì)烴類物質(zhì)爆炸下限與分子描述符間的內(nèi)在定量關(guān)系進(jìn)行關(guān)聯(lián),建立相應(yīng)的預(yù)測(cè)模型。

        多元線性回歸分析是一種較為常用的多元統(tǒng)計(jì)方法,它以線性最小二乘為基礎(chǔ),通過對(duì)輸入變量和輸出變量間的內(nèi)在定量關(guān)系進(jìn)行統(tǒng)計(jì)學(xué)習(xí),建立相應(yīng)的線性模型。本文中MLR 分析采用統(tǒng)計(jì)分析軟件SPSS 11.0 實(shí)現(xiàn),在95%置信區(qū)間,采用全回歸算法對(duì)烴類物質(zhì)爆炸下限數(shù)據(jù)與其分子描述符數(shù)據(jù)之間的線性關(guān)系進(jìn)行擬合。

        支持向量機(jī)(SVM)算法是V.N.Vapnik 等[6]在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上,于1995 年提出的一種新型機(jī)器學(xué)習(xí)方法。其基本思想是通過事先確定的非線性映射將輸入向量x 映射到一個(gè)高維特征空間中,然后在此高維空間中構(gòu)建最優(yōu)超平面,將問題轉(zhuǎn)化為2 次規(guī)劃。在2 次規(guī)劃中,目標(biāo)函數(shù)只涉及內(nèi)積運(yùn)算。如果采用核函數(shù)就可以避免在高維空間進(jìn)行復(fù)雜運(yùn)算,而通過原空間的函數(shù)來實(shí)現(xiàn)內(nèi)積運(yùn)算。因此,選擇適當(dāng)?shù)膬?nèi)積函數(shù)就可以實(shí)現(xiàn)某一非線性變換后的線性計(jì)算,而計(jì)算復(fù)雜度卻沒有增加。由于SVM 具有嚴(yán)格的理論基礎(chǔ),能較好地解決小樣本、非線性、高維數(shù)和局部最小等實(shí)際問題,因此在QSPR 研究領(lǐng)域也開始得到應(yīng)用[7]。本文中SVM 算法采用Libsvm 軟件運(yùn)行。為獲得最佳的泛化能力,在建模過程中需要調(diào)節(jié)相應(yīng)的參數(shù)組合,即選擇合適的核函數(shù)、確定核函數(shù)的參數(shù)、懲罰系數(shù)C 以及ε-不敏感損失函數(shù)中ε的大小。目前實(shí)際應(yīng)用中最多的是徑向基(RBF)形式的核函數(shù),它具有較高的學(xué)習(xí)效率和學(xué)習(xí)速率。對(duì)于RBF核函數(shù),最重要的參數(shù)是核函數(shù)的寬度γ,它與C 及ε一起,決定了SVM 的泛化能力及預(yù)測(cè)性能。由于這幾個(gè)參數(shù)之間有很大的相關(guān)性,因此采用格點(diǎn)搜索方法尋找最優(yōu)的參數(shù)組合。采用“留一法”交互驗(yàn)證方式進(jìn)行模擬,最優(yōu)模型所對(duì)應(yīng)的那組參數(shù)即被確定為最優(yōu)參數(shù)。

        2.5 模型驗(yàn)證

        模型驗(yàn)證對(duì)于QSPR 研究至關(guān)重要,在QSPR 模型建立以后,必須對(duì)模型的穩(wěn)定性、預(yù)測(cè)能力及泛化能力進(jìn)行檢驗(yàn)。常用的驗(yàn)證方法有內(nèi)部驗(yàn)證與外部驗(yàn)證2 種?!傲粢环ā苯换ヲ?yàn)證是常用的內(nèi)部驗(yàn)證方法,其結(jié)果以“留一法”交互驗(yàn)證的復(fù)相關(guān)系數(shù)表示。內(nèi)部交互驗(yàn)證主要是為了檢驗(yàn)?zāi)P偷姆€(wěn)定性以及其內(nèi)部預(yù)測(cè)能力,而相關(guān)研究表明[8],內(nèi)部驗(yàn)證結(jié)果的好壞并不能說明其外部預(yù)測(cè)能力的大小,對(duì)模型預(yù)測(cè)能力的評(píng)價(jià)必須通過對(duì)未參與訓(xùn)練的物質(zhì)進(jìn)行預(yù)測(cè),即外部驗(yàn)證的方式來進(jìn)行。通過對(duì)預(yù)測(cè)集化合物進(jìn)行外部驗(yàn)證,既能夠體現(xiàn)模型對(duì)未參與訓(xùn)練的樣本的真實(shí)預(yù)測(cè)能力,又能夠反映模型的泛化能力。模型的外部預(yù)測(cè)能力常用交互驗(yàn)證的外部復(fù)相關(guān)系數(shù)進(jìn)行衡量。因此,將樣本集隨機(jī)劃分為訓(xùn)練集(樣本總數(shù)80%)和預(yù)測(cè)集(樣本總數(shù)20%)2 部分,其中,訓(xùn)練集主要用于變量篩選和構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)集則主要用于對(duì)所建模型進(jìn)行外部驗(yàn)證。

        此外,均方根誤差RMS 和平均絕對(duì)誤差A(yù)AE 作為重要的統(tǒng)計(jì)學(xué)參數(shù),也被用來衡量所建模型的估計(jì)能力及預(yù)測(cè)性能。

        3 結(jié)果與討論

        3.1 GA-PLS結(jié)果

        運(yùn)用GA-PLS 方法進(jìn)行特征變量篩選,通過比較各模型預(yù)測(cè)RMS 的大小,確定本研究中與烴類物質(zhì)爆炸下限最密切相關(guān)的4 個(gè)結(jié)構(gòu)參數(shù)列于表1。表中,x1、x 2 和x3均屬于拓?fù)涿枋龇?主要描述分子中原子的連接信息。其中,x1與分子的相對(duì)頂點(diǎn)距離復(fù)雜度有關(guān);x2則主要描述分子的形狀,與分子中元素的差異度密切相關(guān);x3則主要反映整個(gè)分子的拓?fù)浣Y(jié)構(gòu)。x4屬于RDF 描述符,主要描述整個(gè)分子中的原子間距離信息,除此之外,它還與分子中鍵的距離、環(huán)的類型、平面和非平面體系及原子類型等信息有關(guān)。

        表1 GA-PLS篩選出的結(jié)構(gòu)參數(shù)Table 1 The descriptors selected by GA-PLS

        從以上討論可以看出,4 個(gè)結(jié)構(gòu)參數(shù)主要與分子的一些簡(jiǎn)單結(jié)構(gòu)特征有關(guān),如分子的大小和形狀、分子中原子的分布等。因此,可以將影響烴類物質(zhì)爆炸下限的主要結(jié)構(gòu)特征歸納為分子的大小、形狀以及分子中原子的分布信息等。

        對(duì)于任意已知分子結(jié)構(gòu)的化合物,上述4 個(gè)結(jié)構(gòu)參數(shù)均可以通過Dragon 軟件進(jìn)行計(jì)算,各參數(shù)的具體計(jì)算公式及過程可參見文獻(xiàn)[9]。

        3.2 MLR 模型結(jié)果

        以GA-PLS 提取的4 個(gè)結(jié)構(gòu)參數(shù)作為輸入變量,針對(duì)訓(xùn)練集樣本,運(yùn)用M LR 方法建立爆炸下限線性預(yù)測(cè)模型

        式中:φ為爆炸下限,n 為樣本數(shù),R2為復(fù)相關(guān)系數(shù),F 為F 檢驗(yàn)值,S 為標(biāo)準(zhǔn)誤差,P 為方程的顯著性概率。由式(1)可知,模型具有較高的相關(guān)系數(shù)和較低的標(biāo)準(zhǔn)誤差,說明模型是可靠的;顯著性概率遠(yuǎn)小于0.05,表明回歸方程具有統(tǒng)計(jì)學(xué)意義。

        隨后,應(yīng)用式(1)分別對(duì)訓(xùn)練集樣本和預(yù)測(cè)集樣本進(jìn)行預(yù)測(cè)。對(duì)預(yù)測(cè)集中70 個(gè)樣本的預(yù)測(cè)值見表2,對(duì)所有樣本所得的爆炸下限預(yù)測(cè)值與目標(biāo)值的比較見圖1,模型的主要性能參數(shù)見表3。

        表2 預(yù)測(cè)集樣本爆炸下限預(yù)測(cè)值Table 2 The predicted values for the test set

        表3 MLR 和SVM 模型的主要性能參數(shù)比較Table 3 Performance parameters obtained by SVM and MLR models

        3.3 SVM 模型結(jié)果

        為了與MLR 模型具有可比性,SVM 模擬中選取的訓(xùn)練集和預(yù)測(cè)集與M LR 相同,采用同樣的4 個(gè)結(jié)構(gòu)參數(shù)作為模型輸入變量。通過格點(diǎn)搜索方法確定SVM 模型的最優(yōu)參數(shù)如下:C=512,ε=0.031 25,γ=0.25,相應(yīng)的支持向量數(shù)為129。應(yīng)用所建模型分別對(duì)訓(xùn)練集樣本和預(yù)測(cè)集樣本進(jìn)行預(yù)測(cè)。對(duì)預(yù)測(cè)集中70 個(gè)樣本的預(yù)測(cè)值見表2,對(duì)所有樣本所得的爆炸下限預(yù)測(cè)值與目標(biāo)值的比較見圖2,模型的主要性能參數(shù)見表3。

        圖1 MLR 模型爆炸下限預(yù)測(cè)值與目標(biāo)值的比較Fig.1 Comparison between the predicted and observed LFL by MLR

        圖2 SVM 模型爆炸下限預(yù)測(cè)值與目標(biāo)值的比較Fig.2 Comparison betw een the predicted and observed LFL by SVM

        3.4 模型穩(wěn)定性分析

        為進(jìn)一步排除所建模型可能存在的“機(jī)會(huì)相關(guān)”現(xiàn)象,采用“y-scrambling”方法分別對(duì)MLR 和SVM 模型進(jìn)行驗(yàn)證,評(píng)估2 個(gè)模型對(duì)“機(jī)會(huì)相關(guān)”現(xiàn)象的依賴程度。首先將訓(xùn)練集樣本中的自變量x 保持不變,將對(duì)應(yīng)的應(yīng)變量y 順序隨機(jī)打亂,使應(yīng)變量和自變量不再對(duì)應(yīng),以消除兩者之間存在的內(nèi)在定量關(guān)系;隨后,針對(duì)上述改變序列的樣本集建立新的QSPR 模型,并對(duì)其相關(guān)性能參數(shù)如RMS 等進(jìn)行計(jì)算;將上述過程重復(fù)50 ~100 次,獲得某一相對(duì)“最優(yōu)”的預(yù)測(cè)模型,并將其與基于原始樣本數(shù)據(jù)建立的實(shí)際預(yù)測(cè)模型進(jìn)行比較。若實(shí)際模型的性能參數(shù)明顯優(yōu)于“最優(yōu)”模型,則認(rèn)為原始樣本數(shù)據(jù)中存在真正的QSPR 關(guān)系,所建立的預(yù)測(cè)模型不存在“機(jī)會(huì)相關(guān)”現(xiàn)象。

        將“y-scrambling”方法針對(duì)2 個(gè)預(yù)測(cè)模型分別運(yùn)行100 次,對(duì)于MLR 模型,所得最小RMS 為5.95,對(duì)于SVM 模型,最小RMS 為4.71,兩者均分別接近原始模型預(yù)測(cè)誤差的100 倍。由此可見,只有在使用正確的應(yīng)變量數(shù)據(jù)時(shí)才能產(chǎn)生合理的QSPR 模型,因而本文中所建立的預(yù)測(cè)模型不存在“機(jī)會(huì)相關(guān)”現(xiàn)象,具備較強(qiáng)的穩(wěn)定性。

        此外,還給出了2 種模型的預(yù)測(cè)殘差分布圖(圖3、4)。從圖中可以看出,2 種模型的預(yù)測(cè)殘差都均勻且隨機(jī)分布于0基準(zhǔn)線的兩側(cè),可見預(yù)測(cè)模型在建立過程中未產(chǎn)生系統(tǒng)誤差。

        圖3 M LR 模型爆炸下限預(yù)測(cè)殘差圖Fig.3 Plot of the residuals versus the observed values for the M LR model

        圖4 SVM 模型爆炸下限預(yù)測(cè)殘差圖Fig.4 Plot of the residuals versus the observed values for the SVM model

        3.5 模型的比較與分析

        3.5.1 M LR 模型與SVM 模型的比較

        從表3 可以看出,2 種預(yù)測(cè)模型的精度均令人滿意,其中MLR 模型的預(yù)測(cè)平均絕對(duì)誤差為0.041%,S VM 模型的預(yù)測(cè)平均絕對(duì)誤差為0.036%,均在實(shí)驗(yàn)誤差允許范圍之內(nèi)。這說明本文中基于遺傳算法所篩選出的4 個(gè)結(jié)構(gòu)參數(shù)能夠有效地表征與烴類物質(zhì)爆炸下限密切相關(guān)的結(jié)構(gòu)特征,同時(shí)基于這些參數(shù)所建立的預(yù)測(cè)模型能夠成功地對(duì)未知物質(zhì)的爆炸下限進(jìn)行預(yù)測(cè)。

        此外,從表3 還可以看出,無論是對(duì)于訓(xùn)練集還是預(yù)測(cè)集,SVM 模型的性能都要明顯優(yōu)于MLR 模型。原因可能主要在于以下2 方面:一是烴類物質(zhì)爆炸下限與其分子結(jié)構(gòu)之間可能存在著較強(qiáng)的非線性關(guān)系,與線性MLR 方法相比,S VM 方法因具有強(qiáng)大的非線性擬合能力而體現(xiàn)出較強(qiáng)的優(yōu)越性;同時(shí),SVM 是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的機(jī)器學(xué)習(xí)方法,它追求置信范圍值的最小化,而非訓(xùn)練誤差的最小化,因此與MLR 相比具有更好的泛化性能。但是,SVM 方法建立的是一種“黑箱”模型,不能給出直觀的數(shù)學(xué)模型,因而無法準(zhǔn)確了解各分子描述符對(duì)模型的貢獻(xiàn)值,而這些正是MLR模型的優(yōu)勢(shì)。因此,這2 種方法各有利弊,并存在一定的互補(bǔ)性。

        3.5.2 與其他預(yù)測(cè)模型的比較

        為進(jìn)一步驗(yàn)證本文預(yù)測(cè)模型的優(yōu)越性,將其與T.A.Albahri[10]所建立的烴類物質(zhì)爆炸下限預(yù)測(cè)模型進(jìn)行比較。關(guān)于樣本集的大小,Albahri 模型的樣本數(shù)(472)大于本文模型(354),然而,Albah ri 模型的外部預(yù)測(cè)樣本數(shù)(18)卻明顯少于本文模型(70),僅占其樣本總數(shù)的4%左右,不滿足QSPR 研究的一般要求[8];關(guān)于模型的輸入?yún)?shù),Albahri 模型基于基團(tuán)貢獻(xiàn)法原理以19 個(gè)分子基團(tuán)作為輸入?yún)?shù),而本文僅以4 個(gè)結(jié)構(gòu)參數(shù)作為分子描述符,一方面使所建立的預(yù)測(cè)模型更為簡(jiǎn)便和穩(wěn)固,另一方面因結(jié)構(gòu)參數(shù)具有明確的物理意義因而便于對(duì)影響爆炸下限的重要結(jié)構(gòu)特征進(jìn)行解釋和研究;關(guān)于模型性能參數(shù),T.A.Albahri 建立的非線性預(yù)測(cè)模型(0.04%)與本文MLR 模型相比(0.045%)較優(yōu),與SVM 模型(0.035%)相比則較差,這驗(yàn)證了前文關(guān)于爆炸下限與分子結(jié)構(gòu)之間可能存在較強(qiáng)非線性關(guān)系的推斷;關(guān)于模型的適用范圍,Albahri 模型基于基團(tuán)貢獻(xiàn)法原理建立,其應(yīng)用范圍受研究體系的影響較大,如果某個(gè)基團(tuán)不在建模所選取的那組基團(tuán)范圍之內(nèi),那么對(duì)于含有該基團(tuán)的化合物就無法應(yīng)用該模型進(jìn)行預(yù)測(cè),而本文預(yù)測(cè)模型則以僅需分子結(jié)構(gòu)就能計(jì)算的分子結(jié)構(gòu)參數(shù)作為描述符,理論上能夠?qū)λ幸阎肿咏Y(jié)構(gòu)的烴類物質(zhì)進(jìn)行預(yù)測(cè),適用范圍更廣。由此可見,與已有的烴類物質(zhì)爆炸下限預(yù)測(cè)模型相比,本文模型在模型穩(wěn)定性、模型解釋、模型預(yù)測(cè)能力和適用范圍等方面都具有一定的優(yōu)越性。

        4 結(jié) 論

        應(yīng)用遺傳算法從大量分子結(jié)構(gòu)參數(shù)中優(yōu)化篩選出與烴類物質(zhì)爆炸下限最密切相關(guān)的一組結(jié)構(gòu)參數(shù),得出了影響爆炸下限的主要結(jié)構(gòu)特征為分子的大小、形狀以及分子中原子的分布信息。同時(shí),以上述結(jié)構(gòu)參數(shù)作為分子描述符,分別應(yīng)用MLR 和SVM 方法建立了相應(yīng)的爆炸下限預(yù)測(cè)模型,實(shí)現(xiàn)了根據(jù)分子結(jié)構(gòu)預(yù)測(cè)爆炸下限的功能。

        [1] Vidal M, Rogers W J, Holste J C,et al.A review of estimation methods for f lash points and f lammability limits[J].Process Safety Progress,2004,23(1):47-55.

        [2] Katritzky A R, Lobanov V S, Karelson M.QSPR:The correlation and quantitative prediction of chemical and physical properties from structure[J].Chemical Society Review s,1995,24(4):279-287.

        [3] 王連生,韓朔睽.分子結(jié)構(gòu)、性質(zhì)與活性[M].北京:化學(xué)工業(yè)出版社,1997.

        [4] H olland J H.Adaptation in natural and artificial systems[M].Ann Arbor:University of Michigan Press,1975.

        [5] Niculescu S P.Artificial neural netw orks and genetic algorithms in QSAR[J].Journal of Molecular Structure:TH EOCH EM,2003,622(l-2):71-83.

        [6] Vapnik V N.The nature of statistical learning theory[M].New York:Springer,1995.

        [7] 劉煥香.基于支持向量機(jī)方法的QSAR/QSPR 在化學(xué)、生物及環(huán)境科學(xué)中的應(yīng)用研究[D].蘭州:蘭州大學(xué),2005.

        [8] T ropsha A,Gramatica P, Gombar V K.The importance of being earnest:Validation is the absolute essential for successful application and interpretation of QSPR models[J].QS AR&Combinatorial Science,2003,22(1):69-77.

        [9] Todeschini R,Consonni V.Handbook of molecular descriptors[M].Weinheim:Wiley-VCH, 2000.

        [10] Albahri T A.Flammability characteristics of pure hydrocarbons[J].Chemical Engineering Science,2003,58(16):3629-3641.

        猜你喜歡
        分子結(jié)構(gòu)結(jié)構(gòu)方法
        把握分子結(jié)構(gòu)理解物質(zhì)的性質(zhì)
        《形而上學(xué)》△卷的結(jié)構(gòu)和位置
        論結(jié)構(gòu)
        中華詩詞(2019年7期)2019-11-25 01:43:04
        三步法確定有機(jī)物的分子結(jié)構(gòu)
        解讀分子結(jié)構(gòu)考點(diǎn)
        外電場(chǎng)中BiH分子結(jié)構(gòu)的研究
        可能是方法不對(duì)
        論《日出》的結(jié)構(gòu)
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        精品国产乱码久久久软件下载| 青青草小视频在线观看| 国产成人无码av一区二区在线观看| 55夜色66夜色国产精品视频| 中文字幕国产欧美| 亚洲精品二区在线观看| 中文字幕色偷偷人妻久久一区| 尤物在线精品视频| 中文字幕一区二区三区久久网站| 无码AV无码免费一区二区| 国产精品久久av色婷婷网站| 国产电影无码午夜在线播放| 69久久夜色精品国产69| 最新国产成人综合在线观看| 亚洲av乱码国产精品观| 国产乱人偷精品人妻a片| a在线观看免费网站大全| 国产人妖xxxx做受视频| 男女上床免费视频网站| 亚洲日韩精品一区二区三区| 少妇的肉体k8经典| 亚洲精品美女久久久久网站| 亚洲av三级黄色在线观看| 少妇粉嫩小泬喷水视频www| 亚洲人成7777影视在线观看| 国产一区二区三区免费小视频| 蜜臀一区二区三区精品| 亚洲精品无码成人a片| 国产精品视频免费的| 色噜噜亚洲精品中文字幕| 国产v片在线播放免费无码| 亚洲第一成人网站| 日韩av一区在线播放| 亚洲成人中文字幕在线视频| 米奇影音777第四色| 日韩久久久黄色一级av| 久久精品亚洲一区二区三区画质| 粗大的内捧猛烈进出小视频 | 免费大片黄国产在线观看| 亚洲中文字幕无码久久2020| 中国精品久久久久国产|