白帆 時(shí)靜潔(江蘇富淼科技股份有限公司,江蘇 張家港 215613)
基于蟻群算法對(duì)有機(jī)物熱容的預(yù)測(cè)研究
白帆時(shí)靜潔(江蘇富淼科技股份有限公司,江蘇張家港215613)
根據(jù)定量構(gòu)效關(guān)系(QSPR)原理,研究有機(jī)物熱容與其分子結(jié)構(gòu)間的內(nèi)在定量關(guān)系。以650種有機(jī)化合物作為樣本集,隨機(jī)選擇520種作為訓(xùn)練集,130種作為測(cè)試集,采用蟻群算法(ACO)進(jìn)行變量選擇,得到5個(gè)特征描述符作為模型的輸入變量,結(jié)合多元線性回歸(MLR)方法建立了蟻群-多元線性回歸(ACO-MLR)預(yù)測(cè)模型。研究結(jié)果表明:ACO-MLR模型的訓(xùn)練集和測(cè)試集的復(fù)相關(guān)系數(shù)分別為0.9430和0.9344,預(yù)測(cè)效果令人滿意。該研究提供了一種新的預(yù)測(cè)有機(jī)化合物熱容的方法。
熱容;蟻群算法;多元線性回歸;預(yù)測(cè)
熱容表示系統(tǒng)升高單位熱力學(xué)溫度時(shí)所吸收的熱[1],是化合物的基本熱學(xué)性質(zhì)之一。熱容的變化提供了化合物相變信息以及化合物分子結(jié)構(gòu)的變化,獲悉該方面信息是非常重要的。液體的熱容值在工程應(yīng)用中是一個(gè)非常重要的性質(zhì),在能量轉(zhuǎn)移以及熱動(dòng)力學(xué)的計(jì)算中也是必需的參數(shù)[2]。熱容性質(zhì)涉及到很多領(lǐng)域,其中包括石油化工行業(yè)、制藥和食品工業(yè)等。在這些行業(yè)的很多過(guò)程都涉及到了熱容,如蒸餾過(guò)程、蒸發(fā)過(guò)程、提取過(guò)程和加熱過(guò)程[3]。比如在某個(gè)溫度范圍內(nèi)進(jìn)行熱交換,離子液體會(huì)呈現(xiàn)出某些性質(zhì)而使物質(zhì)更穩(wěn)定,其中就包括熱容。熱容的實(shí)驗(yàn)測(cè)定有很多方法,但測(cè)定比較復(fù)雜,例如差示掃描量熱儀法[4]、熱線式方法[5]、溫度振蕩量熱法[6]等??紤]到獲取熱容的重要性以及實(shí)驗(yàn)測(cè)定的復(fù)雜性,發(fā)展方便可靠的理論預(yù)測(cè)熱容方法迫在眉睫。目前,關(guān)于理論預(yù)測(cè)有機(jī)物熱容的文獻(xiàn)比比皆是,但有機(jī)物液體熱容的QSPR預(yù)測(cè)模型卻為數(shù)不多。因此,本章擬從分子結(jié)構(gòu)角度出發(fā),應(yīng)用QSPR研究體系,系統(tǒng)研究有機(jī)物熱容與其分子結(jié)構(gòu)間的內(nèi)在定量關(guān)系,建立相應(yīng)的QSPR預(yù)測(cè)模型,并評(píng)價(jià)其模型的預(yù)測(cè)效果。
可靠的預(yù)測(cè)模型必須建立在可靠的實(shí)驗(yàn)樣本基礎(chǔ)之上。在定量結(jié)構(gòu)-性質(zhì)關(guān)系研究中,數(shù)據(jù)的精確性對(duì)于最終的結(jié)果具有至關(guān)重要的影響。本文研究的樣本集為650種有機(jī)化合物的熱容,包括碳?xì)浠衔?、鹵素化合物、醇、酯、醛、酮等。這些化合物涵蓋了廣泛的化學(xué)多樣性空間,為建立健壯、有效的預(yù)測(cè)模型奠定了基礎(chǔ)。此外,為了避免由于數(shù)據(jù)來(lái)源不統(tǒng)一造成的誤差,所有化合物熱容數(shù)據(jù)均來(lái)自于同一個(gè)數(shù)據(jù)庫(kù)——《有機(jī)化合物實(shí)驗(yàn)物性數(shù)據(jù)手冊(cè):含碳、氫、氧、鹵部分》。
分子描述符的計(jì)算首先是在HyperChem 7.5軟件中對(duì)分子結(jié)構(gòu)進(jìn)行輸入與優(yōu)化,導(dǎo)入Dragon 2.1軟件中計(jì)算分子描述符,獲得18類共1481種分子描述符,其計(jì)算的描述符種類包括結(jié)構(gòu)描述符,幾何描述符,拓?fù)涿枋龇取4罅康姆肿用枋龇斜厝淮嬖谌哂嘈畔?,因此?duì)常數(shù)或者近似常數(shù)的描述符以及描述符間相關(guān)系數(shù)達(dá)到0.95以上的描述符進(jìn)行刪除,減少至660個(gè)。如此龐大的分子描述符數(shù)量還是無(wú)法有效進(jìn)行QSPR模型的建立,因此,本文采用ACO對(duì)分子描述符進(jìn)行進(jìn)一步篩選。
運(yùn)用ACO對(duì)660個(gè)描述符進(jìn)行進(jìn)一步篩選,ACO是在VC++6.0中采用C語(yǔ)言編程,螞蟻數(shù)量設(shè)為500,揮發(fā)率設(shè)為0.9,進(jìn)行不斷迭代直至收斂,最終獲得5個(gè)特征描述符。隨后,以ACO篩選的5個(gè)描述符作為輸入?yún)?shù),運(yùn)用SPSS17.0統(tǒng)計(jì)軟件中的多元線性回歸模塊,在95%的置信區(qū)間內(nèi),得到了MLR預(yù)測(cè)模型,結(jié)果如下:
Cp=21.594-10.970*ATS4m+8.598*HATS4u+0.787
*TIC4+20.824*S1K+1.605*C-024(5.2)
n=520,R2=0.943,SD=21.250,F(xiàn)=1697.199,p<0.001
式中,Cp為熱容值,n為訓(xùn)練集樣本數(shù)目,R2為決定系數(shù),SD為模型標(biāo)準(zhǔn)誤差,F(xiàn)為F
檢驗(yàn)值,F(xiàn)實(shí)際=1697.199>F理論(5,514,0.05)=2.25,模型的顯著性概率p遠(yuǎn)小于0.05,認(rèn)為該回歸方程及所篩選變量的影響均是顯著的。
為檢驗(yàn)?zāi)P偷臄M合能力和外部預(yù)測(cè)能力,應(yīng)用該模型分別對(duì)訓(xùn)練集和測(cè)試集進(jìn)行預(yù)測(cè),其訓(xùn)練集和測(cè)試集的復(fù)相關(guān)系數(shù)分別為0.9430和0.9344。
本文運(yùn)用蟻群算法(ACO)作為分子描述符篩選方法,與多元線性回歸(MLR)方法進(jìn)行組合建立了ACO-MLR模型,對(duì)650種有機(jī)化合物的熱容進(jìn)行了QSPR研究。所建立的QSPR熱容預(yù)測(cè)模型的預(yù)測(cè)值與實(shí)驗(yàn)值非常接近,其R2均在0.9以上,預(yù)測(cè)誤差在可接受范圍之內(nèi)。因此,本文所建模型可用于對(duì)有機(jī)物熱容的預(yù)測(cè),為其提供了一種新的有效方法,對(duì)于化工安全設(shè)計(jì)和風(fēng)險(xiǎn)評(píng)價(jià)研究具有重要的意義。
[1]趙敏,強(qiáng)曉明,章韋芳.一種新型比熱容測(cè)量?jī)x[J].大學(xué)物理.2016(2).
[2]蔣華龍,周大偉,劉旭焱等.壓力下MoS2的結(jié)構(gòu)相變以及熱動(dòng)力學(xué)性質(zhì)的第一原理研究[J].低溫物理學(xué).2014(5).
[3]陳永艷,田瑞,王亞輝等.膜蒸餾系統(tǒng)中熱容腔結(jié)構(gòu)參數(shù)優(yōu)化的試驗(yàn)研究[J].工程熱物理學(xué)報(bào).2015(2).
[4]羅昭強(qiáng),譚蓬.應(yīng)用DSC法測(cè)量有機(jī)熱載體比熱容[J].鍋爐制造.2016(1).
[5]鄭明陽(yáng),王天為,張國(guó)鋒.理想氣體熱力學(xué)過(guò)程吸放熱情況的圖像判斷法[J].物理與工程.2014(3).
[6]張濤,孫冰.航天器再入全過(guò)程軸對(duì)稱燒蝕熱防護(hù)數(shù)值仿真研究[J].宇航學(xué)報(bào).2011(5).