亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于定量結(jié)構(gòu)-性質(zhì)關(guān)系預(yù)測含水二元共沸物的共沸溫度與組成

        2020-08-22 09:40:56曾行艷呂利平
        化學(xué)工業(yè)與工程 2020年4期
        關(guān)鍵詞:能力模型

        曾行艷,諸 林*,呂利平,,李 兵

        (1. 西南石油大學(xué)化學(xué)化工學(xué)院,成都 610500; 2. 長江師范學(xué)院化學(xué)化工學(xué)院,重慶 408100)

        由于水具有安全、無毒、可再生能力強(qiáng)及溶解性能好的特點(diǎn),被廣泛應(yīng)用于化工和醫(yī)藥等行業(yè)。在生產(chǎn)過程中,水和其他原料直接或間接的參與生產(chǎn)過程,會(huì)產(chǎn)生大量的含水共沸廢液,如乙腈/水[1]、乙二胺/水[2]及四氫呋喃/水[3]等二元共沸物。 為了實(shí)現(xiàn)資源循環(huán)利用及環(huán)境保護(hù)的目的,需要采用特殊精餾對其進(jìn)行分離。

        共沸特性數(shù)據(jù)是分離工藝設(shè)計(jì)、模擬及優(yōu)化的基礎(chǔ)。 如果僅僅依靠實(shí)驗(yàn)來獲取該類數(shù)據(jù),會(huì)花費(fèi)大量的時(shí)間和經(jīng)濟(jì)成本。 相比之下,狀態(tài)方程法[4-5]、活度系數(shù)法[6-7]、經(jīng)驗(yàn)法[8-9]以及定量結(jié)構(gòu)-性質(zhì)關(guān)系(QSPR)模型[10-11]等理論計(jì)算方法就具有簡單、快速的特點(diǎn)。 目前,很多研究者利用理論計(jì)算方法預(yù)測了部分共沸物及混合物的相平衡數(shù)據(jù),并取得了較好的效果[4,7-8,12-13]。 但是,前3 種方法在預(yù)測共沸物的共沸特性數(shù)據(jù)時(shí),需要一些必要的實(shí)驗(yàn)參數(shù)或擬合參數(shù),而通常這類參數(shù)的獲取難度是比較大的。 QSPR模型具有計(jì)算量小、耗時(shí)短及精度高等優(yōu)點(diǎn),而且相關(guān)所需參數(shù)均可由分子結(jié)構(gòu)計(jì)算所得,并不需要任何額外的實(shí)驗(yàn)數(shù)據(jù),被廣泛應(yīng)用于化工等領(lǐng)域[14-17],如Liang 等從QSPR 中探索變壓蒸餾過程設(shè)計(jì)和動(dòng)態(tài)控制的關(guān)系,且利用QSPR 確定萃取精餾中溶劑對分離混合物相對揮發(fā)性的影響[18-20]。

        基于此,本研究以125 種含水二元共沸物為研究對象,利用定量結(jié)構(gòu)-性質(zhì)關(guān)系分別構(gòu)建可以高精度預(yù)測含水二元共沸物共沸溫度及組成的QSPR 模型,以獲取常壓下該類共沸物的共沸特性數(shù)據(jù);同時(shí),也可為其他特殊種類二元共沸物共沸數(shù)據(jù)的預(yù)測提供參考和思路。

        1 樣本數(shù)據(jù)獲取及分子描述符篩選

        1.1 樣本數(shù)據(jù)的獲取

        為保證所建的QSPR 模型不受數(shù)據(jù)源的影響,本文涉及到的125 種含水二元共沸物的共沸特性數(shù)據(jù)均選自溶劑手冊[21]。 同時(shí),本研究根據(jù)“Mixtures out”樣本劃分法[22]隨機(jī)將整個(gè)數(shù)據(jù)集分為訓(xùn)練集(80%)和測試集(20%),以達(dá)到有效表征各類含水二元共沸物體系的目的,詳見附件1 表1。 其中,訓(xùn)練集用于篩選特征描述符及建立QSPR 模型,測試集則用于評估所建模型的預(yù)測能力及泛化推廣能力[13]。

        1.2 分子結(jié)構(gòu)的優(yōu)化

        常見分子結(jié)構(gòu)繪制和優(yōu)化軟件有Symyx Draw、HyperChem、Gauss 和ChemOffice 等[15,23]。 本 研 究采用HyperChem 8.0 軟件繪制和優(yōu)化純組分的三維分子結(jié)構(gòu)以獲取分子的最小能量構(gòu)象。 相關(guān)優(yōu)化步驟如下:先通過分子力學(xué)方法(MM+)預(yù)優(yōu)化;再由量子力學(xué)半經(jīng)驗(yàn)方法(PM3)進(jìn)一步優(yōu)化。 在優(yōu)化過程中采用Polack-Ribiere 算法,且所有計(jì)算在Hartree-Fock 能級進(jìn)行,至均方根梯度極限達(dá)到4.18×107kJ·m-1·mol-1[24]。

        2 共沸溫度及共沸組成QSPR 模型

        2.1 分子描述符的篩選與模型構(gòu)建

        2.1.1 分子描述符的篩選

        為準(zhǔn)確的表征分子的結(jié)構(gòu)特性,需要對分子描述符進(jìn)行篩選,包括預(yù)篩選和進(jìn)一步篩選,其篩選過程示意圖如圖1 所示。 本研究利用Materials Studio 8.0 軟件計(jì)算純物質(zhì)的分子描述符,得到包括拓?fù)涿枋龇?、結(jié)構(gòu)描述符及空間描述符等的15 類共344 種分子描述符;再以何培等選用的2 個(gè)基本原則[25]對其進(jìn)行預(yù)篩選,以消除無用及冗余信息,減少共線性出現(xiàn)的概率,經(jīng)預(yù)篩選后得到76 種分子描述符;再根據(jù)“Kay’s mixing rule”混合規(guī)則[26]計(jì)算得到二元共沸物的混合描述符,并采用遺傳算法對其進(jìn)一步篩選[27]。

        2.1.2 共沸溫度及組成模型的構(gòu)建

        經(jīng)篩選后的混合描述符即可用于建立共沸溫度及組成的QSPR 模型,模型的構(gòu)建過程如圖1 所示。 式(1)~(6)給出了不同混合描述符個(gè)數(shù)(4 ~9)的共沸溫度預(yù)測模型,模型中的描述符以Ai表示;而式(7) ~(11)給出了不同混合描述符個(gè)數(shù)(2 ~6)的共沸組成預(yù)測模型,模型中的描述符以Bi表示,表1 列出了建模所涉及的全部描述符。

        圖1 特征描述符篩選及多元線性回歸建模選示意圖Fig.1 A schematic diagram of feature descriptor screening and multiple linear regression modeling

        2.1.2.1 共沸溫度模型

        模型1:

        表1 共沸溫度及組成預(yù)測模型構(gòu)建所涉及的全部描述符Table 1 The descriptors involved in the establishment of the azeotropic temperature and composition prediction models

        2.1.2.2 共沸組成模型

        2.2 模型篩選

        圖2 和圖3 分別為所建共沸溫度及組成預(yù)測模型的復(fù)相關(guān)系數(shù)( R2),調(diào)整復(fù)相關(guān)系數(shù)( R2adj)和留一法交叉驗(yàn)證系數(shù)( Q2LOO)與混合描述符個(gè)數(shù)(n)的變化趨勢關(guān)系圖。 從圖2 可以看出,當(dāng)n 由4 增加到8 時(shí),共沸溫度預(yù)測模型的R2,R2adj和Q2LOO曲線穩(wěn)健上升,而當(dāng)增加第9 個(gè)混合描述符時(shí)3 個(gè)參數(shù)曲線均變得十分平緩,說明增加第9 個(gè)混合描述符對模型的擬合能力及穩(wěn)定性提升不大。 從圖3 可以看出,當(dāng)n 由2 增加到3 時(shí),共沸組成預(yù)測模型的R2,R2adj和Q2LOO曲線急劇上升;當(dāng)n 由3 增加到5 時(shí),3 個(gè)參數(shù)曲線緩慢上升;當(dāng)增加第6 個(gè)混合描述符時(shí)參數(shù)曲線幾乎沒有變化;這說明增加第6 個(gè)混合描述符對模型的擬合能力及穩(wěn)定性幾乎不影響。由此可知,最適宜共沸溫度及組成預(yù)測模型的最適宜描述符個(gè)數(shù)是8/5。

        圖2 共沸溫度預(yù)測模型的描述符個(gè)數(shù)與R2,的關(guān)系Fig.2 The relationship between the number of descriptors and R2, of azeotropic temperature prediction models

        圖3 共沸組成預(yù)測模型的描述符個(gè)數(shù)與R2,R2adj, 的關(guān)系Fig.3 The relationship between the number of descriptors and R2,, of azeotropic composition prediction models

        2.2.2 過擬合及顯著性比較

        擬合缺失分?jǐn)?shù)(LOF)作為遺傳函數(shù)算法的適度函數(shù),其變化趨勢可用于判斷模型是否出現(xiàn)過擬合;而F 檢驗(yàn)值的大小代表著方程的顯著性,F 檢驗(yàn)值越大則表明該模型的回歸假設(shè)因果關(guān)系顯著性越高。 圖4 和圖5 分別是共沸溫度及組成預(yù)測模型的LOF 和F 值與混合描述符個(gè)數(shù)的關(guān)系圖。 由圖4可知,當(dāng)n 由4 增加到8 時(shí),LOF 值隨n 的增加而快速下降,說明利用8 個(gè)特征描述符構(gòu)建的模型不存在過擬合現(xiàn)象;而F 檢驗(yàn)值隨n 的增加有略微降低,但當(dāng)n 增加到8 時(shí),F 值也比較高(280.51),說明混合描述符數(shù)為8 時(shí),共沸溫度模型的回歸假設(shè)因果關(guān)系顯著性良好。 由圖5 可知,當(dāng)n 由2 變化到5 時(shí),LOF 值隨n 的增加先急劇下降隨后逐漸減小,說明利用5 個(gè)特征描述符數(shù)構(gòu)建的模型不存在過擬合現(xiàn)象,而F 檢驗(yàn)值隨n 的增加先快速增加隨后在一定范圍內(nèi)波動(dòng),當(dāng)混合描述符數(shù)為5 時(shí),模型的回歸假設(shè)因果關(guān)系顯著性稍弱。 綜上所述,利用8/5 個(gè)混合描述符所構(gòu)建的共沸溫度及組成預(yù)測模型不存在過擬合問題,且模型的假設(shè)因果關(guān)系顯著性高。

        2.3 最適宜模型分析

        圖4 共沸溫度預(yù)測模型的混合描述符個(gè)數(shù)與LOF 和F 的關(guān)系Fig.4 The relationship between the number of mixed descriptors and the LOF and F of azeotropic temperature prediction models

        圖5 共沸組成預(yù)測模型的混合描述符個(gè)數(shù)與LOF 和F 的關(guān)系Fig.5 The relationship between the number of mixed descriptors and the LOF and F of azeotropic composition prediction models

        表2 給出了最適宜的共沸溫度及組成QSPR 模型(模型5/模型10)的特征描述符(以下稱之為變量)及統(tǒng)計(jì)學(xué)參數(shù)。 從表2 中可知,模型5 的8 個(gè)變量的標(biāo)準(zhǔn)系數(shù)分別為0.784、0.287、-0.235、0.184、0.156、0.097、0.150 和0.104,由 此 可 知 其 中 僅 有Chi (5): path/cluster 與共沸溫度呈負(fù)相關(guān);模型10的5 個(gè)變量的標(biāo)準(zhǔn)系數(shù)分別為- 0.131、0.252、0.457、0.497 和-0.118,由此可知其中Hydroxy 和Vertex adjacency/magnitude 描述符與共沸組成呈負(fù)相關(guān),2 個(gè)模型各變量的具體數(shù)據(jù)如附件1 表2 和表3 所示。 此外,上述的13 個(gè)變量t-概率值均小于或等于0.005,說明這些變量對含水二元共沸物的共沸溫度及組成的影響均是顯著的。 模型5 和模型10 的R2和R2adj分別為0.960 6/0.997 0 和0.957 2/0.996 9,2 個(gè)模型的MAE 和RMSE 的值均較小,分別為1.890 0/0.010 4 和2.940 0/0.016 1,說明2 個(gè)模型分別對訓(xùn)練集共沸溫度及組成的實(shí)驗(yàn)數(shù)據(jù)具有較好的擬合能力和預(yù)測能力。

        圖6 和圖7 分別是變量對各QSPR 模型的影響占比情況。 從圖6 可以看出模型5 的8 個(gè)變量對含水二元共沸物共沸溫度的影響程度由大到小排序?yàn)?Hydrogen bond donor >Chi (4): path >Chi (5): path/cluster >Chi (4): path/cluster (valence modified)>Complementary information content (CIC)>Estate keys (indicators): I_sCH3>Molecular shadow area fraction: ZX plane >E-state keys (sums): S_dO。從圖7 中可以看出模型10 的5 個(gè)變量對含水二元共沸物共沸組成的影響程度由大到小排序?yàn)镾tructural information content (SIC)>Complementary information content ( CIC) >Bond information content (BIC)>Hydroxy>Vertex adjacency/magnitude。

        表2 最適宜的QSPR 模型的變量及統(tǒng)計(jì)學(xué)參數(shù)Table 2 The variables and statistical parameters of the optimal QSPR model

        圖6 特征描述符對共沸溫度預(yù)測模型的影響Fig.6 Effect of each feature descriptors on the optimal azeotropic temperature model

        2.4 模型驗(yàn)證

        2.4.1 內(nèi)部及外部驗(yàn)證

        圖7 特征描述符對共沸組成預(yù)測模型的影響Fig.7 Effect of each feature descriptors on the optimal azeotropic composition model

        利用留一法交叉驗(yàn)證對模型的內(nèi)部穩(wěn)定性進(jìn)行了分析,2 個(gè)模型的留一法交叉驗(yàn)證系數(shù)Q2LOO分別為0.947 5 和0.995 7,說明數(shù)據(jù)的擬合度良好,所建模型非常穩(wěn)定。 在內(nèi)部驗(yàn)證的基礎(chǔ)上進(jìn)行外部驗(yàn)證能進(jìn)一步證明模型的真實(shí)有效性及外部預(yù)測能力,因此,本研究對測試集樣本的共沸溫度及組成進(jìn)行了預(yù)測。 圖8 和圖9 是共沸溫度及組成的實(shí)驗(yàn)值與預(yù)測值的關(guān)系圖,從圖8 和圖9 中可以看出,2 個(gè)模型的測試集的預(yù)測效果和訓(xùn)練集的預(yù)測效果一致,散點(diǎn)均位于對角線附近,僅存在1 個(gè)共沸組成預(yù)測數(shù)據(jù)偏離對角線稍遠(yuǎn),2 個(gè)模型的外部驗(yàn)證系數(shù)分別為0.943 9 和0.997 6,說明2 個(gè)模型的預(yù)測準(zhǔn)確性高,泛化推廣能力好。

        圖8 共沸溫度的實(shí)驗(yàn)值和預(yù)測值的比較Fig.8 Comparison of experimental and predicted values of azeotropic temperature

        圖9 共沸組成的實(shí)驗(yàn)值與預(yù)測值的比較Fig.9 Comparison of experimental and predicted values of azeotropic composition

        2.4.2 殘差分析

        為了排除“偶然相關(guān)”的可能,需對2 個(gè)所建模型進(jìn)行殘差分析。 圖10 和圖11 分別是模型5 和模型10 的殘差關(guān)系圖,由圖10 和圖11 可知,2 個(gè)模型的計(jì)算殘差均隨機(jī)且無規(guī)律的均勻分布于基準(zhǔn)線(0 線)兩側(cè),說明在建模過程中均未產(chǎn)生系統(tǒng)誤差。 同時(shí),可以發(fā)現(xiàn)所有殘差分布點(diǎn)均集中于基線附近,且大部分離基線較近,這也說明2 個(gè)模型的預(yù)測誤差較小。

        2.4.3 應(yīng)用域分析

        應(yīng)用域分析最常用的方法是利用標(biāo)準(zhǔn)化殘差和leverage 值作圖,即Williams 圖[26]。 圖12 和 圖13 分別是對模型5 和模型10 應(yīng)用域分析的直觀呈現(xiàn)圖。 從圖12 可以清晰的看出絕大部分樣本落在該應(yīng)用域以內(nèi),只有8 個(gè)樣本落在應(yīng)用域以外;由圖13 可知,只有2 個(gè)樣本落在應(yīng)用域以外,另外有2 個(gè)樣本落在邊界線上。 究其原因可能是這類共沸物中有1 個(gè)分子的某些結(jié)構(gòu)對于整個(gè)樣本集來說比較特殊。 綜上可知,最適宜共沸溫度及組成模型具有較強(qiáng)的泛化推廣能力。

        圖10 最適宜的共沸溫度預(yù)測模型的殘差與實(shí)驗(yàn)值的關(guān)系圖Fig. 10 The Residuals versus experimental values of the optimal azeotropic temperature prediction model

        圖11 最適宜的共沸組成QSPR 模型的殘差與實(shí)驗(yàn)值的關(guān)系圖Fig.11 The Residuals versus experimental values of the optimal azeotropic composition prediction mode

        圖12 最適宜的共沸溫度預(yù)測模型的應(yīng)用領(lǐng)域的Williams 圖Fig.12 Plot of Williams of AD of the optimal azeotropic temperature prediction model

        圖13 最適宜的共沸組成預(yù)測模型的應(yīng)用領(lǐng)域的Williams 圖Fig.13 Plot of Williams of AD of the optimal azeotropic composition prediction model

        3 模型比較

        將這2 個(gè)模型與同類文獻(xiàn)模型及UNIFAC 基團(tuán)貢獻(xiàn)法進(jìn)行比較,表3 列出了不同來源的共沸溫度及組成預(yù)測模型的主要性能參數(shù)。 從表3 中可以看出,所建模型所涉及的變量個(gè)數(shù)與已有模型相近,但是本研究所建模型的R2和比其他QSPR 模型高,說明本研究所建模型的擬合能力和內(nèi)部穩(wěn)定性比其他模型高;從各個(gè)模型的外推預(yù)測效果來看,可以發(fā)現(xiàn)所建模型的遠(yuǎn)大于其他模型及UNIFAC 基團(tuán)貢獻(xiàn)法,且UNIFAC 基團(tuán)貢獻(xiàn)法對一些含水二元共沸體系存在無法計(jì)算的問題,即對所選數(shù)據(jù)集中的26 種二元共沸體系都未能計(jì)算出共沸溫度及組成的預(yù)測值,表明所建模型的預(yù)測能力和泛化推廣能力均優(yōu)于現(xiàn)有模型,其預(yù)測結(jié)果數(shù)據(jù)詳見附件1;從各個(gè)模型的RMSE 和AAE 來看,本研究所建模型的RMSE 和AAE 也遠(yuǎn)小于其他現(xiàn)有模型,這說明所建模型的預(yù)測精度高。 綜上,可以看出所建立的模型不但擬合能力和內(nèi)部穩(wěn)定性有所提高,而且具備較強(qiáng)的預(yù)測能力和泛化推廣能力。

        表3 不同共沸溫度及組成預(yù)測模型的主要性能參數(shù)Table 3 The main statistical parameters of QSPR model of azeotropic temperature and composition in different literatures

        4 結(jié)論

        本研究基于定量結(jié)構(gòu)-性質(zhì)關(guān)系探究含水二元共沸物的共沸溫度及組成與分子結(jié)構(gòu)之間的內(nèi)在關(guān)系,對共沸溫度及組成數(shù)據(jù)進(jìn)行了預(yù)測。 得出以下結(jié)論:

        1)經(jīng)分子的三維結(jié)構(gòu)繪制、優(yōu)化,分子描述符的計(jì)算、篩選以及QSPR 模型構(gòu)建與分析比較,確定最適宜的共沸溫度預(yù)測模型和共沸組成預(yù)測模型分別是利用8/5 個(gè)特征描述符所建立的模型(模型5/模型10),2 個(gè)模型均具有方程顯著性高、不存在過擬合、對實(shí)驗(yàn)數(shù)據(jù)具有良好擬合能力等優(yōu)點(diǎn),即含水二元共沸物的共沸溫度及組成能被所建模型準(zhǔn)確的預(yù)測。 模型5 和模型10 的F,LOF,R2,,RMSE 及MAE 分別為280.51/6 373.60、39.880 0/0.001 1、0.960 6/0.997 0、0.957 2/0.996 9、2.940 0/0.016 1 和1.890 0/0.010 4。

        2)對2 個(gè)模型分別進(jìn)行內(nèi)部驗(yàn)證、外部驗(yàn)證、應(yīng)用域分析,發(fā)現(xiàn)所建的2 個(gè)模型均具有較強(qiáng)的預(yù)測能力和泛化推廣性能,其O和分別為0.947 5/0.995 7 和0.9439/0.997 6。

        3)與同類模型和UNIFAC 基團(tuán)貢獻(xiàn)法相比,結(jié)果表明,本研究所建共沸溫度及組成QSPR 模型對測試集樣本的預(yù)測準(zhǔn)確性和泛化推廣能力均優(yōu)于現(xiàn)有模型,可為工程上其他特殊種類的共沸特性數(shù)據(jù)的獲取提供一定的參考和借鑒。

        猜你喜歡
        能力模型
        一半模型
        消防安全四個(gè)能力
        幽默是一種能力
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        大興學(xué)習(xí)之風(fēng) 提升履職能力
        你的換位思考能力如何
        努力拓展無人機(jī)飛行能力
        無人機(jī)(2017年10期)2017-07-06 03:04:36
        3D打印中的模型分割與打包
        抄能力
        精品九九视频| 亚洲熟妇无码一区二区三区导航 | 精品日产卡一卡二卡国色天香 | 日本大乳高潮视频在线观看| 99久久精品国产成人综合| 白丝美女被狂躁免费视频网站| 亚洲激情一区二区三区视频| 亚洲国产成人av二区| 久久国内精品自在自线图片| 福利一区二区三区视频午夜观看| 中文字幕乱码亚洲美女精品一区| 性感女教师在线免费观看| 国产女人水真多18毛片18精品| 456亚洲人成影视在线观看| 亚洲人成伊人成综合网中文| 亚洲av区,一区二区三区色婷婷| 国产一区二区黑丝美胸| 久久99热国产精品综合| 久久久久人妻精品一区蜜桃| 国产亚洲精品成人无码精品网站 | 九九久久99综合一区二区| 国产精品久久久久久久久免费 | 亚洲码国产精品高潮在线| 亚洲AⅤ无码日韩AV中文AV伦| 国产粉嫩高清| 精品综合久久88少妇激情| 久久精品亚洲一区二区三区浴池| 欧美性受xxxx黑人xyx性爽| 一区二区三区在线观看日本视频| 亚洲最大中文字幕在线| 少妇性饥渴bbbbb搡bbbb| 日韩AV无码一区二区三不卡| 精品国产日韩亚洲一区在线| 久久99国产综合精品| 馬与人黃色毛片一部| 国产精品不卡在线视频| 免费一级淫片日本高清| 狠狠色综合7777久夜色撩人| 国产成人精品三级91在线影院| 日本黄色高清视频久久| 亚洲熟妇无码久久精品|