姚建華 李佳 徐雯麗 蔣舒仰 胡靜 李靖靖 王宇飛
1中國科學(xué)院能量調(diào)控材料重點(diǎn)實(shí)驗(yàn)室,中國科學(xué)院上海有機(jī)化學(xué)研究所(上海 200032)
2鄭州工程技術(shù)學(xué)院 (河南鄭州 450044)
眾所周知,一個(gè)化合物的性質(zhì)與其化學(xué)結(jié)構(gòu)式關(guān)系密切。通常做的分子設(shè)計(jì)或化合物設(shè)計(jì),本質(zhì)上是要設(shè)計(jì)一個(gè)具有某種特定功能/性能的化合物。人們關(guān)注的目標(biāo)是化合物的功能/性能,而非化合物的幾何結(jié)構(gòu)。
國際純粹與應(yīng)用化學(xué)聯(lián)合會(huì)(International Union of Pure and Applied Chemistry,(IUPAC) 是世界化學(xué)命名、術(shù)語(包括周期表中新元素的命名)、標(biāo)準(zhǔn)化測(cè)量方法、原子量和許多其他重要評(píng)估數(shù)據(jù)的權(quán)威機(jī)構(gòu),并為全球化學(xué)界提出開發(fā)和維護(hù)創(chuàng)造共同語言的建議。在IUPAC出版的化學(xué)術(shù)語概略(Compendium of Chemical Terminology)[1]書中,分子設(shè)計(jì)的定義如下所述:所謂分子設(shè)計(jì),即采用各種技術(shù)去發(fā)現(xiàn)具有潛在應(yīng)用所需的特定性質(zhì)的新化學(xué)實(shí)體。計(jì)算機(jī)輔助分子設(shè)計(jì)的定義為:所謂計(jì)算機(jī)輔助分子設(shè)計(jì),即采用各種計(jì)算機(jī)輔助技術(shù),開展發(fā)現(xiàn)、設(shè)計(jì)和優(yōu)化具有特定結(jié)構(gòu)和性質(zhì)的化合物的工作。
本文將介紹用于分子設(shè)計(jì)的計(jì)算機(jī)輔助方法。
經(jīng)驗(yàn)型分子設(shè)計(jì)是以設(shè)計(jì)者的經(jīng)驗(yàn)及相關(guān)理論為依據(jù),設(shè)計(jì)具有特定功能/性能的化合物,其工作流程如圖1所示。
圖1所示的經(jīng)驗(yàn)型分子設(shè)計(jì)工作流程表明,工作人員根據(jù)靈感和經(jīng)驗(yàn),以及已有的研究報(bào)道,提出一個(gè)可能具有某種功能/特性,且未見報(bào)道的化合物結(jié)構(gòu)。采用合成方法獲得該化合物后,用對(duì)應(yīng)的實(shí)驗(yàn)方法,測(cè)試該化合物的相關(guān)功能/特性。如果實(shí)驗(yàn)測(cè)試結(jié)果符合設(shè)計(jì)要求,那么該化合物的分子設(shè)計(jì)工作即完成。如果實(shí)驗(yàn)測(cè)試結(jié)果不符合設(shè)計(jì)要求,設(shè)計(jì)者則根據(jù)經(jīng)驗(yàn)和靈感,修改化合物的化學(xué)結(jié)構(gòu),然后進(jìn)行合成、實(shí)驗(yàn)測(cè)試。如果實(shí)驗(yàn)測(cè)試結(jié)果仍不符合設(shè)計(jì)要求,則重復(fù)前一過程,直到獲得符合設(shè)計(jì)要求的化合物。
圖1 經(jīng)驗(yàn)型分子設(shè)計(jì)工作流程示意圖
IUPAC關(guān)于計(jì)算機(jī)輔助分子設(shè)計(jì)的內(nèi)容包含三部分:化合物發(fā)現(xiàn)、設(shè)計(jì)和化合物結(jié)構(gòu)優(yōu)化??梢哉J(rèn)為,所謂化合物發(fā)現(xiàn)是利用計(jì)算機(jī)輔助技術(shù)在自然界的動(dòng)物、植物和礦物中發(fā)現(xiàn)具有特定功能/性能的化合物;所謂化合物設(shè)計(jì)是利用計(jì)算機(jī)輔助技術(shù)設(shè)計(jì)具有特定功能/性能的化合物;所謂化合物結(jié)構(gòu)優(yōu)化,即利用計(jì)算機(jī)輔助技術(shù)對(duì)那些具有特定功能/性能的化合物結(jié)構(gòu)的取代基團(tuán)及其位置作適當(dāng)調(diào)整,以起到提高化合物性能的作用。
計(jì)算機(jī)輔助分子設(shè)計(jì)的方法主要有三種:基于數(shù)據(jù)(D)、基于邏輯(L)和基于原理(P)(如圖 2所示)?;跀?shù)據(jù)即是利用數(shù)據(jù)庫系統(tǒng),獲得相應(yīng)的化合物功能、性質(zhì)和化學(xué)結(jié)構(gòu)等數(shù)據(jù);基于邏輯即是利用功能/性質(zhì)與結(jié)構(gòu)之間的關(guān)系及規(guī)則,根據(jù)化合物的化學(xué)結(jié)構(gòu)預(yù)測(cè)它的可能功能/性質(zhì);基于原理即是利用量化計(jì)算方法,根據(jù)化合物的化學(xué)結(jié)構(gòu),計(jì)算化學(xué)結(jié)構(gòu)對(duì)應(yīng)的相關(guān)物化參數(shù),并根據(jù)參數(shù),推測(cè)可能的功能。一般而言,人們關(guān)注的化合物功能/性質(zhì)取決于化合物的應(yīng)用領(lǐng)域,它們的預(yù)測(cè)策略和方法因應(yīng)用領(lǐng)域不同而不同。如,醫(yī)藥或農(nóng)藥領(lǐng)域,化合物的生物活性預(yù)測(cè),需要同時(shí)關(guān)注化合物的化學(xué)結(jié)構(gòu)以及作用靶標(biāo)信息;材料領(lǐng)域,材料的性能不僅與單種成分化合物的性質(zhì)相關(guān),還與配方中所有化合物的性質(zhì)及它們之間的相互作用相關(guān)。
圖2 三種計(jì)算機(jī)輔助分子設(shè)計(jì)方法
圖2 所示的In house數(shù)據(jù)庫系統(tǒng),一般為自建的數(shù)據(jù)庫系統(tǒng)。通常,In house數(shù)據(jù)庫系統(tǒng)由兩部分組成:數(shù)據(jù)庫管理系統(tǒng)和數(shù)據(jù)庫。數(shù)據(jù)庫管理系統(tǒng)是用于管理和查詢數(shù)據(jù)庫中的數(shù)據(jù);數(shù)據(jù)庫中包含的結(jié)構(gòu)化的數(shù)據(jù),可以是本單位自用的專用實(shí)驗(yàn)與計(jì)算研究數(shù)據(jù),也可以是專門從文獻(xiàn)中采集的化合物及其特定性質(zhì)數(shù)據(jù)。
圖2所示的基于邏輯的性質(zhì)預(yù)測(cè)系統(tǒng),具有根據(jù)化合物的化學(xué)結(jié)構(gòu)預(yù)測(cè)其相關(guān)性質(zhì)的功能。而基于原理的方法,通常是利用程序計(jì)算一些參數(shù),根據(jù)這些參數(shù)預(yù)測(cè)相關(guān)的性質(zhì)。
計(jì)算機(jī)輔助的分子設(shè)計(jì)的流程如圖3所示。
圖3 計(jì)算機(jī)輔助分子設(shè)計(jì)的流程
圖3 顯示的流程表明,計(jì)算機(jī)輔助分子設(shè)計(jì)過程中,先利用數(shù)據(jù)庫系統(tǒng)查詢憑經(jīng)驗(yàn)和靈感設(shè)計(jì)出的化合物是否已存在(即基于數(shù)據(jù)的方法)。如果數(shù)據(jù)庫中已收錄了對(duì)應(yīng)的化合物,則需要根據(jù)預(yù)測(cè)模型、經(jīng)驗(yàn)和靈感修改化合物結(jié)構(gòu);如果該化合物尚未被收錄到數(shù)據(jù)庫中,則需要利用結(jié)構(gòu)與性質(zhì)之間的關(guān)系及規(guī)則,預(yù)測(cè)該化合物的性質(zhì);如果預(yù)測(cè)結(jié)果符合設(shè)計(jì)要求,則進(jìn)入合成階段;如果不符合要求,設(shè)計(jì)者則需要根據(jù)預(yù)測(cè)模型、經(jīng)驗(yàn)和靈感優(yōu)化化合物結(jié)構(gòu),利用基于數(shù)據(jù)的方法,判斷該化合物是否被數(shù)據(jù)庫收錄;利用基于邏輯或原理的方法預(yù)測(cè)該化合物性質(zhì),并判斷是否符合設(shè)計(jì)要求;重復(fù)這個(gè)過程,直到獲得預(yù)測(cè)結(jié)果符合設(shè)計(jì)要求,然后進(jìn)入合成階段。之后的工作流程與經(jīng)驗(yàn)型的基本相同。
自1946年計(jì)算機(jī)問世,化學(xué)數(shù)據(jù)管理系統(tǒng)就是化學(xué)家們期盼的文獻(xiàn)和數(shù)據(jù)查詢工具。早在20世紀(jì)50年代,美國國家標(biāo)準(zhǔn)化辦公室數(shù)據(jù)處理部門的工作人員,在《科學(xué)(Science)》雜志發(fā)表了題為“用數(shù)字化計(jì)算機(jī)查找化學(xué)記錄”的文章[2]。在這篇文章中,作者介紹了化學(xué)數(shù)據(jù)、化合物結(jié)構(gòu)計(jì)算機(jī)處理的一些方法和策略,以及當(dāng)時(shí)已建立的SEAC[NBS(National Bureau of Standards)Electronic Automatic Computer]系統(tǒng)。
由于計(jì)算機(jī)系統(tǒng)的不斷更新,對(duì)應(yīng)的化學(xué)數(shù)據(jù)管理系統(tǒng)一級(jí)數(shù)據(jù)庫結(jié)構(gòu)也隨之不斷更新升級(jí)。從單機(jī)版的化學(xué)數(shù)據(jù)庫系統(tǒng),逐步轉(zhuǎn)化為“Client/Server”,現(xiàn)在已更新為“基于網(wǎng)絡(luò)”的系統(tǒng)?!盎诰W(wǎng)絡(luò)”系統(tǒng)的優(yōu)點(diǎn)是:數(shù)據(jù)及其管理系統(tǒng)的維護(hù)及時(shí)且方便。目前,在化學(xué)及相關(guān)領(lǐng)域常用的商業(yè)化合物數(shù)據(jù)庫系統(tǒng)有:美國化學(xué)文摘社的SciFinder[3],BIOVIA公司的化合物毒性數(shù)據(jù)庫系統(tǒng)、化合物代謝數(shù)據(jù)庫系統(tǒng)、可用化學(xué)品目錄數(shù)據(jù)庫系統(tǒng)[4],愛斯唯爾的Reaxys化學(xué)數(shù)據(jù)庫系統(tǒng)等等[5]。In house或非商業(yè)化學(xué)數(shù)據(jù)庫系統(tǒng)一般不公開,這里只介紹一下中國科學(xué)院上海有機(jī)化學(xué)研究所姚建華團(tuán)隊(duì)建立的一些非商業(yè)專用的化學(xué)數(shù)據(jù)庫系統(tǒng),如化合物疏水常數(shù)數(shù)據(jù)庫系統(tǒng)、農(nóng)用化學(xué)品數(shù)據(jù)庫、食品添加劑信息管理系統(tǒng)和危險(xiǎn)化學(xué)品信息查詢系統(tǒng)等等[6]。
關(guān)于化合物性質(zhì)預(yù)測(cè)的工作,在20世紀(jì)40年代就有人提出化合物生物活性與它的化學(xué)結(jié)構(gòu)相關(guān)的概念[7]。目前,化合物性質(zhì)預(yù)測(cè)的方法主要有以下三大類:(1)以分子描述符[8]為自變量,性質(zhì)為因變量的方程式作為預(yù)測(cè)依據(jù);(2)以實(shí)驗(yàn)得到的規(guī)律作為預(yù)測(cè)依據(jù)的專家型推理;(3)以分子結(jié)構(gòu)信息與性質(zhì)的對(duì)應(yīng)關(guān)系為預(yù)測(cè)依據(jù)。
第一類預(yù)測(cè)方法大多通過已有的軟件計(jì)算多種的分子描述符,分析這些描述符與性質(zhì)的相關(guān)性,建立對(duì)應(yīng)的方程式,并用于預(yù)測(cè)化合物性質(zhì)。這種方法的優(yōu)點(diǎn):軟件開發(fā)的工作量不大;不足之處:必須依靠計(jì)算分子描述符的軟件。
第二類預(yù)測(cè)方法通過收集已報(bào)道的實(shí)驗(yàn)總結(jié)得出的結(jié)構(gòu)與性質(zhì)關(guān)系,比較被預(yù)測(cè)化合物結(jié)構(gòu)與規(guī)則相符度,預(yù)測(cè)化合物的性質(zhì)。這種方法的優(yōu)點(diǎn):有效地利用了實(shí)驗(yàn)結(jié)果;不足之處:實(shí)驗(yàn)規(guī)則數(shù)量的有限性。
第三類預(yù)測(cè)方法通過收集已報(bào)道的實(shí)驗(yàn)結(jié)果,分析化學(xué)結(jié)構(gòu)與性質(zhì)之間的關(guān)系,建立化學(xué)結(jié)構(gòu)與性質(zhì)的關(guān)系模型,并用于預(yù)測(cè)化合物性質(zhì)。這種方法的優(yōu)點(diǎn):有效地利用了實(shí)驗(yàn)結(jié)果及其結(jié)果中隱含的規(guī)則;不足之處:軟件開發(fā)工作量極大。
分子描述符主要包含以下10大類:拓?fù)漕悾╰opological)、 幾 何 類 (geometrical)、 電 子 類(electronic)、物化類 (physicochemical)、指紋類(fingerprints)、官能團(tuán)類(functional groups)、特性類(properties)、電荷類(charge-related)、半經(jīng)驗(yàn)類(semi-empirical)和熱力學(xué)類(thermodynamical)。描述符計(jì)算軟件各自定義描述符類型及其計(jì)算方法。
目前,現(xiàn)有的分子描述符的計(jì)算軟件主要包括幾類[9]:ADAPT,ADMET Predictor,ADRIANA.Code,CODESSA,DRAGON,GRID,ISIDA,MARVIN Beans,MOE,MOLCONN-Z,MOLGEN-QSPR,PowerMV,HyperChem[10]和Gaussian[11]等等。其中部分軟件還具有描述符與性質(zhì)的關(guān)系數(shù)據(jù)分析功能,如CODESSA和DRAGON等。
第二類預(yù)測(cè)方法的軟件有DEREK(Deductive Estimation of Risk from Existing Knowledge)[12],該軟件可用于預(yù)測(cè)化合物的毒性。
第三類預(yù)測(cè)方法的軟件有PASS[13]、CISOCPSMT、CISOC-PSAT 和 CISOC-pKa 等[14]。
在計(jì)算機(jī)輔助分子設(shè)計(jì)工作中,常用的預(yù)測(cè)軟件有:PASS,Sybyl(原 Tripos公司的產(chǎn)品),CoMFA(Comparative Molecular Field Analysis)[15],CoMSIA(Molecular Similarity Indices in a Comparative Analysis)[16],DEREK,MultiCASE[17],CISOC-PSCT,CISOC-PSMT,CISOC-PSAT,CISOC-logP,CISOC-pKa,CISOC-logS[14],TOPKAT,Discovery Studio 和Material Studio[18]等等。其中,PASS,Sybyl 和Discovery Studio適用于藥物或農(nóng)藥研發(fā)中化合物生物活性的預(yù)測(cè);Material Studio適用于材料研發(fā)中化合物物化參數(shù)和材料性能的預(yù)測(cè);DEREK,MultiCASE,CISOC-PSCT,CISOC-PSMT,CISOCPSAT和TOPKAT可用于預(yù)測(cè)化合物的毒性;CISOC-logP,CISOC-pKa和CISOC-logS分別預(yù)測(cè)化合物的疏水常數(shù)、酸堿解離常數(shù)和水溶解度。
與經(jīng)驗(yàn)型的分子設(shè)計(jì)相比,計(jì)算機(jī)輔助分子設(shè)計(jì)有效提高了分子設(shè)計(jì)的效率和精準(zhǔn)性,降低了實(shí)驗(yàn)的盲目性和化合物設(shè)計(jì)過程中產(chǎn)生的不符合設(shè)計(jì)要求的化合物數(shù)量,降低了實(shí)驗(yàn)廢棄物處理工作量。