亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        第四講 化學(xué)結(jié)構(gòu)信息的計(jì)算機(jī)表述方法

        2019-07-24 06:06:44姚建華李佳徐雯麗蔣舒仰胡靜李靖靖
        關(guān)鍵詞:計(jì)算機(jī)化學(xué)結(jié)構(gòu)

        姚建華 李佳 徐雯麗 蔣舒仰 胡靜 李靖靖

        1中國(guó)科學(xué)院能量調(diào)控材料重點(diǎn)實(shí)驗(yàn)室,中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所(上海 200032)

        2鄭州工程技術(shù)學(xué)院 (河南鄭州 450044)

        據(jù)文獻(xiàn)記載,自公元330年起,人們就開始研究物質(zhì)的組成、運(yùn)動(dòng)、生長(zhǎng)或脫去。美國(guó)化學(xué)文摘社(CAS,Chemical Abstracts Service)統(tǒng)計(jì)的數(shù)據(jù)顯示,截至目前,己知的化合物近1.5億,已報(bào)道的化學(xué)反應(yīng)已超過9000萬條[1]。

        為了記錄和交流化學(xué)知識(shí),必須用一種語言(術(shù)語)來描述這些化合物,即所謂的化合物命名。早在十八世紀(jì)末,瑞典化學(xué)家Bergman和法國(guó)化學(xué)家Laviosier首先建議將當(dāng)時(shí)雜亂的術(shù)語統(tǒng)一起來。雖然他們的體系沒能得到普及,但是這一思想?yún)s孕育了現(xiàn)代化學(xué)廣泛使用著的系統(tǒng)命名法。

        隨著人們對(duì)化學(xué)結(jié)構(gòu)認(rèn)識(shí)的不斷深化,逐漸形成了近代化學(xué)結(jié)構(gòu)理論,特別是Kekule在1865年首次使用了由單短線和雙短線交替組成的正六邊形來表示苯的結(jié)構(gòu)以后,結(jié)構(gòu)式已成為化學(xué)家最通用的語言和化學(xué)知識(shí)的載體。

        化學(xué)結(jié)構(gòu)作為化學(xué)家最普遍使用的語言,在化學(xué)知識(shí)的記錄、傳播和交流中起著十分重要的作用。隨著計(jì)算機(jī)的普及,廣大化學(xué)工作者都希望能用計(jì)算機(jī)來幫助處理化學(xué)結(jié)構(gòu)。

        然而,化學(xué)結(jié)構(gòu)式也有記錄與處理困難的缺點(diǎn),隨著計(jì)算機(jī)的普及,化學(xué)家希望能借助于它來處理化學(xué)結(jié)構(gòu)。因此,自計(jì)算機(jī)誕生起,用計(jì)算機(jī)處理化學(xué)結(jié)構(gòu)的理論和技術(shù)就得到了廣泛的重視與深入的研究。早在20世紀(jì)50年代,美國(guó)國(guó)家標(biāo)準(zhǔn)化辦公室數(shù)據(jù)處理系統(tǒng)部門的工作人員Ray和Kirsch就在《Science》上發(fā)表了題為“Finding chemical records by digital computers”的文章[2]。

        在此,將介紹幾種化學(xué)結(jié)構(gòu)的表述方法:系統(tǒng)命名法、線形碼、碎片碼、拓?fù)浯a和連接表。

        1 系統(tǒng)命名

        在早期的化學(xué)文獻(xiàn)中,化合物命名大多使用簡(jiǎn)短的習(xí)慣命名法。習(xí)慣命名的無規(guī)律性造成了使用的不方便,因此,化學(xué)家希望建立一套大家公認(rèn)的規(guī)則,根據(jù)這套規(guī)則,每個(gè)化合物都能得到一個(gè)標(biāo)準(zhǔn)的命名,這就是系統(tǒng)命名法。系統(tǒng)命名法,特別是它遵循的原則是其他一切化學(xué)結(jié)構(gòu)表述方法的基礎(chǔ)。目前,被化學(xué)家接受的系統(tǒng)命名法主要為IUPAC系統(tǒng)命名法[3]和CA 索引名(CA index name)[4]。

        由于IUPAC系統(tǒng)命名的某些不足,美國(guó)化學(xué)文摘社根據(jù)IUPAC規(guī)則設(shè)計(jì)了專用的系統(tǒng)命名規(guī)則(即CA索引名),并生成算法[5]。

        2 化學(xué)結(jié)構(gòu)的機(jī)器表述

        化學(xué)結(jié)構(gòu)的自動(dòng)處理最早是基于打字機(jī)的化學(xué)結(jié)構(gòu)表示法,提出者為 Richards[6],Dyson[7]和Frear[8]等。

        他們?cè)噲D用數(shù)字和字母組成的直線形式來表述結(jié)構(gòu)式。之后,還有許多人提出了各種各樣的化學(xué)結(jié)構(gòu)表述方法。20世紀(jì)60年代后期以來,人們開展了完善表述化學(xué)結(jié)構(gòu)的方法和計(jì)算機(jī)表述化學(xué)結(jié)構(gòu)方法的工作。目前,在計(jì)算機(jī)上得到實(shí)際應(yīng)用的結(jié)構(gòu)表述方法有線形碼、碎片碼、拓?fù)浯a和連接表文件等等?;衔?-(2-乙胺基)-1,2-苯二酚的化學(xué)結(jié)構(gòu)如圖1所示。

        圖1 化合物4-(2-乙胺基)-1,2-苯二酚的化學(xué)結(jié)構(gòu)

        4-(2-乙胺基)-1,2-苯二酚對(duì)應(yīng)的命名、線形碼和連接文件顯示如下:

        系統(tǒng)命名 (英文):4-(2-ethylaminyl)-1,2-diphenole

        系統(tǒng)命名(中文):4-(2-乙胺基)-1,2-苯二酚

        習(xí)慣名:Dopamine

        SMILES 碼a:OC1=C(O)C=C(CCN)C=C1

        SLN 碼a:OHC[1]=C(OH)C=C(CH2CH2NH2)C=C@1

        InChI碼a:1/C8H11NO2/c9-4-3-6-1-2-7(10)8(11)5-6/h1-2,5,10-11H,3-4,9H2

        連接文件b:

        -ISIS- 06181923262D

        11 11 0 0 0 0 0 0 0 0999 V2000

        1.6236 1.0292 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0

        1.6224 -1.3648 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0

        3.6956 -2.5610 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0

        5.7870 -1.3519 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0

        5.7841 1.0203 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0

        3.6938 2.2253 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0

        -0.4750 2.2500 0.0000O 0 0 0 0 0 0 0 0 0 0 0 0

        -0.4750-2.5792 0.0000O 0 0 0 0 0 0 0 0 0 0 0 0

        7.9000 -2.5292 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0

        7.9375 -4.9458 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0

        12.1042 -6.9458 0.0000N 0 0 0 0 0 0 0 0 0 0 0 0

        5 6 2 0 0 0 0

        6 1 1 0 0 0 0

        1 2 2 0 0 0 0

        1 7 1 0 0 0 0

        3 4 2 0 0 0 0

        2 8 1 0 0 0 0

        4 9 1 0 0 0 0

        4 5 1 0 0 0 0

        9 10 1 0 0 0 0

        2 3 1 0 0 0 0

        10 11 1 0 0 0 0 MEND

        注:a——ChemDraw Ultra Ver.10.0軟件生成;

        b——MDL mol格式文件。

        3 線形碼

        所謂線形碼(或稱線形標(biāo)記),是由一組字符按照一定的規(guī)則排列而成的一個(gè)字符串,該字符串可用于表達(dá)對(duì)應(yīng)的化學(xué)結(jié)構(gòu)式。目前,比較常用的主要有 SMILES,SLN 和 InChI。

        SMILES(Simplified molecular input line entry system)碼,是一種用ASCII字符串明確描述分子結(jié)構(gòu)的表達(dá)式。SMILES由Arthur Weininger和David Weininger于20世紀(jì)80年代晚期開發(fā),并由其他人,尤其是日光化學(xué)信息系統(tǒng)有限公司(Daylight Chemical Information Systems Inc.),修改和擴(kuò)展。

        SLN(SYBYL Line Notation)是由 Tripos公司提出的一種線形ASCII碼表達(dá)式 ,用于表示化學(xué)結(jié)構(gòu),包括常見的有機(jī)分子、大分子、聚合物和組合庫。SLN還用于表示子結(jié)構(gòu)查詢,包括用于Markush表示的完整工具。這種簡(jiǎn)潔的語言非常適合于化學(xué)實(shí)體的數(shù)據(jù)庫存儲(chǔ)以及結(jié)構(gòu)和查詢的網(wǎng)絡(luò)通信[9]。

        InChI(International Chemical Identifier)是 由 國(guó)際純粹與應(yīng)用化學(xué)聯(lián)合會(huì)(International Union of Pure and Applied Chemistry,IUPAC)和美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)研究所(National Institute of Standards and Technology,NIST)聯(lián)合制定的,用以唯一標(biāo)識(shí)化合物識(shí)別碼[10]的線形碼。

        除了專用系統(tǒng),目前,ChemDraw Ultra Ver10.0及以上版本可以產(chǎn)生以上介紹的3種線形碼。但需要注意的是,不同版本的線形碼生成系統(tǒng),產(chǎn)生的線形碼可能有差異。

        4 碎片碼

        碎片碼是將化學(xué)結(jié)構(gòu)分割成結(jié)構(gòu)片斷(這些片斷有一定的化學(xué)意義,最常見的為官能團(tuán)、環(huán)系統(tǒng)等),然后再加以表述的一種方法。用碎片碼表示化學(xué)結(jié)構(gòu)主要涉及3個(gè)內(nèi)容:

        (1)結(jié)構(gòu)碎片的選擇;

        (2)結(jié)構(gòu)碎片的表示;

        (3)代表結(jié)構(gòu)碎片的符號(hào)按何種方式(常稱為句法)整合。

        結(jié)構(gòu)碎片的選擇通常有兩種方法:

        (1)根據(jù)定義好的結(jié)構(gòu)碎片詞典;

        (2)根據(jù)分割規(guī)則通過算法來分割結(jié)構(gòu)。

        為了便于計(jì)算機(jī)處理,結(jié)構(gòu)碎片通常用計(jì)算機(jī)可直接使用的字符來表示。而代表結(jié)構(gòu)碎片的字符還須按某種方式組織起來以代表整個(gè)化學(xué)結(jié)構(gòu),這種組織方式稱為句法。實(shí)際使用中,這種句法可根據(jù)實(shí)際情況來采用,它們分別稱為有句法、半句法或無句法。

        5 拓?fù)浯a

        直接描述分子中結(jié)構(gòu)單元的性質(zhì)及其相互位置(拓?fù)洌╆P(guān)系的編碼即是所謂的拓?fù)浯a。與碎片碼和其他編碼相比,拓?fù)浯a收錄了圖的信息?;瘜W(xué)結(jié)構(gòu)實(shí)際上可被看成有序色圖[11]。

        含有n個(gè)原子的化學(xué)結(jié)構(gòu),有n!種不同的編號(hào)方法(n!個(gè)同構(gòu)的圖)。為使一個(gè)確定結(jié)構(gòu)只能產(chǎn)生一個(gè)唯一的拓?fù)浯a(這一點(diǎn)對(duì)編碼系統(tǒng)至關(guān)重要),結(jié)構(gòu)中的原子必須按某種方式排序。

        排序在產(chǎn)生化學(xué)結(jié)構(gòu)的拓?fù)浯a時(shí)起著決定性的作用,不同的排序方式將產(chǎn)生不同的拓?fù)浯a。最著名的拓?fù)浯a是美國(guó)化學(xué)文獻(xiàn)社采用的Rgeistrty III[12]和法國(guó)學(xué)者Dubois所提出的DARC碼[11]。在用這兩種碼表示化學(xué)結(jié)構(gòu)時(shí),都需要首先找出結(jié)構(gòu)圖的起始點(diǎn)(在CAS碼中為1號(hào)原子,而DARC碼中稱為中心),再確定圖中其他原子的序號(hào)。與絕大多數(shù)拓?fù)浯a一樣,這兩種碼都只對(duì)非氫原子進(jìn)行描述,而氫原子可以方便地由價(jià)鍵理論計(jì)算而得。這兩種碼的區(qū)別在于,CAS碼中原子的序號(hào)是用Morgan算法[13]獲得,而DARC碼中的原子序號(hào)是對(duì)結(jié)構(gòu)圖不斷應(yīng)用優(yōu)先規(guī)則來確定的。

        6 連接表

        化合物的系統(tǒng)命名、碎片碼、拓?fù)浯a和線形碼等,都可用于表述化合物分子結(jié)構(gòu),原則上它們都可用于計(jì)算機(jī)處理。但是,這些表述方法不適用于化學(xué)結(jié)構(gòu)的比較。

        所謂連接表,本質(zhì)上是分子中所有原子性質(zhì)及其連接關(guān)系(有時(shí)包括立體化學(xué))的一個(gè)列表。在連接表中,原子信息主要包含:原子種類,原子的化合價(jià),原子間的連接關(guān)系,原子的坐標(biāo)以及可能的原子電荷、同位素、立體化學(xué)。分子的連接表有冗余的與非冗余的(單向)兩種。

        所謂冗余連接表,實(shí)際是每個(gè)鍵被重復(fù)描述兩次(即成鍵的一對(duì)原子,每個(gè)原子都作為起始原子被描述)??梢姡@種表述方法用于表述化學(xué)結(jié)構(gòu)并不合理。所謂非冗余連接表,即對(duì)每個(gè)鍵只描述一次。后者不僅占用存儲(chǔ)空間小,且計(jì)算量也相應(yīng)減少。因此,非冗余連接表在計(jì)算機(jī)處理化學(xué)結(jié)構(gòu)的程序中得到實(shí)際應(yīng)用。由MDL公司的ISIS_DRAW生成的原子編號(hào)如圖2所示,對(duì)應(yīng)的單向連接表見表1。

        圖2 ISIS_DRAW生成的4-(2-乙胺基)-1,2-苯二酚的原子編號(hào)

        表1 4-(2-乙胺基)-1,2-苯二酚的單向連接表

        7 結(jié)語

        化學(xué)結(jié)構(gòu)作為化學(xué)家最普遍使用的語言,在化學(xué)知識(shí)的記錄、傳播和交流中的核心作用已為大家所認(rèn)識(shí)。

        本文概述了長(zhǎng)期以來,前人為了實(shí)現(xiàn)計(jì)算機(jī)存儲(chǔ)和處理化學(xué)結(jié)構(gòu)所提出的化學(xué)結(jié)構(gòu)的一些表述方法。這些表述方法都有其適用的環(huán)境,即不同的情況采用不同的方法。在使用時(shí),建議采用適合解決問題的那種方法。

        猜你喜歡
        計(jì)算機(jī)化學(xué)結(jié)構(gòu)
        《形而上學(xué)》△卷的結(jié)構(gòu)和位置
        計(jì)算機(jī)操作系統(tǒng)
        基于計(jì)算機(jī)自然語言處理的機(jī)器翻譯技術(shù)應(yīng)用與簡(jiǎn)介
        科技傳播(2019年22期)2020-01-14 03:06:34
        論結(jié)構(gòu)
        中華詩詞(2019年7期)2019-11-25 01:43:04
        信息系統(tǒng)審計(jì)中計(jì)算機(jī)審計(jì)的應(yīng)用
        奇妙的化學(xué)
        奇妙的化學(xué)
        奇妙的化學(xué)
        論《日出》的結(jié)構(gòu)
        奇妙的化學(xué)
        妇女bbbb插插插视频| 国产亚洲日韩一区二区三区| 欧美久久久久中文字幕| 久久国产亚洲av高清色| 国产在线一区二区三区四区不卡| 国产精品一区二区三区卡| 成人免费777777被爆出| 日韩中文网| 国产精品很黄很色很爽的网站| 中文乱码字幕精品高清国产| 国产精品h片在线播放| 亚洲av无码一区二区三区不卡| 老熟女高潮一区二区三区| 中文字幕avdvd| 日韩精品国产一区在线| 蜜桃av噜噜一区二区三区9| 99久久精品国产一区二区三区| 亚洲色大成网站www在线观看| 亚洲欧美国产成人综合不卡| 一区二区三区在线乱码| 青青草成人在线播放视频| 国产成人无码精品久久二区三区| 中文在线天堂网www| 精品少妇后入一区二区三区| 国产变态av一区二区三区调教| 国产精品久久久久影院| 国产精品一区二区 尿失禁 | 狂插美女流出白浆视频在线观看| 成人一区二区免费中文字幕视频| av人摸人人人澡人人超碰小说| 精品人妻免费看一区二区三区| 亚洲国产精品婷婷久久| 日韩视频中文字幕精品偷拍| 久久精品国产99久久丝袜| 国产一区二区三区av观看| 在线中文字幕乱码英文字幕正常| 国产手机在线αⅴ片无码观看| 亚洲色大成在线观看| 免费黄网站一区二区三区| 一区二区三区人妻av| 国产特级毛片aaaaaaa高清|