燕 芳,劉成毫,王志春,李 偉
內(nèi)蒙古科技大學(xué)信息工程學(xué)院,內(nèi)蒙古 包頭 014010
太赫茲時(shí)域光譜技術(shù)(THz-TDS)已成為研究人員分析分子結(jié)構(gòu)的重要手段。研究發(fā)現(xiàn),許多生物大分子的振動都發(fā)生在0.1~10 THz內(nèi)的太赫茲波段[1]。王衛(wèi)寧等應(yīng)用THz-TDS技術(shù),測試了20種α-氨基酸的太赫茲光譜,發(fā)現(xiàn)在0.2~3 THz頻譜范圍內(nèi)上述氨基酸均存在各自的吸收峰[2]。利用 THz-TDS技術(shù)獲取樣品太赫茲吸收光譜時(shí),去除基線可以消除樣品散射對吸收光譜產(chǎn)生的影響。大量的實(shí)驗(yàn)研究與理論計(jì)算均證明THz-TDS技術(shù)能夠運(yùn)用于有機(jī)分子分析。
有機(jī)分子構(gòu)成了中草藥中的主要成分,故可以借鑒研究氨基酸分子所用到的太赫茲時(shí)域光譜技術(shù)對中草藥進(jìn)行鑒別與分析。張活運(yùn)用B3LYP泛函計(jì)算得到青蒿素的太赫茲吸收光譜,與實(shí)驗(yàn)譜對比,清晰的揭示了青蒿素特征峰的產(chǎn)生機(jī)理[3]。劉俊秀等使用太赫茲光譜儀獲取15種有機(jī)化合物的光譜數(shù)據(jù),利用差分-主成分分析-支持向量機(jī)有機(jī)物識別方法,達(dá)到了很高的正確識別率[4]。鄒糧徽等利用太赫茲時(shí)域光譜技術(shù)檢測水體重金屬污染,并指出藥材中某一成分在太赫茲頻率范圍內(nèi)的振動模式尚待研究[5]。Liu等將THz光譜與ALAP-SVM相結(jié)合,有效的鑒別不同轉(zhuǎn)基因棉花種類[6]。
本文選取甘草中的主要成分甘草酸作為研究對象,借助于Gaussian09軟件對甘草酸分子進(jìn)行量子化學(xué)計(jì)算分析。Gaussian09軟件在量子化學(xué)計(jì)算分析中被研究者廣泛使用,與之配套的GaussView5.0軟件能夠以動態(tài)的方式將分子的振動模式呈現(xiàn)出來。不僅如此,Gaussian09軟件還提供了密度泛函(DFT)、半經(jīng)驗(yàn)算法(Semi-Empirical)及從頭算法(Ab Initio Method)等一系列計(jì)算方法,這些計(jì)算方法的準(zhǔn)確性已經(jīng)在組氨酸、L-,D-與DL-阿拉伯糖以及β-胡蘿卜素等有機(jī)分子的計(jì)算中得到了證實(shí)[7-9]。
目前,運(yùn)用量子化學(xué)計(jì)算中草藥單一成分的研究工作相對較少。因此在后續(xù)研究中對分子構(gòu)型的建立,計(jì)算方法的選擇要求更高。另外甘草酸分子體系較大,在保證計(jì)算結(jié)果準(zhǔn)確的情況下,還需考慮計(jì)算機(jī)時(shí)的長短。
甘草酸分子式為C42H62O16,含有120個(gè)原子,歸屬于有機(jī)大分子。故本文首先根據(jù)其分子結(jié)構(gòu)特征,對它進(jìn)行結(jié)構(gòu)分類,以便于下一步計(jì)算結(jié)果的分析。圖1所示的甘草酸單分子構(gòu)型是在ChemDraw中繪制完成的。
圖1 甘草酸分子構(gòu)型與平面結(jié)構(gòu)(a):甘草酸單分子構(gòu)型;(b):甘草酸分子平面結(jié)構(gòu)圖Fig.1 Molecular configuration and planar structure of glycyrrhizic acid(a):Single molecular configuration of glycyrrhizic acid; (b):Molecular plane structure of glycyrrhizic acid
在圖1(a)中,根據(jù)甘草酸的結(jié)構(gòu)特征,以紅色直線作為分界線,把甘草酸分子“拆成”兩部分。由于甘草酸分子左半邊碳環(huán)的構(gòu)成含有氧原子(如圖中紅色圓圈),故左半邊可稱為含氧碳環(huán)塊。甘草酸分子右半邊碳環(huán)皆由碳原子構(gòu)成,而少有的氧原子均在碳環(huán)側(cè)鏈,可將右半邊稱為碳環(huán)塊。
將ChemDraw中繪制的甘草酸分子坐標(biāo)導(dǎo)入到Gaussian09軟件中進(jìn)行計(jì)算,首先為甘草酸分子選擇計(jì)算方法。經(jīng)過DFT和HF方法計(jì)算甘草酸這一有機(jī)大分子,發(fā)現(xiàn)普通計(jì)算機(jī)的內(nèi)存無法滿足計(jì)算要求。而半經(jīng)驗(yàn)理論主要用于計(jì)算有機(jī)大分子體系,且計(jì)算機(jī)時(shí)較短[10]。因此,本文采用半經(jīng)驗(yàn)理論(Semi-Empirical)中的PM3算法進(jìn)行結(jié)構(gòu)優(yōu)化。在結(jié)構(gòu)優(yōu)化成功的基礎(chǔ)上,仍用PM3算法進(jìn)行頻率計(jì)算,得到甘草酸分子的太赫茲吸收譜。這里需要注意結(jié)構(gòu)優(yōu)化與頻率計(jì)算要用相同的算法,否則計(jì)算結(jié)果失去意義。表1為實(shí)驗(yàn)計(jì)算機(jī)配置簡介。
表1 計(jì)算機(jī)配置Table 1 Computer configuration
圖2為利用量子化學(xué)方法計(jì)算得到的太赫茲吸收譜,其頻譜范圍為0.3~3 THz。由圖2可見,甘草酸分子在0.3~3 THz范圍內(nèi)有四個(gè)吸收峰,分別位于0.87,1.17,1.56與2.76 THz處。其中1.56 THz處的吸收峰與趙春喜[11]實(shí)驗(yàn)所測得的1.56 THz吸收峰位完全一致,且與其運(yùn)用密度泛函理論(DFT)方法計(jì)算得到的1.55 THz處吸收峰基本符合。證明了本文中的甘草酸分子初始構(gòu)型與PM3算法的選擇是合理的,也說明量子化學(xué)計(jì)算可以為實(shí)驗(yàn)獲得的太赫茲光譜提供理論佐證。其余三個(gè)吸收峰位與相關(guān)文獻(xiàn)之間還存在一定的差異,這與計(jì)算時(shí)選取了不同的計(jì)算方法和不同的分子構(gòu)型有一定的關(guān)系。
圖2 甘草酸分子的THz吸收譜圖Fig.2 THz absorption spectra of glycyrrhizic acid molecule
支持向量機(jī)(SVM)、量子化學(xué)計(jì)算與太赫茲時(shí)域光譜技術(shù)相結(jié)合的定性分析,是建立在太赫茲吸收譜基礎(chǔ)之上、從不同角度進(jìn)行分析的方法。本文參考上述方法的思路,從振轉(zhuǎn)模式的視角出發(fā),在GaussView5.0的視頻模塊中,觀察分析特征吸收峰的振轉(zhuǎn)動態(tài)模式,進(jìn)一步揭示特征吸收峰的產(chǎn)生機(jī)理。
由于甘草酸分子的平面結(jié)構(gòu)在Chemdraw中繪制,且Gaussian09計(jì)算所用輸入坐標(biāo)是從Chemdraw中導(dǎo)入,計(jì)算成功后產(chǎn)生的輸出文件在GaussView5.0打開,觀察特征峰的振轉(zhuǎn)模式,所以甘草酸分子平面結(jié)構(gòu)與立體結(jié)構(gòu)坐標(biāo)具有一致性。因而可采用甘草酸分子平面結(jié)構(gòu)圖代替立體結(jié)構(gòu)圖分析振轉(zhuǎn)模式。根據(jù)甘草酸分子基團(tuán)的結(jié)構(gòu)特征,對其分類標(biāo)號,分析四個(gè)吸收峰位的振轉(zhuǎn)模式。如圖3所示,三個(gè)羧基(—COOH)分別標(biāo)號為1,2和3;三個(gè)羥基(—OH)依次標(biāo)號為a,b和c。圖4—圖7分別為甘草酸分子在四個(gè)吸收峰位的振轉(zhuǎn)模式分析圖。甘草酸分子在0.87 THz處吸收峰,主要是兩個(gè)羧基(—COOH)分別近似以y軸為轉(zhuǎn)軸(標(biāo)號為1的羧基)、x為轉(zhuǎn)軸(標(biāo)號為2的羧基)扭轉(zhuǎn),共同作用形成的,且2號羧基振動幅度大于1號。在1.17 THz處的吸收峰是由于3號羧基近似以y軸方向扭轉(zhuǎn)、2號羧基振轉(zhuǎn)模式與0.87 THz處相同,其中3號羧基振動幅度明顯大于2號而形成的;除此之外,碳環(huán)塊也存在小幅度的集體振動。1.56 THz處的吸收主要是由3號羧基繞x軸轉(zhuǎn)動、a與c兩處的羥基伸縮振動(a處羥基向內(nèi)伸縮、c處羥基向外伸縮),與2號羧基及其所在的碳環(huán)集體繞y軸轉(zhuǎn)動造成的。2.76 THz處的吸收峰主要由1號羧基的向內(nèi)伸縮振動,c處的羥基向外伸縮振動,和紅圈內(nèi)兩個(gè)碳環(huán)繞x軸扭轉(zhuǎn)形成。
圖3 甘草酸分子基團(tuán)分類Fig.3 Classification of glycyrrhizic acid molecular groups
圖4 0.87 THz處甘草酸分子振轉(zhuǎn)模式Fig.4 Molecular vibration and rotation modes of glycyrrhizic acid at 0.87 THz
圖5 1.17 THz處甘草酸分子振轉(zhuǎn)模式Fig.5 Molecular vibration and rotation modes of glycyrrhizic acid at 1.17 THz
圖6 1.56 THz處甘草酸分子振轉(zhuǎn)模式Fig.6 Molecular vibration and rotation modes of glycyrrhizic acid at 1.56 THz
圖7 2.76 THz處甘草酸分子振轉(zhuǎn)模式Fig.7 Molecular vibration and roatation modes of glycyrrhizic acid at 2.76 THz
通過分析發(fā)現(xiàn),甘草酸分子特征吸收峰振轉(zhuǎn)模式的產(chǎn)生主要是由含氧官能團(tuán)(—COOH、—OH)的扭轉(zhuǎn)和振動造成的,另外還包括碳環(huán)的小幅振動,且碳環(huán)的振動多是由側(cè)鏈的甲基或氫原子引起的。
圖8 1.56 THz處分子構(gòu)象Fig.8 Molecular conformation at 1.56 THz
由于甘草酸分子平面結(jié)構(gòu)來源于分子構(gòu)象圖,在Gaussian09計(jì)算產(chǎn)生的輸出文件中,可以將甘草酸分子輸出構(gòu)象圖提取出來。在此僅列出1.56 THz處甘草酸分子輸出構(gòu)象,標(biāo)識出振轉(zhuǎn)分子基團(tuán),以便與平面結(jié)構(gòu)下的振轉(zhuǎn)模式圖進(jìn)行觀察對比。
分析了甘草酸的分子結(jié)構(gòu),利用半經(jīng)驗(yàn)理論中的PM3算法,對甘草酸分子進(jìn)行了幾何優(yōu)化和頻率計(jì)算,通過計(jì)算得到了甘草酸分子的THz吸收譜。理論計(jì)算表明,甘草酸分子的四個(gè)特征吸收峰分別位于0.87,1.17,1.56以及2.76 THz處,不同峰位的振轉(zhuǎn)幅度與振轉(zhuǎn)模式有差別,但是主要與甘草酸分子中的羧基、羥基(—COOH、—OH)振轉(zhuǎn)有關(guān)。這說明了含氧官能團(tuán)對甘草酸分子的太赫茲吸收峰產(chǎn)生有著重要影響。本文不僅可以為甘草中的其他成分研究提供重要參考,而且在研究中草藥成分的過程中,具有一定的借鑒性。