仝建波,李康楠,吳英紀,占 培,李玲霄
(陜西科技大學 化學與化工學院,陜西 西安 710021)
一種新的氨基酸描述符及其在肽QSAR中的應用
仝建波*,李康楠,吳英紀,占 培,李玲霄
(陜西科技大學 化學與化工學院,陜西 西安 710021)
定量構效關系;氨基酸描述符;多元線性回歸;肽
多肽類藥物在治療癌癥、代謝類疾病、心血管疾病、傳染性疾病、內(nèi)分泌類疾病、血液病和疼痛緩解等眾多方向均有顯著的療效和廣泛的應用前途。與小分子化學藥物相比,多肽類藥物更為安全、副作用更小、特異性更強,很少引起嚴重的免疫反應[1]。隨著化學和生命科學的進步,近年來多肽類藥物的研發(fā)和上市出現(xiàn)了逐步加速的趨勢。
肽類藥物定量構效關系(Quantitative structure activity relationship,QSAR)是應用數(shù)學統(tǒng)計學方法來定量描述肽類藥物或其類似物的化學結構與特定的肽藥物活性之間的關系[2]。采取實驗測量評估肽類藥物活性的方法極大地耗費人力和時間[3],因此肽類藥物定量構效關系在肽類藥物的研發(fā)中具有重要意義。在肽類藥物定量構效關系中,最為重要的是肽藥物結構的表征[4]。Sneath等[5]最先使用幾個半定量實驗參數(shù)對20種天然氨基酸分子結構進行表征,并成功用于后葉催產(chǎn)素類似物活性的預測。Kidera等[6]用因子分析法分析了20種天然氨基酸的188種結構參數(shù),得到10個正交因子,并將其運用到肽類藥物活性預測,取得較好結果。其后,Hellberge等[7-11]用主成分分析法分析了20種天然氨基酸的29個物理化學性質(zhì),得到3個顯著主成分,將其作為氨基酸描述符成功建立了一些肽的定量構效關系模型。此后不斷有新的氨基酸描述符提出,包括ISA-ECI[12],MS-WHIM[13],Z-scale[14],SVHEHS[15],SZOTT[16]等均在肽類藥物定量關系研究中取得滿意成果,為肽藥物的研究和開發(fā)提供了很大的指導和幫助。
1.1 氨基酸描述符的選取
首先通過ChemOffice 2010繪制出20種基本氨基酸分子的初始結構,而后通過Gaussian 9.8在DFT水平上采用Berrny能量梯度法和廣義梯度近似法(GGA)的B3LYP/6-31G**理論優(yōu)化氨基酸分子的空間立體結構及單點計算[17-19]。然后將氨基酸分子的最佳構象分別導入軟件dragon 6[20]計算出20種天然氨基酸的41個randic molecular profiles非零描述符、44個eigenvalue based indices非零描述符和47個walk and path counts非零描述符。然后對3類原始變量分別進行主成分分析以剔除原始數(shù)據(jù)中的噪音信息和無關變量,經(jīng)主成分分析每個非零描述符的前3,4,3個主成分分別可解釋原始變量98.90%,98.33%,95.89%。可見這10個主成分足以表達原始變量所含的信息。用這10個主成分代替原始變量,作為新的氨基酸描述符-SVREW用于肽類藥物定量構效的研究。
1.2 模型的建立與檢測
(1)
(2)
(3)
(4)
式中:n為樣本總數(shù),yobs為肽活性實驗值,ypre為肽活性預測值。
圖1 ACE抑制二肽和三肽樣本的實驗值與預測值的關系圖Fig.1 Plot of the predicted activity against the observed activity of ACE inhibitor dipeptides and tripeptides
2.1 ACE抑制肽的QSAR研究
從圖1可以發(fā)現(xiàn),所有樣本集中分布在過原點45°對角線附近,說明SMR-MLR所建模型的擬合能力與預測能力較強。SMR-MLR所建多元線性回歸方程如下:Y=2.785-0.230×υ18+0.095×υ9+0.063×υ15+0.110×υ5-0.208×υ6+0.591×υ12-0.565×υ11+0.777×υ17+0.026×υ19+1.315×υ13+0.858×υ14-0.158×υ16。
表1 58個ACE抑制二肽序列及其生物活性的實驗值與預測值Table 1 Sequences of 58 ACE inhibitor dipeptides with observed activity and predicted activity
*test set
圖2 苦味二肽和四肽樣本的實驗值與預測值的關系圖Fig.2 Plot of the predicted activity against the observed activity of BTT dipeptides and tetrapeptides
2.2 苦味肽QSAR研究
從圖2可以發(fā)現(xiàn)所有的樣本均集中分布在過原點45°對角線附近,說明SMR-MLR所建模型的擬合能力與預測能力較強。SMR-MLR所建的多元線性回歸方程如下:Y=2.019-0.017×υ8+0.156×υ15+0.022×υ14-0.233×υ2+0.445×υ17+0.188×υ3+0.041×υ4。
表2 48個苦味活性二肽氨基酸序列及其活性的觀察值與模型預測值Table 2 Sequences of 48 BTT dipeptides with observed activity and predicted activity
*test set
表3 23個苦味四肽氨基酸序列及其活性的觀察值與模型預測值Table 3 Sequences of 23 BTT tetrapeptides with observed activity and predicted activity
*test set
2.3 后葉催產(chǎn)素的QSAR研究
后葉催產(chǎn)素是由大腦垂體后葉產(chǎn)生的一種激素,具有促進子宮收縮從而催產(chǎn)以及促進泌乳的作用[26]。此外研究證明[27],當人體催產(chǎn)素含量上升時,會隨之釋放出大量能夠緩解壓力、延緩衰老的激素,并能促進細胞重生。人體在分娩和哺乳等情況下會大量分泌后葉催產(chǎn)素,它能夠產(chǎn)生止痛或鎮(zhèn)定的作用。
圖3 后葉催產(chǎn)素樣本實驗值和預測值的關系圖Fig.3 Plot of calculated versus observed activities for 21 oxytocin analogues
從圖3可以發(fā)現(xiàn),所有樣本都集中分布在過原點45°對角線附近,說明SMR-MLR所建模型的擬合能力與預測能力較強。SMR-MLR所建多元線性回歸方程如下:Y=3.160+3.568×υ16+0.544×υ8-0.435×υ23-0.479×υ18+14.761×υ17。
表4 后葉催產(chǎn)素序列及其生物活性的實驗值與預測值Table 4 Sequences of oxytocin with observed and calculated activities
*test set
2.4 HLA-A*0201限制性CTL表位肽的QSAR研究
圖4 HLA-A*0201限制性CTL表位肽實驗值和預測值的關系圖Fig.4 Plot of calculated versus observed activities for HLA-A* 0201 restricted CTL epitopes
本文提出新的氨基酸描述符-SVREW,此描述符完全是由理論計算獲得的參數(shù),具有操作簡單、形式統(tǒng)一、數(shù)據(jù)易獲取等特點,將其應用于 ACE抑制肽、苦味肽、后葉催產(chǎn)素類似物、HLA-A*0201限制性CTL表位肽的結構表征,應用逐步回歸結合多元線性回歸建立QSAR模型。所得模型的擬合能力和預測能力較強,有望在其他肽類藥物定量構效關系中得到應用和推廣。
[1] Chen G H,Chi J G,Qiu W Z,Wang J N,Sun Y J.ShandongSci.(陳貫虹,遲建國,邱維忠,王加寧,孫元軍.山東科學),2008,21(3):42-48.
[2] Zhang Y,Ding Y,Wang Y Q,Wang B C.ChongqingUniv.Technol.:Nat.Sci.(張婭,丁元,王遠強,王伯初.重慶理工大學學報:自然科學版),2011,25(5):35-41.
[3] Schultz T W,Cronin M T D,Netzeva T I.Mol.Struct.Theochem.,2003,622(2):23-38.
[4] Tong J B,Chang J,Zhao X,Bai M.Mol.Sci.(仝建波,常佳,趙翔,白敏.分子科學學報),2014,30(4):280-286.
[5] Sneath P H A.J.Theor.Biol.,1966,12(2):157-195.
[6] Kidera A,Konishi Y,Oka M,Ooi T.ProteinJ.,1985,4(1):23-55.
[7] Hellberg S,Sj?str?m M,Sjostrom M,Wold S.ActaChem.Scandinavica,1986,40(2):135-140.
[8] Hellberg S,Sj?str?m M,Skagerberg B,Wold S.Med.Chem.1987,30(7):1126-1135.
[9] Hellberg S,Eriksson L,Jonsson J,Lindgren F,Sj?str?m M.Int.PeptideProteinRes.1991,37(5):414-424.
[10] Wold S,Eriksson L,Hellberg S,Jonsson J,Sj?str?m M.CanadianJ.Chem.,2011,65(65):1814-1820.
[11] Jonsson J,Eriksson L,Hellberg S,Sj?str?m M,Wold S.Mol.Inf.,1989,8(3):204-209.
[12] Collantes E R,Rd D W.Med.Chem.,1995,38(14):2705-2713.
[13] And A Z,Gancia E.Chem.Inf.Model.,1999,39(3):525-533.
[14] Tian F,Zhou P,Li Z.J.Mol.Struct.,2007,830(S 1/3):106-115.
[15] Liu J,Peng J Q,Guan X.Anal.Sci.(劉靜,彭劍秋,管驍.分析科學學報),2012,28(1):16-22.
[16] Liang G Z ,Zhou P,Zhou Y.ActaChim.Sin.,2006,64(5):393-396.
[17] Kohn W,Sham L J.Phys.Rev.,1965,140(4A):1133-1138.
[18] Hohenberg P,Kohn W.Phys.Rev.,1964,136(3):864-871.
[19] Maczyński M,Zimecki M,Taraszkiewicz M.ActaPoloniaePharm.,2008,65(5):543-549.
[20] Todeschini R,Consonni V,Mauri A,Pavan M.Anal.Chim.Acta,2004,515(1):199-208.
[21] Tropsha A.Gramatica P.QsarComb.Sci.,2003,22(1):69-77.
[22] Tong J B,Chang J,Liu S L,Bai M.Serb.Chem.Soc.,2015,80(3):343-353.
[23] Tong J B,Chang J,Liu S L,Bai M.Serb.Chem.Soc.,2014,65(5):550-555.
[24] Chen J W,Liu S S,Cai G X.FoodSci.(陳季旺,劉珊珊,蔡廣霞.食品科學),2013,34(9):19-23.
[25] Kim H O,Lichan E C.Agric.FoodChem.,2006,54(26):10102-10111.
[26] Bull P M,Douglas A J,Russell J A.Neuroendocrinol.,1994,6(3):267-274.
[27] Shang S Y,Su Y J.Psychology:TechniquesandApplications(尚思源,蘇彥捷.心理技術與應用),2016,(4):224-235.
[28] Dnyaneshwar W,Preeti C,Kalpana J,Bhushan P.Biol.Pharm.Bull.,2006,29(11):2313-2316.
[29] Chen T,Li M P,Zhang S W.Comput.Appl.Chem.(陳婷,李美萍,張生萬.計算機與應用化學),2011,28(1):78-82.
[30] Lin Z H,Hu Y,Wu Y Z.ActaChim.Sin.(林治華,胡勇,吳玉章.化學學報),2004,62(18):1835-1840.
A New Descriptor for Amino Acids and Its Applications in Peptide QSAR
TONG Jian-bo*,LI Kang-nan,WU Ying-ji,ZHAN Pei,LI Ling-xiao
(College of Chemistry & Chemical Engineering,Shaanxi University of Science & Technology,Xi'an 710021,China)
quantitative structure-activity relationship;amino acid descriptor;multiple linear regression;peptides
2016-07-05;
2016-08-30
國家自然科學基金(21475081);陜西省自然科學基礎研究計劃(2015JM2057);陜西科技大學研究生創(chuàng)新基金
10.3969/j.issn.1004-4957.2017.02.012
O641.121;O629.76
A
1004-4957(2017)02-0224-07
*通訊作者:仝建波,博士,教授,研究方向:計算機輔助藥物設計與相關化學信息及計量學、能源化工、食品化學的研究,E-mail:jianbotong@aliyun.com