陳季旺,劉珊珊,蔡廣霞,吳永寧,2
(1.武漢工業(yè)學院食品科學與工程學院,湖北 武漢 430023;2.中國疾病預防控制中心營養(yǎng)與食品安全所,北京 100050)
高血壓會造成腦、心、腎等重要器官損害,導致中風等,已成為一個嚴重的社會公共衛(wèi)生問題。在發(fā)達國家,高血壓患病率高達25%以上,在發(fā)展中國家,近年來其患病率也在不斷增長。預計到2025年,全世界高血壓病人將達到1.5億人[1]。在高血壓人群中95%以上患者是原發(fā)性高血壓,通過抑制血管緊張素轉(zhuǎn)化酶(angiotensinⅠ-converting enzyme,ACE)活性可降低原發(fā)性高血壓[2]。食物源ACE抑制肽在溫和條件下由蛋白酶水解蛋白質(zhì)獲得,其食用安全性高,無毒副作用;對高血壓患者具有降壓效果,對血壓正常者無降壓作用;它同時具有減肥、免疫調(diào)節(jié)等功能,有著化學合成ACE抑制劑不可比擬的優(yōu)越性,其良好的安全性能以及多種生理功能吸引了眾多的研究者[3]。
1979年Oshima等[4]報道了第一個從食物蛋白質(zhì)中獲得的ACE抑制肽。隨后從乳蛋白[5]、雞蛋蛋白[6]、油料蛋白[7]、谷物蛋白[8]、魚蛋白[9]等中分離純化了大量的ACE抑制肽。定量構效關系(quantitative structure-activity relationship,QSAR)研究是從一系列已知化合物中找出結構和生物學活性之間的數(shù)量依賴關系,建立數(shù)學模型,用這種數(shù)學模型可以預測新化合物的活性,并為指導和設計新化合物提供理論依據(jù),因此對ACE抑制肽進行QSAR研究有助于深入理解肽的結構特征以及活性機理[10-11]。ACE 抑制肽的分子結構表征在QSAR 研究中非常關鍵,通常以物理化學參數(shù)如電性、立體和疏水等來表征結構。Hellberg等[12]首先以氨基酸側(cè)鏈為基礎,從29種物化參數(shù)中提取氨基酸殘基的疏水性、立體性質(zhì)、電荷性質(zhì)3個主要參數(shù)來表征多肽結構特征。隨后,許多研究者對ACE抑制肽結構與活性關系進行了研究,發(fā)現(xiàn)了多種潛在的ACE抑制肽和食物源[13-17]。Majumder等[18]報道采用QSAR模型預報了3種新的來源于雞蛋蛋白的ACE抑制三肽,并通過QSAR模型證明牛奶、禽肉、雞蛋、大豆等是良好的ACE抑制肽來源[11]。
從已報道的ACE抑制肽的QSAR模型發(fā)現(xiàn),這些模型對肽的活性預測、解釋能力有限,且預測結果與實測值差異較大。本實驗在上述研究的基礎上,收集近年發(fā)現(xiàn)的ACE抑制三肽,以單個氨基酸側(cè)鏈的疏水值、立體性質(zhì)、電性參數(shù)為自變量,三肽的lg(IC50)為因變量,利用偏最小二乘回歸法(partial least squares regression,PLS)研究ACE抑制三肽的QSAR,建立數(shù)學模型,并采用“留一法”進行交叉驗證,闡明三肽結構與ACE抑制活性的QSAR,并對已知氨基酸序列三肽的ACE抑制活性進行預測和驗證,擬為獲得高活性的ACE抑制肽提供理論基礎。
收集近年發(fā)現(xiàn)的ACE抑制三肽及其IC50值作為模型樣本,對于不同來源的相同肽序列,報道的IC50值有差異,本實驗優(yōu)選較佳的IC50值,使得建立的模型具有準確性。得到101個三肽的IC50值。因IC50值的相差倍數(shù)較大,為改善分析結果,采用lg(IC50)進行數(shù)據(jù)分析。
根據(jù)Hellberg等[12]提出的20個天然氨基酸描述符Z-scales,從描述20個天然氨基酸的29種物化參數(shù)中,運用主成分分析法,分別提取與氨基酸的疏水性(Z1)、立體性質(zhì)或者側(cè)鏈氨基酸的分子大小(Z2)和電性(Z3)有關的3個參數(shù)作為自變量(表1)。模型構建(表2)以肽的lg(IC50)為因變量,引入肽的疏水性質(zhì)參數(shù)為X1(計算方法參考文獻[19]等),N端第一個氨基酸的疏水性、空間屬性和電性參數(shù)分別為自變量X2、X3、X4,N端第二個氨基酸的疏水性、空間屬性和電性參數(shù)分別為自變量X5、X6、X7,以此類推。運用PLS對多重自變量和因變量進行多元回歸分析,建立QSAR模型。數(shù)據(jù)統(tǒng)計分析采用SIMCA-P 12.0軟件在PC上完成。
表 1 20種天然氨基酸的物理化學參數(shù)[12]Table 1 Physico-chemical parameters of twenty natural amino acids[12]
表 2 101個三肽ACE抑制活性及Z-scales描述值Table 2 ACE inhibitory activity and Z-scales of 101 tripeptides
續(xù)表2
續(xù)表2
使用多元線性回歸建模時必須要對自變量進行多重共線性檢測,診斷自變量系統(tǒng)中是否確實存在多重相關性[20]。較為常見的診斷方法[21]是使用方差膨脹因子(VIF),若VIF≥10,表示多重共線性將嚴重影響回歸結果的穩(wěn)定性和可靠性。采用Stata 11.0軟件分別計算ACE抑制三肽自變量的方差膨脹因子(VIF),對各自變量進行共線性診斷。
對所采集的101樣本,10個自變量,1個自變量采用PLS建立數(shù)學模型,分析模型方程的標準回歸系數(shù),剔除對因變量影響不顯著的自變量,重新建立數(shù)學模型,得到優(yōu)化的較佳模型,分析影響ACE抑制三肽活性的關鍵因素及其作用效果,探討氨基酸序列與ACE抑制三肽活性之間的關系。
為考察模型的穩(wěn)定性和預測能力,對建立的模型用“留一法(leave-one-out)”分別作交互檢驗(cross validation,CV),既每次從樣本集中抽出一個肽,用其余的三肽建模并預測抽出的三肽的IC50值,得到各肽的IC50預測值,計算交叉驗證相關系數(shù)Q2。
Q2=1-∑(yexp-ypre)2/∑(yexp-yave)2
式中:yexp表示實際測得的活性值;ypre表示交叉驗證的活性預測值;yave表示所有肽平均活性值。
根據(jù)所建立模型對本課題組分離所得的VNP(Val-Asn-Pro)[23]、VWP(Val-Trp-Pro)[23]和VAP(Val-Ala-Pro)[24]的IC50值進行預測,比較實測值與預測值的差異,驗證模型的預測能力。
采用Stata 11.0軟件計算三肽10個自變量的方差膨脹因子(VIF),對各自變量進行共線性診斷。由表3可知,三肽樣本集中10個自變量的VIF值在1~4之間,均小于10,表明樣本自變量共線性不高,對回歸模型結果的穩(wěn)定性和可靠性影響較小,因此該樣本變量的選取可靠。采用PLS方法建立ACE抑制三肽的QSAR模型。
以收集的101個ACE抑制三肽中單個氨基酸側(cè)鏈的疏水性、立體性質(zhì)、電性參數(shù)和肽的總體疏水性等10個自變量為自變量,以三肽的lg(IC50)值為因變量,利用PLS研究ACE抑制三肽的QSAR,建立三肽的結構與ACE抑制活性關系的QSAR模型方程,該方程10個自變量和1個因變量的回歸方程標準回歸系數(shù)值見表4。
表 4 初始模型標準回歸系數(shù)Table 4 PLS standard regression coeff icients of the initial model
由表4可知,自變量X1、X4、X6的標準回歸系數(shù)絕對值均小于0.05,對模型的影響不顯著,可解釋ACE抑制三肽的總體疏水參數(shù)、第一位氨基酸的電荷性質(zhì)、第二位氨基酸的立體性質(zhì)對因變量lg(IC50)的影響較小,可以剔除該自變量以進一步優(yōu)化模型。
在第一步模型的基礎上,剔除影響不顯著的自變量后,重新采用PLS方法建立模型方程,其標準化回歸方程為:
將標準化變量表示為原變量回歸方程為:
樣本數(shù)101,R2(X)為0.729,R2(Y)為0.727,該模型對自變量X的解釋能力為0.729,對因變量Y的解釋能力為0.727,表明該模型對樣本集具備良好匹配性。該模型同比Wu Jianping等[15]報道采用140樣本建立的三肽模型(R2=0.4706)更精確。所得模型的自變量標準回歸系數(shù)圖見圖1。由回歸模型的相關系數(shù)可知,X2、X3、X5、X7、X8與三肽的lg(IC50)正相關,X9、X10與其負相關,且X8、X2即末、首位氨基酸的疏水值及X7中間氨基酸的電性參數(shù)對三肽的ACE抑制活性影響最大。X2、X5、X8即組成肽的單個氨基酸疏水值越小(如Val、Lys),該肽的ACE抑制活性越高。X7即中間氨基酸的電性參數(shù)對ACE抑制活性影響較大,呈正相關,而X10即末端氨基酸的電性參數(shù)對ACE抑制活性呈負相關。X3、X9即首、末位氨基酸的體積參數(shù)對ACE抑制活性亦有較大影響。由模型可得,對于ACE抑制三肽的結構組成,具較低疏水值、體積參數(shù)的氨基酸如Val、Leu和Ile傾向于處于N端第一位,較高疏水值和較低電性參數(shù)的氨基酸如Lys、Arg傾向于第二位,較低疏水值和較高體積、電性參數(shù)的氨基酸如Pro、Phe等傾向于第三位。
圖 1 PLS 標準回歸系數(shù)直方圖Fig.1 Histogram of PLS standard regression coeff icients
Cheung等[22]對ACE抑制三肽的構效關系分析表明:C端為芳香族氨基酸且N端為支鏈氨基酸的三肽具有較高的活性。黎觀紅[13]以及Wu Jianping[15]等研究表明ACE抑制活性高的三肽C末端的氨基酸多為芳香族氨基酸,N端氨基酸多為疏水性氨基酸。但中間位置氨基酸分析各異,黎觀紅[13]指出中間位置的氨基酸傾向于電荷指數(shù)、側(cè)鏈體積和疏水性較小的氨基酸,Wu Jianping等[15]報道中間位置的氨基酸為電荷指數(shù)小而側(cè)鏈體積和疏水性大的氨基酸。本研究的QSAR結果中C端與N端氨基酸組成基本與報道一致,但模型表明中間位置氨基酸的體積參數(shù)對模型的影響不大,主要為電荷性質(zhì)的影響,即較高疏水值和較低電性參數(shù)的氨基酸傾向于第二位如Lys、Arg。
為了考察模型的穩(wěn)定性和預測能力,對建立的模型用“留一法”做交叉檢驗,計算整理出101個三肽ACE抑制活性的預測值,計算交叉驗證相關系數(shù)Q2為0.549(Q2大于0.5表明模型具有較好的預測能力[15])。將三肽ACE抑制活性的預測值和實驗值作圖。由圖2可知,模型的預測值和實驗值具有較好的線性關系(R2=0.7250),表明該模型具有良好的預測能力。
圖 2 101個ACE 抑制三肽lg(IC50)實驗值與預測值的相關圖Fig.2 Plot of experimental lg (IC50) versus predicted lg (IC50) of 101 ACE inhibitory tripeptides
QSAR模型預測包括高活性ACE抑制三肽源的發(fā)現(xiàn)和已知三肽序列活性的預測。綜合上述模型的分析和檢驗,該模型具有良好的匹配度和預測能力,可以利用其尋找具有較高ACE抑制活性的肽序列或預測ACE抑制活性,為后續(xù)的化學合成、體內(nèi)實驗提供參考。利用建立的模型對本課題組分離純化得到的VNP、VWP和VAP的IC50值進行預測,并與實際測定值進行比較,驗證模型的預測能力。
表 5 ACE抑制三肽活性預測值與實測值比較Table 5 Comparison of predicted and experimental IC50 of ACE inhibitory tripeptides
在該模型樣本范圍內(nèi),所選取的101個ACE抑制三肽lg(IC50)所有預測值和實測值的誤差值均小于1個單位值。由表5可知,利用該模型對3種新發(fā)現(xiàn)的ACE抑制三肽的lg(IC50)進行預測,實測值和誤差值在0.06~0.23之間,符合該模型檢測范圍,且對VWP的誤差值最小僅為0.06,對VNP誤差值最大為0.23。該結果進一步驗證了模型的預測能力。
以采集ACE抑制三肽的氨基酸側(cè)鏈的疏水性質(zhì)、立體性質(zhì)、電荷性質(zhì)參數(shù)及三肽的總疏水參數(shù)為自變量,三肽的lg(IC50)為因變量,采用PLS方法建立三肽的組成和ACE抑制活性關系的初始數(shù)學模型,剔除對因變量影響不顯著的X1、X4、X6指標,得到優(yōu)化的QSAR模型的回歸方程為:Y=1.952+0.1229X2+ 0.0924X3+ 0.0425X5+0.1777X7+ 0.136X8-0.0809X9-0.1763X10。
樣本數(shù)101,R2(X)為0.729,R2(Y)為0.727,Q2為0.549。該模型對自變量X的解釋能力為0.729,對因變量Y的解釋能力為0.727,表明該模型對樣本集具備良好匹配性。Q2為0.549大于0.5,表明模型具有較好的預測能力。
對模型的分析結果表明:X8、X2即末、首位氨基酸的疏水值及X7中間氨基酸的電性參數(shù)對三肽的ACE抑制活性影響最大。X2、X5、X8即組成肽的各氨基酸疏水值越小(如Val、Leu),該肽的ACE抑制活性越高。X7即中間氨基酸的電性參數(shù)對ACE抑制活性呈正相關,而X10即末端氨基酸的電性參數(shù)對ACE抑制活性呈負相關。對于ACE抑制三肽,具較低疏水值、體積參數(shù)的氨基酸如Val、Leu和Ile傾向于處于N端第一位,較低疏水值、電荷參數(shù)如Lys和Arg傾向于第二位,較低疏水值和較高體積參數(shù)、電荷參數(shù)如Pro、Phe等傾向于第三位。利用該模型預測新發(fā)現(xiàn)的ACE抑制三肽VNP、VWP和VAP,結果表明3種ACE抑制三肽實測值和誤差值在0.06~0.23之間,均在模型樣本誤差范圍內(nèi),進一步驗證該模型具備的良好預測能力。
[1] KEARNEY P M, WHELTON M, REYNOLDS K, et al. Global burden of hypertension: analysis of worldwide data[J]. Lancet, 2005,365: 217-223.
[2] BROWN N J, VAUGHAN D E. Angiotensin-converting enzyme inhibitors[J]. Circulation, 1998, 97: 1411-1420.
[3] GUANG C, PHILLIPS R D. Plant food-derived angiotensin Ⅰconverting enzyme inhibitory peptides[J]. Journal of Agricultural and Food Chemistry, 2009, 57: 5113-5120.
[4] OSHIMA G, SHIMABUKURO H, NAGASAWA K. Peptide inhibitors of angiotensin Ⅰ-converting enzyme in digests of gelatin by bacterial collagenase[J]. Biochimica Biophysica Acta, 1979, 566: 128-137.
[5] QUIR S A, MAR CONTRERAS M, RAMOS M, et al. Stability to gastrointestinal enzymes and structure–activity relationship of β-casein-peptides with antihypertensive properties[J]. Peptides, 2009,30: 1848-1853.
[6] YU Zhiping, LIU Boqun, ZHAO Wenzhu, et al. Primary and secondary structure of novel ACE-inhibitory peptides from egg white protein[J]. Food Chemistry, 2012, 133(2): 315-322.
[7] JIMSHEENA V K, GOWDA L R. Angiotensin Ⅰ-converting enzyme(ACE) inhibitory peptides derived from arachin by simulated gastric digestion[J]. Food Chemistry, 2011, 125: 561-569.
[8] YANG Yanjun, TAO Guanjun, LIU Pi, et al. Peptide with angiotensinⅠ-converting enzyme inhibitory activity from hydrolyzed corn gluten meal[J]. Journal of Agricultural and Food Chemistry, 2007, 55:7891-7895.
[9] FUJITA H, YOSHIKAW A. LKPNM: a prodrug-type ACE-inhibitory peptide derived from fish protein[J]. Immunopharmacology, 1999,44(1/2): 123-127.
[10] PRIPPA A H, ISAKSSON T, STEPANIAK L, et al. Quantitative structure activity relationship modelling of peptides and proteins as a tool in food science[J]. Trends in Food Science & Technology, 2005,16: 484-494.
[11] GU Yuchen, MAJUMDER K, WU Jianping. QSAR-aided in silico approach in evaluation of food proteins as precursors of ACE inhibitory peptides[J]. Food Research International, 2011, 44:2465-2474.
[12] HELLBERG S, SJ?STR?M M, SKAGERBERG B, et al. Peptide quantitative structure-activity-relationships, a multivariate approach[J].Journal of Medicinal Chemistry, 1987, 30(7): 1126-1135.
[13] 黎觀紅. 食品源血管緊張素抑制肽的研究[D]. 無錫: 江南大學, 2005.
[14] PRIPP A H, ISAKSSON T, STEPANIAK L, et al. Quantitative structure-activity relationship modelling of ACE-inhibitory peptides derived from milk proteins[J]. European Food Research and Technology, 2004, 219(6): 579-583.
[15] WU Jianping, ALUKO R E, NAKAI S. Structural requirements of angiotensin Ⅰ-converting enzyme inhibitory peptides: quantitative structure- activity relationship study of di- and tripeptides[J]. Journal of Agricultural and Food Chemistry, 2006, 54: 732-738.
[16] 王毅梅. 草魚源ACE抑制肽的分離純化及定量構效研究[D]. 武漢:武漢工業(yè)學院, 2011.
[17] HEMMATEENEJAD B, MIRI R, ELYASI M. A segmented principal component analysis-regression approach to QSAR study of peptides[J].Journal of Theoretical Biology, 2012, 305: 37-44.
[18] MAJUMDER K, WU Jianping. A new approach for identification of novel antihypertensive peptides from egg proteins by QSAR and bioinformatics[J]. Food Research International, 2010, 43(5): 1371-1378.
[19] 陶鵬, 王任小, 來魯華. 用氨基酸加和法計算多肽的脂水分配系數(shù)[J]. 物理化學學報, 1999, 15(5): 449-453.
[20] 王惠文. 偏最小二乘回歸的線性與非線性方法[M]. 北京: 國防工業(yè)出版社, 2006: 1-133.
[21] 馬雄威. 線性回歸方程中多重共線性診斷方法及其實證分析[J]. 華中農(nóng)業(yè)大學學報: 社會科學版, 2008(2): 78-83.
[22] CHEUNG H S, WANG Fenglai, ONDETTI E, et al. Binding of peptide substrate and inhibitors of angiotensin-converting enzyme[J].Journal of Biological Chemistry, 1980, 255: 401-407.
[23] 蔡廣霞. 大米源血管緊張素轉(zhuǎn)化酶抑制肽的復合酶法制備、純化及構效關系研究[D]. 武漢: 武漢工業(yè)學院, 2012.
[24] CHEN Jiwang, WANG Yimei, ZHONG Qixin, et al. Purif ication and characterization of a novel angiotensin-I converting enzyme (ACE)inhibitory peptide derived from enzymatic hydrolysate of grass carp protein[J]. Peptides, 2012, 33(1): 52-58.