張玉巖 聞 佳
(綏化學(xué)院 黑龍江綏化 152061)
當(dāng)i取值從1到N,這樣可以得到點(diǎn)(xi,yi),…(xN,yN),連接鄰接的這些點(diǎn)就可以得到對應(yīng)的蛋白質(zhì)圖形曲線。
表1 二十種氨基酸對應(yīng)的數(shù)值以及它們在二維直角坐標(biāo)系中對應(yīng)的坐標(biāo)
我們可以證明:我們的模型中的圖形曲線不會出現(xiàn)環(huán)等簡并現(xiàn)象出現(xiàn),證明過程如下:
假設(shè)N表示形成環(huán)中對應(yīng)的氨基酸的個(gè)數(shù),每種氨基酸的個(gè)數(shù)分別用g,a,t,s,p,v,l,i,m,f,y,w,d,e,n,q,k,r,h,和c表示,G,A,T,S,P,V,L,I,M,F,Y,W,D,E,N,Q,K,R,H和C表示每種氨基酸對應(yīng)的矢量坐標(biāo),于是我們可知gG,aA,tT,sS,pP,vV,lL,iI,mM,fF,yY,wW,dD,eE,nN,qQ,kK,rR,hH,和cC形成一個(gè)環(huán),因此,上面的環(huán)可以表示為:
由于x軸的坐標(biāo)和可以表示為
于是我們可以解出g=a=t=s=p=v=l=i=m=f=y=w=d=e=n=q=k=r=h=c=0。
因?yàn)榘被岬膫€(gè)數(shù)是非負(fù)的,所以我們可以確定我們所提出的二維圖形中沒有環(huán)的存在(N>0)。
圖1.二十種不用的矢量分別表示二十種不同的氨基酸
因?yàn)榈鞍踪|(zhì)的圖形曲線和蛋白質(zhì)序列是一一對應(yīng)的,所以序列比對可以轉(zhuǎn)化為對應(yīng)圖形曲線的比較。此外,蛋白質(zhì)序列可以由它所對應(yīng)的圖形進(jìn)行數(shù)值刻畫,而且不會丟失任何信息。下面我們通過兩條短的蛋白質(zhì)序列的圖形表示來進(jìn)一步解釋我們所提出的方法的有效性。圖形2[a(1)]和2[a(2)]是利用我們的所提出方法得到的兩條短的蛋白質(zhì)序列圖形曲線。這兩條蛋白質(zhì)序列分別是
通過對比Yu[3]的兩個(gè)相同的蛋白質(zhì)序列的圖形曲線(圖形2[b(1)]和圖形2[b(2)]),可以發(fā)現(xiàn),我們的蛋白質(zhì)圖形曲線更直觀明顯,更容易進(jìn)行分析和比較。又因?yàn)閅u的蛋白質(zhì)曲線會因?yàn)閳D形曲線的簡并現(xiàn)象的存在而更加冗雜,而且對于長的序列是很難進(jìn)行視覺檢測的。
仔細(xì)查看圖形2,我們還可以發(fā)現(xiàn)兩條蛋白質(zhì)序列從整體上看是相似的,這就暗示著它們有幾個(gè)局部匹配的部分。為了進(jìn)一步量化兩個(gè)蛋白質(zhì)序列的不同,我們把兩個(gè)蛋白質(zhì)序列投影在同一個(gè)模板中(圖形3(a))。因?yàn)槊恳粋€(gè)氨基酸可以用一個(gè)獨(dú)特的矢量來進(jìn)行數(shù)值刻畫,所以相同的矢量暗示著相同的氨基酸。在圖形3(a)中,我們很容易找到兩個(gè)蛋白質(zhì)序列的不相似片段僅出現(xiàn)在位點(diǎn)2,11,14,和27。在圖形3(b)中,我們通過考慮對應(yīng)氨基酸的相對距離用來刻畫蛋白質(zhì)序列比對。在位點(diǎn)2,11,14,和27的相對距離分別是3.5217,4.3484,0.3401,和1.1180。比對對應(yīng)于氨基酸側(cè)鏈的酸離解常數(shù)的蛋白質(zhì)序列的圖形,我們可以很明顯地發(fā)現(xiàn)這些不匹配并不都是一樣的。比如在位點(diǎn)14,蛋白質(zhì)I中的Valine被替換為蛋白質(zhì)II中的Isoleucine,這里的不匹配伴隨著一個(gè)小的相對距離。通過比較我們還會發(fā)現(xiàn),兩個(gè)屬于相同類別的氨基酸相對于屬于不同類別的氨基酸更很容易發(fā)生替換。在這兩個(gè)蛋白質(zhì)之間一共有四個(gè)不匹配,其中對應(yīng)于小振幅的相對距離更不容易改變蛋白質(zhì)的內(nèi)在屬性。
圖2.蛋白質(zhì)I和蛋白質(zhì)II的二維圖形表示
圖3.蛋白質(zhì)序列I和蛋白質(zhì)序列II的圖形比對
圖4.八種ND6蛋白質(zhì)序列的二維圖形表示
在圖形4中,我們給出了八種ND6蛋白質(zhì)序列所對應(yīng)的二維圖形曲線表示。通過比較這些圖形曲線,我們會能夠發(fā)現(xiàn)人、大猩猩和黑猩猩(human,gorilla,common chimpanzee)在整體上是更為相似的,同時(shí)麻斑海豹和灰海豹(harbor seal-gray seal),大鼠和小鼠(rat-mouse)也是很相似的。此外,大袋鼠(wallaroo)明顯地區(qū)別于其他物種。這些結(jié)論和已知的生物進(jìn)化結(jié)論和其他已出版文獻(xiàn)的結(jié)論是完全一樣的[4-6]。
[1]Yao,Y.H.;Dai,Q.;Li,L.;Nan,X..Y.;He,P.A.;Zhang,Y.Z.JComput Chem 2010,31,1045-1452.
[2]Wen,J.;Zhang,Y.Y.Chem Phys Lett 2009,476,281-286.
[3]Yu,J.F.;Sun,X.;Wang,J.H.J Inter J Quan Chem 2011,111,2835-2843.
[4]Li,M.;Badger,J.H.;Chen,X.;Kwong,S.;Kearney,P.;Zhang,H.Bioinformatics 2001,17,149-154.
[5]Out,H.H.;Sayood,K.Bioinformatics 2003,19,2122-2130.
[6]Makarenkov,V.;Lapointe,F.Bioinformatics 2004,20,2113-2121.