劉哲言,屈武斌,張成崗
(軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所,蛋白質(zhì)組學(xué)國家重點(diǎn)實(shí)驗室,全軍軍事認(rèn)知與心理衛(wèi)生研究中心,北京100850)
近年來,以核酸分子雜交為基礎(chǔ)的生物技術(shù)如聚合酶鏈反應(yīng)、DNA印跡、RNA印跡、芯片雜交等在病原微生物檢測、臨床診斷中應(yīng)用廣泛,其可靠性依賴于寡核苷酸分子與其靶點(diǎn)結(jié)合的高穩(wěn)定性與特異性,而分析這種結(jié)合特性的關(guān)鍵在于寡核苷酸與靶分子結(jié)合的二級結(jié)構(gòu)的精確預(yù)測,否則會導(dǎo)致假陰性或假陽性的檢測結(jié)果[1-4]。
已有研究顯示最近鄰模型(Nearest-Neighbor Model,簡稱NN model)是預(yù)測寡核苷酸二級結(jié)構(gòu)最可靠的熱力學(xué)計算方法[5],該模型指出一個給定堿基對的穩(wěn)定性依賴于其臨近堿基對的穩(wěn)定性。其基本思想是將核酸分子結(jié)合過程中的標(biāo)準(zhǔn)焓變和熵變計算轉(zhuǎn)化為由A、T、G、C所形成的10個完美匹配二聚體以及非完美匹配結(jié)構(gòu)的標(biāo)準(zhǔn)焓變和熵變的累加和,再加上起始和結(jié)束單獨(dú)匹配堿基對GC或AT以及序列對稱性等因素的影響[6-7]。然而,由于寡核苷酸單分子自身折疊或者雙分子雜交所形成的二級結(jié)構(gòu)具有多樣性與復(fù)雜性,除完美匹配外,還包含單獨(dú)錯配、連續(xù)錯配、內(nèi)環(huán)、膨脹環(huán)、末端搖擺、CNG重復(fù)、GU擺動等多種模式。因此,寡核苷酸二級結(jié)構(gòu)熱力學(xué)計算的精確性還需要依賴上述多種結(jié)構(gòu)的熱力學(xué)參數(shù)。
鑒于目前的熱力學(xué)數(shù)據(jù)分散于不同的文獻(xiàn)中[8-11],且不同來源數(shù)據(jù)可靠性不一,因此本文根據(jù)學(xué)術(shù)界對不同來源數(shù)據(jù)的認(rèn)可程度,系統(tǒng)性的綜述了近年來廣泛用于寡核苷酸二級結(jié)構(gòu)預(yù)測的熱力學(xué)參數(shù)及相關(guān)計算,并指出當(dāng)前數(shù)據(jù)庫的局限及未來發(fā)展方向,從而為相關(guān)人員進(jìn)行研究提供整合數(shù)據(jù)庫資源,促進(jìn)寡核苷酸二級結(jié)構(gòu)的精確預(yù)測。
針對DNA/DNA相互作用雙鏈中Watson-Crick的 AT、GC配對,SantaLucia于 1998年提出的在1mol/L NaCl環(huán)境下的寡核苷酸最近鄰熱力學(xué)參數(shù)是與實(shí)驗數(shù)據(jù)誤差最小的參數(shù)表[8],受到廣泛應(yīng)用(見表1)。其中ΔH、ΔS與ΔG分別表示標(biāo)準(zhǔn)焓變、標(biāo)準(zhǔn)熵變和標(biāo)準(zhǔn)自由能,可直接從熱力學(xué)參數(shù)表獲取。完美匹配結(jié)構(gòu)的熱力學(xué)計算如下:
表1 DNA/DNA結(jié)合完美匹配最近鄰熱力學(xué)參數(shù)(1 mol/L,37℃)Table 1 Nearest-neighbor thermodynamic parameters for DNA/DNA perfect matches(1 mol/L,37℃)
當(dāng)出現(xiàn)單獨(dú)錯配的模式時,應(yīng)用 Allawi、SantaLucia以及Peyret等人于1997~1999年提供的熱力學(xué)數(shù)據(jù)[9-13](見表2)。單獨(dú)錯配結(jié)構(gòu)的熱力學(xué)計算如下:
表2 單獨(dú)錯配結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 2 Thermodynamic parameters for DNA/DNA single mismatch(1 mol/L,37 ℃)
當(dāng)出現(xiàn)連續(xù)錯配即兩個毗連錯配的模式時,應(yīng)用Allawi、SantaLucia以及Peyret等人于1997~1999年提供的熱力學(xué)數(shù)據(jù)[9-13](見表3)。連續(xù)錯配結(jié)構(gòu)的熱力學(xué)計算如下:
表3 連續(xù)錯配結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 3 Thermodynamic parameters for DNA/DNA tandem mismatches(1 mol/L,37 ℃)
當(dāng)出現(xiàn)內(nèi)環(huán)即三個及其以上毗連錯配的模式時,應(yīng)用Santalucia和Hicks于2004年提供的熱力學(xué)數(shù)據(jù)[14](見表4)。內(nèi)環(huán)結(jié)構(gòu)的熱力學(xué)計算如下:
表4 內(nèi)環(huán)結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 4 Thermodynamic parameters for DNA/DNA internal loop(1 mol/L,37 ℃)
所謂單獨(dú)搖擺末端(Single dangling-end),指雜交序列5’或3’末端出現(xiàn)一個未匹配的核酸即空位gap結(jié)構(gòu)(用“-”表示)。當(dāng)出現(xiàn)這種模式時,應(yīng)用Bommarito等人于2000年提供的熱力學(xué)數(shù)據(jù)[15](見表5)。Single dangling-end結(jié)構(gòu)的熱力學(xué)計算如下:
表5 Single dangling-end結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 5 Thermodynamic parameters for DNA/DNA single dangling-end(1 mol/L,37 ℃)
所謂長搖擺末端(Long dangling-end),指雜交序列5’或3’末端出現(xiàn)連續(xù)兩個及其以上未匹配的核酸即空位gap結(jié)構(gòu)(用“-”表示)。當(dāng)出現(xiàn)這種模式時,應(yīng)用Sugimoto等人于2002年提供的熱力學(xué)數(shù)據(jù)[16](見表6)。Long dangling-end結(jié)構(gòu)的熱力學(xué)計算如下:
表6 Long dangling-end結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 6 Thermodynamic parameters for DNA/DNA long dangling-end(1 mol/L,37 ℃)
所謂單獨(dú)膨脹環(huán)(Single bulge loop),指雜交序列內(nèi)部出現(xiàn)一個未匹配的核酸即空位gap結(jié)構(gòu)(用“-”表示)。當(dāng)出現(xiàn)這種模式時,應(yīng)用Tanaka等人于2004年提供的熱力學(xué)數(shù)據(jù)[17](見表7)。Single bulge loop結(jié)構(gòu)的熱力學(xué)計算如下:
表7 Single bulge loop結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 7 Thermodynamic parameters for DNA/DNA single bulge loop(1 mol/L,37 ℃)
所謂長膨脹環(huán)(Long bulge loop),指雜交序列內(nèi)部出現(xiàn)連續(xù)兩個及其以上未匹配的核酸即空位gap結(jié)構(gòu)(用“-”表示)。當(dāng)出現(xiàn)這種模式時,應(yīng)用Santalucia和Hicks于2004年提供的熱力學(xué)數(shù)據(jù)[14](見表8)。Long bulge loop結(jié)構(gòu)的熱力學(xué)計算如下:
表8 Long bulge loop結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 8 Thermodynamic parameters for DNA/DNA long bulge loop(1 mol/L,37 ℃)
當(dāng)DNA與RNA相互作用時,完美匹配的最近鄰熱力學(xué)參數(shù)表由Sugimoto等人于1995年提出[18](見表9),完美匹配結(jié)構(gòu)的熱力學(xué)計算同1.1。
表9 DNA/RNA結(jié)合完美匹配最近鄰熱力學(xué)參數(shù)(1 mol/L,37℃)Table 9 Thermodynamic parameters for DNA/RNA perfect matches(1 mol/L,37 ℃)
當(dāng)RNA與RNA相互作用時,完美匹配的最近鄰熱力學(xué)參數(shù)表[19]由Xia等人于1998年提出(見表10)。當(dāng)mRNA與RNA相互作用時,完美匹配的最近鄰熱力學(xué)參數(shù)表[20]由Turner等人于2006年提出(見表11)。完美匹配結(jié)構(gòu)的熱力學(xué)計算同1.1。
表10 RNA/RNA結(jié)合完美匹配最近鄰熱力學(xué)參數(shù)表(1 mol/L,37℃)Table 10 Thermodynamic parameters for RNA/RNA perfect matches(1 mol/L,37 ℃)
表11 mRNA/RNA結(jié)合完美匹配最近鄰熱力學(xué)參數(shù)表(1 mol/L,37℃)Table 11 Thermodynamic parameters for mRNA/RNA perfect matches(1 mol/L,37 ℃)
當(dāng)出現(xiàn)單獨(dú)錯配的模式時,應(yīng)用Znosko等人于2008年提供的熱力學(xué)數(shù)據(jù)[21](見表12),其中R表示嘌呤堿基,Y表示嘧啶堿基;單獨(dú)錯配結(jié)構(gòu)的熱力學(xué)計算如下:
當(dāng)出現(xiàn)連續(xù)錯配的模式時,應(yīng)用Turner等人于1999和2006年提供的熱力學(xué)數(shù)據(jù)[22-23](見表13)。連續(xù)錯配結(jié)構(gòu)的熱力學(xué)計算如下:
表12 單獨(dú)錯配結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 12 Thermodynamic parameters for RNA/RNA single mismatch(1 mol/L,37 ℃)
表13 連續(xù)錯配結(jié)構(gòu)熱力學(xué)參數(shù)表(1 mol/L,37℃)Table 13 Thermodynamic parameters for RNA/RNA tandem mismatches(1 mol/L,37 ℃)
當(dāng)出現(xiàn)內(nèi)環(huán)結(jié)構(gòu),應(yīng)用Turner等人于1999年和2006年提供的熱力學(xué)數(shù)據(jù)[22-23](見表14)。內(nèi)環(huán)結(jié)構(gòu)的熱力學(xué)計算如下:
所謂CNG重復(fù)序列,是指一條序列(5’至3’方向)由多個G(CNG)xC的子片段組成的序列,這里x是指CNG重復(fù)的數(shù)目;N代表一種單獨(dú)錯配類型即N/N。當(dāng)出現(xiàn)這種模式時,應(yīng)用Broda等人于2005年提供的熱力學(xué)數(shù)據(jù)[24](見表15)。CNG重復(fù)結(jié)構(gòu)的熱力學(xué)計算如下:
表14 內(nèi)環(huán)結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 14 Thermodynamic parameters for RNA/RNA internal loop(1 mol/L,37 ℃)
表15 CNG重復(fù)結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 15 Thermodynamic parameters for CNG repeats(1 mol/L,37 ℃)
當(dāng)RNA/RNA相互作用呈現(xiàn)多個連續(xù)的GU配對(非Watson-Crick配對)結(jié)構(gòu)時,應(yīng)用Turner等人于1999年提供的熱力學(xué)數(shù)據(jù)[22](見表16)。GU擺動配對結(jié)構(gòu)的熱力學(xué)計算如下:
表16 GU擺動配對結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 16 Thermodynamic parameters for GU wobble base pairs(1 mol/L,37 ℃)
對于Sigle dangling-end模式,應(yīng)用Serra等人于2006和2008年提供的熱力學(xué)數(shù)據(jù)[25-26](見表17);對于Long dangling-end模式,應(yīng)用Sugimoto與Serra等人于2002和2006年提供的熱力學(xué)數(shù)據(jù)[16,25](見表18),其中 R表示嘌呤堿基,Y表示嘧啶堿基。Dangling-end結(jié)構(gòu)的熱力學(xué)計算同1.5與1.6。
表17 Single dangling-end結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 17 Thermodynamic parameters forRNA/RNA single dangling-end(1 mol/L,37℃)
表18 Long dangling-end結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 18 Thermodynamic parameters forRNA/RNA long dangling-end(1 mol/L,37 ℃)
對于Single bulge loop模式,應(yīng)用Serra等人于2007年提供的熱力學(xué)數(shù)據(jù)[27](見表 19),Single bulge loop結(jié)構(gòu)的熱力學(xué)計算同1.7;對于Long bulge loop結(jié)構(gòu)應(yīng)用Turner等人于1999和2006年提供的熱力學(xué)數(shù)據(jù)[22-23](見表 20),Long bulge loop 結(jié)構(gòu)的熱力學(xué)計算如下:
表19 Single bulge-end結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 19 Thermodynamic parameters for RNA/RNA single bulge-end(1 mol/L,37 ℃)
表20 Long bulge-end結(jié)構(gòu)熱力學(xué)參數(shù)(1 mol/L,37℃)Table 20 Thermodynamic parameters forRNA/RNA long bulge-end(1 mol/L,37 ℃)
除上述ATCGU之外,生物體中同樣存在一些非正常的堿基如肌苷(Inosine base,I)、羥基腺嘌呤(2_hydroxyadenine pairs,A*)等。目前發(fā)現(xiàn)肌苷在RNA/RNA相互作用中以IU匹配的形式出現(xiàn),相關(guān)的熱力學(xué)數(shù)據(jù)由Znosko等人于2007年提供[28](見表21);肌苷在DNA/DNA相互作用中的熱力學(xué)數(shù)據(jù)由 Santalucia等人于2005年提供(見表22)[29],熱力學(xué)計算如下:
羥基腺嘌呤(A*)的熱力學(xué)參數(shù)由Sugimoto等人于2001年提供[30],通常 A*只在5’-GA*C -3’以及5’-TA*A-3’序列中出現(xiàn)(見表23)。熱力學(xué)計算如下:
表21 RNA/RNA結(jié)合含有I堿基的熱力學(xué)參數(shù)(1 mol/L,37℃)Table 21 Thermodynamic parameters for RNA/RNA inosine base(1 mol/L,37 ℃)
表22 DNA/DNA結(jié)合含有I堿基的熱力學(xué)參數(shù)(1 mol/L,37℃)Table 22 Thermodynamic parameters for DNA/DNA inosine base(1 mol/L,37 ℃)
表23 DNA/DNA結(jié)合含有A*結(jié)構(gòu)的熱力學(xué)參數(shù)(1 mol/L,37℃)Table 23 Thermodynamic parameters for DNA/DNA A*(1 mol/L,37 ℃)
寡核苷酸二級結(jié)構(gòu)的精確預(yù)測在分子生物學(xué)應(yīng)用中發(fā)揮越來越重要的作用,熱力學(xué)參數(shù)的不斷完善使其精確性得到逐步提高。本文針對不同二級結(jié)構(gòu),綜述目前可利用的有效熱力學(xué)數(shù)據(jù)庫,涵蓋完美匹配、錯配、內(nèi)環(huán)、膨脹環(huán)、末端搖擺、CNG重復(fù)、GU擺動配對以及包含肌苷和羥基腺嘌呤等結(jié)構(gòu)?;诒疚牡臄?shù)據(jù),用戶可以根據(jù)不同需求選擇合適的數(shù)據(jù)集,開發(fā)自有或者改進(jìn)現(xiàn)有的寡核苷酸二級結(jié)構(gòu)的預(yù)測算法,從而提高以寡核苷酸雜交為基礎(chǔ)的分子生物技術(shù)的成功率。
然而,生物學(xué)過程是復(fù)雜的,許多基于核酸雜交的生物技術(shù)實(shí)驗中包含的酶,環(huán)境的pH值,Ca2+、Mg2+等離子以及一些變性劑如甲酰胺(formamide)、DMSO(二甲基亞砜)都會顯著影響寡核苷酸二級結(jié)構(gòu)的評估[14];并且,除 A、T、C、G、U 正常堿基以及少數(shù)報道的特殊堿基外,其他生物分子如經(jīng)甲基化或者乙?;揎椇蟮暮塑账嵋泊罅看嬖谟谏矬w中。因此,未來有必要通過實(shí)驗補(bǔ)充新的熱力學(xué)參數(shù),使現(xiàn)有的熱力學(xué)數(shù)據(jù)得到充實(shí)和完善,以進(jìn)一步提高熱力學(xué)計算的精確性,從而促進(jìn)寡核苷酸二級結(jié)構(gòu)的準(zhǔn)確預(yù)測。
References)
[1] FURUICHI T,INOUYE S,INOUYE M.Biosynthesis and structure of stable branched RNA covalently linked to the 5'end of multicopy single-stranded DNA of Stigmatella aurantiaca[J].Cell,1987,48(1):55 - 62.
[2] GACY A M,GOELLNER G,JURANIC N,et al.Trinucleotide repeats that expand in human disease form hairpin structures in vitro[J].Cell,1995,81(4):533 - 540.
[3] HIGASHITANI N,HIGASHITANI A,HORIUCHI K.Nucleotide sequence of the primer RNA for DNA replication of filamentous bacteriophages[J].J Virol,1993,67(4):2175-2181.
[4] MOROZOV S,CHERNOV B K,MERITS A,et al.Computer-assisted predictions of the secondary structure in the plant virus single-stranded DNA genome[J].J Biomol Struct Dyn,1994,11(4):837-847.
[5] CROTHERS D M ,ZIMM B H.Theory of the melting transition of synthetic polynucleotides:Evaluation of the stacking free energy[J].J Mol Biol,1964,9:1 -9.
[6] SCHILDKRAUT C.Dependence of the melting temperature of DNA on salt concentration[J].Biopolymers,1965,3(2):195-208.
[7] 張艷春,屈武斌,盧一鳴,等.DNA解鏈溫度(Tm)不同預(yù)測方法的比較[J].軍事醫(yī)學(xué),2011(03):231-235.ZHANG Yanchun,QU Wubin,LU Yiming,et al.A Comparison of different melting temperature(Tm)prediction methods for DNA[J].Military Medical Sciences,2011,35(3):231-235.
[8] SANTALUCIA J,JR.A unified view of polymer,dumbbell,and oligonucleotide DNA nearest-neighbor thermodynamics[J].Proc Natl Acad Sci U S A,1998,95(4):1460-1465.
[9] ALLAWI H T,SANTALUCIA J,JR.Thermodynamics and NMR of internal G.T mismatches in DNA[J].Biochemistry,1997,36(34):10581-10594.
[10] ALLAWI H T,SANTALUCIA J,JR.Nearest neighbor thermodynamic parameters for internal G.A mismatches in DNA[J].Biochemistry,1998,37(8):2170 -2179.
[11] ALLAWI H T,SANTALUCIA J,JR.Thermodynamics of internal C.T mismatches in DNA[J].Nucleic Acids Res,1998,26(11):2694-2701.
[12] ALLAWI H T,SANTALUCIA J,JR.Nearest-neighbor thermodynamics of internal A.C mismatches in DNA:sequence dependence and pH effects[J].Biochemistry,1998,37(26):9435-9444.
[13] PEYRET N,SENEVIRATNE P A,ALLAWI H T,et al.Nearest-neighbor thermodynamics and NMR of DNA sequences with internal A.A,C.C,G.G,and T.T mismatches[J].Biochemistry,1999,38(12):3468 -3477.
[14] SANTALUCIA J,JR,HICKS D.The thermodynamics of DNA structural motifs[J].Annu Rev Biophys Biomol Struct,2004,33:415 -440.
[15] BOMMARITO S,PEYRET N,SANTALUCIA J,et al.Thermodynamic parameters for DNA sequences with dangling ends[J].Nucleic Acids Res,2000,28(9):1929 -1934.
[16] OHMICHI T,NAKANO S,MIYOSHI D,et al.Long RNA dangling end has large energetic contribution to duplex stability[J].J Am Chem Soc,2002,124(35):10367-10372.
[17] TANAKA F,KAMEDA A,YAMAMOTO M,et al.Thermodynamic parameters based on a nearest-neighbor model for DNA sequences with a single-bulge loop[J].Biochemistry,2004,43(22):7143-7150.
[18] SUGIMOTO N,NAKANO S,KATOH M,et al.Thermodynamic parameters to predict stability of RNA/DNA hybrid duplexes[J].Biochemistry,1995,34(35):11211 -11216.
[19] XIA T,SANTALUCIA J,JR,et al.Thermodynamic parameters for an expanded nearest-neighbor model for formation of RNA duplexes with Watson-Crick base pairs[J].Biochemistry,1998,37(42):14719 -14735.
[20] KIERZEK E,MATHEWS D H,CIESIELSKA A,et al.Nearest neighbor parameters for Watson-Crick complementary heteroduplexes formed between 2'-O-methyl RNA and RNA oligonucleotides[J].Nucleic Acids Res,2006,34(13):3609-3614.
[21] DAVIS A R,ZNOSKO B M.Thermodynamic characterization of naturally occurring RNA single mismatches with G - U nearest neighbors[J].Biochemistry,2008,47(38):10178-10187.
[22] MATHEWS D H,SABINA J,ZUKER M,et al.Expanded sequence dependence of thermodynamic parameters improves prediction of RNA secondary structure[J].J Mol Biol,1999,288(5):911 -940.
[23]LU Z J,TUMER D H,MATHEWS D H.A set of nearest neighbor parameters for predicting the enthalpy change of RNA secondary structure formation[J].Nucleic Acids Res,2006,34(17):4912 -4924.
[24] BRODA M,KIERZEK E,GDANIEC Z,et al.Thermodynamic stability of RNA structures formed by CNG trinucleotide repeats.Implication for prediction of RNA structure[J].Biochemistry,2005,44(32):10873-10882.
[25] O'TOOLE A S,MILLER S,HAINES N,et al.Comprehensive thermodynamic analysis of 3'double-nucleotide overhangs neighboring Watson-Crick terminal base pairs[J].Nucleic Acids Res,2006,34(11):3338 -3344.
[26] MILLER S,JONES L E,GIOVANNITTI K,et al.Thermodynamic analysis of 5'and 3'single-and 3'double-nucleotide overhangs neighboring wobble terminal base pairs[J].Nucleic Acids Res,2008,36(17):5652 -5659.
[27] BLOSE J M,MANNI M L,KLAPEC K A,et al.Nonnearest-neighbor dependence of the stability for RNA bulge loops based on the complete set of group I single-nucleotide bulge loops[J].Biochemistry,2007,46(51):15123-15135.
[28] WRIGHT D J,RICE J L,YANKER D M,et al.Nearest neighbor parameters for inosine x uridine pairs in RNA duplexes[J].Biochemistry,2007,46(15):4625 -4634.
[29] WATKINS N E,JR,SANTALUCIA J,et al.Nearest-neighbor thermodynamics of deoxyinosine pairs in DNA duplexes[J].Nucleic Acids Res,2005,33(19):6258 -6267.
[30] KAWAKAMI J,KAMIYA H,YASUDA K,et al.Thermodynamic stability of base pairs between 2-hydroxyadenine and incoming nucleotides as a determinant of nucleotide incorporation specificity during replication[J].Nucleic Acids Res,2001,29(16):3289 -3296.