摘 要:人類肝臟蛋白質(zhì)組的研究離不開生物信息學(xué)及計算機技術(shù)的支持,本文結(jié)合現(xiàn)階段蛋白質(zhì)組數(shù)據(jù)研究以及實際試驗需求,對生物信息學(xué)及蛋白質(zhì)組學(xué)進行介紹,分別從蛋白質(zhì)相互作用、生物信息學(xué)和蛋白質(zhì)功能、生物信息學(xué)和蛋白質(zhì)數(shù)據(jù)庫等方面對人肝臟蛋白質(zhì)組生物信息學(xué)研究,對人肝臟蛋白質(zhì)表達譜數(shù)據(jù)庫應(yīng)用系統(tǒng)進行探討。
關(guān)鍵詞:肝臟;蛋白質(zhì)組;生物信息學(xué);研究
中圖分類號:Q75
隨著社會經(jīng)濟的快速發(fā)展,信息技術(shù)也得到進步,軟硬件不斷推陳出新。生物信息學(xué)作為一門新的學(xué)科,為后基因組研究提供科學(xué)合理準確的研究方法。和基因組時代的研究手段相比,蛋白質(zhì)組學(xué)也更加復(fù)雜,需要生物信息學(xué)與之相互結(jié)合,并且可以提供出更加準確的數(shù)據(jù)。所以,生物信息學(xué)對肝臟蛋白組學(xué)相關(guān)信息數(shù)據(jù)進行處理和應(yīng)用是未來生物信息學(xué)的重要發(fā)展趨勢。本文結(jié)合現(xiàn)階段蛋白組數(shù)據(jù)以及實際研究需求,對有關(guān)人肝臟蛋白質(zhì)組生物信息學(xué)進行研究和探討,不足之處,敬請指正。
1 生物信息學(xué)和蛋白質(zhì)組學(xué)概述
1.1 生物信息學(xué)
生物信息學(xué)是一門新興學(xué)科,主要是針對核酸、蛋白質(zhì)等,對原始生物信息的收集、分析、存儲以及處理等,利用計算機及生物醫(yī)學(xué)等工具進行研究。其大約經(jīng)理了三個重要階段,首先是前基因組時代,包括數(shù)據(jù)庫的建立、收索以及DNA蛋白質(zhì)序列的分析;其次是基因組時代,包括對基因進行搜尋和識別,如何建立網(wǎng)絡(luò)數(shù)據(jù)庫等研究;最后是后基因組時代,包括大規(guī)模數(shù)據(jù)的分析及整合。
1.2 人肝臟蛋白質(zhì)組學(xué)
蛋白質(zhì)組是指所有基因代表的全部蛋白質(zhì),及其存在的形式,實際上是一種完整生物體所表達的全套蛋白質(zhì)。具體而言,蛋白質(zhì)組和基因組的定義有很大差別,會根據(jù)組織、環(huán)境狀態(tài)等有所改變,不僅復(fù)雜多變,而且其種類數(shù)量在同一生物體同一環(huán)境下也有所區(qū)別,因此,對人肝臟蛋白質(zhì)組學(xué)的研究需要大量的數(shù)據(jù),生物信息學(xué)與肝臟蛋白質(zhì)學(xué)的結(jié)合具有重要意義。
2 人肝臟蛋白質(zhì)組生物信息學(xué)研究
2.1 蛋白質(zhì)相互作用
按照生物分子相互作用,分別從數(shù)據(jù)穩(wěn)定可靠、網(wǎng)絡(luò)模塊以及信號傳導(dǎo)等方面進行研究,對蛋白質(zhì)相互作用的不同功能模塊進行定義,把蛋白質(zhì)指標與生物信息學(xué)網(wǎng)絡(luò)結(jié)合,對酵母轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)及相關(guān)功能特征進行總結(jié),尋找不同物種代謝網(wǎng)絡(luò)功能和進化的關(guān)系。信號傳導(dǎo)方面,發(fā)掘信號傳導(dǎo)子網(wǎng)絡(luò),建立對傳導(dǎo)信號流方向的預(yù)測方法,這種方法對肝臟蛋白質(zhì)作用的方向性進行定義,從而推斷出蛋白質(zhì)在網(wǎng)絡(luò)中處于信號通路,并且在蛋白質(zhì)結(jié)構(gòu)和蛋白質(zhì)功能等方面對信號傳導(dǎo)網(wǎng)絡(luò)進行理解。網(wǎng)絡(luò)進化方面,設(shè)計出基于KEGG數(shù)據(jù)庫的代謝網(wǎng)絡(luò),分析蛋白質(zhì)相互作用網(wǎng)絡(luò)中酶進化保守及拓撲之間關(guān)聯(lián)的進化距離確定模型。
人類肝臟蛋白質(zhì)之間的相互作用,通過網(wǎng)絡(luò)試驗數(shù)據(jù)進行全面的生物學(xué)研究,利用質(zhì)控獲取核心數(shù)據(jù),建立人類肝臟代謝網(wǎng)絡(luò),對網(wǎng)絡(luò)拓撲結(jié)構(gòu)及蛋白質(zhì)功能關(guān)系進行分析,和人的代謝網(wǎng)絡(luò)進行對比分析,發(fā)展人類肝臟中有大量全基因組代謝網(wǎng)絡(luò)。
2.2 生物信息學(xué)和蛋白質(zhì)功能
生物信息學(xué)已經(jīng)經(jīng)過多年發(fā)展,一方面可以對蛋白質(zhì)組數(shù)據(jù)進行對比分析,另一方面能夠?qū)ξ粗虍a(chǎn)物從功能方面進行預(yù)測。生物信息學(xué)常見的方法是進行相關(guān)模式的識別,是通過已經(jīng)存在于蛋白質(zhì)序列結(jié)構(gòu)中一些特征模體,對人類肝臟蛋白質(zhì)性質(zhì)進行識別。換句話說就是從一些未知的新的蛋白質(zhì)序列中搜尋標志性的已知的序列或者蛋白質(zhì)結(jié)構(gòu),從而建立相關(guān)模式,最后在已建的蛋白質(zhì)數(shù)據(jù)庫中匹配相似模式,并對未知蛋白質(zhì)歸屬進行確定,最后對蛋白質(zhì)的功能進行預(yù)測。
很多基因是在特殊條件下才可以表達,普通的人工模擬環(huán)境無法正常激活。這種未知蛋白質(zhì)需要利用生物信息學(xué)及計算機技術(shù)對其進行分析和預(yù)測,才可以獲取它的具體功能。
2.3 生物信息學(xué)和蛋白質(zhì)數(shù)據(jù)庫
隨著網(wǎng)絡(luò)技術(shù)及計算機技術(shù)的發(fā)展,蛋白質(zhì)組學(xué)的研究效率也得到極大程度的提高,蛋白質(zhì)數(shù)據(jù)庫是代表蛋白質(zhì)組研究水平的重要標志,截止到現(xiàn)在生物學(xué)數(shù)據(jù)庫的總數(shù)超過五百多個。蛋白質(zhì)數(shù)據(jù)庫的類別有以下幾種:(1)按照生物數(shù)據(jù)信息的存儲方式,包括層次型、網(wǎng)狀型、關(guān)系型以及面向?qū)ο笮?;?)按照數(shù)據(jù)存儲種類,包括一級結(jié)構(gòu)序列、三維結(jié)構(gòu)圖形、DAN和蛋白質(zhì)相互作用數(shù)據(jù)庫等。其中,一級結(jié)構(gòu)序列數(shù)據(jù)庫包括SWISS-PROT、MIPS、DOMO等,二維凝膠圖像數(shù)據(jù)庫包括WORLD-2DPAGE等,三維結(jié)構(gòu)圖形數(shù)據(jù)庫包括SCOP、WSISS-MODEL、CCDC等;(3)按照數(shù)據(jù)庫內(nèi)容進行分類,包括蛋白質(zhì)序列數(shù)據(jù)庫、結(jié)構(gòu)數(shù)據(jù)庫及功能數(shù)據(jù)庫等。其中,序列數(shù)據(jù)庫的功能是作為序列測定,包括PIR、GenPept等,一般是互相結(jié)合共同使用。結(jié)構(gòu)數(shù)據(jù)庫包括SCOP等是對蛋白質(zhì)間結(jié)構(gòu)關(guān)系進行闡述。功能數(shù)據(jù)庫,包括GO數(shù)據(jù)庫等,是對蛋白質(zhì)的功能、細胞組等進行闡述;(4)專業(yè)數(shù)據(jù)庫,是按照實際需求而建立的專業(yè)數(shù)據(jù)庫,包括EcoCyc、Wombase等。
3 人肝臟蛋白質(zhì)表達譜數(shù)據(jù)庫應(yīng)用系統(tǒng)分析
3.1 系統(tǒng)運行環(huán)境
本系統(tǒng)是利用Eclipse3.1環(huán)境,是一種具有可視化、面向?qū)ο蟮沫h(huán)境,具有強大的功能,而且操作簡便,集成了JSF等插件,便于進行編寫和調(diào)試,Web是基于JSF的動態(tài)網(wǎng)頁,數(shù)據(jù)庫訪問層是已經(jīng)構(gòu)件好的ORM服務(wù),從而可以完成Java對象和數(shù)據(jù)信息的轉(zhuǎn)換。
3.2 系統(tǒng)組成及其功能
人類肝臟蛋白質(zhì)表達譜數(shù)據(jù)庫的建立是一種Web應(yīng)用系統(tǒng),可以利用計算機瀏覽器對數(shù)據(jù)庫的數(shù)據(jù)信息進行操作,基于數(shù)據(jù)庫的數(shù)據(jù)研究,展示人類肝臟蛋白質(zhì)表達譜的一些研究情況,其中主頁上列出研究名稱,詳細信息頁面上包括項目的簡要介紹、鑒定方法、統(tǒng)計信息等,詳細鑒定結(jié)構(gòu)列表中還有蛋白質(zhì)、肽段等數(shù)據(jù)信息展示。除此之外,還有數(shù)據(jù)檢索模塊,主要應(yīng)用于過濾標準,能夠自行對過濾及排序標準進行定制,從而獲取對應(yīng)的檢索數(shù)據(jù)。(1)蛋白質(zhì)信息,包括列表信息及詳細信息,其中詳細信息還包括一般信息、注釋信息以及詳細鑒定信息等;(2)肽段信息展示,包括肽段列表信息以及詳細信息,其中列表信息表示全部肽段列表,以及其中鑒定情況,假如列表是空的則表示無肽段信息,包括鑒定列表、肽段被PMF鑒定次數(shù)、PFF鑒定信息等;(3)非冗余蛋白質(zhì)組信息,該模塊主要展示項目中的列表信息,假如列表是空的則表示沒有相關(guān)信息;(4)數(shù)據(jù)檢索,本系統(tǒng)中數(shù)據(jù)檢索是在過濾標準定制的基礎(chǔ)上制定的功能,利用自行過濾定制及排序標準,從而得到檢索結(jié)果,以蛋白質(zhì)、肽段等形式表示。
4 結(jié)束語
總而言之,針對人肝臟蛋白質(zhì)組進行生物信息學(xué)相關(guān)研究和探索,具體是從蛋白質(zhì)相互作用、蛋白質(zhì)功能及數(shù)據(jù)庫研究等幾個方面進行探索,為人肝臟蛋白質(zhì)組進行進一步研究提供信息技術(shù)支持。本文對有關(guān)人肝臟蛋白質(zhì)組生物信息學(xué)進行研究和探討,以期對于蛋白質(zhì)組的研究方面,起到一定的促進作用。
參考文獻:
[1]李媛,崔尚金,李建偉.分子生態(tài)學(xué)與生物信息學(xué)[A].中國畜牧獸醫(yī)學(xué)會禽病學(xué)分會第十一次學(xué)術(shù)研討會論文集[C],2012.
[2]陸文聰,鈕冰.基于數(shù)據(jù)挖掘的生物信息學(xué)研究進展[A].中國化學(xué)會第27屆學(xué)術(shù)年會第15分會場摘要集[C],2010.
[3]陳婷婷,郭婷婷,李林.基于生物信息學(xué)的功能蛋白基因序列分類研究[A].2011年全國通信安全學(xué)術(shù)會議論文集[C],2011.
[4]康曉東.生物信息學(xué)及其研究對象[A].全國醫(yī)學(xué)影像技術(shù)學(xué)術(shù)會議論文匯編[C],2009.
[5]張宇,賀丹,王麗.絲狀真菌蛋白質(zhì)組學(xué)研究[J].中國免疫學(xué)雜志,2010(03).
[6]安捷倫科技總裁拜訪中科院生物物理研究所,并為蛋白質(zhì)組學(xué)合作實驗室揭牌[J].生命科學(xué)儀器,2010(02).
作者單位:新鄉(xiāng)醫(yī)學(xué)院三全學(xué)院 基礎(chǔ)醫(yī)學(xué)院,河南新鄉(xiāng) 453003;新鄉(xiāng)市牧野區(qū)林業(yè)工作站,河南新鄉(xiāng) 453003