亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        計算機算法在生物信息學中的應用綜述

        2017-09-29 14:21:34劉奇付李靜靜
        軟件導刊 2017年9期
        關鍵詞:生物信息學數據分析基因

        劉奇付 李靜靜

        摘 要:在人類基因組計劃的推動下,生物信息學得到了人們的廣泛關注,并呈現出數量多、計算量大等鮮明特征,因此要求在生物信息學中采用計算機算法,以提高生物信息學處理問題的效率。以生物信息學中常用的計算機算法為切入點,進一步從基因表達數據分析、基因組序列信息分析、生物序列差異和相似性分析、遺傳數據分析以及蛋白質結構與功能預測5個方面,論述了計算機算法在生物信息學中的典型應用。

        關鍵詞:生物信息學;基因;計算機算法;數據分析

        DOI:10.11907/rjdk.171382

        中圖分類號:TP301 文獻標識碼:A 文章編號:1672-7800(2017)009-0209-03

        Abstract:In the human genome project, the bioinformatics has been widely concerned by the broad masses of bioinformatics scholars, and has the characteristics of large quantity and large computational complexity. This requires that the computer science algorithm should be used in bioinformatics , In order to improve the efficiency of bioinformatics processing problems. In this paper, the computer algorithm used in bioinformatics as the starting point, and further from the analysis of gene expression data, genome sequence information, biological sequence differences and similarity, genetic data and predict the structure and function of protein five aspects, discusses the computer algorithm A typical application in bioinformatics for discussion.

        Key Words:bioinformatics; gene; computer algorithm; data analysis

        0 引言

        生物信息學(Bioinformatics)作為一門新興的交叉學科,是隨著生命科學和計算機科學的高速發(fā)展而出現的。它通過充分利用生物學、信息學、數學、物理學、統(tǒng)計學以及計算機網絡等工具或手段,對大量生物數據信息進行有效的闡明和分析,使之成為具有相應生物意義的生物數據信息。其涵蓋了基因組信息的獲取、處理、分配、存儲等多個方面,通過對生物信息的比較和分析,從而獲取基因編碼以及核酸和蛋白質結構功能等信息,是最具活力和發(fā)展前景的學科之一。然而,生物信息學在我國由于起步較晚,加之其自身呈現出的數量多、計算量大等特征,使生物信息學面臨著計算瓶頸?;诖?,筆者結合自己的工作實踐,對計算機算法在生物信息學中的應用進行探討,以期為在生物信息學中進行有效的數據挖掘提供理論支持。

        1 生物信息學中常用的計算機算法

        算法作為計算機科學的一個重要分支,在計算機科學中居于核心地位。在信息時代,算法作為解決問題的重要工具之一,其通過輸入符合規(guī)范的信息,從而在短時間內快速獲取所需要的輸出,現已在各個領域得到了廣泛應用。在生物信息學中,計算機算法的應用也對生物信息學的發(fā)展起著積極推動作用。生物信息學中常用的計算機算法主要包括以下幾種:

        (1)分治法。分治法即在解決大的問題實例時,通過將該問題實例分解為具有相同問題的幾個小的問題實例,再采用遞歸方法依次對這些小的問題實例求解,然后將所得的解合并,從而得出大的問題實例的解。分治法主要應用于合并排序、最近對和凸包問題等領域。而在生物信息學中,可以通過分治法來分析處理序列比對以及序列聯配等問題。其中,序列比對在生物學中是最為常見的問題之一,通過PSW-DC算法、生物序列比對算法,在分而治之方法理念的指導下,將Query序列劃分成幾個片段,再分配給對應的處理器,然后并行地按照Smith-Waterman算法和目標序列進行對比,最終根據相應規(guī)則的擴展過程得到最優(yōu)化的序列匹配[1]。

        (2)圖算法。圖算法指通過特制的線條算圖求得問題實例解的一種便捷算法。圖作為一種非線性結構,極具復雜性。因此,圖算法無論是在工程、人工智能、數學領域,還是在生物信息學、計算機科學領域均得到了廣泛應用。其中,在生物信息學中,運用圖算法能夠解決很多生物信息學問題,例如:DNA測序、蛋白質測序等。

        (3)貪婪算法。貪婪算法指在一定標準下,通過制定一系列步驟構造問題實例的解,并從眾多解中選取局部最優(yōu)的一個。選取不具有撤銷性,因而依此選取直至全局達到最優(yōu)。在生物信息學中,貪婪算法主要應用于解決基因組重排、反序排列等問題[2]。該算法在生物信息學中的應用不僅能夠使問題得到最優(yōu)解,而且具有較高的運算速度,是一種有效且可行的計算機算法。

        (4)動態(tài)規(guī)劃算法。動態(tài)規(guī)劃算法是指將大的問題實例分解為若干小的、類似的、交錯的子問題實例,通過從下到上的遞推方式求得最優(yōu)值,并將子問題實例的解進行有效存儲,防止重復計算子問題,從而得到問題最優(yōu)解決方案的一種算法策略。將動態(tài)規(guī)劃算法運用到生物信息學中,能夠有效地分析并處理數據之間的重疊性以及相關性等特點,因此主要應用于DNA序列比較、局部及全局序列聯配、多重聯配、基因預測及填充表達缺失數據等問題中[3]。endprint

        2 計算機算法在生物信息學中的典型應用

        2.1 基因表達數據分析

        基因表達數據分析一直是生物信息學研究的熱點和難點。在當今的工作實踐中,往往采用計算機算法中的聚類分析對基因表達數據進行分析處理,通過把表達規(guī)律相近的基因聚成一類,從而找出相互之間有關聯的基因,并分析基因功能。計算機算法可以通過基因的轉錄調節(jié)網絡,觀察基因的表達模式隨環(huán)境變化或在藥物作用下作出的相應改變,闡明基因相互間的調節(jié)作用,并對基因的啟動子加以研究,分析具有相同表達模式的同類啟動子的組成特性。計算機算法中的聚類分析作為分析基因表達數據的重要方法之一,不僅能夠發(fā)現基因間的線性關系,而且能夠找出基因間的非線性關系,因而逐步得到廣大研究者的認可[4]。

        2.2 基因組序列信息分析

        生物信息學中的基因組序列并不是基因的簡單排列,而是具有特定的組織和信息結構,并經過長期演化形成的結果,是基因充分發(fā)揮其應有功能所必需的基礎條件之一。利用計算機算法對基因組序列信息進行分析,并預測相關功能位點是近年來的主要研究方向之一。分析基因組序列信息通常采用從頭算法和比較同源列法兩大類。其中,從頭算法是基于統(tǒng)計學的方法,它是指通過識別蛋白質編碼基因的性質及特征,對外顯子、內含子和基因間的區(qū)域進行有效區(qū)分;而比較同源列法則是通過將基因信息與數據庫中的基因信息進行同源比較,從而找出新基因。在新的DNA序列中,一般除基因外,還包含許多與核酸結構特征有關聯的其它信息,這些信息對DNA與蛋白質或RNA之間的相互作用具有決定性影響,而運用計算機算法搜索與已知蛋白質、表達序列標簽相似的區(qū)域,并對其進行編碼,是生物信息學中分析基因組序列信息最為理想的算法之一。

        2.3 生物序列差異與相似性分析

        在生物信息學中,分析生物序列的差異和相似性是最基本且重要的操作之一,通過對生物序列差異和相似性的分析比較,能夠及時得到生物序列中的結構、功能以及進化等方面信息。一般而言,結構、功能和生物序列間呈現出相互制約的關系,結構由生物序列決定,而功能又由結構決定。在分析生物序列差異和相似性中采用計算機算法,能夠快速達到研究目的。其中,目的之一即通過生物序列之間的相似性,發(fā)現相似的結構及功能。當然也有特殊情況,例如:幾乎沒有任何相似之處的生物序列,不僅分子構成的空間形狀相同,而且功能也相同;目的之二即通過對比生物序列之間的相似性,對生物序列間的同源性進行判斷,并依此推斷生物序列間的進化關系。在分析生物序列的差異和相似性的過程中,常用的計算機算法主要為Needleman-Wunsch動態(tài)規(guī)劃算法、Smith-Waterman算法以及支持向量機算法等。

        2.4 遺傳數據分析

        在生物信息學研究中,由于基因結構、組序列信息以及生物序列的復雜性,要求在對遺傳數據信息的分析過程中運用計算機算法。具體而言,可以借用一些可視化工具,將基因以圖、樹、鏈和方體等形式表現出來,從而提高相關工作人員對基因信息以及基因模式的理解。而知識發(fā)現作為發(fā)現遺傳數據最有力的可視化工具之一,能夠對遺傳數據進行充分挖掘,對轉錄調控基因組水平也能起到積極影響。

        2.5 蛋白質結構與功能預測

        蛋白質的生物功能是由蛋白質結構決定的,因此在生物信息學中對蛋白質進行研究時,應當首先了解蛋白質結構。隨著現代科技的進步,預測蛋白質結構與功能的方法和手段均有了很大進步,但在具體操作過程中依然遠遠滿足不了實際需要,這從一定程度上為計算機算法的推廣應用提供了契機。將計算機算法運用于蛋白質結構與功能預測中,不僅對研究蛋白質結構與功能間的相互關系起著至關重要的作用,而且對蛋白質工程以及蛋白質設計的進展能起到積極促進作用。通常而言,預測蛋白質結構主要包括對蛋白質二級結構以及空間結構進行預測。其中,二級結構預測屬于模式識別問題,通過運用計算機算法能夠有效判斷氨基酸殘基形狀,而在空間結構預測時采用計算機算法,能夠以蛋白質序列為出發(fā)點,判斷亞細胞定位、糖基化位點、信號肽剪切位點等與蛋白質功能有關的特征。

        3 研究展望

        隨著生物信息學的發(fā)展,我國專家學者對生物信息學的重視程度不斷提高,而計算機算法的推廣應用也在一定程度上為生物信息學的發(fā)展提供了新的契機。但從生物信息學的總體發(fā)展情況來看,仍和國際水平有很大差距,需要在未來研究中特別注意如下兩方面問題:

        (1)專業(yè)人才培養(yǎng)。生物信息學作為一門新興學科,要求相關從業(yè)人員既要具備扎實的生物學知識,又要具有較高水平的計算機學科技能,但縱觀我國生物信息學的從業(yè)人員現狀,存在著嚴重的人才斷層及人才匱乏現象,從而對計算機算法在生物信息學中的應用產生了一定制約。因此,要求在后期的研究過程中,注重專業(yè)人才的培養(yǎng),有效解決人才匱乏的現狀,為計算機算法在生物信息學中的應用提供強大的人才支持。

        (2)計算機算法應用范圍拓展。隨著人類基因組計劃的啟動以及計算機科學水平的提高,計算機算法在生物信息學中的應用已取得了初步進展,在分析基因表達數據、基因組序列信息、生物序列差異和相似性、遺傳數據,以及預測蛋白質結構與功能等方面發(fā)揮了重大作用。但生物信息學包含的內容極其豐富,因此要求在后期的研究過程中,應當有計劃地擴大計算機算法在生物信息學中的應用范圍,使計算機算法的價值得到最大限度的發(fā)揮,為生物信息學研究的有效開展提供強有力的技術支持。

        4 結語

        生物信息學作為一門生物學與計算機科學交叉融合的新興學科,其核心是生物學,基本工具則是計算機科學。因此,要求生物信息學相關研究人員在工作實踐中,加強各學科之間的溝通、合作,充分把握計算機算法在生物信息學中的應用,從而解決生物信息學中信息數量多、計算量大等問題,推動生物信息學的進一步發(fā)展。

        參考文獻:

        [1] 于嘯,孟繁疆.數據挖掘技術在生物信息學中的應用[J].農機化研究,2009(3):186-188.

        [2] 趙磊,劉利軍,黃青松.計算機算法在生物信息學中的應用[J].化學與生物工程,2009,26(9):79-81.

        [3] 黃元南,王建新,陳建二.數據挖掘技術在生物信息學中的應用探索[J].電腦知識與技術,2006(9):1-11.

        [4] 莊麗艷,董紅斌.進化計算在生物信息學中的應用[J].哈爾濱師范大學自然科學學報,2007,23(1):60-63.

        (責任編輯:黃 健)endprint

        猜你喜歡
        生物信息學數據分析基因
        Frog whisperer
        修改基因吉兇未卜
        奧秘(2019年8期)2019-08-28 01:47:05
        創(chuàng)新基因讓招行贏在未來
        商周刊(2017年7期)2017-08-22 03:36:21
        “PBL+E—learning”教學模式探索
        移動教學在生物信息學課程改革中的應用
        今傳媒(2016年11期)2016-12-19 11:35:50
        中醫(yī)大數據下生物信息學的發(fā)展及教育模式淺析
        數據挖掘技術在生物信息學中的應用
        Excel電子表格在財務日常工作中的應用
        淺析大數據時代背景下的市場營銷策略
        新常態(tài)下集團公司內部審計工作研究
        中國市場(2016年36期)2016-10-19 04:31:23
        在线观看热码亚洲av每日更新| 亚洲区一区二区三区四| 少妇特殊按摩高潮对白| 久久久精品亚洲一区二区国产av| 国产对白国语对白| 一二三四在线观看免费视频| 亚洲AV永久无码精品导航| 亚洲成av人片在线观看无码| 国产精品久久无码不卡黑寡妇 | 国产精品国产三级国产专区50| 天堂网av一区二区三区在线观看| 天天噜日日噜狠狠噜免费| 欧美性大战久久久久久久| 国产69精品一区二区三区| 国产91成人自拍视频| 亚洲视频高清一区二区| 人妻夜夜爽天天爽三区| 国产亚洲精久久久久久无码| 久久亚洲中文字幕精品一区四| 射进去av一区二区三区| 亚洲午夜久久久精品影院| 99久久婷婷国产综合精品电影| 亚洲AV秘 无码一区二p区三区| 亚洲精品国产av一区二区| 内射爆草少妇精品视频| 欧美老肥妇做爰bbww| 免费无码又爽又刺激聊天app| 巨乳av夹蜜桃站台蜜桃机成人| 一级a免费高清免在线| 亚洲人成综合第一网站| 日本丰满熟妇videossex8k| 伊人久久大香线蕉在观看| 国产一区二区三区涩涩涩| 午夜国产视频一区二区三区| 国产精品久久国产精品99| 99ri国产在线观看| 国产美女高潮流白浆免费观看| 99久久国内精品成人免费| 亚欧中文字幕久久精品无码| 婷婷开心深爱五月天播播| 婷婷色在线视频中文字幕|