亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        AMI方法對(duì)HIV病毒分類

        2015-03-27 12:26:52劉旻昊
        山東青年 2015年1期
        關(guān)鍵詞:基因組

        劉旻昊

        摘要:在生物的基因序列中,蘊(yùn)含了其所有的特點(diǎn)和規(guī)律,是大自然隱藏在生物千變?nèi)f化形態(tài)下的“密碼”。在本文中我們選取21種HIV病毒基因數(shù)據(jù),應(yīng)用基于非序列比對(duì)的平均互信息方法提取出它們的序列特征,結(jié)合相關(guān)系數(shù)和離差平方和方法(Ward法)對(duì)其進(jìn)行分類。此種分類方法有別于傳統(tǒng)的序列對(duì)比方式,運(yùn)算簡單,速度快捷且得到了合理的分類結(jié)果。

        關(guān)鍵詞:平均互信息;基因組;離差平方和方法

        引言

        在醫(yī)學(xué)領(lǐng)域,從DNA分子水平來研究疾病的起因發(fā)展與分類,解讀病毒基因的“密碼”,正日益引起分子生物學(xué)者、數(shù)學(xué)、計(jì)算機(jī)以及信息網(wǎng)絡(luò)科學(xué)研究人員的重視。如何分析這些DNA序列數(shù)據(jù),提取出能夠量化的“信息”來描述它們之間的聯(lián)系,是當(dāng)前研究的熱門問題。HIV病毒在進(jìn)化過程中形成了三種亞型分類,目前對(duì)這種進(jìn)化分類常用的方法有最大簡約法、距離矩陣法和最大似然法等。相應(yīng)的也有一系列軟件,如:PHYLIP、PAUP和MEGA等。通常在應(yīng)用這些方法之前,都要對(duì)序列進(jìn)行比對(duì)(sequence alignment),常用的軟件有CLUSTRALW等。

        本文提取不同DNA序列的平均互信息(Average Mutual Information,AMI)[2]作為特征參數(shù),構(gòu)造AMI向量,通過AMI向量的相關(guān)系數(shù)定義不同DNA序列之間的距離,利用離差平方和法對(duì)距離矩陣進(jìn)行聚類分析,從而得到他們的進(jìn)化關(guān)系。此種方法是非序列比對(duì)方法,計(jì)算簡單且速度較快,對(duì)大量數(shù)據(jù)的處理非常方便,在醫(yī)學(xué)領(lǐng)域中有著廣泛的應(yīng)用。

        1.理論與方法

        1.1平均互信息(AMI)

        DNA序列是4種核苷酸A、C、G、T的集合,如果x代表在基因序列上某一位置的核苷酸,則y為在x下游方向間隔k個(gè)位置的核苷酸。n\-k(x,y)表示核苷酸x其下游間隔k個(gè)位置為y的組合的個(gè)數(shù),這樣就P\-k(x,y)表示核苷酸x其下游間隔k個(gè)位置為y的條件概率。p(x)和p(y)分別是基因序列中核苷酸x和y的概率。

        當(dāng)選取k=0時(shí),就表示了緊鄰二聯(lián)體核苷酸的關(guān)聯(lián)程度,k=1時(shí)表示次緊鄰二聯(lián)體核苷酸的關(guān)聯(lián)程度。[3]i\-k就是基因序列的平均互信息(AMI),不同的k值對(duì)應(yīng)不同的i\-k,對(duì)于每一基因組,我們都能夠得到一組數(shù)據(jù)i\-0,i\-1,…,i\-k,從而構(gòu)成向量I=

        (i\-0,i\-1,…,i\-k),不同的基因序列,可以得到不同的向量I,J,L。

        1.2 相關(guān)系數(shù)

        在本文中我們使用的是線性相關(guān)系數(shù),它反了映兩個(gè)數(shù)據(jù)集之間的線性相關(guān)程度。若相關(guān)系數(shù)為,表示兩個(gè)數(shù)據(jù)集之間呈現(xiàn)完美的正線性相關(guān);若相關(guān)系數(shù)為,則表示量數(shù)據(jù)集之間是負(fù)線性相關(guān);若相關(guān)系數(shù)為0,則表示兩組數(shù)據(jù)集之間沒有線性相關(guān)性。

        1.3 聚類分析

        我們通過計(jì)算不同物種兩兩之間的AMI距離,可以得到不同物種之間的距離從而得到一個(gè)距離矩陣。對(duì)于這個(gè)矩陣,本文選用離差平方和方法進(jìn)行聚類。

        2.基因數(shù)據(jù)與結(jié)果討論

        2.1 基因數(shù)據(jù):21種HIV 數(shù)據(jù)

        21種HIV病毒基因分為三種亞型,用a、b、c分別表示,每種又各有七種,數(shù)據(jù)來自NCBI(http://www.ncbi.nlm.nih.gov)。這21種HIV數(shù)據(jù),長度比較一致,都在10000個(gè)核苷酸上下。

        2.2 數(shù)據(jù)計(jì)算

        對(duì)于這21種HIV病毒,首先提取各自序列的AMI向量,每種病毒得到一個(gè)向量 。對(duì)于參數(shù)k的選取,我們選取了10、50、100、200、300、400、500、600、700等多個(gè)值,綜合各向量之間的距離和聚類分析的結(jié)果來看,k取500是比較合適的,k過小會(huì)丟失基因組的一些關(guān)聯(lián)信息,k過大對(duì)結(jié)果沒有什么影響,這樣AMI向量共有501個(gè)分量。對(duì)于這21個(gè)向量計(jì)算兩兩之間的相關(guān)系數(shù),從而組成一個(gè)距離矩陣。我們將這個(gè)距離矩陣輸入R軟件,使用離差平方和法進(jìn)行聚類分析,得到分類結(jié)果如圖1所示:

        3.結(jié)果分析

        在Mark等人[4]的文章中,也對(duì)這組數(shù)據(jù)做了分析,Mark等使用UPGMA tree、2維和3維圖等方法對(duì)這組數(shù)據(jù)做了分析,將這21種HIV病毒分成了三類。在本文中我們使用R軟件,應(yīng)用離差平方和法更為簡單方便,計(jì)算速度更快,由圖1可以看出同樣對(duì)這21種HIV病毒做了很好的區(qū)分,將其分為a、b、c三類,達(dá)到完全區(qū)分的目的。

        [參考文獻(xiàn)]

        孫嘯,陸祖宏,謝建明.生物信息學(xué)基礎(chǔ)[M].北京:清華大學(xué)出版社,2005:238-239.

        [2] Mark Bauer,Sheldon M Schuster and Khalid Sayood.The Average Mutual Information Profile as a Genomic Signature[J].BMC Bioinformatics 2008,9:48 doi:10.1186/1471-2105-9-48.

        [3] 羅遼復(fù).生命進(jìn)化的物理觀[M].上海:上??茖W(xué)技術(shù)出版社,2000,168-183.

        [4] Ouyang Z,Zhu H,Wang J,et al.Multivariate entropy distance method for p rokaryotic gene identification [J]. J Bioinform ComputBiol, 2004,2(2):353-73.

        (作者單位:武警山東省總隊(duì)訓(xùn)練基地,山東 濟(jì)南 250000)endprint

        猜你喜歡
        基因組
        流式細(xì)胞術(shù)測定玫瑰茄及紅麻的基因組大小
        牛參考基因組中發(fā)現(xiàn)被忽視基因
        科學(xué)家找到母愛改變基因組的證據(jù)
        血清HBV前基因組RNA的研究進(jìn)展
        紫花白及基因組DNA提取方法的比較
        中成藥(2018年7期)2018-08-04 06:04:22
        科學(xué)家找到母愛改變基因組的證據(jù)
        基因組DNA甲基化及組蛋白甲基化
        遺傳(2014年3期)2014-02-28 20:58:49
        基因組育種值估計(jì)的貝葉斯方法
        遺傳(2014年2期)2014-02-28 20:58:18
        有趣的植物基因組
        不同保存條件下白刺屬植物基因組DNA的提取
        色噜噜狠狠一区二区三区果冻| 日韩中文字幕欧美亚洲第一区| 精品一区二区三区无码视频| 久久精品亚洲精品毛片| 日本成熟妇人高潮aⅴ| 熟女乱乱熟女乱乱亚洲| av在线免费观看网站免费| 少妇高潮惨叫久久久久久电影| 纯爱无遮挡h肉动漫在线播放| 国产一区二区三区av在线无码观看| 亚洲精品亚洲人成在线播放| 日本精品少妇一区二区| 国产精品成人av大片| 久久久久高潮综合影院| 久久久久久亚洲av成人无码国产| 最新四色米奇影视777在线看| 亚洲熟妇中文字幕日产无码| 丰满人妻被猛烈进入中文字幕护士| 亚洲综合日韩精品一区二区| 亚洲成av人片天堂网| 国产亚洲情侣一区二区无| 国产精品久久久久久久成人午夜| 精品国产福利久久久| 在线无码免费看黄网站| 国产精品老女人亚洲av无| 蜜桃a人妻精品一区二区三区| 亚洲熟妇少妇任你躁在线观看无码 | 亚洲人成人无码www影院| 丰满多毛少妇做爰视频| 午夜影视啪啪免费体验区入口| 成a人片亚洲日本久久| 国产夫妻自拍视频在线播放| 欧美日韩精品一区二区三区高清视频 | 日本区一区二区三视频| 欧美成人看片一区二区三区尤物| 毛多水多www偷窥小便 | 日本av在线精品视频| 亚洲午夜成人精品无码色欲| 69国产成人综合久久精| 在线综合网| 中文毛片无遮挡高潮|