亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于樣本熵的DNA序列相似性分析

        2016-03-02 08:47:00萬(wàn)力超周小安
        關(guān)鍵詞:物種實(shí)驗(yàn)分析

        萬(wàn)力超 周小安

        摘 要:針對(duì)傳統(tǒng)方法在分析DNA序列相似性方面的不足,提出了一種基于樣本熵的DNA序列相似性分析方法。以五種東亞鉗蝎神經(jīng)毒素的基因序列作為分析對(duì)象,首先通過(guò)DNA序列的圖形表示把DNA序列轉(zhuǎn)換為時(shí)間序列,然后運(yùn)用樣本熵算法計(jì)算出時(shí)間序列的樣本熵值,將樣本熵的互值大小作為分析序列之間相似性的依據(jù),最后將樣本熵方法與DTW(Dynamic Time Warping,動(dòng)態(tài)時(shí)間彎曲)方法的實(shí)驗(yàn)結(jié)果進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明,樣本熵分析方法能有效分析序列之間的相似性,與DTW分析方法相比較,顯示出更強(qiáng)的相似性和區(qū)別度,可將其進(jìn)一步應(yīng)用于生物序列的分析。

        關(guān) 鍵 詞:樣本熵;DNA序列;序列相似性;DTW距離

        中圖分類號(hào): TP391文獻(xiàn)標(biāo)識(shí)碼: A文章編號(hào):2095-2163(2016)01-

        Abstract:This paper studies the application of sample entropy for similarity analysis of DNA sequences. The gene sequences of five kinds of Buthus martensi Karsch neurotoxins are analyzed. The graphical representation of DNA sequences are converted into digital sequences, and their sample entropy are calculated based on sample entropy method. The mutual value between different sample entropy is used to analysis sequence similarity. Analysis result is compared with the method of DTW distance. The analysis result of the proposed method provides good analysis efficiency and higher sensitivity and distinction than the results of DTW distance method. The method of sample entropy can be used for further biological sequences analysis.

        Key words: DNA sequence; similarity analysis; sample entropy; DTW distance

        0 引 言

        隨著生物序列測(cè)序技術(shù)的不斷進(jìn)步,人們已經(jīng)獲得了海量的生物序列信息,對(duì)于如何提取挖掘生物序列中的有用內(nèi)容,解讀DNA序列中的遺傳信息和功能信息,DNA序列的相似性分析即已成為研究關(guān)注熱點(diǎn)和實(shí)施應(yīng)用亮點(diǎn)。DNA序列的相似性是指兩條DNA序列的相似程度,相似程度越高表明兩物種“同源”的可能性越大,反之,兩物種的結(jié)構(gòu)和功能差別越大。每當(dāng)?shù)玫揭粋€(gè)新物種的DNA序列,人們總是想通過(guò)比較該物種與其他已知序列的相似性,由此來(lái)分析其基因的功能,如果兩個(gè)基因序列相似程度越高,新物種的結(jié)構(gòu)和功能就與已知物種越相似,對(duì)于預(yù)測(cè)新物種基因信息就越有利,如此將會(huì)大大降低基因檢測(cè)與測(cè)序的工程量,這在龐大的基因序列面前即顯得尤為重要。

        目前國(guó)內(nèi)外有關(guān)分析DNA相似性的方法已有很多[ - ],但其研究的基本思想都是:將DNA序列轉(zhuǎn)化為圖形表示,利用圖形構(gòu)造矩陣,再利用矩陣的不變量進(jìn)行DNA相似性分析,這種方法存在一定缺陷,有的計(jì)算過(guò)程比較復(fù)雜,有的容易丟失結(jié)構(gòu)信息?;诖耍罄m(xù)研究則旨在尋找一種方法簡(jiǎn)單、具有較高準(zhǔn)確性以及更能從相關(guān)性角度反映序列的生物特性的相似性度量方法。

        文獻(xiàn)[9]利用近似熵方法研究了DNA序列的相似性,該方法被證明是一種量化時(shí)間序列復(fù)雜度的方法,并在現(xiàn)實(shí)項(xiàng)目中成功應(yīng)用于生物序列的相似性分析[ ]。但是,近似熵的值與數(shù)據(jù)長(zhǎng)度有關(guān),而且為防止出現(xiàn)ln(0),計(jì)算過(guò)程中特別比較了自身數(shù)據(jù)段,然而比較數(shù)據(jù)和其自身卻毫無(wú)關(guān)聯(lián)意義,而且還會(huì)產(chǎn)生誤差。為了顯著提高相似性分析方法的準(zhǔn)確度和效率,本文引入了樣本熵算法,相比于近似熵算法,樣本熵在準(zhǔn)確性、效率、以及理論建樹上更占獨(dú)有優(yōu)勢(shì),研究最后則通過(guò)與DTW方法[ ]的實(shí)驗(yàn)結(jié)果進(jìn)行比較后可知,樣本熵方法的分析結(jié)果顯示出更強(qiáng)的相似性,因而可將其進(jìn)一步應(yīng)用在生物序列的研究中。

        1 分析方法

        Richman等提出了一種有關(guān)時(shí)間序列復(fù)雜度的分析方法——樣本熵[ ],通過(guò)對(duì)近似熵算法實(shí)施一定改進(jìn),有效地消除了實(shí)驗(yàn)中的誤差。樣本熵計(jì)算的是和的對(duì)數(shù),計(jì)算過(guò)程中不包含自身數(shù)據(jù)段的比較,同時(shí)避免了近似熵算法過(guò)程中的ln(0)值的出現(xiàn),在計(jì)算效率上占據(jù)明顯優(yōu)勢(shì),而且又減少了實(shí)驗(yàn)中的誤差,其他算法過(guò)程兩者基本相似[ ]。樣本熵的物理意義與近似熵一致,樣本熵值越大,序列的復(fù)雜程度越高,產(chǎn)生出新模式的概率就越大;樣本熵值越小,序列的復(fù)雜程度越低,序列的自我相似性越高。樣本熵的具體算法實(shí)現(xiàn)過(guò)程如下:

        4 實(shí)驗(yàn)結(jié)果

        4.1 DNA序列動(dòng)態(tài)分析

        基因序列可以轉(zhuǎn)換為時(shí)間序列,因此分析DNA相似性等同于時(shí)間序列相似性的比較,按照上述時(shí)間序列轉(zhuǎn)換方法,對(duì)各個(gè)時(shí)間序列采用20點(diǎn)的時(shí)間窗口分別計(jì)算其樣本熵,并將計(jì)算結(jié)果與序列BMTX1結(jié)果展開比對(duì),實(shí)驗(yàn)結(jié)果如圖1所示,由此即可分析DNA序列的動(dòng)態(tài)信息和相似性[9]。

        從圖1中可以看出,BMTX1和BMTX4的曲線覆蓋度較高,表明這兩者之間DNA相似度較高。其他圖像則表現(xiàn)出較少的覆蓋度,由此可知其與BMTX1相似度較低。從生物進(jìn)化關(guān)系看出,分析結(jié)果與實(shí)際相符,表明樣本熵可用于分析DNA相似性。

        4.2 樣本熵實(shí)驗(yàn)結(jié)果

        利用上述時(shí)間序列轉(zhuǎn)換方法,將5種東亞鉗蝎神經(jīng)毒素基因序列轉(zhuǎn)換成時(shí)間序列,然后利用樣本熵算法分別求出五種時(shí)間序列的樣本熵,所得樣本熵則如表2所示。

        觀察表4數(shù)據(jù),BMTX1和BMTX4所對(duì)應(yīng)的DTW距離較小,親緣關(guān)系非常接近,所得實(shí)驗(yàn)結(jié)果與樣本熵方法基本一致。比較兩種方法的實(shí)驗(yàn)結(jié)果,樣本熵方法得到的相對(duì)數(shù)值差異較大,例如,表3實(shí)比表4中的BMTX1與BMTX4、BMCT的相對(duì)數(shù)據(jù)差異明顯較大,顯示出較高的敏感性和區(qū)別度。

        5 結(jié)束語(yǔ)

        本文提出一種基于樣本熵算法的DNA相似性分析方法,并通過(guò)實(shí)例驗(yàn)證了此方法的有效性和準(zhǔn)確性,與DTW距離方法比較,樣本熵方法的分析結(jié)果顯示出更強(qiáng)的相似性和準(zhǔn)確性。這有助于提高親緣關(guān)系較近的分析對(duì)象間的區(qū)別度,可將其進(jìn)一步應(yīng)用在生物序列的分析中,對(duì)更多物種的基因序列進(jìn)行分析,發(fā)現(xiàn)更多未知的物種之間的關(guān)系,提高此方法的說(shuō)服力和應(yīng)用價(jià)值。

        猜你喜歡
        物種實(shí)驗(yàn)分析
        吃光入侵物種真的是解決之道嗎?
        記一次有趣的實(shí)驗(yàn)
        隱蔽失效適航要求符合性驗(yàn)證分析
        做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
        回首2018,這些新物種值得關(guān)注
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        電咖再造新物種
        汽車觀察(2018年10期)2018-11-06 07:05:26
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
        實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
        太空探索(2016年5期)2016-07-12 15:17:55
        野外三级国产在线观看| 18禁成人黄网站免费观看| 亚洲精品一区二区| 无国产精品白浆免费视| 性色av手机在线观看| 91精品啪在线观九色| 免费黄色影片| 污污污污污污WWW网站免费| AV无码系列一区二区三区| 日本一级片一区二区三区| 成人无码av一区二区| 中文字幕美人妻亅u乚一596| 国产精品不卡无码AV在线播放| 乳乱中文字幕熟女熟妇| 成人网站在线进入爽爽爽| 丰满人妻熟妇乱又伦精品视| 国产人妖xxxx做受视频| 伊人久久大香线蕉av不变影院| 在线播放免费人成毛片乱码| 国产精品香蕉在线观看| 97人妻无码免费专区| 国产精品亚洲一区二区麻豆| 毛片无码国产| 亚洲午夜精品a区| 日韩av一区二区三区在线观看| 在线观看一级黄片天堂| 亚洲色欲色欲www| 99久久综合九九亚洲| 日本午夜a级理论片在线播放| 天天躁日日躁aaaaxxxx| 天堂网在线最新版www中文网| 日韩肥熟妇无码一区二区三区| 亚洲成年国产一区二区| 男人进去女人爽免费视频| 午夜短视频日韩免费| 在线观看免费的黄片小视频| 一个人看的www片免费高清视频 | 色欧美与xxxxx| 国产天堂av在线播放资源| 中文字幕乱码一区av久久不卡| 999国产精品视频|