亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種改進(jìn)的多聚腺苷酸化位點(diǎn)提取方法

        2018-11-01 03:04:18張洋子
        電腦知識與技術(shù) 2018年19期
        關(guān)鍵詞:基因組預(yù)處理位點(diǎn)

        張洋子

        摘要:多聚腺苷酸化是真核生物基因表達(dá)的重要步驟。多聚腺苷酸化位點(diǎn)(Poly(A)位點(diǎn))標(biāo)識基因末端,準(zhǔn)確識別poly(A)位點(diǎn)有利于確定成熟的mRNA。如果一個(gè)基因含有多個(gè)poly(A)位點(diǎn),通過不同poly(A)位點(diǎn)的選擇可以產(chǎn)生不同性質(zhì)的mRNA(Alternative Polyadenylation, APA)。全基因組3末端測序技術(shù)產(chǎn)生了大量包含poly(A)位點(diǎn)信息的序列,如何從這些序列中快速有效地獲取poly(A)位點(diǎn)成為生物學(xué)家關(guān)注的焦點(diǎn)。本文針對3末端測序數(shù)據(jù),通過Perl腳本和生物信息軟件的綜合利用,設(shè)計(jì)了poly(A)位點(diǎn)的全基因組提取流程,可有效提取poly(A)位點(diǎn)并對其進(jìn)行注釋,該方法優(yōu)勢是適用于多種物種,適用性廣,且運(yùn)行高效。

        關(guān)鍵詞:Poly(A)位點(diǎn);3末端測序技術(shù);提取流程

        中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)19-0287-01

        1 研究背景和現(xiàn)狀

        多聚腺苷酸化(Polyadenylation)是把一段多聚A尾巴加到mRNA上的機(jī)制,多聚腺苷酸化位點(diǎn)(Poly(A)位點(diǎn))標(biāo)識基因末端,mRNA分子于它們的5末端進(jìn)行加帽,3端中斷,加上一段多聚A尾巴,加尾過程由多聚腺苷酸聚合酶催化進(jìn)行,進(jìn)而形成成熟的mRNA。如果一個(gè)基因含有多個(gè)poly(A)位點(diǎn),通過不同poly(A)位點(diǎn)的選擇可以產(chǎn)生不同性質(zhì)的mRNA(Alternative Polyadenylation, APA)。APA通過改變mRNA的3UTR的長度及其性質(zhì)進(jìn)而改變位于3末端的許多潛在順式調(diào)控模式,從而達(dá)到調(diào)控基因表達(dá)的目的。

        雖然當(dāng)前已獲得許多物種的poly(A)位點(diǎn)信息,但還有多種物種的poly(A)位點(diǎn)信息尚未提取,一方面Poly(A)位點(diǎn)提取的準(zhǔn)確性受測序方法和測序深度影響,另一方面poly(A)位點(diǎn)提取過程沒有流程化處理,較為煩瑣。隨著3末端測序方法的不斷探索和改進(jìn),涌現(xiàn)出很多3末端測序方法,比如WTTS-Seq1, 3READS2,3, A-seq4, PAS-seq5。這些實(shí)驗(yàn)方法把焦點(diǎn)集中在3UTR區(qū)域,增加了獲得更多位點(diǎn)的可能性。為了幫助生物學(xué)家從海量數(shù)據(jù)中提取出有效的poly(A)位點(diǎn),本文研究了poly(A)位點(diǎn)提取方法并整合了流程,使運(yùn)行流暢高效。

        2 提取方法

        Poly(A)位點(diǎn)的提取方法分為測序數(shù)據(jù)預(yù)處理、序列比對至基因組、位點(diǎn)的識別和聚類以及poly(A)位點(diǎn)的注釋4個(gè)步驟,方法流程見圖1。

        1) 測序數(shù)據(jù)預(yù)處理:包括質(zhì)量控制以及去除polyA/T尾巴(測序方向決定A/T);測序后獲得原始序列,序列3端含有連續(xù)的A/T,數(shù)據(jù)格式為FASTQ。質(zhì)量控制的目的是過濾低質(zhì)量的序列,采用FASTX-Toolkit(http://hannonlab.cshl.edu/fastx_toolkit)進(jìn)行質(zhì)量控制,再去除3端接頭含有的A/T尾巴,去A/T尾過程允許一定的錯(cuò)配。

        2) 序列比對至基因組。將預(yù)處理后保留的序列比對至基因組,用TMAP((https://github.com/iontorrent/TMAP)將序列比對至參考基因組,參考基因組可從NCBI下載,保留高質(zhì)量比對結(jié)果用于進(jìn)一步分析。

        3) 位點(diǎn)的識別和聚類。識別poly(A)位點(diǎn),根據(jù)比對后的位置以及方向信息,確定poly(A)位點(diǎn)的位置。由于poly(A)位點(diǎn)的微觀不一致性6–8,許多poly(A)位點(diǎn)之間是位置相近,已有研究表明相聚在20nt以上的poly(A)位點(diǎn)可以由不同的poly(A)信號控制,把24bp以內(nèi)的poly(A)位點(diǎn)聚類到一起,認(rèn)為是1個(gè)poly(A)位點(diǎn)。

        4) Poly(A)位點(diǎn)的注釋。由于一個(gè)基因可能存在多種轉(zhuǎn)錄本或者基因有重疊,在poly(A)位點(diǎn)的注釋過程中,poly(A)位點(diǎn)可能屬于多個(gè)區(qū)域,本文采用固定位置優(yōu)先級解決這個(gè)問題。

        為了檢測方法的有效性,本文從NCBI下載了8組用WTTS-Seq產(chǎn)生的小鼠的共計(jì)43,846,314條3末端測序序列,通過本文設(shè)計(jì)的poly(A)位點(diǎn)提取方法,識別出56,483個(gè)poly(A)位點(diǎn)(每個(gè)位點(diǎn)至少有16條序列支持),其中49,783個(gè)poly(A)位點(diǎn)注釋到基因內(nèi),其他poly(A)位點(diǎn)注釋到基因間區(qū)域。約66%(8,122/12,286)個(gè)編碼蛋白質(zhì)(Protein coding)基因內(nèi)多于1個(gè)poly(A)位點(diǎn),27% (442/1,665)個(gè)長鏈非編碼RNA(Long non-coding RNA, lncRNA)基因內(nèi)多于1個(gè)poly(A)位點(diǎn)。

        為了進(jìn)一步檢測該方法提取出的poly(A)位點(diǎn)的可靠性,本文提取了poly(A)位點(diǎn)前100nt的堿基,分析其信號模式,根據(jù)已有的28個(gè)poly(A)信號,用滑動窗口掃描前100nt的序列,結(jié)果如圖2表示,AATAAA是最保守的信號,與現(xiàn)有研究一致。

        3 結(jié)束語

        本文為幫助生物學(xué)家快速提取有效的poly(A)位點(diǎn),針對當(dāng)前3末端測序技術(shù)得到的海量數(shù)據(jù),設(shè)計(jì)了poly(A)位點(diǎn)的提取方法,流程簡單,運(yùn)行效率高,適用性廣。為檢測方法的有效性,用3末端測序得到的小鼠序列進(jìn)行檢測,結(jié)果表明該方法可以提取出位于不同基因類型的poly(A)位點(diǎn),poly(A)信號模式與當(dāng)前研究相一致。

        參考文獻(xiàn):

        [1] Zhou, X. et al. Accurate profiling of gene expression and alternative polyadenylation with whole transcriptome termini site sequencing (WTTS-Seq). Genetics,2016(203):683–697.

        [2] Hoque, M. et al. Analysis of alternative cleavage and polyadenylation by 3 [prime] region extraction and deep sequencing. Nat. Methods,2013(10):133–139.

        [3] Li, W. et al. Systematic profiling of poly (A)+ transcripts modulated by core 3end processing and splicing factors reveals regulatory rules of alternative cleavage and polyadenylation. PLoS Genet,2015(11): e1005166.

        [4] Gruber, A. R., Martin, G., Keller, W. & Zavolan, M. Cleavage factor Im is a key regulator of 3′ UTR length. RNA Biol,2012(9):1405–1412.

        [5] Shepard, P. J. et al. Complex and dynamic landscape of RNA polyadenylation revealed by PAS-Seq. Rna ,2011(17):761–772.

        [6] Shen, Y. et al. Genome level analysis of rice mRNA 3???-end processing signals and alternative polyadenylation. Nucleic Acids Res,2008(36):3150–3161.

        [7] Tian, B., Hu, J., Zhang, H. & Lutz, C. S. A large-scale analysis of mRNA polyadenylation of human and mouse genes. Nucleic Acids Res,2005(33):201–212.

        猜你喜歡
        基因組預(yù)處理位點(diǎn)
        鎳基單晶高溫合金多組元置換的第一性原理研究
        上海金屬(2021年6期)2021-12-02 10:47:20
        牛參考基因組中發(fā)現(xiàn)被忽視基因
        CLOCK基因rs4580704多態(tài)性位點(diǎn)與2型糖尿病和睡眠質(zhì)量的相關(guān)性
        二項(xiàng)式通項(xiàng)公式在遺傳學(xué)計(jì)算中的運(yùn)用*
        基于預(yù)處理MUSIC算法的分布式陣列DOA估計(jì)
        淺談PLC在預(yù)處理生產(chǎn)線自動化改造中的應(yīng)用
        絡(luò)合萃取法預(yù)處理H酸廢水
        基于自適應(yīng)預(yù)處理的改進(jìn)CPF-GMRES算法
        基因組DNA甲基化及組蛋白甲基化
        遺傳(2014年3期)2014-02-28 20:58:49
        有趣的植物基因組
        亚洲不卡av二区三区四区| 欧美成人中文字幕| 四虎国产精品免费久久麻豆| 人妻色中文字幕免费视频| 熟女人妻一区二区三区| 老鸭窝视频在线观看| 国产精品一区二区在线观看| 欧美黑人乱大交| 熟女系列丰满熟妇av| 国产中文字幕亚洲国产| 最近免费中文字幕中文高清6 | 亚洲一区二区自偷自拍另类| 亚洲天堂av三区四区不卡| 少妇仑乱a毛片| 荡女精品导航| 麻美由真中文字幕人妻| 日本一区二区不卡在线| 国产精品无码人妻在线| 日产国产精品亚洲系列| av资源在线看免费观看| 中文字幕无码家庭乱欲| 中文字幕无码高清一区二区三区 | 蜜桃网站入口可看18禁| 日本a级片免费网站观看| 日本老熟妇乱| 亚洲精品中国国产嫩草影院美女| 亚洲日本在线中文字幕| 91成人黄色蘑菇视频| 亚洲色中文字幕无码av| 国产精品久久久久久妇女6080| 国产杨幂AV在线播放| av在线天堂国产一区| 久久久中日ab精品综合| 真人二十三式性视频(动)| 国产精品久久一区性色a| 亚洲熟女少妇一区二区三区青久久| 色一情一乱一伦一视频免费看| 自愉自愉产区二十四区| 少妇高潮喷水正在播放 | 日本免费三级一区二区| 久久亚洲中文字幕精品一区|