亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        非編碼RNA生物學(xué)預(yù)測(cè)軟件的開發(fā)與應(yīng)用研究進(jìn)展

        2021-12-03 16:18:59劉洪飛廖明幟藍(lán)賢勇
        家畜生態(tài)學(xué)報(bào) 2021年10期
        關(guān)鍵詞:復(fù)合物編碼分子

        劉洪飛,廖明幟,藍(lán)賢勇*

        (1. 西北農(nóng)林科技大學(xué) 動(dòng)物科技學(xué)院,陜西 楊凌 712100;2. 西北農(nóng)林科技大學(xué) 生命科學(xué)學(xué)院,陜西 楊凌 712100)

        自從核糖體RNA(ribonucleotide RNA,rRNA)、轉(zhuǎn)運(yùn)RNA(transfer RNA,tRNA)以及豐富多樣的非編碼RNA被發(fā)現(xiàn)以來,人們?cè)絹碓揭庾R(shí)到非編碼RNA(non-coding RNA,ncRNA)在生命活動(dòng)中的作用。現(xiàn)如今,科學(xué)家發(fā)現(xiàn)的非編碼RNA已有十幾種之多,包括持家非編碼RNA(轉(zhuǎn)運(yùn)RNA、核糖體RNA、核小RNA(small nuclear RNA,snRNA)和核仁小RNA(small nucleolar RNA,snoRNA)等,以及具有調(diào)控功能的非編碼RNA(微RNA(microRNA,miRNA)、長鏈非編碼RNA(long non-coding RNA,lncRNA)、環(huán)狀RNA(circular RNA,circRNA)、小分子干擾RNA(small interfering RNA,siRNA)和Piwi互作RNA(Piwi-interacting RNA,piRNA)等)[1-2],尤其是具有調(diào)控功能的ncRNA在許多疾病以及癌癥中起著重要作用,因而研究其生物形成過程以及功能調(diào)控機(jī)制等方面具有重要意義。

        高通量技術(shù)的發(fā)展促進(jìn)了對(duì)轉(zhuǎn)錄組的認(rèn)識(shí),尤其是針對(duì)不同類型ncRNA而設(shè)計(jì)的RNA-seq通過結(jié)合后續(xù)相應(yīng)的鑒定軟件可以對(duì)其ncRNA進(jìn)行鑒定、差異表達(dá)分析以及常見的功能富集分析。RNA-seq不僅可以對(duì)ncRNA進(jìn)行鑒定,而且能夠挖掘其中的關(guān)鍵突變位點(diǎn)[3]。針對(duì)從RNA-seq后續(xù)分析的結(jié)果中鑒定ncRNA甚至是預(yù)測(cè)新的ncRNA分子,現(xiàn)已經(jīng)有許多ncRNA的鑒定軟件。鑒于對(duì)功能調(diào)節(jié)性ncRNA研究較多,因而本文主要針對(duì)miRNA、lncRNA、circRNA以及piRNA的生物學(xué)預(yù)測(cè)軟件進(jìn)行綜述。

        1 非編碼RNA的生物合成

        1.1 微RNA(microRNA,miRNA)

        miRNA是一類不具有編碼潛力、長度為21~23 nt、可以與靶mRNA分子的3'-UTR結(jié)合的小分子ncRNA。miRNA的合成過程包括2個(gè)階段,分別為細(xì)胞核中的轉(zhuǎn)錄階段以及細(xì)胞質(zhì)中的轉(zhuǎn)錄后加工階段(圖1A)。最終,成熟的miRNA雙鏈可以被由Ago2和Dicer等構(gòu)成的RNA誘導(dǎo)的沉默復(fù)合物(RNA-induced silencing complex, RISC)所識(shí)別,進(jìn)而在RISC中的解旋酶的作用下形成僅有21~23 nt的miRNA單鏈分子[4]。

        目前的研究發(fā)現(xiàn)存在一類非經(jīng)典miRNA,它們是由snoRNA、tRNA等基因轉(zhuǎn)錄加工形成[5],這些非經(jīng)典的miRNA在轉(zhuǎn)錄加工后,通過不同于經(jīng)典miRNA的轉(zhuǎn)運(yùn)機(jī)制出核。在細(xì)胞質(zhì)中,對(duì)于snoRNA來源的miRNA來說,與經(jīng)典的miRNA一樣加載在RISC復(fù)合物中發(fā)揮作用;而tRNA來源的miRNA則需要進(jìn)一步被切割成不同片段,進(jìn)而構(gòu)成RISC復(fù)合物。

        1.2 長鏈非編碼RNA(long non-coding RNA,lncRNA)

        在非編碼RNA中,有一類長度超過200 nt的RNA分子,被稱為長鏈非編碼RNA。非編碼RNA的來源包括基因間轉(zhuǎn)錄本、增強(qiáng)子RNA、正義/反義轉(zhuǎn)錄本等。Kopp等[6]研究發(fā)現(xiàn)一些lncRNA與mRNA非常相似,同樣具有5'帽子結(jié)構(gòu)和polyA尾巴,區(qū)別是不具有開放讀碼框(open reading frame,ORF)。在lncRNA的形成過程中,lncRNA的轉(zhuǎn)錄由RNA聚合酶Ⅱ/Ⅲ所引導(dǎo),并且大多數(shù)lncRNA和mRNA一樣具有polyA尾巴(圖1B)。然而,某些lncRNA有著不同的加工修飾途徑,其加工過程與tRNA形成過程較為相似,其初始轉(zhuǎn)錄本的3'端同樣會(huì)經(jīng)過RNase P的切割,形成一段類似于tRNA的mascRNA (MALAT1-associated small cytoplasmic RNA)[7](圖1B)。

        1.3 環(huán)狀RNA(circular RNA,circRNA)

        circRNA是一類共價(jià)閉合的、經(jīng)過反向剪接機(jī)制形成的環(huán)狀非編碼RNA分子。

        在真核生物中,circRNA的形成存在3類機(jī)制[8](圖1C):一類是通過依賴于剪接體的套索環(huán)化,如外顯子型circRNA(exonic circular RNA,EcircRNA)以及內(nèi)含子型circRNA(circular intronic RNA,CiRNA);第二類是順式作用元件促進(jìn)circRNA的形成,例如某些富含ALU序列的hnRNA可通過環(huán)化位點(diǎn)與線性剪接位點(diǎn)的競(jìng)爭(zhēng)作用而形成不包含內(nèi)含子的circRNA或者包含有內(nèi)含子的外顯子-內(nèi)含子型circRNA(Exon-intron circRNA,EIcircRNA);第三類則是RNA結(jié)合蛋白(RNA binding protein, RBP)調(diào)控circRNA的形成,RBP可以通過結(jié)合到外顯子側(cè)翼的內(nèi)含子上,促進(jìn)或者抑制外顯子的并排,繼而影響circRNA的形成。近年的研究表明,在古細(xì)菌和動(dòng)物體內(nèi)還存在一類由tRNA經(jīng)可變剪接所產(chǎn)生的tRNA內(nèi)含子型circRNA(tRNA intronic circRNA,tricRNA),它的形成需要凸出螺旋凸出(bulge-helix-bugle, BHB)基序和許多反式作用因子,包括RtcB連接酶和tRNA剪接內(nèi)切酶(tRNA splicing endonuclease, TSEN)復(fù)合物[9]。

        1.4 Piwi互作RNA(Piwi-interacting RNA,piRNA)

        piRNA為一類源于dsRNA、通過不依賴于Dicer酶機(jī)制而形成、長度為23~32 nt,與PIWI類的AGO蛋白互作的單鏈非編碼RNA[10]。

        piRNA的生物合成過程可以分為2個(gè)階段(圖1D):細(xì)胞核中前體piRNA的轉(zhuǎn)錄與轉(zhuǎn)運(yùn)階段和細(xì)胞質(zhì)中的前體piRNA加工與裝載PIWI蛋白階段[11]。piRNA大多是來源于有多個(gè)拷貝的轉(zhuǎn)座元件,少部分則是由200 kb的piRNA基因簇所產(chǎn)生的[11]。此外,一些單個(gè)轉(zhuǎn)座子和蛋白編碼基因的3'UTR區(qū)域也可以產(chǎn)生piRNAs[12]。

        piRNA基因簇來源的piRNA由RNA聚合酶II轉(zhuǎn)錄起始,該區(qū)域富含H3K9me3水平, 可與RDC復(fù)合物(Rhino (Rhi)、Deadlock (Del)和Cutoff蛋白)結(jié)合,進(jìn)而促進(jìn)piRNA的表達(dá)。轉(zhuǎn)錄形成的piRNA前體通過核孔轉(zhuǎn)運(yùn)出核后,會(huì)被加工修飾為成熟的piRNA分子。在這一過程中,piRNA會(huì)經(jīng)過5'修剪和3'修剪,其中5'修剪是由核酸酶Zuc酶來完成。此外,在卵丘細(xì)胞中,還存在一種沉默子依賴的修剪機(jī)制,這種機(jī)制又被稱為“乒乓”機(jī)制[12]。

        2 非編碼RNA的特征與生物學(xué)功能

        2.1 miRNA

        大多數(shù)動(dòng)物的miRNAs均可通過與靶mRNA分子的3'UTR區(qū)域結(jié)合以抑制其穩(wěn)定性或翻譯能力,進(jìn)而阻止其翻譯[13]。miRNAs與mRNA的3'UTR結(jié)合的部分被稱為種子序列。當(dāng)RISC復(fù)合物能夠與mRNA的結(jié)合位點(diǎn)嚴(yán)格互補(bǔ)配對(duì)時(shí),可以發(fā)揮其內(nèi)切酶的活性,對(duì)其特定位點(diǎn)進(jìn)行切割,進(jìn)而促使其被降解。

        盡管對(duì)miRNA的大部分研究表明miRNA位于細(xì)胞質(zhì)中,然而仍有一部分位于細(xì)胞核中,可通過形成RISC復(fù)合物或者與特定RBP結(jié)合作用于初級(jí)轉(zhuǎn)錄產(chǎn)物的3'UTR以及CDS序列或內(nèi)含子區(qū)域[14],進(jìn)而發(fā)揮基因沉默的作用。

        2.2 lncRNA

        lncRNA最重要的生物學(xué)功能之一就是可以與特定蛋白相結(jié)合,進(jìn)而發(fā)揮相應(yīng)的作用。有些支架蛋白或RBP在與作為骨架的lncRNA結(jié)合后,促使大分子復(fù)合物的形成和激活,能夠進(jìn)一步激活下游通路或直接發(fā)揮作用[15]。一部分lncRNA可通過與蛋白結(jié)合順式地作用于某些基因的轉(zhuǎn)錄起始位點(diǎn),進(jìn)而調(diào)節(jié)基因轉(zhuǎn)錄。lncRNA也可以直接與DNA序列結(jié)合,從而形成RNA-DNA三股螺旋復(fù)合物,使得染色質(zhì)構(gòu)象處于開放狀態(tài),促進(jìn)基因的轉(zhuǎn)錄[16]。其他lncRNA則具有輔助抑制因子的功能,可與特定轉(zhuǎn)錄因子結(jié)合,阻礙其與DNA的結(jié)合,而抑制RNA聚合酶的活性。此外,lncRNA在染色質(zhì)結(jié)構(gòu)重建和三維結(jié)構(gòu)中也起著重要作用,可通過與染色質(zhì)修飾復(fù)合物或增強(qiáng)子元件結(jié)合,促進(jìn)激活子活性[17]。此外,反義lncRNA與相重疊的蛋白編碼基因可以相互抑制其基因的表達(dá)[18]。近年來,有研究表明lncRNA也是一種重要的內(nèi)源性競(jìng)爭(zhēng)抑制ncRNA,可作為miRNA的抑制因子,調(diào)節(jié)其miRNA對(duì)靶基因的負(fù)向調(diào)控作用[19]。到目前為止,已經(jīng)有大量的lncRNA-miRNA-mRNA作用通路被揭示并研究了其在各種疾病或者發(fā)育進(jìn)程中的作用。盡管大多數(shù)lncRNA不具有編碼能力,仍然有研究或預(yù)測(cè)分析發(fā)現(xiàn)有少部分lncRNA具有編碼能力,可以翻譯形成小分子量的蛋白質(zhì)[20]。

        2.3 circRNA

        circRNA可在轉(zhuǎn)錄水平、轉(zhuǎn)錄后調(diào)控以及mRNA分子的翻譯調(diào)節(jié)甚至是直接作用于某些蛋白而發(fā)揮功能。在轉(zhuǎn)錄水平上,circRNA直接與U1 snRNP和RNA聚合酶Ⅱ共同結(jié)合到靶基因的啟動(dòng)子區(qū)域從而激活下游基因的轉(zhuǎn)錄或調(diào)節(jié)mRNA分子的剪接。circRNA研究最為廣泛的分子機(jī)制就是可以作為miRNA的分子海綿發(fā)揮其競(jìng)爭(zhēng)性抑制的作用,進(jìn)而上調(diào)miRNA的靶基因的表達(dá)。CLIP'seq也證明許多RBP會(huì)與circRNA結(jié)合,起到一種蛋白結(jié)合骨架的作用來調(diào)節(jié)mRNA分子的穩(wěn)定性[21],促進(jìn)靶mRNA的翻譯能力。

        由于大多數(shù)的circRNA不具有5'帽子和polyA結(jié)構(gòu),因而被普遍認(rèn)為其不具有編碼能力。然而有研究表明,少部分circRNA含有內(nèi)在核糖體進(jìn)入序列(internal ribosome entry site,IRES)[22],因而具有一定的編碼能力,能夠翻譯出一些小分子多肽。因此,有人進(jìn)一步對(duì)一些人工合成的含有ORF的circRNA在體外無細(xì)胞翻譯系統(tǒng)進(jìn)行研究,發(fā)現(xiàn)其確實(shí)可以翻譯出多肽[23]。

        2.4 piRNA

        piRNA與PIWI等蛋白構(gòu)成的RISC復(fù)合物在轉(zhuǎn)錄以及轉(zhuǎn)錄后調(diào)節(jié)過程中起著重要的調(diào)節(jié)作用。其調(diào)節(jié)機(jī)制包括3種,一種為piRNA/PIWI復(fù)合物介導(dǎo)的轉(zhuǎn)錄基因沉默機(jī)制,第二種為轉(zhuǎn)錄后基因沉默機(jī)制,第三種為與相關(guān)蛋白互作的調(diào)節(jié)機(jī)制。

        piRNA所形成的沉默復(fù)合物進(jìn)入到細(xì)胞核中后,可以與靶基因的新生轉(zhuǎn)錄物互補(bǔ)配對(duì),進(jìn)而招募沉默因子[24],最終促進(jìn)其異染色質(zhì)的形成。另外,有些piRNA復(fù)合物還會(huì)誘導(dǎo)啟動(dòng)子區(qū)域的CpG島的甲基化,降低目標(biāo)基因的轉(zhuǎn)錄活性[25]。

        piRNA普遍通過piRNA-RNA互作來發(fā)揮轉(zhuǎn)錄后沉默作用,其結(jié)合的RNA分子有mRNA、假基因的轉(zhuǎn)錄本以及l(fā)ncRNA。此外,有些沉默復(fù)合物可以通過miRNA類似的機(jī)制抑制mRNA的翻譯能力;那些能夠與lncRNA結(jié)合的piRNA沉默復(fù)合物則可間接地通過lncRNA介導(dǎo)的競(jìng)爭(zhēng)抑制作用促進(jìn)其miRNA的靶向抑制作用。對(duì)于含有PIWI結(jié)構(gòu)域和RNase H內(nèi)切酶活性的piRNA復(fù)合物來說,它們能夠選擇性地對(duì)轉(zhuǎn)座子基因的RNA進(jìn)行切割,從而抑制其功能[26]。此外,piRNA沉默復(fù)合物還會(huì)調(diào)節(jié)某些特定的蛋白的活性來發(fā)揮基因沉默的作用[27]。

        3 相關(guān)生物學(xué)預(yù)測(cè)軟件的研究現(xiàn)狀

        3.1 miRNA

        miRNA預(yù)測(cè)軟件的鑒定方法主要包括4種類型[28]:基于同源性的方法、基于靶點(diǎn)的預(yù)測(cè)方法、基于評(píng)分的方法和機(jī)器學(xué)習(xí)(表1)。

        基于同源性的方法是最早miRNA預(yù)測(cè)方法之一,該方法的一般策略是利用序列比對(duì)結(jié)合對(duì)二級(jí)結(jié)構(gòu)(如莖環(huán)結(jié)構(gòu))的預(yù)測(cè)來鑒定[28]。該方法只能針對(duì)已知的miRNA及其相似的分子進(jìn)行預(yù)測(cè),難以預(yù)測(cè)新的miRNA。由于miRNA前體序列較長,且其中的loop區(qū)域保守性不如互補(bǔ)配對(duì)區(qū)域,因而針對(duì)整個(gè)miRNA前體序列的同源預(yù)測(cè)的相似度會(huì)較低。

        基于靶點(diǎn)的方法可以通過種子序列的保守性,對(duì)初步預(yù)測(cè)得到的miRNA做進(jìn)一步的篩選[29]。基于該方法的軟件通常同樣需要利用已知miRNA的靶基因的序列信息來預(yù)測(cè)miRNA,同時(shí)結(jié)合一些輔助數(shù)據(jù)庫進(jìn)一步提高其預(yù)測(cè)的準(zhǔn)確度。此外,該方法若與k-mer序列搜索相結(jié)合,則能獲得更多miRNA候選分子[30]。

        基因組評(píng)分方法則是利用了現(xiàn)有的比較基因組的方法,通過對(duì)相似物種的保守miRNA進(jìn)行預(yù)測(cè),能夠發(fā)現(xiàn)在某一物種內(nèi)同源性不高的新的miRNA分子。該方法是對(duì)多個(gè)物種的保守miRNA進(jìn)行比較以得到它們之間保守的結(jié)構(gòu)和序列特征來進(jìn)行預(yù)測(cè)[31]。其他的如miRDeep、miRDeep2則很少依賴于序列的同源性或相似度,而是更多通過其miRNA的結(jié)構(gòu)特征對(duì)miRNA進(jìn)行評(píng)分預(yù)測(cè)[28]。

        機(jī)器學(xué)習(xí)相比于其他方法,最大的不同之處是其模型的訓(xùn)練不僅需要已知的miRNA(陽性集),還需要非miRNA分子(陰性集)?;跈C(jī)器學(xué)習(xí)方法的預(yù)測(cè)軟件根據(jù)不同的算法,可以分為3大類[32],包括支持向量機(jī)(Support Vector Machine,SVM)、貝葉斯和隨機(jī)森林,其中支持向量機(jī)算法是應(yīng)用最廣的一類。例如Xue等[33]開發(fā)的Triplet'SVM分類器在測(cè)試集中的準(zhǔn)確度和敏感度分別達(dá)到了93.3%和88%。Ding等[34]基于miRNA前體的多個(gè)loop區(qū)特征信息開發(fā)的MiRenSVM能夠達(dá)到96.5%和93.05%的特異性和敏感度。

        另外,近年來也有一些通過將機(jī)器學(xué)習(xí)算法與之前的同源方法進(jìn)行組合的軟件。其中,miRDetect就是一種融合了隨機(jī)森林算法與基于同源的方法用于鑒定植物新miRNA前體的軟件。該預(yù)測(cè)模型的準(zhǔn)確率達(dá)到93.35%,相比于其他軟件,在預(yù)測(cè)miRNA方面具有較好的綜合性能[35]。

        3.2 lncRNA

        lncRNA預(yù)測(cè)軟件主要有2種方法,一種是直接預(yù)測(cè)其是否含有ORF元件或同源預(yù)測(cè)的方法,另一種是基于機(jī)器學(xué)習(xí)的方法。

        在RNA-seq數(shù)據(jù)分析后的轉(zhuǎn)錄本進(jìn)行注釋分析時(shí),對(duì)其較長的轉(zhuǎn)錄本進(jìn)行編碼能力的預(yù)測(cè),就可以初步地對(duì)lncRNA進(jìn)行鑒定。對(duì)其編碼能力的預(yù)測(cè),最重要的就是鑒定其中是否存在ORF。然而,有一部分存在模糊ORF的lncRNA就難以通過這些初步篩選軟件所預(yù)測(cè)到。此外,針對(duì)已知lncRNA序列的同源性和保守性,通過利用序列比對(duì)算法(如HMMER、Profile-HMM)(表1)則可以根據(jù)其保守序列或基序(如CGIs、Alu元件和T-UCRs)預(yù)測(cè)新的lncRNA候選分子[36]。

        我在北大接觸和認(rèn)識(shí)很多有成就的人,我發(fā)現(xiàn)他們都有一個(gè)共同的特點(diǎn),那就是他們對(duì)人都很友好,很會(huì)與人相處,與環(huán)境相適,沒有什么對(duì)抗和沖突。

        此外,許多預(yù)測(cè)軟件普遍采用機(jī)器學(xué)習(xí)的算法(表1),例如CPAT[37]、PLEK[38]、CPC2[39]等。其中CPAT是采用了較為簡單的線性回歸算法,而其他軟件則是利用了支持向量機(jī)或者隨機(jī)森林的方法。另外,將lncRNA高級(jí)結(jié)構(gòu)特征信息(假節(jié)和發(fā)夾結(jié)構(gòu))考慮在內(nèi)的折疊算法[40](表1),通過利用這些已知的能夠與蛋白結(jié)合的折疊信息,已經(jīng)有數(shù)以千計(jì)的高度保守的lncRNA在小鼠中被鑒定出來。

        3.3 circRNA

        現(xiàn)有的從RNA-seq數(shù)據(jù)中鑒定circRNAs的算法主要包括2種(表1),一種為基于測(cè)序讀段(reads)比對(duì)的方法,另一種則為基于k-mers或/和德布萊英圖(de bruijn graph,DBG)的方法。

        基于reads比對(duì)的軟件均是依賴于通過鑒定跨越反向剪接位點(diǎn)但不能夠匹配到線性轉(zhuǎn)錄本的reads,繼而基于不同的構(gòu)建策略得到反向剪接接頭(back-splicing junction,BSJ)用于鑒定circRNA?,F(xiàn)有的特異性鑒定circRNAs的算法有以下幾種:circRNA_finder、find_circ[41]、CIRCexplorer[42]、CIRI[43]和 MapSplice[44]等。有研究人員對(duì)5種軟件的敏感度、準(zhǔn)確度進(jìn)行了分析,發(fā)現(xiàn)CIRI算法敏感度較高,但是其準(zhǔn)確度過低,其假陽性比率超過68%,而CIRCexplorer和MapSplice則具有較低的假陽性比率,但鑒定的circRNAs相對(duì)較少[45],且需要耗費(fèi)更長的時(shí)間。Find_circ, circRNA_finder和 CIRI由于可以從頭預(yù)測(cè)circRNAs,因而不需要相關(guān)的注釋文件,適用于缺乏注釋信息的物種。此外,CIRI2在CIRI的基礎(chǔ)上,增加了多線程方面的改進(jìn),使用了基于多種子序列的適應(yīng)性最大似然估計(jì)法去鑒定BSJ位點(diǎn),能夠有效地降低假陽性的幾率,其敏感度、特異性以及內(nèi)存使用率方面都有提升[46]。另有研究表明,CIRI、CIRCexplorer和KNIFE與其他方法相比,在精度和靈敏度之間實(shí)現(xiàn)了較好的平衡性能[47]。

        現(xiàn)有的鑒定circRNAs的算法主要都是基于reads比對(duì)的原理,因而比較耗費(fèi)時(shí)間。因此,有研究開發(fā)了基于k-mers而不是對(duì)比基因組的軟件CircMarker。CircMarker利用轉(zhuǎn)錄組注釋文件創(chuàng)建用于circRNA檢測(cè)的k-mer表[48]。之后,根據(jù)reads的全長區(qū)域所有的k-mers與k-mers表進(jìn)行比對(duì),進(jìn)而依次對(duì)circRNA進(jìn)行鑒定和對(duì)環(huán)化類型的篩選。在這之后,他們進(jìn)一步結(jié)合了k-mers和DBG算法,開發(fā)了更優(yōu)的circDBG[49]。與現(xiàn)有的方法相比,CircDBG能夠找到更可靠的低偏差circRNA,具有更高的運(yùn)算效率,在精度和靈敏度的平衡方面表現(xiàn)得更好[49]。

        另外Szabo等[50]先進(jìn)行從頭預(yù)測(cè),得到可能的BSJ位點(diǎn),之后根據(jù)匹配到BSJ位點(diǎn)處的核苷酸數(shù)、Bowtie2匹配分?jǐn)?shù)和質(zhì)量這3個(gè)特征針對(duì)某一個(gè)read進(jìn)行是否為circRNA來源進(jìn)行鑒定判斷,構(gòu)建了邏輯回歸模型。之后,通過該模型以及對(duì)P值的校正來確定其circRNA及其可信度。最終,通過多種細(xì)胞系的RNA-seq數(shù)據(jù)分析表明,該模型對(duì)circRNAs分子的鑒定在敏感度和特異性方面均有顯著提高。

        3.4 piRNA

        現(xiàn)有的對(duì)piRNA進(jìn)行預(yù)測(cè)的軟件大多數(shù)是基于機(jī)器學(xué)習(xí)算法的(表1)。其piRNA預(yù)測(cè)軟件主要通過以下幾個(gè)特征進(jìn)行鑒定:piRNA序列、基因組位置、5'或/和3'端的序列和結(jié)構(gòu)基序、基因簇位置以及與靶序列的互作信息。其中proTRAC和piClust均是針對(duì)piRNA基因簇進(jìn)行預(yù)測(cè)。proTRAC由于不準(zhǔn)確的定量而難以進(jìn)行后續(xù)的差異表達(dá)分析。而PLIFER擁有較好的平衡性能,不僅能夠精確地鑒定piRNA基因簇,而且對(duì)內(nèi)存的利用效率很高[51]。該軟件首先將已知的piRNA和比對(duì)后得到的假定piRNA作為輸入,尋找到這些piRNA的峰值區(qū)域,并從峰值區(qū)域向上游100 kb內(nèi)取不同長度的滑動(dòng)窗口,通過對(duì)其中不同區(qū)域的reads數(shù)量進(jìn)行統(tǒng)計(jì)分析,以一定的評(píng)分準(zhǔn)則對(duì)可能的piRNA基因簇進(jìn)行預(yù)測(cè)[51]。其相比于proTRAC,雖然報(bào)道的基因簇的總數(shù)要少,然而reads數(shù)量卻要高40%。piRNApredictor則是基于k-mer序列的框架,利用Fisher線性判別分析(linear discriminant analysis,LDA)的機(jī)器學(xué)習(xí)算法對(duì)piRNA進(jìn)行預(yù)測(cè),其準(zhǔn)確度為90%,而敏感度相對(duì)較低,只有60%[52]。另外,基于轉(zhuǎn)座子和piRNA互作的預(yù)測(cè)軟件Piano不僅結(jié)合了piRNA的結(jié)構(gòu)和序列信息,而且使用了SVM算法,在準(zhǔn)確度上達(dá)到95.3%,敏感度上也超過了95%[53]。同時(shí),該軟件能夠應(yīng)用于不同物種,在預(yù)測(cè)人類、小鼠和大鼠的piRNA的整體準(zhǔn)確度上能夠達(dá)到90.6%[53]。在一些非模式動(dòng)物的預(yù)測(cè)中,其也取得了比較好的預(yù)測(cè)結(jié)果。利用SVM的另外一種工具Pibomd同樣也是基于piRNA的結(jié)構(gòu)基序進(jìn)行預(yù)測(cè)的[54]。該軟件相較于較早的基于k-mer序列的軟件,在預(yù)測(cè)準(zhǔn)確度(Accuracy,ACC)上高出10%。

        4 未來研究方向與展望

        非編碼RNA在表觀遺傳調(diào)控中起著重要的作用,是研究基因調(diào)控網(wǎng)絡(luò)中的重要一環(huán)。同時(shí),研究已經(jīng)證明許多ncRNA在許多生命活動(dòng)過程以及疾病中都扮演著不同的角色。因而,對(duì)非編碼RNA的研究是解析遺傳過程、探究生命奧秘過程中不可缺少的一部分。

        為了研究非編碼RNA的結(jié)構(gòu)和功能,進(jìn)行大量的RNA-seq不可避免。然而如何從大量的數(shù)據(jù)中篩選出有潛在功能的非編碼RNA逐漸成為一個(gè)至關(guān)重要的問題。開發(fā)出一種更為廣泛、全面的具有更高準(zhǔn)確率和敏感度的預(yù)測(cè)軟件或許是解決這一問題的答案。

        除了研究較為明晰的持家非編碼RNA以外,具有更多復(fù)雜功能的調(diào)節(jié)性ncRNA更為人們所關(guān)注。所有針對(duì)ncRNA的預(yù)測(cè)軟件均是根據(jù)其固有的特有屬性和特征,具有針對(duì)性地開發(fā)出來的。其所利用的方法主要分為兩大類:一類是基于本身序列的同源性、保守性以及多維結(jié)構(gòu)特征,根據(jù)現(xiàn)有的數(shù)據(jù)庫的已知信息,通過某種統(tǒng)計(jì)模型所預(yù)測(cè)出來的;另一類則是基于機(jī)器學(xué)習(xí)的算法進(jìn)行預(yù)測(cè)。機(jī)器學(xué)習(xí)算法與傳統(tǒng)的算法相比較,能夠具有更好的綜合性能,應(yīng)對(duì)不同物種來源的數(shù)據(jù)。盡管相較于其他類型的ncRNA,預(yù)測(cè)piRNA的軟件相對(duì)研究較少并且缺乏特征信息,然而通過機(jī)器學(xué)習(xí)算法或許能夠更為準(zhǔn)確地預(yù)測(cè)piRNA。

        猜你喜歡
        復(fù)合物編碼分子
        基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
        BeXY、MgXY(X、Y=F、Cl、Br)與ClF3和ClOF3形成復(fù)合物的理論研究
        分子的擴(kuò)散
        《全元詩》未編碼疑難字考辨十五則
        子帶編碼在圖像壓縮編碼中的應(yīng)用
        電子制作(2019年22期)2020-01-14 03:16:24
        Genome and healthcare
        柚皮素磷脂復(fù)合物的制備和表征
        中成藥(2018年7期)2018-08-04 06:04:18
        黃芩苷-小檗堿復(fù)合物的形成規(guī)律
        中成藥(2018年3期)2018-05-07 13:34:18
        “精日”分子到底是什么?
        新民周刊(2018年8期)2018-03-02 15:45:54
        米和米中的危險(xiǎn)分子
        亚洲gv白嫩小受在线观看| 免费在线观看av不卡网站 | 女人被狂躁的高潮免费视频| 另类老妇奶性生bbwbbw| 久草午夜视频| 国产成人高清精品亚洲一区| 国产毛片视频一区二区| 日韩精品区一区二区三vr| 久久国产自偷自免费一区100| 亚洲va精品va国产va| 嫩呦国产一区二区三区av | 丝袜美腿亚洲第一免费| 午夜色大片在线观看| 日韩中文网| 国产大学生自拍三级视频 | 亚洲熟女www一区二区三区| 极品粉嫩嫩模大尺度无码| 国产黄片一区视频在线观看| 国产剧情av麻豆香蕉精品| 亚洲精品国产suv一区88| 99热免费精品| 一区两区三区视频在线观看| 久久久国产精品无码免费专区| 亚洲av无码专区电影在线观看 | 亚洲一区二区三区成人在线| 国产99一区二区三区四区| 久久精品国产亚洲av四虎| 国产亚洲第一精品| 日本一区二区三级免费| 久久狠狠色噜噜狠狠狠狠97| 五十路熟女一区二区三区| 国产一区二区三区免费主播| 校园春色综合久久精品中文字幕| 国产真实老熟女无套内射| 在线观看国产精品91| 你懂的视频网站亚洲视频| 中文字幕乱码无码人妻系列蜜桃| 美女在线国产| 视频一区中文字幕日韩| 国产精品二区一区二区aⅴ污介绍| 窝窝影院午夜看片|