亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        LncRNA的靶RNA 預(yù)測(cè)研究

        2021-09-07 08:05:04鄭希強(qiáng)宋子健李建偉
        醫(yī)學(xué)信息 2021年17期
        關(guān)鍵詞:區(qū)域模型

        鄭希強(qiáng),宋子健,李建偉

        (河北工業(yè)大學(xué)人工智能與數(shù)據(jù)科學(xué)學(xué)院計(jì)算醫(yī)學(xué)研究所,天津 300401)

        隨著生命科學(xué)研究的深入和高通量測(cè)序技術(shù)的飛速發(fā)展,研究發(fā)現(xiàn)大多數(shù)人類(lèi)基因組均已轉(zhuǎn)錄[1]。據(jù)報(bào)道[2],其中僅有2%的RNA 分子可翻譯為蛋白質(zhì),絕大部分RNA 是不能編碼蛋白的非編碼RNA。其中,長(zhǎng)度超過(guò)200 個(gè)核苷酸的非編碼RNA被定義為長(zhǎng)鏈非編碼RNAs(long non-coding RNAs,lncRNAs)。近年來(lái),越來(lái)越多的研究表明,lncRNAs 參與調(diào)控多種重要的生物過(guò)程,如調(diào)控表觀遺傳染色質(zhì)修飾、轉(zhuǎn)錄調(diào)控和轉(zhuǎn)錄后調(diào)控等[3]。2012 年,Gong ZJ 等[4]發(fā)現(xiàn)HOTAIR 可通過(guò)與PRC2復(fù)合物相互作用,誘導(dǎo)H3K27 發(fā)生甲基化,進(jìn)而抑制該基因的表達(dá)。此外,lncRNAs 與癌癥[5]、心血管疾病[6]和糖尿病[7]等多種復(fù)雜疾病的發(fā)生發(fā)展均存在著密切聯(lián)系。因此,深入了解lncRNA的調(diào)控功能,對(duì)人類(lèi)復(fù)雜疾病的診斷、治療和預(yù)后提供新的治療靶點(diǎn)具有重要意義。

        1 LncRNA的靶RNA 預(yù)測(cè)研究

        迄今為止,海量的lncRNAs 被不斷發(fā)現(xiàn),但對(duì)其調(diào)控功能的研究仍不夠充分。通過(guò)傳統(tǒng)的生物實(shí)驗(yàn)驗(yàn)證lncRNA調(diào)控功能,結(jié)果雖然準(zhǔn)確、可靠,但存在實(shí)驗(yàn)周期長(zhǎng)、費(fèi)用高、效率低等問(wèn)題。單純地依靠傳統(tǒng)的生物實(shí)驗(yàn)已遠(yuǎn)遠(yuǎn)不能滿(mǎn)足當(dāng)前需求,借助高效的、基于生物信息學(xué)的計(jì)算方法預(yù)測(cè)lncRNAs的調(diào)控功能已成為計(jì)算醫(yī)學(xué)研究和對(duì)復(fù)雜疾病機(jī)制研究的熱門(mén)方向。研究發(fā)現(xiàn)[8],lncRNAs 常通過(guò)堿基互補(bǔ)配對(duì)的方式調(diào)控靶RNA的表達(dá),進(jìn)而發(fā)揮其調(diào)控作用。因此,根據(jù)lncRNA 與靶RNA 之間的相互作用關(guān)系,通過(guò)計(jì)算預(yù)測(cè)lncRNA的靶RNA,利用靶RNA的生物學(xué)功能推斷l(xiāng)ncRNAs的調(diào)控功能已成為一種常見(jiàn)的研究方法。此外,lncRNAs 會(huì)折疊成復(fù)雜的二級(jí)結(jié)構(gòu)來(lái)維持它們的穩(wěn)定性和保守性。lncRNA的二級(jí)結(jié)構(gòu)可以幫助預(yù)測(cè)lncRNAs的靶RNA[9]。lncRNA 二級(jí)結(jié)構(gòu)的生物學(xué)意義及其堿基序列組成同樣重要,部分lncRNAs的功能活性通常由它們特定的二級(jí)結(jié)構(gòu)決定。

        基于以上分析,開(kāi)發(fā)lncRNA 靶RNA 預(yù)測(cè)模型在全基因組范圍預(yù)測(cè)lncRNA-RNA 相互作用,快速搜索lncRNA 與RNA 之間最穩(wěn)定的堿基互補(bǔ)配對(duì)狀態(tài),成為lncRNA-RNA 相互作用預(yù)測(cè)的關(guān)鍵[10]。隨著生物信息學(xué)的不斷發(fā)展,涌現(xiàn)出了數(shù)量眾多的RNA-RNA 相互作用預(yù)測(cè)模型,這些模型均可用于lncRNA 靶RNA 預(yù)測(cè)。常見(jiàn)的RNA-RNA 相互作用預(yù)測(cè)模型見(jiàn)表1。

        表1 常見(jiàn)預(yù)測(cè)lncRNA 靶RNA 模型的關(guān)鍵特性

        2 常見(jiàn)的RNA-RNA 相互作用預(yù)測(cè)模型

        2.1 LncTar LncTar 預(yù)測(cè)模型[11]通過(guò)標(biāo)準(zhǔn)化自由能(ndG)輔助科研人員預(yù)測(cè)lncRNAs的靶RNA。Li J等[11]從RNA 堿基互補(bǔ)配對(duì)的角度分析了lncRNAs與靶RNA 之間的相互作用關(guān)系,并將多重PCR 技術(shù)中引物二聚體的思想運(yùn)用到篩選lncRNA 靶RNA中。LncTar 預(yù)測(cè)模型利用“滑動(dòng)”算法和最近鄰能量模型[15,16]尋找并計(jì)算結(jié)合區(qū)域的自由能,最終通過(guò)計(jì)算ndG 與自定義閾值實(shí)現(xiàn)lncRNA-靶RNA 相互作用關(guān)系預(yù)測(cè)。

        LncTar 預(yù)測(cè)模型包含三個(gè)步驟。首先,創(chuàng)建二維矩陣,用于記錄兩個(gè)RNAs 分子的互補(bǔ)堿基對(duì)。在計(jì)算兩個(gè)RNAs 形成的結(jié)合區(qū)域時(shí),采用最近鄰能量模型。其中自由能(ΔG)由給定的焓值(ΔH)、熵值(ΔS)和特定溫度下的熔化溫度T 來(lái)計(jì)算。具體計(jì)算公式:ΔG=ΔH-TΔS。其次,遍歷兩個(gè)輸入RNAs 分子形成的全部結(jié)合區(qū)域,分別計(jì)算它們的總自由能(dG),并記錄在哈希表中。遍歷完成后,在哈希表中尋找最小的總自由能(dG)并獲得其結(jié)合區(qū)域。最后,LncTar 提出一個(gè)判定標(biāo)準(zhǔn)——標(biāo)準(zhǔn)化自由能(ndG),用它來(lái)反映自由能最小的結(jié)合區(qū)域中l(wèi)ncRNA-靶RNA 結(jié)合的相對(duì)穩(wěn)定性。具體計(jì)算公式如下:

        其中結(jié)合區(qū)域長(zhǎng)度(bindingregion)是兩個(gè)RNAs序列中較短的RNA 序列長(zhǎng)度。如果計(jì)算出兩個(gè)RNAs 形成結(jié)合區(qū)域的ndG 小于等于人為自定義閾值,就可以判定兩個(gè)RNAs 分子有相互作用關(guān)系,否則給出相反判定。

        LncTar 預(yù)測(cè)模型的優(yōu)勢(shì)在于對(duì)RNA 序列長(zhǎng)度沒(méi)有任何限制,可適用任意長(zhǎng)度的RNA 分子。并且LncTar 提供了標(biāo)準(zhǔn)化自由能,能自動(dòng)判定兩個(gè)RNAs 分子是否有相互作用關(guān)系,極大地減輕用戶(hù)的判定負(fù)擔(dān)。此外,LncTar的算法時(shí)間復(fù)雜度僅為O(n2)。但LncTar 預(yù)測(cè)模型也有一定的局限性。如因?yàn)樽非笥?jì)算速度,LncTar 沒(méi)考慮到RNA 二級(jí)結(jié)構(gòu),而lncRNA的二級(jí)結(jié)構(gòu)對(duì)大部分lncRNA-靶RNA相互作用的判定有著一定的影響。此外,如果兩個(gè)RNAs 轉(zhuǎn)錄本序列長(zhǎng)度較長(zhǎng)的情況下,預(yù)測(cè)出的結(jié)合區(qū)域長(zhǎng)度過(guò)長(zhǎng),將導(dǎo)致ndG 值過(guò)小,具有靶向關(guān)系的兩個(gè)RNAs 會(huì)被誤判。而ndG的閾值如果設(shè)置過(guò)小,雖然降低了假陽(yáng)性率,但會(huì)導(dǎo)致一部分正樣本預(yù)測(cè)結(jié)果不準(zhǔn)。因此,LncTar 預(yù)測(cè)模型還有很大的提升空間。

        2.2 RIsearch2 RIsearch2 模型[12]適用于大規(guī)模預(yù)測(cè)RNAs 間的相互作用。Ferhat A 等[12]在允許G-U 搖擺配對(duì)的情況下搜索與種子反向互補(bǔ)匹配的序列片段,并使用后綴數(shù)組索引與動(dòng)態(tài)規(guī)劃擴(kuò)展種子的方法快速定位查詢(xún)序列和目標(biāo)序列之間的互補(bǔ)結(jié)合區(qū)域。RIsearch2 模型分為兩個(gè)階段。第一階段:將查詢(xún)序列和目標(biāo)序列各自轉(zhuǎn)換為后綴數(shù)組索引結(jié)構(gòu),并存儲(chǔ)目標(biāo)序列后綴數(shù)組的反向互補(bǔ)序列。轉(zhuǎn)換為后綴數(shù)組索引結(jié)構(gòu)的算法是基于GUUGle 算法[17]。大部分算法將Watson-Crick 對(duì)(A-T,C-G)視為匹配,并且允許存在G-U 搖擺配對(duì)。而Ferhat A 等提出一種無(wú)需反轉(zhuǎn)查詢(xún)序列來(lái)找尋結(jié)合區(qū)域的方法,將GA 和U-C 匹配視為有效對(duì),然后使用二分查找來(lái)確定目標(biāo)序列后綴數(shù)組中與查詢(xún)序列匹配的區(qū)域。這種方法可以直接匹配目標(biāo)序列的后綴數(shù)組,不需要反轉(zhuǎn)查詢(xún)序列。第二階段:為了減少種子相互重疊造成的冗余,首先將冗余的匹配種子進(jìn)行過(guò)濾,然后通過(guò)填充種子上下游區(qū)域的動(dòng)態(tài)規(guī)劃矩陣擴(kuò)展剩余的種子區(qū)域,接著利用RIsearch[18]中簡(jiǎn)化的最近鄰能量模型計(jì)算種子匹配區(qū)域的自由能,并與用戶(hù)定義的分子間自由能閾值進(jìn)行比較,篩選出滿(mǎn)足條件的匹配區(qū)域。最后,通過(guò)回溯動(dòng)態(tài)規(guī)劃矩陣找到實(shí)際的相互作用區(qū)域。

        RIsearch2 預(yù)測(cè)模型將RIsearch 模型與GUUGle模型進(jìn)行深度集成,并且采用多個(gè)線程并行處理(OpenMP API)的方式對(duì)兩個(gè)后綴數(shù)組進(jìn)行匹配。這種高效的計(jì)算方式不僅克服了傳統(tǒng)算法一次只能處理一個(gè)目標(biāo)序列的障礙,還提高了計(jì)算速度。但RNA-RNA 相互作用預(yù)測(cè)中忽略RNA 二級(jí)結(jié)構(gòu)信息會(huì)降低預(yù)測(cè)的準(zhǔn)確性。

        2.3 RIblast RIblast 預(yù)測(cè)模型[13]一種基于種子擴(kuò)展方法[19]的超快速RNA-RNA 相互作用預(yù)測(cè)模型。首先,RIblast 使用后綴數(shù)組尋找種子匹配區(qū)域;其次,通過(guò)互補(bǔ)能量模型擴(kuò)展種子區(qū)域的兩端;最后,RIblast 模型使用兩種能量之和作為目標(biāo)序列和查詢(xún)序列相互作用結(jié)合區(qū)域的輸出結(jié)果。其中一種為可訪問(wèn)能量,這種能量是防止結(jié)合區(qū)域內(nèi)形成分子內(nèi)堿基對(duì)所需的能量,通過(guò)使用分區(qū)函數(shù)算法進(jìn)行計(jì)算[20]。另一種能量為雜交能量,它源自?xún)蓚€(gè)RNAs 片段之間分子間堿基配對(duì)產(chǎn)生的自由能,可以基于最近鄰能量模型計(jì)算。

        RIblast 預(yù)測(cè)模型分為兩個(gè)步驟:數(shù)據(jù)庫(kù)構(gòu)建和RNAs 結(jié)合區(qū)域搜索。在數(shù)據(jù)庫(kù)構(gòu)建中,首先是計(jì)算目標(biāo)RNA 數(shù)據(jù)集中每個(gè)片段的可訪問(wèn)能量,然后將目標(biāo)RNA 序列反轉(zhuǎn),并在未反轉(zhuǎn)與反轉(zhuǎn)的序列之間插入分隔符,接著構(gòu)造串聯(lián)序列的后綴數(shù)組索引,為了加快RNA 相互作用區(qū)域的搜索,可對(duì)短字符串預(yù)先計(jì)算其雜交能量,最后將可訪問(wèn)能量串聯(lián)序列的后綴數(shù)組索引和短字符串計(jì)算互補(bǔ)能量的結(jié)果存儲(chǔ)在數(shù)據(jù)庫(kù)中。在RNAs 結(jié)合區(qū)域搜索中,首先是計(jì)算查詢(xún)序列的可訪問(wèn)能量,并為查詢(xún)序列構(gòu)建后綴數(shù)組索引,然后基于查詢(xún)和數(shù)據(jù)庫(kù)的兩個(gè)后綴數(shù)組,查找雜交能量小于閾值能量的種子區(qū)域。接著,通過(guò)雜交能量和兩個(gè)可訪問(wèn)能量的總和來(lái)計(jì)算找到的種子區(qū)域的相互作用能。繼次,RIblast 在種子區(qū)域兩邊進(jìn)行擴(kuò)展,沒(méi)有間隙。當(dāng)擴(kuò)展中不再形成RNA 互補(bǔ)雙鏈體時(shí),RIblast 終止擴(kuò)展。最后,刪除與其他種子區(qū)域完全重疊的種子。另外,也排除超過(guò)閾值能量的相互作用結(jié)果。

        對(duì)于RNA-RNA 相互作用預(yù)測(cè),可訪問(wèn)能量的計(jì)算時(shí)間與序列長(zhǎng)度成線性關(guān)系,雜交能量的計(jì)算時(shí)間是種子匹配項(xiàng)的平方,這是提高運(yùn)行速度的障礙。而RIblast 先進(jìn)行了大量的預(yù)處理工作,然后在查詢(xún)序列和目標(biāo)序列之間找到短匹配區(qū)域以加快速度(稱(chēng)為種子),最后將檢測(cè)到的種子兩端擴(kuò)展,這種方法解決了時(shí)間復(fù)雜度高的問(wèn)題。RIblast的不足之處在于最后只給出能量信息,部分用戶(hù)無(wú)法通過(guò)這些能量信息判斷兩個(gè)RNAs 分子是否存在相互作用關(guān)系。沒(méi)有給予用戶(hù)一些判定標(biāo)準(zhǔn),增加了人工判定的負(fù)擔(dān)。

        2.4 ASSA Antonov I 等[14]發(fā)現(xiàn)總自由能的值取決于RNA的轉(zhuǎn)錄本長(zhǎng)度和GC 含量?jī)蓚€(gè)因素,這使研究人員很難比較不同特性轉(zhuǎn)錄本所計(jì)算出的RNARNA 相互作用的總自由能。為了解決這個(gè)問(wèn)題,ASSA 預(yù)測(cè)模型[14]根據(jù)兩個(gè)相互作用RNAs的轉(zhuǎn)錄本長(zhǎng)度和GC 含量設(shè)計(jì)出了總自由能的統(tǒng)計(jì)顯著性(P值)。ASSA 預(yù)測(cè)模型包括三個(gè)步驟。第一步,使用LASTAL[21]程序包中的局部序列比對(duì)工具,搜索查詢(xún)序列和目標(biāo)序列中的局部互補(bǔ)區(qū)域。在這項(xiàng)工作中,ASSA 將這些局部互補(bǔ)區(qū)域稱(chēng)為“反義位點(diǎn)”。第二步,首先提取LASTAL 預(yù)測(cè)的反義位點(diǎn)以及側(cè)翼序列組成“假定雙鏈體”,然后根據(jù)熱力學(xué)模型計(jì)算其雜交能量?!凹俣p鏈體”中可能存在局部的RNA 二級(jí)結(jié)構(gòu),研究人員通過(guò)觀察總結(jié)出兩種“假定雙鏈體”類(lèi)型。第一種類(lèi)型稱(chēng)之為“真雙鏈體”,這種類(lèi)型的RNA 雙鏈體與任一側(cè)附近的(側(cè)翼)區(qū)域不具有強(qiáng)互補(bǔ)性,即單鏈RNA 無(wú)法形成二級(jí)結(jié)構(gòu)。因此,這種類(lèi)型的RNA 雙鏈體只形成分子間堿基對(duì)。第二種類(lèi)型稱(chēng)之為“兩個(gè)發(fā)夾”。除了RNAs 分子間堿基互補(bǔ)配對(duì)以外,兩個(gè)RNAs 自身還具有完美的(100%)分子內(nèi)互補(bǔ)性。為了將“真雙鏈體”與“兩個(gè)發(fā)夾”兩種類(lèi)型區(qū)分開(kāi),ASSA 預(yù)測(cè)模型使用基于熱力學(xué)的工具RNAup[22],因?yàn)樗軌蛲ㄟ^(guò)計(jì)算分子間自由能相對(duì)準(zhǔn)確地分開(kāi)兩種類(lèi)型。ASSA 將RNAup 應(yīng)用于特定序列組塊(“假定雙鏈體”)而不是全長(zhǎng)轉(zhuǎn)錄本,這樣可以有效并快速地計(jì)算RNA 分子間的雜交能量。最后,全部特定序列組塊相加當(dāng)作兩個(gè)RNAs 結(jié)合產(chǎn)生的總自由能。第三步,估算獲得的總自由能的統(tǒng)計(jì)顯著性。通過(guò)將觀察的RNA 序列[總自由能的分布取決于RNA 序列的特征(長(zhǎng)度和GC 含量)]與相應(yīng)隨機(jī)序列(ASSA 生成的負(fù)樣本)產(chǎn)生的總自由能進(jìn)行比較,估算總自由能的統(tǒng)計(jì)顯著性P值。具體計(jì)算公式如下:

        其中x 是觀察的RNA 序列通過(guò)ASSA 預(yù)測(cè)的總自由能,Num(ΔGrand≤x|T)是隨機(jī)序列產(chǎn)生的總自由能小于或等于x的隨機(jī)序列個(gè)數(shù),Num(ΔGrand)是隨機(jī)序列的總數(shù)。統(tǒng)計(jì)顯著性P值越小,說(shuō)明觀察的兩個(gè)RNAs 有相互作用的可能性越大。

        在ASSA 中的主要?jiǎng)?chuàng)新是數(shù)學(xué)統(tǒng)計(jì)模型,它可以快速計(jì)算并估計(jì)觀察的RNA-RNA 相互作用產(chǎn)生總自由能的統(tǒng)計(jì)顯著性。在RNA-RNA 相互作用預(yù)測(cè)模型中,ASSA 是唯一估計(jì)P值的預(yù)測(cè)模型。由于僅使用局部RNA 二級(jí)結(jié)構(gòu),對(duì)于全序列來(lái)說(shuō),反義位點(diǎn)上RNA 二級(jí)結(jié)構(gòu)可能超出它側(cè)翼區(qū)域的范圍,忽略該二級(jí)結(jié)構(gòu)的自由能會(huì)對(duì)最后結(jié)果的準(zhǔn)確性產(chǎn)生一定的影響。

        3 總結(jié)

        不同的lncRNA 靶RNA 預(yù)測(cè)模型各有其自身的特點(diǎn)和優(yōu)勢(shì)。研究者應(yīng)根據(jù)研究目的和需求,進(jìn)行合理選擇。但目前l(fā)ncRNA 靶RNA 預(yù)測(cè)模型還存在一些不足之處需要深入研究,主要包括以下幾個(gè)方面:首先,由于lncRNAs的研究剛剛起步,相關(guān)的lncRNA 生物特性認(rèn)識(shí)仍然不足。部分lncRNAs的生物特征如何表征還需進(jìn)一步探索,如RNA的三級(jí)結(jié)構(gòu),其空間性特征可能在預(yù)測(cè)lncRNA 靶RNA 中發(fā)揮重要的作用。其次,實(shí)驗(yàn)驗(yàn)證的數(shù)據(jù)雖然可靠,但數(shù)據(jù)量較少,通過(guò)計(jì)算統(tǒng)計(jì)的方法來(lái)區(qū)分兩個(gè)RNAs 相互作用的規(guī)律還需要進(jìn)一步研究,以提高預(yù)測(cè)模型的靈敏度。最后,還應(yīng)考慮其他因素,包括RNA的染色體定位以及特定RNA 結(jié)合蛋白的存在。發(fā)現(xiàn)和引入RNA的更多特征是lncRNA 靶基因預(yù)測(cè)模型發(fā)展的一個(gè)重要方向。

        隨著更多相關(guān)數(shù)據(jù)庫(kù)地建立和RNA-RNA 預(yù)測(cè)方法的改進(jìn),相信會(huì)有更多、更準(zhǔn)確的lncRNARNA 相互作用預(yù)測(cè)模型被開(kāi)發(fā)并應(yīng)用于lncRNA調(diào)控功能的研究。總之,在全基因組水平上預(yù)測(cè)lncRNA-RNA 相互作用的關(guān)系來(lái)尋找lncRNA 靶RNA 仍然有巨大的進(jìn)步空間。

        猜你喜歡
        區(qū)域模型
        一半模型
        永久基本農(nóng)田集中區(qū)域“禁廢”
        分割區(qū)域
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        關(guān)于四色猜想
        分區(qū)域
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        基于嚴(yán)重區(qū)域的多PCC點(diǎn)暫降頻次估計(jì)
        国产精品亚洲A∨天堂| 内射口爆少妇麻豆| 欧美精品v国产精品v日韩精品| 久久无码人妻一区二区三区午夜| 丰满人妻AV无码一区二区三区| 加勒比av在线一区二区| 日日麻批免费40分钟无码| 国产无遮挡无码视频免费软件| 粉嫩极品国产在线观看| 亚洲精品在线观看自拍| 精品人妻码一区二区三区剧情| 中文字幕乱码熟女人妻水蜜桃| 国产在线成人精品| 男女男在线精品免费观看| 99久久免费看精品国产一| 色噜噜狠狠狠综合曰曰曰| 国产精品亚洲一区二区无码国产| 男男互吃大丁视频网站| 我要看免费久久99片黄色| 久激情内射婷内射蜜桃| 国产成人无码A区在线观| 精品黄色一区二区三区| 伊人情人色综合网站| 亚洲成a∨人片在无码2023| 亚洲国产精品午夜电影| 久久久亚洲成年中文字幕| 国产又猛又黄又爽| 人妻去按摩店被黑人按中出| 美腿丝袜一区二区三区| 国产精品无套一区二区久久 | 日韩成人精品在线| 白色橄榄树在线阅读免费| 少妇人妻综合久久中文字幕| 精品无码中文字幕在线| 亚洲av成人在线网站| 99久久婷婷国产精品综合| 男人的天堂免费a级毛片无码| 国产精品二区在线观看| 久久色悠悠亚洲综合网| 中文字幕亚洲精品一区二区三区 | 国产av无码专区亚洲精品|