何超,沈文龍,李平,張彥,曾晶,殷作明,趙志虎
?
Alu元件在染色質三維結構層次上的生物信息學分析
何超1,2,沈文龍2,李平2,張彥2,曾晶1,殷作明1,趙志虎2
1. 西藏軍區(qū)總醫(yī)院,拉薩 850000 2. 軍事科學院軍事醫(yī)學研究院生物工程研究所,北京 100071
染色質在細胞核內三維高級結構包括最底層的核小體、核小體組成的“串珠”結構、螺線管纖維結構、染色質/DNA環(huán)結構(chromatin/DNA loop)、拓撲結構域(topologically associated domain, TAD)等多層次結構。其中,TAD因在不同的細胞類型中相對穩(wěn)定且保守,被認為是染色質三維結構的基本單元。Alu元件是一種哺乳動物基因組中占據了較大比例的短散在重復元件,其廣泛存在且種類繁多,目前關于Alu元件功能上的研究尚不透徹。本研究對Alu元件與染色質三維結構的關系進行研究,分析了Alu元件在染色質三維結構形成中的作用,并通過染色質三維結構上的距離關系對Alu元件子族的演化流程進行了探索。結果發(fā)現,Alu元件參與的染色質間相互作用在高強度的染色質相互作用中的比例隨著強度增加而逐漸增高,表明Alu在染色質三維結構構建的過程中發(fā)揮了重要的作用。同時,研究還發(fā)現Alu元件在染色質上相互作用的強度與進化上的關系存在著一定的正相關性,表現在一維序列進化距離上比較接近的Alu元件在染色質的三維結構上也會彼此相互靠近。
染色質三維結構;Alu元件;生物信息;進化樹
短散在元件(short interspersed elements, SINEs)是以散在方式分布于基因組中的較短的重復序列,其單元長度通常在50 bp以下。Alu序列是哺乳動物的短散在元件中所占比例最多的一種重復元件[1]。Alu序列的左右兩端各分布著一個不等長的、包含一個RNA聚合酶Ⅲ啟動子序列的單體[2],左側單體比右側單體短31 bp且只有左側單體的RNA聚合酶Ⅲ啟動子具有活性。研究表明,在Alu元件附近往往富集著長非編碼RNA (long non-coding RNAs, lncRNAs),可輔助lncRNAs在細胞核內進行定位[3],而且還能在基因組轉錄過程中能夠充當剪接受體,抑制mRNA的翻譯并導致基因組不穩(wěn)定[4]。此外,還有研究發(fā)現Alu元件在基因組中與增強子(enhancer)廣泛相互作用[5~7]。
染色質在細胞核內的結構與蛋白質的三維高級結構相似,包括基礎的核小體、核小體組成的“串珠”結構、螺線管纖維結構、染色質/DNA環(huán)結構(chromatin/DNA loop)、拓撲結構域(topological associated domain, TAD)等多層次結構[8,9]。其中,TAD因在不同的細胞類型中相對穩(wěn)定且保守,被認為是染色質三維結構的基本單元[10]。目前對于染色質三維結構的研究主要基于近距離連接反應的染色體構象捕獲技術、基于圖譜技術根據多聚物聚合等原理進行計算機建模、基于CRISPR的DNA片段編輯等的遺傳學技術,以及基因光譜反射的顯微鏡技術。迄今為止,對染色質結構的直接觀測受到技術的限制,難以直接在高分辨率下觀測染色質的動態(tài)變化,因此研究者們采用先將染色質內的相互作用固定下來,通過分子生物學手段進行分析,從而推斷生理條件下真實的染色質動態(tài)結構。目前對染色質三維結構的研究方法主要包括研究點與點之間距離水平的3C技術[11]、研究一點到基因組范圍內其他位點距離水平的4C技術[12]、研究已知范圍內多點到多點間相互作用的5C技術[13]、全基因組內染色質相互作用的Hi-C技術[14,15]及進一步衍生出的DNase Hi-C[16]、Micro-C[17]、Capture Hi-C[18]、COLA[19]、C-walk[20]等技術[21,22]。本研究通過生物信息學方法,結合Hi-C實驗數據,在染色質三維結構層次上對Alu元件在染色質三維結構形成中發(fā)揮的作用進行探索,并根據染色質三維折疊數據對Alu元件的相關功能進行分析。
Hi-C實驗數據來源于Rao等[19]所公開的數據集,包括GM12878、IMR90和K562 3個細胞系,均可在最高5 kb分辨率下開展研究。Alu元件數據來自UCSC genome browser repeat masker,包含了Alu元件不同子類在基因組上所在位點的信息[23]。參考基因組選取為人類參考基因組hg19版本。
目前已經有較多處理Hi-C數據的比較成熟的軟件,如GenomicInteractions[24]、HiCPlotter[25]、HiC-Pro[26]等,其中GenomicInteractions可用于分析特殊位點間相互作用網絡,然而這一軟件并不能整合多組學數據,也不能夠進行后續(xù)的功能挖掘等分析[24];HiCPlotter側重于將Hi-C相互作用熱圖與相應的包括組蛋白修飾等表觀遺傳特征的結合,但并未關注染色質上特殊序列間的相互作用[25]。利用HiC-Pro軟件對原始數據進行預處理,因Hi-C數據是包含相互作用的兩個基因組片段的整合序列,通過將原始測序序列比對到基因組上,得到發(fā)生相互作用的兩個基因組位點。過濾掉自連接或未連接的無用、冗余相互作用對,將剩余相互作用對進行整合匯總,以便后續(xù)分析處理。
利用開源的R語言及附屬軟件包對Alu元件不同子類相互作用頻率分布進行分析。將不同位點的全部相互作用匯總,設定相互作用上下閾值,超過上限閾值認為其過度連接,低于下線閾值認為其為染色質內隨機連接。根據上下閾值進行過濾后,按照相互作用頻率強度將所有位點的相互作用分成若干子集。根據Alu元件所在的位置生成隨機位點組成隨機組,將每一組內的相互作用數據與隨機組數據相比較,從而幫助用戶判斷特殊位點的相互作用在生物學上是否顯著,以及是否與染色質三維結構相關。
將Alu元件子族參與的相互作用從全局染色質間與染色質內相互作用中提取出來,并根據Alu元件不同子族進行分類。然后根據不同Alu元件子族間的平均相互作用強度,推算三維結構上的距離關系,并與已知的Alu元件進化樹相比較,從而判斷這些元件之間是否存在關聯。
首先使用bowtie2軟件對數據集進行序列比對,通過比對后得到染色質相互作用序列對。將全部相互作用序列對進行統(tǒng)計,得到不同位點間相互作用頻率,根據上下閾值進行過濾,然后按照相互作用頻率大小分成若干子集,將每一組內的相互作用數據與隨機組數據相比較,從而判斷Alu元件的相互作用在生物學上是否顯著,以及是否與染色質三維結構相關。為了判斷差異是否真實存在,根據相應Alu元件的位置信息,生成了與之對應的隨機對照組進行比較[27]。
經計算發(fā)現,在不同細胞系中Alu元件所參與的相互作用比例結果顯示均具有較高的一致性,Pearson相關系數均在0.997以上,說明Alu元件參與相互作用的比例在不同細胞系中是相對一致的,這些結果提示在不同細胞系中,Alu元件可能對染 色質三維結構的構建、傳遞和維持發(fā)揮著重要的 作用。
根據UCSC上Repeat Masker數據集中Alu的位點信息,對其在不同強度的染色質相互作用中所占的比例進行了分析,因Hi-C實驗數據是若干條序列,其中每條序列為染色質上兩段相互靠近的不同位點連接形成,通過序列雙端比對即可獲取全基因組范圍內的染色質相互作用水平[28],將全部相互作用根據上下閾值進行過濾,按照相互作用頻率大小分成若干子集,根據Alu元件的位點信息,將Alu元件參與的相互作用從全局相互作用中提取出來,進一步計算其在不同子集中所占的比例。
結果發(fā)現,Alu元件在高強度的相互作用中所占比例隨著強度增加而逐漸增高,這表明Alu在染色質三維結構構建過程中發(fā)揮了重要的作用(圖1)。之前的研究也表明,Alu富集的區(qū)域會使序列有更高的GC含量,從而也會有更多的CpG島與甲基化水平,這些使序列和轉錄調控變得更加靈活,也就更有可能富集著較多的染色質相互作用。同時Alu序列經常在細胞中發(fā)揮增強子的作用,這也可能是其廣泛參與高強度染色質相互作用的原因[29]。
圖1 Alu元件參與的染色質相互作用分布
本研究從染色質三維結構層面上對Alu元件家族中不同子類之間的分布進行了分析與驗證。通過計算不同子類之間的相互作用強度,即染色質三維結構層次上的平均距離,結果見圖2。顏色越深表明兩種元件在染色質三維結構層面上平均距離越近,可以看出AluJ與AluS子家族呈現出一個局部的熱區(qū),而AluY子家族則與其余子家族間相互作用強度都較低。
為排除細胞類型特異性因素的影響,對GM12878、K562和IMR90 3個細胞系中Alu家族所有二級子類所參與的相互作用強度進行了一致性檢驗。結果發(fā)現,3個細胞系的分析結果均具有相對較高的一致性,尤其是GM12878與K562,Pearson相關系數可以達到0.827,說明不同Alu子類參與的相互作用強度水平并不是細胞類型特異的,而是普遍存在且相對一致的。
從上面的研究中可以發(fā)現,Alu的3個子家族AluJ、AluS和AluY在相互作用強度上存在著差異,因此對這3個子家族的相互作用強度進行了進一步的觀察,并根據三者之間相互作用強度繪制了熱圖(圖3),結果發(fā)現AluJ和AluS都是與自身相互作用最強,與相鄰的子家族次強,與距離最遠的子家族相互作用強度最弱,也就是說,AluJ與AluS、AluS與AluY在染色質三維結構上距離較近,而AluJ與AluY距離較遠。這一發(fā)現與之前文獻中報道的僅僅根據一維核酸序列分析得到的Alu家族進化樹(圖4)相一致[30,31],AluY自身作用強度較弱,這也許與其較近年代才產生有關,相對于AluJ (21 575個)、AluS (16 536個)而言,AluY的數量較少,只有1731個,分布也較為分散,相互作用強度較弱。因此推測,在進一步的進化過程中,當Alu繼續(xù)衍生出新的子家族,AluY數量在人類基因組中逐漸增多時,其參與的相互作用的強度也會隨之增加。根據相互作用強度做了層次聚類,發(fā)現與上面的推測也基本一致(圖5)。
圖2 Alu元件子族間相互作用強度分布
橫縱坐標代表相應的Alu元件子類。
圖3 Alu元件3個子族間相互作用強度分布
基于上述結果,推斷Alu元件在染色質相互作用的強度與進化上的關系是存在著一定的正相關性,也就是說一維序列進化距離上比較接近的Alu元件在染色質的三維結構上也會彼此相互靠近。至于是因為它們進化上首先隨機跳躍擴展到基因組中的不同區(qū)域,但是由于一維序列比較類似因而結合類似的、共同的調控因子從而導致所在區(qū)域染色質三維結構相互聚集,還是因為原本在染色質三維構象上,原始的序列位點就比較接近,在進一步的演化過程中,新出現的元件優(yōu)先擴展到三維距離上更近的區(qū)域最終使得所有這些同族的Alu子族在三維分布上也比較接近,還需要后續(xù)更多的實驗驗證。
細胞核是真核生物獨有的一種細胞器,具有高度不均一、嚴格區(qū)室化、亞結構相對獨立等特點,可以從外至內分為核被膜、核纖層、核基質、染色質及核仁層結構,其中核纖層、核基質、核仁3者相互連接,構成細胞核內的骨架及支撐結構,染色質圍繞這一骨架以復雜而精致的三維形態(tài)高度折疊,這一折疊能夠維持著相對穩(wěn)定且高度動態(tài)變化的結構,在DNA復制、重排、重組、修復以及基因轉錄調控等方面發(fā)揮重要的功能[16,32,33]。
圖4 Alu元件進化樹
圖5 Alu元件相互作用強度層次聚類圖
隨著技術的發(fā)展,人們逐漸發(fā)現染色質與蛋白質的多級折疊結構相似,可以分成若干個不同的層級。DNA雙螺旋鏈通過纏繞形成核小體,核小體通過連接DNA形成核小體“串珠”結構,進一步轉曲折疊形成螺線管顯微結構。共定位、共表達的染色質位點又在染色質內相互靠近,形成染色質或DNA環(huán)結構。染色質環(huán)又進一步根據相互作用折疊成拓撲結構域(TAD)[28,34]。經研究發(fā)現同一TAD內染色質會存在較強的相互作用,TAD間的則相對較弱,且TAD的邊界在不同物種、不同類型的細胞系中會相對穩(wěn)定,因此TAD被認為是染色質三維構象的結構和功能基本單元。近期Bing等[35]整合比較了21種人類不同類型細胞的染色質相互作用,進一步證實TAD邊界在不同類型細胞相對保守,且發(fā)現了局部相互作用高度富集的染色質活躍區(qū)域(frequently interacting regions, FIREs)與超級增強子部分重疊,表明染色質三維折疊與細胞生命活動緊密相關。
在哺乳動物基因組中,一半以上都是各類重復元件序列。重復元件根據結構和復制形式,可分為串聯重復序列(tandem repeat)和轉座元件(transpos-able elements)。轉座元件又可分為長散在重復元件(long interspersed nuclear elements, LINE)與短散在重復元件(short interspersed nuclear elements, SINE)等[36]。短散在重復元件又根據結構等可分為Alu元件與Mir元件等不同子類。其中Alu元件在哺乳動物尤其是靈長類動物基因組中廣泛存在且比例較高,然而對其功能上的研究卻一直進展緩慢,早起甚至被認為是垃圾序列[1,37]。最近的一些研究才發(fā)現Alu元件在基因組的結構及基因表達調控等方面發(fā)揮了一些功能[38,39]。
本研究發(fā)現Alu元件在染色質三維構象的動態(tài)折疊過程中發(fā)揮了重要的作用,在不同種類的細胞系中均參與了較多高強度的染色質間相互作用。且目前多有研究發(fā)現,Alu元件與染色質內的增強子有強烈的相互作用。這些都表明Alu元件可能在染色質三維結構的構建、傳遞和維持中發(fā)揮著作用。染色質在細胞核內維持著動態(tài)平衡、永不纏繞的結構狀態(tài),有著相對穩(wěn)定的結構,而這樣的結構需要一定的網絡節(jié)點加以固定,因此認為Alu元件在其中可能就發(fā)揮著高強度的相互作用網絡中心固定節(jié)點的作用,從而維持著染色質動態(tài)結構的穩(wěn)定。
Alu元件在短散在重復序列中廣泛分布,且種類繁多[40],目前已有較多根據序列層面分析Alu家族演化過程的研究,但尚未有人從其在染色質三維結構上的分布來分析其演化過程。本研究基于染色質三維結構的數據,對Alu元件的演化歷程進行了分析,證明了一維序列演化關系上相對靠近的子類,在染色質三維結構中的相互作用強度也會較高,并用層次聚類的方式得到了基于染色質相互作用強度的進化樹。這些工作表明,Alu元件在染色質上相互作用的強度與進化上的關系存在著一定的正相關,可目前的工作尚無法對這一現象的原因進行證實。一方面有可能是因為在進化過程中,Alu元件初代子族隨機跳躍擴展到基因組內,某些調控因子對這些初代子族進行調控,使得這些子族所在的染色質位點相互靠攏,對染色質的三維構象進行改變;另一方面有可能在進化過程中,Alu元件的初代子族本身就分布在空間距離比較接近的染色質位點,隨著基因組的演化,新產生的Alu元件子族也逐漸跳躍擴展到三維距離相近的染色質位點上,從而使得相同的Alu子族在染色質三維分布上比較靠近。兩方面共同作用,從而使得Alu元件的演化與染色質的三維構象緊密相關。
[1] Makalowski W, Genomics. Not junk after all, 2003, 300(5623): 1246–1247.
[2] Wang W, Wang YP. Roles of alu family in human genome., 2007, 29(05): 641–645.王偉, 王亞平. Alu家族在人類基因組中的作用細胞生物學雜志, 2007, 29(05): 641–645.
[3] Lubelsky Y, Ulitsky I. Sequences enriched in alu repeats drive nuclear localization of long rnas in human cells, 2018. 555(7694): 107–111.
[4] Akta? T, Av?ar Il?k I, Maticzka D, Bhardwaj V, Pessoa Rodrigues C, Mittler G, Manke T, Backofen R, Akhtar A. Dhx9 suppresses rna processing defects originating from the alu invasion of the human genome, 2017, 544(7648): 115–119.
[5] Su M, Han D, Boyd-Kirkup J, Yu X, Han JD. Evolution of alu elements toward enhancers, 2014, 7(2): 376–385.
[6] Elbarbary RA, Maquat LE. Distinct mechanisms obviate the potentially toxic effects of Inverted-Repeat alu elements on cellular rna metabolism, 2017, 24(6): 496–498.
[7] Nakama M, Otsuka H, Ago Y, Sasai H, Abdelkreem E, Aoyama Y, Fukao T. Intronic antisense alu elements have a negative splicing effect on the inclusion of adjacent downstream exons, 2018, 664: 84–89.
[8] Dixon JR, Selvaraj S, Yue F, Kim A, Li Y, Shen Y, Hu M, Liu JS, Ren B. Topological domains in mammalian genomes identified by analysis of chromatin interactions, 2012, 485(7398): 376–380.
[9] He C, Li P, Zhang Y, Shi ML, Zhang XY, Xie DJ, Shen WL, Zhao ZH. Bioinformatics analysis of MARs’extensive involvement of forming genome 3D structure., 2017, 33(6): 638–644.何超, 李平, 張彥, 師明磊, 張香媛, 謝德建, 沈文龍, 趙志虎. 核基質附著區(qū)廣泛參與基因組三維結構折疊的生物信息學分析中國生物化學與分子生物學報, 2017,33(6): 638–644.
[10] Pope BD, Ryba T, Dileep V, Yue F, Wu W, Denas O, Vera DL, Wang Y, Hansen RS, Canfield TK, Thurman RE, Cheng Y, Gülsoy G, Dennis JH, Snyder MP, Stamatoyannopoulos JA, Taylor J, Hardison RC, Kahveci T, Ren B, Gilbert DM. Topologically associating domains are stable units of Replication-Timing regulation, 2014, 515(7527): 402–405.
[11] Dekker J, Rippe K, Dekker M, Kleckner N. Capturing chromosome conformation, 2002, 295(5558): 1306–1311.
[12] Zhao Z, Tavoosidana G, Sj?linder M, G?nd?r A, Mariano P, Wang S, Kanduri C, Lezcano M, Sandhu KS, Singh U, Pant V, Tiwari V, Kurukuti S, Ohlsson R. Circular chromosome conformation capture (4c) uncovers extensive networks of epigenetically regulated Intra- and interchromosomal interactions, 2006, 38(11): 1341–1347.
[13] Dostie J, Richmond TA, Arnaout RA, Selzer RR, Lee WL, Honan TA, Rubio ED, Krumm A, Lamb J, Nusbaum C, Green RD, Dekker J. Chromosome conformation capture carbon copy (5c): a massively parallel solution for mapping interactions between genomic elements, 2006, 16(10): 1299–1309.
[14] Lieberman-Aiden E, van Berkum NL, Williams L, Imakaev M, Ragoczy T, Telling A, Amit I, Lajoie BR, Sabo PJ, Dorschner MO, Sandstrom R, Bernstein B, Bender MA, Groudine M, Gnirke A, Stamatoyannopoulos J, Mirny LA, Lander ES, Dekker J. Comprehensive mapping of Long-Range interactions reveals folding principles of the human genome, 2009, 326(5950): 289–293.
[15] Zhang XY, He C, Ye BY, Xie DJ, Shi ML, Zhang Y, Shen WL, Li P, Zhao ZH. Optimization and quality control of genome-wide Hi-C library preparation(), 2017, 39(9): 847–855.張香媛, 何超, 葉丙雨, 謝德建, 師明磊, 張彥, 沈文龍, 李平, 趙志虎. 全基因組染色質相互作用Hi-C 文庫制備的優(yōu)化及其質量控制. 遺傳, 2017, 39(9): 847–855.
[16] Ma W, Ay F, Lee C, Gulsoy G, Deng X, Cook S, Hesson J, Cavanaugh C, Ware CB, Krumm A, Shendure J, Blau CA, Disteche CM, Noble WS, Duan Z. Fine-Scale chromatin interaction maps reveal the Cis-Regulatory landscape of human lincrna genes, 2015, 12(1): 71–78.
[17] Hsieh TH, Weiner A, Lajoie B, Dekker J, Friedman N, Rando OJ. Mapping nucleosome resolution chromosome folding in yeast by Micro-C, 2015, 162(1): 108–119.
[18] Dryden NH, Broome LR, Dudbridge F, Johnson N, Orr N, Schoenfelder S, Nagano T, Andrews S, Wingett S, Kozarewa I, Assiotis I, Fenwick K, Maguire SL, Campbell J, Natrajan R, Lambros M, Perrakis E, Ashworth A, Fraser P, Fletcher O. Unbiased analysis of potential targets of breast cancer susceptibility loci by capture Hi-C, 2014, 24(11): 1854–1868.
[19] Rao SS, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT, Sanborn AL, Machol I, Omer AD, Lander ES, Aiden EL. A 3d map of the human genome at kilobase resolution reveals principles of chromatin looping, 2014, 159(7): 1665–1680.
[20] Olivares-Chauvet P, Mukamel Z, Lifshitz A, Schwartzman O, Elkayam NO, Lubling Y, Deikus G, Sebra RP, Tanay A. Capturing pairwise and Multi-Way chromosomal conformations using chromosomal walks, 2016, 540(7632): 296–300.
[21] Denker A, de Laat W. The second decade of 3c technologies: detailed insights into nuclear organization, 2016, 30(12): 1357–1382.
[22] Dekker J, Belmont AS, Guttman M, Leshyk VO, Lis JT, Lomvardas S, Mirny LA, O'Shea CC, Park PJ, Ren B, Politz JCR, Shendure J, Zhong S, 4D Nucleome Network. The 4d nucleome project, 2017, 549(7671): 219–226.
[23] Chen N. Using repeatmasker to identify repetitive elements in genomic sequences, 2004, Chapter 4: Unit 4. 10.
[24] Harmston N, Ing-Simmons E, Perry M, Bare?i? A, Lenhard B. Genomicinteractions: an R/Bioconductor package for manipulating and investigating chromatin interaction data, 2015, 16: 963.
[25] Akdemir KC, Chin L. Hicplotter integrates genomic data with interaction matrices, 2015, 16: 198.
[26] Servant N, Varoquaux N, Lajoie BR, Viara E, Chen CJ, Vert JP, Heard E, Dekker J, Barillot E. Hic-Pro: an optimized and flexible pipeline for Hi-C data processing, 2015, 16: 259.
[27] Lajoie BR, Dekker J, Kaplan N. The hitchhiker's guide to Hi-C analysis: practical guidelines, 2015, 72: 65–75.
[28] Cremer T, Cremer M, Cremer C. The 4d Nucleome: genome compartmentalization in an evolutionary context, 2018, 83(4): 313–325.
[29] Cournac A, Koszul R, Mozziconacci J. The 3d folding of metazoan genomes correlates with the association of sImilarrepetitive elements, 2016, 44(1): 245–255.
[30] Kapitonov V, Jurka J. The age of alu subfamilies, 1996, 42(1): 59–65.
[31] Price AL, Eskin E, Pevzner PA. Whole-Genome analysis of alu repeat elements reveals complex evolutionary history, 2004, 14(11): 2245–2252.
[32] Xie DJ, Shi ML, Zhang Y, Wang TY, Shen WL, Ye BY, Li P, He C, Zhang XY, Zhao ZH. Construction of ctcf degradation cell line by Crispr/Cas9 mediated genome editing, 2016, 38(7): 651–657.謝德建, 師明磊, 張彥, 王天藝, 沈文龍, 葉丙雨, 李平, 何超, 張香媛, 趙志虎. 利用CRISPR/Cas9 技術構建CTCF 蛋白降解細胞系. 遺傳, 2016, 38(7): 651–657.
[33] Beagrie RA, Scialdone A, Schueler M, Kraemer DC, Chotalia M, Xie SQ, Barbieri M, de Santiago I, Lavitas LM, Branco MR, Fraser J, Dostie J, Game L, Dillon N, Edwards PA, Nicodemi M, Pombo A. Complex Multi-Enhancer contacts captured by genome architecture mapping, 2017, 543(7646): 519–524.
[34] Marti-Renom MA, Almouzni G, Bickmore WA, Bystricky K, Cavalli G, Fraser P, Gasser SM, Giorgetti L, Heard E, Nicodemi M, Nollmann M, Orozco M, Pombo A, Torres-Padilla ME. Challenges and guidelines toward 4d nucleome data and model standards, 2018, 50(10): 1352–1358.
[35] Schmitt AD, Hu M, Jung I, Xu Z, Qiu Y, Tan CL, Li Y, Lin S, Lin Y, Barr CL, Ren B. A compendium of chromatin contact maps reveals spatially active regions in the human genome, 2016, 17(8): 2042–2059.
[36] Chuong EB, Elde NC, Feschotte C. Regulatory activities of transposable elements: from conflicts to benefits, 2017, 18(2): 71–86.
[37] Ge SX. Exploratory bioinformatics investigation reveals importance of "Junk" DNA in early embryo development, 2017, 18(1): 200.
[38] Padeken J, Zeller P, Gasser SM. Repeat DNA in genome organization and stability, 2015, 31: 12–19.
[39] Gu Z, Jin K, Crabbe MJC, Zhang Y, Liu X, Huang Y, Hua M, Nan P, Zhang Z, Zhong Y. Enrichment analysis of alu elements with different spatial chromatin proximity in the human genome, 2016, 7(4): 250–266.
[40] Tang LM, Pu WY, Xiao L, Li K, Guo ZF, Research progress of a component., 2014, (08): 1–2.湯麗夢, 浦汪洋, 肖莉, 李凱, 郭紫芬. Alu元件研究進展生物技術世界, 2014, (08): 1–2.
Bioinformatics analysis of Alu components at the level of genome 3D structure
Chao He1,2, Wenlong Shen2, Ping Li2, Yan Zhang2, Jing Zeng1, Zuoming Yin1, Zhihu Zhao2
The interphase chromatin is folded in the nucleus in a hierarchical manner, including the nucleosome, the "beads on a string" structure composed of nucleosomes, the solenoid fiber structure, the chromatin/DNA loop structure (chromatin/DNA loop), and the topologically associated domain (TAD). Among them, TAD is considered to be the basic unit of the 3D structure of chromatin because it is relatively stable and conserved in different cell types. Alu elements occupy a large proportion in the mammalian genomes. There are a wide variety of Alu elements, but their functional characterizations are limited to date. This study investigates the role of Alu elements in the assembly of 3D chromatin conformation. The evolutionary process of the Alu subfamily was explored by the distance relationship of the 3D structure of chromatin. We found that the proportion of Alu elements in high-density chromatin interaction increased with higher similarity, indicating that Alu plays an important role in the construction of chromatin 3D structure. There is a certain positive correlation between the strength of the upper interaction and the evolutionary relationship. In sum, the Alu elements with relatively close distances in the 1D sequence will also be close to each other in the 3D structure of chromatin.
genome 3D structure;Alu component;bioinformatics;evolutionary tree
2018-10-30;
2019-01-01
國家自然科學基金項目(編號:31370762,31030026,31272416,81372218)資助[Supported by the National Natural Science Foundation of China (Nos. 31370762, 31030026, 31272416, 81372218)]
何超,碩士,工程師,研究方向:生物信息學。E-mail: hechao2010@tsinghua.org.cn
殷作明,西藏軍區(qū)總醫(yī)院院長,研究方向:高原病、戰(zhàn)創(chuàng)傷。E-mail: yinzuoming@163.com趙志虎,軍事科學院軍事醫(yī)學研究院研究員,研究方向:染色質三維結構。E-mail: zhaozh@bmi.ac.cn
10.16288/j.yczz.18-296
2019/1/14 13:15:30
URI: http://kns.cnki.net/kcms/detail/11.1913.R.20190114.1315.011.html
(責任編委: 吳強)