亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于一維序列的三維染色質(zhì)相分離:驅(qū)動(dòng)力、過程與功能

        2020-04-02 02:52:48劉思睿權(quán)慧田昊周瑞楊立江高毅勤
        物理化學(xué)學(xué)報(bào) 2020年1期
        關(guān)鍵詞:染色質(zhì)表觀草原

        劉思睿,權(quán)慧,田昊,周瑞,楊立江,高毅勤,,*

        1北京大學(xué)化學(xué)與分子工程學(xué)院,北京 100871

        2北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC),北京 100871

        1 引言

        在生命有機(jī)體中,通常由DNA編碼RNA,RNA經(jīng)過一定修飾和處理后再翻譯為蛋白質(zhì)來行使細(xì)胞內(nèi)的諸多功能。作為遺傳信息的載體,DNA承載著海量信息,以人類為例,其基因組堿基對數(shù)目高達(dá)30億對,且線性長度達(dá)到2 m。這樣長鏈的DNA被壓縮在幾十微米量級的細(xì)胞核中1,勢必經(jīng)過高度復(fù)雜的折疊組裝,同時(shí)為了實(shí)現(xiàn)高效的動(dòng)態(tài)檢索,這種折疊又勢必是有序的。過去人們對染色質(zhì)在較小尺度的分層組裝結(jié)構(gòu)已經(jīng)有了較多認(rèn)識。在真核生物中,DNA與蛋白質(zhì)共同構(gòu)成染色質(zhì),其中一類較為重要的蛋白質(zhì)是組蛋白。DNA-組蛋白復(fù)合形成的核小體核心顆粒(nucleosome core particle,NCP)由雙鏈DNA沿組蛋白八聚體纏繞1.7圈構(gòu)成,其DNA長度約為147 bp (base pair,堿基對)2,相鄰的NCP由長度范圍為20-60 bp的連接(linker)DNA相連,形成寬度約為10 nm的“beadson-a-string”纖維結(jié)構(gòu)3,并在H1組蛋白的輔助下,可能進(jìn)一步折疊形成30 nm纖維4。在較大尺度上,染色質(zhì)由轉(zhuǎn)錄相對活躍、結(jié)構(gòu)相對松散的常染色質(zhì)和折疊緊密的異染色質(zhì)兩種區(qū)域構(gòu)成。間期染色質(zhì)在核內(nèi)空間非隨機(jī)地占據(jù)不同區(qū)域從而形成染色質(zhì)域(chromosome territories,CTs),且其在核內(nèi)的徑向分布在進(jìn)化上具有一定保守性5。

        近二十年來,伴隨著染色質(zhì)構(gòu)象捕獲技術(shù)的發(fā)展,尤其是近十年來以Hi-C6、ChIA-PET7為代表的基于二代測序的全基因組構(gòu)象捕捉技術(shù)的提出,人們對千堿基(kb)、兆堿基(Mb)乃至數(shù)十兆堿基尺度下染色質(zhì)高級結(jié)構(gòu)的認(rèn)識有了長足的進(jìn)步,先后發(fā)現(xiàn)和驗(yàn)證了全局結(jié)構(gòu)區(qū)室6(compartment)、局域單元TAD8-10(topologically associated domain)、染色質(zhì)環(huán)11(loop)等高級結(jié)構(gòu)。在不同類型的樣本中,區(qū)室的翻轉(zhuǎn)廣泛存在,TAD則在組織間和進(jìn)化中都相對保守12,13。

        染色質(zhì)高級結(jié)構(gòu)在基因調(diào)控中起到重要作用,染色質(zhì)結(jié)構(gòu)在不同生命過程中如何受到調(diào)控而發(fā)生變化、并參與細(xì)胞功能的實(shí)現(xiàn),一直以來受到人們的關(guān)注。多種因素與染色質(zhì)結(jié)構(gòu)的形成與調(diào)節(jié)相互關(guān)聯(lián),例如:染色質(zhì)高級結(jié)構(gòu)與表觀遺傳性質(zhì)存在關(guān)聯(lián)14,而以CTCF (CCCTC binding factor)為代表的結(jié)構(gòu)蛋白在TAD邊界富集從而與染色質(zhì)的結(jié)構(gòu)聯(lián)系8,15,Bernardi等人發(fā)現(xiàn)GC含量等容區(qū)(isochore)的邊界與TAD邊界顯著重合16,因此與染色質(zhì)結(jié)構(gòu)緊密相關(guān)等。近年來“相分離”作為一種染色質(zhì)結(jié)構(gòu)形成的物理機(jī)制受到了廣泛關(guān)注,然而已有的相分離模型更多關(guān)注轉(zhuǎn)錄機(jī)器等蛋白復(fù)合物的結(jié)合對局域結(jié)構(gòu)的影響,很少能體現(xiàn)DNA序列不均一性在其中的作用。序列不均一性作為最基本的性質(zhì)之一,其在染色質(zhì)結(jié)構(gòu)形成中的作用,即不同細(xì)胞狀態(tài)中多變的染色質(zhì)結(jié)構(gòu)形成過程對序列依賴的程度和方式,亟待開展研究。

        本文系統(tǒng)綜述了基于序列的染色質(zhì)相分離模型的研究進(jìn)展,著重介紹了在該模型框架下對不同生命過程、不同物種的分析與解釋,以及相分離可能的物理機(jī)制。

        2 染色質(zhì)模型研究進(jìn)展

        借助Hi-C等實(shí)驗(yàn)數(shù)據(jù)構(gòu)建染色質(zhì)結(jié)構(gòu)、理解其形成機(jī)制,是研究者們關(guān)心的一類重要問題。目前對不同物種的染色質(zhì)建模工作已經(jīng)取得了一些進(jìn)展,如對酵母與果蠅的全染色質(zhì)建模可以驗(yàn)證端粒與著絲粒的聚集及其對染色質(zhì)的束縛效果2,17。酵母染色質(zhì)的行為相對簡單,其長度較短且固定在紡錘極體上,由簡單物理定律就可以較好描述18,且可以通過高分子模擬重構(gòu)出其間期的核區(qū)結(jié)構(gòu)18,19。通過構(gòu)建果蠅由表觀遺傳性質(zhì)不同的區(qū)段構(gòu)成的嵌段共聚高分子模型,可以較好地重復(fù)數(shù)個(gè)Mb尺度的Hi-C接觸模式,且能夠?qū)AD的形成與相圖上的多穩(wěn)態(tài)區(qū)對應(yīng)20。

        染色質(zhì)結(jié)構(gòu)模型可以完全基于機(jī)器學(xué)習(xí)等計(jì)算工具與方法,重復(fù)結(jié)構(gòu)的一部分特性,也可以通過建立物理模型,對其結(jié)構(gòu)形成機(jī)理進(jìn)行探究。應(yīng)用細(xì)胞的表觀遺傳等特性可以一定程度上對結(jié)構(gòu)性質(zhì)進(jìn)行預(yù)測,除了Filion等人借助蛋白結(jié)合等數(shù)據(jù)定義果蠅的主要染色質(zhì)狀態(tài)21外,組蛋白修飾、染色質(zhì)可及性、RNA-seq等多組學(xué)數(shù)據(jù)可以用于共同預(yù)測染色質(zhì)的TAD內(nèi)相互作用,且與啟動(dòng)子、增強(qiáng)子序列元件的接觸有關(guān)22;有研究者認(rèn)為TAD邊界與“核心”相互作用位點(diǎn)(chromatin interaction hubs)僅依賴組蛋白信息就可以進(jìn)行預(yù)測23;去除CpG島后的低分辨率甲基化數(shù)據(jù)的長程相關(guān)性信息能夠較好預(yù)測區(qū)室A、B24。

        三維結(jié)構(gòu)模型的構(gòu)建可以幫助人們理解染色質(zhì)結(jié)構(gòu)形成的物理機(jī)制。研究者可以用高分子模型模擬染色質(zhì)結(jié)構(gòu),比較分形球等模型的優(yōu)劣6,25。針對細(xì)菌擬核所提出的概念性的“智能高分子”模型認(rèn)為該結(jié)構(gòu)能夠使染色質(zhì)對溫度、pH等外界條件的細(xì)微變化作出敏感的響應(yīng)26。通過視神經(jīng)細(xì)胞的染色質(zhì)結(jié)構(gòu)重建工作,人們對常染色質(zhì)、常規(guī)異染色質(zhì)和結(jié)構(gòu)性異染色質(zhì)三種不同類型區(qū)段間作用力進(jìn)行了系統(tǒng)研究,發(fā)現(xiàn)異染色質(zhì)可能是區(qū)室化的驅(qū)動(dòng)力27。Di Pierro等人利用組蛋白修飾差異區(qū)域之間相互作用能不同的假設(shè),基于最大熵原理建立的三維結(jié)構(gòu)模型具有不同染色體間通用的勢函數(shù)28。Zhang等人對染色質(zhì)結(jié)構(gòu)的能量景觀與相圖進(jìn)行了構(gòu)建,研究了其液晶相態(tài)與手性變化,并認(rèn)為染色質(zhì)的構(gòu)象形成過程可能由非平衡玻璃態(tài)的動(dòng)態(tài)學(xué)與動(dòng)力學(xué)控制29。這些模型探討了表觀遺傳等局域性質(zhì)差異對染色質(zhì)結(jié)構(gòu)的影響、以及染色質(zhì)的熱力學(xué)與動(dòng)力學(xué)。

        Hi-C接觸數(shù)據(jù)可以被直接用于建立符合接觸概率約束的染色質(zhì)結(jié)構(gòu)模型30。該方法通過計(jì)算不同序列距離下的平均接觸強(qiáng)度得到接觸強(qiáng)度與序列距離的一一對應(yīng),并假設(shè)序列距離與空間距離滿足立方冪次關(guān)系,由此可以得到建立空間距離與接觸強(qiáng)度之間的對應(yīng)關(guān)系,并將任意兩個(gè)單元間的Hi-C接觸強(qiáng)度轉(zhuǎn)化為兩點(diǎn)間的空間距離約束。為了減少遠(yuǎn)程數(shù)據(jù)噪音的影響,增強(qiáng)方法的魯棒性,該方法需要對遠(yuǎn)程接觸強(qiáng)度進(jìn)行粗?;幚怼?yīng)用這個(gè)方法構(gòu)建的染色質(zhì)結(jié)構(gòu)模型能夠較好滿足約束,具有不打結(jié)的特性,且能夠較好地重現(xiàn)Hi-C接觸矩陣。將多種性質(zhì)投影到該建模結(jié)構(gòu)上,我們發(fā)現(xiàn)DNase超敏位點(diǎn)、RNA聚合酶(Pol II)結(jié)合位點(diǎn)等多種生物特性均在三維空間中聚集;區(qū)室A/B在三維空間中分離,且染色質(zhì)環(huán)的尺寸與其聚集程度和在核內(nèi)的分布有關(guān),較大、較小的染色質(zhì)環(huán)傾向于分別聚集;大尺寸的局域TAD結(jié)構(gòu)更多位于區(qū)室B,更傾向于位于核膜一側(cè),并與核膜結(jié)合核纖層關(guān)聯(lián)域有關(guān)。總的來講,在這個(gè)模型中結(jié)構(gòu)與表觀遺傳性質(zhì)不同的區(qū)域均傾向于在空間內(nèi)分別聚集。

        由于染色質(zhì)具有較高的核內(nèi)體積占比,我們可以將染色質(zhì)結(jié)構(gòu)看作粗?;瘑卧奂w并用分子擁擠(molecular crowding)模型對它進(jìn)行描述31,32。分子擁擠效應(yīng)傳統(tǒng)上指有限體積內(nèi)較高大分子濃度對體系自由能以及多種動(dòng)力學(xué)性質(zhì)的影響,狹義來說這些大分子應(yīng)當(dāng)是功能無關(guān)且可溶的33。對物種和相互作用都較為簡單的模型體系,其物理化學(xué)性質(zhì)借助理論、體外實(shí)驗(yàn)或模擬已經(jīng)得到了較多研究34-37,主要表現(xiàn)為擴(kuò)散的減慢、大分子較大的體積分?jǐn)?shù)帶來的體積排阻(volume exclusion)效應(yīng)、以及生化反應(yīng)自由能和速率的改變18。值得注意的是,大分子濃度和物種數(shù)的變化對體系擁擠效應(yīng)的影響都具有非線性特征38-41,而復(fù)雜體內(nèi)環(huán)境使得實(shí)驗(yàn)中惰性探針的選擇較為困難,因而目前對核內(nèi)環(huán)境分子擁擠效應(yīng)的實(shí)驗(yàn)和模擬依然是較有挑戰(zhàn)性的問題。Bancaud等人42用惰性熒光探針對活體細(xì)胞的擴(kuò)散行為進(jìn)行探測,認(rèn)為擁擠效應(yīng)導(dǎo)致的動(dòng)力學(xué)與分型模型一致,且異染色質(zhì)與常染色質(zhì)的分形結(jié)構(gòu)不同。Kim等人用不同擁擠條件下的隨機(jī)環(huán)高分子的結(jié)構(gòu)變化來模擬環(huán)境變化對染色質(zhì)結(jié)構(gòu)的影響,發(fā)現(xiàn)高分子的壓縮程度隨體積分?jǐn)?shù)的變化存在極大值43;Wu等人的實(shí)驗(yàn)與分子動(dòng)力學(xué)模擬也表明細(xì)胞尺寸對染色質(zhì)的大小和位置都起著重要作用44。Walter等人則認(rèn)為染色質(zhì)自身的分子擁擠特性不論對異染色質(zhì)的形成或維持都不必要45,其在擁擠介質(zhì)中的高分子性質(zhì)更可能是導(dǎo)致不同區(qū)室出現(xiàn)的驅(qū)動(dòng)力18。

        染色質(zhì)的“相分離”模型是近年來受到較多關(guān)注的一類生物物理模型。早期一些研究者利用高分子模型對多親分子與轉(zhuǎn)錄對染色質(zhì)共定位的作用進(jìn)行過討論,例如兩種基于高分子排空力(depletion force)的熵驅(qū)動(dòng)模型均指出共轉(zhuǎn)錄可以導(dǎo)致共定位現(xiàn)象46,47;研究者認(rèn)為包括轉(zhuǎn)錄因子、非編碼RNA等因子在內(nèi)的多親性分子組裝體(multivalent molecule assembly)在其中可能起到了橋聯(lián)作用47-49。近年來對染色質(zhì)相分離機(jī)制的討論更多基于一些實(shí)驗(yàn)觀察。比較具有代表性的是對異染色質(zhì)結(jié)構(gòu)蛋白HP1與異染色質(zhì)分相行為的研究:人類的HP1a蛋白具有可溶性,但其發(fā)生N端磷酸化或與DNA結(jié)合后會形成與水相分離的液滴50;果蠅的HP1a蛋白在體外實(shí)驗(yàn)中表現(xiàn)出液-液分離,且在體內(nèi)可以聚集形成液滴;異染色質(zhì)區(qū)域的動(dòng)力學(xué)與液體分相行為相似51。這些觀察促使人們提出異染色質(zhì)的形成可能由液-液分相介導(dǎo),最近的模擬工作也表明異染色質(zhì)間相互作用可能對視神經(jīng)細(xì)胞中染色質(zhì)結(jié)構(gòu)的形成起到重要作用27。另一類較具有代表性的工作關(guān)注了轉(zhuǎn)錄活躍區(qū)域的相分離,轉(zhuǎn)錄活躍區(qū)可以發(fā)生空間聚集,研究者認(rèn)為多種轉(zhuǎn)錄因子的結(jié)合可能與染色質(zhì)環(huán)等局域結(jié)構(gòu)形成有關(guān)52,53。

        人們提出的染色質(zhì)相分離模型通常需要結(jié)合因子的輔助,根據(jù)結(jié)合因子作用的不同,可以將這些模型大致分為兩類54,一類是高分子-高分子相分離(polymer-polymer phase separation,PPPS),另一類是液-液相分離(liquid-liquid phase separation,LLPS)。第一類模型中,結(jié)合因子間不需要存在相互作用,它們與DNA的結(jié)合可以實(shí)現(xiàn)結(jié)合片段間的空間聚集,因而起到橋聯(lián)作用,與不同橋聯(lián)因子相互作用的區(qū)域之間可發(fā)生相分離。空間限域作用與體積排空力更多被認(rèn)為是這類模型的驅(qū)動(dòng)力,如CTCF與黏連蛋白(cohesin)介導(dǎo)的環(huán)推擠模型55-57,僅由CTCF結(jié)合位點(diǎn)就可以建模重現(xiàn)較多Hi-C實(shí)驗(yàn)結(jié)果56,57;轉(zhuǎn)錄因子YY1也被認(rèn)為可能介導(dǎo)染色質(zhì)調(diào)控網(wǎng)絡(luò)建立58。另一類模型LLPS通常要求結(jié)合因子的多親性,依賴于多親分子間、以及多親分子和染色質(zhì)間的靜電吸引等相互作用。這些多親蛋白本身就可以發(fā)生聚集,且這種聚集常常與包含內(nèi)稟無規(guī)區(qū)(intrinsically disordered region,IDR)的因子有關(guān)59,60。以O(shè)CT4-MED1體系為例52,OCT4轉(zhuǎn)錄因子在體外環(huán)境下不會自發(fā)形成液滴,但加入MED1的內(nèi)稟無規(guī)區(qū)后可以自發(fā)形成大小在微米量級的OCT4-MED1-IDR液滴,其他多種轉(zhuǎn)錄因子也可以在MED1-IDR介導(dǎo)下形成液滴,進(jìn)而將基因激活與相分離關(guān)聯(lián)。但需要注意的是,染色質(zhì)的相分離未必僅僅由上述兩種簡單機(jī)制之一介導(dǎo),如HP1既具有和H3K9me3組蛋白修飾區(qū)域特異性結(jié)合的能力,又能夠在體外環(huán)境下直接(在果蠅中)或與DNA結(jié)合后(在人類中)發(fā)生液-液相分離,其行為不能由上述任何單一模型完全描述。

        先前人們提出的相分離模型均主要關(guān)注蛋白的結(jié)合能力或序列的表觀遺傳特性,較大程度忽略了DNA自身性質(zhì)沿序列的差異分布,即序列本身作為“嵌段高分子”的性質(zhì)對相分離過程的直接影響。已有的相分離模型可以幫助我們重建特定約束下的染色質(zhì)結(jié)構(gòu)或解釋特定細(xì)胞狀態(tài)下的染色質(zhì)行為,而序列特性的引入則能夠在統(tǒng)一框架下理解不同過程中的染色質(zhì)結(jié)構(gòu)變化及其驅(qū)動(dòng)力。

        3 序列不均一性與基于序列的染色質(zhì)性質(zhì)差異

        哺乳動(dòng)物的基因組包含大量非編碼區(qū),其序列具有多個(gè)層級的不均一分布的特性,而染色質(zhì)組裝同樣是分層實(shí)現(xiàn)的。這種序列特征如何影響染色質(zhì)三維結(jié)構(gòu)是一個(gè)復(fù)雜且具有挑戰(zhàn)性的問題。DNA包含腺嘌呤(A,adenine)、胸腺嘧啶(T,thymine)、胞嘧啶(C,cytosine)、鳥嘌呤(G,guanine)四種堿基,其中A-T、C-G兩兩配對。前人根據(jù)GC堿基含量沿序列的不同,將其劃分為內(nèi)部GC含量相對均一、區(qū)域間GC含量不同的等容區(qū)61,62。等容區(qū)邊界不僅與TAD存在對應(yīng),而且低GC含量區(qū)與核纖層關(guān)聯(lián)域有關(guān)16。這種不均一性可以被高頻短序列的出現(xiàn)放大,如對AT含量為60%和AT含量為40%的序列,雖然AT單堿基含量僅相差0.5倍,ATATA隨機(jī)出現(xiàn)的頻率可以相差6.6倍之多63。借助這些短序列的識別蛋白,原本微小的差異可以被放大而影響結(jié)構(gòu)。GC含量漲落的基礎(chǔ)上,CpG二核苷酸沿序列的分布也具有不均一性,可以一維特異性聚集形成CpG島(CpG island,CGI),并與基因調(diào)控密切相關(guān),例如位于基因啟動(dòng)子(promoter)區(qū)域的CGI高甲基化與基因沉默關(guān)聯(lián),并通過多梳蛋白復(fù)合物與轉(zhuǎn)錄因子的結(jié)合起到調(diào)控作用64。

        與DNA序列組成的不均一性對應(yīng)的是,DNA序列具有顯著的長程相關(guān),且其自相關(guān)性在數(shù)十kb尺度上表現(xiàn)為冪次衰減,這一特征尺度恰好與基因和染色質(zhì)環(huán)較為匹配11,65。冪次定律通常意味著尺寸不變性,其成因可能是多種多樣的66,如復(fù)制-變異模型(duplication-mutation)基于堿基隨機(jī)變異與復(fù)制/刪除隨時(shí)間的累積,可以得到長度分布服從冪次衰減的不同性質(zhì)的序列區(qū)域,從進(jìn)化的角度解釋DNA序列的冪次定律67;Azbel用Ising模型來理解DNA中核酸序列的可能關(guān)聯(lián)68-70。長程關(guān)聯(lián)性的另一個(gè)典型例子則是相變點(diǎn)附近的臨界現(xiàn)象,在臨界溫度附近漲落的關(guān)聯(lián)長度滿足冪次定律

        式中ξ為關(guān)聯(lián)長度,Tc為臨界溫度,vc為所滿足的冪次。從而溫度越靠近相變點(diǎn),結(jié)構(gòu)越能夠表現(xiàn)出長程相關(guān)性。序列與結(jié)構(gòu)中均存在的多層級特征和長程相關(guān)性暗示著對序列特性的研究可能是理解染色質(zhì)結(jié)構(gòu)形成機(jī)制的一個(gè)重要入口。1993年,Grosberg等人就曾提出DNA序列的長程相關(guān)性與其三維結(jié)構(gòu)存在關(guān)聯(lián)71。

        從CGI分布的不均一性出發(fā),我們基于相鄰CGI距離分布與隨機(jī)分布的差異,將序列進(jìn)一步劃分為具有高CGI密度的CGI森林區(qū)域和低CGI密度的CGI草原區(qū)域72。在隨機(jī)情形下,將DNA序列等效為時(shí)間序列,則CGI的出現(xiàn)是一個(gè)泊松過程,相鄰CGI的距離分布應(yīng)當(dāng)服從泊松過程的首達(dá)時(shí)分布

        其中p(r)為相鄰距離為r時(shí)的概率密度,α為常數(shù)。以此為依據(jù),將CGI的實(shí)際相鄰距離分布與該隨機(jī)分布比較,注意到二者主要有兩個(gè)標(biāo)志性交點(diǎn),在第一個(gè)交點(diǎn)前與第二個(gè)交點(diǎn)后實(shí)際分布密度均高于隨機(jī)。這說明實(shí)際序列的CGI分布相對隨機(jī)存在特異性聚集,從而第一個(gè)交點(diǎn)前的聚集對應(yīng)CGI簇內(nèi)相鄰距離,第二個(gè)交點(diǎn)后對應(yīng)CGI簇間最近距離。因此我們選取第二個(gè)交點(diǎn)位置作為該序列的特征距離,根據(jù)相鄰CGI距離劃分出了CGI富集的森林與貧乏的草原區(qū)域。

        基于DNA序列、甲基化、染色質(zhì)三維結(jié)構(gòu)、結(jié)構(gòu)與轉(zhuǎn)錄因子結(jié)合、組蛋白占據(jù)與修飾和基因表達(dá)量等數(shù)據(jù)的整合分析72表明,CGI“森林”和CGI“草原”兩種區(qū)域的基因密度、功能、表達(dá)、表觀遺傳等特性均表現(xiàn)出不同(表1、圖1)。森林區(qū)域的基因密度、尤其是管家基因密度更高,平均表達(dá)水平也高于草原區(qū)域。二者的基因功能也表現(xiàn)出不同,草原區(qū)域雖然基因密度低,但位于該區(qū)域的管家基因相對森林區(qū)域特異性地富集染色質(zhì)結(jié)構(gòu)重塑、DNA損傷修復(fù)、p53通路、氧化壓力響應(yīng)等功能,其中部分功能直接與染色質(zhì)結(jié)構(gòu)相關(guān)。與森林區(qū)域更高的基因密度和基因表達(dá)水平相對應(yīng),這些區(qū)域富集激活性表觀遺傳修飾,如H3K4me1、H3K4me3,同時(shí)它們的染色質(zhì)更為可及,更容易結(jié)合與轉(zhuǎn)錄密切相關(guān)的Pol II蛋白;相比之下,草原區(qū)域不僅基因密度和表達(dá)水平較低,染色質(zhì)也更不可及,相對更多包含結(jié)構(gòu)性異染色質(zhì)標(biāo)記H3K9me3,甲基化的更強(qiáng)的周期性分布間接暗示草原區(qū)域的DNA纏繞更為規(guī)整。二者一定程度上分別構(gòu)成了常染色質(zhì)與異染色質(zhì)的序列基礎(chǔ)。

        4 不同生命過程中基于序列的分相-混相平衡

        在發(fā)育與分化、乃至疾病與衰老過程中,由幾乎完全一致的基因組能夠得到不同的基因表達(dá)與表觀遺傳譜,因此理解基因組如何影響表觀遺傳,組織與細(xì)胞特異的基因表達(dá)如何在發(fā)育與分化中不斷建立并在衰老中改變等問題是十分重要的。CGI森林與草原區(qū)域的劃分為在統(tǒng)一框架下理解序列與不同生命過程中染色質(zhì)結(jié)構(gòu)變化的關(guān)系提供了支持,這兩種兆堿基尺度的元件在不同的細(xì)胞類型表現(xiàn)出不同程度的空間分離(圖2),“森林”和“草原”在發(fā)育、分化和衰老過程中逐漸分離,同時(shí)多尺度的森林-草原空間糾纏具有明顯細(xì)胞類型特異性,而且在分化中增強(qiáng),從而輔助細(xì)胞身份的確立72。

        表1 CGI森林與草原區(qū)域的性質(zhì)差異Table 1 Differences between forest and prairie domains in sequential and epigenetic properties.

        圖1 CGI森林與草原區(qū)域的性質(zhì)截然不同。(a) CGI、基因、組蛋白修飾、Pol II結(jié)合位點(diǎn)和DNase超敏感區(qū)位點(diǎn)沿序列的分布;(b)森林與草原區(qū)域的基因表達(dá)水平;(c)二者的結(jié)構(gòu)性質(zhì)差異。圖1(b,c)改編自已發(fā)表工作72,出版商為Oxford University PressFig.1 Forest and prairie domains are distinct in properties.(a) IGV snapshot showing the distribution of CGI,housekeeping genes, histone marks, Pol II, and DHS distribution along the genome, (b) average gene expression levels in forest and prairie domains, (c) structural properties for forest and prairie domains.Fig.1b,c were adopted from published work72 with Oxford University Press as the original publisher.

        CGI森林與草原區(qū)域在早期胚胎發(fā)育中整體上表現(xiàn)出系統(tǒng)性的空間分離,伴隨著區(qū)域內(nèi)相互作用減少與長程相互作用建立,這與該過程中區(qū)室與TAD等高級結(jié)構(gòu)的建立73-76對應(yīng)。但是在兩個(gè)特殊的時(shí)間節(jié)點(diǎn)—合子基因組激活(zygotic gene activation,ZGA)和著床期(implantation),則表現(xiàn)出兩種性質(zhì)序列區(qū)域的混合77。細(xì)胞的分化伴隨著異染色質(zhì)的積累。早期胚胎與多能性細(xì)胞表觀遺傳序列差異較小,異染色質(zhì)占比較低73,74,78,79。隨著分化進(jìn)行,同種類型和不同類型區(qū)域間的遠(yuǎn)程相互作用均增加,但同種類型的區(qū)域間相互作用增加更為明顯,該現(xiàn)象在低CGI密度的草原區(qū)域尤為顯著。對小鼠重編程樣本,隨著樣本分化程度提高,中遠(yuǎn)程的區(qū)域間相互作用在多個(gè)尺度下均有明顯增加,且對低CGI密度區(qū)的同類型相互作用這一效應(yīng)最為明顯。分化過程同時(shí)伴隨著區(qū)室B占比的增加,與異染色質(zhì)累積78,79和抑制性組蛋白修飾覆蓋區(qū)域在分化中增加80,81的現(xiàn)象相對應(yīng)。在小鼠神經(jīng)發(fā)育中,區(qū)室B內(nèi)部相互作用增加82,也與主要構(gòu)成區(qū)室B的草原區(qū)域間相互作用的增加對應(yīng)。在區(qū)域尺度上高、低CGI密度區(qū)進(jìn)一步趨于空間分離,這一過程由非特異性相互作用驅(qū)動(dòng)。伴隨著結(jié)構(gòu)分相的加強(qiáng),兩種區(qū)域的甲基化修飾等穩(wěn)定表觀遺傳性質(zhì)的差異也更為顯著,表觀遺傳性質(zhì)的差異程度也可以作為結(jié)構(gòu)變化的一個(gè)反映。

        除區(qū)域尺度的森林-草原分離,分化過程還伴隨著多個(gè)尺度的森林-草原特異性混合,這種混相行為影響基因表達(dá),能夠有效解釋組織特異性的調(diào)控機(jī)制72。在以40 kb為單元的較小尺度上,隨著分化程度的增加,森林與草原趨向于具有更強(qiáng)的混合,且基因三維局域環(huán)境的森林或草原占比影響表達(dá),處于草原環(huán)境的基因平均表達(dá)水平更低。序列與局域環(huán)境特性相反的“逆轉(zhuǎn)區(qū)域”(處于低GC含量環(huán)境的高CGI密度的序列,或者相反)則特異性富集免疫與炎癥相關(guān)的基因,暗示這些基因能夠被更為靈活地調(diào)控,與它們的功能對應(yīng)。這種調(diào)控能力根植于它們所處的序列位置,具有序列基礎(chǔ)。對組織類型特異的逆轉(zhuǎn)草原區(qū)域,即特異性地處于相對轉(zhuǎn)錄活躍的高CGI密度環(huán)境的草原,其基因功能與細(xì)胞類型有關(guān),反映了局域環(huán)境對序列區(qū)域的特異性激活,是局域結(jié)構(gòu)-功能關(guān)系的有效體現(xiàn)。在更大的尺度上,森林與草原區(qū)域在區(qū)室A/B的分配也與細(xì)胞類型相關(guān),隨著分化進(jìn)行,位于轉(zhuǎn)錄活躍的區(qū)室A的草原基因表達(dá)量升高最為顯著,且這部分基因與分化細(xì)胞的類型密切相關(guān)。由于草原區(qū)域的基因表達(dá)水平在不同細(xì)胞類型間的差異相對森林區(qū)域更大,草原區(qū)域的基因可能更具有在不同細(xì)胞類型中被特異性調(diào)控的潛力。

        多種證據(jù)表明分相程度增強(qiáng)的趨勢在衰老過程中得以持續(xù),與之相伴的是低GC含量區(qū)局域相互作用的丟失83,相對于區(qū)域間相互作用,低CGI密度區(qū)域的區(qū)域內(nèi)相互作用進(jìn)一步減少,結(jié)構(gòu)性異染色質(zhì)和H3K9me3抑制性修飾空間聚集83,84,草原相對森林更加分離。

        圖2 不同細(xì)胞狀態(tài)的染色質(zhì)分相情況。(a)早期胚胎或多能性樣本;(b)分化體細(xì)胞,其不同序列性質(zhì)的區(qū)域既整體相互分離,又發(fā)生功能特異的混合;(c)衰老細(xì)胞,其草原區(qū)域間相互作用進(jìn)一步增強(qiáng);(d)增殖細(xì)胞,與普通細(xì)胞相比,森林-草原更為分相,且伴隨著隔間B的累積。本圖片改編自已發(fā)表工作72,出版商為Oxford University PressFig.2 A schematic picture of the forest-prairie phase separation in different cell types.(a) early embryonic or pluripotent cells, (b) differentiated somatic cells, in which regions with different sequential properties tend to segregate from each other although accompanied by tissue/cell specific mixing; (c) senescent cells, in which inter-prairie region interactions enhance compared to growing samples; (d) proliferating cells, which have more segregated chromatin structure than normal samples and have compartment B accumulated.This figure was adopted from published work72 with Oxford University Press as the original publisher.

        對不斷增殖的樣本如肝臟與細(xì)胞系,它們的森林-草原區(qū)域間相互作用較弱、草原-草原間相互作用的提高在中長程尤為明顯,意味著更多同類型DNA長程相互作用的建立。同時(shí),草原與森林區(qū)域分離也更明顯,而較大的森林-草原甲基化差異表明表觀遺傳的差異程度與序列差異在增殖樣本中較為一致。與衰老體系不同的是,增殖細(xì)胞的染色質(zhì)結(jié)構(gòu)近距離相互作用增強(qiáng),暗示著其染色質(zhì)結(jié)構(gòu)表現(xiàn)出局域作用增強(qiáng)的趨勢。

        實(shí)體瘤樣本與不斷增殖的細(xì)胞樣本的表觀遺傳特性相似,相對正常體細(xì)胞,二者均具有更強(qiáng)的甲基化序列差異。對實(shí)體瘤的染色質(zhì)結(jié)構(gòu)和可及性、DNA甲基化與組蛋白修飾數(shù)據(jù)的聯(lián)合分析表明,相比正常細(xì)胞,癌細(xì)胞的染色質(zhì)中森林-草原分相程度提高,區(qū)室B增加,森林與草原區(qū)域的甲基化差異與表達(dá)量差異也在癌變過程中升高,這一點(diǎn)也暗示著分相程度的增強(qiáng)。癌變過程的相分離更為明顯,可能與該過程中組織特異性的減弱乃至消失相關(guān)。相應(yīng)地衰老過程中細(xì)胞特異性得以維持,可能達(dá)到與組織類型有關(guān)的染色質(zhì)結(jié)構(gòu)的局域穩(wěn)態(tài),且由于衰老過程特異的異染色質(zhì)聚集,亞穩(wěn)態(tài)的形成可能阻止全局穩(wěn)態(tài)的實(shí)現(xiàn)。對癌變過程染色質(zhì)結(jié)構(gòu)變化、構(gòu)效關(guān)系與表觀遺傳的研究可能為我們理解和治療癌癥提供新的思路。

        森林-草原序列區(qū)域在不同過程中既有區(qū)域間分相的不斷加強(qiáng),又有細(xì)胞或組織類型特異的不同類型DNA序列的混合(圖2),產(chǎn)生這些變化的原因既包含熱力學(xué)驅(qū)動(dòng)力,又有動(dòng)力學(xué)的擾動(dòng)?;趯θ旧|(zhì)序列特征和三維結(jié)構(gòu)的觀察,我們猜測在分化與衰老過程中熱力學(xué)穩(wěn)定性增強(qiáng),染色質(zhì)結(jié)構(gòu)逆轉(zhuǎn)較為困難,這是誘導(dǎo)重編程過程需要ATP輔助染色質(zhì)重塑因子的幫助85-87的一個(gè)可能原因。而在有性生殖過程中,已分化的配子的染色質(zhì)結(jié)構(gòu)進(jìn)行重組73,74,76,所產(chǎn)生的早期胚胎細(xì)胞的染色質(zhì)回到CGI森林-草原表觀遺傳性質(zhì)差異較小且結(jié)構(gòu)上相對混合的狀態(tài)。對處于特定狀態(tài)的細(xì)胞,分相-混相行為的平衡對于染色質(zhì)結(jié)構(gòu)的穩(wěn)定和細(xì)胞身份的維持有重要意義,影響相分離的物理因素可能影響染色質(zhì)結(jié)構(gòu),進(jìn)而與細(xì)胞的分化、疾病狀態(tài)等存在關(guān)聯(lián)。

        5 相分離模型的可能驅(qū)動(dòng)力與物理影響因素

        5.1 相分離的可能驅(qū)動(dòng)力

        在不同的細(xì)胞類型中,CGI森林和草原區(qū)域表現(xiàn)出了程度不同但普遍存在的空間分離,相同序列距離下,不同類型區(qū)域間的相互作用幾乎總?cè)跤谕N類型區(qū)域間相互作用。這兩種高-低CGI密度區(qū)的空間相分離行為體現(xiàn)了常染色質(zhì)-異染色質(zhì)分相的序列基礎(chǔ)。已有的相分離模型更多基于對結(jié)合蛋白和表觀遺傳狀態(tài)的觀察,但實(shí)際上,CTCF與黏連蛋白對TAD的形成既非充分也非必要11,88,結(jié)合蛋白在TAD與區(qū)室消失又重建的有絲分裂過程中被大量剝離89-93,細(xì)胞衰老中的表觀遺傳重塑與染色質(zhì)結(jié)構(gòu)變化可能相對獨(dú)立84,這都表明結(jié)合蛋白與表觀遺傳因素對染色質(zhì)結(jié)構(gòu)形成與維持的影響需要被更為慎重地考慮。小到TAD、大到染色質(zhì)域的保守性,都暗示著更加內(nèi)在的結(jié)構(gòu)決定因素。

        CGI森林-草原序列的不同確實(shí)為其結(jié)構(gòu)差異提供了基礎(chǔ),森林與草原分別主要由type A與type B30兩種結(jié)構(gòu)元件構(gòu)成,且其邊界與TAD和區(qū)室邊界均顯著重合72,可見該序列劃分較好分隔了不同結(jié)構(gòu)特征。由于DNA序列帶負(fù)電,而組蛋白帶正電,草原規(guī)整、高密度的組蛋白纏繞意味著區(qū)域內(nèi)的電性能夠被更好地中和,因此我們推斷這些區(qū)域相對更為疏水,從而在合適的溫度與濃度下,草原區(qū)域傾向于發(fā)生相對森林區(qū)域的疏水分離。這種分段鑲嵌式的序列可能為染色質(zhì)的形成提供基本的驅(qū)動(dòng)力。除Hi-C實(shí)驗(yàn)結(jié)果與分析外,熒光原位雜交(Fluorescence in situ hybridization,F(xiàn)ISH)等其他染色質(zhì)結(jié)構(gòu)探測方法與體外實(shí)驗(yàn)的結(jié)果也支持這一推測。如莊小威實(shí)驗(yàn)室對轉(zhuǎn)錄活躍區(qū)、惰性區(qū)、多梳蛋白結(jié)合區(qū)三種染色質(zhì)的FISH實(shí)驗(yàn)表明14這三種染色質(zhì)不僅三維結(jié)構(gòu)不同,而且多梳蛋白抑制區(qū)空間上更傾向于排除周圍的活躍染色質(zhì),這一實(shí)驗(yàn)雖然是從表觀特性的角度出發(fā),其結(jié)果與草原序列和轉(zhuǎn)錄活躍的森林區(qū)域的結(jié)構(gòu)差異和空間分離一致。草原序列相對森林的疏水分離與從蛋白角度觀察到的異染色質(zhì)標(biāo)志蛋白HP1α在體外環(huán)境下的液-液相分離一致50,51,也與近期對異染色質(zhì)相分離的實(shí)驗(yàn)觀察和基于異染色質(zhì)表觀特征得到的分相更多由異染色質(zhì)相互作用主導(dǎo)的模擬結(jié)果一致27。

        除序列本身性質(zhì)的差異,轉(zhuǎn)錄因子、RNA等的結(jié)合與協(xié)同作用可能對染色質(zhì)結(jié)構(gòu)的形成造成調(diào)控和擾動(dòng)。結(jié)合因子對染色質(zhì)結(jié)構(gòu)可能具有不同的影響:廣譜的結(jié)合因子通過自加強(qiáng)的結(jié)合,預(yù)期會進(jìn)一步加強(qiáng)森林-草原的結(jié)構(gòu)差異,有利于二者分離,如HP1對草原區(qū)域的結(jié)合;另一方面,具有細(xì)胞/組織特異性的結(jié)合因子(如YY1)輔助細(xì)胞類型特異的調(diào)控網(wǎng)絡(luò)的建立,通過其結(jié)合將具有不同序列性質(zhì)的區(qū)域聚集起來,參與森林-草原間細(xì)胞類型特異的相互作用。如與胚胎干細(xì)胞多能性密切相關(guān)的OCT4轉(zhuǎn)錄因子52,該轉(zhuǎn)錄因子在多個(gè)關(guān)鍵的多能性基因的超級增強(qiáng)子區(qū)域聚集,且可以與和它共定位的媒介子(mediator)在體外形成相分離的液滴,暗示著該細(xì)胞類型特異轉(zhuǎn)錄因子可能的結(jié)構(gòu)調(diào)控作用。值得注意的是,媒介子不僅可以幫助OCT4發(fā)生液-液相分離,還可以幫助多種轉(zhuǎn)錄因子發(fā)生類液相沉積,并幫助維持細(xì)胞身份關(guān)鍵基因的表達(dá)52,94。該過程雖然可能較為動(dòng)態(tài),但細(xì)胞類型特異的轉(zhuǎn)錄相對穩(wěn)定,依然可能輔助細(xì)胞類型特異的相互作用的建立。

        除上述兩種相對穩(wěn)定的相分離或沉積過程外,多種蛋白和RNA的復(fù)合物還可能發(fā)生類液相沉積,這種液滴常與轉(zhuǎn)錄有關(guān),不僅尺寸較小,而且更為動(dòng)態(tài)。實(shí)驗(yàn)上發(fā)現(xiàn)RNA與轉(zhuǎn)錄因子共同介導(dǎo)轉(zhuǎn)錄活躍相從不活躍相的相分離53;外顯子和剪切事件更多的基因趨向于相互聚集82,同樣暗示了相似轉(zhuǎn)錄性質(zhì)區(qū)域的聚集可能由RNA與轉(zhuǎn)錄因子介導(dǎo)。人為控制的RNA大量轉(zhuǎn)錄能夠影響染色質(zhì)的局域結(jié)構(gòu),但這種影響非常動(dòng)態(tài),轉(zhuǎn)錄停止后可以迅速消失95,96。除RNA與轉(zhuǎn)錄因子,Pol II與染色質(zhì)結(jié)構(gòu)的形成也關(guān)系密切,65%的RNA聚合酶Pol II結(jié)合位點(diǎn)與染色質(zhì)環(huán)形成有關(guān),且部分Pol II位點(diǎn)傾向于聚集97,暗示著Pol II對轉(zhuǎn)錄活躍的局域相的動(dòng)態(tài)形成可能的貢獻(xiàn)。與轉(zhuǎn)錄尺度相匹配地,核小體精度的micro-C技術(shù)可以探測更加精細(xì)的染色質(zhì)結(jié)構(gòu)98,99,從而將基因的動(dòng)態(tài)調(diào)控與染色質(zhì)局域結(jié)構(gòu)變化關(guān)聯(lián)。該技術(shù)發(fā)現(xiàn)酵母染色質(zhì)中存在比TAD更小的microTAD結(jié)構(gòu),而Pol II協(xié)助的轉(zhuǎn)錄對染色質(zhì)結(jié)構(gòu)的調(diào)控作用顯著體現(xiàn)在基因尺度100,佐證了Pol II結(jié)構(gòu)調(diào)控的局域特性。從這個(gè)角度看,高CGI密度的森林區(qū)域與低CGI密度草原區(qū)域與轉(zhuǎn)錄復(fù)合物的非特異性結(jié)合能力差異可能使前者更多提供了具有激活性動(dòng)態(tài)調(diào)控潛質(zhì)的序列基礎(chǔ),從而二者在平均結(jié)構(gòu)行為上依然表現(xiàn)出穩(wěn)定差異與相互分離。轉(zhuǎn)錄因子密度也可能影響TAD的形成101。除實(shí)驗(yàn)觀察外,目前已經(jīng)有一些高分子模型探討了轉(zhuǎn)錄因子及其它可能的多親分子對染色質(zhì)空間相互作用的介導(dǎo)作用47-49,102。此外,管家基因有較小的基因調(diào)控網(wǎng)絡(luò),傾向于自反饋97,103,而世系特異的基因更依賴于長程相互作用,傾向于形成更復(fù)雜的調(diào)控網(wǎng)絡(luò)103,104,也暗示了細(xì)胞特異性因子在結(jié)構(gòu)調(diào)控中的作用。與之對應(yīng)的是,micro-C實(shí)驗(yàn)表明酵母的基因間相互作用更多發(fā)生在近程98,99,與其單細(xì)胞從而不具有細(xì)胞特異性的生物性質(zhì)一致。

        蛋白、RNA等分子與序列的結(jié)合往往與表觀遺傳修飾關(guān)聯(lián),但不同的表觀遺傳修飾與染色質(zhì)分相行為的耦合尺度可能存在差異。組蛋白的酰基化、磷酸化、泛素化等修飾對染色質(zhì)局部結(jié)構(gòu)的動(dòng)態(tài)調(diào)控有重要影響:組蛋白超乙?;赡芡ㄟ^增強(qiáng)電荷互斥造成高密度染色質(zhì)的解聚而使染色質(zhì)更為均一,并改變?nèi)旧|(zhì)的擁擠效應(yīng)105;磷酸化修飾與有絲分裂及其中的結(jié)構(gòu)變化密切相關(guān)106-108;泛素化修飾與轉(zhuǎn)錄密切相關(guān)109,和Pol II延展及轉(zhuǎn)錄延伸中的結(jié)構(gòu)重建均有關(guān)聯(lián)110,體外實(shí)驗(yàn)中111H2B的泛素化修飾不利于30 nm纖維的形成,且能夠提高其生化可及性,對纖維結(jié)構(gòu)造成影響。目前對這些修飾的研究更多集中在核小體或數(shù)個(gè)核小體的空間尺度上,對體內(nèi)更大尺度結(jié)構(gòu)影響的探討相對較少。值得注意的是,乙?;揎椩谟薪z分裂中被大量擦除89,112,磷酸化修飾直接與細(xì)胞周期有關(guān),而泛素化修飾與轉(zhuǎn)錄動(dòng)態(tài)調(diào)控相關(guān),這些修飾因而較為動(dòng)態(tài),更可能與空間、時(shí)間尺度較小的液-液相分離關(guān)聯(lián)。在細(xì)胞周期中組蛋白甲基化修飾則相對穩(wěn)定89,DNA甲基化的平均行為相對其他修飾有更強(qiáng)的細(xì)胞身份特異性,因而更可能與發(fā)育、分化、衰老等過程中同種細(xì)胞類型內(nèi)相對穩(wěn)定的分相-混相行為關(guān)聯(lián)。

        有絲分裂伴隨著TAD與區(qū)室結(jié)構(gòu)的消失與重建113,114。在這個(gè)過程中,除少數(shù)“書簽蛋白”與一些表觀遺傳修飾得以保留外,HP1、多梳蛋白等大量結(jié)構(gòu)蛋白從染色質(zhì)剝離,?;揎棌男蛄猩喜脸?9,112。但是,重建的染色質(zhì)不僅能夠重新結(jié)合這些蛋白和發(fā)生修飾,而且能夠維持相似的結(jié)構(gòu)特征,如轉(zhuǎn)錄活躍區(qū)的相對靠近6,115,因此在這個(gè)過程中,序列和序列依賴的表觀遺傳修飾可能在一定程度上指導(dǎo)了染色質(zhì)重建。隨著有絲分裂的不斷進(jìn)行,染色質(zhì)的結(jié)構(gòu)調(diào)整以及表觀遺傳和轉(zhuǎn)錄因子等的剝離與重新發(fā)生或結(jié)合類似重復(fù)退火過程,使表觀遺傳特征逐漸趨于和序列特征一致,而表觀遺傳特征又能加強(qiáng)不同序列區(qū)的物理差異,從而有利于森林-草原區(qū)域的進(jìn)一步分離,形成了正反饋。因此染色質(zhì)相分離可能借助重復(fù)進(jìn)行的有絲分裂實(shí)現(xiàn)和增強(qiáng)。

        染色質(zhì)的相分離過程由熱力學(xué)因素與動(dòng)力學(xué)因素共同介導(dǎo),是趨向基于序列差異的熱力學(xué)穩(wěn)定態(tài)和轉(zhuǎn)錄因子、能量驅(qū)動(dòng)的結(jié)構(gòu)重整酶等生物分子提供的動(dòng)力學(xué)微擾共同作用的結(jié)果。我們提出一維馬賽克序列在三維空間的相分離可能是染色質(zhì)組裝和大規(guī)模沉默的一個(gè)潛在驅(qū)動(dòng)力,這一驅(qū)動(dòng)力與細(xì)胞類型特異的表觀遺傳修飾與轉(zhuǎn)錄因子共同塑造了不同細(xì)胞類型中的染色質(zhì)結(jié)構(gòu)。在更小的時(shí)空尺度上,動(dòng)態(tài)的表觀遺傳修飾與RNA、TF、Pol II等結(jié)合因子可能共同調(diào)控染色質(zhì)的局域相分離,而森林與草原區(qū)域的序列差異帶來了其動(dòng)態(tài)調(diào)控潛力的差別,從而表現(xiàn)出平均行為的差異。

        5.2 物理因素對結(jié)構(gòu)的可能影響

        對具有幾乎完全相同序列的不同器官,所處環(huán)境的區(qū)別可能與其不同的染色質(zhì)分相能力有關(guān)。肝臟染色質(zhì)的區(qū)域內(nèi)相互作用更強(qiáng),其草原-草原區(qū)域間相互作用在中長程上明顯較高,三維結(jié)構(gòu)模型也表現(xiàn)出較強(qiáng)的森林-草原區(qū)域分離。此外,肝臟樣本染色質(zhì)區(qū)域間具有較大的甲基化水平差異,且其甲基化自相關(guān)函數(shù)表現(xiàn)出相對其它體細(xì)胞樣本顯著更強(qiáng)的長程相關(guān)72,意味著其表觀遺傳特性更好地遵從序列差異。與肝臟形成對比的是,大腦皮質(zhì)染色質(zhì)結(jié)構(gòu)較為松散,森林和草原兩相混雜。腦的森林-草原甲基化水平差異小,且甲基化自關(guān)聯(lián)衰減較其他體細(xì)胞更快116,結(jié)構(gòu)和表觀遺傳特征都表明它是一個(gè)更為混相的體系。

        我們注意到肝臟是人體溫度最高的器官117,而腦的溫度較低,二者結(jié)構(gòu)的差異可能與森林-草原的疏水分相作為一個(gè)熵驅(qū)動(dòng)過程、升溫有利于相分離加強(qiáng)有關(guān)。這些現(xiàn)象的因果關(guān)系值得進(jìn)一步研究。從另一方面來看,肝臟具有增殖活性,可以多次分裂,而大多數(shù)神經(jīng)細(xì)胞很難增殖,有絲分裂次數(shù)的差異也有可能帶來染色質(zhì)結(jié)構(gòu),特別是相分離程度的差異。進(jìn)一步來講,肝臟與腦中不同的森林-草原相互作用模式暗示著它們具有不同的基因調(diào)控機(jī)制。肝臟的森林、草原區(qū)域相對分離,其特異性基因可能在森林或草原序列上相對更為聚集,從而對不同序列性質(zhì)的區(qū)域間的特異性相互作用需求更少;而腦的特異性基因調(diào)控可能更加需要部分特異性草原基因與森林的相互作用,建立森林-草原糾纏的調(diào)控網(wǎng)絡(luò)。小鼠中,大腦皮質(zhì)的溫度低于脂肪組織與肝臟,肝臟溫度又高于脂肪118,這三種組織的溫度也與其染色質(zhì)結(jié)構(gòu)的相分離程度一致。除哺乳動(dòng)物,水稻秧苗在低溫壓力下染色質(zhì)結(jié)構(gòu)變得更加松散119,也暗示著溫度與染色質(zhì)結(jié)構(gòu)的關(guān)聯(lián)。

        人類、小鼠等物種明確的森林-草原區(qū)域劃分暗示著染色質(zhì)具有較強(qiáng)的相分離趨勢,因而是溫度敏感的。對一些生命過程如疾病發(fā)生、胚胎發(fā)育,溫度的控制可能與這些過程的染色質(zhì)結(jié)構(gòu)變化存在關(guān)聯(lián)。在早期胚胎發(fā)育過程中,染色質(zhì)結(jié)構(gòu)從森林-草原相對混合的狀態(tài)趨于更強(qiáng)的相分離,但在ZGA與著床期出現(xiàn)特異混相,恰好與母體在受孕后的溫度升高與ZGA和著床期兩次特異性溫度降低的時(shí)間節(jié)點(diǎn)對應(yīng)77。該現(xiàn)象對小鼠樣本與人類樣本均存在,可見溫度控制對二者的胚胎發(fā)育起到重要作用,也與相分離模型的預(yù)測一致。另外,神經(jīng)退行性疾病患者的腦樣本中森林-草原的甲基化差異較普通腦細(xì)胞更小,甲基化自關(guān)聯(lián)衰減更快,人類阿爾茲海默癥與癡呆(Alzheimer’s disease and dementia)的發(fā)展和體溫降低有關(guān)120,121,暗示著這些疾病中染色質(zhì)相分離及相分離溫度效應(yīng)存在值得深入探討的關(guān)系。與之對應(yīng),癌變則伴隨著體溫的升高122,這與癌癥染色質(zhì)結(jié)構(gòu)趨于分相的觀察一致。另外,炎癥也伴隨著局部溫度的升高123,我們推測這可能與森林、草原區(qū)域中免疫基因的分別聚集有關(guān)。衰老過程伴隨著分相的加強(qiáng),與之對應(yīng),低溫可能與嚙齒類、小鼠和人的壽命延長有關(guān)124-126。多個(gè)過程中染色質(zhì)或表觀遺傳差異的變化均與其溫度變化對應(yīng),暗示了溫度對于染色質(zhì)結(jié)構(gòu)中相分離的影響,以及在生命功能的調(diào)節(jié)中的重要意義。

        從染色質(zhì)相分離模型的角度出發(fā),不同物種的DNA序列差異程度和區(qū)域長度的分布等特征不同,從而可能具有不同的染色質(zhì)分相能力,形成不同的三維結(jié)構(gòu),進(jìn)而具有不同的溫度響應(yīng)模式。相對于變溫動(dòng)物,恒溫動(dòng)物的序列不均一性更強(qiáng)127,其溫度區(qū)間窄且具有物種特異性128;爬行類的體溫區(qū)間則更寬129。按照相分離機(jī)制,較強(qiáng)的序列分布差異對應(yīng)較窄的相變溫度區(qū)間,恒溫、變溫動(dòng)物的體溫控制范圍與其序列差異可以較好對應(yīng)。對比古老物種與現(xiàn)代物種的CpG密度分布,在早期演化過程中CpG密度逐漸降低,但其沿序列分布的差異較小,而較為后期的演化過程(如冷血?jiǎng)游锱c溫血?jiǎng)游锏姆蛛x時(shí))則更多表現(xiàn)為CpG沿序列的差異增大,相應(yīng)地CpG平均密度的變化很小。之前的研究指出,CpG甲基化/去甲基化是導(dǎo)致CpG向TpA的演化的一個(gè)可能原因130。而二核苷酸傾向于空間分離的特性與隨機(jī)變異可能共同導(dǎo)致了不同物種中的基因組變化。不同物種的DNA序列可能影響其染色質(zhì)組裝,這種序列-結(jié)構(gòu)關(guān)系提供了更為豐富的關(guān)于進(jìn)化的信息。

        6 總結(jié)與展望

        在染色質(zhì)結(jié)構(gòu)的形成與調(diào)控過程中,相分離機(jī)制起到的作用引起越來越多的關(guān)注。基于序列的相分離模型,將序列不均一性對染色質(zhì)結(jié)構(gòu)的影響納入考慮,通過對序列的有效劃分,可以得到基因、表觀遺傳和結(jié)構(gòu)性質(zhì)差異明顯的兩類區(qū)域,為TAD結(jié)構(gòu)形成和染色質(zhì)隔間化提供了序列基礎(chǔ)。

        DNA序列的森林和草原區(qū)域?qū)Ρ碛^遺傳區(qū)域的有效劃分使我們能夠建立DNA序列和染色質(zhì)狀態(tài)之間的廣泛聯(lián)系,而染色質(zhì)結(jié)構(gòu)的序列依賴性為討論不同生物過程中染色質(zhì)結(jié)構(gòu)的演變提供了一致的討論框架和機(jī)制。在序列差異的熱力學(xué)因素與轉(zhuǎn)錄等動(dòng)力學(xué)因素的共同驅(qū)動(dòng)下,在早期胚胎發(fā)育、分化、衰老等過程中,一方面森林-草原區(qū)域的分相不斷加深,另一方面多個(gè)尺度下細(xì)胞類型特異的森林-草原間相互作用輔助細(xì)胞身份建立。基于該模型,一些物理因素可能對染色質(zhì)結(jié)構(gòu)造成影響,對相同的序列,不同溫度對應(yīng)結(jié)構(gòu)的不同相分離程度,溫度變化可能影響發(fā)育、分化等生命過程,溫度也與疾病等特殊狀態(tài)對應(yīng);對不同物種,序列特性本身影響染色質(zhì)的分相模式,并可能與其溫度適應(yīng)范圍與溫度響應(yīng)能力有關(guān)。

        一維序列與三維結(jié)構(gòu)的形成與演化背后的物理和化學(xué)原理還需要進(jìn)一步探索。從物理上理解不同細(xì)胞狀態(tài)和組織的基因調(diào)控網(wǎng)絡(luò),有利于更高效和系統(tǒng)地尋找致病的關(guān)鍵因子,乃至尋找更好的治療方案。我們也希望從物理的視角理解不同物種的序列差異如何影響染色質(zhì)組裝,序列的差異如何在演化過程中逐漸產(chǎn)生,演化路徑如何被物理性質(zhì)所影響或驅(qū)動(dòng)。為了達(dá)到這一系列目標(biāo),我們需要應(yīng)用生物信息學(xué)和機(jī)器學(xué)習(xí)工具,系統(tǒng)、全面地分析已有實(shí)驗(yàn)數(shù)據(jù),充分利用統(tǒng)計(jì)物理學(xué)和多尺度分子模擬方法構(gòu)建物理模型,并與實(shí)驗(yàn)測量相結(jié)合。近年來,不同組織與細(xì)胞狀態(tài)的表觀遺傳數(shù)據(jù)快速增加,表觀遺傳與生物功能的聯(lián)系逐漸建立,為多組學(xué)數(shù)據(jù)的聯(lián)合分析提供了可能。單細(xì)胞數(shù)據(jù)的積累有助于理解染色質(zhì)結(jié)構(gòu)的細(xì)胞差異與組織差異之間尺度和行為上的聯(lián)系與區(qū)別。DNA Zoo131等項(xiàng)目對多物種結(jié)構(gòu)、基因組等數(shù)據(jù)的系統(tǒng)搜集大大方便了跨物種的比較研究。粗?;P蛷腍i-C等實(shí)驗(yàn)數(shù)據(jù)重構(gòu)染色質(zhì)結(jié)構(gòu)可以實(shí)現(xiàn)染色質(zhì)三維組織方式的可視化,有助于從原理上理解三維結(jié)構(gòu)的形成,結(jié)合更高分辨率的ChIA-PET 數(shù)據(jù)與全基因組覆蓋的Hi-C數(shù)據(jù),可能實(shí)現(xiàn)更高精度的結(jié)構(gòu)重建。在更小尺度上,單核小體分辨率的micro-C等技術(shù)可以探測基因環(huán)、30 nm纖維等精細(xì)結(jié)構(gòu)的形成,補(bǔ)充染色質(zhì)折疊的重要環(huán)節(jié);全原子模型分子動(dòng)力學(xué)模擬與 NMR/2-D IR技術(shù)可以用于驗(yàn)證相似DNA序列傾向于空間聚集的猜測。通過發(fā)展深度學(xué)習(xí)方法,借助深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network)等方法優(yōu)化自由能景觀,可能從不同分辨率重構(gòu)染色質(zhì),可解釋的機(jī)器學(xué)習(xí)模型為理解一維信息影響結(jié)構(gòu)和表達(dá)的方式以及貢獻(xiàn)程度提供了工具。生命過程雖然多種多樣且高度復(fù)雜,目前的分析暗示著它們之間存在密切的聯(lián)系,對這些過程的整體的理解不僅是我們的愿望,隨著各種數(shù)據(jù)的不斷積累也越來越可能成為現(xiàn)實(shí)。

        猜你喜歡
        染色質(zhì)表觀草原
        染色質(zhì)開放性與動(dòng)物胚胎發(fā)育關(guān)系的研究進(jìn)展
        講解《草原圖》
        哺乳動(dòng)物合子基因組激活過程中的染色質(zhì)重塑
        《當(dāng)周大草原》
        散文詩(2021年22期)2022-01-12 06:14:28
        一生的草原
        散文詩(2021年22期)2022-01-12 06:14:10
        綠盲蝽為害與赤霞珠葡萄防御互作中的表觀響應(yīng)
        河北果樹(2021年4期)2021-12-02 01:14:50
        鋼結(jié)構(gòu)表觀裂紋監(jiān)測技術(shù)對比與展望
        上海公路(2019年3期)2019-11-25 07:39:28
        染色質(zhì)可接近性在前列腺癌研究中的作用
        “哺乳動(dòng)物卵母細(xì)胞生發(fā)泡染色質(zhì)構(gòu)型的研究進(jìn)展”一文附圖
        例析對高中表觀遺傳學(xué)的認(rèn)識
        亚洲成av人的天堂在线观看| 精品黄色一区二区三区| 久久综合另类激情人妖| 亚洲午夜久久久久久久久电影网| 又湿又黄裸乳漫画无遮挡网站| 后入到高潮免费观看| 特黄a级毛片免费视频| 91久久国产综合精品| 蜜桃伦理一区二区三区| 校园春色日韩高清一区二区| 国产av无码专区亚洲av麻豆| 又长又大又粗又硬3p免费视频| 亚洲国产精品久久久久秋霞1| 免费 无码 国产精品| 日本办公室三级在线观看| 国产成人精品无码一区二区三区| 国产精品无套内射迪丽热巴| 在线a人片免费观看高清| 亚洲成人一区二区三区不卡| 午夜男女很黄的视频| 日韩精品大片在线观看| 久久精品国产亚洲精品色婷婷| 一级毛片60分钟在线播放| av在线免费观看你懂的| 日本女优激情四射中文字幕| 欧美真人性野外做爰| 国产91精选在线观看麻豆| 久草视频在线视频手机在线观看| 中文字幕午夜精品一区二区三区| 国内精品视频一区二区三区八戒| 日韩a毛片免费观看| 超级少妇一区二区三区 | 甲状腺囊实性结节三级| 手机在线免费观看的av| 三年的高清电影免费看| 国产精品密播放国产免费看| 午夜精品一区二区三区av免费| 日本免费一区二区在线看片| 女局长白白嫩嫩大屁股| 日本免费一区尤物| 中文字幕一区二区三区四区久久|