2 0 2 0 年1 月2 1 日,全球頂級雜志《自然》(Nature)發(fā)表綜述文章,“Technologies to watch in 2020”,請七位行業(yè)思想領(lǐng)袖預(yù)測技術(shù)發(fā)展將在今年產(chǎn)生的重大影響。
在兩到三年中透射式冷凍電子顯微鏡(cryogenic electron microscopy,cryo-EM)將成為解密大分子結(jié)構(gòu)的最強(qiáng)大工具。這些結(jié)構(gòu)對于理解生化機(jī)制和藥物開發(fā)至關(guān)重要,而更有效地解析它們的方法可以加快此類工作。
在cryo-EM中,將生物樣本快速冷凍在液氮中有助于保留水分,減少用于成像的高能電子對分子的損害。但是標(biāo)本的準(zhǔn)備工作是目前一個主要的瓶頸。沒有好的標(biāo)本,就無法成像。生物樣本通常含有蛋白質(zhì),這些蛋白質(zhì)會在冷凍過程中在薄液表面散開。
為了防止這種情況的發(fā)生,研究人員正在開發(fā)能在施加液滴之前將蛋白質(zhì)錨固在二維材料(例如碳晶格石墨烯)上的方法。這樣,液滴更小,并讓蛋白質(zhì)遠(yuǎn)離空氣—水界面。有的實(shí)驗(yàn)室將納米級別的樣品直接放在表面上,而不是使用舊方法從大液滴中吸走多余的液體。有的使用聚焦離子束將冷凍的細(xì)胞切成100納米以下,使研究人員能夠在細(xì)胞環(huán)境中研究分子。
使用cryo-EM解析分子結(jié)構(gòu)通常需要收集和分析多達(dá)一萬張圖像,這代表了數(shù)周至一個月的工作。許多圖像是不完美的,因此研究者必須丟棄它們。理論上,幾十張照片就足夠了,收集和分析工作將花費(fèi)不到一天的時(shí)間。增加的通量可以幫助我們了解疾病的機(jī)制并更有效地開發(fā)藥物。
我一直在關(guān)注并使用適配體的發(fā)光RNA鏈進(jìn)行RNA長讀長測序和活細(xì)胞成像。這些技術(shù)日趨成熟,并在未來一兩年內(nèi)發(fā)生重大變化。
短讀長測序改變了RNA生物學(xué)。例如,它可以告訴你哪些RNA序列包含經(jīng)過生物化學(xué)修飾的殘基。但是,長讀長測序則可以幫助確定特定修飾在細(xì)胞中的普遍程度,以及RNA分子之間的變化是否互相關(guān)聯(lián)。
發(fā)光適配體是在實(shí)驗(yàn)室中開發(fā)的與熒光染料結(jié)合的單鏈DNA或RNA分子,是在某些海洋動物體內(nèi)產(chǎn)生的綠色熒光蛋白的RNA類似物。當(dāng)這些適配體與染料結(jié)合時(shí),它們的熒光強(qiáng)度會增加。使得研究人員能夠跟蹤研究,例如導(dǎo)致神經(jīng)退行性疾病的細(xì)胞內(nèi)RNA簇的形成等。
早期的發(fā)光適配體并不可靠,它們的信號微弱,有時(shí)根本不起作用,因?yàn)榕c靶RNA融合時(shí)序列會錯誤折疊。但是有幾個小組開發(fā)出了新型熒光RNA。我在論文和演講中看到了其中的巨大推進(jìn),以提高現(xiàn)有適體的亮度,并創(chuàng)造出可以發(fā)出不同顏色的變體。
我的實(shí)驗(yàn)室已經(jīng)在使用化學(xué)足跡法來研究細(xì)胞中RNA的折疊。許多疾病都與RNA結(jié)構(gòu)的變化有關(guān),但這確實(shí)很難分開。現(xiàn)在,我們借助長讀測序和發(fā)光適配體,研究癌癥、代謝綜合征和阿爾茨海默病等疾病中的RNA蛋白聚集體。通過這些技術(shù),我們可以更好地將細(xì)胞死亡和其他疾病特征與細(xì)胞中RNA分子中發(fā)生的情況聯(lián)系起來。
在過去十年中,對微生物群落進(jìn)行基因測序已經(jīng)探查了人類微生物組的組成。最近,科學(xué)家試圖通過整合有關(guān)基因、轉(zhuǎn)錄、蛋白質(zhì)和代謝產(chǎn)物的信息來了解微生物組的功能。代謝物特別有趣。它們可以提供微生物組如何影響人類健康最相關(guān)的信息,因?yàn)樵S多宿主與微生物組的相互作用是通過細(xì)菌產(chǎn)生和消耗的代謝物發(fā)生的。
微生物組和代謝組學(xué)研究呈現(xiàn)爆炸式增長。例如通過宏基因組測序來研究一組糞便樣本,鑒定每個樣品中存在的物種及其豐度,使用質(zhì)譜法和其他技術(shù)測量不同代謝物的濃度。將這兩種方面結(jié)合起來,了解微生物組正在做什么,從而了解特定微生物是否決定了某些代謝物的水平。
但是這些數(shù)據(jù)是復(fù)雜的多維數(shù)據(jù),可能存在一整套的相互作用,涉及最終產(chǎn)生一組代謝產(chǎn)物的多個物種和途徑。科學(xué)家已經(jīng)發(fā)表了計(jì)算方法以關(guān)聯(lián)微生物組和代謝組數(shù)據(jù)。這些方法包括簡單相關(guān)性的分析,以及使用現(xiàn)有微生物組—代謝組數(shù)據(jù)集,來預(yù)測新微生物群落中的代謝組或恢復(fù)微生物—代謝物關(guān)系的復(fù)雜機(jī)器學(xué)習(xí)方法。
我們的實(shí)驗(yàn)室采用了不同的策略,沒有使用統(tǒng)計(jì)方法來發(fā)現(xiàn)微生物與代謝物的關(guān)聯(lián),而是建立了特定微生物組成如何影響代謝組的機(jī)制模型,并將其用作分析的一部分。我們設(shè)問,根據(jù)基因組和代謝信息,對每種微生物產(chǎn)生或吸收特定代謝產(chǎn)物的能力了解多少?然后,預(yù)測給定微生物集合產(chǎn)生或降解特定代謝物的潛力,并與實(shí)際代謝組學(xué)數(shù)據(jù)進(jìn)行比較。我們也證明了這種方法避免了簡單的相關(guān)分析的缺陷,將在未來幾個月內(nèi)發(fā)布新版本的分析框架。
這樣的研究,可以通過識別產(chǎn)生過多有害代謝物或太少有益代謝物的特定微生物,來改善微生物組的療法。
1869年創(chuàng)刊的《自然》是世界上最早的國際性科技期刊,以報(bào)道科學(xué)世界中的重大發(fā)現(xiàn)、重要突破為使命,要求科研成果新穎,在學(xué)術(shù)界享有盛譽(yù)
我們看不到癌癥形成的過程,只能看到它的終點(diǎn)。腫瘤達(dá)到臨床可檢測的程度時(shí),我們才對它進(jìn)行采樣。那時(shí),我們只有應(yīng)對歷經(jīng)突變的腫瘤。
我們的團(tuán)隊(duì)建立了一個計(jì)算模型,在考慮組織空間結(jié)構(gòu)的同時(shí)探索腫瘤進(jìn)展的動力學(xué)。使用此模型,我們可以模擬各種情況,生成具有模擬患者數(shù)據(jù)的突變模式的“虛擬腫瘤”。通過將模擬數(shù)據(jù)與實(shí)際基因組數(shù)據(jù)進(jìn)行比較,可以推斷出哪些參數(shù)可能導(dǎo)致了患者的腫瘤。
我很高興看到,通過新興條形碼和記錄法來直接測量腫瘤譜系和表型來補(bǔ)充這些推論方法。過去兩年,不斷發(fā)展的CRISPR條形碼,可以記錄哺乳動物發(fā)育過程中細(xì)胞的命運(yùn)。再如,通過RNA原位表達(dá)使用圖像的DNA條形碼檢測,從而捕獲細(xì)胞譜系、空間鄰近性和表型。
在一項(xiàng)模擬結(jié)腸癌腫瘤生長的研究中,我們使用腫瘤序列數(shù)據(jù)和機(jī)器模擬來研究原發(fā)性和轉(zhuǎn)移性腫瘤之間的關(guān)系。推論分析表明,當(dāng)原發(fā)腫瘤包含僅100000個細(xì)胞時(shí),絕大多數(shù)癌癥就已經(jīng)擴(kuò)散,這時(shí)的腫瘤太小了,無法通過結(jié)腸鏡等標(biāo)準(zhǔn)診斷方法進(jìn)行檢測。
由于具有更高的靈敏度和可擴(kuò)展性,建模和測量方法的結(jié)合可以跟蹤腫瘤形成過程中的譜系和空間關(guān)系,從而洞悉癌癥的起源,比如特定的突變?nèi)绾斡绊懠?xì)胞適應(yīng)性并導(dǎo)致疾病的發(fā)展。
我們已經(jīng)進(jìn)行了約15年的大規(guī)模實(shí)驗(yàn),繪制增強(qiáng)子和其他調(diào)控DNA序列的圖譜。這些序列控制著細(xì)胞和器官如何讀取基因。盡管完成這些圖還需要更多工作,我們?nèi)钥梢愿_地控制基因組。
在2019年10月伊利諾伊州芝加哥市舉行的神經(jīng)科學(xué)協(xié)會年會上,我主持了一個會議。會議重點(diǎn)是確定增強(qiáng)子序列并使用它們控制大腦中特定細(xì)胞類型中的基因表達(dá)。一種方法是將工程化的病毒傳播到大腦中,以測試數(shù)千種增強(qiáng)子的目標(biāo)基因表達(dá)譜。2019年,華盛頓州西雅圖市艾倫腦科學(xué)研究所的研究人員使用這種策略,在人腦特定皮質(zhì)層中尋找增強(qiáng)子。來自馬薩諸塞州劍橋市哈佛大學(xué)的一個研究小組使用RNA測序的方法來發(fā)現(xiàn)在某些中間神經(jīng)元起作用的增強(qiáng)子。
一旦確定了增強(qiáng)子序列,科學(xué)家就可以使用它們來驅(qū)動特定細(xì)胞類型的表達(dá),從而進(jìn)行基因治療。在基因拷貝失活或缺失而引起的疾病中,CRISPR–Cas9基因編輯工具可以將轉(zhuǎn)錄激活因子靶向該基因的增強(qiáng)子,從而提高工作拷貝的表達(dá)。對老鼠的研究表明,這些方法可以糾正肥胖和脆弱X綜合征、Rett和Dravet綜合征等疾病的基因表達(dá)缺陷,后者是我實(shí)驗(yàn)室正在研究的一種嚴(yán)重的癲癇病。2020年我們?nèi)詴M(jìn)一步在老鼠身上開展研究,希望我們可以使用這些方法來改變?nèi)祟惢蛑委煹姆绞健?/p>
我對如何更快、更方便地為患者提供藥物感興趣。所需的技術(shù)是多方面的。一方面是發(fā)現(xiàn),例如單細(xì)胞測序方法。另一方面是制造,我們需要將技術(shù)帶給患者。這特別適用于罕見病或患者少的藥物,甚至適用于滿足已有藥品的全球可及性。
在發(fā)現(xiàn)這方面,我們與麻省理工學(xué)院合作,開發(fā)了一種便攜式廉價(jià)平臺,用于高通量單細(xì)胞RNA測序。但是要獲得足夠的分辨率以區(qū)分具有不同作用和抗原特異性的免疫細(xì)胞亞型,仍然是一項(xiàng)挑戰(zhàn)。過去一年,我們用多種方式增強(qiáng)了單細(xì)胞基因組測序。首先,我們提出了一種更有效地檢測低表達(dá)轉(zhuǎn)錄本的方法。特別是針對T淋巴細(xì)胞,我們設(shè)計(jì)了一種方案,將每個細(xì)胞的基因表達(dá)譜與其獨(dú)特抗原受體的序列聯(lián)系起來。
同時(shí),位于馬薩諸塞州波士頓的達(dá)納法伯癌癥研究所的一個研究小組,發(fā)布了一種巧妙的文庫篩選策略,確定特定的T細(xì)胞受體識別哪種抗原。
我與麻省理工學(xué)院的合作者Alex Shalek等人一起,創(chuàng)立了一家名為Honeycomb Biotechnologies的公司,將我們的單細(xì)胞RNA測序平臺商業(yè)化。不必將細(xì)胞放在離心機(jī)中離心,而是將其粘貼在試管中,然后將其冷凍在液氮中,可以運(yùn)送一系列單細(xì)胞大小的孔,如USB大小。這可以使在全球任何地方對幾乎所有樣本的單細(xì)胞存儲和基因組的分析成為可能。
當(dāng)你從一端到另一端伸展單個細(xì)胞的DNA時(shí),它的長度約為2米,但它能夠被直徑小于大頭針直徑的細(xì)胞核容納。而折疊模式不能是隨機(jī)的,染色體形成必須在生物的整個生命周期中對其進(jìn)行3D結(jié)構(gòu)的時(shí)空調(diào)節(jié)。
隨著過去十年中基因組學(xué)和成像技術(shù)的發(fā)展,我們現(xiàn)在可以創(chuàng)建基因組折疊方式的超高分辨率圖?,F(xiàn)在最大的問題是,每個折疊模式的功能是什么?它們?nèi)绾慰刂苹虮磉_(dá)、DNA復(fù)制和DNA修復(fù)等基本過程?
幾種合成生物學(xué)方法可以使我們在一定長度和時(shí)間范圍內(nèi)折疊和探測基因組。一種方法,CRISPRGO,可以將DNA片段攜帶到細(xì)胞核上或細(xì)胞核中的特定區(qū)室。這將使科學(xué)家們能夠研究DNA序列的核內(nèi)形態(tài)如何控制基因功能。
另一個是我們實(shí)驗(yàn)室的光激活動態(tài)環(huán)狀結(jié)構(gòu)化(light-activated dynamic looping,LADL)工具,該工具使用光和CRISPR-Cas9可以根據(jù)需要在長距離上將特定的DNA束縛在一起。這可以使增強(qiáng)子直接與數(shù)千個甚至數(shù)百萬個堿基的靶基因直接接觸,因此我們可以直接評估調(diào)節(jié)序列的功能。其靶基因的表達(dá)會上升還是下降,以及上升到什么程度?該技術(shù)可以對基因表達(dá)進(jìn)行精確的時(shí)空控制,這在許多疾病中都受到了嚴(yán)重破壞。
第三種系統(tǒng)CasDrop 使用另一種光激活的CRISPR-Cas9系統(tǒng)將特定的DNA片段拉入亞核無膜“冷凝物”。自幾年前被發(fā)現(xiàn)以來,它們在細(xì)胞中的功能一直引起激烈的爭論。
深受啟發(fā)的是,我們可以將這些3D基因組工程工具與基于CRISPR的活細(xì)胞成像方法結(jié)合起來,以便我們可以在細(xì)胞中實(shí)時(shí)工程化和觀察基因組。
功能可驅(qū)動結(jié)構(gòu),或結(jié)構(gòu)可驅(qū)動功能。這些工程工具將解開這個很大的謎。