大約在10年前我們開始研究腸道菌群,還記得在2007年的時候,我接到了任務,加入微生物群的研究組。在過去10年當中我們有了很多進展,我們得到了數(shù)據(jù),有了一些成果,并且也了解了里面包含的挑戰(zhàn),還有更多的東西需要發(fā)現(xiàn)和探索,我們還僅僅是剛剛進步。在這個過程中有很多驚喜的發(fā)現(xiàn),其中之一就是新的測試技術產生出大量的數(shù)據(jù),中國在這方面作出了很大的貢獻。
2007年我們做了一個規(guī)劃,希望有24個樣本可以進行測序,這是當時定下的目標,結果一年之后中國的華大基因已經(jīng)做到了124個測序,在當時來說是非常驚人的量。
說到我們的腸道菌群指的就是一個微生物的社區(qū),每次我們說Microbiome就是人體內微生物菌群,在大多數(shù)的情況下就是特指腸道內的微生物群,這個微生物群非常復雜,即便在今天還是沒有辦法把所有的微生物,或者體內微生物進行體外培養(yǎng)?,F(xiàn)在有數(shù)以百萬計基因已經(jīng)在不同項目當中被發(fā)現(xiàn),大部分都是來自人體腸道內的微生物,如果我們比較微生物的細胞和人體細胞,它的數(shù)量幾乎是一樣的。
我之前提到的研究組Meta當時有幾個大的項目同時進行,但是其中之一是Meta HIT,是歐盟計劃,也有中國合作伙伴參與,還有美國的人體基因組的一個項目,兩個項目不一樣,Meta HIT主要是測序,了解基因的多樣性,美國項目更多是要了解不同社區(qū)人群當中的差異。我們相互參考,相互學習。Meta HIT第一次發(fā)表的論文,是突破性的發(fā)現(xiàn),被引用了數(shù)千次,這是第一次找到了我們所做的124個測序的基因目錄。我們看到的是微生物群的豐富性非常重要。
我們發(fā)現(xiàn)一個內容,如果微生物菌群多樣性低,它的穩(wěn)定性也會比較低,同時也會導致疾病,特別是炎癥的反應。還有一些炎癥的指標、代謝的指標跟微生物菌群多樣性低是聯(lián)系在一起的,兩者之間有很強的相關性。之所以我們對于微生物群研究這么讓人激動,因為我們發(fā)現(xiàn)微生物和人類健康是息息相關的,有一些疾病和它有關系,這是我們原先沒想到的,我們可以很好地做總結。
說到微生物群會想到的就是微生物的基因非常多樣化,自己都有代謝的潛力,可能比人體的潛力要更大、更豐富,人體可能有25萬個基因,但是微生物有幾百萬甚至是更多不同的基因,所以它的潛在能力是非常大的,對于生物或者藥物來說有各種不同的可能,而且吃東西下去的時候首先接觸到的是腸道微生物,首先是接觸點,所以微生物有特殊的作用。全球各地的臨床實驗在一個領域非?;钴S,在美國、歐洲和亞洲,今年的數(shù)據(jù)亞洲會更多,而且亞洲很多都會集中在中國,我們一項很重要的工作就是聚焦代謝類疾病,特別是二型糖尿病,二型糖尿病在世界各地都是非常常見的疾病,大約有5億的人口患病,不僅僅是在西方國家,現(xiàn)在最高的比例是在阿拉伯地區(qū),它的發(fā)病率最高,這是第一個被證明跟微生物群相關的一種疾病。
我提到相關性的概念,健康人群和患病人群微生物群是有差異的,但是微生物群和疾病之間并不是因果關系,只是說有相關性。因為跟人類基因學不一樣,微生物的菌群基因或者微生物群會變化,當?shù)貌≈罂赡苁俏⑸锶喊l(fā)生變化,也可能微生物群變化之后得了疾病,只是代表一種相關性。在各地的研究當中都有發(fā)現(xiàn)二型糖尿病和腸道微生物菌群有相關性的,而且我們發(fā)現(xiàn)使用治療糖尿病的藥物可以解釋差異。
當我們想要證明疾病是否對微生物群有影響的時候,我們發(fā)現(xiàn)某種藥物導致了腸道菌群的改變,所以并不是微生物菌群變化導致疾病發(fā)生,而是對疾病的治療過程導致了微生物菌群的改變。之后我們又做了一項其他的研究,這些人還沒有得糖尿病,但是血糖比較高,在這個時候我們也想研究微生物群的代謝是不是跟疾病也有關系。我們做了比較復雜的數(shù)據(jù)的分析。
為了減少微生物群數(shù)據(jù)的復雜性,我們使用宏基因組的概念,就是并不知道里面所有的樣本基因。我們有一個原則,如果兩個基因都在染色體上,它們在任何一個樣本當中的豐裕度差不多,它們豐裕度一致,讓我們看到了之前沒有看到的成果。我們看看樣品、看看測序,可以看到不同的語境,就得出相應的結論,大家也可以看到我們采用的樣本非常多,這樣讓我們在微生物群樣品當中可以獲得很多的信息。
如果要運用基因組描述微生物,可以找到相應的比較好的參照。運用這樣的技術、運用宏基因組的物種,幾乎有90%的樣品甚至是95%的樣品可以找到參照組。我們看看具體的理念是如何使用的?這是一個基因是在1200個樣品當中使用的豐裕度,和第一個基因組類似有4000個不同基因,它們的豐裕度和類似于第一個基因組,這也就是我們所謂的宏基因組種。通過一系列技術在人體的菌群當中找到1500種不一樣的菌群,可以用這樣的手段來進行測試參照。但是一方面我們可以找到一定的參照,與此同時又可以找到新的品種,我們可以看到一系列分類的標記,這樣就知道我們的基因組是可以如何進行分類和參照的。
我們可以看到在亞種的層面當中有非常準確的配對率,有一些菌群的亞種做得比較好,但是在其他的菌群當中并不是的,比如說我們在雙歧桿菌有宏基因組測序當中有2000個基因做到比較好的參照,所以它的參照率可以大于80%在嬰兒的腸道菌群亞種當中看到類似的數(shù)據(jù)。如果看看更大情況,有很多的基因可以通過分類標記來完成相應的分類,但是還有很多的微生物群依舊沒有辦法通過技術手段來做到的。
如果我們回到糖尿病的案例當中,我們有600萬不同的基因,有各種各樣的微生物群,所以我們把糖尿病一種激素進行關聯(lián),把它的相關代謝物和疾病進行關聯(lián)。我們在代謝物當中看到有一些糖尿病的前兆的標志,這是氨基酸的標志,這些標志是在高血糖人群當中可以看到非常典型的氨基酸,我們也碰到很多技術不奏效的時候,因為比如說我們運用的是糞便的樣品,而不是使用小腸的樣品,這樣可能導致技術失效或者手段并不能發(fā)揮好的作用。但是或許有方法論不一樣的,因為在個體當中生產出來的物種不一樣,這樣如果我們一概而論很有可能很多聯(lián)系建設不起來。
我們從微生物顯微鏡的角度來看,可以看到叢林原則或者草原原則,想要知道哪些微生物群是掠食者,是站在食物鏈頂端的?在腸道微生物群當中也有類似的目標,因為每個個體當中可能有不一樣的掠食者,站在食物鏈頂端的微生物群也不相同,所以它的關聯(lián)性有可能并不是完全一樣的。如果看一下它們的運作群體,分組有可能不一樣,對于統(tǒng)計來說并不是一件很好的事情,比如說可能有三個物種進行分類,或許發(fā)現(xiàn)有700個物種和它們很類似的,但是如果再乘以系數(shù)很有可能意味著有3億多個不同的基因,很有可能進行相應的關聯(lián),這件事情就會使得關聯(lián)性的效果大打折扣。
我們也有一系列的案例發(fā)現(xiàn),功能比較類似的微生物會有類似的表征,與此同時它們還有自己的標志,也就意味著這些類似的功能也是非常好的特性傳遞的媒介,所以如果我們把數(shù)據(jù)融合在一起有非常好的結論。
我要特別感謝共同研究的國際團隊,正是我們共同的努力,才有了今天的成果。[本文根據(jù)H.Bjorn Nielsen在2019浦江創(chuàng)新論壇未來(科學)論壇——“無處不在的微生物群”分論壇現(xiàn)場錄音整理,未經(jīng)本人審定]