梁曉一
【摘 要】關(guān)于微生物時間序列的研究提供了對從海洋到人類微生物群落穩(wěn)定性和動態(tài)的新見解。專用于時間序列的分析工具使這些數(shù)據(jù)受到充分利用。這些工具可以揭示周期模式,有助于建立預(yù)測模型,或者量化異常行為。此外,微生物間隨時間變化的相互作用可以用來構(gòu)造隨時間變化的關(guān)聯(lián)網(wǎng)絡(luò)。本文通過分析介紹這些技術(shù)來說明它們在微生物研究上的潛在價值。
【關(guān)鍵詞】微生物群落 宏基因組 時間序列
高通量測序方法的改進使得關(guān)于各種環(huán)境下微生物群落隨時間變化情況的縱向研究大大增加。這些時間序列研究可以提供對于微生物群落穩(wěn)定性的獨特生態(tài)見解,同時也能了解無法以其他方式獲得的微生物群落應(yīng)對擾動的響應(yīng)。
1通過時間序列數(shù)據(jù)了解微生物
在近期的縱向研究中,大約一半的微生物群落有負斜率時間衰減曲線,也就是說,這些微生物群落間的不同隨時間增加為增加。此外,微生物群落多樣性隨時間變化的情況與環(huán)境有關(guān),在相同的環(huán)境下,其多樣性差異不大,在不同的環(huán)境中,微生物群落多樣性差異很大。例如,土壤和釀酒廠廢水中微生物多樣性最低,然而人類手掌和嬰兒腸道的微生物多樣性最高。對海洋微生物進行的長期研究表明,相對與其他因素,微生物群落中的個別成員會受到季節(jié)變化的強烈影響。同時,另一些微生物群落在定殖后會經(jīng)過一系列的可預(yù)測狀態(tài),例如在牙斑的形成過程中,耐氧菌的生存為厭氧菌提供環(huán)境。在某些情況下,例如嬰兒腸道菌群的定植,雖然微生物群落在初始階段變化連續(xù)變化,但最終會穩(wěn)定在類似的狀態(tài)。
微生物群落往往演變成一個穩(wěn)定的組合狀態(tài),這一狀態(tài)會受到外界因素的變化而變化,例如抗生素或益生菌治療會影響腸道微生物群落的組合狀態(tài)。微生物彼此之間及微生物與環(huán)境之間的復(fù)雜相互作用是影響微生物生態(tài)的主要貢獻者,目前探索上述關(guān)系的方法主要是網(wǎng)絡(luò)推斷技術(shù)。
2微生物時間序列網(wǎng)絡(luò)
近期的研究提供了許多可以從時間序列數(shù)據(jù)構(gòu)建共生網(wǎng)絡(luò)的方法,從結(jié)合置換檢驗的相關(guān)性分析[1]到基于超幾何分布的相似性評估[2],以及分析影響類群豐度多因素的多元回歸分析[3]。這些靜態(tài)網(wǎng)絡(luò)推斷技術(shù)可應(yīng)用于構(gòu)造動態(tài)模型。例如,微生物群落的動態(tài)變化在數(shù)學(xué)上往往符合廣義的Lotka-Volterra方程,其將微生物豐度的變化作為分類群生長率和微生物間相互作用強度的函數(shù)。方程中的參數(shù)可以利用對時間序列數(shù)據(jù)進行多元回歸確定。
然而,上述方法忽略了時間序列提供的時間點排序和依賴性的附加信息。這些特性只能通過動態(tài)的方式加以利用。
局部相似性分析(LSA)采用動態(tài)規(guī)劃算法,在最大限度上確定兩個序列的相似性得分,以判斷兩個序列的相似關(guān)系,同時LSA還可以檢測兩個時間序列之間關(guān)系的滯后。例如,LSA被用于預(yù)測噬菌體和他們的宿主之間的關(guān)系。動態(tài)貝葉斯網(wǎng)絡(luò)在模型中將每個變量的當前值作為其父變量之前時間點的函數(shù)。因此,動態(tài)貝葉斯網(wǎng)絡(luò)可檢測包括循環(huán)在內(nèi)的動態(tài)相關(guān)性, 相比標準貝葉斯網(wǎng)絡(luò),動態(tài)貝葉斯提供了更強大的建模框架,盡管它增加了計算成本,可擴展性有限,然而在識別正確模型時其對數(shù)據(jù)的解釋良好。另一組的動態(tài)網(wǎng)絡(luò)推斷技術(shù)基于交叉預(yù)測,它對如何通過同一系統(tǒng)內(nèi)的其它時間序列預(yù)測某一的時間序列的將來這一問題進行量化,這類方法包括Granger因果關(guān)系[4]和新型聚合雜交映射。
上面提到的所有方法在推斷物種相互作用時都從整個時間序列出發(fā)構(gòu)造單一網(wǎng)絡(luò)。然而,物種之間的相互作用可能隨時間改變, 因此其網(wǎng)絡(luò)結(jié)構(gòu)也會隨之變化。時變網(wǎng)絡(luò)推斷技術(shù)的目的就是研究變化發(fā)展的網(wǎng)絡(luò)結(jié)構(gòu),非平穩(wěn)和隨時間變化的動態(tài)貝葉斯網(wǎng)絡(luò),可用于推斷在網(wǎng)絡(luò)結(jié)構(gòu)隨時間發(fā)生的變化。
3結(jié)語
在微生物時間序列分析中,時間間隔的長短會影響微生物關(guān)聯(lián)關(guān)系,縱向分析中的許多方法需要短期和定期采樣間隔長的時間序列,目前可用的宏基因組時間序列往往很短(幾個時間點),跳空(失蹤的時間點),稀疏(零富)和嘈雜,因此需要進行預(yù)處理,包括:規(guī)范,插值和去趨勢,使時間點等距等方法。因此如何更好的選取取樣間隔是一個需要解決的問題。網(wǎng)絡(luò)結(jié)構(gòu)對狀態(tài)轉(zhuǎn)換的影響的研究尚處于起步階段。未來的研究方向是探索隨時間變化的網(wǎng)絡(luò)是否有“預(yù)警”的屬性,即網(wǎng)絡(luò)結(jié)構(gòu)可以預(yù)測某種轉(zhuǎn)變是否發(fā)生。
盡管面臨挑戰(zhàn),微生物時間序列的研究已經(jīng)提供了一套豐富的分析工具,有助于了解系統(tǒng)動力學(xué)和應(yīng)對擾動,構(gòu)建預(yù)測模型。應(yīng)用這些強大的技術(shù)于微生物學(xué)和宏基因組學(xué),在解決遇到的縱向時間序列和相關(guān)建模難題上時有很大的幫助。
參考文獻:
[1]吳松鋒,朱云平,賀福初.轉(zhuǎn)錄組與蛋白質(zhì)組比較研究進展[J].生物化學(xué)與生物物理進展, 2005, 32(2): 99-105.
[2]李朝飛,于航,潘麗晶等.棉鈴蟲泛素基因的克隆及序列分析[J].中山大學(xué)學(xué)報: 自然科學(xué)版,2005,44(1):61-64.
[3]李紹珠.多元回歸分析[J].上海教育科研,1991,3: 014.
[4]李衛(wèi)娜,鄭小林,侯文生 等.腦功能信號的 Granger 因果性分析方法[J].國際生物醫(yī)學(xué)工程雜志,2011,34(6):375-379.