本刊記者 黃雪霜 嚴永紅
數(shù)納百川 生命流長
——訪中國科學院數(shù)學與系統(tǒng)科學研究院、國家數(shù)學與交叉科學中心李雷研究員
本刊記者 黃雪霜 嚴永紅
數(shù)學是一門基礎學科,很多學科都是在數(shù)學的基礎上誕生、發(fā)展成熟的,同時又推動了數(shù)學的進展;如牛頓的經(jīng)典《自然哲學的數(shù)學原理》奠定了力學的基礎、Shannon的經(jīng)典《通信的數(shù)學理論》開創(chuàng)了信息論的研究。
生物學是研究生命現(xiàn)象和生物活動規(guī)律的科學,而分子生物學和基因組學是現(xiàn)代生物學的重要內(nèi)容。如何分析、計算分子生物學和基因組學中的高通量數(shù)據(jù)、闡明其中的數(shù)學原理,系統(tǒng)地認識生命是當代科學家面對的極富挑戰(zhàn)性的問題。李雷從1995年開始,就致力于這一領域的研究,并且成效顯著。
李雷,中國科學院數(shù)學與系統(tǒng)科學研究院研究員,獲北大學士和碩士學位,1998年于美國加州大學伯克利分校統(tǒng)計系獲博士學位,并作為當年統(tǒng)計系唯一的優(yōu)秀畢業(yè)生獲得Evelyn Fix紀念獎章。2000年秋在加利福尼亞大學洛杉磯分校純粹與應用數(shù)學研究所做博士后。1998-2002年在佛羅里達州立大學任助理教授,2002-2010年在南加利福尼亞大學計算生物及數(shù)學系任教并于2005年獲終身職務。2003年與Michael Waterman教授、Simon Tavare教授等在南加州大學建立了世界上第一個計算生物系。2010年入選中國科學院“百人計劃”。作為一名數(shù)學、生物兩棲科學家,其研究覆蓋統(tǒng)計學,信息論,計算,計算生物學、系統(tǒng)生物學,基因組學和老齡生物學等領域,獲得若干具有原創(chuàng)性的成果。
李雷在中學時就對數(shù)學有著濃厚興趣。1984年,他以優(yōu)異成績考取北京大學數(shù)學系,本科畢業(yè)后師從謝忠潔教授從事時間序列分析的研究。在美國加州大學伯克利分校攻讀博士期間師從于國際著名統(tǒng)計學家、澳大利亞科學院院士Terence P. Speed教授。這期間李雷充分感受著數(shù)學的博大精深與美麗,吸收著數(shù)學、統(tǒng)計學的養(yǎng)分。2000年在UCLA做博士后研究期間又得到Wing Wong教授指點。經(jīng)過多年鉆研,他漸漸在科學實踐中形成了自己的研究哲學和風格。
在若干經(jīng)典的數(shù)學問題上,包括最優(yōu)無損失編碼長度問題(Shannon第一定理的經(jīng)驗公式)、譜分解、帶正約束的廣義線性反問題、最小截斷方差解的計算、“將來”與“過去”之間的交互信息量, 李雷的研究處于世界領先地位。
類似于經(jīng)典統(tǒng)計學中的點估計,區(qū)間估計,假設檢驗,預測等方法,李雷從科學實踐中總結(jié)出了一類新的統(tǒng)計問題:盲反問題。它提供了一個全新的形而上的應用統(tǒng)計學概念?;诿し磫栴}的原理,李雷與Speed教授提出了新的DNA測序技術中的光度校正方法,并證明了它的最優(yōu)性。這個方法已成為新一代Illumina高通量測序儀的工業(yè)標準。目前世界上規(guī)模首屈一指的測序機構(gòu)-中國華大基因研究院的主力測序儀就是Illumina平臺。
為了提高DNA測序精度,李雷對反卷積這一經(jīng)典應用數(shù)學問題,提出了全新的理論和算法,其中包括參數(shù)反卷積方法。在文獻中,反卷積經(jīng)常被認為是不適定問題。李雷通過自己的工作證實只要spike-convolution模型是現(xiàn)實問題的良好近似,那么反卷積是適定的統(tǒng)計問題。
數(shù)學是開啟其他學科的鑰匙,而原創(chuàng)的有效的數(shù)學方法和原理就像是一把新“鑰匙”,不僅為李雷打開了數(shù)學之門,也打開了一道數(shù)學和生物學之間彼此隔離的大門。
20世紀末,人類自然科學史上三大工程之一——“國際人類基因組計劃”的進展速度振奮人心。這期間,李雷有幸與Speed教授、計算生物學先驅(qū)、美國科學院院士Michael Waterman教授等世界一流的科學家等合作,由此踏上了綜合運用統(tǒng)計、概率、計算等數(shù)學方法解決分子生物、基因組學中的科學問題的交叉研究之路。
DNA測序是基因組學研究的基石。李雷研究組給出了基因組學中評估DNA測序精度的完整數(shù)學模型。此外,包括人類基因組工程在內(nèi),最初發(fā)表的基因組都是由多模本組合而成的。也就是說,DNA的一個片段來自于一個模本,另一個片段可能來自于另一個模本。李雷研究組為雙倍體的測序問題建立了一個完整的統(tǒng)計模型,提出了構(gòu)造雙倍體DNA的算法和對結(jié)果的統(tǒng)計評估。研究小組利用已有的DNA測序數(shù)據(jù)給出了第一個有統(tǒng)計評估的雙倍體基因組, 即玻璃海鞘的雙倍體基因組,此工作早于人類的雙倍體基因組的研究成果。
基因組學和系統(tǒng)分子生物學中數(shù)學建?;締栴}分為兩類:測量(包括DNA測序,基因芯片,光學映像等)和統(tǒng)計推斷(包括細胞活動,表達調(diào)控,網(wǎng)絡重建等)。李雷研究組為主要的生物測量技術如基因芯片,光學映像建立了完整的數(shù)學模型。
基因的表達是通過轉(zhuǎn)錄蛋白質(zhì)和其它因子調(diào)控實現(xiàn)的。如何從基因表達譜和相關生物信息中推斷調(diào)控機制是一個非常有挑戰(zhàn)性的嶄新的統(tǒng)計問題。李雷的小組發(fā)展了一套基因調(diào)控的推斷方法,稱為BASE (Binding association with sorted expression differentiation)方法。從概念上,這一統(tǒng)計推斷方法超越了經(jīng)典的Pearson相關函數(shù)方法。從實踐上,他們已發(fā)表了若干成功的案例。
信息技術的發(fā)展改變了人類的生活方式,而基因工程的突破將幫助人類延年益壽。人類將挑戰(zhàn)生命科學的極限。對這項極富意義和挑戰(zhàn)性的工作,李雷表現(xiàn)出了極大的興趣。從2004年起,他與南加州大學的老齡分子遺傳專家Valter Longo博士合作,以酵母菌為模型,共同研究生命如何健康長壽的問題。利用李雷研究組發(fā)展的基因芯片分析工具,他們探明了若干長壽的機制。比如,他們發(fā)現(xiàn)在長壽的菌種細胞中,存在乙醇向甘油的能源轉(zhuǎn)換;在營養(yǎng)減少的過程中,線粒體核糖體基因表達在野生型細胞中上調(diào),而在長壽的菌種細胞中則保持平穩(wěn)。此前,人類已經(jīng)發(fā)現(xiàn)了老化和長壽的一些線索。比如,端粒體理論,free radicals理論,ERC理論。值得一提的是,李雷在此期間完成了自己研究生涯中的一大亮點成果:采用功能性基因組的方法,從分子系統(tǒng)生物學的角度,發(fā)現(xiàn)長壽的sch9Δ細胞可以協(xié)調(diào)呼吸(TCA cycle,產(chǎn)生free radicals的主要過程)與rRNA processing及核仁活動。這個發(fā)現(xiàn)第一次將衰老的free radicals 理論與rDNA理論聯(lián)系起來。它們將對設計更科學的飲食方式和治療方式產(chǎn)生深刻的影響。
“要想在數(shù)學、計算和軟件開發(fā),分子生物等多個學科中自由穿梭,游刃有余,確實非常具有挑戰(zhàn)性?!崩罾渍f,在不同學科之間探討新的科學道路雖然艱苦,但也充滿探索的快樂。他堅信在科學的發(fā)展方向上,多科學的交叉領域是很有前途和社會回報的。而且還有可能形成新的產(chǎn)業(yè),這對中國的產(chǎn)業(yè)升級具有重要意義。因而,如何增強交叉科學研究和更有效地培養(yǎng)年輕的兩棲及多棲科學家也是他在不斷思索的一個問題。他認為這是一個重要的科學戰(zhàn)略問題,應該引起科學決策者的更多關注。
值得慶幸的是,國家已經(jīng)意識到這一戰(zhàn)略要求,2011年底,中科院依托數(shù)學院成立了國家數(shù)學與交叉科學中心,李雷參加了中心下屬的數(shù)學與生物/醫(yī)學交叉部,具體參加重大慢性多發(fā)疾病的動態(tài)網(wǎng)絡構(gòu)建的項目。雖然啟動時間不長,但李雷和他的同事們的工作進展還算順利。目前他們與北京大學醫(yī)學部合作,以小鼠為模型,研究2型糖尿病的發(fā)生發(fā)展機制,以應對近年來糖尿病高發(fā)對社會家庭造成的巨大負擔。此外李雷指導學生繼續(xù)進行計算生物學中的基礎研究,包括新一代高通量測序與堿基辨識中的一些問題,以及癌癥的基因組學研究等。
李雷也非常希望重拾因回國而中斷的衰老和長壽方面的研究。中國已逐漸進入老齡社會,這方面的科學研究對國民健康、家庭和諧、醫(yī)療社會保險政策的制定都非常有意義。而這也恰好契合了當初他選擇應用數(shù)學的初衷:數(shù)學搬下高閣,飛入尋常百姓家。長壽機制的研究,使得老百姓的生命有了“細水長流”的希望。
最后,李雷說他所在的國家數(shù)學與交叉科學中心生物/醫(yī)學交叉部,希望有更多海內(nèi)外有實力的計算生物學家、生物信息學家、種群遺傳學家加入到他們的隊伍中來,多學科薈萃交融,共筑和諧新世界。他們同時希望與更多生物學家、醫(yī)院、醫(yī)生廣泛合作,運用他們的數(shù)學與計算能力為生命科學服務,特別是為中國的農(nóng)業(yè)科技和改善人民健康服務。
book=66,ebook=37