氣候科學(xué)正在人類與機器之間締結(jié)更加完美的聯(lián)盟。
厄爾尼諾現(xiàn)象:在傳統(tǒng)人類學(xué)習(xí)的輔助下,深度學(xué)習(xí)也許不久就能預(yù)報目前難以預(yù)測的厄爾尼諾事件,就像圖中顯示的厄爾尼諾現(xiàn)象一樣。2015年,四個熱帶氣旋“基洛”“伊格納西奧”“希梅納”“TD14E”在太平洋肆虐
機器學(xué)習(xí)領(lǐng)域在過去20年間取得很大進展,人類能不能在國際象棋之類的比賽中擊敗計算機這個問題不再令人有所疑問;我們贏過計算機的概率幾乎就像在仰臥推舉比拼中對戰(zhàn)叉車。但是,問一下目前的計算機國際象棋冠軍,也就是谷歌的AlphaZero,向它請教象棋對弈的理論,譬如在西班牙開局中,是象還是馬更具價值?你所能得到的反饋是閃動的光標發(fā)出的茫然注視。理論是人類的概念,算法并不需要什么理論。計算機只知道如何在任何給定的位置找到最佳的一步,因為它受到廣泛的訓(xùn)練,也就是通過自我練習(xí),學(xué)會棋子怎么走最好。
AlphaZero之類的成功故事背后隱藏著的計算方法已經(jīng)被取名為“深度學(xué)習(xí)”,如此的稱呼是因為這些計算方法利用深度神經(jīng)網(wǎng)絡(luò)之類的復(fù)雜結(jié)構(gòu),在輸入與輸出之間有多層計算節(jié)點。輸入內(nèi)容可以有豐富的構(gòu)造,就像象棋棋盤上的棋子位置或者圖片中的像素色值,而輸出內(nèi)容也許是做出決定所需要的某項評估,就像可能的某步棋的評估值,或者一張圖片是吉娃娃犬照片而非藍莓瑪芬蛋糕照片的概率。訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)通常牽涉調(diào)節(jié)所有可獲取的刻度盤,也就是調(diào)節(jié)模型的參數(shù),直至它對于一組訓(xùn)練數(shù)據(jù)表現(xiàn)良好,接著再測試它對于另一組樣本以外的數(shù)據(jù)集的表現(xiàn)。對于這類系統(tǒng),一種抱怨是說,一旦它們的訓(xùn)練完成,它們就成為黑盒;算法到底是如何處理所給予的信息的,為什么要那么處理?這常常是個于謎團。(當(dāng)這僅僅牽涉一次象棋棋局時,事情并不要緊,但是當(dāng)同樣的技術(shù)用于判定民眾的信譽度或者實施犯罪的可能性時,對問責(zé)的要求就提高了,這是可以理解的。)節(jié)點的層次越多,在學(xué)習(xí)環(huán)節(jié)中要調(diào)整的參數(shù)也就越多,這個“盒子”變得更不透明。
然而,除了在棋盤上立于不敗之地,深度學(xué)習(xí)算法已經(jīng)在金融、廣告、醫(yī)藥領(lǐng)域取得成功。有點讓人吃驚的是,下一塊倒下的多米諾骨牌也許是天氣預(yù)報。這是機器學(xué)習(xí)要承擔(dān)的令人驚訝的挑戰(zhàn),部分原因是傳統(tǒng)的人類學(xué)習(xí)(由計算機增強,但僅僅用于數(shù)值計算)早已經(jīng)很好完成天氣預(yù)報的任務(wù)。如上所述,當(dāng)深度學(xué)習(xí)方法闖入有所建樹的學(xué)科時,所發(fā)生的情況是有趣的案例研究。人類與機器之間的這次新競賽能為科學(xué)的未來預(yù)示什么?
氣象學(xué)與象棋不同,背后有許多成熟的理論。流體動力學(xué)的方程或者陸地與大氣之間的能量轉(zhuǎn)移這類基本物理關(guān)系為天氣系統(tǒng)形成和演變的方式設(shè)定界限?;跉鉁?、風(fēng)速、濕度等的當(dāng)前測量值,并且將測量誤差引起的不確定性考慮在內(nèi),可以建立一套方程;當(dāng)前最先進的天氣預(yù)報實際上相當(dāng)于那套方程的模擬解。神經(jīng)網(wǎng)絡(luò)無論有多么“深度”,都是從完全一無所知的位置起步,要一下子惡補所有理論知識,都會度過一段艱難時期。因此,機器學(xué)習(xí)和氣候科學(xué)的前沿研究者最近開始使用不同的方法:結(jié)合我們對于氣象學(xué)已經(jīng)了解的知識與深度學(xué)習(xí)的能力,來揭開我們并不知曉的氣象模式。
在2019年9月的《自然》雜志上,韓國全南國立大學(xué)海洋學(xué)系的咸佑根(Yoo-Geun Ham)、金貞煥(Jeong-Hwan Kim)與中國南京信息工程大學(xué)氣候與應(yīng)用前沿研究院的羅京佳共同宣布,他們成功地用一種全新的深度學(xué)習(xí)算法,最多可以提前18個月預(yù)測厄爾尼諾事件的發(fā)生。厄爾尼諾是指東太平洋地區(qū)海面溫度的冷暖振蕩中的升溫階段。它對全球天氣中期預(yù)報造成長期難題。在厄爾尼諾出現(xiàn)的年份里,正常的天氣模式被完全顛覆,世界部分地區(qū)會目睹更濕潤的氣候狀況和更嚴重的風(fēng)暴,而其他地區(qū)經(jīng)歷更久的干旱。最大的影響發(fā)生在南美洲的西海岸,那兒的大量降雨能引發(fā)災(zāi)難性的洪水,而海洋溫度的改變威脅到該地區(qū)所依賴的漁業(yè);而在南太平洋的另一邊,干旱、強風(fēng)的情況比往年嚴重三倍,氣溫高過歷年平均氣溫,所有這些因素都加劇了爆發(fā)叢林大火的風(fēng)險,就像目前正在澳大利亞新南威爾士州熊熊燃燒的野火一樣。
厄爾尼諾現(xiàn)象的社會成本極其龐大;它已經(jīng)關(guān)系到水短缺、饑荒、傳染病傳播和民眾動亂。(1789年至1793年間歐洲農(nóng)作物產(chǎn)量的下降甚至可能引發(fā)了法國大革命。)因此,更好預(yù)報厄爾尼諾、為它做好準備的潛在益處同樣巨大。問題在于,厄爾尼諾事件僅僅在有些時候是有規(guī)律的。厄爾尼諾的記錄可追溯到19世紀后期,那時厄爾尼諾被首次描述為全球性現(xiàn)象,兩次事件之間通常間隔2~7年,但在此之外,并沒有找到真正的模式。而且,每次厄爾尼諾的嚴重程度和類型各有不同,具體要看海洋溫度的最大異常到底出現(xiàn)在哪里,而每個類型都產(chǎn)生一套獨特的天氣現(xiàn)象。取決于你生活在哪里,你也許不會注意到一場厄爾尼諾現(xiàn)象剛剛結(jié)束。2019年的厄爾尼諾在秋天結(jié)束,屬于輕微的類型。
在咸佑根與他的共同作者之前,最出色的預(yù)報者能提前一年預(yù)測到厄爾尼諾事件,但有理由相信,尚有改進的空間。首先,海洋溫度的變化不是那么迅速,波動不像個別天氣系統(tǒng)那么混亂。海溫異常也存在某種周期性;厄爾尼諾的升溫階段之后,一般緊隨名叫拉尼娜的降溫階段,就像一波巨大的熱浪在太平洋中來回行進。于是,雖然具體的緣由與時機仍然不清楚,但變暖的信號也許提前很久就存在了。
他們決定使用卷積神經(jīng)網(wǎng)絡(luò),同樣的網(wǎng)絡(luò)架構(gòu)用于圖像識別之類的機器視覺問題。他們想看一下,它是否能在洋溫數(shù)據(jù)中識別出能預(yù)測厄爾尼諾事件的特征。然而,為了訓(xùn)練模型,他們不能僅僅依賴于歷史數(shù)據(jù),因為可以分配的數(shù)據(jù)量并不足夠。洋溫的月度記錄僅能追溯至1871年,而且有部分數(shù)據(jù)需要保留,用于確證模型在用于訓(xùn)練的樣本數(shù)據(jù)以外的預(yù)測能力。神經(jīng)網(wǎng)絡(luò)技術(shù)最適合應(yīng)用于大數(shù)據(jù)的問題,而厄爾尼諾數(shù)據(jù)的規(guī)模小得令人失望。
這是新穎的數(shù)據(jù)科學(xué)與老式的氣候?qū)W相融合的領(lǐng)域。
他們最先沒有用歷史數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò),而是在一批“模擬”中進行訓(xùn)練。這些“模擬”由全球各地的研究團隊制作,作為“耦合模式比較項目”( Coupled Model Intercomparison Project ,CMIP)的一部分收集而來。CMIP是一個大規(guī)??蒲谐h,分享氣候模型,比較萬兆字節(jié)容量的預(yù)測,旨在了解不同的未來情況下會發(fā)生什么。一些模擬情景代表另一個過去,就像氣候歷史小說,而這些故事要足夠詳細,包括厄爾尼諾事件之類的特征。于是,這些“模擬”代表貌似真實的數(shù)據(jù),由已知的氣候模型來提供約束邊界。它們也許與真實數(shù)據(jù)尚有距離,但它們的真實性足以充當(dāng)真實數(shù)據(jù)的替身。咸佑根等人使用替代數(shù)據(jù),能在相當(dāng)于2 961年的觀測結(jié)果的數(shù)據(jù)集上訓(xùn)練神經(jīng)網(wǎng)絡(luò)。然后,他們使用這些訓(xùn)練的結(jié)果作為從實際歷史數(shù)據(jù)中學(xué)習(xí)的起點。他們將實際歷史數(shù)據(jù)分為兩部分,1871到1973年的數(shù)據(jù)用于訓(xùn)練,1984到2017年的數(shù)據(jù)用于樣本以外的驗證。
研究結(jié)果讓人嘆為觀止。神經(jīng)網(wǎng)絡(luò)的表現(xiàn)勝過以前的最出色預(yù)報,做出預(yù)報的時間越早,兩者的差距越大。即便相隔18個月,神經(jīng)網(wǎng)絡(luò)也能預(yù)見厄爾尼諾事件的出現(xiàn),很好估計厄爾尼諾現(xiàn)象的程度,甚至能根據(jù)溫度峰值出現(xiàn)在太平洋中部或東太平洋而將它們分類。它在預(yù)報北方春夏時節(jié)的厄爾尼諾現(xiàn)象時,表現(xiàn)尤其出色;而因為厄爾尼諾現(xiàn)象與南亞地區(qū)季風(fēng)之間復(fù)雜的相互影響,以前的模型都會在此陷入“預(yù)測障礙”。
訓(xùn)練一個系統(tǒng),讓它在一個任務(wù)上表現(xiàn)良好(在這里,就是在一組模擬數(shù)據(jù)基礎(chǔ)上預(yù)報厄爾尼諾現(xiàn)象),再將那些知識應(yīng)用到另一個任務(wù)上,這項技術(shù)稱為遷移學(xué)習(xí)。咸佑根在預(yù)報厄爾尼諾上獲得的成功表明:這個方法結(jié)合了氣候?qū)W與深度學(xué)習(xí)的優(yōu)點。氣候模型生成的模擬為神經(jīng)網(wǎng)絡(luò)提供充足的數(shù)據(jù),讓它從中學(xué)習(xí),實質(zhì)上是訓(xùn)練神經(jīng)網(wǎng)絡(luò),讓它像氣候模型一樣思考,但那些模型必然承受某種系統(tǒng)性差錯。用真實的歷史數(shù)據(jù)來微調(diào)神經(jīng)網(wǎng)絡(luò),消除差錯,讓神經(jīng)網(wǎng)絡(luò)尋找到科學(xué)家也許未曾想到去尋找的特征,最終成果就是更為準確的預(yù)報。
作為最后一次合理性檢查,以證明他們的模型實際上將氣候理論的一些教訓(xùn)吸收了,建模者利用神經(jīng)網(wǎng)絡(luò)對1997年到1998年間的厄爾尼諾進行了事后分析,那是有記錄以來最嚴重的一次厄爾尼諾現(xiàn)象。他們輸入了1996年5月、6月和7月的洋溫數(shù)據(jù),看見特定區(qū)域的神經(jīng)元亮了,這表明厄爾尼諾事件的有利情況正在形成。1996年,熱帶西太平洋海洋變暖開始形成趨勢,如同上膛的槍,接著,印度洋西南區(qū)域的較冷情況將趨勢推向東部,導(dǎo)致大約1年后出現(xiàn)極強的厄爾尼諾現(xiàn)象。在副熱帶大西洋出現(xiàn)比往年平均洋溫更低的情況,這反而加重了事態(tài)。不像某種神秘的神諭黑盒,模型識別出這些意義深遠的特征,而它們?nèi)挤蠚夂驅(qū)W家對于世界不同地區(qū)洋溫與氣候描述方式之間關(guān)系的認知。神經(jīng)網(wǎng)絡(luò)比任何人都更早看見厄爾尼諾的到來,假如預(yù)警系統(tǒng)布置到位的話,這或許足夠讓受影響區(qū)域的民眾更好防備厄爾尼諾的破壞沖擊。
追蹤厄爾尼諾現(xiàn)象所展示的混合方法也許提供了新模式,即將成功的機器學(xué)習(xí)技術(shù)應(yīng)用到如氣候科學(xué)之類的重視理論的領(lǐng)域。這些新的突破顯示出,科研的未來不是爭奪地盤,而可能是合作,結(jié)合傳統(tǒng)科學(xué)與數(shù)據(jù)科學(xué)的優(yōu)勢。在2019年的《自然》雜志的另一篇論文中,來自德國馬克斯?普朗克生物化學(xué)研究所生物地球化學(xué)整合系的第一作者馬庫斯?賴希施泰因(Markus Reichstein)主張“語境線索”(即已知理論預(yù)測的數(shù)據(jù)的關(guān)系)的重要性。他將這視為增強地球科學(xué)中深度學(xué)習(xí)方法的途徑。我們沒有理由預(yù)期這種途徑會止步于此。
與此同時,機器學(xué)習(xí)也許在恰當(dāng)時候給予氣候科學(xué)推動力,這多虧了我們發(fā)現(xiàn)所面臨的接連不斷的氣候災(zāi)難。尤其是,盡管厄爾尼諾所影響的天氣系統(tǒng)預(yù)計在未來會更極端,但氣候變化是否會提高厄爾尼諾事件的頻率或嚴重性呢?對此仍然沒有形成科學(xué)共識。政府間氣候變化專門委員會2013年的報告僅僅聲稱,它預(yù)計厄爾尼諾會持續(xù)出現(xiàn),但對于它可能的變化方式?jīng)]有多少把握。厄爾尼諾事件依賴于海洋冷暖水體、大氣、信風(fēng)等等之間的復(fù)雜反饋回路。擾亂這些循環(huán)的部分,可能會關(guān)閉整個回路,使厄爾尼諾的情況更頻發(fā),甚至可能永久存在,或者沒有明顯結(jié)果。
想明白如何為未來的極端天氣定好計劃,就像在棋子不斷變化的棋局中尋找最佳策略。這會耗費一臺超級電腦的所有學(xué)習(xí)能力以及一位象棋特級大師的所有經(jīng)驗。