中國地震局地震預測研究所 陳會忠
地震大數(shù)據(jù)思維
Thinking on big data of earthquakes
中國地震局地震預測研究所 陳會忠
美國政府在2012年3月21日宣布大數(shù)據(jù)時代計劃,“Big Data is a Big Deal”,地質(zhì)調(diào)查局(USGS)承擔了重要任務。這是美國政府第二次宣布信息技術計劃,第一次是在1994年宣布信息高速公路計劃,此后互聯(lián)網(wǎng)的發(fā)展幾乎改變了世界。
USGS的約翰?韋斯利?鮑威爾的“分析與集成中心”啟動了8個新的研究項目,將地球科學理論的大數(shù)據(jù)集,轉變成為科學發(fā)現(xiàn)。其中,包括“地震復發(fā)率及最大震級地震全球統(tǒng)計模型”的研究,美國認為近期全球發(fā)生的一系列地震事件再次證明,即使是最好的地震監(jiān)測網(wǎng)絡也無法實現(xiàn)對有連續(xù)歷史記錄以來的最高級別地震的預測,這意味著人類預測地震能大數(shù)據(jù)的倡導者維克托?邁爾?舍恩伯格說:“大數(shù)據(jù)是人們獲得新的認知,創(chuàng)造新的價值的源泉?!币虼撕芏嗳苏J為大數(shù)據(jù)是信息技術的新發(fā)展,而這個發(fā)展可能像互聯(lián)網(wǎng)一樣標志著一個新的時代的來臨。
大數(shù)據(jù)的來源
大數(shù)據(jù)就是巨量數(shù)據(jù),巨量數(shù)據(jù)是怎么產(chǎn)生的?巨量數(shù)據(jù)的產(chǎn)生一定力之有限。該計劃的目標是重新評估發(fā)生在所有主要板塊邊界和板塊內(nèi)部環(huán)境的地震等級、發(fā)生頻率和震級分布,以及最大震級,以改進地震預警(測)模型,并使美國的災害評估建立在更為強大的全球數(shù)據(jù)及其分析基礎之上。
現(xiàn)在人類面對巨量數(shù)據(jù)的挑戰(zhàn),什么是大數(shù)據(jù)?人們并未形成統(tǒng)一的認識,一般而言,它是指規(guī)模遠遠超過傳統(tǒng)數(shù)據(jù)庫軟件處理能力的海量數(shù)據(jù)集合。這一概念首要是針對信息化社會數(shù)據(jù)“爆炸式”增長,體量巨大而提出的。
據(jù)美國政府估計,全球每年由各類設備產(chǎn)生的數(shù)據(jù)達到約1.2 ZB(1 ZB=12億TB)。若用1粒沙代表1 B數(shù)據(jù),1 PB(相當于1000 TB)相當于1英里長、100碼寬的沙灘,而1.2億ZB的數(shù)據(jù)就如同一片浩瀚的沙漠。是:傳感器和設備從精密到簡單、從笨重到智能、從昂貴到廉價、從量少到量大。當前是移動互聯(lián)網(wǎng)時代,互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),從臺式計算機、筆記本計算機到手機,從成千上萬APP應用到物聯(lián)網(wǎng),從MEMS傳感器到可穿戴設備,這一切都是從精密到簡單,從笨重到智能、從昂貴到廉價、從量少到量大,大數(shù)據(jù)就是在這個背景下產(chǎn)生的。
設備從精密到簡單,從昂貴到廉價,從笨重到智能,從量少到量大
最明顯的例子就是智能手機,現(xiàn)在手機的能力和阿波羅登月指揮用的計算機性能是一樣的,那時價值幾億美元??墒乾F(xiàn)在手機的成本不到1000元人民幣?,F(xiàn)在全國有6億部智能手機,7×24小時產(chǎn)生著巨量數(shù)據(jù),這就是大數(shù)據(jù)的根源之一。
地震烈度速報
汶川特大地震發(fā)生之后,盡管我國地震速報在震后快速測定了震中參數(shù),但是我國那時還沒有建立常規(guī)運行的地震烈度速報系統(tǒng),無法提供有效的地震烈度速報圖,因此對于汶川地震的應急響應和緊急救援產(chǎn)生了巨大影響。地震烈度速報被緊急提到議事日程上。美國自1994年北嶺地震之后,開始對震動圖(Shakemap)進行研究。在美國南加州臺網(wǎng),如果網(wǎng)內(nèi)一個破壞性地震發(fā)生之后能夠快速提供峰值地面加速度、速度的空間分布圖和儀器地震烈度分布圖,稱為地震動圖Shakemap。由于現(xiàn)有的地震臺網(wǎng)的臺站密度不夠,烈度速報就需要增加臺站,但是當時由于經(jīng)費條件不允許,于是就采用地球模擬器的辦法,在實際臺站之間增加“虛擬地震臺”來“加密”地震臺網(wǎng),獲得地震以后的地震動圖,它顯示的是地震產(chǎn)生的地面運動和儀器烈度。下圖就是我國山西地震臺網(wǎng)產(chǎn)生的動態(tài)Shakemap。
山西地震臺網(wǎng)的觀測烈度速報
由于日本是個多地震的國家,非常重視對地震的監(jiān)測,快速向公眾發(fā)布地震的信息,由于烈度速報比地震三要素的參數(shù)速報在處理上簡單,速度快,公眾容易理解,日本的地震速報就是烈度速報,一般一個地震發(fā)生后,在1~2分鐘地震烈度的信息就可發(fā)布。這需要的就是建立有效的密集地震監(jiān)測網(wǎng),日本在20世紀阪神地震之后,投入巨資在全國建立具有1000多個地震臺的Hi-net,這使日本在烈度速報上非常迅速,Hi-net目前已經(jīng)發(fā)展到3000個臺站。因此,日本是最早利用密集地震臺網(wǎng)實現(xiàn)烈度速報的國家,突破了傳統(tǒng)的以地震三要素測定的地震速報。
2013年12月14日12時06分日本千葉近海5.5級地震烈度速報圖(使用了800多個臺站,震后3分多鐘發(fā)布)
地震預警
地震預警也是在汶川地震,特別是日本3?11地震之后被越來越多的人提出來,很多人把地震預警和地震預報等同起來,這是因為在漢字里“預”字有預先之意,其實這是一個翻譯的問題。地震預警這個詞是從英文“Earthquake Early Warning”翻譯過來的。日本叫“地震緊急速報”,中文應翻譯為“地震報警或地震警報”,而不應翻譯成“地震預警”。翻譯成地震預警容易和地震預報混淆。美國在西海岸新建立的地震預警試驗系統(tǒng)就叫作“Shake Alert”系統(tǒng),即震動報警系統(tǒng)。因此,目前所說的地震預警,就是地震警報!
之所以叫地震警報,就是在一個地方已經(jīng)發(fā)生了地震,當?shù)氐牡卣鸨O(jiān)測儀器在測出了地震之后,發(fā)出警報:我這地震了!由于地震波的速度只有每秒幾千米,相對電磁波的每秒30萬千米的速度要慢得多,人們就將地震發(fā)生的消息用電磁波手段(電話、廣播、電視、網(wǎng)絡、手機)迅速地傳給遠方,在離地震發(fā)生比較遠的地方,收到警報時地震波還未到達,這時采取緊急措施逃生和關閉電、氣、水等生命線設施,地鐵、高鐵減速等等,可以減少損失,避免次生災害發(fā)生。這就和防空警報一樣,知道敵機已經(jīng)起飛了,拉響防空警報,提醒人們及時躲避。
如前所述,地震預警是一種報警技術,它是建立在現(xiàn)代地震觀測技術和信息技術基礎上發(fā)展起來的新技術。但是地震預警技術從原理上就存在“預警盲區(qū)”。如前所述,地震預警是在大地震發(fā)生后,向遠處發(fā)出大地震警報。從大地震發(fā)生到警報的發(fā)出,是需要時間的,這個時間是地震波從震源到達地震臺的時間和地震臺收到地震信號判定地震需要的處理時間總和。換句話說,地震發(fā)生了,并不能立刻拉警報,需要地震臺(網(wǎng))收到地震信號,并且確定是大地震后,才能拉警報。在這段時間地震波照樣傳播,由于大地震主要是由S波造成破壞,這段時間對應的S波傳播的距離,我們稱之為盲區(qū)。即地震警報到達該地區(qū)時,地震波已經(jīng)到達或已經(jīng)過去。換句話說警報收到時,具有最大破壞力的S波已經(jīng)掃過了。為了縮小地震的盲區(qū),最重要的是和地震烈度速報一樣,也需要密集地震觀測網(wǎng),根據(jù)研究地震預警網(wǎng)至少需要10千米就要建立一個地震臺站,如果用傳統(tǒng)的技術建立地震臺站,這需要巨額投資。
MEMS傳感器烈度計和智能設備
中國地震局在國家發(fā)改委的支持下,在下一代互聯(lián)網(wǎng)地震應用的開發(fā)項目中,開發(fā)了一系列移動互聯(lián)網(wǎng)應用技術。特別是以智能手機為基礎,結合MEMS技術開發(fā)了地震烈度計和動態(tài)地震烈度網(wǎng)技術,這種技術可以適合大量密集地震觀測網(wǎng)的布設。
2013年10月美國BSSA上發(fā)表了一篇題為“Suitability of low-cost three-axis MEMS accelerometers in strongmotion seismology: tests on the LIS331DLH (iPhone) accelerometer”的文章,在該研究中,美國地震學家和技術人員檢驗了安裝在iPhone手機中的LIS331DLH MEMS加速計,這種微機電系統(tǒng)MEMS加速度計是用于手機倒換桌面屏幕的傳感器。他們將MEMS傳感器和地震觀測用的傳統(tǒng)強震儀EpiSensor力平衡加速計(force-balance accelerometer,F(xiàn)BA)ES-T做了比較和測試,得到結論是,微機電系(micro-electro-mechanical systemMEMS)為地震觀測提供一種新的、可以大量布設且廉價方便的新設備,其成本要比傳統(tǒng)地震儀便宜近20倍。MEMS傳感器地震烈度計技術和移動互聯(lián)網(wǎng)技術結合使密集地震觀測網(wǎng)技術得以實現(xiàn)。
如上所述,密集地震觀測網(wǎng)完全遵循了大數(shù)據(jù)產(chǎn)生的規(guī)律,從精密的傳統(tǒng)地震儀到簡單的MEMS烈度計,從昂貴的設備到廉價的MEMS設備,從高精度儀器到智能化的設備,從一兩百千米稀疏的量少臺站到10千米左右量大的密集地震觀測網(wǎng)。地震觀測的數(shù)據(jù)從小數(shù)據(jù)變成了大數(shù)據(jù)。所以說,密集地震觀測網(wǎng)將會把地震帶進大數(shù)據(jù)時代。
地震大數(shù)據(jù)的產(chǎn)生起源于密集地震觀測網(wǎng),密集地震觀測網(wǎng)無論在空間采樣,還是在時間采樣上都是傳統(tǒng)地震觀測網(wǎng)無法與之比擬的,我國密集地震觀測網(wǎng)將會擁有數(shù)萬到數(shù)十萬個傳感器,地震預警和地震烈度速報催生了密集地震臺網(wǎng),密集地震觀測網(wǎng)突破了傳統(tǒng)地震觀測方式,它無須精密傳感器和精細選臺,可以在任何地方布設。無須巨額投資,建設簡單,智能設備基本免維護。數(shù)量多而密,代替了傳統(tǒng)的少而稀、造價昂貴的地震臺,而密集地震臺網(wǎng)產(chǎn)生了巨量數(shù)據(jù),它是地震大數(shù)據(jù)的基礎。但是地震大數(shù)據(jù)絕不僅僅是專業(yè)密集地震觀測網(wǎng)的數(shù)據(jù),根據(jù)互聯(lián)網(wǎng)+地震的技術,地震大數(shù)據(jù)還必須加上來自互聯(lián)網(wǎng)的各種數(shù)據(jù)。這里有兩個例子。一是云創(chuàng)公司生產(chǎn)的“我的PM2.5”這樣的智能設備,它內(nèi)設的傳感器包括PM2.5、溫度、濕度、氣體、磁場、振動等。據(jù)說它的室內(nèi)測試設備很快就要突破100萬臺,它采集的所有數(shù)據(jù)都將通過環(huán)境云平臺進入互聯(lián)網(wǎng),這將比行業(yè)數(shù)據(jù)大得多。第二個例子就是日本的家庭地震報警器,據(jù)說已經(jīng)有數(shù)十萬臺,這個報警器內(nèi)設MEMS振動傳感器,和互聯(lián)網(wǎng)相連,已經(jīng)是日本地震烈度速報九成的數(shù)據(jù)來源。
PM2.5室內(nèi)探測器、日本家庭地震報警器和工作流程
地震數(shù)據(jù)從小數(shù)據(jù)到大數(shù)據(jù)完全顯示了大數(shù)據(jù)思維的概念。地震小數(shù)據(jù),由于傳統(tǒng)地震臺站觀測儀器精密昂貴,地震觀測技術復雜,因此地震觀測臺站之間一般都要一兩百千米甚至數(shù)百千米,地震臺網(wǎng)稀疏。因此,信息的匱乏使地震研究趨向于采用因果關系范式,因為數(shù)據(jù)少,只能在很多邊界條件下處理這些少量的數(shù)據(jù)以找出因果。但是如果處理出問題,可能因果關系并不存在。
但是大數(shù)據(jù),假如各種地震觀測手段都是密集觀測網(wǎng)都產(chǎn)生海量數(shù)據(jù)。依照傳統(tǒng)角度來看,這些數(shù)據(jù)量大、紛雜、混亂、無法使用、無法處理,甚至根本和地震“無關”,但是這就是所謂的“全量數(shù)據(jù)”,也就是大數(shù)據(jù)。數(shù)據(jù)的紛繁雜亂才是數(shù)據(jù)的真正狀態(tài),呈現(xiàn)出世界的復雜性和不確定性特征,想要獲得大數(shù)據(jù)的價值,承認混亂而不是對抗或避免混亂才是一種可行的路徑。正如一個數(shù)據(jù)庫專家所言:“我們再也不能假裝活在一個整齊的世界里?!?/p>
大數(shù)據(jù)時代對于數(shù)據(jù)的研究完全有條件向關聯(lián)、非關聯(lián)等相關關系探究的轉變。在商業(yè)上的一個超市,在對消費者購物行為進行分析時發(fā)現(xiàn),男性顧客在購買嬰兒尿片時,常常會順便搭配幾瓶啤酒來犒勞自己,于是推出了將啤酒和尿片捆綁銷售的促銷手段。如今,這一“啤酒+尿片”的數(shù)據(jù)分析成果也成了大數(shù)據(jù)技術應用的經(jīng)典案例。
在地震大數(shù)據(jù)應用上,中國地震臺網(wǎng)中心張崇立的前兆異常度的案例說明了大數(shù)據(jù)應用前景。案例很簡單,就是將汶川地震前每周會上提出的前兆數(shù)據(jù)異常數(shù)和在劃分的二級塊體里臺站的比例稱為前兆異常度。按照大數(shù)據(jù)的方式,不管這些數(shù)據(jù)的手段和學科(地震前兆觀測數(shù)據(jù)包括地形變、地磁、地電、地下流體、地球化學、地表面振動、地震等學科及幾百種觀測手段和儀器),也不管它的空間維度和結構,只要出現(xiàn)異常就帶入異常度公式計算。
我們定義“異?;顒佣取睘?,“表示某一地塊(或某一地質(zhì)構造單元)在某一t時刻表現(xiàn)為異常活動的劇烈程度的參量”。一般地,理論上用下式表示:
式中,AZCL是一個無量綱的參量;S用來量度與孕育某個震級水平的地震相匹配的、且不可再分的基本地質(zhì)構造單元的理論空間尺度,它與根據(jù)研究對象的需要所設定的震級下限有關;ε是對應于S的地質(zhì)構造單元特征空間尺度參量,它是S的近似值,與“地震-構造活動”的關系研究結果的準確性和精細程度有關;NA表示某一具ε特征空間尺度的地質(zhì)構造單元內(nèi)在t時刻呈異?;顒訝顟B(tài)的質(zhì)點數(shù);N表示與ε對應的地質(zhì)構造單元內(nèi)質(zhì)點的總數(shù)。
對汶川地震前每周的異常度的前六個月到前一周進行計算。結果像發(fā)現(xiàn)啤酒和尿片有關系一樣,發(fā)現(xiàn)前兆異常度和二級塊體巴顏克拉有很好的關聯(lián)性,而用其他劃分方法找不到相關性。
使用大數(shù)據(jù)關聯(lián)方法開展地震前兆異常度的研究表明:地震前兆觀測數(shù)據(jù)是和構造體有關的,它們是相關聯(lián)的。汶川地震前前兆異常度的變化,和巴顏克拉塊體有關聯(lián),這和各方面研究結論是相一致的。
大數(shù)據(jù)使處理更為簡單
傳統(tǒng)的小數(shù)據(jù)時代,在由于數(shù)據(jù)的限制而無法突破的情形下,數(shù)據(jù)處理算法的研究越來越深入,發(fā)明的算法也越來越復雜。比如測定地震參數(shù)的算法就是這樣,現(xiàn)在地震的定位使用了數(shù)十種方法,越來越復雜,速度也越來越慢,需要的計算機能力越來越高。如前所述,當數(shù)據(jù)量以指數(shù)級擴張時,原來在小數(shù)量級的數(shù)據(jù)中表現(xiàn)很差的簡單算法,準確率會大幅提高。大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更為有效。密集地震臺網(wǎng)的定位基本就是最先到達臺站的平均間隔,就可能比傳統(tǒng)臺網(wǎng)定位準確。而震級的計算根本不需要在量取震相賦值,而是計算密集地震臺網(wǎng)地震波掃過后最大震動的面積,這個面積其實就是金森博雄的矩陣級公式,只需轉換一下系數(shù),處理快速簡單而準確。
大數(shù)據(jù)變審慎決策為快速決策
傳統(tǒng)地震臺網(wǎng)處理和決策都非常慎重,通過收集和分析數(shù)據(jù)來驗證這種假設;如果有一些數(shù)據(jù)有問題,就影響原有假設,決策與行動是審慎的。小數(shù)據(jù)的地震速報可以較快地進行自動速報,但是處理復雜,要多中心審慎決策,特別是終報更需要審慎決策。原因是小數(shù)據(jù)依靠模型解算方程,由于空間數(shù)據(jù)間隔太大,往往初值確定度準確,大量計算可能仍然得不到可靠的結果,必然影響快速決策。
密集地震臺網(wǎng)的大數(shù)據(jù),不再受限于傳統(tǒng)的方式,在密集的大數(shù)據(jù)里可以簡單而準確地得到地震在哪兒和多大,無須一而再地檢查和復核。足以做出快速決定,地震預警的警報可以在數(shù)秒內(nèi)發(fā)出,地震烈度速報可以在幾分鐘就發(fā)出。快速決策對于大地震的減輕災害影響和挽救生命無疑具有重要的意義。
大數(shù)據(jù)使“人類從依靠自身判斷(依靠計算模型)做決定到依靠數(shù)據(jù)做決定的轉變,也是大數(shù)據(jù)做出的最大貢獻之一”(大數(shù)據(jù)時代),因此大數(shù)據(jù)推進了新的模式和新業(yè)態(tài),對于地震科學技術和地震行業(yè),也帶來了新模式,催生了新業(yè)態(tài)。
大數(shù)據(jù)支撐地震應急救援
在互聯(lián)網(wǎng)+地震時,就產(chǎn)生了地震互聯(lián)網(wǎng)大數(shù)據(jù),“中國地震臺網(wǎng)速報”和“中國國際救援隊”兩個新浪微博賬號,擁有1200萬粉絲。一個地震微博將會影響數(shù)億人,產(chǎn)生的數(shù)據(jù)足以稱為大數(shù)據(jù),它完全反映一個地震和各行各業(yè)的關聯(lián),反映社會在地震時的狀態(tài)。根據(jù)互聯(lián)網(wǎng)的大數(shù)據(jù)得到的和地震關聯(lián)的數(shù)據(jù)信息,既快速又準確,加快了大地震應急和救援的速度和能力。例如互聯(lián)網(wǎng)大數(shù)據(jù)產(chǎn)生的熱力圖,它表示了人口的實時流動,就是實時人口分布圖,在發(fā)生大地震時它立刻指明了生命救援的方向。
2010年1月2日海地發(fā)生了7.0級強烈地震,造成22萬人死亡。嚴重的災害造成大量人口流動,使救援組織難以有效地進行救助和重建計劃,利用移動電話運營商(Digicel)1 900 000部手機的大數(shù)據(jù)分析了地震42天之前到341天之后人口的流動。地震之后十九天,導致首都太子港人口減少了約23%。研究表明人口的流動比較混亂,但是人口流動的軌跡明顯,離開首都的人的目的地在地震后的前三個星期是高度相關。特別是他們的流動模式對于人道主義救援和災后重建意義重大。研究結果表明在災害中的人口變動使用大數(shù)據(jù)預測更為有效。物聯(lián)網(wǎng)大數(shù)據(jù)的地震應用
物聯(lián)網(wǎng)大數(shù)據(jù)將給地震帶來新的業(yè)態(tài)。
2014年8月24日美國舊金山納帕發(fā)生了6.0級地震,根據(jù)消費電子公司Jawbone的數(shù)據(jù),當時那些地區(qū)的居民絕大多數(shù)(占93%)都被震醒了。Jawbone公司對灣區(qū)成千上萬的UP手環(huán)佩戴者進行了睡眠追蹤,這個手環(huán)支持計步和睡眠追蹤功能。數(shù)據(jù)表明在震中附近的納帕、索諾瑪?shù)鹊兀瑤缀跛腥胨氖汁h(huán)用戶都被地震驚醒。隨著距離震中越來越遠,地震能吵醒的人迅速減少,在舊金山和奧克蘭地區(qū)有一半以上的UP手環(huán)佩戴者在地震中醒來。到了75英里外的莫德斯托和圣克魯斯,睡著的用戶幾乎沒有受到任何影響,45%接近地震震中的人在地震發(fā)生后沒有再入眠。這被稱為Jawbone手環(huán)繪出“地震源”。
手環(huán)地震驚醒記錄曲線
手環(huán)驚醒“震動圖”物聯(lián)網(wǎng)可穿戴手環(huán)繪出“地震源”
從地震烈度速報和預警到密集地震觀測網(wǎng)絡,從密集地震觀測網(wǎng)絡再到地震大數(shù)據(jù),這是時代的發(fā)展,這就是大數(shù)據(jù)地震科學和技術帶來的新模式和新業(yè)態(tài)。我們的時代是科技高速發(fā)展的時代,高科技會推動地震學的突破,但是更重要的是改變觀念和思維,這樣才能有所創(chuàng)新。
UP手環(huán)UP