趙久彬,劉元雪,宋林波,劉佳鑫
(1.陸軍勤務(wù)學(xué)院 軍事設(shè)施系, 重慶 401331;2.巖土力學(xué)與地質(zhì)環(huán)境保護(hù)重慶市重點(diǎn)實(shí)驗(yàn)室, 重慶 401331)
我國是山體滑坡災(zāi)害易發(fā)國家,西南、西北等一些山區(qū)、丘陵地貌的區(qū)域是滑坡高發(fā)區(qū)域。隨著我國現(xiàn)代化進(jìn)程的快速推進(jìn),加上施工工藝的提高,很多大型工程對(duì)山體自然特征進(jìn)行了破壞,人類的活動(dòng)對(duì)滑坡災(zāi)害的影響作用也大大提高。根據(jù)國家有關(guān)地質(zhì)部門統(tǒng)計(jì):2016年我國共發(fā)生了9 710起地質(zhì)災(zāi)害,造成直接經(jīng)濟(jì)損失31.7億元人民幣,共有370人死亡、35人失蹤、209人受傷。2017年6月24日,四川省阿壩州茂縣疊溪鎮(zhèn)新磨村連續(xù)降雨超過半個(gè)月,發(fā)生了大型高位山體滑坡,產(chǎn)生了1 800萬立方米的滑坡方量,造成 40余間房屋和100余人被滑坡體掩埋,并在3日后發(fā)生了二次垮塌,塌方量約200~300立方米。地質(zhì)災(zāi)害主要集中在滑坡、坍塌和泥石流等方面,近年來滑坡災(zāi)害發(fā)生數(shù)量增多,監(jiān)測(cè)預(yù)警是降低地質(zhì)災(zāi)害風(fēng)險(xiǎn)的重要措施,具有廣闊的研究前景和應(yīng)用意義。
滑坡監(jiān)測(cè)的傳統(tǒng)方法主要是對(duì)滑坡易發(fā)地區(qū)設(shè)置水文、地質(zhì)和氣象等傳感器,數(shù)據(jù)傳送系統(tǒng)將傳感器采集的信號(hào)傳輸?shù)教幚碇行?,得出分析結(jié)論和預(yù)測(cè)結(jié)果。將災(zāi)害信息通知到部門群眾,做好預(yù)防工作[1-2]?;卤O(jiān)測(cè)需要監(jiān)測(cè)的對(duì)象有很多,比如有位移監(jiān)測(cè)、應(yīng)力監(jiān)測(cè)、氣象監(jiān)測(cè)等,采用的儀器設(shè)備也不同,產(chǎn)生的數(shù)據(jù)格式和參數(shù)各式各樣。監(jiān)測(cè)時(shí)間持續(xù)較長(zhǎng),采集次數(shù)多,產(chǎn)生了類型各異、數(shù)據(jù)量大的監(jiān)測(cè)數(shù)據(jù)。
滑坡監(jiān)測(cè)數(shù)據(jù)有著以下特點(diǎn):工期較長(zhǎng)、測(cè)點(diǎn)數(shù)量較多、測(cè)點(diǎn)類型較多、產(chǎn)生的數(shù)據(jù)量大、數(shù)據(jù)來源復(fù)雜多樣且多媒體化,包括了數(shù)、字、圖、表等數(shù)據(jù)類型[3]。這些數(shù)據(jù)不斷累積增長(zhǎng),而且要求在較短時(shí)間內(nèi)進(jìn)行實(shí)時(shí)處理,用傳統(tǒng)數(shù)據(jù)庫進(jìn)行處理面臨相當(dāng)大的挑戰(zhàn)。可將大數(shù)據(jù)技術(shù)與滑坡監(jiān)測(cè)預(yù)警技術(shù)結(jié)合起來進(jìn)行研究,運(yùn)用大數(shù)據(jù)的理論、機(jī)制、模型和方法,采用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)等方法得出可靠性較高的預(yù)警信息。本文介紹了目前應(yīng)用廣泛的大數(shù)據(jù)技術(shù),并對(duì)滑坡監(jiān)測(cè)預(yù)警大數(shù)據(jù)系統(tǒng)進(jìn)行了架構(gòu)設(shè)計(jì)。
在地理信息系統(tǒng)、數(shù)據(jù)存儲(chǔ)技術(shù)及物聯(lián)網(wǎng)等技術(shù)高速發(fā)展的信息時(shí)代,工業(yè)、醫(yī)療、交通運(yùn)輸、網(wǎng)絡(luò)社交等領(lǐng)域都產(chǎn)生了PB乃至EB級(jí)大數(shù)據(jù),這些數(shù)據(jù)影響著人們認(rèn)識(shí)社會(huì)、理解社會(huì)的方式,并推動(dòng)社會(huì)發(fā)展,成為了信息社會(huì)的巨大財(cái)富[4]。大數(shù)據(jù)的特點(diǎn)可以總結(jié)為以下4個(gè):體積巨大(volume)、類型繁多(variety)、生成快速(velocity)、價(jià)值巨大但密度很低(value)[5-8]。大數(shù)據(jù)的關(guān)鍵技術(shù)在于使設(shè)計(jì)成本可以接受的,可以通過快速采集、發(fā)現(xiàn)、分析等工具和方法的,從數(shù)據(jù)量大、類型多樣的數(shù)據(jù)集中發(fā)掘有用價(jià)值的體系架構(gòu)。
滑坡監(jiān)測(cè)預(yù)警大數(shù)據(jù)系統(tǒng)是滑坡災(zāi)害應(yīng)急中心實(shí)施會(huì)議召開、分析磋商、調(diào)度指揮的信息化平臺(tái)。圖1為滑坡監(jiān)測(cè)預(yù)警大數(shù)據(jù)系統(tǒng)的體系架構(gòu),主要采用分布式計(jì)算架構(gòu),結(jié)合并行數(shù)據(jù)庫技術(shù),有效搭載各類滑坡信息數(shù)據(jù),支持大數(shù)據(jù)的流處理和批處理模式,能夠?qū)崿F(xiàn)滑坡大數(shù)據(jù)的海量存儲(chǔ)與維護(hù)和跨層級(jí)分布式業(yè)務(wù)處理,為系統(tǒng)功能的柔性從組提供一個(gè)松耦合的集成框架。
基礎(chǔ)設(shè)施層是指硬件基礎(chǔ),包含計(jì)算機(jī)、網(wǎng)絡(luò)、中間件、虛擬服務(wù)器、數(shù)據(jù)庫及集群軟件,是滑坡監(jiān)測(cè)預(yù)警大數(shù)據(jù)系統(tǒng)所需的資源載體。數(shù)據(jù)源層為滑坡監(jiān)測(cè)大數(shù)據(jù)系統(tǒng)提供需要的數(shù)據(jù)源頭,并提供各類專業(yè)知識(shí)和參數(shù)等。數(shù)據(jù)接口層是對(duì)數(shù)據(jù)來源的特征開發(fā)設(shè)計(jì)轉(zhuǎn)換適配器,是根據(jù)行業(yè)規(guī)范,對(duì)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、處理的轉(zhuǎn)換層。處理后的數(shù)據(jù)存入大數(shù)據(jù)存儲(chǔ)系統(tǒng)中。
大數(shù)據(jù)的平臺(tái)層是整個(gè)系統(tǒng)最重要的部分。Hypervisor/VMs的作用是連接物理設(shè)備層和虛擬軟件層,為服務(wù)器能夠在物理設(shè)備與虛擬軟件之間實(shí)現(xiàn)預(yù)定功能提供協(xié)調(diào)并得到實(shí)施。通過網(wǎng)絡(luò)層這個(gè)媒介連接存儲(chǔ)系統(tǒng)和處理系統(tǒng),并連接大數(shù)據(jù)系統(tǒng)的訪問框架。平臺(tái)采用HDFS作為底層數(shù)據(jù)存儲(chǔ)框架。大數(shù)據(jù)的訪問框架包括了Pig、Hive、Sqoop等系統(tǒng),其中:Pig是計(jì)算機(jī)編程語言,適合用于Hadoop和Map/Reduce平臺(tái)來查詢大型半結(jié)構(gòu)數(shù)據(jù)集;Hive是數(shù)據(jù)倉庫,通過HQL語言實(shí)現(xiàn)MapReduce的快速統(tǒng)計(jì);Sqoop的作用是用來與關(guān)系型數(shù)據(jù)庫實(shí)現(xiàn)數(shù)據(jù)交換,如Mysql、Oracle等關(guān)系型數(shù)據(jù)庫。大數(shù)據(jù)的調(diào)度框架包括以下3個(gè)系統(tǒng):Hbase是列存儲(chǔ)非關(guān)系型數(shù)據(jù)庫,提供可靠性高并有分布式數(shù)據(jù)庫功能的作用;日志收集的系統(tǒng)Flum,其作用是收集各類數(shù)據(jù)發(fā)送方的相關(guān)資料日志,并收集數(shù)據(jù)集;分布式閉鎖組建Zookeeper,其作用是高效和可靠地協(xié)同工作系統(tǒng),提供分布式鎖之類的作用,用于構(gòu)建分布式應(yīng)用,減輕應(yīng)用程序所承擔(dān)的協(xié)調(diào)任務(wù)[9]。系統(tǒng)應(yīng)用層則是滑坡監(jiān)測(cè)預(yù)警大數(shù)據(jù)系統(tǒng)的功能實(shí)現(xiàn)系統(tǒng),具有穩(wěn)定性分析、智能決策、可視化交互等功能。
圖1 滑坡監(jiān)測(cè)預(yù)警大數(shù)據(jù)系統(tǒng)的系統(tǒng)架構(gòu)
目前的大數(shù)據(jù)時(shí)代,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫在處理非關(guān)系型、數(shù)據(jù)量龐大、讀寫高發(fā)及海量存儲(chǔ)的數(shù)據(jù)集時(shí)已經(jīng)力不從心。于是產(chǎn)生了NoSQL非關(guān)系型數(shù)據(jù)庫。目前,大數(shù)據(jù)多數(shù)應(yīng)用都基于Apache開發(fā)的Hadoop(圖2)。Hadoop適應(yīng)了時(shí)代需求,其成本低廉,適合大型企業(yè)和小型企業(yè)采用,并有可靠、容錯(cuò)率高的特征。Hadoop采用分布式對(duì)大數(shù)據(jù)集進(jìn)行處理的軟件框架。用戶利用Hadoop開源特性開發(fā)程序,可充分發(fā)揮計(jì)算機(jī)集群高速存儲(chǔ)與計(jì)算的優(yōu)勢(shì),因此其越來越在各個(gè)領(lǐng)域得到廣泛應(yīng)用[10]。
圖2 平臺(tái)數(shù)據(jù)存儲(chǔ)技術(shù)結(jié)構(gòu)
支持傳統(tǒng)的滑坡監(jiān)測(cè)數(shù)據(jù)數(shù)據(jù)庫是大數(shù)據(jù)平臺(tái)儲(chǔ)存的基礎(chǔ)需求,因?yàn)槿粘1O(jiān)測(cè)產(chǎn)生的數(shù)據(jù)都具有統(tǒng)一規(guī)范和格式,所以存儲(chǔ)在傳統(tǒng)關(guān)系型數(shù)據(jù)庫更有優(yōu)勢(shì),另外一些數(shù)據(jù)無法或不適宜轉(zhuǎn)存到分布式存儲(chǔ),本文采用了典型的關(guān)系型開源數(shù)據(jù)庫MYSQL作為底層存儲(chǔ)支持。對(duì)于一些文本、圖片、遙感照片和分析報(bào)告等數(shù)據(jù),需要存儲(chǔ)在NoSQL非關(guān)系型數(shù)據(jù)庫。平臺(tái)在開源的基礎(chǔ)上進(jìn)行二次開發(fā),采用HBASE作為技術(shù)支持,結(jié)合HDFS的特點(diǎn),將HBASE部署于HDFS之上配置其運(yùn)行環(huán)境[11],從而搭建了滑坡監(jiān)測(cè)數(shù)據(jù)非關(guān)系型數(shù)據(jù)庫,從而使大數(shù)據(jù)平臺(tái)存儲(chǔ)問題得以解決。
平臺(tái)數(shù)據(jù)存儲(chǔ)技術(shù)解決后,需要提供后端數(shù)據(jù)接口技術(shù)支持。平臺(tái)對(duì)關(guān)系型數(shù)據(jù)庫采用JDBC作為兼容大數(shù)據(jù)平臺(tái)技術(shù)。在此基礎(chǔ)上采用Thrift支持,為Java、C++Python等語言訪問非關(guān)系型數(shù)據(jù)庫提供接口。對(duì)于Hadoop和Spark生態(tài)圈,利用Hive、Yarn和Spark Stream提供數(shù)據(jù)接口引擎支持。
平臺(tái)后端開發(fā)的中心思想是以Java為邏輯主控,C++作為兼容型輔助開發(fā)工具,Python作為算法和計(jì)算的高級(jí)編程語言。在此基礎(chǔ)上,引入公用的算法計(jì)算庫。目前比較流行的有2個(gè)算法庫,即Hadoop生態(tài)圈的Mahout和Spark生態(tài)圈的Spark MLlib。Mahout是基于Hadoop的經(jīng)典機(jī)器學(xué)習(xí)算法合集,對(duì)這些算法進(jìn)行封裝和開發(fā),可以為平臺(tái)提供強(qiáng)大的機(jī)器學(xué)習(xí)計(jì)算分析能力;Spark MLlib是Spark計(jì)算框架的機(jī)器學(xué)習(xí)算法庫,包括分類、回歸、聚類、協(xié)同過濾、降維等部分。引入Python、Scala、Pig編程支持,從而為更多機(jī)器學(xué)習(xí)算法提供實(shí)現(xiàn)方案。
大數(shù)據(jù)時(shí)代核心需求是從紛繁復(fù)雜的各類異構(gòu)數(shù)據(jù)中,發(fā)掘出利于研究和開發(fā)的規(guī)律和價(jià)值。如何在Hadoop中實(shí)現(xiàn)基于滑坡數(shù)據(jù)的機(jī)器學(xué)習(xí)和智能判別預(yù)測(cè)目標(biāo),需要一些數(shù)據(jù)挖掘算法、統(tǒng)計(jì)分析和可視化等工具實(shí)現(xiàn)。
1.4.1 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘的許多算法已經(jīng)在人工智能、模式識(shí)別、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)與數(shù)據(jù)庫中得到應(yīng)用實(shí)現(xiàn)。目前國際上比較流行的數(shù)據(jù)挖掘方法有很多,包括SVM、C4.5、Apriori、k-means、PageRank、EM、KNN、AdaBoost、CART和樸素貝葉斯等,覆蓋了聚類、關(guān)聯(lián)、分類、統(tǒng)計(jì)與回歸等[12]。另外,一些先進(jìn)的算法如基因算法和神經(jīng)網(wǎng)絡(luò)算法等也被充分應(yīng)用到不同領(lǐng)域的數(shù)據(jù)挖掘中,取得了很好的效果。
1.4.2 統(tǒng)計(jì)分析
統(tǒng)計(jì)分析屬于應(yīng)用數(shù)學(xué)的一個(gè)分支領(lǐng)域,在統(tǒng)計(jì)理論中,事件的模糊性和隨機(jī)性都由概率統(tǒng)計(jì)理論計(jì)算。統(tǒng)計(jì)分析技術(shù)分為兩類:應(yīng)用描述性統(tǒng)計(jì)對(duì)數(shù)據(jù)集進(jìn)行描述;應(yīng)用推斷性統(tǒng)計(jì)對(duì)數(shù)據(jù)集統(tǒng)計(jì)分析后,得出推斷結(jié)論,并給出結(jié)論發(fā)生的概率。進(jìn)一步的多元統(tǒng)計(jì)分析還包括因子分析、多元回歸、判別和聚類等。
1.4.3 數(shù)據(jù)可視化
數(shù)據(jù)可視化以一目了然的圖像方式將信息傳遞給客戶,地圖和圖表可以用來幫助用戶快速理解知識(shí)信息。滑坡可視化可采用圖表、地圖和模擬動(dòng)畫等方式展現(xiàn)。然而,當(dāng)數(shù)據(jù)量達(dá)到大數(shù)據(jù)級(jí)別時(shí),傳統(tǒng)的電子表格技術(shù)已無法處理。大數(shù)據(jù)可視化技術(shù)可以采用HTIM5、Apache Zeppelin等技術(shù)開發(fā),Zeppelin由NFLAB開發(fā),可提供Web界面,類似于iPython的Notebook,可以用于數(shù)據(jù)分析和可視化,也可結(jié)合SAS、SPSS、R、Geph等工具進(jìn)行展示。
滑坡大數(shù)據(jù)來源于多源異構(gòu),種類多樣:有現(xiàn)場(chǎng)監(jiān)測(cè)儀器產(chǎn)生的數(shù)據(jù)(如GNSS設(shè)備、氣象監(jiān)測(cè)器、裂縫傳感器、應(yīng)力應(yīng)變計(jì)等監(jiān)測(cè)的數(shù)據(jù)),與國家和地方地質(zhì)數(shù)據(jù)進(jìn)行共享的地質(zhì)環(huán)境信息數(shù)據(jù)(如遙感圖像、地形地貌圖等),滑坡易發(fā)地區(qū)的歷史滑坡數(shù)據(jù)等。根據(jù)滑坡數(shù)據(jù)的來源,可歸為以下5類:地質(zhì)環(huán)境信息、各類歷史滑坡資料、地質(zhì)內(nèi)部數(shù)據(jù)、地質(zhì)外部數(shù)據(jù)、其他數(shù)據(jù)源(表1)[13]。以上這些數(shù)據(jù)為多源異構(gòu)型,需要進(jìn)行處理。首先進(jìn)行數(shù)據(jù)清洗和轉(zhuǎn)換,并對(duì)這些數(shù)據(jù)進(jìn)行統(tǒng)一的建模,存儲(chǔ)于大數(shù)據(jù)平臺(tái)的儲(chǔ)存框架中,為對(duì)數(shù)據(jù)進(jìn)行挖掘分析做好準(zhǔn)備,并允許跨平臺(tái)交互和共享。
表1 滑坡數(shù)據(jù)分類
影響滑坡災(zāi)害的因素很多,要預(yù)先獲得滑坡區(qū)域的地質(zhì)構(gòu)造情況數(shù)據(jù),并掌握滑坡體的力學(xué)模型先驗(yàn)知識(shí),實(shí)時(shí)采集各類監(jiān)測(cè)數(shù)據(jù)和外界影響因素(如人類活動(dòng)),通過統(tǒng)計(jì)大量的、不同區(qū)域的、時(shí)間不同的歷史滑坡大數(shù)據(jù),采用統(tǒng)計(jì)學(xué)、信息原理分析的技術(shù)手段,篩選出其中的重要條件和因素(如地質(zhì)構(gòu)造相似度),按類比原則將海量滑坡數(shù)據(jù)分為地段性滑坡數(shù)據(jù)類,此類滑坡具有類似的易滑坡作用條件和影響因素。根據(jù)自然斜坡或是滑坡的地質(zhì)構(gòu)造情況,將其歸屬到相應(yīng)的地段性滑坡類中,在此滑坡類中,將大數(shù)據(jù)集的滑坡類數(shù)據(jù)分為訓(xùn)練集和驗(yàn)證集,采用機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)潛在有用的規(guī)則,對(duì)待預(yù)測(cè)的此滑坡類的滑體進(jìn)行規(guī)則判定,預(yù)測(cè)其穩(wěn)定性。如:周科平等[14]利用數(shù)據(jù)挖掘的粗糙集技術(shù),分析了影響滑坡的穩(wěn)定性的主要影響因素;趙建華[15]利用決策樹數(shù)據(jù)挖掘算法,分析了多種影響因素對(duì)滑坡的作用,并得到了劃分評(píng)價(jià)滑坡危險(xiǎn)區(qū)域的模型。
滑坡災(zāi)害空間預(yù)測(cè)指的是對(duì)于一定區(qū)域內(nèi)的滑坡體進(jìn)行穩(wěn)定性預(yù)測(cè),保護(hù)人類空間活動(dòng)的安全性,為國家和社會(huì)的土地資源利用提供科學(xué)指導(dǎo),防止生命財(cái)產(chǎn)受到威脅破壞。
在大數(shù)據(jù)系統(tǒng)提供滑坡災(zāi)害空間預(yù)測(cè)功能時(shí),例如在對(duì)重慶某滑坡頻發(fā)的區(qū)縣地域進(jìn)行空間預(yù)測(cè)時(shí),需要提供大樣本數(shù)據(jù)作為訓(xùn)練集。為了在下一步大數(shù)據(jù)平臺(tái)中設(shè)計(jì)數(shù)據(jù)挖掘方案,本文進(jìn)行了上機(jī)試驗(yàn),選取了重慶某縣區(qū)域20個(gè)露天120個(gè)礦巖質(zhì)邊坡數(shù)據(jù)資料,利用SQL Server軟件提供的Apriori算法,對(duì)數(shù)據(jù)進(jìn)行泛化處理,模型計(jì)算后,形成規(guī)則用于預(yù)測(cè)判斷。Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法。將滑坡數(shù)據(jù)庫中準(zhǔn)備好的數(shù)據(jù)集載入,輸入最小支持度閥值min-supp和最小置信度minconf,系統(tǒng)掃描數(shù)據(jù)庫,通過連接步和剪枝步產(chǎn)生頻繁項(xiàng)集。
產(chǎn)生的頻繁項(xiàng)集再通過最小置信度產(chǎn)生關(guān)聯(lián)規(guī)則,步驟如下:
1) 對(duì)于每個(gè)頻繁項(xiàng)集l,產(chǎn)生l的所有非空子集。
2) 對(duì)于l的每個(gè)非空子集s,如果下式條件成立:
則輸出規(guī)則“s?(l-s)”。
由表2、3可知:數(shù)據(jù)庫中考慮了10個(gè)影響破壞類型的因素,基本包含了影響滑坡發(fā)生的因素。在進(jìn)行數(shù)據(jù)挖掘的過程中,由用戶設(shè)置最小支持度minsupp和最小置信度minconf。當(dāng)發(fā)現(xiàn)規(guī)則過多或過少時(shí),還需要重新調(diào)整設(shè)置值。本文設(shè)置了支持度8%和置信度99%,發(fā)現(xiàn)了117條規(guī)則,根據(jù)專家的經(jīng)驗(yàn)進(jìn)行過濾后,得到了18條有用的規(guī)則,例如:巖石單軸抗壓強(qiáng)度取值為80~90 MPa,地下水為5 H,巖體結(jié)構(gòu)類型為塊狀,那么邊坡發(fā)生雙滑塊折線型破壞,并有支持度18%,置信度99%。這個(gè)結(jié)果與專家經(jīng)驗(yàn)結(jié)論基本相符。
在下一步大數(shù)據(jù)集的訓(xùn)練樣本下,訓(xùn)練得到的知識(shí)規(guī)則將會(huì)有更高的可信度和置信度,所以用大數(shù)據(jù)進(jìn)行劃分和評(píng)價(jià)區(qū)域性滑坡時(shí),將會(huì)取得更加有效的研究成果。
表2 用于挖掘的數(shù)據(jù)樣本
注:σb為巖石的單軸抗壓強(qiáng)度;α為結(jié)構(gòu)面傾角;A為結(jié)構(gòu)面與邊坡面的關(guān)系;B為地下水條件;C為巖體結(jié)構(gòu)類型;D為可能破壞的類型;c為內(nèi)摩擦角;h為邊坡高度;n為安全系數(shù);β為邊坡角。
表3 用于檢驗(yàn)的樣本
注:F為巖體結(jié)構(gòu)類型(實(shí)際值);G為巖體結(jié)構(gòu)類型(預(yù)測(cè)值),其他符號(hào)同表1。
場(chǎng)地性滑坡監(jiān)測(cè)分析指對(duì)存在滑坡隱患災(zāi)害的邊坡進(jìn)行監(jiān)測(cè)預(yù)測(cè)工作,需要當(dāng)?shù)氐牡刭|(zhì)勘察資料,并結(jié)合實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行。對(duì)于單個(gè)場(chǎng)地滑坡體的監(jiān)測(cè)工作,需要提供不同類型的測(cè)量設(shè)備,實(shí)現(xiàn)位移、應(yīng)力、地下水、降雨量、溫度場(chǎng)等實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),通過采集融合人工監(jiān)測(cè)數(shù)據(jù),半自動(dòng)化、全自動(dòng)化設(shè)備的數(shù)據(jù),用有線或無線的傳輸技術(shù),將監(jiān)測(cè)數(shù)據(jù)傳輸?shù)綌?shù)據(jù)處理中心,對(duì)其進(jìn)行去噪、清洗和轉(zhuǎn)換,最后把可用于大數(shù)據(jù)平臺(tái)數(shù)據(jù)挖掘的數(shù)據(jù)(數(shù)據(jù)倉庫)存儲(chǔ)在系統(tǒng)中。
在數(shù)據(jù)挖掘過程中,需要采用相關(guān)的理論分析方法作為基礎(chǔ),將數(shù)值計(jì)算方法作為手段,從數(shù)據(jù)集中找到某種規(guī)律,進(jìn)而建立數(shù)學(xué)模型。對(duì)于數(shù)據(jù)準(zhǔn)確完整、模型簡(jiǎn)單的場(chǎng)地性滑坡穩(wěn)定性分析,可以結(jié)合較為完善的力學(xué)分析方法和數(shù)值模型方法驗(yàn)算;對(duì)于影響因素多樣、數(shù)據(jù)不完整、結(jié)構(gòu)復(fù)雜的場(chǎng)地性滑坡,采用神經(jīng)網(wǎng)絡(luò)模型和灰色模型等方法。如周科平等[16]采用頻繁項(xiàng)集算法中的Apriori算法,利用滑坡現(xiàn)場(chǎng)得到的數(shù)據(jù),分析得到了某礦山滑場(chǎng)發(fā)生的影響因素,并有效預(yù)測(cè)了其穩(wěn)定性;張治強(qiáng)等[17]也采用了Apriori算法,把某采場(chǎng)的地形地貌、巖體性質(zhì)和外在影響因素進(jìn)行統(tǒng)一考慮,建立穩(wěn)定性評(píng)價(jià)模型。
通過建立的穩(wěn)定性分析模型,用以計(jì)算此滑坡在外界作用下的穩(wěn)定性系數(shù),或是利用可靠性分析模型預(yù)測(cè)此滑坡的破壞機(jī)率,為滑坡穩(wěn)定性分析提供定量依據(jù)。
為了在大數(shù)據(jù)平臺(tái)建立針對(duì)某場(chǎng)地的預(yù)測(cè)滑坡穩(wěn)定性模型,本文利用Matlab模糊工具箱提供的ANFIS函數(shù)進(jìn)行神經(jīng)網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)算法上機(jī)試驗(yàn)。模糊神經(jīng)網(wǎng)絡(luò)常將常規(guī)的RBF神經(jīng)網(wǎng)絡(luò)和Hopfied神經(jīng)網(wǎng)絡(luò)中模糊地進(jìn)行賦予輸入和權(quán)值,進(jìn)行參數(shù)學(xué)習(xí)。例如全反饋神經(jīng)網(wǎng)絡(luò):
(2)
其中:X=(X1,X2,…,Xn)為輸入樣本;Y=(Y1,Y2,…,Yn)為實(shí)際輸出;Wij為連接權(quán)值;θj控制閥值。通過3種方式調(diào)整輸入和權(quán)值:① 實(shí)數(shù)輸入,模糊權(quán)值;② 模糊輸入,實(shí)數(shù)權(quán)值;③ 模糊輸入,模糊權(quán)值。以此達(dá)到全局逼近的效果,參數(shù)學(xué)習(xí)的結(jié)果得到全局優(yōu)化。我們收集了某高邊坡工程2年的監(jiān)測(cè)數(shù)據(jù),利用Matlab軟件中的模糊神經(jīng)網(wǎng)絡(luò)工具箱,研究開挖、支護(hù)和外在因素對(duì)孔口位移的影響。表4為孔口位置相關(guān)監(jiān)測(cè)資料。
將前17組作為訓(xùn)練集,后5組作為檢驗(yàn)集,得出預(yù)測(cè)位移與實(shí)測(cè)位移的對(duì)比關(guān)系,見表5,表內(nèi)的預(yù)測(cè)值和實(shí)測(cè)值誤差在20%以內(nèi)。通過實(shí)例分析,神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法用于研究滑坡位移、應(yīng)力、穩(wěn)定性分析等方面具有獨(dú)特的優(yōu)勢(shì),采用大數(shù)據(jù)平臺(tái)大數(shù)據(jù)量、高運(yùn)算速度的優(yōu)勢(shì),可以有效、并在很短時(shí)間內(nèi)得到預(yù)測(cè)值,用于滑坡監(jiān)測(cè)預(yù)警前景可觀。
表4 某孔口位移監(jiān)測(cè)基本資料
表5 計(jì)算位移與實(shí)測(cè)位移對(duì)比
GIS系統(tǒng)的坐標(biāo)系采用了嚴(yán)格的地理坐標(biāo)系,以經(jīng)緯度存儲(chǔ)單位,并可以進(jìn)行坐標(biāo)投影與轉(zhuǎn)換,支持圖形和數(shù)據(jù)的雙向檢索,具有強(qiáng)大的數(shù)據(jù)庫分析功能,集成了GPS、CAD、RS技術(shù),將GIS技術(shù)結(jié)合大數(shù)據(jù)平臺(tái)進(jìn)行應(yīng)用,對(duì)于滑坡穩(wěn)定性分析和展示將會(huì)發(fā)揮獨(dú)特的優(yōu)勢(shì)。
該研究可集成國家和地區(qū)相關(guān)部門的滑坡災(zāi)害信息資料,利用地理信息系統(tǒng)(GIS)進(jìn)行相關(guān)信息管理和可視化動(dòng)態(tài)展示,通過大數(shù)據(jù)平臺(tái)挖掘出來的結(jié)果用地理信息系統(tǒng)呈現(xiàn)出來,給客戶直觀地展示評(píng)價(jià)情況,這將成為大數(shù)據(jù)分析滑坡穩(wěn)定的一種趨勢(shì)。
由于滑坡的監(jiān)測(cè)預(yù)警工作涉及到海量數(shù)據(jù),傳統(tǒng)的監(jiān)測(cè)預(yù)警方法已不能滿足現(xiàn)代化監(jiān)測(cè)預(yù)警的需要。本文首先對(duì)大數(shù)據(jù)數(shù)據(jù)處理和數(shù)據(jù)挖掘等關(guān)鍵技術(shù)進(jìn)行了總結(jié),然后對(duì)滑坡監(jiān)測(cè)預(yù)警大數(shù)據(jù)系統(tǒng)的整體架構(gòu)、功能應(yīng)用及其應(yīng)用進(jìn)行了闡述。隨著大數(shù)據(jù)系統(tǒng)技術(shù)的發(fā)展,一些基于Hadoop平臺(tái)的開源運(yùn)算框架如Apache Spark等得到較快的發(fā)展,大數(shù)據(jù)平臺(tái)的性能將得到大幅度提升,滑坡監(jiān)測(cè)預(yù)警大數(shù)據(jù)技術(shù)的應(yīng)用前景廣闊。
[1] 陳鐵軍,陳華方,胡楊超,等.基于CC2480的山體滑坡監(jiān)測(cè)系統(tǒng)[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(20):4512-4515.
[2] 劉東旗,劉新中,卜令俊,等.基于無線傳感器網(wǎng)絡(luò)的遠(yuǎn)程抄表系統(tǒng)信息智能傳輸?shù)膶?shí)現(xiàn)[J].電測(cè)與儀表,2009,46(12A):46-50.
[3] 唐亞明,張茂省,薛強(qiáng),等.滑坡監(jiān)測(cè)預(yù)警國內(nèi)外研究現(xiàn)狀及評(píng)述[J].地質(zhì)論評(píng),2012,58(3):533-541.
[4] 郭宇棟,李生林.大數(shù)據(jù)關(guān)鍵技術(shù)在基建營(yíng)房綜合管理系統(tǒng)中的運(yùn)用[J].軍事物流,2016,35(5):169-175.
[5] WIKIPEDIA.BigData[EB/OL].(2013-08-05) [2013-09-08].http://zh.wikipedia.org/zh/%E5%A4%A7%E6%95%B0%E6%8D%AE.
[6] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
[7] 王樹良,丁剛毅,鐘鳴.大數(shù)據(jù)下的空間數(shù)據(jù)挖掘思考[J].中國電子科學(xué)研究研學(xué)報(bào),2013,8(1):8-17.
[8] 鄭玲微.大步跨入大數(shù)據(jù)時(shí)代][J].信息化建設(shè),2013,173(1):11-13.
[9] 王逸飛,張行,何迪,等.基于大數(shù)據(jù)平臺(tái)的電網(wǎng)防災(zāi)調(diào)度系統(tǒng)功能設(shè)計(jì)與系統(tǒng)架構(gòu)[J].電網(wǎng)技術(shù),2016,40(10):3213-3219.
[10] 王浩,覃衛(wèi)民,焦玉勇.大數(shù)據(jù)時(shí)代的巖土工程監(jiān)測(cè)折與機(jī)遇[J].巖土力學(xué),2014,35(9):2634-2641.
[11] 李學(xué)龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國科學(xué)(信息科學(xué)),2015,45(1):1-44.
[12] WU X,KUMAR V,QUINLAN J R,et al.Top 10 algorithms in data mining[J].Knowledge & Information Systems,2007,14(1):1-37.
[13] 殷坤龍.滑坡災(zāi)害預(yù)測(cè)預(yù)報(bào)分類[J].中國地質(zhì)災(zāi)害與防治學(xué)報(bào),2003,14(4):12-18.
[14] 周科平,向仁軍.基于粗糙集理論的數(shù)據(jù)挖掘方法在邊坡穩(wěn)定性分析中的應(yīng)用[J].礦業(yè)研究與開發(fā),2003,23(6):11-14.
[15] 趙建華,陳漢林,楊樹鋒,等.基于決策樹算法的滑坡危險(xiǎn)性區(qū)劃評(píng)價(jià)[J].浙江大學(xué)學(xué)報(bào)(理學(xué)版),2004,31(4):465-470.
[16] 周科平,羅周全,史秀志.基于數(shù)據(jù)挖掘的采場(chǎng)穩(wěn)定性的知識(shí)獲取與應(yīng)用[J].礦業(yè)研究與開發(fā),2002,22(5):1-4.
[17] 張治強(qiáng),蔡嗣經(jīng),馬平波.數(shù)據(jù)挖掘在巖質(zhì)邊坡穩(wěn)定性預(yù)測(cè)中的應(yīng)用[J].北京科技大學(xué)學(xué)報(bào),2003,25(2):103-106.