邱 超,何 錫 君,張 蘭
(1.浙江省水文管理中心,浙江 杭州 310027; 2.浙江省環(huán)境監(jiān)測中心,浙江 杭州 310012)
水文要素種類繁多,包括雨量、水位、蒸發(fā)、流量、泥沙、水質(zhì)、墑情和水溫等反映水文情勢的各類數(shù)據(jù),一般由水文站網(wǎng)通過水文測驗獲取[1-2]。目前,浙江省水文部門已建成各類水文要素監(jiān)測站點(diǎn)7 000多個,共享氣象和城管等部門雨量監(jiān)測站4 000多個,全省站網(wǎng)密度達(dá)到9 km2/站。水文數(shù)據(jù)已逐漸呈現(xiàn)出多源、多維、大量和多態(tài)的大數(shù)據(jù)特征[3]。水文部門利用多源匯集的大量數(shù)據(jù),歷年來為水利部門在防汛抗旱、水資源管理、水利工程建設(shè)、水生態(tài)修復(fù)等方面提供了全方位的服務(wù)。隨著機(jī)構(gòu)改革和大數(shù)據(jù)時代的來臨,應(yīng)急管理、自然資源、生態(tài)環(huán)境、氣象等其他政府部門以及社會公眾對水文部門的服務(wù)需求日益增長,充分利用人工智能、云計算等核心技術(shù)對海量數(shù)據(jù)進(jìn)行管理、交換、共享、分析和應(yīng)用成為當(dāng)前的重要任務(wù)。而為各類型水文測站設(shè)計規(guī)律性代碼是標(biāo)志、識別和融合應(yīng)用多源數(shù)據(jù)以及建設(shè)水文大數(shù)據(jù)平臺的前提和支撐[4-5]。
隨著浙江省數(shù)字化改革的推進(jìn),數(shù)據(jù)歸集逐步多源整合,各部門無序編碼現(xiàn)象突出,氣象站、水情站、資料站等編碼各成體系,無法統(tǒng)一融合,阻礙了水文要素集成管理與綜合分析,導(dǎo)致數(shù)據(jù)使用效率低下[6]?,F(xiàn)有水文測站編碼體系已經(jīng)不能滿足當(dāng)前跨行業(yè)跨部門站點(diǎn)的管理與應(yīng)用需求,逐步暴露出一些應(yīng)用問題:① 編碼攜帶的信息量較少、可兼容性和可拓展性不足?,F(xiàn)有編碼僅包含流域水系、測站類型信息,缺少測站精確的空間位置信息,必須輔以其他信息才能準(zhǔn)確定位,同時編碼無法兼容氣象、城管等部門的站點(diǎn)信息,無法實現(xiàn)以地理空間網(wǎng)格為對象的多監(jiān)測要素信息融合,制約了水文信息網(wǎng)格分布式應(yīng)用。② 編碼管理水平不高。近年來隨著浙江省水文測站數(shù)量的迅速增加,目前的人工編碼方式已經(jīng)越來越不適合時代發(fā)展的要求:一方面人工編碼工作效率低;另一方面一站多碼、同站不同碼等錯誤情況時有發(fā)生,直接影響了水文數(shù)據(jù)的信息化進(jìn)程。以GIS空間數(shù)據(jù)為技術(shù)框架,通過統(tǒng)一的數(shù)據(jù)模型和對象編碼,構(gòu)建物理集中與邏輯映射相結(jié)合的數(shù)據(jù)庫群是一種有效解決方案[7],將地理空間區(qū)域劃分成地理網(wǎng)格對象,基于網(wǎng)格對象的時間序列來實現(xiàn)任意空間和時間序列的水文分析計算,為后期無資料地區(qū)、小流域水文分析及分布式水文模型研發(fā)奠定技術(shù)基礎(chǔ)。因此,研究一套具有高密度、唯一性和高集成性的地理網(wǎng)格空間水文測站編碼體系勢在必行,同時也符合當(dāng)前浙江省數(shù)字化改革提出的各部門數(shù)據(jù)多源整合、共享共用的要求。
遵循GB/T 7027-2002《信息分類和編碼的基本原則與方法》中定義的科學(xué)性、系統(tǒng)性、可擴(kuò)展性、兼容性與綜合實用性5項編碼原則[8],應(yīng)盡量減少人為因素影響,本文提出基于地理網(wǎng)格的水文測站編碼方法,將水文站編碼與地理空間的自然屬性相關(guān)聯(lián),根據(jù)站點(diǎn)屬性信息和地理網(wǎng)格自動進(jìn)行測站編碼,有效提升了編碼的自動化和標(biāo)準(zhǔn)化水平。
地理網(wǎng)格是一種對地理空間進(jìn)行位置劃分的方法,是將連續(xù)空間區(qū)域的平面離散化,即按一定規(guī)則進(jìn)行分割,形成許多網(wǎng)格單元,并賦予標(biāo)識符(即地理編碼)[9-10]?;诘乩砭W(wǎng)格可以最大程度地匯集和共享網(wǎng)格內(nèi)分布的各種海量信息資源,為區(qū)域信息獲取、處理和應(yīng)用服務(wù)提供技術(shù)支撐。在多用戶、多平臺、多數(shù)據(jù)源的復(fù)雜異構(gòu)環(huán)境下,以網(wǎng)格為對象的編碼方式可以實現(xiàn)數(shù)據(jù)高效共享和數(shù)據(jù)集成[11]。目前,地理網(wǎng)格技術(shù)在交通管理、農(nóng)產(chǎn)品產(chǎn)地溯源等方面有著廣泛的應(yīng)用,成果顯著[12-13]。
將地理網(wǎng)格技術(shù)引入到水文測站編碼中,可以將分散的各類水文要素信息,通過地理網(wǎng)格對象進(jìn)行空間組織,實現(xiàn)基于地理網(wǎng)格對象的多要素存儲模式和應(yīng)用體系。該編碼方法的總體思路為:采用規(guī)則網(wǎng)格預(yù)先對浙江省全域進(jìn)行兩級分區(qū),由基本網(wǎng)格和子網(wǎng)格組成為網(wǎng)格碼,網(wǎng)格碼結(jié)構(gòu)為DrrrBcccTxx;再編制不同測站類型碼Kyy。網(wǎng)格碼與類型碼組合成測站編碼DrrrBcccTxxKyy。根據(jù)水文匯集測站的經(jīng)緯度位置信息,采用自適應(yīng)技術(shù)自動匹配至自動編碼的地理網(wǎng)格中,構(gòu)建網(wǎng)格對象與站點(diǎn)的對照關(guān)系。總體目標(biāo)就是以網(wǎng)格為對象整合集成當(dāng)前分散的各類監(jiān)測數(shù)據(jù)源,實現(xiàn)水文要素之間的關(guān)聯(lián),為基于地理網(wǎng)格的水文大數(shù)據(jù)應(yīng)用做好技術(shù)儲備。
1.2.1基本網(wǎng)格劃分
基本網(wǎng)格編碼采用組合代碼形式,將省域劃分為若干個方格狀的監(jiān)測區(qū),在經(jīng)、緯度1°內(nèi)劃分100個×100個的網(wǎng)格,每個網(wǎng)格跨度為0.01°,按自南向北、由西至東順序進(jìn)行行列編碼,劃分后得到的每一個網(wǎng)格都具有一個唯一的地址編碼與之對應(yīng)。該地址編碼由兩部分構(gòu)成:網(wǎng)格所在的行號、網(wǎng)格所在的列號。其中行號的定義是:網(wǎng)格在水平軸延伸方向的行數(shù),其中以起算點(diǎn)左下角網(wǎng)格為第1行。列號的定義是:網(wǎng)格在垂直軸延伸方向的列數(shù),其中以起算點(diǎn)左下角的網(wǎng)格為第1列。基本網(wǎng)格編碼形式如下:DrrrBccc。其中,D表示東經(jīng),B表示北緯;rrr為3位,表示測站網(wǎng)格所在垂直軸方向的列號,由西至東順序編號為001~500;ccc為3位,表示測站網(wǎng)格所在水平軸方向的行號,自南向北順序編號為001~500。浙江省域測站基本網(wǎng)格編碼示例見圖1。
圖1 浙江省域測站基本網(wǎng)格編碼示例Fig.1 Coding of basic grid of gauges in Zhejiang Province
1.2.2子網(wǎng)格劃分
考慮到全省部分地區(qū)水文測站集中度較高,有進(jìn)一步細(xì)分網(wǎng)格的需求,以及今后的拓展需求,在基本網(wǎng)格上進(jìn)行子網(wǎng)格的劃分,即在基本網(wǎng)格的基礎(chǔ)上進(jìn)一步劃分為10個×10個網(wǎng)格,子網(wǎng)格編碼形式如下:Txx。其中,T表示子網(wǎng)格拓展劃分;xx為2位,表示子網(wǎng)格所在基本網(wǎng)格劃分后的編號,為0N~NN。以基本網(wǎng)格D001B001為例,測站子網(wǎng)格編碼彈性劃分示例見圖2。針對可能存在部分站點(diǎn)距離較近的實際情況,在實際編碼拓展中,N值默認(rèn)為9。
圖2 水文要素子網(wǎng)格編碼劃分示例Fig.2 Coding division of hydrological sub-element
1.2.3測站類型碼
根據(jù)測站當(dāng)前主要開展的水文監(jiān)測項目,制定水文測站類型碼,以便于水文測站按類型碼進(jìn)行歸類。測站類型碼見表1。
表1 測站類型碼
考慮到測站種類和數(shù)量的需要,測站類型編碼形式為Kyy。其中,K表示測站類型分類;yy為2位,第1位y代表不同水文測站類型碼(表1),第2位y代表同類型監(jiān)測站的數(shù)量(若存在多個同類監(jiān)測站點(diǎn),編碼取1~9;若不存在,編碼取0)。
1.2.4自適應(yīng)編碼
利用站點(diǎn)經(jīng)緯度位置信息,采用自適應(yīng)技術(shù)自動匹配至測站的地理網(wǎng)格中,結(jié)合測站屬性信息,自動完成測站的地理網(wǎng)格編碼。針對水位、水質(zhì)、墑情等各類已有測站編碼,建立唯一的關(guān)聯(lián)關(guān)系,實現(xiàn)以地理網(wǎng)格為單元匯集全部水文要素信息資源。地理網(wǎng)格編碼類似身份證號碼,現(xiàn)有各類測站編碼類似不同銀行卡卡號,通過關(guān)聯(lián)關(guān)系就可以實現(xiàn)對不同銀行卡的集中管理。地理網(wǎng)格編碼與原有測站關(guān)聯(lián)轉(zhuǎn)換關(guān)系示例見圖3。
圖3 水文測站地理網(wǎng)格編碼與原有測站關(guān)聯(lián)轉(zhuǎn)換示意Fig.3 Conversion between previous gauges and new geographical code grid
該編碼方案主要具有如下特點(diǎn):
(1) 有利于數(shù)據(jù)交換和共享。采用基于地理網(wǎng)格的測站編碼,每一網(wǎng)格的編碼都是唯一確定的,網(wǎng)格內(nèi)的信息高度集成,極大地方便了部門之間相關(guān)業(yè)務(wù)數(shù)據(jù)的交換和共享。
(2) 有利于數(shù)據(jù)應(yīng)用和拓展。通過網(wǎng)格編碼提取網(wǎng)格內(nèi)水文數(shù)據(jù)信息,為分布式洪水預(yù)報模型、水資源空間分析等水文業(yè)務(wù)在GIS條件下的應(yīng)用和拓展提供了極大便利。
(3) 編碼根據(jù)站點(diǎn)空間及屬性信息可預(yù)先自動生成,且富有彈性,無需人為編輯,便于管理。編碼本身具有空間和屬性信息,方便分類統(tǒng)計,應(yīng)用便捷、高效。
(4) 符合大數(shù)據(jù)發(fā)展趨勢。地理網(wǎng)格化正逐漸成為信息化業(yè)務(wù)系統(tǒng)的一個發(fā)展方向,本文采取的地理網(wǎng)格編碼可以為大數(shù)據(jù)分析應(yīng)用奠定堅實的應(yīng)用基礎(chǔ)。
雨量分析是水文分析計算的基礎(chǔ),如區(qū)域降雨分析、水量分析計算、洪水預(yù)測預(yù)報以及汛情信息發(fā)布都需要有雨量時間和空間分析。隨著水文分析的深入,需要對歷史、實時和未來降雨進(jìn)行融合分析。而采用傳統(tǒng)的基于站點(diǎn)的分析已無法滿足該分析要求,存在站網(wǎng)變動大、歷史站點(diǎn)數(shù)據(jù)應(yīng)用困難、跨部門數(shù)據(jù)無法融合、空間分析精細(xì)化不夠等問題,通過采用以地理網(wǎng)格為對象的編碼體系,可較好地解決上述問題,并在流域洪水預(yù)報的時空演變分析中得到了較好的實踐應(yīng)用。
基于歷史、實時和未來降雨進(jìn)行分析和預(yù)報時,發(fā)現(xiàn)傳統(tǒng)的以站點(diǎn)為對象的分析方法無法有效利用所有采集要素,主要存在以下4方面問題。
(1) 歷史各年站點(diǎn)數(shù)據(jù)不統(tǒng)一。歷史水文數(shù)據(jù)序列長度不一,有長達(dá)百年之久的水文測站,也有5 a以內(nèi)的水文測站,在進(jìn)行序列分析時,針對站點(diǎn)進(jìn)行分析,無法形成完整的水文序列。
(2) 參與統(tǒng)計分析站點(diǎn)變化較大。隨著大量站點(diǎn)建設(shè)及跨行業(yè)數(shù)據(jù)歸集,測站密度激增,站點(diǎn)故障和相鄰融合等問題凸顯,不同時間段可用于分析計算的站點(diǎn)會有較大差異,以點(diǎn)為對象統(tǒng)計分析存在不合理現(xiàn)象。
(3) 未來降雨與實時降雨格式不一致。未來數(shù)值降雨預(yù)報成果為網(wǎng)格對象數(shù)據(jù),傳統(tǒng)實時降雨以站點(diǎn)為對象進(jìn)行統(tǒng)計分析,格式無法兼容,須統(tǒng)一到基于站點(diǎn)或基于網(wǎng)格的格式進(jìn)行降雨統(tǒng)計分析。
(4) 流域內(nèi)的雨量時空分布無法精細(xì)化體現(xiàn)。以站點(diǎn)的點(diǎn)對象為基礎(chǔ)開展面雨量分析計算,受站點(diǎn)密度限制無法實現(xiàn)小區(qū)塊的面雨量空間分析,只能概化為大區(qū)塊的面雨量過程,時空分布無法精細(xì)化,影響預(yù)報精度。
為了精準(zhǔn)掌控流域降雨時空演變態(tài)勢,該案例采用了基于地圖網(wǎng)格的水文測站編碼,將多源水文要素進(jìn)行以網(wǎng)格為單元對象的空間地理編碼,實現(xiàn)站點(diǎn)從點(diǎn)到網(wǎng)格面的空間關(guān)系轉(zhuǎn)換,以便給予規(guī)則的網(wǎng)格面,可以按時間序列空間插補(bǔ)全域網(wǎng)格的數(shù)值,實現(xiàn)從網(wǎng)格面到全域面的時間序列空間賦值。結(jié)合水文分析的流域范圍,可以對全域面中的所有網(wǎng)格單元對象進(jìn)行特定空間范圍的提取。提取后可以按照時間序列實現(xiàn)面雨量計算、等值面填色、籠罩面積統(tǒng)計等二次空間分析。分析過程如圖4所示。
圖4 全域面降雨時空演變分析示意Fig.4 Demonstration of rainfall tempor-spatial evolution in whole region area
每個網(wǎng)格都通過網(wǎng)格編碼實現(xiàn)對象化身份認(rèn)證,并以網(wǎng)格編碼為索引進(jìn)行存儲,通過開發(fā)接口實時動態(tài)調(diào)用任意時間段、任意網(wǎng)格數(shù)據(jù)。選定區(qū)域可以由一個子網(wǎng)格,也可以由任意多個子網(wǎng)格組成,結(jié)構(gòu)靈活,并與未來數(shù)值降雨無縫對接,為水資源分區(qū)統(tǒng)計、水質(zhì)水量同步分析、分布半分布等洪水預(yù)報模型的集成化應(yīng)用提供了技術(shù)支撐。
地理網(wǎng)格編碼體系較好地實現(xiàn)了點(diǎn)源與網(wǎng)格數(shù)據(jù)格式、本省和歐洲預(yù)報模式的多源數(shù)值預(yù)報降雨耦合,實時在線比對多源流域面雨量成果,為錢塘江分布式水文模型提供了精準(zhǔn)實效的實時和未來雨量數(shù)據(jù)。
錢塘江半分布式水文預(yù)報模型基于重點(diǎn)預(yù)報區(qū)域河流水系分段,將現(xiàn)有報汛的水工程和水文斷面作為劃分節(jié)點(diǎn),構(gòu)建產(chǎn)匯流網(wǎng)格與河流之間的匯流網(wǎng)絡(luò)模型。通過地理網(wǎng)格編碼體系為洪水作業(yè)預(yù)報平臺輸入高精度的網(wǎng)格化歷史和實況降水量數(shù)據(jù)等,通過參數(shù)率定模塊開展半分布式模型參數(shù)的率定。
2021年6月30日至7月2日,錢塘江中上游出現(xiàn)較強(qiáng)降雨過程。錢塘江半分布式水文預(yù)報模型于6月30日14:00,根據(jù)實況點(diǎn)降雨和未來數(shù)值降雨預(yù)報成果,開展實時作業(yè)預(yù)報。通過站點(diǎn)降雨網(wǎng)格化、統(tǒng)計實時和未來各分區(qū)面雨量過程、調(diào)用半分布式水文預(yù)報方案等流程,預(yù)報常山以上流域各子流域河流節(jié)點(diǎn)的洪水過程。其中流域出口斷面的常山水文站洪峰流量4 890 m3/s,實測洪峰流量5 060 m3/s,相較于集中式模型預(yù)報的洪峰流量4 370 m3/s,在預(yù)報精度和洪水過程擬合度方面都有明顯提高。通過采用地理網(wǎng)格編碼體系,將有利于進(jìn)一步細(xì)化流域預(yù)報單元,實現(xiàn)從傳統(tǒng)集中式預(yù)報向分布式預(yù)報的發(fā)展,預(yù)報對象將逐步從固定斷面向區(qū)域內(nèi)的任意網(wǎng)格單元拓展。
為了更好地實現(xiàn)對海量水文數(shù)據(jù)進(jìn)行集成管理、分析、共享、應(yīng)用和發(fā)布,結(jié)合水文信息的現(xiàn)代化服務(wù)需求,本文提出了基于地理網(wǎng)格的測站編碼方法,制定了網(wǎng)格編碼規(guī)則,建立了網(wǎng)格內(nèi)各類測站編碼與網(wǎng)格編碼之間的關(guān)聯(lián)關(guān)系。上述成果實現(xiàn)了當(dāng)前水文分析從點(diǎn)到面的跨越,打破了數(shù)據(jù)時空變化造成的融合壁壘,拓展了水文數(shù)據(jù)的深加工和分析服務(wù)能力,有利于水文大數(shù)據(jù)技術(shù)的應(yīng)用和分析,為后續(xù)水文數(shù)字化服務(wù)提質(zhì)增效奠定了堅實的基礎(chǔ)。