亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        天氣預報分析型數據模型及生成

        2014-07-18 12:07:13譚曉光羅
        應用氣象學報 2014年1期
        關鍵詞:分析系統

        譚曉光羅 兵

        1)(中國氣象局北京城市氣象研究所,北京100089)2)(國家氣象中心,北京100081)

        天氣預報分析型數據模型及生成

        譚曉光1)*羅 兵2)

        1)(中國氣象局北京城市氣象研究所,北京100089)2)(國家氣象中心,北京100081)

        將原始數據轉換為分析型數據,增強用戶對海量數據的分析能力,是數據倉庫技術最核心、最有價值的思想,也是數據倉庫在氣象領域應用的基礎。該文針對天氣預報領域數據空間性、瞬變性、物理性和多尺度性等特點,提出了五元組描述的天氣預報分析型數據概念模型;總結了生成分析型數據的固定區(qū)域統計、劃分區(qū)域統計、基本天氣系統識別和天氣學概念模型識別4種聚集變換,并對其關鍵技術進行了討論。提出了基本天氣系統自動識別的濾波-劃分-測量算法,探討了針對氣象數據特點的模糊空間關系,定義了進行天氣學概念模型識別的空間模糊產生式規(guī)則,并針對空間數據給出了定位條件等擴展。

        天氣預報;數據倉庫;分析型數據;天氣系統識別

        引 言

        目前天氣預報業(yè)務中預報員獲取的數據量迅速增長,“信息爆炸”問題突出。為了解決問題,開發(fā)以數據檢索、圖形顯示為主要功能的人機交互系統,使預報員能夠快速檢索、查看、分析各種氣象數據。但由于數據量過于龐大,預報員進行預報決策時間相對較短,很難充分利用。在大量的數值預報產品面前,預報員往往只了解其預報結果;衛(wèi)星、雷達系統產生的大量反演產品、密集的自動氣象站觀測數據也只得到粗淺的使用。因此僅依靠目前的人機交互系統,不能解決“信息爆炸”問題,還需要強有力的工具幫助預報員進行數據分析,而數據倉庫技術是該方向重要的成熟工具。文獻[1]介紹了數據倉庫技術的基本概念并給出了天氣預報數據倉庫的基本框架,本文將對數據倉庫的關鍵技術——天氣預報分析型數據的設計和生成進行深入探討。

        數據倉庫技術核心思想是將原始雜亂的數據轉變?yōu)榉治鲂蛿祿?,從而幫助用戶快速地分析大量數據。分析型數據簡單說就是經過加工,易于分析的數據。加工過程包括對原始雜亂的數據進行整理和一致性處理(整合),抽取對數據分析任務重要的數據,對這些數據進行聚集變換,使分析信息(例如未來天氣的信息)集中到具有不同粒度的少量數據中。經過這些處理后的數據再配合適當的分析工具,可以使分析人員能夠在短時間內充分分析大量數據。

        分析型數據對于數據倉庫的重要性相當于預報因子對于統計預報(或模式產品的統計釋用)的重要性。在統計預報中,有“好”的預報因子時,用最簡單的統計預報方法也可以得到很好的結果。沒有“好”的因子則無論使用如何復雜的方法也很難得到滿意的結果。而將原始數據轉換為分析型數據就相當于解決因子問題,特別是聚集變換,能夠將未來天氣信息集中到少數數據中,十分關鍵。目前數值預報網格越來越細,必須將多個格點的信息聚集到少數數據中,才能提高分析的效率和質量。有了“好”的分析型數據,數據挖掘和聯機分析處理等分析工具才能取得好的效果。因此,分析型數據設計和生成質量是整個數據倉庫項目能否獲得成功的關鍵。

        氣象方面應用的分析型數據的設計和生成必須依據氣象領域分析任務的特點,由信息技術專家與氣象領域專家密切配合完成,對于天氣預報業(yè)務來說,首先需要分析天氣預報中氣象數據的特點,建立適當的天氣預報分析型數據模型。

        1 天氣預報分析型數據概念模型

        在設計數據處理、存儲和應用系統時,首先要對數據概念模型有清晰的認識,其次要設計好計算機能理解的邏輯模型,最終落實到數據的物理模型,其中的關鍵是概念模型。

        天氣預報中的氣象數據是分布在時空中的空間數據,其概念模型必須考慮其空間特性。而與一般地理信息空間數據相比氣象數據有4個主要特點:場特性,氣象數據是在時空中連續(xù)分布的場數據;瞬變性,氣象數據隨時間變化快速變化;物理性,氣象數據是按一定物理規(guī)律分布和變化的,受一組動力方程約束;多尺度性,氣象領域習慣將氣象數據場分解成大、中、小多種尺度的運動進行分析。

        通用的地理信息系統(GIS)數據模型對這4個特性考慮較少,不能簡單套用已有的GIS數據模型,而是既要充分利用GIS的研究成果,也要考慮氣象數據的特殊性。

        在GIS領域,描述空間數據的概念模型通常包括:場模型、對象模型和網絡模型。

        場模型是用于描述在空間連續(xù)分布的量。氣象數據就是這種量,可以有二維場和三維場,氣象數據還經常要考慮時間維和要素維。目前獲得的天氣預報業(yè)務數據主要采用二維場。二維場又可以分為若干具體的場模型:不規(guī)則分布點模型,即常見的站點數據;規(guī)則矩形區(qū)模型,即常見的網格點數據;等值線模型,即用一組等值線描述整個場,MICAPS第14類數據用圖元信息表述整個場數據,是這種模型的擴展。

        對象模型也稱為要素模型。將空間中的實體作為獨立的對象。按空間特征可以分為點、線、面、體等對象。每個對象由一系列屬性描述,包括空間屬性、非空間屬性等。天氣分析中的各種天氣系統就屬于對象模型,在天氣預報業(yè)務提供的數據中沒有現成的天氣系統數據,必須經過預報員人工或天氣系統自動識別算法,從業(yè)務提供的場數據中識別出各種特征點、線、面、體等空間對象,即天氣系統。

        網絡模型是多個空間對象(節(jié)點)通過路徑連通為一個網絡的模型,如路網、河網、管網、電網等,為氣象服務業(yè)務中常用模型。

        預報員在進行天氣分析時,主要是依據天氣學知識,在業(yè)務環(huán)境提供的二維數據場中分析識別天氣系統。根據天氣系統的移動、變化及其與局地天氣的關系做出未來天氣的預報。因此,滿足天氣分析需要的分析型數據應主要采用基于二維場識別的天氣系統空間對象模型作為概念模型。參考GIS已有研究的對象模型[2-7],并考慮到氣象數據的瞬變性、物理性和多尺度性,定義天氣預報分析型數據的概念模型。

        定義1:將天氣預報分析中氣象數據的最小分析單元稱為一個天氣預報分析型數據(weather analytic data,WAD)。WAD由一個五元組描述(ID,SA,EA,TA,PA)。其中,ID(identity)為數據標識屬性集合,SA(spatial attributes)為數據空間屬性集合,EA(entity attributes)為數據實體的非空間屬性集合,TA(time attributes)為數據時間屬性集合,PA(physical attributes)為數據物理屬性集合。

        與普通的GIS數據模型比較來說,WAD多了一個PA元組,以反映大氣的物理屬性。上述各個集合又是若干子集的并集,下面對各集合的組成進行詳細解釋。

        其中,NAME為數據名稱,是數據的唯一標識;TIME為數據時間;SUBJECT為所屬主題,隨分析任務而定;KIND為類型,例如高值區(qū)、低值區(qū)、槽線、脊線等;GRANULARITY為數據粒度,即數據的概括程度,由分析任務而定;MAGNITUDE為數據量綱,即數據使用什么單位;ELEMENT為要素(或物理量)的枚舉名稱。

        其中,FA(field attribute)為場屬性,FA=PROJ∪FM ∪FTD∪ TD,PROJ(project)為原始二維場數據(產生本分析型數據的源數據)的投影屬性(蘭勃托、麥開托、極射赤面等),FM(field model)為原始二維場模型(離散點、經緯度網格、等距直角坐標網格),FTD(first two dimensions)為二維場的坐標(x-y,x-z,y-z,x-p,y-p等),TD(the third dimension)為第3維坐標類型(氣壓坐標、高度坐標、x和y、經度、緯度等),TDV(the third dimension value)為第3維的取值;LS(location set)為空間對象所在位置的空間點集(測站位置或網格點位置的列表);GA(geo-attributes)為地理屬性,GA=CP∪ EP∪AREA ∪ ASPECT ∪ CL,CP(center point)為幾何中心位置(經緯度),EP(extreme point)為極值位置(經緯度),AREA(area)為面積,ASPECT(aspect)為縱橫比,CL(center line)為中心線(長度∪寬度∪方向∪彎曲度∪各頂點矢量坐標)。

        其中,STA(statistical attribute)為統計屬性,STA=AVE∪EXTREME∪VAR∪INTENSITY,AVE為平均值,EXTREME為極值,VAR為方差,INTENSITY為強度(極值減臨界值的絕對值);SPA(spectrum attribute)為譜屬性,SPA=SPT∪SPV,SPT為譜類型(傅立葉變換、小波函數、正交多項式、經驗正交分解等),SPV為譜展開系數。

        其中,H(history)為生命周期,H=FORMER ∪COMER,FORMER為過去時刻對應的空間對象標識,COMER為預報的未來時刻對應的空間對象標識;LA(life attribute)為生命周期屬性值(可以取值為新生、發(fā)展、持續(xù)、消散等)。

        其中,SCALE(scale)為尺度特征(大、中、小尺度等),PR(physical restrains)為數據滿足的物理約束關系(靜力關系、地轉平衡、位渦守恒等代碼)。

        預報員使用的業(yè)務數據通常為二維場數據,上述模型采用了二維空間對象模型;而實際大氣運動場是由時空四維場與要素維的五維空間來描述的,相應的空間實體是一個五維實體。因此,模型中也包括第3空間維、時間維和要素的取值。而這些二維空間對象在其他三維空間中的屬性可以通過它們之間在其他三維中的空間關系來描述。

        為了從業(yè)務氣象數據得到上述對象模型的各個參數,從提供的場數據中識別出空間對象的多組參數,并討論如何通過聚集變換從原始的場數據中自動識別出空間對象,從而產生出天氣預報分析型數據。為統一描述,在后面的敘述中將直接引用上述模型中的屬性代碼代替相應的文字。

        2 聚集變換的類型

        天氣預報業(yè)務中,原始觀測數據經過了數據融合(如局地分析預報系統LAPS)、同化(如三維變分3DVAR)或數值分析(如GRAPS)等處理,已較為規(guī)范。因此,分析型數據的生成主要集中在聚集變換上。聚集變換就是將原始數據變換為一些概括的、粒度比較大的數據,將信息濃縮到少量的粒度數據中以便于快速分析。對于天氣分析來說,數據倉庫提供的求和、匯總等變換遠遠不夠。因此,根據天氣分析的經驗,從業(yè)務場數據到空間對象的聚集變換包括空間固定區(qū)域統計、空間劃分區(qū)域統計、基本天氣系統識別、天氣學概念模型識別。

        2.1 空間固定區(qū)域統計

        取空間某固定區(qū)域內的場數據進行統計。此時該空間區(qū)域就被定義為一個空間對象,其SA不隨時間變化。

        這種數據主要應用其STA或SPA屬性。通常用于表示預報量、預報關鍵區(qū)或指標類的知識。如北京24h降水量、2m溫度、10m風等統計,SPA屬性則可以描述華北地區(qū)的降水場分布、風場分布等譜特征。一般區(qū)域面積小則以STA為主,面積大則以SPA為主。

        數據粒度根據給定區(qū)域的面積或譜展開保留的階數來確定。

        2.2 空間劃分區(qū)域統計

        與上述統計類似,將全場劃分為若干不重疊的區(qū)域。例如可以規(guī)則地取經、緯度每隔2°,5°,10°,或網格點每隔5,10,20個格點進行劃分;也可以不規(guī)則地取山區(qū)、平原、城市等,或按行政區(qū)劃進行劃分等。規(guī)則的劃分統計可以反映不同尺度的運動,其粒度的確定也與上述固定區(qū)域統計類似。

        2.3 基本天氣系統識別

        本文的基本天氣系統是指單一要素標量場的特征點、線、面對象。天氣預報分析中,特征點一般取極值中心(高、低中心)、線對象取槽、脊線、面對象取高、低值區(qū)。常見天氣系統大部分都可以由天氣要素場基本天氣系統表示,或通過一定的預處理。

        ?大梯度區(qū):計算要素場的梯度場,大梯度區(qū)就是梯度場的高值區(qū)。

        ?大梯度帶:計算要素場的梯度場,大梯度帶(如鋒區(qū))就是梯度場的脊區(qū)(線),適用于識別溫度鋒、露點鋒等。

        ?輻合、輻散中心:計算風場的散度場,取高、低中心。

        ? 輻合、輻散線:計算風場的散度場,取其槽、脊線。

        ?正、反渦旋中心:計算風場的渦度場,取高、低中心。

        ?正、反渦旋區(qū):計算風場的渦度場,取高、低值區(qū)。

        ?只考慮風向的正、反切變線:風速歸一化后計算的渦度場的槽、脊線。

        ?急流軸:計算風場的全風速場,取脊線。

        ?急流中心:計算風場的全風速場,取高中心。

        此類型數據的粒度將由兩種方法定義:一種是在不同粒度的規(guī)則劃分統計平均值場基礎上進行基本天氣系統識別,其粒度與這個場的粒度一樣;另一種是用天氣系統識別時的隸屬度作為其粒度。

        2.4 天氣學概念模型識別

        有些天氣系統無法從單一的場數據中識別,需要多個基本天氣系統的邏輯組合來識別。

        定義2:一組滿足一定空間關系的基本天氣系統的邏輯組合稱為天氣學概念模型(簡稱為概念模型)。

        本文中天氣學概念模型的定義與氣象領域的災害性天氣概念模型不同,主要用于復雜天氣系統的靜態(tài)識別。例如,對鋒線的識別必須建立相應的天氣學概念模型,通過對這個模型的識別來完成。

        概念模型粒度的確定與上述基本天氣系統一樣,也可以根據識別概念模型所使用的場數據的尺度,或根據規(guī)則滿足的隸屬度大小來確定。當組成概念模型的各基本天氣系統具有不同的粒度時,取其中最粗的粒度作為該概念模型的粒度。

        經過上述4類聚集變換就可以從原始的氣象場數據得到天氣預報的分析型數據。前兩類變換所需要的各種算法是天氣預報員熟知的,不在此贅述。后面兩類分析型數據產生的算法則比較復雜,須進一步說明。

        3 基本天氣系統的識別

        基本天氣系統的識別是從一個網格點場數據中識別出其特征的點、線、面對象,即預報員熟悉的高、低中心、槽、脊線和高、低值區(qū)等。常見的圖像處理和模式識別算法要處理的數據很復雜,如圖像處理首先就要遇到圖像數值化的問題。天氣預報業(yè)務中的數據大部分是規(guī)范的網格點數據,問題要簡單些。借鑒計算機視覺中的一些算法[8],本文提出一個簡單的基本天氣系統識別算法,即先對原始的數據場進行濾波,然后對濾波后的場劃分出高、低值區(qū),最后對每個高、低值區(qū)測量計算其相應的一系列屬性值,如高、低中心位置、強度、縱橫比等。根據屬性再將區(qū)域進行簡單的分類,區(qū)分出條狀的槽、脊和塊狀的高、低值區(qū)域等??煞Q為F(filtering,濾波)-D(dividing,劃分)-M(measuring,測量)算法。

        3.1 濾 波

        濾波是第1步,可以去除缺乏天氣學意義的尺度過小的波動,并可以突出數據場中對天氣系統識別重要的特征,另外也能用于將離散點(站點)數據插值到網格點上。常用濾波算法為距離權重方法:

        其中,Fi,j為濾波后第(i,j)個格點的值。W是權重函數,rn是第n個數據(站點或格點)到格點(i,j)的距離,Rc為影響半徑,θn則是第n個數據的值。使用不同的權重函數會有不同的濾波效果。針對天氣系統識別的特點,可以選用墨西哥帽函數作為權重函數:

        其中,r為距離;a和b為常數,表示控制函數尖銳或平坦狀況,該權重函數為一個較尖銳的高斯函數和一個較平滑的高斯函數之差(圖1)。

        圖1a是兩個高斯函數的圖形,相減后得到圖1b的墨西哥帽函數。這種權重函數的特點是靠近中心格點的權重為正,遠離中心格點的權重為負,權重為零的距離稱為臨界半徑。墨西哥帽權重函數的濾波作用是用中心格點附近(臨界半徑以內)的格點值減去周邊格點的值,其作用類似二階導數(網格點數據的二階導數差分格式就是用中心格點上、下、左、右4個格點值減去4倍的中心格點值),但符號相反。眾所周知,二階導數在函數凹凸之處、槽脊曲率最大處都會出現高、低中心。突出這些區(qū)域有利于天氣系統的識別。

        可以證明,墨西哥帽函數的頻率響應函數是頻率的單峰函數。臨界半徑越大,峰值頻率越低。如果取足夠大的臨界半徑,就可以使墨西哥帽函數濾波在該要素場頻率特征范圍內起到一個類似低通濾波器的作用。

        圖1 墨西哥帽權重函數(a)兩個高斯權重函數,(b)兩函數相減后結果Fig.1 Weight function of Mexican hat(a)two Gaussian wight functions,(b)result of sharper one subtract smoother one

        圖2a為一個LAPS(局地分析預報系統)分析的2012年7月7日20:00(北京時,下同)北京及河北北部地面散度場。由于LAPS地面分析考慮了地形等諸多因素,其分析場包含了很細致的中尺度特征,但也顯得十分凌亂(由于MICAPS V2等值線算法的限制,對如此凌亂的數據已經無法畫出正常的等值線)。上述濾波函數同時具有低通濾波的作用,取臨界半徑10km,得到的結果圖2b所示。通常一個中尺度天氣系統必須要有一定空間規(guī)模并持續(xù)一定的時間,才能產生有天氣意義的影響。對突出物理意義的數據分析來說,針對不同的分析任務設計不同的濾波參數濾掉尺度過小的系統很重要。但濾波會造成原始數據場的變形,有時為了保持原始數據場的特征,則不能濾波。

        圖2 2012年7月7日20:00北京及河北北部LAPS分析的地面散度場(a)濾波前,(b)濾波后Fig.2 LAPS surface divergence field of Beijing and north part of Hebei at 2000BT 7July 2012(a)before filtering,(b)after filtering

        3.2 劃 分

        濾波后的場要進行劃分。劃分的算法有生長法、閾值法等。本文針對天氣預報數據的特點提出雙閾值法進行劃分。其算法可描述如下:設t1和t2為兩個閾值,且t1>t2。取所有網格點值不小于t1且只有1個有效極值點的聯通區(qū)域為高值區(qū)、所有網格點值不大于t2且只有1個有效極值點的聯通區(qū)域為低值區(qū),網格點值小于t1且大于t2的聯通區(qū)域為臨界區(qū),臨界區(qū)只能有1個。即劃分結果必須滿足如下條件:①全場為互不重疊的若干高值區(qū)、若干低值區(qū)和1個臨界區(qū)組成,②所有高值區(qū)、低值區(qū)和臨界區(qū)均為聯通區(qū)域,③高值區(qū)內所有網格點值均不小于臨界值t1,④低值區(qū)內所有網格點值均不大于臨界值t2,⑤臨界區(qū)內所有網格點值均小于t1同時大于t2,⑥所有高值區(qū)和低值區(qū)都存在且僅存在1個有效極值點。

        極值點值與最低(高)邊緣值之差的絕對值大于人為指定的強度閾值時稱為有效極值點。求最低(高)邊緣值的算法為從極值網格點出發(fā),沿包括x軸正方向在內的均勻分布的8個方向延伸,取每個延伸射線經過的網格點值單調下降(或上升)達到該區(qū)域內最低(或最高)點時的值,得到8個方向的最低(或最高)值,取8個值中最低(或最高)的作為最低(高)邊緣值。取有效極值點可以消除那些強度過低的缺乏物理意義的極值點。有時在一個區(qū)域內有多個滿足條件的有效極值點,此時取其中之一即可。

        上述算法中雖然全場使用了統一的閾值(t1和t2),但實際上識別每個天氣系統的最佳閾值(t1或t2)應該取其最低(高)邊緣值。對不同的天氣系統,閾值不同。一般情況下,天氣系統尺度越大,最佳閾值越低。因此,只有在同一個場中天氣系統尺度相差不大時(如渦度場、散度場等)才可以采用統一的閾值t1,t2進行劃分。當天氣系統尺度相差較大時(如高度場、溫度場等,大槽、大脊與小波動同時存在),可先對原場進行尺度分離,形成幾個不同尺度的場,再對不同尺度的場采用不同的閾值進行識別。

        圖3a是對圖2地面散度場濾波后采用最簡單的全場統一閾值的劃分結果。

        圖3 對2012年7月7日20:00北京及河北北部LAPS地面散度場的劃分及測量(a)劃分區(qū)域,(b)測量得到的高、低中心和槽脊線(G為高中心,D為低中心;藍線為脊線,紅線為槽線)Fig.3 Result of dividing and measuring of LAPS surface divergence of Beijing and north part of Hebei at 2000BT 7July 2012(a)regions by dividing,(b)extreme center,trough and ridge line(G denotes high center,D denotes low center,blue line denotes ridge,red line denotes trough)

        3.3 測 量

        對劃分出的各高、低值區(qū)進行測量,計算出WAD數據模型中SA(空間屬性)、EA(非空間屬性)和TA(時間屬性)的所有屬性值。其中縱橫比用中心線CL的寬度除以長度得到,縱橫比小于某閾值的區(qū)域即為狹長的槽、脊區(qū)域,可以取其中心線CL為槽、脊線。在WAD模型中,空間形狀參數只取了縱橫比,用于區(qū)分線狀和塊狀對象。

        圖3b中標注G和D的區(qū)域標識高、低區(qū)域和中心(風場的輻散輻合中心)。標紅線和藍線的區(qū)域是縱橫比小于0.5的槽線和脊線(風場的輻合輻散線),最終分析結果見圖4。

        圖5給出2009年6月1日08:00的散度場分析與自動氣象站實況風場的對比,該個例未對散度場進行濾波。分析的天氣系統與實況吻合。

        對格距較大的網格數據,由于槽、脊線等采用的是區(qū)域的中心線,與實際的槽、脊線有一定誤差,這時可以對原網格進行內插加密(2~3倍甚至10倍),直到消除誤差為止。

        圖4 2012年7月7日20:00北京及河北北部LAPS地面散度場基本天氣系統Fig.4 Basic weather systems of LAPS surface divergence of Beijing and north part of Hebei at 2000BT 7July 2012

        圖5 對2009年6月1日08:00北京地區(qū)LAPS地面散度場的劃分及天氣系統分析(a)劃分區(qū)域與自動氣象站風相比,(b)測量得到的天氣系統分析(G為輻散中心,D為輻合中心;藍線為輻散線,紅線為輻合線)Fig.5 Result of dividing and weather systems of LAPS surface divergence of Beijing at 0800BT 1June 2009(a)regions by dividing vs wind in situ,(b)basic weather systems vs wind in situ(G denotes divergence center,D denotes convergence center;blue line denotes divergence line,red line denotes convergence line)

        4 天氣學概念模型的識別

        第3章算法解決了單一標量場的基本天氣系統識別問題。但只有對單一標量場的基本天氣系統識別是不夠的,例如冷鋒、颮線等必須用一組基本天氣系統的邏輯組合來識別。這就是2.4節(jié)定義2給出的天氣學概念模型。以鋒線為例,根據經驗給出一個定義。

        定義3:鋒線是一條特殊的地面切變線,其后方附近在850hPa上空有一條基本平行的鋒區(qū)或海平面氣壓的大梯度帶,在其前方附近地面有一個明顯的3h變壓的降壓中心或在其后方附近地面有一個明顯的3h變壓的升壓中心。

        該鋒線的定義具有如下4個特點:①是5個(至少要有3個存在)基本天氣系統的組合,地面切變線、850hPa鋒區(qū)、海平面氣壓大梯度帶、降壓中心、升壓中心;②基本天氣系統之間必須滿足一定的空間關系,如850hPa鋒區(qū)必須在地面切變線的后方、附近、基本平行等;③各基本天氣系統的存在和它們之間的關系都是模糊的,如“附近”、“基本平行”,“明顯”等模糊詞匯;④有一個確定鋒線位置的定位條件,鋒線位置與地面切變線一致。

        用預報員熟悉的方式表示這類具有上述4個特點的知識,選擇用空間模糊產生式規(guī)則。將各類天氣系統概念模型都轉化成空間模糊產生式規(guī)則,則可以組成天氣系統概念模型的規(guī)則庫,與相應的推理機就構成了一個知識庫系統。這樣,天氣系統的識別過程就成為對這個知識庫系統的推理過程。

        模糊產生式規(guī)則[9]可以表達為

        其中,P是結論,Q是前提,CF為規(guī)則可信度,τ是預報員根據經驗確定的閾值。

        空間的模糊產生式規(guī)則,則是包含了空間對象和模糊空間關系的模糊產生式規(guī)則。

        空間對象是通過第2章中前3類聚集變換得到的分析型數據,其存在可以是確定的,也可以是模糊的(根據實際空間對象與理想空間對象的屬性進行比較給出隸屬度)。

        空間關系則是指兩個空間對象屬性之間的關系。根據GIS理論,空間關系分為度量關系、順序關系(方位關系)和拓撲關系3類[10]。而模糊空間關系就是在兩個空間對象屬性之間計算的這些空間關系的隸屬度。

        拓撲關系[11-14]是在空間任意伸縮扭曲的情況下都不會改變的空間關系。采用Egenhofer等[15]早期定義的8種簡單的拓撲關系,針對氣象數據特點可以簡化為相離、相接、相疊和覆蓋4種拓撲關系。根據WAD的位置點集(LS)不難計算它們的隸屬度。

        度量關系是空間對象屬性之間的數值關系。主要包括空間距離(可以有幾何中心距離、平均距離、最近距離等)、平行(根據中心線CL各頂點坐標計算)等度量,EA各屬性(強度、面積等)之間的比較等。

        順序關系包括重要的方位關系,即一個對象相對另一個對象的方位,對天氣預報來說,更重要的是前后關系,即一個對象在另一個對象運動的前方還是后方,以及垂直方向的前傾、后傾等順序關系。這首先需要解決判斷天氣系統移動方向的復雜問題,在大尺度西風帶可以用方位關系代替復雜的前后關系,一般東南方是系統移動的前方,西北方是后方。對于雷達回波系統等就需要借鑒例如雷暴識別追蹤分析預報(TITAN)等算法[16]。

        模糊產生式規(guī)則一般的推理過程是先根據各條件的隸屬度計算Q的匹配程度m,然后計算真度t??梢匀=min{m,CF},或t=m×CF。當t>τ時,規(guī)則被激活,即結論P成立,且結論的真度為t。

        一個空間模糊產生式規(guī)則被激活后,應該得到一個結論的空間對象p。例如前面鋒線定義中p就是一個與地面切變線一致的空間對象。因此伴隨一個空間模糊產生式規(guī)則應該有一個從Q的各空間對象屬性中生成p的各屬性的規(guī)則。如可以規(guī)定鋒線繼承地面切變線所有的屬性。但一般情況下,要確定p的全部屬性是一個復雜問題,還有待進一步研究。下面給出一個能夠確定p空間位置的定位條件定義。

        定義4:定位條件是規(guī)則前提Q中與結論P空間位置有關的各空間對象位置點集LS的交、并、補的集合運算式。

        當規(guī)則激活時,Q中存在的各空間對象LS經過定位條件的集合運算就能夠得到結論空間對象p的空間點集LS。LS是p最重要的屬性。

        5 小 結

        天氣預報分析型數據的定義和生成是整個天氣預報數據倉庫的基礎。本文針對天氣預報領域的特點對分析型數據模型的定義和生成技術進行了深入探討。重點考慮了氣象數據的空間性、模糊性、時變性、物理性和多尺度性等特點,給出了WAD數據模型和產生該模型各屬性的一系列算法,未來將在實時業(yè)務環(huán)境的進一步研究中試驗并優(yōu)化。

        將原始數據轉換為分析型數據的算法與數據倉庫建設目的密切相關,須由預報員結合信息技術專家共同實現。分析型數據產生后,其存儲、檢索等問題可以借助現有的商業(yè)數據倉庫產品(ORICLE,SQL Server等)實現。如何建立基于本文WAD模型的數據倉庫及數據挖掘和聯機分析處理系統,將在未來的研究中進一步探討。

        [1] 譚曉光.數據倉庫技術在天氣預報決策中的應用探討.應用氣象學報,2006,17(3):325-332.

        [2] 李景文,田麗亞,張燕,等.面向對象的空間數據模型設計方法.地理空間信息,2011,9(5):9-11.

        [3] 劉亞彬,劉大友,王飛.空間對象的幾何表示.計算機科學,2003,30(3):62-64.

        [4] 劉瑜,龔詠喜,張晶,等.地理空間中的空間關系表達和推理.地理與地理信息科學,2007,23(5):1-7.

        [5] 滿君豐,劉強,楊鼎.空間數據的表示方法研究.計算機應用,2004,24(11):97-99.

        [6] 王宏勇,郭建星.空間運動對象與時空數據類型研究.地理與地理信息科學,2005,21(5):1-5.

        [7] 張英,邵峰晶,孫仁誠.面向對象的四元組時空數據模型.四川大學學報:工程科學版,2007,39(增刊):115-118.

        [8] 傅京孫.人工智能及其應用.北京:清華大學出版社,1987.

        [9] 何新貴.模糊知識處理的理論與技術(第二版).北京:國防工業(yè)出版社,1998.

        [10] 蔡少華,翟戰(zhàn)強.GIS基礎空間關系分析.測繪工程,1999,8(2):38-42.

        [11] 吳長彬,閭國年.空間拓撲關系若干問題研究現狀的評析.地球信息科學學報,2010,12(4):524-531.

        [12] 寇振華,應新洋,周國兵.GIS中拓撲關系及空間推理研究.計算機應用研究,2005(5):97-99.

        [13] 郭慶勝,丁虹,劉浩,等.面狀目標之間空間拓撲關系的組合式分類.武漢大學學報:信息科學版,2005,30(8):728-732.

        [14] 郭慶勝,陳宇箭,劉浩.線與面的空間拓撲關系組合推理.武漢大學學報:信息科學版,2005,30(6):529-532.

        [15] Egenhofer M J,Herring J R.A Mathematical Framework for the Definition of Topological Relationships∥Brassel K E,KishimotoH.4th International Symposium on Spatial Data Handling.Zurich:Department of Geography,University of Zurich,1990:803-813.

        [16] 韓雷,鄭永光,王洪慶,等.基于數學形態(tài)學的三維風暴體自動識別方法研究.氣象學報,2007,65(5):805-814.

        Model and Generation of Weather Forecast Analytic Data

        Tan Xiaoguang1)Luo Bing2)

        1)(Institute of Urban Meteorology,CMA,Beijing100089)
        2)(National Meteorological Center,Beijing100081)

        To solve the problem of“information exploration”in operational weather forecast,building a data warehouse to help forecaster’s analysis is necessary.The key and most valuable idea is to change raw data to analytic data,include extracting useful data,making data clean,and aggregating data to rough granularity data.Usually the meteorological data got in operational weather forecast is processed,clean and canonical.So the main process is“aggregation”to concentrate the weather information to fewer data which have clear physical meaning.

        A conceptual model of weather analytic data is suggested with a pentagon tuple considering the spatial,transitional,physical and multi-scale natures of meteorological data.The pentagon tuple refers to ID(identification),SA (spatial attributes),EA (entity attributes),TA (time attributes)and PA (physical attributes),including several detailed attributes set each.Although meteorological data is field data,forecasters usually use spatial object data to analyze the weather systems.So the main work of changing raw data to analytic data is identifying spatial objects from field data.

        Four aggregations arithmetics to change raw data to analytic data are suggested:Statistics for fixed region,statistics for given spatial or temporal partitions,identification of basic weather systems and identification of weather conceptual models.The former two are relatively simple statistics,while the latter two are complex for mutative spatial object and they are discussed in detail.

        Basic weather systems include region of high/low,center of high/low and trough/ridge in a data field.A filtering-dividing-measuring arithmetic is suggested.Filtered with a Mexican-h(huán)at function,the trough/ridge become high/low region and easier to identify,and then the high/low region are divided from the filtered field,with some arithmetics adopted to tread with multi-scale problems of meteorological field.At last the divided regions are measured to get area,extreme value,length,width,aspect ratio(width/length),geometry center,extreme data location,points of central line,including all attributes of SA,EA,TA and PA.If the aspect ratio is smaller than a threshold,the region will be identified as a trough or ridge,and the central line is the trough or ridge line.

        A knowledge base system with spatial fuzzy production rule is suggested for identifying weather conceptual models(e.g.,cold front),and the rational process of this rule is described.4topological relations,several order relations,measure relations and their subjection functions are suggested.The conclusion of the rules is expanded to spatial objects with a result-spatial-object.

        weather forecast;data warehouse;weather analytic data;weather system identifying

        譚曉光,羅兵.天氣預報分析型數據模型及生成.應用氣象學報,2014,25(1):120-128.

        2013-02-18收到,2013-10-23收到再改稿。

        公益性行業(yè)(氣象)科研專項(GYHY201206031)

        *email:xgtan@ium.cn

        猜你喜歡
        分析系統
        Smartflower POP 一體式光伏系統
        WJ-700無人機系統
        隱蔽失效適航要求符合性驗證分析
        ZC系列無人機遙感系統
        北京測繪(2020年12期)2020-12-29 01:33:58
        基于PowerPC+FPGA顯示系統
        半沸制皂系統(下)
        電力系統不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        電力系統及其自動化發(fā)展趨勢分析
        中西醫(yī)結合治療抑郁癥100例分析
        国产午夜福利100集发布| 国产午夜激情视频在线看| 中国亚洲av第一精品| 久久久久久av无码免费网站下载| 中文字幕久久精品一二三区| 欧美国产亚洲日韩在线二区| 日本激情视频一区在线观看| 我揉搓少妇好久没做高潮| 久久久久88色偷偷| 人妻影音先锋啪啪av资源| 在线观看精品国产福利片100| 白嫩少妇在线喷水18禁| 人人妻人人澡人人爽精品日本| 婷婷中文字幕综合在线| 国产日韩A∨无码免费播放| 91国语对白在线观看| 91伦理片视频国产精品久久久| 我把护士日出水了视频90分钟| 中文字幕福利视频| 国产亚洲精品成人av在线| 国产在线视频91九色| 免费拍拍拍网站| av一区无码不卡毛片| 中文字幕人妻乱码在线| 色爱情人网站| 久久精品人人爽人人爽| 日韩成人精品日本亚洲| 国产精品女同一区二区免| 麻豆网神马久久人鬼片| 色欲麻豆国产福利精品| 国产美女亚洲精品一区| 亚洲国产中文字幕无线乱码| 377p日本欧洲亚洲大胆张筱雨| 国产日韩在线播放观看| 女同中文字幕在线观看| 2019nv天堂香蕉在线观看| 国产成人av免费观看| 欧洲AV秘 无码一区二区三| 极品尤物在线精品一区二区三区| 夜夜添夜夜添夜夜摸夜夜摸| 午夜tv视频免费国产区4|