廖娟 阮運飛
摘要:以農(nóng)業(yè)災(zāi)害中常見的水災(zāi)為例,文章提出一種基于斜率過濾分段的時間序列匹配方法,定義了水深序列和應(yīng)用于農(nóng)業(yè)災(zāi)害的相似度量模型。根據(jù)過濾算法,確定出農(nóng)業(yè)災(zāi)害等級,從以往水災(zāi)數(shù)據(jù)庫中調(diào)出應(yīng)急方法,達到輔助決策的目的,為農(nóng)業(yè)災(zāi)害的輔助及防治提供了很好的技術(shù)支持。
關(guān)鍵詞:過濾分段;時間序列匹配;輔助決策
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)12-2871-02
A kind of Natural Disasters in Agriculture Aided Decision System Based on Time Series
LIAO Juan, RUAN Yun-fei
(KaiLi University, KaiLi 556011, China)
Abstract: In the agricultural disasters common floods, for example, the article puts forward a kind of time series matching method based on slope filtering section, defines the sequence and the depth of the water used in agriculture disasters similarity measurement model. Based on filter algorithm to determine the level of agricultural disaster, emergency method, from previous flood database, in an achieve the purpose of aid decision making, for the auxiliary of agricultural disasters and prevention provides a good technical support.
Key words: filtering section; time series matching; aid decision making
時間序列數(shù)據(jù)在社會中有著非常廣的使用[1],生活中、商業(yè)上、科學(xué)上等等各個領(lǐng)域幾乎都涉及到時間序列數(shù)據(jù)。而農(nóng)業(yè)中的水災(zāi)是農(nóng)業(yè)災(zāi)害中比較重要也是常見的一種自然災(zāi)害[2],該災(zāi)害涉及到雨水的多少、風(fēng)的大小等都會造成一定的農(nóng)業(yè)經(jīng)濟損失。結(jié)合雨水中的一些特點,利用時間序列匹配的方法,給農(nóng)民提前傳授一定的預(yù)防知識,是非常有必要而且有意義[3]。
1 算法的相關(guān)定義
定義1:水深序列:把洪水或者大雨等事件的空間、地域描述等屬性忽略,根據(jù)洪水發(fā)生的時間,按照時間將該事項連接起來。從而,一個水深序列就可以用[S=S(t)|t=0,1,2,…,n]來表示。
定義2:水深序列長度:水深序列 [S]的長度即為水深時間序列元素的個數(shù),該序列的任意一個元素,表示的是水深時間序列在某一個時刻的最高水位值。[S[i]]表示水深序列[S]中的第[i]個元素,[S(t)]表示水深序列[S]在[t]時刻的最高水位值。
定義3:相似度量模型定義:假設(shè)[Q]和[C]是和是兩個不同的水深時間序列,那么這兩個序列的相似性定義為這兩個序列相對應(yīng)的元素的相似性來確定。
他們的度量模型定義:
[Measure(Q,C)=i=1max{|Q|,|C|}δ(Q[i],C[i])]
其中,若[|Q|=|C|],則兩序列的長度相等。
2 算法描述
基于斜率過濾分段的水深序列相似匹配算法(SHM_SF):
步驟1:首先對搜集到的數(shù)據(jù)進行預(yù)處理,經(jīng)過篩選、按照時間順序,把不符合規(guī)定是數(shù)據(jù)剔除掉。同時,將對應(yīng)的水深信息放在預(yù)處理文件中。
步驟2:把經(jīng)過預(yù)處理的數(shù)據(jù)構(gòu)造成水深序列,即按照時間順序把各個地方的水深數(shù)據(jù)編號,依次放入數(shù)組中,形成一組水深序列SSS。
步驟3:水深數(shù)據(jù)的處理,把監(jiān)測到的水深數(shù)據(jù)依次按照步驟1進行預(yù)處理,根據(jù)時間順序放入數(shù)組中形成時間序列數(shù)據(jù)。
步驟4:把得來的水深數(shù)據(jù)經(jīng)過步驟3形成水深時間序列,同農(nóng)業(yè)災(zāi)害數(shù)據(jù)庫中的水深時間序列進行過濾分段基于斜率的相似匹配比較,如果相似則放入到指定的經(jīng)過一級過濾的數(shù)據(jù)庫中,再利用定義3的相似度量模型,確定好閾值,如果得出的相似度小于該閾值,則篩選出改條水深時間序列,從而人為它是要找的相似的那條序列。
步驟5:水深輔助決策,依據(jù)步驟4得出的相似序列,在水深災(zāi)害數(shù)據(jù)庫中找到相似匹配的災(zāi)害等級,農(nóng)業(yè)相關(guān)部門根據(jù)結(jié)果,找到往年是如何給農(nóng)民提出相對應(yīng)的意見,再針對該次水災(zāi)發(fā)生的時間長短,給出指導(dǎo)性的意見。流程圖如下圖所示:
該算法在使用了基于斜率的分段相似匹配之后,利用定義3進行的兩序列之間的匹配需各序列對應(yīng)元素一一匹配。
3 實驗設(shè)計與分析
3.1 災(zāi)情等級評價
根據(jù)上述算法可以得出動態(tài)水位分布,評定災(zāi)害等級,綜合災(zāi)害等級得到該次災(zāi)害的信息。災(zāi)情等級分為非常嚴重、嚴重、中級、初級、沒影響等,每一級別都有相應(yīng)的應(yīng)對信息。
3.2 應(yīng)用實例及結(jié)果分析
農(nóng)業(yè)災(zāi)害的輔助決策,該文主要針對水自然災(zāi)害,該方法是通過在已有的農(nóng)業(yè)水災(zāi)害數(shù)據(jù)庫中按照步驟3本水深數(shù)據(jù)處理為水深時間序列事件,每次農(nóng)業(yè)水災(zāi)害都有與之對應(yīng)的處理方法,該文就是利用分段的時間序列相似匹配方法把目前已有的水深數(shù)據(jù)處理為水深時間序列數(shù)據(jù),與數(shù)據(jù)庫中的時間數(shù)據(jù)序列進行匹配,得出最符合要求的時間序列,從而根據(jù)當年發(fā)生該次災(zāi)害時處理的方法,得出該次災(zāi)害應(yīng)如何處理。例如下面圖2這個例子,是1960年7月發(fā)生的通過本文的方法,得到最相似的是1961年10的嚴重潮災(zāi)。那么,根據(jù)該次潮災(zāi)發(fā)生時,當時農(nóng)業(yè)部門處理的方法,就可以很快得出應(yīng)急方案,減少損失。
該算法的[l]值選取非常關(guān)鍵,因為該值選取過大或過小,對算法的影響比較大。該值如果過大,則分段的數(shù)目就會減少,從而導(dǎo)致會多過濾掉時間序列,把本來相似的序列給過濾掉。反之,如果該值過小,那么過濾掉的效果就不明顯,起不到篩選的作用。經(jīng)過多次實驗,[l]值為7時,效果是最佳的, 既沒有過濾掉相似的序列,也有效的剔除掉了一部分序列。
從該實驗可得知,該算法在l=7時相似匹配程度較高,準確性較好,在為農(nóng)民提供有利的災(zāi)害信息時,比較及時和準確。
4 結(jié)束語
在農(nóng)業(yè)自然災(zāi)害方面,水災(zāi)是比較常見的災(zāi)害。而風(fēng)暴潮災(zāi)害也是其中的一種,文章針對農(nóng)業(yè)水災(zāi)害中碰到的一些問題,采用數(shù)學(xué)分析的方法,提出了基于過濾分段的算法,對于更好的指導(dǎo)農(nóng)民的農(nóng)業(yè)作業(yè)有著一定的幫助。
參考文獻:
[1] 張鵬,張錦文,王喜年.天津沿海風(fēng)暴潮實時監(jiān)測預(yù)報系統(tǒng)[J].海洋預(yù)報,2002(19):16-22.
[2] 國宏偉,劉燕馳,梁合蘭,武森.多變量時間序列的模糊決策樹挖掘[J].計算機應(yīng)用研究,2009(1).
[3] 吳紹春,吳耿鋒,王煒,蔚趙春.尋找地震相關(guān)地區(qū)的時間序列相似性匹配算法[J].軟件學(xué)報,2006,17:185-192.endprint
摘要:以農(nóng)業(yè)災(zāi)害中常見的水災(zāi)為例,文章提出一種基于斜率過濾分段的時間序列匹配方法,定義了水深序列和應(yīng)用于農(nóng)業(yè)災(zāi)害的相似度量模型。根據(jù)過濾算法,確定出農(nóng)業(yè)災(zāi)害等級,從以往水災(zāi)數(shù)據(jù)庫中調(diào)出應(yīng)急方法,達到輔助決策的目的,為農(nóng)業(yè)災(zāi)害的輔助及防治提供了很好的技術(shù)支持。
關(guān)鍵詞:過濾分段;時間序列匹配;輔助決策
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)12-2871-02
A kind of Natural Disasters in Agriculture Aided Decision System Based on Time Series
LIAO Juan, RUAN Yun-fei
(KaiLi University, KaiLi 556011, China)
Abstract: In the agricultural disasters common floods, for example, the article puts forward a kind of time series matching method based on slope filtering section, defines the sequence and the depth of the water used in agriculture disasters similarity measurement model. Based on filter algorithm to determine the level of agricultural disaster, emergency method, from previous flood database, in an achieve the purpose of aid decision making, for the auxiliary of agricultural disasters and prevention provides a good technical support.
Key words: filtering section; time series matching; aid decision making
時間序列數(shù)據(jù)在社會中有著非常廣的使用[1],生活中、商業(yè)上、科學(xué)上等等各個領(lǐng)域幾乎都涉及到時間序列數(shù)據(jù)。而農(nóng)業(yè)中的水災(zāi)是農(nóng)業(yè)災(zāi)害中比較重要也是常見的一種自然災(zāi)害[2],該災(zāi)害涉及到雨水的多少、風(fēng)的大小等都會造成一定的農(nóng)業(yè)經(jīng)濟損失。結(jié)合雨水中的一些特點,利用時間序列匹配的方法,給農(nóng)民提前傳授一定的預(yù)防知識,是非常有必要而且有意義[3]。
1 算法的相關(guān)定義
定義1:水深序列:把洪水或者大雨等事件的空間、地域描述等屬性忽略,根據(jù)洪水發(fā)生的時間,按照時間將該事項連接起來。從而,一個水深序列就可以用[S=S(t)|t=0,1,2,…,n]來表示。
定義2:水深序列長度:水深序列 [S]的長度即為水深時間序列元素的個數(shù),該序列的任意一個元素,表示的是水深時間序列在某一個時刻的最高水位值。[S[i]]表示水深序列[S]中的第[i]個元素,[S(t)]表示水深序列[S]在[t]時刻的最高水位值。
定義3:相似度量模型定義:假設(shè)[Q]和[C]是和是兩個不同的水深時間序列,那么這兩個序列的相似性定義為這兩個序列相對應(yīng)的元素的相似性來確定。
他們的度量模型定義:
[Measure(Q,C)=i=1max{|Q|,|C|}δ(Q[i],C[i])]
其中,若[|Q|=|C|],則兩序列的長度相等。
2 算法描述
基于斜率過濾分段的水深序列相似匹配算法(SHM_SF):
步驟1:首先對搜集到的數(shù)據(jù)進行預(yù)處理,經(jīng)過篩選、按照時間順序,把不符合規(guī)定是數(shù)據(jù)剔除掉。同時,將對應(yīng)的水深信息放在預(yù)處理文件中。
步驟2:把經(jīng)過預(yù)處理的數(shù)據(jù)構(gòu)造成水深序列,即按照時間順序把各個地方的水深數(shù)據(jù)編號,依次放入數(shù)組中,形成一組水深序列SSS。
步驟3:水深數(shù)據(jù)的處理,把監(jiān)測到的水深數(shù)據(jù)依次按照步驟1進行預(yù)處理,根據(jù)時間順序放入數(shù)組中形成時間序列數(shù)據(jù)。
步驟4:把得來的水深數(shù)據(jù)經(jīng)過步驟3形成水深時間序列,同農(nóng)業(yè)災(zāi)害數(shù)據(jù)庫中的水深時間序列進行過濾分段基于斜率的相似匹配比較,如果相似則放入到指定的經(jīng)過一級過濾的數(shù)據(jù)庫中,再利用定義3的相似度量模型,確定好閾值,如果得出的相似度小于該閾值,則篩選出改條水深時間序列,從而人為它是要找的相似的那條序列。
步驟5:水深輔助決策,依據(jù)步驟4得出的相似序列,在水深災(zāi)害數(shù)據(jù)庫中找到相似匹配的災(zāi)害等級,農(nóng)業(yè)相關(guān)部門根據(jù)結(jié)果,找到往年是如何給農(nóng)民提出相對應(yīng)的意見,再針對該次水災(zāi)發(fā)生的時間長短,給出指導(dǎo)性的意見。流程圖如下圖所示:
該算法在使用了基于斜率的分段相似匹配之后,利用定義3進行的兩序列之間的匹配需各序列對應(yīng)元素一一匹配。
3 實驗設(shè)計與分析
3.1 災(zāi)情等級評價
根據(jù)上述算法可以得出動態(tài)水位分布,評定災(zāi)害等級,綜合災(zāi)害等級得到該次災(zāi)害的信息。災(zāi)情等級分為非常嚴重、嚴重、中級、初級、沒影響等,每一級別都有相應(yīng)的應(yīng)對信息。
3.2 應(yīng)用實例及結(jié)果分析
農(nóng)業(yè)災(zāi)害的輔助決策,該文主要針對水自然災(zāi)害,該方法是通過在已有的農(nóng)業(yè)水災(zāi)害數(shù)據(jù)庫中按照步驟3本水深數(shù)據(jù)處理為水深時間序列事件,每次農(nóng)業(yè)水災(zāi)害都有與之對應(yīng)的處理方法,該文就是利用分段的時間序列相似匹配方法把目前已有的水深數(shù)據(jù)處理為水深時間序列數(shù)據(jù),與數(shù)據(jù)庫中的時間數(shù)據(jù)序列進行匹配,得出最符合要求的時間序列,從而根據(jù)當年發(fā)生該次災(zāi)害時處理的方法,得出該次災(zāi)害應(yīng)如何處理。例如下面圖2這個例子,是1960年7月發(fā)生的通過本文的方法,得到最相似的是1961年10的嚴重潮災(zāi)。那么,根據(jù)該次潮災(zāi)發(fā)生時,當時農(nóng)業(yè)部門處理的方法,就可以很快得出應(yīng)急方案,減少損失。
該算法的[l]值選取非常關(guān)鍵,因為該值選取過大或過小,對算法的影響比較大。該值如果過大,則分段的數(shù)目就會減少,從而導(dǎo)致會多過濾掉時間序列,把本來相似的序列給過濾掉。反之,如果該值過小,那么過濾掉的效果就不明顯,起不到篩選的作用。經(jīng)過多次實驗,[l]值為7時,效果是最佳的, 既沒有過濾掉相似的序列,也有效的剔除掉了一部分序列。
從該實驗可得知,該算法在l=7時相似匹配程度較高,準確性較好,在為農(nóng)民提供有利的災(zāi)害信息時,比較及時和準確。
4 結(jié)束語
在農(nóng)業(yè)自然災(zāi)害方面,水災(zāi)是比較常見的災(zāi)害。而風(fēng)暴潮災(zāi)害也是其中的一種,文章針對農(nóng)業(yè)水災(zāi)害中碰到的一些問題,采用數(shù)學(xué)分析的方法,提出了基于過濾分段的算法,對于更好的指導(dǎo)農(nóng)民的農(nóng)業(yè)作業(yè)有著一定的幫助。
參考文獻:
[1] 張鵬,張錦文,王喜年.天津沿海風(fēng)暴潮實時監(jiān)測預(yù)報系統(tǒng)[J].海洋預(yù)報,2002(19):16-22.
[2] 國宏偉,劉燕馳,梁合蘭,武森.多變量時間序列的模糊決策樹挖掘[J].計算機應(yīng)用研究,2009(1).
[3] 吳紹春,吳耿鋒,王煒,蔚趙春.尋找地震相關(guān)地區(qū)的時間序列相似性匹配算法[J].軟件學(xué)報,2006,17:185-192.endprint
摘要:以農(nóng)業(yè)災(zāi)害中常見的水災(zāi)為例,文章提出一種基于斜率過濾分段的時間序列匹配方法,定義了水深序列和應(yīng)用于農(nóng)業(yè)災(zāi)害的相似度量模型。根據(jù)過濾算法,確定出農(nóng)業(yè)災(zāi)害等級,從以往水災(zāi)數(shù)據(jù)庫中調(diào)出應(yīng)急方法,達到輔助決策的目的,為農(nóng)業(yè)災(zāi)害的輔助及防治提供了很好的技術(shù)支持。
關(guān)鍵詞:過濾分段;時間序列匹配;輔助決策
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)12-2871-02
A kind of Natural Disasters in Agriculture Aided Decision System Based on Time Series
LIAO Juan, RUAN Yun-fei
(KaiLi University, KaiLi 556011, China)
Abstract: In the agricultural disasters common floods, for example, the article puts forward a kind of time series matching method based on slope filtering section, defines the sequence and the depth of the water used in agriculture disasters similarity measurement model. Based on filter algorithm to determine the level of agricultural disaster, emergency method, from previous flood database, in an achieve the purpose of aid decision making, for the auxiliary of agricultural disasters and prevention provides a good technical support.
Key words: filtering section; time series matching; aid decision making
時間序列數(shù)據(jù)在社會中有著非常廣的使用[1],生活中、商業(yè)上、科學(xué)上等等各個領(lǐng)域幾乎都涉及到時間序列數(shù)據(jù)。而農(nóng)業(yè)中的水災(zāi)是農(nóng)業(yè)災(zāi)害中比較重要也是常見的一種自然災(zāi)害[2],該災(zāi)害涉及到雨水的多少、風(fēng)的大小等都會造成一定的農(nóng)業(yè)經(jīng)濟損失。結(jié)合雨水中的一些特點,利用時間序列匹配的方法,給農(nóng)民提前傳授一定的預(yù)防知識,是非常有必要而且有意義[3]。
1 算法的相關(guān)定義
定義1:水深序列:把洪水或者大雨等事件的空間、地域描述等屬性忽略,根據(jù)洪水發(fā)生的時間,按照時間將該事項連接起來。從而,一個水深序列就可以用[S=S(t)|t=0,1,2,…,n]來表示。
定義2:水深序列長度:水深序列 [S]的長度即為水深時間序列元素的個數(shù),該序列的任意一個元素,表示的是水深時間序列在某一個時刻的最高水位值。[S[i]]表示水深序列[S]中的第[i]個元素,[S(t)]表示水深序列[S]在[t]時刻的最高水位值。
定義3:相似度量模型定義:假設(shè)[Q]和[C]是和是兩個不同的水深時間序列,那么這兩個序列的相似性定義為這兩個序列相對應(yīng)的元素的相似性來確定。
他們的度量模型定義:
[Measure(Q,C)=i=1max{|Q|,|C|}δ(Q[i],C[i])]
其中,若[|Q|=|C|],則兩序列的長度相等。
2 算法描述
基于斜率過濾分段的水深序列相似匹配算法(SHM_SF):
步驟1:首先對搜集到的數(shù)據(jù)進行預(yù)處理,經(jīng)過篩選、按照時間順序,把不符合規(guī)定是數(shù)據(jù)剔除掉。同時,將對應(yīng)的水深信息放在預(yù)處理文件中。
步驟2:把經(jīng)過預(yù)處理的數(shù)據(jù)構(gòu)造成水深序列,即按照時間順序把各個地方的水深數(shù)據(jù)編號,依次放入數(shù)組中,形成一組水深序列SSS。
步驟3:水深數(shù)據(jù)的處理,把監(jiān)測到的水深數(shù)據(jù)依次按照步驟1進行預(yù)處理,根據(jù)時間順序放入數(shù)組中形成時間序列數(shù)據(jù)。
步驟4:把得來的水深數(shù)據(jù)經(jīng)過步驟3形成水深時間序列,同農(nóng)業(yè)災(zāi)害數(shù)據(jù)庫中的水深時間序列進行過濾分段基于斜率的相似匹配比較,如果相似則放入到指定的經(jīng)過一級過濾的數(shù)據(jù)庫中,再利用定義3的相似度量模型,確定好閾值,如果得出的相似度小于該閾值,則篩選出改條水深時間序列,從而人為它是要找的相似的那條序列。
步驟5:水深輔助決策,依據(jù)步驟4得出的相似序列,在水深災(zāi)害數(shù)據(jù)庫中找到相似匹配的災(zāi)害等級,農(nóng)業(yè)相關(guān)部門根據(jù)結(jié)果,找到往年是如何給農(nóng)民提出相對應(yīng)的意見,再針對該次水災(zāi)發(fā)生的時間長短,給出指導(dǎo)性的意見。流程圖如下圖所示:
該算法在使用了基于斜率的分段相似匹配之后,利用定義3進行的兩序列之間的匹配需各序列對應(yīng)元素一一匹配。
3 實驗設(shè)計與分析
3.1 災(zāi)情等級評價
根據(jù)上述算法可以得出動態(tài)水位分布,評定災(zāi)害等級,綜合災(zāi)害等級得到該次災(zāi)害的信息。災(zāi)情等級分為非常嚴重、嚴重、中級、初級、沒影響等,每一級別都有相應(yīng)的應(yīng)對信息。
3.2 應(yīng)用實例及結(jié)果分析
農(nóng)業(yè)災(zāi)害的輔助決策,該文主要針對水自然災(zāi)害,該方法是通過在已有的農(nóng)業(yè)水災(zāi)害數(shù)據(jù)庫中按照步驟3本水深數(shù)據(jù)處理為水深時間序列事件,每次農(nóng)業(yè)水災(zāi)害都有與之對應(yīng)的處理方法,該文就是利用分段的時間序列相似匹配方法把目前已有的水深數(shù)據(jù)處理為水深時間序列數(shù)據(jù),與數(shù)據(jù)庫中的時間數(shù)據(jù)序列進行匹配,得出最符合要求的時間序列,從而根據(jù)當年發(fā)生該次災(zāi)害時處理的方法,得出該次災(zāi)害應(yīng)如何處理。例如下面圖2這個例子,是1960年7月發(fā)生的通過本文的方法,得到最相似的是1961年10的嚴重潮災(zāi)。那么,根據(jù)該次潮災(zāi)發(fā)生時,當時農(nóng)業(yè)部門處理的方法,就可以很快得出應(yīng)急方案,減少損失。
該算法的[l]值選取非常關(guān)鍵,因為該值選取過大或過小,對算法的影響比較大。該值如果過大,則分段的數(shù)目就會減少,從而導(dǎo)致會多過濾掉時間序列,把本來相似的序列給過濾掉。反之,如果該值過小,那么過濾掉的效果就不明顯,起不到篩選的作用。經(jīng)過多次實驗,[l]值為7時,效果是最佳的, 既沒有過濾掉相似的序列,也有效的剔除掉了一部分序列。
從該實驗可得知,該算法在l=7時相似匹配程度較高,準確性較好,在為農(nóng)民提供有利的災(zāi)害信息時,比較及時和準確。
4 結(jié)束語
在農(nóng)業(yè)自然災(zāi)害方面,水災(zāi)是比較常見的災(zāi)害。而風(fēng)暴潮災(zāi)害也是其中的一種,文章針對農(nóng)業(yè)水災(zāi)害中碰到的一些問題,采用數(shù)學(xué)分析的方法,提出了基于過濾分段的算法,對于更好的指導(dǎo)農(nóng)民的農(nóng)業(yè)作業(yè)有著一定的幫助。
參考文獻:
[1] 張鵬,張錦文,王喜年.天津沿海風(fēng)暴潮實時監(jiān)測預(yù)報系統(tǒng)[J].海洋預(yù)報,2002(19):16-22.
[2] 國宏偉,劉燕馳,梁合蘭,武森.多變量時間序列的模糊決策樹挖掘[J].計算機應(yīng)用研究,2009(1).
[3] 吳紹春,吳耿鋒,王煒,蔚趙春.尋找地震相關(guān)地區(qū)的時間序列相似性匹配算法[J].軟件學(xué)報,2006,17:185-192.endprint