宋佳陽
(遼寧省鞍山水文局,遼寧 鞍山 114000)
當(dāng)前河流數(shù)字化提取隨著地理信息技術(shù)快速發(fā)展已成為區(qū)域河流調(diào)查和評(píng)價(jià)的主要方式,水利普查已經(jīng)完成了流域面積50km2河流數(shù)字化提取工作,但對(duì)于流域面積在10~50km2小型河流還未開展數(shù)字化提取工作,而對(duì)于鞍山地區(qū)而言,由于位于遼寧東部山區(qū),河流水系較為復(fù)雜,尤其是小型河流分布較多[1]。為補(bǔ)齊鞍山地區(qū)河流數(shù)字化數(shù)據(jù)底板,開展對(duì)流域面積在現(xiàn)10~50km2小型河流數(shù)字化提取工作,由于這部分河流數(shù)目較大,逐條河流提取需要消耗大量的人力、物力。為提高河流數(shù)字化提取的效率,國內(nèi)開展過相關(guān)研究,并取得一定研究成果[2-7],這其中河流數(shù)字化并行提取算法,可顯著提高河流數(shù)字化提取的精度。近些年來,具有密度聚類算法的河流數(shù)字化并行提取方法得到一定程度的應(yīng)用,通過實(shí)例應(yīng)用研究[8-14],相比于傳統(tǒng)串行算法,其河流提取精度得到明顯提升,但在小型河流數(shù)字化并行提取中還未得到相關(guān)應(yīng)用,為提高鞍山地區(qū)小型河流數(shù)字化并行提取的效率,從工作實(shí)際出發(fā),引入密度聚類算法,結(jié)合地理信息軟件,對(duì)鞍山地區(qū)10~50km2小型河流進(jìn)行并行數(shù)字化提取研究,研究成果對(duì)于區(qū)域中小型河流數(shù)字化并行提取具有重要參考價(jià)值。
國內(nèi)對(duì)于河流數(shù)字化提取的方法已有較為成熟的成果,本文重點(diǎn)對(duì)小型河流并行提取的密度聚類算法進(jìn)行介紹,該算法通過對(duì)并行提取河流之間的空間距離進(jìn)行分析后建立其密度函數(shù),對(duì)密度函數(shù)進(jìn)行不同維度樣本集合的勢(shì)度函數(shù)pi(0)進(jìn)行計(jì)算:
(1)
式中,n—河流提取空間維度;a—提取區(qū)域的搜索半徑,m。
a的計(jì)算方程為:
(2)
其中搜索半徑的運(yùn)算基礎(chǔ)為勢(shì)度函數(shù)計(jì)算值,該搜索半徑在較大數(shù)據(jù)樣本情況下收斂度相對(duì)較低,為此采用密度函數(shù)對(duì)其并行聚類進(jìn)行計(jì)算:
(3)
式中,D—搜索半徑范圍內(nèi)的聚類值;fd—密度聚類系數(shù)。
對(duì)搜索半徑范圍內(nèi)的聚類值進(jìn)行初始密度計(jì)算:
(4)
在計(jì)算完成河流并行提取樣本數(shù)據(jù)系列的初始密度后采用歐幾距離矩陣方程對(duì)其空間聚類密度進(jìn)行計(jì)算:
(5)
在進(jìn)行空間聚類密度計(jì)算后對(duì)其河流并行提取的復(fù)雜度進(jìn)行計(jì)算:
(6)
結(jié)合計(jì)算的河流數(shù)字化并行提取復(fù)雜度值對(duì)其進(jìn)行綜合聚類密度的修正計(jì)算:
(7)
式中,K—修正系數(shù)。
采用計(jì)算試驗(yàn)方法分別對(duì)不同計(jì)算閾值、聚類系數(shù)下河流并行提取時(shí)效性進(jìn)行對(duì)比分析,設(shè)置的河流并行提取的樣本總數(shù)為400,空間維度設(shè)置為20,2種算法下河流并行提取的時(shí)效性對(duì)比結(jié)果見表1。
表1 不同算法下小型河流并行提取計(jì)算時(shí)效對(duì)比
從不同算法下400條小型河流的計(jì)算時(shí)效對(duì)比結(jié)果可看出,在相同計(jì)算閾值和空間維度下,密度聚類算法下在聚類系數(shù)為19.8時(shí)其提取時(shí)長為16.2min,而傳統(tǒng)串行算法下在相同計(jì)算閾值和空間維度情況下,其聚類系數(shù)相比于密度聚類算法有所減小,400條小型河流提取的計(jì)算時(shí)長為41.3min,相比于密度聚類算法,傳統(tǒng)串行算法下提取時(shí)長增加25.1min,密度聚類算法下其計(jì)算時(shí)效平均可提高47.5%,這主要是因?yàn)閭鹘y(tǒng)串行算法對(duì)各小型河流進(jìn)行逐維度計(jì)算,其聚類系數(shù)要高于密度聚類算法,增加了其河流并行提取搜索半徑的范圍,從而使得其計(jì)算時(shí)效相比于密度聚類算法有明顯增加。
結(jié)合地理信息技術(shù)對(duì)鞍山地區(qū)10~50km2小型河流進(jìn)行數(shù)字化提取,為實(shí)現(xiàn)小型河流數(shù)字化并行提取,結(jié)合密度聚類算法對(duì)其數(shù)字化提取方式進(jìn)行并行計(jì)算,其首先基于流域數(shù)字高程數(shù)據(jù)采用D8算法進(jìn)行流向的計(jì)算,流向計(jì)算如圖1(b)所示,在對(duì)不同計(jì)算網(wǎng)格單元流向分析后采用密度聚類算法對(duì)其進(jìn)行匯流累積并行計(jì)算,如圖1(c)所示,在進(jìn)行匯流并行累計(jì)計(jì)算后對(duì)其滿足一定閾值范圍內(nèi)的河流進(jìn)行數(shù)值化并行提取,提取過程如圖1(d)所示。
圖1 基于密度聚類算法的河流數(shù)字化并行提取過程圖
結(jié)合鞍山地區(qū)流域面積在10~50km2的10條小型河流實(shí)地調(diào)查數(shù)據(jù),對(duì)比分析密度聚類算法下小型河流提取的精度,精度分析結(jié)果見表2。
表2 小型河流數(shù)字化并行提取精度分析
并對(duì)其數(shù)字化提取河長和比降與實(shí)際調(diào)查值的吻合度進(jìn)行分析,分析結(jié)果如圖2所示。
圖2 數(shù)字化提取的河長和比降與實(shí)際調(diào)查值吻合度分析
從小型河流數(shù)字化并行提取精度分析結(jié)果可看出,對(duì)于鞍山地區(qū)流域面積在10~50km2的10條小型河流數(shù)字化提取的河長、比降和實(shí)際調(diào)查值之間的相對(duì)誤差均在20%以內(nèi),其中林家河相對(duì)誤差最高,這主要是因?yàn)樵摵拥缽澢容^大,對(duì)其河流數(shù)字化提取精度產(chǎn)生一定程度影響,可見對(duì)于小型河流而言,其河流彎曲度對(duì)其數(shù)字化提取精度影響較高。從絕對(duì)誤差分析可看出,對(duì)于小型河流河長數(shù)字化提取值和實(shí)際調(diào)查值之間的絕對(duì)誤差在3km以內(nèi),河段比降絕對(duì)誤差在3%以內(nèi),對(duì)于小型河流而言,其河流數(shù)字化并行提取精度基本滿足要求。從數(shù)字化提取的河長和比降與實(shí)際調(diào)查值吻合度分析結(jié)果可看出,其相關(guān)系數(shù)總體在0.5以上,河長相關(guān)度要高于比降相關(guān)度,對(duì)于河長而言,其數(shù)字化提取的精度受河流彎曲度影響相對(duì)較小,而河段比降其受河流彎曲度影響較大,因此其吻合度要低于河長數(shù)字化提取值和實(shí)際調(diào)查值之間的吻合度。
(1)采用密度聚類算法對(duì)小型河流進(jìn)行數(shù)字化并行提取時(shí),為提高其提取效率,其應(yīng)建立聚類密度指數(shù)和空間維度的關(guān)聯(lián)方程,來對(duì)其聚類密度指數(shù)進(jìn)行優(yōu)化,從而降低其搜索半徑范圍,一般聚類密度指數(shù)要控制在10~15之間為宜。
(2)小型河流彎曲度對(duì)于密度聚類算法下河流數(shù)字化提取精度影響較大,對(duì)于小型河流而言,其彎曲度在2.0以上,需要結(jié)合河流調(diào)查值,對(duì)其比降提取值進(jìn)行適當(dāng)修正。
(3)密度聚類算法適合于山丘型小型河流數(shù)字化并行提取,其對(duì)于平原地區(qū)河流提取的適用性還需進(jìn)一步探討。