高仕源,羅萬明,羅 澤,白曉航,于景華
1(中國科學院 計算機網絡信息中心,北京 100190)
2(中國科學院大學,北京 100049)
3(中國科學院 沈陽應用生態(tài)研究所,沈陽 110016)
森林是陸地生態(tài)系統(tǒng)的主體,是陸地上最大的生物群落,是人類社會賴以生存的物質基礎,是哺育人類的搖籃,是人類不可或缺的戰(zhàn)略資源.全球5個國家擁有超過50%的森林資源,中國位列其中.由于我國國土面積廣大、人口眾多,森林分布不均勻、人均占有量少,根據國家林業(yè)局在2014年2月發(fā)布的《中國森林資源簡況——第八次全國森林資源清查》結果顯示,我國人均森林面積占有量只有世界人均占有量的四分之一,并且面臨著林業(yè)生物災害頻發(fā)、森林資源采伐使用不盡合理的局面[1].
當前國內有一些研究森林生態(tài)保護與恢復工作的高校、科研機構,收集了一些森林資源數據并建立了一些學科模型,但相關研究工作普遍處于單機化運行,普遍存在科研人員重復構建計算模型、搭建計算環(huán)境的問題.為了減少此類重復性工作,提高數據和功能的共享與互操作,開放地理信息系統(tǒng)聯盟OGC(Open Geospatial Consortium)提出了可擴展的能無縫集成各種在線空間信息處理和位置服務的框架OWS(OGC Web Services)[2,3].作為OWS 規(guī)范中面向共享的服務標準,網絡處理服務(Web Processing Service)利用Web Services 技術跨平臺、跨語言的特性,能夠提供異構平臺的無縫銜接技術手段,通過封裝專業(yè)性強、具有學科特色的模型,并對外提供統(tǒng)一標準化服務接口,其他科研機構和個人可以調用相關網絡處理服務,獲得相應處理結果,實現一處構建開發(fā)、處處重復使用的目的[4-6].
在東北森林屏障帶生態(tài)保護與恢復的研究工作當中,采集了大量森林經緯度、坡度、坡向信息,喬木、灌木、草木的胸徑、高度、蓋度等數據,根據調查數據研究相應學科模型,通過分析模型計算結果,對東北森林屏障帶進行評估與規(guī)劃.本文根據OWS 規(guī)范中的網絡處理服務相關標準,采用Web Service 技術設計并實現一個面向森林生態(tài)學研究的Web處理服務系統(tǒng).客戶端通過向目標服務端提交符合網絡處理服務規(guī)范的請求,獲取該服務端所提供的網絡處理服務列表、網絡處理服務描述文檔,根據返回信息將待處理數據提交至服務端,利用相應模型進行處理,獲得模型處理結果.
如圖1所示,系統(tǒng)整體分為兩部分:客戶端程序和服務器端程序.客戶端作為服務請求端,通過網絡向服務器,即網絡處理服務提供者所暴露的三個接口:GetCapabilities、DescribeProcess、Execute,發(fā)送業(yè)務請求,服務器在業(yè)務邏輯層根據request 請求參數對請求進行分發(fā),調用相應邏輯模塊進行處理.
圖1 系統(tǒng)整體結構
圖2 網絡處理服務UML 序列圖
接口層負責實現客戶端調用并由服務器執(zhí)行的以下操作:GetCapabilities 操作允許客戶端請求有關服務器提供的功能和處理能力的信息,DescribeProcess 操作允許客戶端請求服務器提供的選定進程的詳細元數據信息、Execute 操作允許客戶端執(zhí)行由進程標識符、期望的數據輸入輸出格式組成的執(zhí)行過程,見圖2.
①GetCapabilities 操作
GetCapabilities 操作的請求用來獲取目標服務器功能的描述性文檔,請求參數包括強制和可選參數兩部分,如表1所示.
GetCapabilities 操作的響應返回描述該服務器功能的XML 文檔,同樣包括強制和可選參數兩部分,如表2所示.
表1 GetCapabilities 操作的請求參數
表2 GetCapabilities 操作的響應文檔參數
②DescribeProcess 操作
DescribeProcess 操作的請求用來獲取服務器上一個或多個處理服務的完整描述信息,該描述信息包括輸入輸出參數和格式.請求參數包括強制參數及可選參數,具體信息如表3.
DescribeProcess 操作的響應是一個Process-Descriptions data 結構的XML 文檔,按照請求中所包含標識符(Identifier)將一個或多個處理服務的描述封裝XML 文檔返回.主要的強制參數及可選參數如表4所示.
表3 DescribeProcess 操作的請求參數
表4 DescribeProcess 操作的響應文檔參數
③Executes 操作
Execute 操作允許客戶端使用輸入參數值去調用服務器中指定處理服務,從而得到返回結果.與前兩個操作不同,該操作強制實現HTTP POST 請求,可選實現HTTP GET 請求,一般不實現HTTP GET 請求.
Execute 操作的請求參數如表5所示.
表5 Execute 操作的請求參數
Execute 操作的響應文檔參數如表6所示.
表6 Execute 操作的響應參數
在服務器端,業(yè)務邏輯層負責處理客戶端對不同接口的調用請求.當接收到GetCapabilities 請求時,向模型庫請求所有模型的標識符和簡單描述,并將獲得的信息封裝為X M L 響應文檔返回;當接收到DescribeProcess 請求時,根據標識符的值向模型庫請求與該標識符對應的算法完全描述,并將相關信息封裝成ProcessDescriptions 響應文檔返回;當接收到Execute 請求時,將DataInputs 下Input 參數作為輸入,解析為系統(tǒng)定義的數據類型,根據標識符的值請求對應的模型,對輸入數據進行處理,并將處理結果封裝成響應文檔返回.
數據處理層負責對輸入數據進行類型匹配、轉化及校驗,并對輸出數據進行格式轉換.由于網絡處理服務需要接收和返回除整型、浮點型、字符型等基本數據類型外的矢量數據、柵格數據等生態(tài)環(huán)境領域數據類型,因此在將數據提交到模型庫執(zhí)行前有必要對其進行轉換.同理,當需要返回復雜數據類型的數據時,也需要對模型處理結果進行轉化.
經緯度、海拔、坡度等地形數據,對野外生態(tài)環(huán)境觀測與保護有著重要作用.
本系統(tǒng)構建的地形模型,通過輸入數字高程模型(Digital Elevation Model,DEM)和經緯度得到給定位置海拔等信息.
數字高程模型是一組包含地表相關情況的有序數列,是數字地形模型(Digital Terrain Model,DTM)的一個分支[7].其包含了平面坐標及高程值兩部分數據,主要有三種類型的數據:規(guī)則格網、不規(guī)則三角網結構、等高線型,現常用規(guī)則格網型數據.數字地形模型可以通過如下公式表示:
當m取值為1時,表示數字高程模型,即:
其中,Xi,Yi表示表面坐標,Zi是該點對應的高程值.實驗數據來自于“地理空間數據云”網站在線計算服務,“DEM 高程數據切割”模塊中90 m 分辨率SRTM數據.
群叢是植被分類的基本單位,相當于植物分類中“種”的分類等級,進行群叢分類是了解一個地區(qū)植被特征最基本、最重要方法之一[8-10].
在該模型中,需要了解樣地劃分以及樣地內所有胸徑大于1 cm的木本植物.通常在生態(tài)學中,用重要值(Important Value,IV)表示物種在樣地群落中的相對重要性[11],計算公式如下:
式中,P表示物種相對多度,SDBH表示物種相對胸高斷面積.根據樣方劃分與樣方內各物種重要值形成二維矩陣.
目前學界常用的是雙向指示種分析法(Two-Way INdicator SPecies ANalysis,TWINSPAN),是基于指示種分析法的改進算法[12],算法流程如下:
算法1. TWINSPAN 算法1)對數據進行相互平均排序(Reciprocal Averaging,RA).2)在形成的第一排序軸以軸心為中心將所有樣方劃分為正負兩組.3)選擇排序軸兩端的種作為指示種(indicator species),其指示意義的大小用指示值(indicator value)來衡量:D(i)=|n1(i)/N1-n2(i)/N2| (i=1,2,···,p)其中,D(i)為種i的指示值,N1 和N2 分別表示步驟2中正負組中的樣方數,n1(i)和n2(i)分別表示種i 在正負組中出現的樣方數.4)根據選擇的指示種計算樣方的指示分(indicator score),并按指示得分將樣方分組,選擇適當的閾值將樣方分為正負兩組.比較相互平均排序的結果,如果不完全一致,將排序軸中心向兩側擴展出的中性帶(indifferent zone)中錯分類的調整過來.5)重復上述過程,直到每個組內樣方數降到設定值,分類結束.
森林生物量是指在某一時刻在單位面積內存在的所有林木有機質總量.由于森林生物量是森林生態(tài)系統(tǒng)重要的狀態(tài)特征,是研究全球碳循環(huán)、森林系統(tǒng)碳儲量等生態(tài)問題研究的基礎,因此了解森林生物量有十分重要的意義[13].目前可以測定樹木生物量的方法有皆伐法、平均木標準木法、徑級標準木法和異速生長模型法等,其中直接測量獲得的生物量最為準確.但是由于該方法需要耗費大量人力物力,且對生態(tài)環(huán)境造成一定破壞,不能對整個調查區(qū)域內的林木進行全部砍伐,因此普遍采用生物量模型法進行森林生物量的估算.
在建立生物量模型的過程中,主要考慮與生物量計算有關且易獲取的林木特征統(tǒng)計量.根據既有的研究成果以及實際采集林木特征數據,采用以下生物量計算模型[14-16]:
其中,α、β、γ是模型參數,D是林木的胸徑,H是樹高.考慮到不同用戶對不同林木使用的α、β、γ系數不盡相同,因此在系統(tǒng)設計時允許用戶自行輸入相應數值.
本文所研究的物種多樣性主要是指森林生態(tài)系統(tǒng)中,植物物種多樣性問題,主要表征了該生態(tài)系統(tǒng)的復雜性、衡量其植物資源的豐富度,可以為生態(tài)系統(tǒng)穩(wěn)定性評估、未來發(fā)展的預測提供數據支持.
本文實現了以下指數進行物種多樣性評估[17-20]:
①物種豐富度指數
Margalef 指數:
②物種多樣性指數
Simpson 指數:
ShannonWiener 指數:
③物種均勻度指數
Pielou 指數:
其中,S是樣地內物種總數,N為所有物種的個體總數,Ni為物種i在樣地內的物種個體數.
本系統(tǒng)界面如圖3所示,根據前文所述主要有三部分功能:GetCapabilities 操作對應的獲取網絡處理服務信息功能、DescribeProcess 操作對應的獲取處理服務信息、Execute 接口對應的模型計算應用.數據來源于中國科學院沈陽應用生態(tài)研究所,遼寧省部分森林樣地調查數據.
圖3 系統(tǒng)界面
選擇獲取服務基本信息,系統(tǒng)會彈出當前系統(tǒng)基本信息及可提供所有處理服務的描述信息,如圖4所示.
圖4 服務描述信息
根據業(yè)務需要選擇查看某個或多個處理服務的具體信息,包括服務標識、數據的輸入輸出格式等信息,如圖5.
圖5 處理服務詳細信息
根據業(yè)務需要選擇所需模型,查看計算結果.在地形模型中,在下拉列表選擇某一地區(qū)數據,通過輸入一個數字高程數據集DEM 和給定位置的經緯度,獲取到該點的海拔以及整個DEM 數據集包含區(qū)域內的最高海拔、最低海拔、平均海拔等數據,結果如圖6所示.
圖6 地形模型計算結果
在群叢分類模型中,同樣選擇某一樣地數據集,通過向后臺發(fā)送樣方和物種的二元數據,后臺根據前文所述的TWINSPAN 算法的相關原理,經過計算后返回該樣地劃分的各個樣方所屬群叢種類結果,前端自動彈出相應計算結果.
在生物量模型中,選擇某一物種數據集,輸入α、β、γ的取值,客戶端會將返回結果組裝成echarts 進行展示,可以自行選取以折線圖、柱狀圖等形式進行顯示.如圖8所示.
圖7 群叢分類模型計算結果
圖8 生物量模型計算結果
在物種多樣性模型中,選擇需要查看的樣地編號,服務器將調取該樣地的所有林木的統(tǒng)計數據,計算得出各評估指數返回給客戶端進行展示.如圖9所示.
面向森林生態(tài)學研究的Web處理服務系統(tǒng)根據OGC 相關規(guī)范,以Web Service 技術為基礎,整合相關森林生態(tài)學模型,改變傳統(tǒng)單機獨立重復開發(fā)與部署模型計算環(huán)境的方式,將計算模型集中化、網絡化,通過提供網絡處理服務的方式,減少了研究人員重復開發(fā)生態(tài)學模型和搭建相應處理環(huán)境的時間及精力.
系統(tǒng)各層之間松耦合度,以及模型庫中各模型相互獨立,方便今后系統(tǒng)的改進和拓展.未來將進一步增加生態(tài)學研究模型,并研究拓展系統(tǒng)可處理的空間數據類型.
圖9 群叢分類模型計算結果