范屹帆,郭根威,吳 寅
(南京林業(yè)大學(xué) 信息科學(xué)技術(shù)學(xué)院,江蘇 南京210037)
混交林是相對于純林而言的一種林分,同屬于人工林。在森林經(jīng)營上,如果林分內(nèi)80%以上的樹種為同一樹種,則該林被認為是純林,如果該林分由多個樹種組成,并且這些樹種都未達到總數(shù)的80%,則視其為混交林。因此相對于純林而言,混交林的優(yōu)勢在于物種更加豐富,對各類型資源如養(yǎng)分、水分、光照等的分配利用更高效[1]。對混交林的實時監(jiān)測是林業(yè)物聯(lián)網(wǎng)的關(guān)鍵。
LoRa信號傳輸距離遠,網(wǎng)絡(luò)易于建設(shè)和部署,低功耗,低成本,在農(nóng)業(yè)和林業(yè)領(lǐng)域有著廣泛的應(yīng)用。中國無線電委員會,分配470 MHz為LoRa在中國的使用頻段,考慮到使用的合法性,實驗選用470 MHz的LoRa信號。其他頻段的LoRa信號基本調(diào)制原理和470 MHz的類似,其特性也基本相同。研究人員對LoRa信號傳播特性曲線進行過深入的研究,文韜等人[2]研究了橘園中無線傳感網(wǎng)絡(luò)節(jié)點不同的部署方式,無線信號的衰減情況受植被深度、距離及天線高度等因素影響,但實驗環(huán)境是橘樹盆栽,植株高度較低,樹林的一些反射衍射影響較小。譚星等人[3]研究了433 MHz無線信號在桉樹人工林中的傳播特性,分析了樹齡、樹干和距離對信號傳播的影響,但是實驗環(huán)境是人工林,樹木規(guī)則有序,實驗環(huán)境較為單一和理想化,不能很好地適用于野外復(fù)雜多變的環(huán)境。
本文考慮了林業(yè)特征參數(shù)葉面積指數(shù)(Leaf Area Index,LAI)[4]、降雨率(Rain Rate)[5]和傳播距離(Distance)對信號傳播強度的影響。葉面積指數(shù)通常的定義為葉面積占土地面積的比值,描述了樹林樹葉的茂密程度,其大小直接反映了信號傳播途中天然障礙的多少。雨衰是指電波進入雨層中引起的衰減,它包括雨粒吸收引起的衰減和雨粒散射引起的衰減,雨衰的直接表征就是降雨率,降雨率越大,信號衰減越大。距離參數(shù)直接反映節(jié)點和網(wǎng)關(guān)之間的遠近,通常情況下距離越遠,信號衰減越大。實驗環(huán)境選擇不規(guī)則排列的混交林,環(huán)境復(fù)雜,模型穩(wěn)定性強。
實驗設(shè)備包括一個LoRa的網(wǎng)關(guān),多個LoRa節(jié)點和多個LAI采集傳感器。其中LoRa網(wǎng)關(guān)和節(jié)點的設(shè)置參數(shù)如表1所示。
表1 測量設(shè)置參數(shù)
1.1.1 LoRa網(wǎng)關(guān)
實驗采用RAK7249網(wǎng)關(guān),如圖1所示,它是一款基于低功耗廣域網(wǎng)LoRaWAN協(xié)議的室外網(wǎng)關(guān),采用防水外殼,支持以太網(wǎng)供電(Power over Ethernet,PoE),可連接標準的LoRaWAN終端并進行雙向通信。網(wǎng)關(guān)通過標準的以太網(wǎng)將網(wǎng)關(guān)設(shè)備連接到網(wǎng)絡(luò)服務(wù)器 (Network Server,NS),支持網(wǎng)絡(luò)和防火墻功能。同時,RAK7249支持4G/LTE、GPS、WiFi等多種通信協(xié)議,實現(xiàn)數(shù)據(jù)上傳。RAK7249內(nèi)置OpenWRT操作系統(tǒng),用戶通過Web管理頁面,頁面可以靈活地配置網(wǎng)絡(luò)參數(shù)和LoRaWAN協(xié)議參數(shù)。RAK7249可連接標準內(nèi)置NS,無需用戶在云端和本地部署NS,特別適合于行業(yè)應(yīng)用中小型化的場景,節(jié)省數(shù)千元的服務(wù)器成本和研發(fā)投入,并且具有執(zhí)行效率高、延時更短的優(yōu)點。RAK7249集成RAK2247的LoRa集中器網(wǎng)卡,最多可擴展支持兩張LoRa集中器網(wǎng)卡,實現(xiàn)16個上行接入通道和兩個下行發(fā)送通道,保證了傳輸?shù)姆€(wěn)定性。
圖1 網(wǎng)關(guān)Fig.1 Gateway
1.1.2 LoRa節(jié)點
實驗的數(shù)據(jù)采集節(jié)點運用RAK811,如圖2所示,它是一款低功耗遠距離LoRa技術(shù)收發(fā)模塊,具有易用、小巧、傳輸距離遠以及功耗低等特點,是一種非常好的遠距離無線數(shù)據(jù)傳輸解決方案。RAK811模塊支持最新的LoRaWAN的A類和C類技術(shù)協(xié)議規(guī)范,可以非常方便地接入廣域網(wǎng)物聯(lián)網(wǎng)平臺。RAK811模塊集成了Semtech的SX1276和STM32L芯片,并提供了UART接口讓用戶可以發(fā)送AT串口指令。林業(yè)特色傳感器直接連接節(jié)點的串口,給節(jié)點發(fā)送數(shù)據(jù),而后經(jīng)節(jié)點轉(zhuǎn)發(fā)到服務(wù)器網(wǎng)關(guān)。
圖2 節(jié)點Fig.2 Node
1.1.3 LAI測量傳感器——PAR光量子傳感器
傳感器設(shè)備使用了PAR傳感器,如圖3所示,用于檢測自然光的光合有效輻射,這是植物進行光合作用的太陽輻射,設(shè)備使用簡單,當(dāng)有光照時,產(chǎn)生一個與入射輻射強度成正比的電壓信號。由于其值的數(shù)量級很小,通過轉(zhuǎn)接放大器,再利用單片機采集得到放大幾百倍的電壓值,兩個PAR傳感器組成了一個LAI測量設(shè)備。
圖3 PAR傳感器Fig.3 PAR sensor
1.1.4 網(wǎng)關(guān)內(nèi)置服務(wù)器
RAK網(wǎng)關(guān)標準固件集成了消息隊列遙測傳輸 (Message Queuing Telemetry Transport,MQTT) Bridge功能,讓用戶自行選擇使用用戶數(shù)據(jù)報協(xié)議(User Datagram Protocol,UDP)或MQTT協(xié)議轉(zhuǎn)發(fā)數(shù)據(jù)到指定的NS服務(wù)器。上電后通過WiFi掃描連接對應(yīng)網(wǎng)關(guān)的服務(wù)集標識(Service Set Identifier,SSID),連上后在網(wǎng)頁界面登錄網(wǎng)關(guān)。
采用LoRaWAN星型組網(wǎng)方式,如圖4所示。
圖4 組網(wǎng)布局Fig.4 Network layout
在混交林水平方向上每隔5 m布置一個節(jié)點,即距離LoRaWAN網(wǎng)關(guān)5,10,15,…,85 m的位置;垂直方向上,每隔0.5 m布置一個節(jié)點,分別在確定好水平位置的前提下,距離地面0.5,1,1.5,2,2.5 m位置布置節(jié)點。如圖5所示,每個位置放置兩個節(jié)點,分別連接PAR傳感器,其中一個PAR傳感器放置在樹木底部脫離陰影區(qū)域,用來作為光合有效輻射的參照值;另一個PAR傳感器放置在樹木冠層下方,用來測量透過樹木冠層的有效輻射,其采集傳輸過程如圖6所示。
圖5 節(jié)點布局Fig.5 Node layout
圖6 硬件設(shè)備工作流程Fig.6 Hardware equipment workflow
網(wǎng)關(guān)布置在混交林的入口處,直立向上。上位機是一臺筆記本電腦,通過無線WiFi連接網(wǎng)關(guān)的內(nèi)置NS,如圖7所示,用于實時監(jiān)測數(shù)據(jù)采集。
圖7 網(wǎng)關(guān)架設(shè)圖Fig.7 Gateway erection diagram
在實際測量中,發(fā)射節(jié)點和接收網(wǎng)關(guān)的天線均保持垂直向上,在同一測量位置的同一高度,由于樹葉、樹枝和灌木叢分步的隨機性和實時微小變化性(如風(fēng)吹動影響葉子的正對面積等),傳輸信號的強度可能會發(fā)生很大的變化。因此同一個測量節(jié)點測量多組數(shù)據(jù),當(dāng)擁有足夠大的數(shù)據(jù)集后,其特征將無限逼近信號的真實特性,而后再采用均值來代替大數(shù)據(jù)集。同一個位置節(jié)點的接收信號強度指示(Received Signal Strength Indication,RSSI)的平均值,用作后續(xù)數(shù)據(jù)分析的參照值。
路徑損耗是電波在傳輸過程中由傳播距離、傳播環(huán)境產(chǎn)生的損耗,表示信號衰減的程度[6]。路徑損耗會縮短信號的傳播距離,降低信號的質(zhì)量,不同環(huán)境下路徑損耗指數(shù)的取值也有差異[7]。
對數(shù)-常態(tài)分布模型多用于無線電傳播模型建設(shè),其表達式為:
(1)
式中,PL(d0)為經(jīng)過單位距離后的路徑損耗,d0為單位距離,通常d0=1 m;PL(d)為經(jīng)過單位距離d后的路徑損耗;X0均值為0的高斯分布隨機量,n為一個和環(huán)境相關(guān)的路徑損耗指數(shù)[8]。
RSSI在常規(guī)正常使用情況下,可以將單位距離d0取1,使用簡化的模型公式為:
RSSI=-(10nlgd+A),
(2)
式中,d為待測節(jié)點和參考節(jié)點之間的距離(單位:m);n為路徑損耗指數(shù),取值范圍一般為2~4;A為待測節(jié)點和參考節(jié)點之間的距離d為1 m時,測得的信號基準功率[9]??紤]到路徑損耗和RSSI之間的關(guān)系,本文利用RSSI這一更加直觀且便于采集的特征量來分析470 MHz無線信號的傳播特性。
實驗采集到的LoRa節(jié)點傳遞到網(wǎng)關(guān)的RSSI,每個節(jié)點多次測量,測量后進行相應(yīng)的數(shù)據(jù)清洗,將異常值去除,而后取平均值,其處理流程如圖8所示。
圖8 數(shù)據(jù)處理流程Fig.8 Data processing flow
根據(jù)處理后的數(shù)據(jù),進行相應(yīng)的繪圖,測量結(jié)果顯示,LoRa信號的RSSI數(shù)據(jù)分布,隨距離的增加呈指數(shù)衰減,符合信號衰減的普遍規(guī)律,數(shù)據(jù)具有說服力,如圖9所示。
(a) 秋冬季節(jié)
許多基于太陽輻射與植物冠層定量相互作用的間接非接觸LAI估算模型都利用了植物在VIS光譜中的透光率特性。所使用的monte-saeki模型是一種簡化的基于輻射的模型,它反演了用于評估LAI的著名的表示均勻混濁介質(zhì)中輻射衰減的Beer-Lambert定律[10]:
(3)
式中,A為冠層上方觀測到的無遮擋天空亮度,B為冠層下觀測到的天空亮度,P為特定品種、特定場地項,即所謂的消光系數(shù)。它是由植物葉片特定光吸收特性的數(shù)量給出,并受如冠層結(jié)構(gòu)及其他因素影響,此外,太陽高度對該系數(shù)影響顯著??紤]混交林相關(guān)參數(shù)后,取值為1.24,將PAR傳感器采集到的數(shù)據(jù)代入公式計算得出相應(yīng)的LAI。利用式(3),即可對不同采集點收集到的冠層上下方的光強電壓值進行計算,從而得到不同采集點處的LAI值。具體的LAI計算值如表2所示。
表2 不同采集點的LAI計算值
將基于LoRa的LAI傳感器和專業(yè)HM-G20植物冠層圖像分析設(shè)備的LAI測量結(jié)果進行對比和驗證,結(jié)果表明,基于LoRa的LAI傳感器的測量結(jié)果較為精準,并且更為便捷,具體結(jié)果對比如表3和圖10所示。
表3 兩種不同測量方法的結(jié)果對比
圖10 不同測量方法的結(jié)果對比Fig.10 Comparison of results of different measurement methods
如圖10所示,基于LoRa的LAI傳感器和HM-G20植物冠層圖像分析儀兩種方法的LAI測量結(jié)果的擬合曲線是很接近的。同時,經(jīng)計算得到其對應(yīng)的均方誤差為0.137%,因此,基于LoRa的LAI傳感器測量結(jié)果較為精準,相對來說LAI的獲取方式也更為便捷。
電波進入雨層中會發(fā)生衰減,包括雨粒吸收引起的衰減和雨粒散射引起的衰減。導(dǎo)致雨衰的直接因素就是降雨率,從氣象臺獲取不同天數(shù)的降雨率數(shù)據(jù),并比較降雨率不同時直接導(dǎo)致的RSSI變化,如圖11所示。選取LAI=1.54,高度為1.5時,同一測量區(qū)域不同降雨率下,RSSI值的曲線走勢圖。結(jié)果發(fā)現(xiàn),降雨率的值與RSSI成反相關(guān)。
圖11 降雨率對RSSI的影響Fig.11 Impact of rainfall on RSSI
實驗過程中,實驗人員距離地面0.5,1,1.5,2,2.5 m位置布置節(jié)點,進行數(shù)據(jù)采集,從垂直方向上比較了RSSI值的分布情況,選取LAI=1.1,降雨率為0.3的點進行數(shù)據(jù)分析,如圖12所示。由圖可知,數(shù)據(jù)整體上隨著距離的增加呈指數(shù)衰減,數(shù)據(jù)符合LoRa的分布,對比看出節(jié)點高度為1.5 m的RSSI整體最大,接收信號強度最佳。為方便后續(xù)建模,后續(xù)數(shù)據(jù)處理直接選取高度為1.5 m的數(shù)據(jù)。
圖12 不同高度的RSSI值Fig.12 RSSI values of different heights
在人工神經(jīng)網(wǎng)絡(luò)應(yīng)用當(dāng)中,被采用最多的是前饋反向傳播網(wǎng)絡(luò),即BP神經(jīng)網(wǎng)絡(luò)[11],典型的BP神經(jīng)網(wǎng)絡(luò)是一個含有隱含層的3層結(jié)構(gòu)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)的算法流程如圖13所示。
圖13 神經(jīng)網(wǎng)絡(luò)算法流程Fig.13 Neural network algorithm flow
圖14 神經(jīng)網(wǎng)絡(luò)預(yù)測圖Fig.14 Neural network prediction graph
支持向量機(Support Vector Machine,SVM)[13],也稱為支持向量網(wǎng)絡(luò),是機器學(xué)習(xí)中獲得關(guān)注最多的算法,它源于統(tǒng)計學(xué)習(xí)理論。從學(xué)術(shù)角度來看,SVM是最接近深度學(xué)習(xí)的機器學(xué)習(xí)算法。從實際應(yīng)用來看,SVM在各種實際問題中的表現(xiàn)都非常優(yōu)秀。它在手寫識別數(shù)字和人臉識別中應(yīng)用廣泛,在文本和超文本的分類中舉足輕重。人們還使用SVM來識別用于模型預(yù)測的各種特征,以找出各種基因表現(xiàn)結(jié)果的影響因素。
SVM回歸預(yù)測基于不敏感函數(shù)及核函數(shù)算法進行計算,針對非線性回歸,常通過非線性映射核函數(shù)(Φ)把數(shù)據(jù)映射到高維空間進行線性回歸處理[14],其中懲罰系數(shù)(C)和不敏感損失函數(shù)(ε)兩個參數(shù)最為重要,用于平衡誤差和調(diào)整模型復(fù)雜程度[15]。通過網(wǎng)格搜索(GridSearchCV)工具設(shè)置參數(shù)選項C值(5,8,10,12,15,18,20)和ε值(0.01,0.005,0.001,0.000 5,0.000 1)進行逐步參數(shù)組合計算,根據(jù)訓(xùn)練集和驗證集R2最為接近為原則,確定懲罰系數(shù)(C=10)和損失函數(shù)(ε=0.001)為模型外推的最優(yōu)參數(shù)進行預(yù)測。SVM模型的構(gòu)建和預(yù)測通過python中SVR模塊實現(xiàn),訓(xùn)練集占比80%,驗證集和測試集各占10%,對RSSI模型進行分類預(yù)測,結(jié)果如圖15 所示。
圖15 支持向量機預(yù)測圖Fig.15 Support vector machine prediction graph
隨機森林是算法模型中的一種,是一種比較新的機器學(xué)習(xí)技術(shù)。隨機森林是由Leo Breiman和Cutler Adele在2001年開發(fā)完成的一種數(shù)據(jù)挖掘方法,它是一種現(xiàn)代分類與回歸技術(shù),同時也是一種組合式的自學(xué)習(xí)技術(shù)[16]。隨機森林是非常具有代表性的Bagging集成算法,它的所有基評估器都是決策樹,分類樹組成的森林稱為隨機森林分類器,回歸樹所集成的森林稱為隨機森林回歸器。
對隨機森林進行優(yōu)化,需要對3個參數(shù)進行調(diào)參:max_features、n_estimators和min_sample_leaf。
(1) max_features
隨機森林允許單個決策樹使用特征的最大數(shù)量。增加max_features一般能提高模型的性能,因為在每個節(jié)點上,有更多的選擇可以考慮。然而,這未必完全是對的,因為它降低了單個樹的多樣性,而這正是隨機森林獨特的優(yōu)點。參數(shù)擇優(yōu)的范圍:1~11,步長為1。
(2) n_estimators
森林中子樹的數(shù)目,即基評估器的數(shù)量?;u估器的數(shù)量越大,模型的效果往往越好,選擇盡可能高的值使預(yù)測更好、更穩(wěn)定。參數(shù)擇優(yōu)的范圍是:1~101,步長為10。
(3) min_sample_leaf
最小樣本葉片大小。葉是決策樹的末端節(jié)點。較小的葉子使模型更容易捕捉訓(xùn)練數(shù)據(jù)中的噪聲,最小樣本葉片大小很重要,一般選擇50以上。參數(shù)擇優(yōu)的范圍:50~100,步長為1。
在可承受的內(nèi)存/時間內(nèi),參數(shù)調(diào)試采用十折用交叉驗證法,交叉驗證(Cross Validation,CV)法的原理是將原始數(shù)據(jù)分為兩組:訓(xùn)練集和驗證集,其次使用訓(xùn)練集的數(shù)據(jù)分類器,用驗證集的數(shù)據(jù)來驗證訓(xùn)練好的模型,從而獲得能夠評價分類器的性能指標-準確率(Accuracy)。因此,CV法能在一定意義上獲取最優(yōu)參數(shù)。常見的CV方法有Hold-Out Method 、K-CV和LOO-CV三種。尋得的最優(yōu)參數(shù)如表4所示。
表4 最優(yōu)參數(shù)表
選取合適的值,max_features=6;n_estimators=81;min_sample_leaf=73。訓(xùn)練集占比80%,驗證集和測試集各占10%,預(yù)測結(jié)果如圖16所示。
圖16 隨機森林預(yù)測圖Fig.16 Random forest prediction graph
對比3個預(yù)測模型,其中通過兩個特征值MSE和R2來顯示模型的優(yōu)良性,RMSE為均方根誤差,R2為決定系數(shù)。
(4)
(5)
表5 3種模型結(jié)果對比
圖17 實際接收信號強度值與各個模型預(yù)測值比較Fig.17 Actual received signal strength value is compared with the predicted value of each model
混交林占中國南方地帶的大部分林地,對混交林的實時監(jiān)測,信號傳輸是林業(yè)物聯(lián)網(wǎng)的關(guān)鍵點。本文的工作總結(jié)如下:
① 驗證了葉面積指數(shù)、降雨量和距離的參數(shù)變化對信號傳輸存在干擾,經(jīng)過數(shù)據(jù)分析與比較,發(fā)現(xiàn)同等條件下,降雨量越大,RSSI越小;葉面積指數(shù)越大,RSSI越??;距離越遠,RSSI越小。
② 本研究聯(lián)合LAI數(shù)值、林場降雨率和傳輸距離,使用機器學(xué)習(xí)方法分析了LoRa信道在樹林中的RSSI。通過對隨機森林、BP神經(jīng)網(wǎng)絡(luò)和支持向量機3種學(xué)習(xí)模型的對比,發(fā)現(xiàn)隨機森林的預(yù)測效果最為接近真實數(shù)據(jù),模型擬合精度達92.2%,均方根誤差為3.17,具有良好的穩(wěn)定性。
③ 利用所設(shè)計的基于優(yōu)化參數(shù)的隨機森林算法測試了學(xué)校南大山實驗林場中的LAI及其RSSI數(shù)值,預(yù)測驗證結(jié)果表明精度可達90.8%,均方根誤差為3.56,可正常滿足LoRa節(jié)點林間通信的功率控制需求。
本文的研究內(nèi)容也有一些不足的地方,基于當(dāng)前的研究情況,未來可以從以下三點進一步完善:
① 路徑損耗模型的輸入?yún)?shù)有待擴充。LoRa信號在林中傳播時,除了受到林間葉面積指數(shù)和降雨率的影響,也可能受到其他參數(shù)的影響。比如樹干的胸徑(DBH)、環(huán)境溫度和大氣相對濕度等,未來可以聯(lián)合多個相關(guān)因素進行分析建模。
② 實驗數(shù)據(jù)的獲取方式有待完善。在實地測量LoRa無線信號的RSSI值時,盡管采取每隔5 m獲取10個數(shù)值,并取其平均值作為測量點的RSSI值方法,但是教學(xué)主樓西側(cè)的觀賞林和南大山實驗林場環(huán)境有一定的坡度,不能保證LoRa節(jié)點收發(fā)信號時直線放置,同時RAK7249網(wǎng)關(guān)設(shè)備數(shù)據(jù)波動較大,即使在同一個測量點采取平均值法,也很難避免出現(xiàn)較大的測量誤差。因此在今后試驗中對設(shè)備進行更新?lián)Q代,或者使用其他能夠定點實時測量數(shù)據(jù)的設(shè)備,這樣既能方便獲取數(shù)據(jù),也能夠減少誤差。
③ 數(shù)據(jù)建模可以較為準確地推算出預(yù)測節(jié)點的RSSI值,后續(xù)還需通過得到的RSSI值,準確地定位出節(jié)點應(yīng)該擺放的具體位置,實現(xiàn)混交林中的節(jié)點定位。