[藍海盛 張文娟]
物聯(lián)網(wǎng)是通過智能感知、識別技術(shù)與普適計算、泛在網(wǎng)絡(luò)的融合應(yīng)用,在5G的萬物互聯(lián)時代, 物聯(lián)網(wǎng)要通過大規(guī)模的不同類型的傳感器去感知周邊物體和物理環(huán)境,為物聯(lián)網(wǎng)應(yīng)用層的數(shù)據(jù)分析提供依據(jù)。傳感器采集系統(tǒng)實時監(jiān)測、感知和采集各種環(huán)境或監(jiān)測對象信息,實現(xiàn)物理世界多種元素、信息空間以及人類社會之間的交流,不同規(guī)模,不同采集頻率對傳感器采集系統(tǒng)的要求不一樣,對大規(guī)模傳感器進行高頻次采集,要求傳感器采集系統(tǒng)具備大范圍高帶寬的實時傳輸、計算、存儲和處理能力,統(tǒng)一集中式的云計算模式無法滿足此要求,多接入邊緣計算(Muti-access Edge Computing, MEC)技術(shù)的出現(xiàn)才使其成為可能。
多接入邊緣計算MEC是一種在物理上靠近數(shù)據(jù)生成位置的處理數(shù)據(jù)的方法,是5G的關(guān)鍵技術(shù)之一[1]。邊緣計算通過使業(yè)務(wù)靠近網(wǎng)絡(luò)邊緣擴展了云計算能力,在5G網(wǎng)絡(luò)中,被認(rèn)為是能高效處理大量業(yè)務(wù)數(shù)據(jù),滿足用戶對業(yè)務(wù)需求的有效技術(shù)之一。
大規(guī)模傳感器高頻采集系統(tǒng)將傳感器技術(shù)、現(xiàn)代網(wǎng)絡(luò)及無線通信技術(shù)、分布式信息處理技術(shù)、大規(guī)模信息處理系統(tǒng)等多項先進技術(shù)集中應(yīng)用,基于邊緣計算,通過研究大規(guī)模高頻率采集傳感器數(shù)據(jù)情況下傳感器數(shù)據(jù)傳輸、存儲、處理和展示技術(shù),開發(fā)一套通用的大規(guī)模高頻采集數(shù)據(jù)分析處理軟件,長時間持續(xù)綜合分析多個高頻采集設(shè)備的數(shù)據(jù),并提供二次開發(fā)接口,為傳感器數(shù)據(jù)進一步挖掘處理提供基礎(chǔ),可為傳感器采集系統(tǒng)的發(fā)展和應(yīng)用推廣提供更廣闊的平臺。
常見傳感器(如溫濕度、水量等)采集系統(tǒng)規(guī)模通常較小,覆蓋區(qū)域集中在企業(yè)內(nèi)部,其采集時間通常不超過毫秒級,也即采集頻率為1 000 Hz以下;相對而言,大規(guī)模傳感器高頻采集系統(tǒng)其覆蓋區(qū)域廣(行政區(qū)一級以上區(qū)域),涉及數(shù)量多(大于1 000個以上),采集頻率高(大于1 000 Hz以上)。
從國內(nèi)外已有的相關(guān)研究來看,在國家、省、市相關(guān)物聯(lián)網(wǎng)的項目中,雖全方位地涵蓋了低速和中高速傳感器網(wǎng)絡(luò)的體系結(jié)構(gòu)、自主組網(wǎng)和通信協(xié)議、數(shù)據(jù)融合與管理、應(yīng)用示范和測試等研究內(nèi)容,但大都基于對傳感器數(shù)據(jù)進行低頻率采集,對高頻率采集的相關(guān)研究不多。
市場上的物聯(lián)網(wǎng)相關(guān)廠家尚在集中精力于傳輸協(xié)議的研究和設(shè)備的研制,以及監(jiān)控系統(tǒng)的開發(fā),也是基于低頻次采集的,對大規(guī)模的高頻次采集傳感器數(shù)據(jù)處理分析技術(shù)未見報道。
對高頻傳感器采集進行分析的產(chǎn)品硬件有測量儀器,軟件有NI公司的Labview,這些都是少量幾個通道的短時間直接分析,未有長時間的多設(shè)備的持續(xù)綜合數(shù)據(jù)分析。
在電力、管網(wǎng)、地震、環(huán)境等監(jiān)測應(yīng)用中,都有對大范圍高密集的傳感器進行長時間高頻次采集監(jiān)測的需求,有必要對此開展相關(guān)研究。
大規(guī)模傳感器高頻采集系統(tǒng)具有如下特點:
(1)采集數(shù)據(jù)量大:采樣精度和頻率高,單位時間內(nèi)采集的數(shù)據(jù)量大;
(2)數(shù)據(jù)傳輸帶寬:要傳輸?shù)膫鞲衅鲾?shù)據(jù)量大,必須要求網(wǎng)絡(luò)帶寬高;
(3)存儲線性增加:單個傳感器的采集數(shù)據(jù)隨時間線性增長;
(4)采集時間同步:存在不同的采集設(shè)備之間的時間同步問題;
(5)系統(tǒng)規(guī)模大:系統(tǒng)需要綜合分析多個傳感器的數(shù)據(jù)才能得到有意義的結(jié)果;
(6)計算處理要求高:由于需要對數(shù)據(jù)進行信號分析,濾波等處理,計算量非常大。
針對系統(tǒng)特點需求,首要研究大規(guī)模傳感器高頻采集系統(tǒng)體系結(jié)構(gòu)和相關(guān)實現(xiàn)技術(shù),研究大規(guī)模高頻率采集傳感器數(shù)據(jù)情況下傳感器數(shù)據(jù)傳輸、存儲、處理分析和展示技術(shù)。
其次要研制一款傳感器高頻采集設(shè)備作為系統(tǒng)的數(shù)據(jù)源,開發(fā)一個大規(guī)模高頻采集數(shù)據(jù)分析處理軟件以供傳感信息查看和管理,基于邊緣計算構(gòu)建一個大規(guī)模高頻采集數(shù)據(jù)服務(wù)平臺進行傳感數(shù)據(jù)的上傳、存儲、計算和分析。
下面從網(wǎng)絡(luò)體系結(jié)構(gòu)、中心平臺架構(gòu)、高頻采集設(shè)備硬件組成和軟件框架、相關(guān)關(guān)鍵技術(shù)和系統(tǒng)應(yīng)用場景幾個方面進行論述。
如圖1所示,大規(guī)模傳感器高頻采集系統(tǒng)是由高頻采集設(shè)備、分布式MEC在線計算服務(wù)器和集中式云端中心服務(wù)平臺組成。高頻采集設(shè)備實時高頻次收集傳感器監(jiān)測數(shù)據(jù),通過4G/5G移動網(wǎng)或固網(wǎng)傳送至分布式MEC在線計算服務(wù)器進行處理,分布式MEC在線計算服務(wù)器再把原始數(shù)據(jù)和計算結(jié)果傳輸?shù)郊惺皆贫酥行姆?wù)平臺,在服務(wù)平臺中數(shù)據(jù)上傳集群接收傳感器數(shù)據(jù)流,存儲到數(shù)據(jù)存儲倉庫。
圖1 系統(tǒng)體系結(jié)構(gòu)圖
系統(tǒng)采用分布式架構(gòu),充分利用MEC計算服務(wù)器的高性能運算能力,對異構(gòu)數(shù)據(jù)實施高效的存儲、管理、同化、分析與信息發(fā)現(xiàn),以實現(xiàn)高可信度的實時預(yù)警決策。其中,數(shù)據(jù)存儲和管理涉及異構(gòu)數(shù)據(jù)整合和數(shù)據(jù)倉庫設(shè)計;異構(gòu)數(shù)據(jù)同化、分析和信息發(fā)現(xiàn)則是評估與預(yù)警服務(wù)的關(guān)鍵。
如圖2所示,中心服務(wù)平臺由數(shù)據(jù)上傳集群、離線分析集群、分布式計算集群、數(shù)據(jù)存儲倉庫和應(yīng)用服務(wù)集群組成。
圖2 平臺架構(gòu)圖
多個高頻采集設(shè)備采集的數(shù)據(jù)通過網(wǎng)絡(luò)(以太網(wǎng)、移動通信網(wǎng)、無線網(wǎng)絡(luò)等)上傳到MEC在線計算服務(wù)器,MEC在線計算服務(wù)器形成的分布式計算集群實時對原始數(shù)據(jù)進行壓縮傳輸、整形清洗等預(yù)處理,產(chǎn)生相關(guān)頻諳等計算結(jié)果,原始數(shù)據(jù)和計算結(jié)果都傳送到數(shù)據(jù)上傳集群,由數(shù)據(jù)上傳集群進行分片接收處理,存儲到數(shù)據(jù)存儲倉庫,更新業(yè)務(wù)數(shù)據(jù)庫中的數(shù)據(jù)索引。
用戶、維護和管理人員訪問應(yīng)用服務(wù)集群,從業(yè)務(wù)數(shù)據(jù)庫獲取設(shè)備和數(shù)據(jù)索引信息,當(dāng)查看波形、頻譜等傳感信息時,由應(yīng)用服務(wù)集群請求分布式計算計算集群進行計算,計算結(jié)果由應(yīng)用服務(wù)集群返回給客戶端。
離線分析集群通過構(gòu)建數(shù)據(jù)分析模型,對采集的高頻次傳感器原始數(shù)據(jù)和計算結(jié)果進行多角度分析、深度挖掘?qū)W習(xí)和綜合分析處理,以得到有意義的結(jié)果,同時能生成分析報告,供管理者決策。當(dāng)大量傳感數(shù)據(jù)具備空間地理信息之后,并結(jié)合入GIS系統(tǒng)之后,使得結(jié)合空間地理信息的實現(xiàn)多角度多面向個性化的傳感信息分析模式成為可能。通過數(shù)據(jù)挖掘及模式匹配、多樣化輸出模式及圖形化控制終端系統(tǒng)設(shè)計,對傳感數(shù)據(jù)結(jié)合空間地理信息數(shù)據(jù)進行管理和計算,能直觀詮釋空間、時間及各感知信息之間的相互關(guān)系。
在數(shù)據(jù)上傳和客戶端訪問的前端,都通過負(fù)載均衡來實現(xiàn)對高并發(fā)訪問的分流控制。
如圖3所示,設(shè)備由多個模塊組成,高精度時鐘模塊經(jīng)校準(zhǔn)后,為設(shè)備提供高精度的時間同步功能;移動通信模塊支持與4G/5G移動網(wǎng)絡(luò)進行通信;傳感器網(wǎng)絡(luò)通信模塊具備協(xié)議棧處理功能,提供與低速/高速傳感器網(wǎng)絡(luò)及設(shè)備的通信,并通過總線(SPI)與主處理器相連;WiFi模塊提供到無線局域網(wǎng)的接入能力;信息顯示模塊為設(shè)備提供圖形化信息顯示;外部采控提供高頻采集設(shè)備連接多種傳感器的接口,并進行接口轉(zhuǎn)換和防護處理;GPS/北斗模塊提供設(shè)備位置信息;數(shù)據(jù)處理和控制模塊為高頻采集設(shè)備提供高性能的處理能力;電源模塊為設(shè)備所有其它模塊供電。
圖3 硬件組成圖
圖4 設(shè)備軟件框架圖
如圖4所示,軟件布署在數(shù)據(jù)處理和控制模塊中,數(shù)據(jù)服務(wù)完成高頻采集傳感器數(shù)據(jù)的匯聚與傳輸,實現(xiàn)傳感網(wǎng)數(shù)據(jù)到無線局域網(wǎng)、移動通信網(wǎng)絡(luò)、有線網(wǎng)絡(luò)的傳輸。采集控制實現(xiàn)外部采控接口中傳感器數(shù)據(jù)的高頻采集。協(xié)議管理實現(xiàn)對傳感器網(wǎng)絡(luò)的管理,實現(xiàn)RS-485 Modbus RTU、Modbus TCP應(yīng)用協(xié)議支持;參數(shù)配置功能實現(xiàn)管理中心對設(shè)備參數(shù)進行配置,通過RJ45或USB進行配置。
TCP/IP協(xié)議棧提供網(wǎng)絡(luò)通信支持。WiFi協(xié)議棧提供無線局域網(wǎng)通信。4G/5G通信RIL框架提供移動網(wǎng)絡(luò)通信框架。傳感器網(wǎng)絡(luò)通信接口實現(xiàn)與傳感器網(wǎng)絡(luò)的信息交互,實現(xiàn)傳感網(wǎng)數(shù)據(jù)的匯聚和控制指令的分發(fā)。
操作系統(tǒng)提供應(yīng)用軟件的平臺支持。
驅(qū)動提供對硬件的抽象接口。包括:SPI、LAN、UART、USB、4G模塊、GPIO、AD/DA、I2C、WiFi、LCD顯示、按鍵、傳感器驅(qū)動。
如圖5所示,數(shù)據(jù)分析處理軟件使用組態(tài)軟件架構(gòu),把處理、顯示、分析等模塊分離,易于修改顯示方式和增加分析處理功能。
圖5 分析處理軟件框架圖
分析處理軟件包括底部驅(qū)動程序,通訊協(xié)議等與設(shè)備配套使用的控制軟件,自動識別設(shè)備配置,遠(yuǎn)程設(shè)置設(shè)備的量程、濾波及采樣參數(shù),完成信號的實時采集分析處理。
控制界面提供設(shè)備識別、參數(shù)配置、實時采集、數(shù)據(jù)預(yù)處理、格式轉(zhuǎn)換及數(shù)據(jù)保存功能。分析界面提供時差域、幅值域、頻率域和相關(guān)分析功能。
決策界面部分,通過長時間統(tǒng)計分析,多設(shè)備綜合計算,對結(jié)果進行數(shù)據(jù)可視化顯示,生成決策報告,并提供在線操作幫助。
時間同步是對多傳感器綜合分析的前提,需要在統(tǒng)一的時間軸上,方可通過傳感器數(shù)據(jù)時間分析多傳感器之間的相關(guān)性??赏ㄟ^兩種途徑保證傳感器數(shù)據(jù)的同時性(誤差在較小范圍),一是采集設(shè)備統(tǒng)一使用GPS授時,結(jié)合自身的高精度時鐘持續(xù)采集;二是由分布式MEC在線計算服務(wù)器校正傳感器數(shù)據(jù)時間。
基于高頻次采集的大量實時數(shù)據(jù),以及傳感器的位置信息,可實時在GIS空間信息上顯示相關(guān)區(qū)域的傳感信息,通過提供一系列的分析和處理的手段,使用戶直觀的獲得相關(guān)可視化分析結(jié)果。
可視化要求能對被傳感器采集系統(tǒng)覆蓋區(qū)域進行空間數(shù)據(jù)查詢,同時獲得對應(yīng)的傳感采集數(shù)據(jù)信息。系統(tǒng)需提供可拖動時間軸,獲取相關(guān)區(qū)域的歷史傳感信息,或獲取指定區(qū)域的歷史環(huán)境的變化過程圖。
要實時在GIS中顯示某區(qū)域的傳感器數(shù)據(jù),其難點在于接收、解析及處理遠(yuǎn)程采集設(shè)備的地理位置信息及傳感信息,在大數(shù)據(jù)吞吐量下須具備高可靠性。歷史數(shù)據(jù)可視化回放的難點在于允許用戶可以通過拖拉滾動條或者指定時間范圍自動播放,還原指定區(qū)域環(huán)境信息歷史的走向。
可視化分析則要求系統(tǒng)能對用戶指定的服務(wù)端接收到的原始數(shù)據(jù)進行自定義的可視化分析處理,包括簡單的數(shù)學(xué)運算、復(fù)雜的聚類、模式匹配等數(shù)據(jù)處理。
傳感器采集的數(shù)據(jù)具有一定的冗余,通過數(shù)據(jù)融合技術(shù)可提高數(shù)據(jù)收集的效率和準(zhǔn)確性。傳統(tǒng)的數(shù)據(jù)融合技術(shù)優(yōu)先考慮節(jié)省能量,為融合盡量多的合并數(shù)據(jù)包,降低數(shù)據(jù)傳輸量,通常會犧牲數(shù)據(jù)包的傳輸延時。
由于高頻采集的傳感器數(shù)據(jù)量大、實時性要求高,需研究在滿足時間性和信息完整性的要求下,對大量的信息進行編碼融合,以減少傳輸帶寬并壓縮存儲。數(shù)據(jù)融合機制需根據(jù)信息與業(yè)務(wù)的實時性要求選擇不同的數(shù)據(jù)融合度,且能根據(jù)網(wǎng)絡(luò)各層協(xié)議的信息,調(diào)整數(shù)據(jù)融合的融合度、緩存大小、融合等待時間等參數(shù),在節(jié)省能量和傳輸速度方面達成平衡。
高頻傳感器采集的數(shù)據(jù)量大,數(shù)據(jù)流有連續(xù)和間斷的,數(shù)據(jù)量隨時間的增加而線性增長,在分布式MEC在線計算服務(wù)器及數(shù)據(jù)存儲倉庫中,必須設(shè)計特定的存儲結(jié)構(gòu)存儲,方便插入和查詢。通過把間斷分散的高頻傳感器數(shù)據(jù)片按時間順序整理成連續(xù)的數(shù)據(jù)流,方便進一步的查看和處理。
高頻采集設(shè)備上傳的傳感器數(shù)據(jù)經(jīng)過整形等預(yù)處理過程寫入數(shù)據(jù)存儲倉庫的同時,必須實時計算出波形、頻譜等圖形推送給客戶端查看。由于傳感器數(shù)量多,分布式MEC在線計算集群必須在短時間內(nèi)計算出大量的傳感器圖形,就需要研究并發(fā)度高,計算速度快的系統(tǒng)架構(gòu)及算法。
數(shù)據(jù)挖掘在時間節(jié)點上包括以下層面:對已有數(shù)據(jù)庫,通過專家知識建立數(shù)據(jù)挖掘的算法基礎(chǔ)和相應(yīng)的挖掘引擎,挖掘出相應(yīng)的數(shù)據(jù)模式;在采集信號異常時,通過待分析數(shù)據(jù)和經(jīng)驗數(shù)據(jù)模式的數(shù)據(jù)比對,進行實時預(yù)測和警報,并更新警報于數(shù)據(jù)庫。
系統(tǒng)可應(yīng)用在需要對大量傳感器進行長時間持續(xù)綜合分析的場合,根據(jù)不同的應(yīng)用領(lǐng)域,進行定制開發(fā)形成特定的監(jiān)測系統(tǒng)。
橋梁應(yīng)變在線監(jiān)測需要在一座橋梁部署幾十個應(yīng)變傳感器,監(jiān)測橋梁形變情況,提前預(yù)警斷裂。當(dāng)選用應(yīng)變信號傳感器作為高頻采集傳感器,則可把系統(tǒng)用于橋梁應(yīng)變在線監(jiān)測。
管道(水、天然氣、石油等)在線監(jiān)測需要監(jiān)測管道中的壓力、流量、流速等,綜合多采集點信號實時計算反應(yīng)其泄漏情況。當(dāng)選用流量、壓力信號傳感器作為高頻采集傳感器,則可把系統(tǒng)用于管道在線監(jiān)測。
電力在線監(jiān)測需要監(jiān)測電力線路的電壓電流變化,計算電力網(wǎng)絡(luò)的功率、相位信息,用于漏電檢測和電能分配調(diào)度等。當(dāng)選用電流、電壓信號傳感器作為高頻采集傳感器,則可把系統(tǒng)用于電力在線監(jiān)測。
文中分析大規(guī)模傳感器高頻采集系統(tǒng)特點,提出基于邊緣計算的大規(guī)模傳感器高頻采集系統(tǒng),對其關(guān)鍵技術(shù)和分析軟件架構(gòu)進行研究,為大規(guī)模傳感器高頻采集系統(tǒng)應(yīng)用提供基礎(chǔ),推動5G垂直行業(yè)應(yīng)用發(fā)展。