張慶來 張軍 蘇云
摘? 要:隨著物聯網技術的發(fā)展,城市社區(qū)中各類數據量劇增,內容也越來越豐富。文章以華林山社區(qū)為例,調研了社區(qū)物聯網數據分布現狀,分析了基于物聯網數據的社區(qū)管理決策目標,之后提出語義數據融合框架,最后根據框架提出了華林山社區(qū)的數據融合方案。該研究成果,對于推進社區(qū)的信息化建設,提高管理人員的決策水平具有參考作用。
關鍵詞:社區(qū)管理;數據融合;語義網;SSN;SOSA
中圖分類號:G202;C916? ? ? ? ? ? 文獻標識碼:A文章編號:2096-4706(2021)23-0173-04
Research on Community Semantic Data Fusion Based on Internet of Things Technology
ZHANG Qinglai, ZHANG Jun, SU Yun
(School of Management, Lanzhou University, Lanzhou? 730013, China)
Abstract: With the development of Internet of Things technology, the amount of all kinds of data in urban communities has increased dramatically, and the content is becoming richer and richer. Taking Hualinshan community as an example, this paper investigates the current situation of community Internet of Things data distribution, analyzes the Community Management decision-making objectives based on Internet of Things data, then puts forward the semantic data fusion framework, and finally puts forward the data fusion scheme of Hualinshan community according to the framework. The research results of this paper can be used as a reference to promote the information construction of the community and improve the decision-making level of managers.
Keywords: Community Management; data fusion; Semantic Web; SSN; SOSA
0? 引? 言
隨著社區(qū)中物聯網數據越來越多,社區(qū)管理人員面對大量的數據卻很難做出有效決策。數據融合技術可以根據管理人員設定的決策目標,快速對數據進行加工處理,濃縮數據以支持決策。數據融合技術在數據的搜集、加工、判斷方面具有獨特的優(yōu)勢,而語義網技術則在自動推理、機器互動方面具有一定的專長。本文試圖將數據融合技術與語義網技術結合起來,提出語義數據融合方案,用于支持社區(qū)管理工作中的有效決策。
數據融合(Data Fusion,Data Aggregation),又稱數據聚集,是指對來自多個傳感器的數據進行多級別、多方面、多層次的處理,從而產生新的有意義的信息,而這種新信息是任何單一傳感器所無法獲得的[1]。常見的聚集操作有以下幾種,MAX(求最大值)、MIN(求最小值)、SUM(求和)、COUNT(計數)、AVERAGE(求平均值)、MEDIAN(求中位數)等[2]。多傳感器數據融合算法主要有加權平均法、神經網絡法、Kalman濾波法、貝葉斯估計法、D-S證據理論等[3]。
2017年10月,W3C提出了SSN(Semantic Sensor Network Ontology)本體推薦標準,用于描述傳感器、制動器與采樣器的工作過程。SSN包括一個輕量級的核心本體叫SOSA(Sensor,Observation,Sample and Actuator),用于描述它的基本類與屬性。SSN和SOSA可以描述包括物聯網在內的多種應用場景,這為基于物聯網技術的語義數據融合提供了基礎。
1? 社區(qū)物聯網數據分布與決策目標
1.1? 社區(qū)物聯網數據分布現狀
本文選擇了蘭州市華林山社區(qū)作為樣本展開相關研究工作,該社區(qū)存在監(jiān)控視頻、門禁數據、計量傳感器數據、特殊傳感器、智能傳感器等類型的物聯網數據。該社區(qū)已經安裝了監(jiān)控系統(tǒng),可以實現實時圖像采集。社區(qū)中已經開始使用門禁系統(tǒng),可以對社區(qū)門禁與樓宇門禁實現在線監(jiān)控與數據統(tǒng)計。部分樓宇開始應用水電氣等物聯網傳感器來搜集數據,已有居民使用智能家電、在線監(jiān)控等工具。在華林山社區(qū)中可以通過傳感器采集的數據有:
1.1.1? 小區(qū)門禁數據
可以來自門禁攝像頭的圖像識別,可以來自車庫的紅外線識別,主要提供與車輛有關的信息。可以用來監(jiān)控車輛情況,包括時間、地理位置、車牌號、收費等數據,進而可以分析擁堵與停車場情況,也可以與駕駛員關聯起來,進行行為模式識別。如果小區(qū)采用RFID鑰匙出入,也可以對社區(qū)居民的相關數據進行搜集。
1.1.2? 樓宇門禁數據
樓宇門禁主要搜集關于居民出入的信息,主要來自使用RFID鑰匙的智能門鎖,可以搜集關于時間、樓宇號、房間號、計數(天計數)等方面的數據。樓宇門禁的數據可以用來分析個人行為模式等。
1.1.3? 居民活動數據
可以通過搜集小區(qū)基站關于手機的信息,主要是基站連接數量等非敏感數據。在經過授權的情況下,可以搜集GPS定位數據、移動軌跡等敏感數據。
1.1.4? 計量傳感器數據
數據源來自各類傳感器如水電燃氣、溫度等的計量設備。通過數據分析判斷特定事件,如水電氣異常事件、異常消費等,可以用于事件監(jiān)控與預警。
1.1.5? 視頻監(jiān)控數據
主要來自小區(qū)的各類監(jiān)控攝像頭,其中高清攝像頭可以進行圖像識別和事件識別。
1.1.6? 其他數據
包括專門傳感器如壓力傳感器、溫度傳感器、煙霧傳感器、各類氣體檢測傳感器等搜集的數據,還包括未來會廣泛應用的智能傳感器如個人醫(yī)療設備、智能家居設備數據等搜集的數據。
1.2? 基于物聯網數據的社區(qū)決策目標
決策目標的識別是一個動態(tài)過程,需要周期性的進行,不斷對決策目標集合進行修正。華林山社區(qū)中的決策目標集合包括以下幾個方面。
1.2.1? 事件預警類
事件預警類內容包括:
(1)突發(fā)人群聚集事件管理:社區(qū)的重大節(jié)日,或者傳統(tǒng)活動,可能會出現大量人員聚集。根據歷年數據,可以對參與人群的規(guī)模做出大致預測。如果通過數據分析手段發(fā)現異常時,應向值班人員發(fā)出預警。
(2)異常行為模式事件管理:通過物聯網數據(攝像頭、小區(qū)門禁)、移動網絡數據(地理位置與數量)的統(tǒng)計,可以發(fā)現異常行為模式,之后做出預警。
1.2.2? 日常監(jiān)測類
日常監(jiān)測類內容包括:
(1)常規(guī)監(jiān)測處理:對基于物聯網的數據進行建模,能夠識別特殊的車輛、人員等,甚至可以識別特殊的事件。
(2)閾值監(jiān)測處理:對社區(qū)內各類計量傳感器進行監(jiān)控,如果傳感器數值突破界限即進行預警,此類數值包括最大值、最小值、頻度、位置變動范圍等。閾值分析可以使用物聯網方式監(jiān)控設備或資源的運行情況,如水電氣、通信等。
2? 社區(qū)語義數據融合框架
2.1? 數據融合方式
由于華林山社區(qū)地理范圍較大,傳感器種類較多,傳感器數量也相對較多,因此采用分布式數據融合方式比較合適。源節(jié)點(又稱傳感器節(jié)點,采集節(jié)點)發(fā)送的數據經中間節(jié)點轉發(fā)時,中間節(jié)點(又稱數據融合節(jié)點,融合節(jié)點)查看數據包的內容,進行相應的數據融合后再傳送到匯聚節(jié)點,由匯聚節(jié)點實現數據的綜合[4]。匯聚節(jié)點與決策目標相關聯,必要的時候,匯聚節(jié)點可以給中間節(jié)點和源節(jié)點反饋調節(jié)信息。
2.2? 語義數據融合框架
傳統(tǒng)的數據融合方法中,從傳感器獲取數據,要經過數據(像素)級融合、特征級融合與決策級融合[5],在數據級進行數據粒度最小的數據融合,在特征級需要進行數學統(tǒng)計計算完成數據融合,而在決策級必須對數據進行建模分析后,才可以完成數據的融合,觸發(fā)決策目標。在決策級融合,數據復雜且與決策目標高度相關,語義表達能力與推理能力就顯得尤為重要。
2.2.1? 傳統(tǒng)數據融合與語義數據融合關系
傳統(tǒng)數據融合與語義數據融合各有優(yōu)勢,如果能有效結合起來,將能兼顧二者的優(yōu)點。傳統(tǒng)的數據融合適用于相同類型的傳感器數據加工處理,如果涉及不同類型的傳感器,就需要人工干預,事先決定數據融合的方式與過程。當不斷有新傳感器類型出現,并加入社區(qū)傳感器網絡的時候,人工干預的方式就會由于工作量大,容易出錯而變得效率較低。此時,如果能引入基于語義網的數據融合方式,由于數據的語義描述只需要進行一次,之后的數據融合過程可以由機器自動完成,并可以進行語義推理,效率將會大大提高。
傳統(tǒng)數據融合與語義數據融合相結合的過程中,需要決定在哪一級引入語義描述。雖然可以在特征級引入本體描述,也可以在決策級引入本體描述,但數據的語義只有在與決策目標相關聯時,語義分析與推理的價值才得以展現出來,在數據級與特征級主要涉及的是數據運算,語義價值并不能得以充分體現。因此,本文擬在數據融合的決策級引入語義描述的方案。
2.2.2? 語義數據融合
第一步,采取傳統(tǒng)數據融合方法完成數據級與特征級的數據融合。
第二步,采用語義數據融合方式完成決策級數據融合。在這一步中,需要選擇合適的本體來描述傳感器數據,如果找不到合適的本體就可能需要自行構建本體。如果社區(qū)中的傳感器數據需要不同的本體來描述,那么還需要完成不同本體之間的集成工作。最后基于本體描述,可以建立推理規(guī)則,并采用推理工具進行語義推理,之后將推理結果與決策目標關聯。
在這種融合模式中,傳統(tǒng)數據融合與語義數據融合存在著分工。傳統(tǒng)數據融合負責將來自多個傳感器的原始數據完成數據級與特征級的數據融合,之后再由語義數據融合負責完成跨越傳感器類型的數據融合,并與決策目標關聯。本文提出的數據融合框架如圖1所示。
3? 社區(qū)語義數據融合方案
3.1? 本體選擇與構建
社區(qū)中存在多種類型的傳感器,決策目標集合構成也相對復雜。因此,需要考慮社區(qū)內可供選擇的各類本體規(guī)范。與社區(qū)管理相關的本體有很多,如RDF、RDFS、OIL、DAML、OWL、SKOS等,這些語言都是遵循XML語言標準,具有良好的語法,支持推理,表達能力強并使用方便[6]。社區(qū)的管理涉及多方面的因素,而不同的領域需要不同的本體進行描述,可供選擇的本體主要有FOAF、SIOC、ORG、vCard、Event Ontology、SSN等。構建領域本體常用的描述語言是RDF與OWL,但RDF不能很好地支持精確語言關系描述,OWL又過于復雜,介于二者之間的SKOS既可以描述語義關系,又相對簡單靈活,適合輕量級的語義關系描述。
3.2? 本體集成
基于本體進行數據融合時,通常有三種方法:單本體方法、多本體方法與混合方法[7]。但這種本體集成的思想不適用于SSN,SSN可以通過模塊化的方式使用多個本體。在本體領域,本體模塊化是一個用來將本體劃分成更小單位的通用方法。SSN通過使用owl: import語句,通過集成或映射本體的方式,將現有的多個本體進行合成。
SSN的垂直模塊化是將一個本體構建于另一個本體之上,高層本體有方向的使用owl: import語句引入低層模塊,SOSA作為核心不引入任何本體。SSN的水平模塊化本體有可能互相依賴,所有給SSN提供領域詞匯的本體均被認為是水平模塊。
3.3? 數據描述
3.3.1? 傳感器數據SSN描述
SSN可以對數值型數據、日期時間型數據、位置數據等進行觀測,對數值型數據可以區(qū)分不同的計量單位。以下以溫度傳感器為例,說明SSN對傳感器數據的描述過程為:
@prefix rdf:? <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix time: <http://www.w3.org/2006/time#>.
@prefix sosa: <http://www.w3.org/ns/sosa/> .
@prefix ssn:? <http://www.w3.org/ns/ssn/> .
@prefix xsd:? <http://www.w3.org/2001/XMLSchema#> .
@prefix qudt-1-1: <http://qudt.org/1.1/schema/qudt#> .
@prefix qudt-unit-1-1: <http://qudt.org/1.1/vocab/unit#> .
@base <http://examplecomminty.org/data/> .
<Observation/202112301> rdf:type sosa:Observation ;
sosa:observedProperty? <Building/No.5/Appartment/1201/TemperatureDetection> ;
sosa:madeBySensor <sensor/hlsc123> ;
sosa:hasResult [
rdf:type qudt-1-1:QuantityValue ;
qudt-1-1:numericValue “20.5”^^xsd:double ;
qudt-1-1:unit qudt-unit-1-1: DegreeCelsius ] ;
<sensor/hlsc123> rdf:type sosa:Sensor ;
sosa:observes? < Building/No.5/Appartment/1201/TemperatureDetection > ;
sosa:madeObservation <Observation/202112301>, <Observation/202112302>, <Observation/202112303> .
上述文檔描述了一個傳感器,編號為hlsc123,它進行了三次觀測,編號分別為202112301、202112302、202112303,其中編號為202112301的觀測對象為Building/No.5/Appartment/1201,類型為溫度檢測,觀測的結果為double型的數值數據20.5,單位是攝氏度。
3.3.2? 基于數據融合的SSN描述
SSN基于單個傳感器進行語義描述,而傳統(tǒng)數據融合是基于多個傳感器的。為了解決這一矛盾,可以采取虛擬節(jié)點的方法。
首先,采用傳統(tǒng)數據融合方式得到多個傳感器節(jié)點的值,這些數據通常來自同一類傳感器。在數據融合過程中需要進行數據級與特征級融合,可能的操作類型有總和、平均值、加權平均、計數、最大值、最小值、挑選隨機數等。
其次,在采用SSN描述傳感器數據時,將傳感器命名為一個虛擬出來的數據融合節(jié)點,由傳統(tǒng)數據融合的中間結點提供數據級與特征級融合的結果數據,并用comment進行說明:
<Observation/ Virtual_node_hlsc987> rdf:type sosa:Observation ;
rdfs:comment “This is a virtual node composed of hlsc123, hlsc124, hlsc125. “@en ;
最后,描述虛擬節(jié)點其他特征。其他特征語義描述與單個傳感器節(jié)點描述方法相同,但其對應的數據已經是中間結點融合后的統(tǒng)計數據。
3.4? 語義推理
在進行基于語義數據融合的決策時,可以利用語義網內置的語義推理功能進行邏輯推理。當前,語義分析與推理多采用Jena開發(fā)包來實現。Jena是惠普公司開發(fā)的一種使用Java語言的語義Web開發(fā)工具,提供了多種類型的推理機,可以為社區(qū)中的各類決策目標如事件預警類、日常監(jiān)測類建立推理規(guī)則。
3.5? 決策目標關聯
基于語義融合的結果數據,既可以構建各類數據分析模型建立與決策目標的關聯,也可以根據事先設定的語義推理規(guī)則,完成社區(qū)管理決策任務。無論采用哪種方式,都可以實現基于物聯網數據的機器自動分析和預警,從而提升社區(qū)管理能力與水平。
4? 結? 論
本文基于數據融合方法與語義網理論,提出了社區(qū)中語義數據融合方案。數據融合方法存在著一些固有的問題,如封閉問題域、固定推理關系等,語義網技術可以有效地彌補這些缺陷。采用語義數據融合方式來進行社區(qū)的數據融合,同樣存在著一些問題,如多媒體數據類型的語義數據融合目前沒有完美解決方案。隨著物聯網、語義網等技術的發(fā)展,這些問題將會得以解決,從而讓社區(qū)管理變得更加自動化和智能化。
參考文獻:
[1] 何友等.多傳感器數據融合算法綜述 [J].火力與指揮控制,1996,21(1):12-21.
[2] 李建中,高宏.無線傳感器網絡的研究進展 [J].計算機研究與發(fā)展,2008(1):1-15.
[3] 周鵬.多傳感器數據融合技術研究與展望 [J].物聯網技術,2015,5(5):23-25.
[4] 唐慧,胡向東.無線傳感器網絡數據融合研究綜述 [J].信息安全與通信保密,2007(7):62-64+68.
[5] 趙繼軍,劉云飛,趙欣.無線傳感器網絡數據融合體系結構綜述 [J].傳感器與微系統(tǒng),2009,28(10):1-4.
[6] 錢斌.基于語義網的輿情監(jiān)控系統(tǒng)的設計與實現 [D].蘭州:蘭州大學,2016.
[7] 王薇.基于關聯數據的圖書館數字資源語義融合研究[D].南京:南京大學,2013
作者簡介:張慶來(1972—),男,漢族,河北保定人,副教授,博士,研究方向:信息管理與管理信息系統(tǒng)、企業(yè)信息化等。