張慶來 張軍 蘇云
摘? 要:隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,城市社區(qū)中各類數(shù)據(jù)量劇增,內(nèi)容也越來越豐富。文章以華林山社區(qū)為例,調(diào)研了社區(qū)物聯(lián)網(wǎng)數(shù)據(jù)分布現(xiàn)狀,分析了基于物聯(lián)網(wǎng)數(shù)據(jù)的社區(qū)管理決策目標(biāo),之后提出語義數(shù)據(jù)融合框架,最后根據(jù)框架提出了華林山社區(qū)的數(shù)據(jù)融合方案。該研究成果,對(duì)于推進(jìn)社區(qū)的信息化建設(shè),提高管理人員的決策水平具有參考作用。
關(guān)鍵詞:社區(qū)管理;數(shù)據(jù)融合;語義網(wǎng);SSN;SOSA
中圖分類號(hào):G202;C916? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-4706(2021)23-0173-04
Research on Community Semantic Data Fusion Based on Internet of Things Technology
ZHANG Qinglai, ZHANG Jun, SU Yun
(School of Management, Lanzhou University, Lanzhou? 730013, China)
Abstract: With the development of Internet of Things technology, the amount of all kinds of data in urban communities has increased dramatically, and the content is becoming richer and richer. Taking Hualinshan community as an example, this paper investigates the current situation of community Internet of Things data distribution, analyzes the Community Management decision-making objectives based on Internet of Things data, then puts forward the semantic data fusion framework, and finally puts forward the data fusion scheme of Hualinshan community according to the framework. The research results of this paper can be used as a reference to promote the information construction of the community and improve the decision-making level of managers.
Keywords: Community Management; data fusion; Semantic Web; SSN; SOSA
0? 引? 言
隨著社區(qū)中物聯(lián)網(wǎng)數(shù)據(jù)越來越多,社區(qū)管理人員面對(duì)大量的數(shù)據(jù)卻很難做出有效決策。數(shù)據(jù)融合技術(shù)可以根據(jù)管理人員設(shè)定的決策目標(biāo),快速對(duì)數(shù)據(jù)進(jìn)行加工處理,濃縮數(shù)據(jù)以支持決策。數(shù)據(jù)融合技術(shù)在數(shù)據(jù)的搜集、加工、判斷方面具有獨(dú)特的優(yōu)勢,而語義網(wǎng)技術(shù)則在自動(dòng)推理、機(jī)器互動(dòng)方面具有一定的專長。本文試圖將數(shù)據(jù)融合技術(shù)與語義網(wǎng)技術(shù)結(jié)合起來,提出語義數(shù)據(jù)融合方案,用于支持社區(qū)管理工作中的有效決策。
數(shù)據(jù)融合(Data Fusion,Data Aggregation),又稱數(shù)據(jù)聚集,是指對(duì)來自多個(gè)傳感器的數(shù)據(jù)進(jìn)行多級(jí)別、多方面、多層次的處理,從而產(chǎn)生新的有意義的信息,而這種新信息是任何單一傳感器所無法獲得的[1]。常見的聚集操作有以下幾種,MAX(求最大值)、MIN(求最小值)、SUM(求和)、COUNT(計(jì)數(shù))、AVERAGE(求平均值)、MEDIAN(求中位數(shù))等[2]。多傳感器數(shù)據(jù)融合算法主要有加權(quán)平均法、神經(jīng)網(wǎng)絡(luò)法、Kalman濾波法、貝葉斯估計(jì)法、D-S證據(jù)理論等[3]。
2017年10月,W3C提出了SSN(Semantic Sensor Network Ontology)本體推薦標(biāo)準(zhǔn),用于描述傳感器、制動(dòng)器與采樣器的工作過程。SSN包括一個(gè)輕量級(jí)的核心本體叫SOSA(Sensor,Observation,Sample and Actuator),用于描述它的基本類與屬性。SSN和SOSA可以描述包括物聯(lián)網(wǎng)在內(nèi)的多種應(yīng)用場景,這為基于物聯(lián)網(wǎng)技術(shù)的語義數(shù)據(jù)融合提供了基礎(chǔ)。
1? 社區(qū)物聯(lián)網(wǎng)數(shù)據(jù)分布與決策目標(biāo)
1.1? 社區(qū)物聯(lián)網(wǎng)數(shù)據(jù)分布現(xiàn)狀
本文選擇了蘭州市華林山社區(qū)作為樣本展開相關(guān)研究工作,該社區(qū)存在監(jiān)控視頻、門禁數(shù)據(jù)、計(jì)量傳感器數(shù)據(jù)、特殊傳感器、智能傳感器等類型的物聯(lián)網(wǎng)數(shù)據(jù)。該社區(qū)已經(jīng)安裝了監(jiān)控系統(tǒng),可以實(shí)現(xiàn)實(shí)時(shí)圖像采集。社區(qū)中已經(jīng)開始使用門禁系統(tǒng),可以對(duì)社區(qū)門禁與樓宇門禁實(shí)現(xiàn)在線監(jiān)控與數(shù)據(jù)統(tǒng)計(jì)。部分樓宇開始應(yīng)用水電氣等物聯(lián)網(wǎng)傳感器來搜集數(shù)據(jù),已有居民使用智能家電、在線監(jiān)控等工具。在華林山社區(qū)中可以通過傳感器采集的數(shù)據(jù)有:
1.1.1? 小區(qū)門禁數(shù)據(jù)
可以來自門禁攝像頭的圖像識(shí)別,可以來自車庫的紅外線識(shí)別,主要提供與車輛有關(guān)的信息。可以用來監(jiān)控車輛情況,包括時(shí)間、地理位置、車牌號(hào)、收費(fèi)等數(shù)據(jù),進(jìn)而可以分析擁堵與停車場情況,也可以與駕駛員關(guān)聯(lián)起來,進(jìn)行行為模式識(shí)別。如果小區(qū)采用RFID鑰匙出入,也可以對(duì)社區(qū)居民的相關(guān)數(shù)據(jù)進(jìn)行搜集。
1.1.2? 樓宇門禁數(shù)據(jù)
樓宇門禁主要搜集關(guān)于居民出入的信息,主要來自使用RFID鑰匙的智能門鎖,可以搜集關(guān)于時(shí)間、樓宇號(hào)、房間號(hào)、計(jì)數(shù)(天計(jì)數(shù))等方面的數(shù)據(jù)。樓宇門禁的數(shù)據(jù)可以用來分析個(gè)人行為模式等。
1.1.3? 居民活動(dòng)數(shù)據(jù)
可以通過搜集小區(qū)基站關(guān)于手機(jī)的信息,主要是基站連接數(shù)量等非敏感數(shù)據(jù)。在經(jīng)過授權(quán)的情況下,可以搜集GPS定位數(shù)據(jù)、移動(dòng)軌跡等敏感數(shù)據(jù)。
1.1.4? 計(jì)量傳感器數(shù)據(jù)
數(shù)據(jù)源來自各類傳感器如水電燃?xì)?、溫度等的?jì)量設(shè)備。通過數(shù)據(jù)分析判斷特定事件,如水電氣異常事件、異常消費(fèi)等,可以用于事件監(jiān)控與預(yù)警。
1.1.5? 視頻監(jiān)控?cái)?shù)據(jù)
主要來自小區(qū)的各類監(jiān)控?cái)z像頭,其中高清攝像頭可以進(jìn)行圖像識(shí)別和事件識(shí)別。
1.1.6? 其他數(shù)據(jù)
包括專門傳感器如壓力傳感器、溫度傳感器、煙霧傳感器、各類氣體檢測傳感器等搜集的數(shù)據(jù),還包括未來會(huì)廣泛應(yīng)用的智能傳感器如個(gè)人醫(yī)療設(shè)備、智能家居設(shè)備數(shù)據(jù)等搜集的數(shù)據(jù)。
1.2? 基于物聯(lián)網(wǎng)數(shù)據(jù)的社區(qū)決策目標(biāo)
決策目標(biāo)的識(shí)別是一個(gè)動(dòng)態(tài)過程,需要周期性的進(jìn)行,不斷對(duì)決策目標(biāo)集合進(jìn)行修正。華林山社區(qū)中的決策目標(biāo)集合包括以下幾個(gè)方面。
1.2.1? 事件預(yù)警類
事件預(yù)警類內(nèi)容包括:
(1)突發(fā)人群聚集事件管理:社區(qū)的重大節(jié)日,或者傳統(tǒng)活動(dòng),可能會(huì)出現(xiàn)大量人員聚集。根據(jù)歷年數(shù)據(jù),可以對(duì)參與人群的規(guī)模做出大致預(yù)測。如果通過數(shù)據(jù)分析手段發(fā)現(xiàn)異常時(shí),應(yīng)向值班人員發(fā)出預(yù)警。
(2)異常行為模式事件管理:通過物聯(lián)網(wǎng)數(shù)據(jù)(攝像頭、小區(qū)門禁)、移動(dòng)網(wǎng)絡(luò)數(shù)據(jù)(地理位置與數(shù)量)的統(tǒng)計(jì),可以發(fā)現(xiàn)異常行為模式,之后做出預(yù)警。
1.2.2? 日常監(jiān)測類
日常監(jiān)測類內(nèi)容包括:
(1)常規(guī)監(jiān)測處理:對(duì)基于物聯(lián)網(wǎng)的數(shù)據(jù)進(jìn)行建模,能夠識(shí)別特殊的車輛、人員等,甚至可以識(shí)別特殊的事件。
(2)閾值監(jiān)測處理:對(duì)社區(qū)內(nèi)各類計(jì)量傳感器進(jìn)行監(jiān)控,如果傳感器數(shù)值突破界限即進(jìn)行預(yù)警,此類數(shù)值包括最大值、最小值、頻度、位置變動(dòng)范圍等。閾值分析可以使用物聯(lián)網(wǎng)方式監(jiān)控設(shè)備或資源的運(yùn)行情況,如水電氣、通信等。
2? 社區(qū)語義數(shù)據(jù)融合框架
2.1? 數(shù)據(jù)融合方式
由于華林山社區(qū)地理范圍較大,傳感器種類較多,傳感器數(shù)量也相對(duì)較多,因此采用分布式數(shù)據(jù)融合方式比較合適。源節(jié)點(diǎn)(又稱傳感器節(jié)點(diǎn),采集節(jié)點(diǎn))發(fā)送的數(shù)據(jù)經(jīng)中間節(jié)點(diǎn)轉(zhuǎn)發(fā)時(shí),中間節(jié)點(diǎn)(又稱數(shù)據(jù)融合節(jié)點(diǎn),融合節(jié)點(diǎn))查看數(shù)據(jù)包的內(nèi)容,進(jìn)行相應(yīng)的數(shù)據(jù)融合后再傳送到匯聚節(jié)點(diǎn),由匯聚節(jié)點(diǎn)實(shí)現(xiàn)數(shù)據(jù)的綜合[4]。匯聚節(jié)點(diǎn)與決策目標(biāo)相關(guān)聯(lián),必要的時(shí)候,匯聚節(jié)點(diǎn)可以給中間節(jié)點(diǎn)和源節(jié)點(diǎn)反饋調(diào)節(jié)信息。
2.2? 語義數(shù)據(jù)融合框架
傳統(tǒng)的數(shù)據(jù)融合方法中,從傳感器獲取數(shù)據(jù),要經(jīng)過數(shù)據(jù)(像素)級(jí)融合、特征級(jí)融合與決策級(jí)融合[5],在數(shù)據(jù)級(jí)進(jìn)行數(shù)據(jù)粒度最小的數(shù)據(jù)融合,在特征級(jí)需要進(jìn)行數(shù)學(xué)統(tǒng)計(jì)計(jì)算完成數(shù)據(jù)融合,而在決策級(jí)必須對(duì)數(shù)據(jù)進(jìn)行建模分析后,才可以完成數(shù)據(jù)的融合,觸發(fā)決策目標(biāo)。在決策級(jí)融合,數(shù)據(jù)復(fù)雜且與決策目標(biāo)高度相關(guān),語義表達(dá)能力與推理能力就顯得尤為重要。
2.2.1? 傳統(tǒng)數(shù)據(jù)融合與語義數(shù)據(jù)融合關(guān)系
傳統(tǒng)數(shù)據(jù)融合與語義數(shù)據(jù)融合各有優(yōu)勢,如果能有效結(jié)合起來,將能兼顧二者的優(yōu)點(diǎn)。傳統(tǒng)的數(shù)據(jù)融合適用于相同類型的傳感器數(shù)據(jù)加工處理,如果涉及不同類型的傳感器,就需要人工干預(yù),事先決定數(shù)據(jù)融合的方式與過程。當(dāng)不斷有新傳感器類型出現(xiàn),并加入社區(qū)傳感器網(wǎng)絡(luò)的時(shí)候,人工干預(yù)的方式就會(huì)由于工作量大,容易出錯(cuò)而變得效率較低。此時(shí),如果能引入基于語義網(wǎng)的數(shù)據(jù)融合方式,由于數(shù)據(jù)的語義描述只需要進(jìn)行一次,之后的數(shù)據(jù)融合過程可以由機(jī)器自動(dòng)完成,并可以進(jìn)行語義推理,效率將會(huì)大大提高。
傳統(tǒng)數(shù)據(jù)融合與語義數(shù)據(jù)融合相結(jié)合的過程中,需要決定在哪一級(jí)引入語義描述。雖然可以在特征級(jí)引入本體描述,也可以在決策級(jí)引入本體描述,但數(shù)據(jù)的語義只有在與決策目標(biāo)相關(guān)聯(lián)時(shí),語義分析與推理的價(jià)值才得以展現(xiàn)出來,在數(shù)據(jù)級(jí)與特征級(jí)主要涉及的是數(shù)據(jù)運(yùn)算,語義價(jià)值并不能得以充分體現(xiàn)。因此,本文擬在數(shù)據(jù)融合的決策級(jí)引入語義描述的方案。
2.2.2? 語義數(shù)據(jù)融合
第一步,采取傳統(tǒng)數(shù)據(jù)融合方法完成數(shù)據(jù)級(jí)與特征級(jí)的數(shù)據(jù)融合。
第二步,采用語義數(shù)據(jù)融合方式完成決策級(jí)數(shù)據(jù)融合。在這一步中,需要選擇合適的本體來描述傳感器數(shù)據(jù),如果找不到合適的本體就可能需要自行構(gòu)建本體。如果社區(qū)中的傳感器數(shù)據(jù)需要不同的本體來描述,那么還需要完成不同本體之間的集成工作。最后基于本體描述,可以建立推理規(guī)則,并采用推理工具進(jìn)行語義推理,之后將推理結(jié)果與決策目標(biāo)關(guān)聯(lián)。
在這種融合模式中,傳統(tǒng)數(shù)據(jù)融合與語義數(shù)據(jù)融合存在著分工。傳統(tǒng)數(shù)據(jù)融合負(fù)責(zé)將來自多個(gè)傳感器的原始數(shù)據(jù)完成數(shù)據(jù)級(jí)與特征級(jí)的數(shù)據(jù)融合,之后再由語義數(shù)據(jù)融合負(fù)責(zé)完成跨越傳感器類型的數(shù)據(jù)融合,并與決策目標(biāo)關(guān)聯(lián)。本文提出的數(shù)據(jù)融合框架如圖1所示。
3? 社區(qū)語義數(shù)據(jù)融合方案
3.1? 本體選擇與構(gòu)建
社區(qū)中存在多種類型的傳感器,決策目標(biāo)集合構(gòu)成也相對(duì)復(fù)雜。因此,需要考慮社區(qū)內(nèi)可供選擇的各類本體規(guī)范。與社區(qū)管理相關(guān)的本體有很多,如RDF、RDFS、OIL、DAML、OWL、SKOS等,這些語言都是遵循XML語言標(biāo)準(zhǔn),具有良好的語法,支持推理,表達(dá)能力強(qiáng)并使用方便[6]。社區(qū)的管理涉及多方面的因素,而不同的領(lǐng)域需要不同的本體進(jìn)行描述,可供選擇的本體主要有FOAF、SIOC、ORG、vCard、Event Ontology、SSN等。構(gòu)建領(lǐng)域本體常用的描述語言是RDF與OWL,但RDF不能很好地支持精確語言關(guān)系描述,OWL又過于復(fù)雜,介于二者之間的SKOS既可以描述語義關(guān)系,又相對(duì)簡單靈活,適合輕量級(jí)的語義關(guān)系描述。
3.2? 本體集成
基于本體進(jìn)行數(shù)據(jù)融合時(shí),通常有三種方法:單本體方法、多本體方法與混合方法[7]。但這種本體集成的思想不適用于SSN,SSN可以通過模塊化的方式使用多個(gè)本體。在本體領(lǐng)域,本體模塊化是一個(gè)用來將本體劃分成更小單位的通用方法。SSN通過使用owl: import語句,通過集成或映射本體的方式,將現(xiàn)有的多個(gè)本體進(jìn)行合成。
SSN的垂直模塊化是將一個(gè)本體構(gòu)建于另一個(gè)本體之上,高層本體有方向的使用owl: import語句引入低層模塊,SOSA作為核心不引入任何本體。SSN的水平模塊化本體有可能互相依賴,所有給SSN提供領(lǐng)域詞匯的本體均被認(rèn)為是水平模塊。
3.3? 數(shù)據(jù)描述
3.3.1? 傳感器數(shù)據(jù)SSN描述
SSN可以對(duì)數(shù)值型數(shù)據(jù)、日期時(shí)間型數(shù)據(jù)、位置數(shù)據(jù)等進(jìn)行觀測,對(duì)數(shù)值型數(shù)據(jù)可以區(qū)分不同的計(jì)量單位。以下以溫度傳感器為例,說明SSN對(duì)傳感器數(shù)據(jù)的描述過程為:
@prefix rdf:? <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix time: <http://www.w3.org/2006/time#>.
@prefix sosa: <http://www.w3.org/ns/sosa/> .
@prefix ssn:? <http://www.w3.org/ns/ssn/> .
@prefix xsd:? <http://www.w3.org/2001/XMLSchema#> .
@prefix qudt-1-1: <http://qudt.org/1.1/schema/qudt#> .
@prefix qudt-unit-1-1: <http://qudt.org/1.1/vocab/unit#> .
@base <http://examplecomminty.org/data/> .
<Observation/202112301> rdf:type sosa:Observation ;
sosa:observedProperty? <Building/No.5/Appartment/1201/TemperatureDetection> ;
sosa:madeBySensor <sensor/hlsc123> ;
sosa:hasResult [
rdf:type qudt-1-1:QuantityValue ;
qudt-1-1:numericValue “20.5”^^xsd:double ;
qudt-1-1:unit qudt-unit-1-1: DegreeCelsius ] ;
<sensor/hlsc123> rdf:type sosa:Sensor ;
sosa:observes? < Building/No.5/Appartment/1201/TemperatureDetection > ;
sosa:madeObservation <Observation/202112301>, <Observation/202112302>, <Observation/202112303> .
上述文檔描述了一個(gè)傳感器,編號(hào)為hlsc123,它進(jìn)行了三次觀測,編號(hào)分別為202112301、202112302、202112303,其中編號(hào)為202112301的觀測對(duì)象為Building/No.5/Appartment/1201,類型為溫度檢測,觀測的結(jié)果為double型的數(shù)值數(shù)據(jù)20.5,單位是攝氏度。
3.3.2? 基于數(shù)據(jù)融合的SSN描述
SSN基于單個(gè)傳感器進(jìn)行語義描述,而傳統(tǒng)數(shù)據(jù)融合是基于多個(gè)傳感器的。為了解決這一矛盾,可以采取虛擬節(jié)點(diǎn)的方法。
首先,采用傳統(tǒng)數(shù)據(jù)融合方式得到多個(gè)傳感器節(jié)點(diǎn)的值,這些數(shù)據(jù)通常來自同一類傳感器。在數(shù)據(jù)融合過程中需要進(jìn)行數(shù)據(jù)級(jí)與特征級(jí)融合,可能的操作類型有總和、平均值、加權(quán)平均、計(jì)數(shù)、最大值、最小值、挑選隨機(jī)數(shù)等。
其次,在采用SSN描述傳感器數(shù)據(jù)時(shí),將傳感器命名為一個(gè)虛擬出來的數(shù)據(jù)融合節(jié)點(diǎn),由傳統(tǒng)數(shù)據(jù)融合的中間結(jié)點(diǎn)提供數(shù)據(jù)級(jí)與特征級(jí)融合的結(jié)果數(shù)據(jù),并用comment進(jìn)行說明:
<Observation/ Virtual_node_hlsc987> rdf:type sosa:Observation ;
rdfs:comment “This is a virtual node composed of hlsc123, hlsc124, hlsc125. “@en ;
最后,描述虛擬節(jié)點(diǎn)其他特征。其他特征語義描述與單個(gè)傳感器節(jié)點(diǎn)描述方法相同,但其對(duì)應(yīng)的數(shù)據(jù)已經(jīng)是中間結(jié)點(diǎn)融合后的統(tǒng)計(jì)數(shù)據(jù)。
3.4? 語義推理
在進(jìn)行基于語義數(shù)據(jù)融合的決策時(shí),可以利用語義網(wǎng)內(nèi)置的語義推理功能進(jìn)行邏輯推理。當(dāng)前,語義分析與推理多采用Jena開發(fā)包來實(shí)現(xiàn)。Jena是惠普公司開發(fā)的一種使用Java語言的語義Web開發(fā)工具,提供了多種類型的推理機(jī),可以為社區(qū)中的各類決策目標(biāo)如事件預(yù)警類、日常監(jiān)測類建立推理規(guī)則。
3.5? 決策目標(biāo)關(guān)聯(lián)
基于語義融合的結(jié)果數(shù)據(jù),既可以構(gòu)建各類數(shù)據(jù)分析模型建立與決策目標(biāo)的關(guān)聯(lián),也可以根據(jù)事先設(shè)定的語義推理規(guī)則,完成社區(qū)管理決策任務(wù)。無論采用哪種方式,都可以實(shí)現(xiàn)基于物聯(lián)網(wǎng)數(shù)據(jù)的機(jī)器自動(dòng)分析和預(yù)警,從而提升社區(qū)管理能力與水平。
4? 結(jié)? 論
本文基于數(shù)據(jù)融合方法與語義網(wǎng)理論,提出了社區(qū)中語義數(shù)據(jù)融合方案。數(shù)據(jù)融合方法存在著一些固有的問題,如封閉問題域、固定推理關(guān)系等,語義網(wǎng)技術(shù)可以有效地彌補(bǔ)這些缺陷。采用語義數(shù)據(jù)融合方式來進(jìn)行社區(qū)的數(shù)據(jù)融合,同樣存在著一些問題,如多媒體數(shù)據(jù)類型的語義數(shù)據(jù)融合目前沒有完美解決方案。隨著物聯(lián)網(wǎng)、語義網(wǎng)等技術(shù)的發(fā)展,這些問題將會(huì)得以解決,從而讓社區(qū)管理變得更加自動(dòng)化和智能化。
參考文獻(xiàn):
[1] 何友等.多傳感器數(shù)據(jù)融合算法綜述 [J].火力與指揮控制,1996,21(1):12-21.
[2] 李建中,高宏.無線傳感器網(wǎng)絡(luò)的研究進(jìn)展 [J].計(jì)算機(jī)研究與發(fā)展,2008(1):1-15.
[3] 周鵬.多傳感器數(shù)據(jù)融合技術(shù)研究與展望 [J].物聯(lián)網(wǎng)技術(shù),2015,5(5):23-25.
[4] 唐慧,胡向東.無線傳感器網(wǎng)絡(luò)數(shù)據(jù)融合研究綜述 [J].信息安全與通信保密,2007(7):62-64+68.
[5] 趙繼軍,劉云飛,趙欣.無線傳感器網(wǎng)絡(luò)數(shù)據(jù)融合體系結(jié)構(gòu)綜述 [J].傳感器與微系統(tǒng),2009,28(10):1-4.
[6] 錢斌.基于語義網(wǎng)的輿情監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) [D].蘭州:蘭州大學(xué),2016.
[7] 王薇.基于關(guān)聯(lián)數(shù)據(jù)的圖書館數(shù)字資源語義融合研究[D].南京:南京大學(xué),2013
作者簡介:張慶來(1972—),男,漢族,河北保定人,副教授,博士,研究方向:信息管理與管理信息系統(tǒng)、企業(yè)信息化等。