郝培豪,高潔
(中國(guó)人民公安大學(xué)信息技術(shù)與網(wǎng)絡(luò)安全學(xué)院,北京102623)
隨著社會(huì)不斷發(fā)展,社會(huì)之中人與人之間的交往也變得更加頻繁,與此同時(shí),愈來愈多的社會(huì)活動(dòng)也隨之而不斷開展,而保障這些活動(dòng)的安全順利的進(jìn)行是各級(jí)政府極具重視的工作之一。再加之,社會(huì)中一些具有仇視心理的人為報(bào)復(fù)社會(huì),總會(huì)在大規(guī)模人群中制造危險(xiǎn),并且國(guó)內(nèi)外對(duì)于這種事件的發(fā)生也屢見不鮮,因此合理科學(xué)地增強(qiáng)安保工作便成為當(dāng)務(wù)之急。我國(guó)安保領(lǐng)域的數(shù)據(jù)資源雖然豐富,數(shù)據(jù)量也呈爆炸式增長(zhǎng),其涉及的方面也十分廣泛,但是其包含各種結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),關(guān)聯(lián)性和可操作性較差,難以為安保做出更大的貢獻(xiàn),如何解決安保活動(dòng)中出現(xiàn)的各種諸如人、車以及物品等數(shù)據(jù),并將其整合成為有關(guān)系的語義網(wǎng)絡(luò)便成為當(dāng)前安保領(lǐng)域的一個(gè)研究方向。傳統(tǒng)的關(guān)系數(shù)據(jù)庫可以處理一下具有簡(jiǎn)單的數(shù)據(jù)關(guān)系,但隨著如今各種數(shù)據(jù)已爆炸的形勢(shì)增長(zhǎng),以往的關(guān)系數(shù)據(jù)庫已在適應(yīng)數(shù)據(jù)的動(dòng)態(tài)性、處理數(shù)據(jù)之間的關(guān)系等方面呈現(xiàn)出一定的疲態(tài),而知識(shí)圖譜便可處理安?;顒?dòng)中的難題。知識(shí)圖譜是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系[1]。本文運(yùn)用Neo4j圖數(shù)據(jù)庫[2]對(duì)安保警務(wù)知識(shí)圖譜所產(chǎn)生的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與整理,并進(jìn)行數(shù)據(jù)的編譯,使之形成一個(gè)完整的安保知識(shí)圖譜,使安保人員能夠直觀地了解某些在安保過程中面對(duì)突發(fā)情況所應(yīng)該采取的措施,一方面節(jié)省時(shí)間,另一方面也優(yōu)化了信息獲取的速度,縮短了時(shí)間,提升了工作效率。
Neo4j圖數(shù)據(jù)庫作為一個(gè)高性能的圖形數(shù)據(jù)庫,它的優(yōu)點(diǎn)是可以將結(jié)構(gòu)化的數(shù)據(jù)保存在網(wǎng)絡(luò)中,而不是傳統(tǒng)關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)表中。它利用的是Java持久化引擎,并且該引擎是嵌入式的、基于磁盤、具備完全的事務(wù)特性[3]。它擁有目前成熟數(shù)據(jù)庫的諸多特性,相比較于傳統(tǒng)的關(guān)系數(shù)據(jù)庫,它可以更加高效地解決大量低結(jié)構(gòu)化、復(fù)雜的數(shù)據(jù),其原因在于,傳統(tǒng)的關(guān)系數(shù)據(jù)庫在處理關(guān)系繁多的數(shù)據(jù)信息是,伴隨其產(chǎn)生的就是大量的數(shù)據(jù)表連接,這些連接會(huì)使得用戶在做數(shù)據(jù)查詢處理時(shí)就會(huì)顯得不夠迅速與便捷。而Neo4j圖數(shù)據(jù)庫很出色地解決了這一問題,通過圍繞圖形進(jìn)行數(shù)學(xué)建模,Neo4j在數(shù)據(jù)處理上會(huì)以相同速度遍歷節(jié)點(diǎn)與邊,并且其遍歷的速度與圖數(shù)據(jù)庫中的數(shù)據(jù)量是沒有直接關(guān)系,無論圖數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)量有多少,都不會(huì)影響Neo4j的遍歷速度,這種做法的好處是大大提升了數(shù)據(jù)庫的工作效率。此外,Neo4j圖數(shù)據(jù)庫還在傳統(tǒng)關(guān)系數(shù)據(jù)庫的基礎(chǔ)上,提供了快速的圖算法、推薦系統(tǒng)和OLAP風(fēng)格的分析方法,方便數(shù)據(jù)的綜合分析[4]。
本文是構(gòu)建一個(gè)安保領(lǐng)域體系的知識(shí)圖譜,將安保中出現(xiàn)的數(shù)據(jù)信息存儲(chǔ)到數(shù)據(jù)庫中,并利用可視化工具將其展現(xiàn),并且能夠進(jìn)行特定查詢的功能。具體研究步驟如下:
(1)采用億圖MindMaster軟件做安保工作的思維導(dǎo)圖,用于理清安保過程中各個(gè)流程之間的關(guān)系,以及梳理在安保過程中出現(xiàn)的人、車以及物品所可能出現(xiàn)的關(guān)系屬性。
(2)運(yùn)用 Protégé軟件進(jìn)行安保領(lǐng)域的本體構(gòu)建[5],分析其中的知識(shí)結(jié)構(gòu),明確安保領(lǐng)域的本體概念,針對(duì)安保中的邏輯概念進(jìn)行限定,最后利用定義規(guī)則的方式推理安保知識(shí)圖譜的本體關(guān)系。
(3)基于Neo4j圖數(shù)據(jù)庫構(gòu)建安保知識(shí)圖譜,利用Cypher語言對(duì)安保中的實(shí)體、關(guān)系以及屬性進(jìn)行設(shè)計(jì)、編譯,使安保知識(shí)圖譜中可以呈現(xiàn)清晰的節(jié)點(diǎn)關(guān)系結(jié)構(gòu),并且利用該圖數(shù)據(jù)庫方便使用交互式查詢。
在知識(shí)圖譜的研究領(lǐng)域中,知識(shí)圖譜對(duì)于數(shù)據(jù)來源的定義已劃為基本的三類,分別為基于結(jié)構(gòu)化數(shù)據(jù)構(gòu)建、基于半結(jié)構(gòu)化數(shù)據(jù)構(gòu)建和基于非結(jié)構(gòu)化數(shù)據(jù)構(gòu)建。由于安保行動(dòng)對(duì)于全世界而言都是屬于秘密行動(dòng),為防止不法分子針對(duì)安保方案進(jìn)行恐怖活動(dòng)方案設(shè)計(jì),所以本文的安保知識(shí)圖譜數(shù)據(jù)主要是通過基層調(diào)研,向基層派出所的一線民警調(diào)研學(xué)習(xí),獲得關(guān)于安?;顒?dòng)的方案以及處置經(jīng)驗(yàn),故本文主要基于非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行安保知識(shí)圖譜的構(gòu)建,并結(jié)合網(wǎng)絡(luò)中相關(guān)的安保新聞以及文檔信息,作為安保知識(shí)圖譜的數(shù)據(jù)基礎(chǔ),進(jìn)行分析。
本文運(yùn)用億圖MindMaster軟件,針對(duì)安保方案以及收集的數(shù)據(jù)進(jìn)行梳理,將安保流程及規(guī)范整理為本體與事件兩大類,其中安保中本體下可分為人、車和物,而安保中事件可分為應(yīng)急、防爆和檢查,運(yùn)用這兩大類,六個(gè)方面將安保工作進(jìn)行整體概括,從而形成安保知識(shí)導(dǎo)圖(如圖1所示)。
圖1 安保知識(shí)導(dǎo)圖
在本文研究中,針對(duì)抽取而出的安保信息數(shù)據(jù)的本體,例如在安保行動(dòng)過程中出現(xiàn)的人,其屬性包括為姓名、身份證號(hào)、相貌特征、犯罪記錄等,以及車輛、物品,諸如此類本體在一定的時(shí)空之中會(huì)發(fā)生諸多交集,并且由于安保現(xiàn)場(chǎng)人員眾多,車輛與物品的出現(xiàn)也會(huì)充滿了隨機(jī)性與多樣性,這樣復(fù)雜的關(guān)系聯(lián)系就需要人工定義推理的方法完成,本文運(yùn)用Protégé軟件進(jìn)行本體與本體之間,以及屬性的定義,分析出對(duì)于安保過程中最基本的本體要本,利用OntoGraf插件可構(gòu)建完整的本體屬性關(guān)聯(lián)關(guān)系圖(如圖2所示),從而形成嚴(yán)密完整的知識(shí)語言邏輯體系,成為安保知識(shí)圖譜的理論基礎(chǔ)。
通過對(duì)本體與本體之間的關(guān)系進(jìn)行定義,可以定義駕駛、擁有、偷竊、檢查等多種關(guān)系,憑借著各種關(guān)系,多種本體之間的關(guān)系就會(huì)構(gòu)成一套容納整個(gè)安保中的本體、關(guān)系的知識(shí)庫。
安保知識(shí)圖譜的可視化是通過Neo4j圖數(shù)據(jù)庫所實(shí)現(xiàn)的[6]。在Neo4j圖數(shù)據(jù)庫中,數(shù)據(jù)展現(xiàn)是通過數(shù)據(jù)節(jié)點(diǎn)、屬性已經(jīng)關(guān)系展現(xiàn)的,各個(gè)節(jié)點(diǎn)之間可以擁有多個(gè)關(guān)系和屬性,并且針對(duì)安保工作中的各種人物、車輛和物品的復(fù)雜關(guān)系,以及多源的數(shù)據(jù)類型,Neo4j圖數(shù)據(jù)庫可以很好地處理這些問題。并在這基礎(chǔ)之上,針對(duì)傳統(tǒng)數(shù)據(jù)庫在表示數(shù)據(jù)表的連接時(shí)的局限性,Neo4j圖數(shù)據(jù)庫可概括為一個(gè)節(jié)點(diǎn),從而大幅度提升數(shù)據(jù)檢索時(shí)的效率。
圖2 安保本體聯(lián)系圖
針對(duì)安保中數(shù)據(jù)信息的處理,通過代碼編寫和數(shù)據(jù)導(dǎo)入,獲得安保信息,并在Neo4j圖數(shù)據(jù)庫中構(gòu)建知識(shí)圖譜體系。例如,在數(shù)據(jù)庫中,對(duì)人物“楊問楓”進(jìn)行檢索,其對(duì)應(yīng)的查詢語句為:
match(p:人物{姓名:“楊問楓”}
return p;
查詢結(jié)果如圖3所示。通過對(duì)人物“楊問楓”的檢索,可以獲得關(guān)于其的人物關(guān)系、車輛關(guān)系以及物品所屬關(guān)系,通過對(duì)這些關(guān)系的分析,從而可以便捷高效地掌握信息,也同時(shí)為安保工作提供便利。
圖3 安保知識(shí)圖譜
本文通過針對(duì)警務(wù)安保領(lǐng)域的知識(shí)圖譜構(gòu)建進(jìn)行了探究,通過對(duì)安保行業(yè)的知識(shí)信息數(shù)據(jù)進(jìn)行歸納提取,基于其特殊的應(yīng)用領(lǐng)域,從本體關(guān)系關(guān)聯(lián)的角度,深入本體之間的關(guān)系架構(gòu),構(gòu)建符合安保實(shí)際情況的知識(shí)圖譜,也同時(shí)為安保知識(shí)圖譜的研究提供一個(gè)實(shí)踐基礎(chǔ)和理論基礎(chǔ)。隨著社會(huì)快速發(fā)展,安保領(lǐng)域也面臨著活動(dòng)不斷復(fù)雜的情況,并且關(guān)于本體的數(shù)據(jù)也在不斷變化與更新,因此需要對(duì)本體和屬性的知識(shí)庫進(jìn)行周期性更新,這樣才能夠保證安保知識(shí)圖譜在安保領(lǐng)域中不會(huì)落后,不會(huì)影響安保工作的正常進(jìn)行。在本文中也存在著一些不足,對(duì)于安保領(lǐng)域而言,本文的安保知識(shí)圖譜僅是一次初步探索,其本體的定義還不僅完善,對(duì)屬性以及關(guān)系的構(gòu)建也不夠詳盡與,因此希望在以后的研究中將其完善,做深入研究。
安保行業(yè)領(lǐng)域一直以來都是受到廣泛關(guān)注的特殊領(lǐng)域,為此,加強(qiáng)安保工作,針對(duì)安保知識(shí)圖譜的搭建便具有十分重要的意義。在此基礎(chǔ)上,安保知識(shí)圖譜也能在可視化的檢索服務(wù)中為安保人員的知識(shí)需求提供一種便捷的服務(wù),從而幫助安保活動(dòng)的正常順利進(jìn)行。