周育偉,楊朝紅,王宏宇
(陸軍裝甲兵學院信息通信系,北京 100072)
智能化浪潮洶涌而來,加速著人類社會的進步和發(fā)展,智能化技術是改變世界的顛覆性技術之一。世界各軍事強國在軍事領域對人工智能的應用都給予了大力的支持。同時,戰(zhàn)場信息獲取從匱乏轉向過載甚至“爆炸”,使指揮員在面臨海量信息的時候無法快速決策,忽略一些重要的信息,如何將信息優(yōu)勢轉化為決策優(yōu)勢是一個關鍵問題。
知識是對信息的抽象和組織,因此相對于信息,知識能更好的指導人的決策和行動,可以將信息優(yōu)勢轉為認知優(yōu)勢,進而轉換為決策優(yōu)勢,輔助指揮員進行決策,由于軍事領域的特殊性,面向軍事領域知識圖譜的構建,前期一般采用自頂向下的方式構建知識圖譜,這就需要對本體層進行研究和構建。
本文基于本體的概念和構建方法,探討目前軍事領域本體構建的現(xiàn)狀,歸納已有的軍事領域本體,構建一個涵蓋多維度、多層次的軍事領域本體。
本體這一概念最早源于哲學領域,意為“對世界上客觀事物的系統(tǒng)描述,即存在論”,后來隨著人工智能的發(fā)展,1998 年被德國學者Stude 引入到了人工智能領域,并賦予了新的概念“本體是共享概念模型的形式化規(guī)范說明”。這個定義包含了四層含義:
⑴共享(Share):本體中所蘊含的知識是為大多數(shù)人認可的,其表達的是共性的知識。
⑵概念化(Conceptualization):本體所表述的知識是客觀的現(xiàn)實世界的一個抽象概念模型。
⑶明確性(Explicit):指本體中全部的術語、屬性及公理在使用前都必須有明確的定義。
⑷ 形式化(Formal):指本體可以被計算機所理解,具有機器可讀性。
可以說本體是對某一個領域進行描述的術語集合,是從世界存在的客觀事物抽象出來的概念模型,這個模型包含了概念和概念之間的關系和屬性以及對它們的約束、公理等,本體就相當于是知識圖譜的骨骼,實體則是對知識圖譜按照本體骨架進行填充的血肉。
將本體定義為六元組:
其中,C 表示概念集,A表示各個概念的屬性集,R 表示關系,A表示各個關系的屬性集,H 表示概念層次,用來說明概念集的層次劃分。例如,H(C1,C2)表示C1是C2 的子概念,X 表示公理集,用來約束概念與概念之間的關系或是概念與關系的屬性值。
常用的本體構建方法包括以下幾種方法:七步法、METHONTOLOGY 法、KACTUS工程法、SENSUS法、骨架法、TOVE 法、IDEF-5 法,其中七步法較其他幾種方法更為成熟。
對于軍事領域本體構建,有很多學者進行了研究。雷玉霞等人提出了軍事領域知識本體的設計思想,給出了一些用于知識庫中知識的語義一致性、完備性和精確性的公理。程英迅對軍事訓練領域的數(shù)據(jù)進行研究,提出了軍事訓練定義的六元組結構,構建了軍事訓練本體,開發(fā)了分布式數(shù)據(jù)庫搜索引擎。彭明輝基于搜狗的軍事新聞報道語料對軍事領域情感本體進行了構建,基于該本體構建了軍事領域情感傾向性分析平臺。蔣維等人提出了建立本體的5 個步驟,實現(xiàn)了本體建立過程部分功能自動完成,但是未進行本體的檢驗和更新。楊建池等人構建了用于作戰(zhàn)仿真的軍事領域核心本體。鐘誠等人對軍事倉儲領域本體進行了構建,并結合骨架法提出了一種優(yōu)化的領域本體構建流程。李坤等人將軍事領域本體劃分為5 類二級本體,并對每類二級本體進行了具體的劃分,設計了類的屬性,但是并未給出類間的關系,添加了本體實例,完成了軍事領域本體庫的存儲。陳立峰等人分析了軍事通信領域本體的特點,給出了軍事通信領域構建的方法。鄒燁翰對軍事條令條例的本體進行研究,針對美軍《任務清單》進行本體構建。雷瑛等人對多源軍事數(shù)據(jù)進行分析將軍事數(shù)據(jù)本體劃分為機構、人員、裝備、物資、環(huán)境、設施和理論法規(guī)7 類二級本體。劉煜澄對包括萬國兵器網、關系性能數(shù)據(jù)庫存儲的兵器數(shù)據(jù)進行分析構建了兵器本體。張清輝等人構建了軍事信息服務本體,并驗證了所構建本體模型的有效性。
當前本體構建的工具有Protégé、WebOneto、KAON、WebODE等工具。其中,Protégé具有支持中文語言,通過圖形化界面進行構建,支持推理及軟件的擴展,操作簡單等多種優(yōu)勢,成為構建本體的第一選擇。七步法目前成熟度較高,而且七步法是基于本體構建工具Protégé 進行本體構建的方法,故借鑒七步法提出一種軍事領域本體構建的方法并使用Protégé 工具對軍事領域本體進行構建。圖1 展示了結合七步法的軍事領域本體構建的流程。
圖1 軍事領域本體構建流程
⑴明確軍事領域本體的領域和范圍
明確軍事本體對應的邊界、業(yè)務功能域、用途、描述的信息內容、使用和維護本體的對象。
⑵收集軍事概念和數(shù)據(jù)資源
在構建軍事本體前,依據(jù)軍語、各類戰(zhàn)備工程數(shù)據(jù)庫標注、軍事報文、交換文件、戰(zhàn)場情報等,收集環(huán)境作戰(zhàn)數(shù)據(jù)。
⑶現(xiàn)有本體可重用性構建
對現(xiàn)有本體進行分析和完善,提高可重用性??芍赜帽倔w具有重要的意義,一方面可對現(xiàn)有本體進行拓展,減少很多不必要的研發(fā)工作,提高本體構建的效率。另一方面,可以為現(xiàn)有本體提供經驗性的指導以及設計上的啟發(fā)和幫助。
⑷本體的分析表達
對于不可重用的現(xiàn)有本體,需要對收集到的軍語、標注、標準進行數(shù)據(jù)分析,提取核心概念、概念屬性以及概念間的關系。
⑸構建本體
首先,采用自頂向下的方法定義類和類的繼承關系,即從軍事領域最基本的概念開始,逐層細化。例如從條令條例的概念開始,細化為共同條令、外軍作戰(zhàn)條令、專業(yè)條例等。然后,類定義完之后需要對類的屬性以及類之間的關系進行定義,比如定義作戰(zhàn)編隊和戰(zhàn)區(qū)之間的所屬關系等。最后,基于軍事業(yè)務規(guī)則,對類的屬性進行限制,包括屬性的類型,屬性的定義域和值域。如對一個連隊的人數(shù)進行約束,不能超過軍事知識的范圍,符合軍事領域知識的規(guī)范。
⑹本體整合和實例化
對軍事本體進行整合,采用一致性規(guī)約化方法對來自不同兵種、不同業(yè)務領域的軍事本體進行重定義和語義化處理,以免影響數(shù)據(jù)共享和融合,確認本體后可抽取數(shù)據(jù)進行實例化。
⑺本體評估和修正
經過明確領域,搜集概念等步驟,可以初步構建一個本體。但構建本體并非是一蹴而就的任務,在構建的過程中會受到構建者自身認知的限制,因此可能會存在一定的差錯和冗余,因此需要對本體進行評估和修正。一方面可以經過調研和請教領域內的專家進行探討,記錄評價意見,從本體的一致性、明確性、可擴展性等方面進行綜合評價,另一方面可以使用Protégé內自帶的推理機進行本體的一致性檢驗。軍事領域本體的構建隨著業(yè)務需求變化而擴展迭代更新,以保證滿足軍事業(yè)務需求,與時俱進,實現(xiàn)高性能,高可用。
通過總結、歸納已有軍事領域本體,以及對裝備手冊等數(shù)據(jù)來源進行分析,并咨詢領域專家,共設置四級本體樹。一級本體包含武器裝備、戰(zhàn)場環(huán)境、軍用物資、人物、條令條例、設施和組織機構共7大類,二至四級本體是對上一級本體的具體劃分。
以武器裝備為例,考慮到作戰(zhàn)中可能涉及的各類裝備,按照領域用途將武器裝備本體分為遙感裝置、保密裝備、電子對抗裝備、軍械裝備、偵察觀測裝備、陸軍裝備、海軍裝備、空軍裝備、工程裝備、防化裝備、指揮通信裝備、彈藥導彈、多棲裝備和保障裝備共14 個二級本體。以偵察觀測裝備為例,下設指揮鏡、方向盤、望遠鏡、步兵潛望鏡、測距機、炮兵聲測系統(tǒng)、炮兵測地系統(tǒng)、炮兵鏡、炮兵防空兵夜視設備、經緯儀、輕武器夜視設備、雷達等14 個三級本體,雷達本體下設機械掃描雷達和電掃描雷達2個四級本體。
在對軍事領域本體的概念進行定義之后,需要對本體的關系和屬性進行定義。在Protégé軟件中,關系為對象屬性(Object Property)即表示本體類與類之間的關系,屬性為數(shù)據(jù)屬性(Data Property)即表示本體類所具有的性質,一條事實可以用三元組(定義域,對象/數(shù)據(jù)屬性,值域)進行表示,對于對象屬性來講,值域是一個本體概念,對于數(shù)據(jù)屬性而言,值域是一個定義好的數(shù)據(jù)類型。例如三元組(轟炸機,搭載,導彈)表示了本體概念“轟炸機”作為定義域,“搭載”作為關系,“導彈”作為值域的一條事實“轟炸機搭載了導彈”,這樣“轟炸機”類的實體和“導彈”類的實體就可以擁有“搭載”這個關系。軍事領域本體設置以下五類關系:
作戰(zhàn)關系 主要用來描述作戰(zhàn)過程中的行動關系。包括:支援、協(xié)同、指揮、干擾、保障等關系。
人員關系 主要用來描述人員與人員、組織、裝備和物資的關系。包括:上級、下級、平級、配備、隸屬、任職、管理、維修、研發(fā)等關系。
裝備關系 主要用來描述裝備作戰(zhàn)單元和組織機構等之間的關系。包括:編配、配屬、搭載、生產、使用、消耗、部件等關系。
位置關系 主要用來表示方位的關系。包括:東、西、南、北、東西等關系。
其他關系 主要是一些共性的關系,如:組成、屬于、包含等通用的關系。
數(shù)據(jù)屬性的類型設計主要用來約束屬性值的數(shù)據(jù)類型,在定義屬性類型時需要對屬性名、屬性值和屬性的數(shù)據(jù)類型進行定義,數(shù)據(jù)屬性將本體類與數(shù)據(jù)類型進行關聯(lián),Protégé 中提供了多種數(shù)據(jù)類型。以導彈類本體為例,其主要屬性定義如表1所示。
表1 導彈類屬性類型設計(部分)
考慮到個體的主觀意識影響,并且本體構建是一個隨著構建者認知不斷加深而重復修正的一個過程,在本體構建的過程中會產生一定的概念、關系、屬性和公理等方面的沖突或冗余,故而需要對已經構建好的本體進行一致性、準確性和可滿足性等方面的檢測。構建本體的過程中參照《軍語》等專業(yè)術語概念進行構建,將有歧義的本體概念降到最低,同時邀請領域專家進行點評修改,提高本體構建的準確性,構建好的本體保存為OWL格式的文件,然后使用Protégé軟件中自帶的Pellet 推理機進行本體的一致性檢測。Protégé 軟件內置的Pellet 推理機是一種基于Tableau算法的描述邏輯推理機,Pellet推理機可以根據(jù)本體結構生成斷言概念結構,確定本體元素與元素之間是否存在相互否定的關系,從而實現(xiàn)描述邏輯一致性檢驗的目的。構建好軍事領域本體后就可以根據(jù)本體進行實體抽取、關系抽取、屬性抽取等任務完成軍事領域知識圖譜的構建,為智能問答、輔助決策等下游任務提供基礎。
本文對軍事領域已有本體進行了歸納總結,借鑒七步法提出了軍事領域本體構建的流程,復用已有的軍事領域本體,對包括裝備手冊在內的數(shù)據(jù)進行分析總結,使用Protégé 構建了一個涵蓋范圍廣、多層次的軍事領域本體,為下一步基于軍事領域知識圖譜的構建做鋪墊。但是考慮到軍事領域本體構建的質量要求高,因此構建的全過程都是依靠人工的,因而構建過程緩慢,之后會對半自動以及自動構建本體展開研究和探討。