李軼童,黃子俊,熊家軍,吳長(zhǎng)飛
(空軍預(yù)警學(xué)院,武漢 430019)
?
基于本體的軍事情報(bào)元數(shù)據(jù)描述研究
李軼童,黃子俊,熊家軍,吳長(zhǎng)飛
(空軍預(yù)警學(xué)院,武漢 430019)
目前,軍事情報(bào)系統(tǒng)按情報(bào)的專(zhuān)業(yè)種類(lèi)提供定制和分發(fā)服務(wù),缺乏對(duì)情報(bào)資源的統(tǒng)一描述,不同專(zhuān)業(yè)系統(tǒng)之間情報(bào)共享困難。結(jié)合元數(shù)據(jù)以及軍事情報(bào)自身的特點(diǎn),將基于本體的元數(shù)據(jù)思想引用到軍事情報(bào)描述中去,建立用于描述軍事情報(bào)資源的元數(shù)據(jù)模型,提出了基于本體的軍事情報(bào)元數(shù)據(jù)模型的描述框架,使情報(bào)資源通過(guò)元數(shù)據(jù)更容易被發(fā)現(xiàn)、獲取、利用和共享。
本體;元數(shù)據(jù);軍事情報(bào);元數(shù)據(jù)模型
隨著大量情報(bào)偵察監(jiān)視技術(shù)和手段的運(yùn)用,軍事情報(bào)源種類(lèi)和數(shù)量不斷增加,造成了情報(bào)多元、復(fù)雜、無(wú)序、異構(gòu)等特點(diǎn)。一方面使得情報(bào)之間相對(duì)封閉,不同系統(tǒng)之間的情報(bào)共享變得非常困難,而造成了大量情報(bào)資源無(wú)法利用的“情報(bào)泛濫”,另一方面也造成了情報(bào)用戶(hù)在大量無(wú)序、異構(gòu)的情報(bào)面前無(wú)從選取、定位的“情報(bào)缺乏”。如何解決這一矛盾,是情報(bào)工作者必須面對(duì)的問(wèn)題。運(yùn)用基于本體的元數(shù)據(jù)方法對(duì)情報(bào)進(jìn)行描述,能將情報(bào)的內(nèi)容更加規(guī)范、完整地描述出來(lái),增強(qiáng)情報(bào)的透明度和共享性。
元數(shù)據(jù)可理解成對(duì)其他數(shù)據(jù)的特征進(jìn)行描述的數(shù)據(jù),同時(shí)確保這些數(shù)據(jù)能被計(jì)算機(jī)理解,是一種可以使信息資源被有效組織和管理的工具?;诒倔w的元數(shù)據(jù)不但能對(duì)專(zhuān)業(yè)術(shù)語(yǔ)進(jìn)行形式化的定義,使其支持語(yǔ)義描述,能有效地促進(jìn)領(lǐng)域內(nèi)知識(shí)共享,同時(shí)也能幫助用戶(hù)查詢(xún)所需要的情報(bào)。
本文從情報(bào)的現(xiàn)實(shí)需求出發(fā),主要針對(duì)情報(bào)的異構(gòu)性提出了一種基于本體的情報(bào)核心元數(shù)據(jù)模板,并結(jié)合XML語(yǔ)言將其進(jìn)行描述,增強(qiáng)了不同軍兵種用戶(hù)對(duì)情報(bào)的感知、理解及推理能力。
1.1 元數(shù)據(jù)的作用
元數(shù)據(jù)在人們生活中長(zhǎng)時(shí)間被用作對(duì)資源的定位、說(shuō)明等。關(guān)于元數(shù)據(jù)的定義,國(guó)際圖聯(lián)[1]提出了比較確切的說(shuō)法:“元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。此術(shù)語(yǔ)可以指任何用于幫助網(wǎng)絡(luò)電子資源識(shí)別、描述和定位的數(shù)據(jù)”。
近年來(lái),元數(shù)據(jù)被應(yīng)用到越來(lái)越多的領(lǐng)域,因此其作用也受到越來(lái)越多的關(guān)注和重視,元數(shù)據(jù)在預(yù)警情報(bào)描述中的主要作用表現(xiàn)為以下幾種:
(1) 有利于情報(bào)資源的著錄描述。通過(guò)元數(shù)據(jù)提供的各種信息進(jìn)行語(yǔ)義描述,可較為全面、詳盡地描述情報(bào)資源,幫助維護(hù)者建立資源文檔,用戶(hù)理解資源信息。
(2) 有利于情報(bào)的組織管理。相應(yīng)的元數(shù)據(jù)可有效解決異構(gòu)數(shù)據(jù)的組織和管理,并方便數(shù)據(jù)資源的長(zhǎng)期保存。利用元數(shù)據(jù)還可以對(duì)管理過(guò)程進(jìn)行控制,包括權(quán)限管理、數(shù)字簽名、密級(jí)管理、訪(fǎng)問(wèn)管理等。
(3) 有利于情報(bào)的發(fā)現(xiàn)與定位。根據(jù)用戶(hù)的情報(bào)需求,快速找到用戶(hù)所需的情報(bào)資源并確定情報(bào)資源的位置。
(4) 提高情報(bào)的共享能力[2]。通過(guò)統(tǒng)一規(guī)范的元數(shù)據(jù)對(duì)情報(bào)資源進(jìn)行描述,打破不同專(zhuān)業(yè)和不同系統(tǒng)之間的情報(bào)壁壘,實(shí)現(xiàn)不同專(zhuān)業(yè)情報(bào)信息系統(tǒng)之間的網(wǎng)絡(luò)信息共享。
1.2 元數(shù)據(jù)的類(lèi)型
完整的元數(shù)據(jù)體系根據(jù)其功能可分為以下4種類(lèi)型[3]:
(1) 描述型元數(shù)據(jù),用來(lái)描述和標(biāo)識(shí)信息最本質(zhì)、最基礎(chǔ)的特征,以便資源被用戶(hù)識(shí)別和發(fā)現(xiàn)。
(2) 管理型元數(shù)據(jù)[4],用于組織和管理數(shù)據(jù)資源的元數(shù)據(jù),如版本控制、信息采集等。
(3) 保存型元數(shù)據(jù),用來(lái)描述資源的期限、更新、轉(zhuǎn)換等相關(guān)的元數(shù)據(jù)。
(4) 技術(shù)型元數(shù)據(jù)[4],用于描述和系統(tǒng)運(yùn)行有關(guān)的元數(shù)據(jù)。
2.1 本體的概念
本體(Ontology)的研究最早起源于哲學(xué)領(lǐng)域,人們將對(duì)世界客觀(guān)存在事物的描述稱(chēng)之為本體論或存在論。自上世紀(jì)90年代以來(lái),其思想被人工智能、計(jì)算機(jī)等領(lǐng)域所研究并采用。近些年,關(guān)于本體的定義有很多,其中獲得較多認(rèn)同的定義是:1998年R.Studer在前人的基礎(chǔ)上給出了一個(gè)本體較為明確的解釋[5],即“本體是共享概念模型的明確的形式化規(guī)范說(shuō)明”。
定義1[6]:在一個(gè)完整的本體中,至少應(yīng)該由概念、關(guān)系、函數(shù)、公理和實(shí)例等五類(lèi)基本元素構(gòu)成。因此,本體可以如下表現(xiàn):O={C,R,F(xiàn),A,I},其中:
(1)C:概念。本體中的概念是廣義上的概念,它除了包括一般意義上的概念外,還包括任務(wù)、功能、行為、策略、推理過(guò)程等。本體中的這些概念通常按照一定的關(guān)系形成一個(gè)層次結(jié)構(gòu)。
(2)R?2c×c:概念之間的關(guān)系,表示概念之間的一類(lèi)關(guān)聯(lián)。如概念之間的“Subclass-of”關(guān)系、“Part-of”關(guān)系等。
(3)F?Rn:一種特殊的關(guān)系。其中第n個(gè)元素Cn相對(duì)于前面n-1個(gè)元素是唯一確定的。函數(shù)可用如下形式表示:F:C1×C2×…×Cn-1→Cn。
(4)A:概念或概念之間的關(guān)系所滿(mǎn)足的公理是一些永真式。
(5)I:領(lǐng)域內(nèi)概念實(shí)例的集合。在有些本體模型中,概念的實(shí)例不被看成是本體的組成部分。
2.2 本體在軍事情報(bào)描述中的作用
(1) 有效擴(kuò)展資源查詢(xún)能力。軍事情報(bào)本體對(duì)不同軍兵種等的情報(bào)資源描述都賦予了語(yǔ)義,而其自身的推理能力可以提供面向語(yǔ)義的查詢(xún)能力,利用情報(bào)本體進(jìn)行查詢(xún)的擴(kuò)充,可以使查詢(xún)的結(jié)果更加全面。
(2) 支持更多的資源交流。軍事情報(bào)本體的目的是對(duì)自身領(lǐng)域的資源進(jìn)行捕獲,通過(guò)提供該領(lǐng)域資源的共同理解來(lái)確定共同認(rèn)可的術(shù)語(yǔ),從而使領(lǐng)域知識(shí)的結(jié)構(gòu)更加清晰,為情報(bào)的表示打好了基礎(chǔ)。情報(bào)本體可以重用,從而避免重復(fù)的領(lǐng)域知識(shí)分析。
(3) 支持不同系統(tǒng)之間的互操作性。不同的系統(tǒng)、不同的軍兵種采用不同標(biāo)準(zhǔn)的元數(shù)據(jù),使得各系統(tǒng)之間存在異構(gòu)性,本體在不同建模、語(yǔ)言和軟件工具之間進(jìn)行翻譯和映射,從而實(shí)現(xiàn)不同系統(tǒng)之間的互操作和集成。
(4) 提高信息化的實(shí)施效率和質(zhì)量。利用本體對(duì)所需解決的問(wèn)題和任務(wù)進(jìn)行規(guī)范描述,可以提高需求分析及信息獲取的效率,節(jié)約成本。
2.3 軍事情報(bào)特點(diǎn)
信息化戰(zhàn)爭(zhēng)發(fā)展以來(lái),由于防空預(yù)警、反導(dǎo)預(yù)警、航天偵察、網(wǎng)絡(luò)偵察等大量電子偵察技術(shù)和手段的運(yùn)用,使得情報(bào)來(lái)源越來(lái)越廣。軍事情報(bào)服務(wù)于軍事活動(dòng),因此具有客觀(guān)性、動(dòng)態(tài)性、時(shí)效性、保密性等特點(diǎn)[7]。
(1) 客觀(guān)性。軍事情報(bào)的特殊性決定了軍事情報(bào)必須全部是客觀(guān)實(shí)際情況,不能夾雜任何的主觀(guān)色彩描述。
(2) 動(dòng)態(tài)性。軍事情報(bào)反映出隨著軍事活動(dòng)發(fā)展不斷變化的情況,尤其是戰(zhàn)時(shí)的軍事情報(bào)內(nèi)容必須根據(jù)瞬息萬(wàn)變的戰(zhàn)場(chǎng)情況而不斷更新。
(3) 時(shí)效性。軍事情報(bào)的時(shí)效性是決定軍事情報(bào)價(jià)值的重要因素之一。它反映出的客觀(guān)實(shí)際情況特別是動(dòng)向情況應(yīng)及時(shí)提供使用,也因此更強(qiáng)調(diào)時(shí)效性,以免貽誤戰(zhàn)機(jī)。
(4) 保密性。軍事斗爭(zhēng)的保密性決定了軍事情報(bào)的保密性,軍事情報(bào)關(guān)系國(guó)家安全和戰(zhàn)爭(zhēng)勝負(fù)[8],因此特別強(qiáng)調(diào)保密性,因此在限制級(jí)別開(kāi)放的同時(shí)還要加強(qiáng)自身的保密。
2.4 基于本體的軍事情報(bào)元數(shù)據(jù)模型
定義2:基于本體的元數(shù)據(jù)模型是一個(gè)六元組,記作M=(I,T,Tc,R,F,P)。其中:
(1)I為實(shí)例集,一般是實(shí)體類(lèi)集合,指實(shí)體類(lèi)或?qū)ο蟆?/p>
(2)T為術(shù)語(yǔ)集,表示包括實(shí)體、數(shù)據(jù)元素和類(lèi)屬元素在內(nèi)的軍用概念術(shù)語(yǔ)以及實(shí)體元數(shù)據(jù)、數(shù)據(jù)元素元數(shù)據(jù)和類(lèi)書(shū)元素元數(shù)據(jù)在內(nèi)的屬性術(shù)語(yǔ)的集合。
(3)Tc為術(shù)語(yǔ)注釋集,是自然語(yǔ)言對(duì)術(shù)語(yǔ)進(jìn)行解釋說(shuō)明的集合。通過(guò)自然語(yǔ)言對(duì)術(shù)語(yǔ)進(jìn)行描述,實(shí)現(xiàn)用戶(hù)更好的對(duì)術(shù)語(yǔ)理解,以便支持元數(shù)據(jù)模型的后續(xù)維護(hù)。
(4)R為所有關(guān)系的集合。主要包括:
①語(yǔ)義關(guān)系,在基于本體的元數(shù)據(jù)構(gòu)建中,語(yǔ)義關(guān)系分析也是必不可少的,主要有包含關(guān)系、統(tǒng)一關(guān)系和上下位關(guān)系等。
②概念關(guān)系,確定概念間的等級(jí)關(guān)系,得到領(lǐng)域概念的層次關(guān)系圖,主要有用代關(guān)系(優(yōu)選關(guān)系)、屬種關(guān)系、相關(guān)關(guān)系和非交關(guān)系。
③實(shí)體關(guān)系,主要包括聚合關(guān)系、關(guān)聯(lián)關(guān)系和繼承關(guān)系。
(5)F為函數(shù)集,包括:
①Att:A→E∪R:屬性函數(shù),將屬性分配給某一實(shí)體類(lèi)或關(guān)系;
②val:V→(E,A):屬性取值函數(shù),屬性具有數(shù)據(jù)類(lèi)型;
③Inst:E→2I:信息單元實(shí)例化函數(shù),可以寫(xiě)為Inst(E)=I或E(I);
④Instr:R→2I×I:關(guān)系實(shí)例化函數(shù),可以寫(xiě)為Instr(R)={I1,I2}或R(I1,I2)。
(6)P為約束規(guī)則集,指所有信息單元實(shí)體類(lèi)、關(guān)系和實(shí)例要滿(mǎn)足約束的集合。包括類(lèi)型約束(取值約束)和基數(shù)約束。
定義3[11]:給定的元數(shù)據(jù)模型M=(I,T,Tc,R,F,P),模型的解釋為一個(gè)二元組,記為I=(ΔI●I)。
其中,ΔI為M的論域的非空集合,●I是解釋函數(shù),它將術(shù)語(yǔ)集中的每個(gè)原子類(lèi)C都映像為ΔI中的一個(gè)子集,使得CI?ΔI,將每個(gè)關(guān)系語(yǔ)義R都映像為一個(gè)二元關(guān)系RI?ΔI×ΔI,將實(shí)例集中每一個(gè)個(gè)體c映像為I中的元素,使得cI∈ΔI。
3.1 軍事情報(bào)分析
軍事情報(bào)利用一定的方法和技術(shù)對(duì)情報(bào)的外部特征進(jìn)行描述、內(nèi)容特征進(jìn)行揭示,其資源描述的構(gòu)成具備了整個(gè)軍事資源對(duì)資源描述需求的共性。與軍事資源直接相關(guān)的要素包括:區(qū)域、武器裝備、編制和部署等,這些資源詳細(xì)記錄了與軍事情報(bào)相關(guān)的覆蓋范圍、作戰(zhàn)任務(wù)和安全等級(jí)等基礎(chǔ)信息。同時(shí),軍事情報(bào)作為軍事資源的一類(lèi),有著其自身的特性,因此需要一些專(zhuān)門(mén)記錄這些特性的信息描述。與軍事情報(bào)密切相關(guān)的要素有:時(shí)間、提供者、安全等級(jí)、級(jí)別等,這些數(shù)據(jù)涵蓋了軍事情報(bào)從建立到內(nèi)容描述再到訪(fǎng)問(wèn)等每個(gè)環(huán)節(jié)。其中每個(gè)信息的描述根據(jù)應(yīng)用條件或記錄信息的不同可繼續(xù)劃分為更加詳細(xì)的信息描述。
3.2 軍事情報(bào)核心元數(shù)據(jù)
軍事情報(bào)的特殊性決定軍事情報(bào)元數(shù)據(jù)的特殊性,本文針對(duì)軍事情報(bào)的特殊性,參照國(guó)內(nèi)外一些成熟的元數(shù)據(jù)標(biāo)準(zhǔn),在都柏林核心元數(shù)據(jù)集(DC)[9]的基礎(chǔ)上加入軍事情報(bào)特有的元素,提出了一種基于本體的軍事情報(bào)核心元數(shù)據(jù)。
軍事情報(bào)元數(shù)據(jù)主要對(duì)各類(lèi)情報(bào)資源進(jìn)行描述,因此情報(bào)資源可以按照一定的性質(zhì)分為資源管理型元素、資源內(nèi)容型元素、安全認(rèn)證元素和訪(fǎng)問(wèn)操作元素。
如圖1所示,軍事情報(bào)核心元數(shù)據(jù)歸類(lèi)合并了在內(nèi)容和數(shù)據(jù)結(jié)構(gòu)上具有相關(guān)性的數(shù)據(jù)集合,元數(shù)據(jù)模型有4個(gè)一級(jí)情報(bào)資源描述分類(lèi),在每個(gè)一級(jí)分類(lèi)下又分為若干個(gè)二級(jí)分類(lèi)。
圖1 軍事情報(bào)核心元數(shù)據(jù)模版
資源管理元素[10],為用戶(hù)直觀(guān)提供概覽式情報(bào)資源的元數(shù)據(jù),包含序列碼(全局唯一序列碼)SerialCode、版本Version、標(biāo)題Title、時(shí)間Time、提供者ProviderInfo、資源屬性ResAttribute、當(dāng)前狀態(tài)CurrentState。
資源內(nèi)容元素,用于描述或標(biāo)識(shí)情報(bào)資源內(nèi)容和概要的信息元數(shù)據(jù),包含主題Subject、關(guān)鍵字KeyWord、摘要Abstract、用途Purpose、軍事來(lái)源Source、覆蓋范圍Coverage、自定義標(biāo)簽Tag、服務(wù)分類(lèi)ServiceClass。
安全認(rèn)證元素,對(duì)情報(bào)資源對(duì)象安全認(rèn)證方面描述的元數(shù)據(jù),包含安全等級(jí)SecurityLevel、授權(quán)信息AuthorizationInfo、信任度Reliability、分發(fā)控制DistrubuteControl和加密信息EncrpytionInfo。
訪(fǎng)問(wèn)操作元素,提供情報(bào)資源安全合法訪(fǎng)問(wèn)依據(jù)的元數(shù)據(jù),包含訪(fǎng)問(wèn)級(jí)別AccessLevel和訪(fǎng)問(wèn)位置AccesLocation。
3.3 雷達(dá)情報(bào)核心元數(shù)據(jù)描述
基于本體的軍事情報(bào)元數(shù)據(jù)主要用于規(guī)范數(shù)據(jù)的記錄,從而使數(shù)據(jù)管理和共享能統(tǒng)一標(biāo)準(zhǔn),提高情報(bào)的利用率。根據(jù)建立的情報(bào)核心元數(shù)據(jù)模板,記錄了一則雷達(dá)情報(bào)的描述文件。
地面雷達(dá)發(fā)現(xiàn)的概況:2007年8月8日6時(shí)37分,雷達(dá)x旅xx雷達(dá)站發(fā)現(xiàn)一批不明空情,當(dāng)日14時(shí)50分,目標(biāo)消失,歷時(shí)8 h13 min,總航程約810 km。期間先后升空5批次殲擊機(jī)對(duì)不明空情進(jìn)行攔截查證。
// 序列碼
//當(dāng)前版本
// 標(biāo)題
// 建立時(shí)間
// 更新時(shí)間
// 有效期
//提供者機(jī)構(gòu)
//提供者ID
//提供者IP
//提供者級(jí)別
//提供者所在區(qū)域
//資源類(lèi)型
<雷達(dá)特點(diǎn)>12個(gè)型號(hào)20部雷達(dá)發(fā)現(xiàn)目標(biāo)。包括三坐標(biāo)雷達(dá)、兩坐標(biāo)雷達(dá)和測(cè)高雷達(dá);頻段覆蓋包括米波雷達(dá)、L波段雷達(dá)、S波段雷達(dá)。多重覆蓋最大達(dá)到5重覆蓋。雷達(dá)特點(diǎn)>
<目標(biāo)航跡特點(diǎn)>航跡點(diǎn)連續(xù),航跡參數(shù)穩(wěn)定、速度約100km/h;暫消點(diǎn)較多;多重覆蓋雷達(dá)的定位點(diǎn)基本一致;目標(biāo)發(fā)現(xiàn)和消失的高度均在10 000m左右,整個(gè)航跡點(diǎn)上高度欺負(fù)變化小。目標(biāo)航跡特點(diǎn)>
//信任度
//分發(fā)控制
//加密信息
// 訪(fǎng)問(wèn)級(jí)別
// 訪(fǎng)問(wèn)位置
信息化戰(zhàn)爭(zhēng)對(duì)情報(bào)的需求比重越來(lái)越大,情報(bào)數(shù)量和種類(lèi)之多給用戶(hù)們帶來(lái)不小的挑戰(zhàn),本文在結(jié)合DC元數(shù)據(jù)和國(guó)內(nèi)外一些成熟的元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上,利用本體理論建立了基于本體的軍事情報(bào)元數(shù)據(jù)模型,這種元數(shù)據(jù)模型更加清楚明了地反映了情報(bào)資源所涵蓋的信息,使得用戶(hù)可直觀(guān)快速地判斷是否選擇情報(bào)資源。
[1] 張春景.信息系統(tǒng)元數(shù)據(jù)規(guī)范應(yīng)用研究[D].上海:華東師范大學(xué),2004.
[2] 趙軍.數(shù)據(jù)資源描述與組織的元數(shù)據(jù)方法[D].天津:天津大學(xué),2005.
[3] 張曉林.元數(shù)據(jù)研究與應(yīng)用[M].北京:北京圖書(shū)館出版社,2002.
[4] 王亞寧.基于本體的軍用元數(shù)據(jù)模型研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011(4):227-230.
[5] Studer R,Benjamins V R,Fensel D.Knowledge engineering,principles and methods[J].Data and Know ledge Engineering,1998,25(12):161-197.
[6] 黃宏斌.基于語(yǔ)義關(guān)系的××信息資源聚焦服務(wù)方法及關(guān)鍵技術(shù)研究[D].長(zhǎng)沙:國(guó)防科技大學(xué),2007.
[7] 陳鋒.軍事情報(bào)述論[J].軍事百科,2007(4):20-21.
[8] 徐坤.軍事情報(bào)元數(shù)據(jù)的多維索引技術(shù)研究[D].長(zhǎng)沙:國(guó)防科技大學(xué),2008.
[9] 吳建中.DC元數(shù)據(jù)[M].上海:上??茖W(xué)技術(shù)文獻(xiàn)出版社,2000.
[10]魏巍.ToIIS中情報(bào)信息服務(wù)描述和匹配技術(shù)研究[D].長(zhǎng)沙:國(guó)防科技大學(xué),2009.
[11]黃宏斌,劉震,鄧蘇,等.基于語(yǔ)義的信息聚焦服務(wù)[M].北京:電子工業(yè)出版社,2012.
Study of Ontology Based Military Intelligence Metadata Description
LI Yi-tong,HUANG Zi-jun,XIONG Jia-jun,WU Chang-fei
(Air Force Early Warning Academy,Wuhan 430019,China)
At present,military intelligence systems provide intelligence customization and distribution services according to intelligence specialty sorts,and intelligence share among different specialty systems is difficult because of no uniform description to intelligence resources.Based on the characteristics of metadata and military intelligence,this paper introduces the thought of ontology metadata into military intelligence description,establishes the metadata model for describing the military intelligence resource,presents the description frame of military intelligence metadata model based on ontology,which makes the intelligence resources be found,got,used and shared more easily.
ontology;metadata;military intelligence;metadata model
2015-04-23
TP311
A
CN32-1413(2015)04-0111-05
10.16426/j.cnki.jcdzdk.2015.04.028