摘要:目前對武器裝備試驗鑒定與試驗信息分析處理過程中產生的試驗文檔處理方法較落后,信息化程度不高,隨著電子靶場信息化建設的深入發(fā)展,如何對試驗文檔進行有效的信息處理是當前亟待解決的問題。針對這一問題,提出一種基于Web的方法。該方法通過定義武器裝備試驗文檔標準化模板、格式轉換、ID設置、文檔優(yōu)化等步驟實現在Web頁面上對不同格式的試驗文檔進行信息處理。提出的方法已經應用于武器綜合試驗信息系統(tǒng)中,取得了很好的應用效果。本文最后給出了實驗結果。
關鍵詞:標準化模板;信息處理;Web;武器裝備;試驗文檔
中圖分類號:TN91934文獻標識碼:A文章編號:1004373X(2012)18005303
引言
武器裝備能否在信息化戰(zhàn)爭中發(fā)揮效能,是部隊武器裝備研制中需要面對的現實問題。武器裝備在試驗、測試過程中信息的處理、傳遞、融合、共享程度對武器裝備的進一步研制、開發(fā)、生產起著至關重要的作用。現階段,武器裝備試驗電子靶場的信息化建設已經有很大發(fā)展,試驗數據資源的傳遞、融合、共享程度比較高,但是對試驗文檔信息的管理還停留在紙質作業(yè)、刻錄光盤、人工傳送或者郵件發(fā)送接收階段,沒有充分利用網絡資源,信息化程度不高,造成大量的“信息孤島”,嚴重阻礙武器裝備的研制、開發(fā)和生產。如何針對武器裝備試驗信息的特點實現基于Web的武器裝備試驗文檔綜合信息處理,將為武器裝備試驗鑒定與試驗信息分析處理提供較大的幫助,有效推動電子靶場信息化建設。
目前,文檔數據信息交互的方式主要有2種[14]:
(1)在Web頁面上對文檔信息進行處理。這種方式主要針對XML(eXtensibleMarkupLanguage)文檔,XML定義了清晰的結構和存儲機制并支持多種檢索方法,為半結構化數據提供了有效的通信、存儲和檢索的實現方法,具有數字簽名和多種加密的方法的特點,但是XML文檔不易存儲和顯示圖片、公式、圖形等數據信息。
(2)在本地計算機上對文檔信息進行處理。主要使用工具是Word、記事本等,其中Word以其對文字、圖片、公式、圖形等數據操作簡單,界面友好,保存格式多樣化,表現形式豐富等優(yōu)點尤為適合對武器裝備試驗信息進行處理與分析,由于包含在word文檔中大量的有用的數據僅能在Word環(huán)境中編輯與顯示,沒有語義信息,不適合數據查詢及數據交換,嚴重阻礙文檔信息的傳遞、融合、共享。
武器裝備試驗鑒定與試驗信息分析處理過程中要處理doc,xml,txt等多種格式試驗文檔,且在測試過程中要依托Web技術對這些試驗文檔信息進行處理、傳遞、融合和共享,從而得知以上兩種方式很難滿足這一需求。
本文提出一種基于Web的方法,通過武器裝備試驗文檔標準化、格式轉換、ID設置、文檔優(yōu)化等步驟實現在Web頁面上對不同格式的試驗文檔進行綜合信息處理。該方法充分融合上述兩種方式的優(yōu)點,將Web技術與Word應用程序聯系起來。本文提到的信息處理是指對文檔內容依據關鍵詞檢索、提取內容[]與重新合并提取的內容生成新文檔,新文檔可以在Word中瀏覽、操作。
1武器裝備試驗文檔標準化模板
武器裝備試驗文檔標準化模板是指依據試驗文檔的格式、內容、結構、層次、關鍵信息、解析粒度等因素定義一種結構規(guī)范的標準化文檔模板,滿足Web系統(tǒng)對文檔的自動識別、檢索、解析等要求。
本文充分利用XML語言的優(yōu)點[5],借鑒微軟公司的WordML格式,定義一種結構規(guī)范化的文檔作為武器裝備試驗文檔的標準化模板WXML(XMLforWord)。WXML是對WordML格式的修改和擴展,不僅可以被Word應用程序識別,同時能夠在Web上依據內容進行檢索。WXML文檔的組織結構如圖1所示。
根節(jié)點下包含2個子節(jié)點:docOleData節(jié)點用于記錄Word中操作的Ole對象,body節(jié)點用于記錄文檔的實際內容;sect節(jié)點記錄的是Word文檔中一個分節(jié)的內容;Content_Root為本文定義的節(jié)點,記錄了用戶轉換Word文檔的實際內容,其子節(jié)點樹結構與用戶定義的XML文檔結構類似;ContentNodeName節(jié)點記錄的是Word文檔章節(jié)名稱、ID號和關鍵詞,WordContent標簽下記錄的是WordML格式的章節(jié)內容片段。每個節(jié)點的屬性里面包含有父子關系屬性,可以根據需要添加子節(jié)點。
2武器裝備試驗文檔處理
2.1格式轉換
試驗文檔格式轉換的主要工作是對武器裝備試驗鑒定過程中產生的有關產品過程、測控資源、試驗組織等試驗文檔數據信息,其中包括總體方案、研制總要求、試驗大綱、實施方案和安全性分析等多種類型文檔進行深入分析,根據試驗文檔的內容、層次、特點等因素將試驗文檔轉換成標準化文檔WXML。由于文檔的組織方式和表現方式差別很大,不同格式的文檔只能用各自專用的閱讀器打開,并且不同格式文檔之間格式轉換很不方便,轉換過程中可能會丟失重要的格式信息。大部分文檔無法跨平臺應用,甚至有的文檔的不同版本之間都不兼容,因此為了實現對文檔內容信息的有效處理,必須進行文檔格式轉換[67]。
設待轉換的試驗文檔標題為Tittle,共包含NUM個章節(jié),章節(jié)標題為Charles[NUM],內容為Content,在轉換過程中docOleData節(jié)點記錄著操作文檔的對象,Tittle將轉換為Content_Root下的第一子節(jié)點。ContentNode的Name,ID屬性記錄著章節(jié)標題Charles[NUM]和ID,子節(jié)點數與章節(jié)個數NUM相同。WordContent節(jié)點是帶有WordML格式的內容片段。WordML記錄著圖片、公式、圖形的二進制碼,并且保留位置,大小,形狀的標簽屬性。
2.2ID設置
ID設置的主要工作是為每個試驗文檔、試驗文檔中每個章節(jié)節(jié)點定義ID。此ID是文檔與節(jié)點的身份標識,一能有效提高Web頁面上對試驗文檔綜合信息處理的效率。
在人際交互的過程中依據ID進行信息傳遞與對相關文檔進行信息處理。二是保證公式、圖片具有唯一編號。公式、圖片在試驗文檔中采用順序編號的方式,當多個含有公式、圖片的內容片段組合成新的WXML文檔時,可能會引起編號的重合,從而導致WXML文檔不能正確顯示。為避免該問題的發(fā)生,需要重新修改公式和圖片的編號。
2.3文檔優(yōu)化
標準化文檔WXML主要為樹形組織結構,然而樹形結構檢索效率較低,同時由于WXML文檔存儲了大量的公式、圖像等數據,極大降低了檢索效率。為提高檢索效率,需要對WXML文檔進行優(yōu)化,建立結構索引及標簽索引表。
結構索引是指刪除了WXML文檔所有文檔內容,僅保留樹形結構與節(jié)點標簽。結構索引仍為XML文檔組織,記錄著文檔的組織結構,主要作用一是提高解析WXML樹形組織結構的效率;二是在Web頁面上顯示文檔的結構視圖,實現Web頁面上的節(jié)點與節(jié)點內容的交互。
標簽索引表是指提取了文檔中所有用戶自定義的關鍵詞,并以一維線性表的形式進行組織。由關鍵詞構成的一維線性表檢準率高,速度快,有效提高WXML的檢索效率。
3信息處理的實現
由于武器裝備試驗鑒定與試驗信息分析處理過程中不僅需要關鍵數據更需要含有關鍵數據相關信息的整個章節(jié)段落,所以本文提及的信息處理主要工作是指對試驗文檔內容依據關鍵詞檢索,提取章節(jié)內容與重新合并提取的內容生成新的文檔。
本方法依托標準化模板WXML文檔和ID,將對語義豐富,內容各異,結構不一,存儲格式不同的武器裝備試驗文檔綜合信息處理方法的研究轉化為在Web環(huán)境下對結構規(guī)范的標準化模板WXML文檔進行信息檢索、提取與合并的方法研究,而對XML文檔內容信息進行檢索、提取與生成新文檔的技術已經非常成熟[811]。
具體方法如下:
(1)依據關鍵詞遍歷WXML文檔的一維標簽索引表,查詢符合條件的文檔;
(2)根據查詢結果文檔ID獲取結構索引;
(3)解析結構索引的樹形結構,以文檔結構圖的形式顯示在Web頁面上;
(4)提取人機交互選中的文檔結構圖節(jié)點,遍歷各選中節(jié)點,根據當前節(jié)點ID與名稱查詢WXML文檔,提取當前節(jié)點內容;
(5)將提取的各節(jié)點內容排列生成新的WXML文檔,完成一次檢索、提取和合并。
4實驗仿真
將本文提出的方法應用在武器綜合試驗信息系統(tǒng)中,對武器裝備試驗文檔內容信息處理進行了測試驗證。武器綜合試驗信息系統(tǒng)采用B/S結構,系統(tǒng)中含有大量不同格式和結構不一的試驗文檔,文檔中都不同程度的含有圖片、公式、表格,文字,圖形等對象。系統(tǒng)應用本文提出的方法后效果圖如圖2~圖4所示。
從以上效果圖可以看出,應用本文提出的方法后Web頁面上的文檔結構圖清楚、完整。信息處理后的新文檔可以在Word應用程序中進行操作,且保留了原始文檔格式,圖片、圖形、公式、表格等表達準確、完整、清晰。
在深入分析武器裝備試驗文檔特點的基礎上,本文提出了一種基于Web的武器裝備試驗文檔信息處理方法,并應用于武器綜合試驗信息系統(tǒng)的研究中,實現了對武器裝備系統(tǒng)試驗文檔綜合信息處理和資源共享,取得了良好的效果,為部隊武器裝備研制提供了較大幫助,對推動武器裝備試驗電子靶場的信息化建設起到了良好的促進作用。
參考文獻
[1]吳治宗.基于XML的文檔處理技術的研究與實現[D].大連:大連理工大學,2006.
[2]高軍,唐世渭.半結構化數據查詢與重寫[J].計算機研究與發(fā)展,2002,39(2):165171.
[3]WorldWideWebConsortium(W3C).XMLEncryptionRequirements[EB/OL].[20020311].http://www.w3.org/TR/xmlencryptionreq.