汪浩洋,吳 偉,向 超,唐 健,湯佳駿
(上海機(jī)電工程研究所,上海 201109)
隨著從數(shù)據(jù)中獲取知識(shí)的概念提出,以及信息化技術(shù)的發(fā)展,數(shù)據(jù)作為一種資源被廣泛重視并收集使用。武器裝備測(cè)試系統(tǒng)在信息化實(shí)踐過(guò)程中積累了大量的測(cè)試數(shù)據(jù),并隨著武器裝備的研制生產(chǎn),其規(guī)模越來(lái)越龐大。但人們更為關(guān)注數(shù)據(jù)背后蘊(yùn)含的、能有效指導(dǎo)實(shí)踐的知識(shí),這意味需要對(duì)海量數(shù)據(jù)進(jìn)行挖掘分析,提煉出有價(jià)值的信息?;A(chǔ)的數(shù)據(jù)存儲(chǔ)以及管理方式雖然統(tǒng)籌存儲(chǔ)數(shù)據(jù),解決了數(shù)據(jù)孤島問(wèn)題,但難以滿足大規(guī)模的數(shù)據(jù)挖掘處理以及復(fù)雜分析的需求,因此需要構(gòu)建一套高效便捷的數(shù)據(jù)管理架構(gòu)。
在數(shù)據(jù)采集、存儲(chǔ)、應(yīng)用的全過(guò)程中,形成了多種優(yōu)化方法以提高實(shí)際效率。文獻(xiàn)[1-2]對(duì)數(shù)據(jù)倉(cāng)庫(kù)抽取、轉(zhuǎn)換以及加載數(shù)據(jù)的功能過(guò)程進(jìn)行了梳理,優(yōu)化了任務(wù)調(diào)度策略,在軍備保障以及政務(wù)數(shù)據(jù)存儲(chǔ)中得到了良好的運(yùn)用。文獻(xiàn)[3-9]則是構(gòu)建了數(shù)據(jù)立方體模型,利用其易與聯(lián)機(jī)實(shí)時(shí)分析方法(On Line Transaction Processing,OLAP)結(jié)合的優(yōu)點(diǎn)實(shí)現(xiàn)數(shù)據(jù)處理過(guò)程的優(yōu)化。文獻(xiàn)[3]與文獻(xiàn)[4]將數(shù)據(jù)立方體模型與政區(qū)地圖相結(jié)合,實(shí)現(xiàn)了不同地區(qū)維度、不同統(tǒng)計(jì)方向下的數(shù)據(jù)統(tǒng)籌分析。文獻(xiàn)[7]介紹了數(shù)據(jù)立方體在港口環(huán)境下的實(shí)際應(yīng)用,總結(jié)了數(shù)據(jù)立方體的構(gòu)造以及軟件實(shí)現(xiàn),運(yùn)用實(shí)際數(shù)據(jù)進(jìn)行了測(cè)試驗(yàn)證,保證了數(shù)據(jù)立方體的有效性。在文獻(xiàn)[8]對(duì)犯罪預(yù)防分析與文獻(xiàn)[9]對(duì)輿情監(jiān)測(cè)分析中,數(shù)據(jù)立方體模型起到了強(qiáng)力支撐作用,為復(fù)雜多要素情境提供多維度分析視角。文獻(xiàn)[10]將文本概念加入數(shù)據(jù)立方體,形成更豐富的應(yīng)用環(huán)境;文獻(xiàn)[11]與文獻(xiàn)[12]則是將流數(shù)據(jù)與數(shù)據(jù)立方體結(jié)合,提出基于流數(shù)據(jù)的概要數(shù)據(jù)立方體,極大提高了索引效率。文獻(xiàn)[13-14]提出了有向圖方法對(duì)數(shù)據(jù)立方體進(jìn)行詳細(xì)描述;文獻(xiàn)[15-16]分別就緊湊、封閉等數(shù)據(jù)立方體細(xì)分領(lǐng)域進(jìn)行深入研究,提升數(shù)據(jù)立方體的數(shù)據(jù)查詢效率。
本文根據(jù)國(guó)內(nèi)外研究及應(yīng)用成果,將數(shù)據(jù)立方體概念引入到武器裝備測(cè)控領(lǐng)域,分析了數(shù)據(jù)立方體的設(shè)計(jì)思路,依據(jù)裝備測(cè)試數(shù)據(jù)的特點(diǎn)構(gòu)建裝備測(cè)試數(shù)據(jù)的數(shù)據(jù)立方體模型,在不同維度上實(shí)現(xiàn)對(duì)測(cè)試數(shù)據(jù)的觀測(cè),為之后的數(shù)據(jù)分析工作提供良好的數(shù)據(jù)交換平臺(tái)。
自Codd.E.F在20世紀(jì)70年代提出關(guān)系型數(shù)據(jù)模式以來(lái)[17],關(guān)系型數(shù)據(jù)庫(kù)以其結(jié)構(gòu)簡(jiǎn)單清晰、易于維護(hù)等優(yōu)點(diǎn)得以快速發(fā)展。數(shù)據(jù)立方體是多維數(shù)據(jù)模型的一種具體表現(xiàn)形式,是基于關(guān)系數(shù)據(jù)庫(kù)的一類多維矩陣,能夠多維度展示數(shù)據(jù),給用戶提供多個(gè)觀測(cè)和分析數(shù)據(jù)的視角[18-19]。數(shù)據(jù)立方體是對(duì)基本事件的屬性、度量值以及它們之間關(guān)聯(lián)的表現(xiàn)形式進(jìn)行重構(gòu)得到的,由維和事實(shí)定義。維是事實(shí)信息的屬性,至少包含維碼、維層次、維成員等基本屬性,由維的基本屬性構(gòu)成的與之相關(guān)聯(lián)的表稱為維表。事實(shí)是數(shù)值度量的,事實(shí)表包括事實(shí)的名稱或度量,以及每個(gè)相關(guān)維表的維碼。
從名稱上看,數(shù)據(jù)立方體容易被理解是三維結(jié)構(gòu),但實(shí)際上它可以由n維構(gòu)成,立方體是對(duì)多維數(shù)據(jù)存儲(chǔ)的一種比喻。多維數(shù)據(jù)模型圍繞中心主題組織構(gòu)建,不同視角分析數(shù)據(jù)的實(shí)際需求以及主題所關(guān)聯(lián)的特性決定數(shù)據(jù)立方體的維度。也即是說(shuō),我們可以根據(jù)實(shí)際的分析需求對(duì)構(gòu)成數(shù)據(jù)立方體的維度進(jìn)行增減,優(yōu)化數(shù)據(jù)結(jié)構(gòu),例如微軟曾構(gòu)建過(guò)高達(dá)64維的多維數(shù)據(jù)模型。顯然,這是多維數(shù)據(jù)模型面向主題構(gòu)建特性的體現(xiàn)。圖1展示了圍繞武器裝備試驗(yàn)次數(shù)構(gòu)建的數(shù)據(jù)立方體模型,該數(shù)據(jù)立方體提供時(shí)間、地點(diǎn)、裝備試驗(yàn)次數(shù)3個(gè)數(shù)據(jù)分析視角,若想要分析不同環(huán)境下的試驗(yàn)次數(shù),則需設(shè)計(jì)一個(gè)環(huán)境維度重新構(gòu)造數(shù)據(jù)立方體模型。
圖1 三維數(shù)據(jù)立方體示意圖
數(shù)據(jù)立方體是一個(gè)概念模型,它與物理模型的映射關(guān)系是通過(guò)確定維度以及維度內(nèi)的成員、粒度、層次等要素來(lái)實(shí)現(xiàn)的。維度成員是構(gòu)成維的基本單位,對(duì)應(yīng)著該維的一個(gè)取值,例如對(duì)于時(shí)間維,第一季度是它的一個(gè)維成員。粒度是一個(gè)維度內(nèi)為提供詳細(xì)分類信息而定義的劃分單位。粒度越粗表示細(xì)節(jié)程度越低、綜合程度越高;粒度越細(xì)表示細(xì)節(jié)程度越高、分類信息越詳實(shí)。信息詳實(shí)程度往往與數(shù)據(jù)總量呈正相關(guān),即信息越詳實(shí),數(shù)據(jù)規(guī)模越龐大。因此在資源有限的情況下,需要進(jìn)行合理的粒度劃分,優(yōu)化數(shù)據(jù)結(jié)構(gòu),提高查詢分析效率。粒度的粗細(xì)對(duì)應(yīng)不同的級(jí)別,級(jí)別組成維度的層次結(jié)構(gòu)。對(duì)于時(shí)間維的一個(gè)層次結(jié)構(gòu){年,半年,季}而言,年是第一級(jí)別,半年是第二級(jí)別,季是第三級(jí)別,這些級(jí)別間存在著“父子”包含關(guān)系。需要注意的是,同一維度內(nèi)可以存在多個(gè)層次結(jié)構(gòu),例如時(shí)間維內(nèi)可以有{年,半年,季,月}的層次結(jié)構(gòu),也可以有{年,月,日}的層次結(jié)構(gòu)。
各維度的維成員在數(shù)據(jù)立方體內(nèi)唯一邏輯標(biāo)識(shí)確定的單位稱為數(shù)據(jù)格,該數(shù)據(jù)格存放聚集值。由所有維度最低級(jí)別的維成員確定的數(shù)據(jù)格稱為基本格,也稱基本方體;最高級(jí)別的維成員所確定的數(shù)據(jù)格稱為頂點(diǎn)方體;高層次級(jí)別的數(shù)據(jù)格聚集值由低層次數(shù)據(jù)格匯聚得到。在圖1中時(shí)間維度的“9月”成員、地點(diǎn)維度的“上?!背蓡T以及武器裝備型號(hào)維度的“A型裝備”成員所唯一確定的方體存儲(chǔ)的量值為9,即是說(shuō)在9月份上海有9次A型裝備試驗(yàn)。
在數(shù)據(jù)立方體中并非每個(gè)方體內(nèi)都包含量值,不具備任何信息的方體被稱為空方體??辗襟w不同于量值為0的方體,它通常是數(shù)據(jù)缺失或其他異常情況導(dǎo)致的,需要被特定標(biāo)識(shí)。數(shù)據(jù)立方體中的空數(shù)據(jù)格作為一種特殊的數(shù)據(jù)格,體現(xiàn)了數(shù)據(jù)立方體模型的稀疏性,用基本空方體數(shù)與數(shù)據(jù)立方體的基本方體總數(shù)的比值來(lái)衡量稀疏性程度。空方體的這種特殊性會(huì)導(dǎo)致數(shù)值矩陣計(jì)算難以進(jìn)行,所以在實(shí)際操作中忽略空數(shù)據(jù)格是一個(gè)不錯(cuò)的選擇。
最初的關(guān)系型數(shù)據(jù)庫(kù)設(shè)計(jì)應(yīng)用實(shí)體-聯(lián)系數(shù)據(jù)模型,通過(guò)鍵碼連接二維數(shù)據(jù)表實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)檢索[20]。這種關(guān)系模型在查詢時(shí)通過(guò)鍵值跳轉(zhuǎn)查詢,對(duì)數(shù)據(jù)的全局展示較差,并不利于數(shù)據(jù)的多維分析,也不適用于聯(lián)機(jī)分析處理。目前較為常用的數(shù)據(jù)倉(cāng)庫(kù)模型是多維數(shù)據(jù)模型,主要有星形模型、雪花模型及事實(shí)星座模型3種樣式。
星形模式數(shù)據(jù)庫(kù)包括一個(gè)中心事實(shí)表與一組附屬維表兩大部分,各維表連接到一個(gè)大的中心事實(shí)表上,其連接圖形如星形。在該模型下,中心事實(shí)表包含事實(shí)數(shù)據(jù)信息以及各個(gè)維表的維碼,并且不含冗余項(xiàng);維表數(shù)量與事實(shí)表中的維碼相對(duì)應(yīng),每個(gè)維表僅包含一組屬性。圖2為武器裝備測(cè)試數(shù)據(jù)的星形模型展開。
圖2 武器裝備測(cè)試數(shù)據(jù)的星形模型表示
雪花模型和事實(shí)星座模型都能夠由星形模型衍化而來(lái),可以看做是星形模型的特殊形式。雪花模型是在星形模式的基礎(chǔ)上,將某些維表進(jìn)行規(guī)范化處理,將數(shù)據(jù)進(jìn)一步分解到附加表中得到的。相比于星形模式,雪花模式的優(yōu)點(diǎn)在于某些維表是規(guī)范化的形式,易于維護(hù),并且節(jié)省了存儲(chǔ)空間。不足之處在于規(guī)范附加維表后,執(zhí)行查詢需要更多的連接操作,帶來(lái)瀏覽效率的降低,可能會(huì)影響系統(tǒng)的性能。因此,盡管雪花模式有一些優(yōu)點(diǎn),適用于一些特定的場(chǎng)合,比如地址的規(guī)范,但是在多維數(shù)據(jù)模型中星形模型應(yīng)用更廣泛。
事實(shí)星座模型是將多個(gè)關(guān)聯(lián)的星形模型合并相同維表得到的。在實(shí)際的復(fù)雜應(yīng)用情景中,存在有多個(gè)事實(shí)表相互關(guān)聯(lián),表現(xiàn)為部分維表相同的情況,有多個(gè)中心事實(shí)表而共用相同維表的模型稱為事實(shí)星座模型。
數(shù)據(jù)立方體的構(gòu)建需要分析實(shí)際應(yīng)用場(chǎng)景,確定實(shí)際需求,從而明確數(shù)據(jù)倉(cāng)庫(kù)的主題,而后依據(jù)中心主題進(jìn)行數(shù)據(jù)立方體設(shè)計(jì)。本節(jié)首先分析武器裝備測(cè)試系統(tǒng)的實(shí)際需求,明確維度數(shù)量、維度間的關(guān)系以及各維度的層次結(jié)構(gòu),之后運(yùn)用概念模型、邏輯模型以及物理模型三級(jí)數(shù)據(jù)模型方法實(shí)現(xiàn)數(shù)據(jù)立方體的構(gòu)建。
武器裝備測(cè)試系統(tǒng)管理人員最關(guān)注武器裝備生產(chǎn)質(zhì)量是否合格,最關(guān)注的參數(shù)是武器裝備的測(cè)試參數(shù)指標(biāo)。由其研制過(guò)程來(lái)看,數(shù)據(jù)來(lái)源包括原理樣機(jī)測(cè)試數(shù)據(jù)、工程樣機(jī)測(cè)試數(shù)據(jù)以及定型測(cè)試數(shù)據(jù),涵蓋了設(shè)計(jì)、定型、生產(chǎn)的各階段。因此可以以測(cè)試質(zhì)量分析為中心主題構(gòu)建一個(gè)數(shù)據(jù)立方體模型。但在實(shí)際操作過(guò)程中,由于武器裝備系統(tǒng)的復(fù)雜性以及各層次管理人員的不同分工管理,單一的測(cè)試數(shù)據(jù)中心主題不足以滿足實(shí)際需求。頂層設(shè)計(jì)人員需要從宏觀把控武器裝備型號(hào)立項(xiàng),掌握全局信息,確定發(fā)展方向;中層管理人員需要確定測(cè)試項(xiàng)目及指標(biāo)設(shè)計(jì)是否合理,從原理設(shè)計(jì)方面對(duì)其進(jìn)行試驗(yàn)驗(yàn)證;技術(shù)操作人員需要檢驗(yàn)生產(chǎn)質(zhì)量,依據(jù)測(cè)試數(shù)據(jù)進(jìn)行判讀分析;配套方單獨(dú)提供配套信息。因此在結(jié)合各方需求后,基本可以確定4個(gè)中心主題:武器裝備設(shè)計(jì)分析、武器裝備測(cè)試項(xiàng)目分析、武器裝備測(cè)試數(shù)據(jù)分析以及配套信息分析。由此,確定武器裝備測(cè)試數(shù)據(jù)立方體采用事實(shí)星座模式,由多個(gè)事實(shí)中心及其配套維表組成。事實(shí)星座模型設(shè)計(jì)可由多個(gè)星形模式合并相同維表得來(lái),因此在下文分析中僅以武器裝備測(cè)試數(shù)據(jù)分析的星形模式為例分析數(shù)據(jù)立方體的構(gòu)建方法及步驟,在此基礎(chǔ)上容易得到事實(shí)星座模式構(gòu)建方法。
概念模型設(shè)計(jì)是在較高抽象層次上的設(shè)計(jì),它面向武器裝備測(cè)試系統(tǒng)全局建立,為數(shù)據(jù)立方體的整體構(gòu)建提供了全局的概念視圖。一方面,數(shù)據(jù)立方體是對(duì)武器裝備測(cè)試系統(tǒng)的歷史數(shù)據(jù)進(jìn)行集成和整合而組成的數(shù)據(jù)大集合,需要充分考慮使用者的功能需求;另一方面,需要對(duì)武器裝備測(cè)試系統(tǒng)的數(shù)據(jù)內(nèi)容及其特性有深入而清晰的理解,才能有針對(duì)性地設(shè)計(jì)完整方案。分析數(shù)據(jù)特性以及功能需求后,通過(guò)確定系統(tǒng)邊界和定義主題域來(lái)反映數(shù)據(jù)倉(cāng)庫(kù)的概念模型。
武器裝備測(cè)試數(shù)據(jù)分析主題的需求是有效判別武器裝備生產(chǎn)質(zhì)量,數(shù)據(jù)來(lái)源是測(cè)試數(shù)據(jù)信息。經(jīng)過(guò)分析可以得到感興趣的分析視角,確定維度信息,即時(shí)間維度、武器裝備編號(hào)維度、測(cè)試種類維度、測(cè)試環(huán)境維度。時(shí)間維度中劃分年、月、日3個(gè)粒度級(jí)別;武器裝備編號(hào)維度中劃分型號(hào)、批次、編號(hào)3個(gè)粒度級(jí)別;測(cè)試總類維度中劃分全彈測(cè)試、艙段測(cè)試、單機(jī)測(cè)試3個(gè)粒度級(jí)別;測(cè)試環(huán)境維度中信息較為繁雜,并沒(méi)有明顯的“父子”包含關(guān)系,多以并列關(guān)系存在。圖3展示了武器裝備編號(hào)維度的詳細(xì)層次結(jié)構(gòu)關(guān)系。
圖3 武器裝備編號(hào)維度的層次結(jié)構(gòu)
考慮多維數(shù)據(jù)模型的多維特性,超出三維的數(shù)據(jù)模型無(wú)法有效展現(xiàn),本文采用信息包圖表示多維數(shù)據(jù)。信息包圖采用二維表格的形式表示多維數(shù)據(jù),它有3個(gè)重要對(duì)象:維度、粒度和指標(biāo)對(duì)象。根據(jù)上文的分析,詳細(xì)確定了武器裝備測(cè)試數(shù)據(jù)分析主題的維度以及粒度層次信息;指標(biāo)對(duì)象信息是實(shí)際度量值,在武器裝備測(cè)試主題中包括測(cè)試數(shù)據(jù)以及成功子樣。將各確定的維度對(duì)象、粒度對(duì)象以及指標(biāo)對(duì)象信息匯總后,以信息打包的方式得到信息包圖,如圖4所示。
圖4 武器裝備測(cè)試數(shù)據(jù)信息包圖
邏輯模型是從概念模型到物理模型轉(zhuǎn)化的中間步驟。按照概念模型階段構(gòu)建的基本對(duì)應(yīng)關(guān)系,以及選定的數(shù)據(jù)模型形式要求,將概念模型轉(zhuǎn)化為相應(yīng)的邏輯模型。這一階段的目的是確定各主題中包含的實(shí)體、各實(shí)體間的關(guān)聯(lián)關(guān)系是什么以及實(shí)體間是否有約束關(guān)系。按照轉(zhuǎn)換規(guī)則以及目的,武器裝備測(cè)試數(shù)據(jù)分析主題確定指標(biāo)實(shí)體以及維度實(shí)體兩類實(shí)體。首先需要定義指標(biāo)實(shí)體以及維度實(shí)體,其次是建立兩者間的聯(lián)系。指標(biāo)實(shí)體包括數(shù)據(jù)指標(biāo)和邏輯指標(biāo),數(shù)據(jù)指標(biāo)即是主題域中所包含的數(shù)據(jù),可以由信息包圖的指標(biāo)對(duì)象構(gòu)成;邏輯指標(biāo)是指區(qū)分?jǐn)?shù)據(jù)的邏輯關(guān)系,可以由各維度的最低級(jí)別類別構(gòu)成,得到唯一確定的邏輯標(biāo)識(shí)。這樣得到的數(shù)據(jù)與邏輯指標(biāo)共同構(gòu)成了星型圖的指標(biāo)實(shí)體。維度實(shí)體由各維度的各層次對(duì)象構(gòu)成,例如時(shí)間維度的維度實(shí)體為{年,月,日}。
指標(biāo)實(shí)體包含維度實(shí)體的最低類別成員,因此指標(biāo)實(shí)體與維度實(shí)體之間的關(guān)系可以通過(guò)邏輯模型中的詳細(xì)類別定義,實(shí)現(xiàn)一一對(duì)應(yīng)的關(guān)系。在星型圖中,每個(gè)維度實(shí)體通過(guò)最底層的詳細(xì)類別實(shí)體和指標(biāo)實(shí)體進(jìn)行連接。由此構(gòu)建得到星型圖模型,如圖5所示。
圖5 武器裝備測(cè)試星型圖
物理模型是根據(jù)邏輯模型的設(shè)計(jì)內(nèi)容,在實(shí)際的物理具體介質(zhì)上實(shí)現(xiàn)出來(lái)。物理模型階段不僅需要建立物理結(jié)構(gòu)模型,而且需要規(guī)定數(shù)據(jù)標(biāo)準(zhǔn),明確實(shí)具體特征,以便于在物理介質(zhì)上進(jìn)行具體操作。定義數(shù)據(jù)標(biāo)準(zhǔn)包括命名約定、數(shù)據(jù)類型、約束、索引等方面;實(shí)體特征包括值的類型、存儲(chǔ)長(zhǎng)度等方面信息。
在得到的星型圖基礎(chǔ)上,要綜合考慮數(shù)據(jù)立方體模型中事實(shí)表與維度表的實(shí)體構(gòu)建,以及它們之間的各種約束關(guān)系。根據(jù)邏輯設(shè)計(jì)的星型圖,將指標(biāo)實(shí)體轉(zhuǎn)化為中心事實(shí)表,將維度實(shí)體轉(zhuǎn)化為維度表。事實(shí)表中不僅僅包含數(shù)據(jù)的指標(biāo)量,還要包含維度實(shí)體中約定的主碼值,通過(guò)包含的主碼與維表的外碼構(gòu)建事實(shí)表與維表之間的連接,因此主碼與外碼鍵值關(guān)系必須一一對(duì)應(yīng)。即是說(shuō)事實(shí)表中包含兩部分,一部分是與之連接的維表主碼值,另一部分是事實(shí)數(shù)據(jù)的量值。維表包含定義的外碼以及對(duì)應(yīng)的一組維屬性。
在武器裝備測(cè)試數(shù)據(jù)分析主題中,事實(shí)表包含時(shí)間標(biāo)識(shí)、編號(hào)標(biāo)識(shí)、測(cè)試標(biāo)識(shí)以及環(huán)境標(biāo)識(shí)共同構(gòu)成的組合維碼,以及測(cè)試指標(biāo)數(shù)據(jù)和成功子樣的度量值信息。同時(shí),事實(shí)表中還含有數(shù)據(jù)類型等約定規(guī)范信息,其具體的表結(jié)構(gòu)如表1所示。
表1 武器裝備測(cè)試事實(shí)表
每個(gè)維都有與之對(duì)應(yīng)的維表,它展現(xiàn)了維度的外碼鍵值、粒度級(jí)別信息以及約束信息。以武器裝備編號(hào)維度為例,維表包含了編號(hào)標(biāo)識(shí)、{型號(hào)、批次、編號(hào)}等層次信息以及儲(chǔ)存類型、數(shù)值長(zhǎng)度等約束信息,具體表結(jié)構(gòu)如表2所示。
表2 武器裝備編號(hào)維度表
本文實(shí)驗(yàn)數(shù)據(jù)來(lái)源于歷史儲(chǔ)存的裝備測(cè)試數(shù)據(jù)。該數(shù)據(jù)集中每一條數(shù)據(jù)樣本都有測(cè)試裝備信息,該裝備測(cè)試的時(shí)間、環(huán)境等輔助信息,反映不同測(cè)試類別的測(cè)試種類信息,以及反映裝備狀態(tài)的測(cè)試數(shù)據(jù)組成。在武器裝備測(cè)試數(shù)據(jù)管理平臺(tái)中,數(shù)據(jù)立方體配合聯(lián)機(jī)分析方法采用多維分析技術(shù),實(shí)現(xiàn)數(shù)據(jù)的高效整合分析,并可在前端界面進(jìn)行表格化展示。
數(shù)據(jù)立方體的多維分析技術(shù)是在構(gòu)建的數(shù)據(jù)立方體框架內(nèi)對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換、整合分析,其具體的操作主要包括切塊、切片、下鉆、上卷以及旋轉(zhuǎn)。切片以及切塊操作是選擇特定目標(biāo)數(shù)據(jù)進(jìn)行查詢分析,下鉆與上卷操作是依據(jù)層次結(jié)構(gòu)進(jìn)行數(shù)據(jù)整合分析,旋轉(zhuǎn)操作是從不同方向研究指標(biāo)數(shù)據(jù)在維上的分布。
圖6(a)展示了裝備編號(hào)維在下鉆操作下的前端顯示,圖6(b)展示了數(shù)據(jù)立方體在切塊操作下對(duì)特定區(qū)域數(shù)據(jù)的查詢顯示??梢钥闯?,裝備編號(hào)維的下鉆操作是依照設(shè)定的層次結(jié)構(gòu)依次向下進(jìn)行的,體現(xiàn)了數(shù)據(jù)的從屬關(guān)系,能夠有效地在總體與細(xì)節(jié)上觀測(cè)數(shù)據(jù);對(duì)數(shù)據(jù)立方體進(jìn)行切塊查詢操作,選擇出需要的數(shù)據(jù)對(duì)象,能夠精細(xì)地整合數(shù)據(jù),聚合同一類型的數(shù)據(jù)對(duì)象,為數(shù)據(jù)分析提供了現(xiàn)實(shí)數(shù)據(jù)基礎(chǔ)。
圖6 結(jié)果顯示
試驗(yàn)結(jié)果分析發(fā)現(xiàn),相較于表格存儲(chǔ),對(duì)數(shù)據(jù)進(jìn)行重構(gòu)得到的數(shù)據(jù)立方體模型擁有更好的數(shù)據(jù)組織整合能力,能夠體現(xiàn)設(shè)計(jì)要求,提供多維度觀測(cè)分析的視角,實(shí)現(xiàn)了數(shù)據(jù)靈活精細(xì)地組織整合,滿足了數(shù)據(jù)查詢與分析的需求,為之后的數(shù)據(jù)挖掘提供了良好的數(shù)據(jù)基礎(chǔ)平臺(tái)。
龐大的數(shù)據(jù)規(guī)模以及精細(xì)化管控目標(biāo)不僅要求采用合適的數(shù)據(jù)分析方法得到有價(jià)值的知識(shí),而且需要對(duì)數(shù)據(jù)進(jìn)行更深入的挖掘,更全面的分析。本文采用數(shù)據(jù)立方體模型建立了層次和級(jí)別表達(dá)機(jī)制,以及多維視角的數(shù)據(jù)觀測(cè)模式,能夠有效地支撐數(shù)據(jù)的多維度分析挖掘需求。依照三級(jí)數(shù)據(jù)模型設(shè)計(jì)方法,詳細(xì)介紹了武器裝備測(cè)試數(shù)據(jù)立方體的構(gòu)建過(guò)程,具有可操作性。數(shù)據(jù)立方體存儲(chǔ)模型既能夠?qū)崿F(xiàn)在時(shí)間、裝備編號(hào)等維度的統(tǒng)計(jì)分析,又能在型號(hào)、批次等粒度層面實(shí)現(xiàn)橫向?qū)Ρ确治?,支持全方位、多視角的?shù)據(jù)觀測(cè),有利于展開綜合性對(duì)比關(guān)聯(lián)分析。