亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于關(guān)聯(lián)數(shù)據(jù)的企業(yè)數(shù)據(jù)治理可視化框架研究

        2021-06-07 08:08:13陳氫劉文梅
        現(xiàn)代情報 2021年6期
        關(guān)鍵詞:企業(yè)

        陳氫 劉文梅

        關(guān)鍵詞:關(guān)聯(lián)數(shù)據(jù);企業(yè);數(shù)據(jù)治理:數(shù)據(jù)可視化

        隨著社會信息化技術(shù)的不斷發(fā)展,數(shù)據(jù)已逐漸成為企業(yè)經(jīng)營發(fā)展的核心資產(chǎn)。激烈的商業(yè)競爭環(huán)境使得企業(yè)更加專注于自身所產(chǎn)生的數(shù)據(jù)。數(shù)據(jù)是企業(yè)分析與決策的重要基礎(chǔ).其數(shù)據(jù)質(zhì)量直接影響到數(shù)據(jù)分析的結(jié)果,進而決定企業(yè)的商業(yè)決策。為了減輕低數(shù)據(jù)質(zhì)量、可視化工具缺乏以及數(shù)據(jù)基本屬性所帶來的風險,實現(xiàn)對已有數(shù)據(jù)的最大利用度,企業(yè)必須建立數(shù)據(jù)治理框架。數(shù)據(jù)治理是確保整個企業(yè)重要數(shù)據(jù)資產(chǎn)被正式化管理的重要手段。它不僅能保障數(shù)據(jù)的可靠性,還可確定誰應為低數(shù)據(jù)質(zhì)量產(chǎn)生的不良后果負責。企業(yè)數(shù)據(jù)治理作為數(shù)據(jù)資產(chǎn)發(fā)揮價值的前提與基礎(chǔ),能夠保障數(shù)據(jù)以及決策質(zhì)量,有效提升企業(yè)數(shù)據(jù)治理的能力。

        強化企業(yè)數(shù)據(jù)最大程度可視化是數(shù)據(jù)治理的關(guān)鍵組成部分。傳統(tǒng)的集中式管理方式已不再適用復雜化的組織結(jié)構(gòu),單一的管理者會使企業(yè)錯過捕獲和糾正信心的幾率更高。為了實現(xiàn)對企業(yè)數(shù)據(jù)資產(chǎn)更有效的治理,組織必須對描述、創(chuàng)建、格式、轉(zhuǎn)換、移動和管理的信息進行全面控制,從根本上提升企業(yè)數(shù)據(jù)治理的能力。因此,本文主要借助本體、關(guān)聯(lián)數(shù)據(jù)以及Protege工具,實現(xiàn)企業(yè)數(shù)據(jù)全局可視化。通過賦予組織成員不同的權(quán)限與責任,實現(xiàn)對數(shù)據(jù)共享最大化,從而改善企業(yè)數(shù)據(jù)治理水平,以提升企業(yè)數(shù)據(jù)質(zhì)量。與此同時,本文還制定了模型更新策略、數(shù)據(jù)傳輸捕獲策略和數(shù)據(jù)可視化查詢方法,為企業(yè)數(shù)據(jù)治理的實施提供了可操作指導。

        1相關(guān)研究

        1.1數(shù)據(jù)治理

        數(shù)據(jù)治理作為社會信息化的產(chǎn)物,表明數(shù)據(jù)從排他性到共享,從封閉到開放。相對于信息,數(shù)據(jù)具有不同的特征,產(chǎn)生了新的治理需求,并推動了傳統(tǒng)信息管理模式的變革。目前國內(nèi)外學者對于數(shù)據(jù)治理的相關(guān)研究也甚多。

        數(shù)據(jù)治理是一門集人員、工具及相關(guān)管理工作流程于一體的學科,表明當事人擁有決策權(quán)并對組織數(shù)據(jù)資產(chǎn)決策負責。DAMA(國際數(shù)據(jù)管理協(xié)會)把數(shù)據(jù)治理定義為通過對數(shù)據(jù)和信息進行組織與管理,實現(xiàn)對數(shù)據(jù)資產(chǎn)的控制與使用;在企業(yè)數(shù)據(jù)管理過程中.數(shù)據(jù)治理則是通過對決策權(quán)和職責的分配,以實現(xiàn)企業(yè)數(shù)據(jù)資產(chǎn)價值最大化;而依托于數(shù)據(jù)治理的目標.數(shù)據(jù)治理則被定義為通過規(guī)范數(shù)據(jù)標準、簡化數(shù)據(jù)內(nèi)容、制定數(shù)據(jù)質(zhì)量標準等,使得數(shù)據(jù)管理思路清晰,以構(gòu)建良好數(shù)據(jù)體系,獲得高質(zhì)量數(shù)據(jù);依托于數(shù)據(jù)治理領(lǐng)域,數(shù)據(jù)治理是聚焦于數(shù)據(jù)來源、質(zhì)量、隱私安全、責任等關(guān)鍵領(lǐng)域,其重點在于保護數(shù)據(jù)信息與挖掘數(shù)據(jù)價值,以免受數(shù)據(jù)安全隱患,進而保障數(shù)據(jù)的準確性、完整性、安全性以及真實性,從而實現(xiàn)數(shù)據(jù)的高度共享。

        數(shù)據(jù)治理的價值體現(xiàn)在保障數(shù)據(jù)質(zhì)量、改善數(shù)據(jù)報告可信度、減少低數(shù)據(jù)質(zhì)量帶來的成本、保證不違反制度規(guī)則、提升數(shù)據(jù)使用者的滿意度以及改善企業(yè)市場地位等方面的價值:在一定程度上可保障數(shù)據(jù)質(zhì)量,從而盡可能規(guī)避低數(shù)據(jù)質(zhì)量在數(shù)據(jù)檢測和更正過程中帶來的大量時間與運營成本的浪費,以及造成數(shù)據(jù)決策無效和數(shù)據(jù)預測結(jié)果錯誤等問題;提高了數(shù)據(jù)透明度,保障了數(shù)據(jù)質(zhì)量以及增強了數(shù)據(jù)的規(guī)范性和利用率:數(shù)據(jù)治理是保障數(shù)據(jù)質(zhì)量的關(guān)鍵,其價值在于保障數(shù)據(jù)的準確性、安全性以及易用性,以實現(xiàn)數(shù)據(jù)合規(guī)使用與適度分享。也有學者對數(shù)據(jù)質(zhì)量、數(shù)據(jù)隱私、數(shù)據(jù)共享等方面進行研究,提出了大數(shù)據(jù)時代數(shù)據(jù)治理能力和數(shù)據(jù)素養(yǎng)等能力已逐漸成為企業(yè)的核心競爭力??梢?,數(shù)據(jù)治理對于企業(yè)的經(jīng)營發(fā)展具有重要意義。

        數(shù)據(jù)管理活動與數(shù)據(jù)治理緊密相關(guān)。數(shù)據(jù)管理需了解企業(yè)當前及未來需求.并使得數(shù)據(jù)在支撐管理活動中實用且高效。通過數(shù)據(jù)治理,數(shù)據(jù)管理能有效地支持和執(zhí)行企業(yè)戰(zhàn)略目標。在數(shù)據(jù)治理的基礎(chǔ)上,建立一個企業(yè)數(shù)據(jù)全局可視化圖是非常有必要的。通過清晰認識企業(yè)數(shù)據(jù)可視化圖,以便正確地管理和治理企業(yè)數(shù)據(jù)資產(chǎn)。

        1.2數(shù)據(jù)可視化

        數(shù)據(jù)可視化是信息技術(shù)領(lǐng)域一個不斷發(fā)展的跨學科技術(shù),其目的是通過圖像等方式將抽象且無序的數(shù)據(jù)以一種易于理解的形式匯集起來??梢暬訌娬{(diào)視覺表達、互動方式以及心理感知,結(jié)合跨學科的知識來呈現(xiàn)數(shù)據(jù)并傳達其隱含的意義。隨著語義Web、本體論等技術(shù)的發(fā)展,知識圖譜的目的是描述現(xiàn)實世界中實體之間的關(guān)系。國內(nèi)外學者在知識圖譜可視化領(lǐng)域已經(jīng)取得了顯著的成果,包括各種可視化技術(shù)和可視化查詢方法。

        在2007年提出的“關(guān)聯(lián)開放數(shù)據(jù)”項目中,通過RDF鏈接將不同的知識圖譜組合成一個大型的知識圖譜。隨后,國內(nèi)外學者開始研究相關(guān)的開放數(shù)據(jù)可視化技術(shù)。通過對不同數(shù)據(jù)間的抽象級別進行定義,實現(xiàn)關(guān)聯(lián)數(shù)據(jù)的動態(tài)可視化,并提出關(guān)聯(lián)數(shù)據(jù)的可視化模型。由于數(shù)據(jù)可視化不存在標準化的數(shù)據(jù)模型,因此需要不同的查詢語言來實現(xiàn)查詢與管理。例如,由萬維網(wǎng)聯(lián)盟開發(fā)的用于映射RDF知識的標準查詢語言SPARQL已經(jīng)被創(chuàng)建,其基本單元是三元組模式.允許多個運算符將基本圖擴展到復雜圖。但SPARQL查詢語言在文本結(jié)構(gòu)化查詢時面臨一個共同問題.即用戶們需要一定的時間才能掌握查詢語言的結(jié)構(gòu)和語義信息對應的不同的關(guān)鍵詞和運算符。

        本體的可視化查詢方法側(cè)重于本體的層次結(jié)構(gòu),而本體適用于概念及其復雜關(guān)系的形式化表示。Protege是一種基于Java語言的知識獲取和編輯軟件,它允許可視化本體層次結(jié)構(gòu),并為多個繼承復制概念。其中,樹視圖和歐拉圖是最適合體現(xiàn)層次結(jié)構(gòu)的視覺模型,以縮進列表的形式清晰地呈現(xiàn)本體的類名及其層次關(guān)系.其不足之處在于無法體現(xiàn)同一層級本體間的實際關(guān)系。相比較之下,歐拉圖能夠以節(jié)點嵌套的方式呈現(xiàn)本體間的層次關(guān)系,以及通過節(jié)點大小與距離反映實體間的相似性.但是同樹視圖一樣,存在無法體現(xiàn)多層繼承的關(guān)系。

        知識圖譜可視化被廣泛應用于衛(wèi)生醫(yī)療、輿情分析、網(wǎng)絡(luò)社交等領(lǐng)域,是實現(xiàn)人工智能背景下認知智能的核心工具。由于每個領(lǐng)域不斷地生成知識圖譜,因此通用的可視化查詢方法可能不適用于描述每個領(lǐng)域的特定問題。

        1.3關(guān)聯(lián)數(shù)據(jù)

        關(guān)聯(lián)數(shù)據(jù)是利用Web技術(shù)在不同數(shù)據(jù)源之間創(chuàng)建語義關(guān)聯(lián)的最佳手段,它允許用戶通過萬維網(wǎng)或企業(yè)內(nèi)部網(wǎng)發(fā)布、共享以及關(guān)聯(lián)數(shù)據(jù)。與其他存儲數(shù)據(jù)方式相反,關(guān)聯(lián)數(shù)據(jù)的主要特點在于認為跨數(shù)據(jù)庫關(guān)系與數(shù)據(jù)本身同等重要,可以關(guān)聯(lián)完全分散的數(shù)據(jù)集。另外,關(guān)聯(lián)數(shù)據(jù)遵從以下原則:使用URIs作為任何事物的標識名稱:使用HTTP URIs訪問這些標識;當訪問某個URI時,采用標準形式提供有用信息;盡可能關(guān)聯(lián)到其他URI,使人們發(fā)現(xiàn)更多的資源和信息。

        當統(tǒng)一標準被采用后.關(guān)聯(lián)數(shù)據(jù)就具有明確定義和機器可讀。由于應用程序可以通過關(guān)聯(lián)數(shù)據(jù)定義,則自描述型數(shù)據(jù)可將數(shù)據(jù)格式與表示完全分離.以便于發(fā)布者在發(fā)布語義本體時不受單個詞匯限制。在機器可讀性方面,將HTTP協(xié)議作為一種檢索機制。結(jié)合靈活且鏈接友好的RDF圖結(jié)構(gòu),以自動化的形式爬取或梳理程序中的大量互聯(lián)數(shù)據(jù)集,以發(fā)現(xiàn)新的數(shù)據(jù)源及其后續(xù)的關(guān)聯(lián)。正是這種發(fā)布數(shù)據(jù)的靈活性和友好性,使得關(guān)聯(lián)數(shù)據(jù)特別適合對企業(yè)數(shù)據(jù)進行建模。RDF作為關(guān)聯(lián)數(shù)據(jù)的關(guān)鍵基礎(chǔ),用于描述元數(shù)據(jù)資源的屬性及其關(guān)系的標記語言。本質(zhì)上,RDF最初基于XML語法,是關(guān)聯(lián)數(shù)據(jù)的數(shù)據(jù)模型。通過三元組形式描述元數(shù)據(jù)間的關(guān)系,其基本結(jié)構(gòu)由主語、謂語及賓語3個部分組成。主語和賓語可以通過統(tǒng)一的URI來標識Web或內(nèi)網(wǎng)上的資源。最重要的是RDF不需要關(guān)聯(lián)其他數(shù)據(jù),也能很好地描述實體以及實體與實體之間的關(guān)系。而資源描述框架模式(RDFS)是一種在RDF中通過使用類和rdfs:type屬性來定義詞匯表的方式。RDF類是一組具有特定rdfs:class類型的RDF源。而類或源可通過rdfs:subclass屬性進一步分組。Web本體語言是語義Web的基礎(chǔ),實質(zhì)上是一個詞匯表,也是RDF的擴展。

        關(guān)聯(lián)數(shù)據(jù)為關(guān)聯(lián)的結(jié)構(gòu)化數(shù)據(jù)提供了一種新的支持,使機器能夠更好地讀取這些數(shù)據(jù)。但是關(guān)聯(lián)數(shù)據(jù)本身沒有語義意義.它們更好地承載了用戶可以訪問的語義數(shù)據(jù)。因此,盡管關(guān)聯(lián)數(shù)據(jù)本身沒有語義特征,但它們可以在數(shù)據(jù)級別上建立關(guān)系,從而為真正的語義Web技術(shù)提供橋梁。

        2大數(shù)據(jù)背景下企業(yè)數(shù)據(jù)治理面臨的挑戰(zhàn)

        2.1低數(shù)據(jù)質(zhì)量問題

        高數(shù)據(jù)質(zhì)量通常被認為是企業(yè)經(jīng)營、計劃和決策的核心競爭力,是實現(xiàn)企業(yè)戰(zhàn)略目標的關(guān)鍵前提。據(jù)調(diào)查顯示,低數(shù)據(jù)質(zhì)量是導致客戶關(guān)系管理系統(tǒng)障礙的主要原因。在低數(shù)據(jù)質(zhì)量的環(huán)境下,企業(yè)通常無法實現(xiàn)商業(yè)決策時的附加價值。由于缺乏數(shù)據(jù)治理與管理的能力.企業(yè)往往造成跨組織低數(shù)據(jù)質(zhì)量問題。其主要體現(xiàn)在數(shù)據(jù)不一致、不準確、不及時和來源不明確等。低數(shù)據(jù)質(zhì)量不僅會產(chǎn)生流程進度失敗、信息廢料和返工等成本,還會削弱組織對數(shù)據(jù)的信任,甚至造成客戶不愿意接受基于此數(shù)據(jù)的商業(yè)計劃項目。海量而復雜的數(shù)據(jù)給企業(yè)管理帶來挑戰(zhàn)的同時,也增加了低數(shù)據(jù)質(zhì)量的風險。良好的數(shù)據(jù)治理和健全的全局數(shù)據(jù)可視化可有效提升數(shù)據(jù)質(zhì)量。

        2.2缺乏數(shù)據(jù)治理工具

        除了低數(shù)據(jù)質(zhì)量問題外.缺乏數(shù)據(jù)治理工具也為企業(yè)帶來了進一步的挑戰(zhàn)。當前,企業(yè)數(shù)據(jù)管理工作主要依賴于詳細目錄或注冊技術(shù),或者是一些專有和開源的工具。然而,大部分工具仍然停留在對驅(qū)動項目和數(shù)據(jù)所有者信息的收集和整合。在最近的數(shù)據(jù)治理研究中,主要通過建立自頂而下的方法實現(xiàn)數(shù)據(jù)治理與管理。雖然實現(xiàn)了對項目的更多控制,但是阻礙了整個組織人員以“眾包”輸入形式實現(xiàn)對數(shù)據(jù)的管理、定義及移動。在企業(yè)數(shù)據(jù)治理過程中.由于難以量化工作優(yōu)先級帶來的好處.因此很難授權(quán)實際優(yōu)先級.進而企業(yè)商業(yè)項目難以推進。在該情況下,各部門會形成孤立的數(shù)據(jù)集,從而導致業(yè)務人員無法了解數(shù)據(jù)間的依賴性。因此,企業(yè)需要一個合適的可視化工具,實現(xiàn)整個企業(yè)的全局數(shù)據(jù)可視化圖,以映射企業(yè)數(shù)據(jù)流及業(yè)務范圍。

        2.3數(shù)據(jù)基本屬性問題

        在企業(yè)元數(shù)據(jù)類型與數(shù)據(jù)管理計劃的并行問題中,主要由兩個方面驅(qū)動:一是數(shù)據(jù)屬性問題;二是關(guān)于元數(shù)據(jù)管理活動相關(guān)的問題。對于數(shù)據(jù)屬性問題,主要存在數(shù)據(jù)不完整、數(shù)據(jù)不一致、數(shù)據(jù)來源不明確以及數(shù)據(jù)異常等問題;而對于元數(shù)據(jù)管理活動問題,主要包括數(shù)據(jù)的創(chuàng)建、收集、共享、更新以及查詢等問題。不同類型的元數(shù)據(jù)在整個企業(yè)中面臨著不同的挑戰(zhàn)。然而企業(yè)管理活動與元數(shù)據(jù)類型間的維度是相互交織的。在數(shù)據(jù)創(chuàng)建、轉(zhuǎn)換和移動過程中,有效的元數(shù)據(jù)管理需要重點解決數(shù)據(jù)在收集、共享、更新和查詢中的數(shù)據(jù)來源問題。與此同時,管理者和用戶在查詢數(shù)據(jù)時也應該尤其注意數(shù)據(jù)治理的問題。

        3基于關(guān)聯(lián)數(shù)據(jù)的企業(yè)數(shù)據(jù)治理可視化框架設(shè)計

        3.1以關(guān)聯(lián)數(shù)據(jù)和本體為基礎(chǔ)

        關(guān)聯(lián)數(shù)據(jù)和本體是企業(yè)數(shù)據(jù)可視化的通用技術(shù)基礎(chǔ)。由于語義Web技術(shù)和圖數(shù)據(jù)結(jié)構(gòu)的靈活性和可表達性,關(guān)聯(lián)數(shù)據(jù)可更好地通過增加元數(shù)據(jù)的可視化效果來提高企業(yè)數(shù)據(jù)質(zhì)量。為有效提高企業(yè)數(shù)據(jù)質(zhì)量水平,數(shù)據(jù)的可視化遠遠超出了可描述的實際數(shù)據(jù)結(jié)構(gòu)(庫、行、列等)。企業(yè)的數(shù)據(jù)可視化還包括企業(yè)數(shù)據(jù)在整個組織中如何被使用、被誰使用、如何分布以及數(shù)據(jù)屬于哪個業(yè)務概念或流程。在整個組織中,通過建立一種可共享的標準化方式來關(guān)聯(lián)這些復雜關(guān)系,用以描述數(shù)據(jù)與組織的交互,借此實現(xiàn)企業(yè)數(shù)據(jù)最大程度地可視化。

        在建立企業(yè)數(shù)據(jù)可視化框架過程中,所需關(guān)聯(lián)數(shù)據(jù)和本體的關(guān)鍵屬性包括:

        1)可表達性。通過使用三元組構(gòu)建企業(yè)數(shù)據(jù)、流程及人員間的復雜關(guān)系,形成一個圖數(shù)據(jù)結(jié)構(gòu)。在整個組織中將企業(yè)數(shù)據(jù)與其他實體關(guān)聯(lián)起來,從而建立一個以圖結(jié)構(gòu)捕獲數(shù)據(jù)、流程及人員的集成方式。其次,通過使用OWL本體語言擴展RDF,以本體的形式建立復雜規(guī)則與關(guān)系,以此為推理引擎提供基礎(chǔ)。其中,關(guān)系允許數(shù)據(jù)是“自描述的”,因此在處理圖信息的工具上可以是輕量級的,不需要關(guān)注關(guān)系或規(guī)則的維護。

        2)靈活性。語義Web技術(shù)提供了在不同級別上指定數(shù)據(jù)的靈活性。基于對開放世界的假設(shè),數(shù)據(jù)可以對任何事物具體化。在組織控件上可以以規(guī)則、推斷或公理的形式來保持高度靈活性和標準化。在處理實際問題時,靈活性也非常重要。例如,在不同級別上團隊可以輸入他們擁有的信息。通過以標準化方式存儲企業(yè)元數(shù)據(jù),以提供強大的數(shù)據(jù)源,為企業(yè)范圍內(nèi)建立高水平戰(zhàn)略元數(shù)據(jù)視圖提供數(shù)據(jù)支撐。

        3)易發(fā)布性。語義Web內(nèi)容的發(fā)布僅需一個公開的URI。當發(fā)現(xiàn)被引用時,Web瀏覽器會自動訪問該資源并集成為當前視圖。該方法易于將事實信息公布于語義網(wǎng)中,使得多方輕松實現(xiàn)數(shù)據(jù)共享,從而提供一種“眾包”方法來構(gòu)建知識庫。然而,大規(guī)模的元數(shù)據(jù)管理工作需要跨組織的參與才能取得成功。因此通過建立企業(yè)數(shù)據(jù)可視化,不僅可以迅速增加知識庫內(nèi)容,還可以實現(xiàn)數(shù)據(jù)共享的最大化。

        4)可推斷性。推斷是OWL的主要優(yōu)點之一,推理引擎可根據(jù)數(shù)據(jù)中的斷言和規(guī)則推斷出新的數(shù)據(jù)。這種推斷數(shù)據(jù)的能力是維護企業(yè)數(shù)據(jù)圖靈活性所不可或缺的。在元數(shù)據(jù)管理過程中,團隊必須能夠在一定級別上輸入數(shù)據(jù),以保持推斷的實時性。例如,一個團隊提交特定系統(tǒng)由多個個人訪問,這些個人從干系人到技術(shù)所有者。另一種情況,他們僅允許特定部門訪問其系統(tǒng)。推論可得知干系人和技術(shù)所有者來自組織的哪個部門。類似地,推斷也可協(xié)調(diào)不同系統(tǒng)的信息級別:推理引擎還可創(chuàng)建隱含事實,將不同級別的組織信息和系統(tǒng)信息關(guān)聯(lián)起來。

        5)豐富的框架和工具。語義Web技術(shù)還提供了許多成熟的開源框架、工具、三重存儲、推理引擎和可視化工具。此外,還有一種稱之為Prot6g6的本體開發(fā)工具,可以實現(xiàn)企業(yè)數(shù)據(jù)的可視化,從而提高數(shù)據(jù)的可共享程度。在本例中,相比于電子表格,組織圖能更好地看到數(shù)據(jù)移動及其依賴關(guān)系,并且讓組織員工對公司數(shù)據(jù)有更好的認識。另外.存在開源和專有的幾種RDF存儲類型,以有效處理大量三元組。

        豐富的開源工具組合和準入的低成本,使得語義Web技術(shù)成為相對于高成本、專有和集中化元數(shù)據(jù)管理更具吸引力。此外,企業(yè)范圍內(nèi)的元數(shù)據(jù)項目依賴于高參與率,企業(yè)數(shù)據(jù)的高度可視化促進了企業(yè)元數(shù)據(jù)管理以及更高質(zhì)量的輸入,更多的個體可看到組織內(nèi)部系統(tǒng)、數(shù)據(jù)和人員間的依賴關(guān)系。

        3.2企業(yè)整體框架體系

        企業(yè)整體框架體系是構(gòu)建企業(yè)數(shù)據(jù)可視化的核心。它是圖數(shù)據(jù)存儲的基礎(chǔ),并存儲著貫穿于整個企業(yè)的核心元數(shù)據(jù)。隨后,公司其他部門人員將企業(yè)數(shù)據(jù)圖及其本體應用于部門數(shù)據(jù)圖,并擴展與數(shù)據(jù)結(jié)構(gòu)和組織相關(guān)的附加信息。如同任何數(shù)據(jù)模型工具.圖結(jié)構(gòu)的通用性和一致性對于準確反映組織狀態(tài)是至關(guān)重要的。圖1所示為企業(yè)整體框架體系。

        其中,關(guān)鍵組成部分包括:

        企業(yè)圖:核心數(shù)據(jù)圖是實現(xiàn)企業(yè)整體數(shù)據(jù)可視化的關(guān)鍵要素。它是一種包含企業(yè)主數(shù)據(jù)的本體。企業(yè)圖不僅包括職能部門、業(yè)務部門、監(jiān)管實體和人員等組織信息:還包括描述數(shù)據(jù)移動和公司計劃相關(guān)的信息,例如信息來源、項目相關(guān)信息和業(yè)務主體信息。與所有本體一樣,除了包含這些特定實體外,還包括其關(guān)聯(lián)關(guān)系。該核心數(shù)據(jù)圖將通過在OWL中導人指令:http://ww.owl-ontolo.gies.com//NEW_ONTOLOGY,從而使企業(yè)所有信息集成在一起。

        部門圖:部門圖包含特定部門或其他原子工作組的本地化信息。其主要目的是鼓勵企業(yè)廣泛參與并發(fā)布有關(guān)數(shù)據(jù)使用和管理的信息。通過分解任務,將責任交付給定期使用數(shù)據(jù)的人員。部門圖包括盡可能多或少的數(shù)據(jù)來描述局部環(huán)境.以促進實現(xiàn)企業(yè)范圍內(nèi)目標。而特定部門或其他原子工作組擁有的最好信息包括:與基礎(chǔ)設(shè)施相關(guān)的數(shù)據(jù)信息、管理信息以及數(shù)據(jù)移動的信息來源和抽象信息,如業(yè)務領(lǐng)域的對象映射。在部門圖中導入核心數(shù)據(jù)圖,提供對整個公司所有其他部門圖的訪問.同時也為企業(yè)范圍內(nèi)的元數(shù)據(jù)提供一個共同的“中心”。

        企業(yè)資產(chǎn)元數(shù)據(jù):這些是整個組織的實際技術(shù)資產(chǎn),如引用的系統(tǒng)和數(shù)據(jù)庫。在其生命周期中用于捕獲并跟蹤數(shù)據(jù)移動、使用和治理。

        組織、人和治理信息:這些是組織結(jié)構(gòu),如部門、法人實體和人員。這些信息形成了數(shù)據(jù)管理和治理基礎(chǔ),將人和數(shù)據(jù)有機結(jié)合起來。

        定義業(yè)務流程:此信息與技術(shù)資產(chǎn)和業(yè)務關(guān)系密切相關(guān)。企業(yè)數(shù)據(jù)可視化是業(yè)務流程的一部分,而業(yè)務流程又由一個或多個功能領(lǐng)域“擁有”。如大型組織的招聘流程,招聘流程由招聘部門“擁有”,但人力資源部門的其他部門也會參與。擁有與關(guān)鍵數(shù)據(jù)元素相關(guān)的功能流程對于識別數(shù)據(jù)結(jié)構(gòu)更改(如升級或轉(zhuǎn)換)的影響是必須的。此外,定義業(yè)務是組織中使用的與實體、度量、屬性等相關(guān)的術(shù)語。在定義企業(yè)業(yè)務時,若出現(xiàn)含義混淆或支持數(shù)據(jù)無法明確識別時,就會出現(xiàn)數(shù)據(jù)異常等問題。

        圖更新過程:此過程包括手動更新和自動更新兩種方式,根據(jù)組織狀態(tài)實時更新圖。類似爬蟲與代理機制,其更新過程是完全動態(tài)的,根據(jù)數(shù)據(jù)結(jié)構(gòu)圖、組織結(jié)構(gòu)的變化更新圖結(jié)構(gòu)實體和業(yè)務流程圖。同時,更新過程可由操作員手動干預提取信息并加載到圖結(jié)構(gòu)中。盡管此方法在許多大型組織和復雜層次結(jié)構(gòu)中具有一定的局限性,但關(guān)聯(lián)數(shù)據(jù)的靈活性可支持各種方式的進行。

        圖維護和瀏覽實用程序:該程序允許用戶瀏覽企業(yè)數(shù)據(jù)可視化圖來觀察整個組織內(nèi)的全局數(shù)據(jù)視圖,還可以根據(jù)需要和許可更新企業(yè)數(shù)據(jù)視圖。大部分與流程定義相關(guān)的手動更新都通過這一機制來實施,各部門也可根據(jù)組織內(nèi)需求來更新特定的圖表。

        數(shù)據(jù)請求實用程序:該程序用于追蹤組織中的數(shù)據(jù)來源。為了捕獲組織內(nèi)的數(shù)據(jù)需求,需開發(fā)一個實用程序用于捕獲這些請求。如果實現(xiàn)了數(shù)據(jù)請求,就需要進行數(shù)據(jù)傳輸。所有數(shù)據(jù)請求將通過一個工具輸入,該工具將捕獲所查找的信息、請求的個人以及數(shù)據(jù)目標。用戶根據(jù)現(xiàn)有的數(shù)據(jù)視圖來選擇其所需領(lǐng)域的數(shù)據(jù)。此方法不僅可以為管理者提供可視化數(shù)據(jù)圖,還可為創(chuàng)建信息來源奠定基礎(chǔ),從而實現(xiàn)真正的數(shù)據(jù)追蹤。

        報告與查詢:該組件允許組織以標準化或交互式的方式從圖表中提取信息。隨著組織內(nèi)系統(tǒng)的逐漸成熟化,圖形界面將允許業(yè)務工作人員查詢可用數(shù)據(jù)及如何使用和傳輸數(shù)據(jù)。由于部門及工作人員被清晰地標識為企業(yè)數(shù)據(jù)的創(chuàng)建者、管理者和使用者.增加對企業(yè)數(shù)據(jù)的可視化程度將有助于企業(yè)數(shù)據(jù)治理的能力。一旦形成高度成熟化的企業(yè)可視化圖,企業(yè)將獲得更高質(zhì)量的數(shù)據(jù)用于支撐更精準的商業(yè)決策。

        3.3本體分類

        企業(yè)數(shù)據(jù)可視化圖的核心是本體。本體是構(gòu)建企業(yè)數(shù)據(jù)可視化圖的核心基礎(chǔ)。本體將對組織內(nèi)特有概念(如部門級別、系統(tǒng)組件、人員及委員會等)進行建模,以實現(xiàn)更大的跨組織標準化。業(yè)務概念也可通過本體建模,并關(guān)聯(lián)到支撐它們的底層數(shù)據(jù)和團隊。基于上述與斷言和規(guī)則相關(guān)的類組成了一個詞匯表,以反映企業(yè)數(shù)據(jù)資產(chǎn)與相關(guān)實體間的交互。其中,大部分本體是基于包含而不是繼承關(guān)系。為了克服這一問題,需要適當?shù)孛s束和對象屬性以建立恰當?shù)年P(guān)系模型。

        現(xiàn)在將繼續(xù)定義本體中的關(guān)鍵類:

        組織實體:該類通常用于企業(yè)組織結(jié)構(gòu)建模。在組織中,通常存在多種方式組織這些實體。例如:財務、金融或信息技術(shù)等職能部門,或地區(qū)、城市等地理位置。語義web允許任意不同的組織結(jié)構(gòu),但許多組織結(jié)構(gòu)是基于組合而不是繼承關(guān)系,因此需要建立合適屬性以確定其組織順序。其中,組織人員是元數(shù)據(jù)圖的重要組成成分,分配個人責任制對于數(shù)據(jù)管理工作至關(guān)重要。在很多情況下,只需關(guān)注關(guān)鍵任務.如技術(shù)開發(fā)人員或用于解決部門、地區(qū)等組織實體的團隊。

        元數(shù)據(jù)實體:元數(shù)據(jù)組件用于反映組織內(nèi)實際技術(shù)構(gòu)件。本研究利用結(jié)構(gòu)化表格數(shù)據(jù),以表格格式形成RDBMS和文件。頂層系統(tǒng)通過一系列技術(shù)和流程來支撐組織業(yè)務流程。該系統(tǒng)由用戶界面和數(shù)據(jù)庫等組件構(gòu)成,而數(shù)據(jù)庫由后續(xù)實體組成,實體又包含屬性。通過使用對象屬性,元數(shù)據(jù)信息被關(guān)聯(lián)到組織和數(shù)據(jù)來源類,以便對數(shù)據(jù)在其整個生命周期的使用情況進行建模。此外,業(yè)務概念類也關(guān)聯(lián)到這些類以標識業(yè)務抽象概念的持久性位置。元數(shù)據(jù)組件需要得到不同團隊的關(guān)注,這些團隊再使用特定信息來填充本體。為準確反映客觀現(xiàn)實,可以通過自動化代理來梳理數(shù)據(jù)庫目錄或控制文件,以實現(xiàn)元數(shù)據(jù)的實時更新。

        來源實體:數(shù)據(jù)來源指的是數(shù)據(jù)在整個生命周期的軌跡,包括數(shù)據(jù)在哪如何被創(chuàng)建,還包括數(shù)據(jù)的移動與轉(zhuǎn)換。其集中于捕獲數(shù)據(jù)從一個系統(tǒng)到另一個系統(tǒng)的傳輸狀態(tài),這些傳輸以文件或反饋形式從一個系統(tǒng)到另一個系統(tǒng)或直接用UI、服務器等訪問。此外,關(guān)鍵對象屬性對于顯示哪些元數(shù)據(jù)組件作為傳輸源和目標來說是必不可少的。與其他類相似,傳輸也可以分配任一級別的來源屬性。

        治理實體:該實體可以是監(jiān)督企業(yè)整個生命周期中各系統(tǒng)和業(yè)務流程的任意分組或委員會。不同于組織實體,其是可變和動態(tài)的。治理實體可出現(xiàn)在給定的項目中.擁有特定的對象屬性,如“必須批準”或“必須被通知”,這些屬性將個人與數(shù)據(jù)關(guān)聯(lián)起來。然而,組織實體傾向于更緊密地映射組織結(jié)構(gòu),以保持整個本體的一致性。此外,依據(jù)特定的組織策略,將復雜的角色和關(guān)系關(guān)聯(lián)到組織實體和企業(yè)數(shù)據(jù)資產(chǎn)。

        業(yè)務主體項目:業(yè)務概念類是用于捕獲現(xiàn)有業(yè)務定義和流程并驅(qū)動系統(tǒng)及其產(chǎn)生的數(shù)據(jù)。該類充分利用了語義web.允許各小組使用或擁有其概念。這不僅將業(yè)務概念及流程和數(shù)據(jù)結(jié)合起來,還將企業(yè)內(nèi)部的各種概念結(jié)合起來可指同一事物?;谡Z義web技術(shù)填充數(shù)據(jù)的靈活性,以組織結(jié)構(gòu)和元數(shù)據(jù)的形式填充知識庫。在對數(shù)據(jù)全局可視化圖的物理結(jié)構(gòu)建模后,就可以關(guān)注概念或語義實體。數(shù)據(jù)空間領(lǐng)域的常見模式是通過語義定義的決策被推遲,“已知”世界被建模而產(chǎn)生投資回報。

        請求實體:這些類從請求的角度來捕獲數(shù)據(jù)。若組織在開始時存在捕獲元數(shù)據(jù)的需求,他們就需要一個設(shè)施接收或路由數(shù)據(jù)請求到相關(guān)數(shù)據(jù)所有者。經(jīng)過一個審批流程,最終實現(xiàn)數(shù)據(jù)請求的傳輸。當組織接受這一數(shù)據(jù)請求,他們就能夠在整個生命周期中追蹤數(shù)據(jù)的移動。數(shù)據(jù)請求的提升不僅取決于公司采取的數(shù)據(jù)治理策略.還取決于組織采用的框架,其實體和屬性作為一種手段以確保有效的數(shù)據(jù)治理過程。

        3.4對象屬性

        除了已包含的類之外,還包括多個對象的不同對象屬性。不同的對象屬性通常用于綁定組織和數(shù)據(jù)間的關(guān)系。由于OWL類的默認關(guān)系是一種繼承關(guān)系,而其中一些屬性在類中用于建立包含關(guān)系。另外,還有在管理和治理領(lǐng)域用于捕獲整個企業(yè)和所有相關(guān)方的數(shù)據(jù)流。

        在核心本體中定義了以下對象屬性組:

        管理:這些屬性的主要目的是建立組織實體和元數(shù)據(jù)實體間的關(guān)系.以此建立企業(yè)數(shù)據(jù)治理方面的關(guān)系概念。在這里,會確定哪些人或團隊被指定為利益相關(guān)者、所有者或管理者。在做變更和批準影響分析時需要來自與數(shù)據(jù)相關(guān)的各方.這是任何數(shù)據(jù)治理計劃的關(guān)鍵基礎(chǔ)。當出現(xiàn)司法糾紛時,識別涉及到的個人或領(lǐng)域就像使用給定的元數(shù)據(jù)源作為主題查詢該屬性對象一樣簡單。在日常的基礎(chǔ)上.記錄在案的知識允許企業(yè)制定更好的商業(yè)決策。與此同時,每一個瀏覽本體的人都知道涉及數(shù)據(jù)相關(guān)的各方。

        來源:來源屬性在數(shù)據(jù)生命周期建模中非常重要。除了描述包含屬性,“來源”屬性和“來源于”屬性在建模數(shù)據(jù)依賴關(guān)系是至關(guān)重要的。在此,系統(tǒng)或數(shù)據(jù)庫可以實現(xiàn)為源或其他相關(guān)依賴系統(tǒng)。當與傳輸類聯(lián)合使用時,許多系統(tǒng)依賴于特定的數(shù)據(jù)反饋進行建模。與其他類相似,可以在較低的詳細級別應用此屬性。在其他情況下,表或數(shù)據(jù)庫擁有的信息可以為數(shù)據(jù)管理者提供足夠的信息。

        業(yè)務處理:業(yè)務流程對象屬性包含本體中的大多數(shù)類。他們用于描述業(yè)務流程與其工件間的關(guān)系、與支撐這些過程的系統(tǒng)間的關(guān)系以及組織內(nèi)負責這些過程的職能領(lǐng)域。此外,這些屬性被認為是自反的,因為它們可以應用于其他業(yè)務流程。一個業(yè)務流程依賴于另一個業(yè)務流程的構(gòu)件通常是很常見的.對哪個業(yè)務流程依賴于哪個數(shù)據(jù)的理解將有助于確保數(shù)據(jù)治理不僅僅是一個IT問題.而是貫穿于整個組織結(jié)構(gòu)。

        元數(shù)據(jù)和組織結(jié)構(gòu):組織屬性主要用于建立基于樹的層次結(jié)構(gòu)以反映大多數(shù)企業(yè)組織結(jié)構(gòu)。從功能和位置的角度來看,元數(shù)據(jù)屬性描述了大多數(shù)系統(tǒng)顯示的父子關(guān)系。由關(guān)系數(shù)據(jù)庫概念來驅(qū)動,如包含表和視圖的數(shù)據(jù)庫,這些表和視圖還包含了列。

        4基于關(guān)聯(lián)數(shù)據(jù)的企業(yè)數(shù)據(jù)治理可視化框架構(gòu)建

        本文的主要工作是構(gòu)建基于關(guān)聯(lián)數(shù)據(jù)的企業(yè)數(shù)據(jù)治理可視化框架,以此建立企業(yè)數(shù)據(jù)全局可視化,從而實現(xiàn)數(shù)據(jù)共享最大化。基于此,設(shè)計了如圖5所示的構(gòu)建流程。

        4.1數(shù)據(jù)準備與精煉

        數(shù)據(jù)準備:本文的研究對象主要是針對大型綜合性組織結(jié)構(gòu)復雜的企業(yè),通過八爪魚采集器進行組織結(jié)構(gòu)資源的獲取,并將采集到的數(shù)據(jù)存儲在Microsoft Excel中。鑒于企業(yè)信息資源管理系統(tǒng)的標簽集大多以文本的形式保存,而資源集可能存在圖片、音頻或視頻等多樣化類型。因此,本文采用爬蟲工具采集標簽集中的標簽文本,并采集資源集中該資源的URL作為唯一標識。

        數(shù)據(jù)精煉:利用Microsoft Excel對所存儲的數(shù)據(jù)資源進行整合。通過合并、去重、替換等方式進行數(shù)據(jù)清洗與精煉,將數(shù)據(jù)集轉(zhuǎn)化類標簽和對象屬性標簽且反映兩者聯(lián)系。利用數(shù)據(jù)清洗的手段獲得語義清晰、無歧義的精煉標簽數(shù)據(jù)集,并以表格的形式存儲。

        4.2語義本體構(gòu)建

        1)本體的原型構(gòu)建

        根據(jù)不同等級的需求對組織進行建模,其首要任務是決定如何構(gòu)建核心本體。在本體的創(chuàng)建中,類派生于數(shù)據(jù)治理的基本方面,這些方面以業(yè)務與技術(shù)的一致性為中心。為了改善企業(yè)數(shù)據(jù)治理的能力.管理人員應先識別捕獲數(shù)據(jù)資產(chǎn)與組織如何交互的類。這些類將實現(xiàn)以下功能:

        組織實體:這些類將捕捉各部門、小組和子組,甚至是各層次需求的人員。其目標是建模一個既豐富又準確而且易于維護的組織結(jié)構(gòu)。執(zhí)行者需要考慮兩個問題是否有意義。一個是當其他企業(yè)系統(tǒng)如財務或人力資源企業(yè)去模仿此組織結(jié)構(gòu):另一個是創(chuàng)建一個與此計劃相關(guān)的全新結(jié)構(gòu)。

        元數(shù)據(jù)實體:這一類實際上代表著數(shù)據(jù)資產(chǎn)本身。與先前的數(shù)據(jù)組一樣,需要建立豐富且可持續(xù)的詳細級別。執(zhí)行者要有識別潛在影響的能力,并熟知數(shù)據(jù)元素流。該領(lǐng)域包含字段或列級別的詳細信息。

        業(yè)務領(lǐng)域?qū)嶓w:從數(shù)據(jù)角度來看,數(shù)據(jù)資產(chǎn)和業(yè)務計劃間的相互關(guān)系非常重要。但是這些類中最重要的是代表現(xiàn)有業(yè)務流程的類。這將進一步允許連接到企業(yè)的業(yè)務行為如何依賴于具體數(shù)據(jù)資產(chǎn)。

        除了類之外.建立適當?shù)膶ο髮傩詫⑦@些類及其后續(xù)個體關(guān)聯(lián)起來也很重要。包括以下關(guān)鍵屬性:

        組織屬性:該對象屬性(例如“含有”)允許公司分層結(jié)構(gòu),其他屬性則可用于突顯矩陣樣式關(guān)系。

        治理/管理屬性:與數(shù)據(jù)資產(chǎn)相關(guān)的屬性對于整個組織內(nèi)人員和小組是關(guān)鍵的。例如數(shù)據(jù)持有者、管理者和贊助商能利用其屬性關(guān)系更好反映數(shù)據(jù)治理的戰(zhàn)略。此外,這些專業(yè)術(shù)語可用于識別數(shù)據(jù)資產(chǎn)“誰負責”“誰批準”“咨詢誰”及“告知誰”等部分。

        來源屬性:識別數(shù)據(jù)資產(chǎn)類建模的屙陛對于顯示數(shù)據(jù)供應鏈至關(guān)重要。像“引用”和“被引用”這樣的概念將突顯其依賴性。同樣重要的是確保這些屬性以便描述他們的屬性鏈。

        2)本體的形式化

        一旦建立了本體,就需要使用與所選類和屬性相關(guān)的適當數(shù)據(jù)來填充它。在這里,高容量類是組織結(jié)構(gòu)和數(shù)據(jù)資產(chǎn)。根據(jù)組織的規(guī)模、系統(tǒng)/資產(chǎn)的數(shù)量和所選詳細級別.此任務可能需要幾個小時到幾周的時間。

        通過對象屬性關(guān)聯(lián)的信息行為需要被研究、達成一致和某種程度的自動化。在核心系統(tǒng)中可獲取組織信息;在系統(tǒng)、數(shù)據(jù)庫、表、查詢和字段中還可以得到一些自動化方式,如查詢系統(tǒng)目錄。一些組織也可能擁有庫存系統(tǒng)的應用程序,該程序也有一些所有權(quán)信息。其他類,例如當信息無序地存儲在庫存系統(tǒng)中,業(yè)務流程就需手動收集信息。類被加載后,通過屬性標簽和數(shù)據(jù)資源等關(guān)系定義數(shù)據(jù)屬性、建立實例,通過本體工具Protege完成本體構(gòu)建,并生成本體的RDF描述文件.完成企業(yè)數(shù)據(jù)信息系統(tǒng)數(shù)據(jù)集的RDF化。

        4.3語義本體發(fā)布成關(guān)聯(lián)數(shù)據(jù)

        發(fā)布關(guān)聯(lián)數(shù)據(jù)的具體方式與企業(yè)的核心需求緊密相關(guān)。假若以資源查詢?yōu)楹诵?,可選SPASRQL作為最佳工具,把語義本體發(fā)布成為關(guān)聯(lián)數(shù)據(jù)供組織成員查詢。通過OpenLink Virtuoso將本體的RDF文件導入到SPASRQL中,隨后將RDF三元組數(shù)據(jù)以圖結(jié)構(gòu)的形式存儲于SPASRQL。然后,借助關(guān)聯(lián)數(shù)據(jù)的前端應用程序,將企業(yè)中特定數(shù)據(jù)信息生成URIs,供外部訪問和內(nèi)部查詢。假若以導航地址為核心,可借助WebVOWL工具將RDF文件導入,利用OWL工具自動識別OWL描述的本體,并提取本體中的類、對象屬性、數(shù)據(jù)屬性、實例等元素,并在線生成可視化網(wǎng)絡(luò)圖形界面,供用戶訪問和瀏覽。此外,假若以資源導航為核心,可借助LODE工具來提取RDF文件中的類及對象屬性等,并以本體的三元組列表的方式展現(xiàn)HTML網(wǎng)頁,使得用戶更方便地利用資源索引瀏覽與使用。

        4.4制定模型更新策略

        當企業(yè)運用抽象模型時,應保持模型實時更新策略,以免因模型不精準而造成信譽丟失,在文檔相對于所描述代碼過時時有所體現(xiàn)。此外,當數(shù)據(jù)建模師使用諸如ER圖之類的工具去建立關(guān)系數(shù)據(jù)庫時,應保持其最新以便大眾使用。可見,本體論精準地表達組織是十分重要的。在組織結(jié)構(gòu)變更或創(chuàng)建新的數(shù)據(jù)資產(chǎn)時,一定程度的自動化可適當?shù)貙ζ溥M行更改。盡管采用了保持更新模型的方法,但所采用的集中化程度也與此相關(guān)。如果采用高度分散化的方法.則各區(qū)域必須確保其“局部”模型盡可能準確。

        由于每個人都有自己的模型維護,因此可以更高的信息級別完成對其他本體的更新。此外,使用分布式方法,給定組(如部門)的建模級別將會更低,因為數(shù)據(jù)資產(chǎn)包含在該組擁有和使用的內(nèi)容中。由于每個人都有自己的模型維護,引用其他本體就可以有更高的信任度。

        定義可重復進程是許多數(shù)據(jù)治理成熟模型的一個關(guān)鍵組成部分,確保企業(yè)數(shù)據(jù)治理不是一次性活動。定義可重復進程以保持組織框架或模型實時更新。此外,當可重復進程輸入干凈數(shù)據(jù),質(zhì)量監(jiān)控數(shù)據(jù)以及更新所需數(shù)據(jù)時,該進程就成為總體框架的一部分。將這些過程捕獲為其他輔助過程記錄它們在數(shù)據(jù)生命周期中的角色。

        4.5制定數(shù)據(jù)傳輸捕獲策略

        在此框架中,數(shù)據(jù)移動可能是要捕捉的更抽象的元素之一。在一種情況下,它簡單到擁有一個數(shù)據(jù)資產(chǎn)(如表、字段或視圖源)。在這里,實施者可以選擇在較低的詳細級別上指定字段或者保持一定的抽象,并確定給定表可能來自另一個系統(tǒng)。對于一個組織來說,了解到給定表可能涉及到另一個系統(tǒng)的特定接口已是足夠可視化。然而與圖形數(shù)據(jù)庫一樣,高度靈活性允許組選擇合適自己的級別。

        另一個決策點是創(chuàng)建一個從傳輸?shù)匠橄髷?shù)據(jù)移動的概念。如果一組特定的數(shù)據(jù)(例如員工名冊)被組織中的許多組重用,那么可以建立數(shù)據(jù)集傳輸模型來減少維護并將其用于多個系統(tǒng)中。這種抽象化對于組織擁有多種不同數(shù)據(jù)移動方式來說是非常有幫助的。例如文件“feed”,其中一個平面文件被發(fā)送到另一個系統(tǒng)以便攝取,或者通過API、公開Web服務、一個數(shù)據(jù)庫視圖。雖然轉(zhuǎn)移方式不同,但信息管理和依賴是相同的。

        4.6制定數(shù)據(jù)可視化建模方法

        企業(yè)數(shù)據(jù)可視化作為類及其關(guān)聯(lián)關(guān)系的基礎(chǔ)。為了構(gòu)建研究本體,本文使用Protege工具進行知識和領(lǐng)域建模。Protege可以便捷地實現(xiàn)跨組織共享、協(xié)作和查看本體。本工具支持最新的Web本體語言以及RDF/XML、Turtle和owl/xml等序列化。

        Protege的主要組件是允許添加和操作本體類及對象屬性的瀏覽器,以顯示加載到應用程序中的活動本體的主屏幕。雖然屏幕是高度可配置的,但它顯示了一些關(guān)鍵信息.比如關(guān)于本體大小的度量、本體的呈現(xiàn)(本例中是RDF/XML)以及關(guān)于導入或由本體引用的任何本體或數(shù)據(jù)集的信息。圖6展示了本體類的主要查看器。

        由圖6可看出,左側(cè)屏幕以“樹視圖”的形式呈現(xiàn)出本體類。然而,值得注意的是與描述包含關(guān)系的XML和其他樹視圖不同的是本體中的類是基于繼承的。同樣重要的是,“企業(yè)數(shù)據(jù)治理一項目管理辦公室主體”類描述了項目管理概念,以集成數(shù)據(jù)管理和治理概念。

        在右側(cè)屏幕,除了頂部帶有關(guān)于突出顯示類注釋的部分外,其主要功能是對突出顯示類的約束,例如等價于、子類等。此外,該部分還顯示了類的實例,如圖中紫色菱形所示。此方法對于在本體中查看實際數(shù)據(jù)非常有效。類似于類查看器,對象屬性同樣也可查看。在此,以同樣的格式實現(xiàn)對對象屬性的創(chuàng)建與操作以及對其設(shè)置相應的約束。然而.與類屬性不同的是對象屬性存在是否為傳遞性、對稱性等復選框的標識屬性。

        Protege提供了一種高度交互的方式來查看本體以及其所有實例數(shù)據(jù)。與圖表類似,使用者可以看到各類的子類和實例。在多個對象屬性情況下,Protege還可以查詢實體間各種可能的綁定關(guān)系,這對于企業(yè)數(shù)據(jù)可視化來說至關(guān)重要。

        5結(jié)語

        隨著云計算、物聯(lián)網(wǎng)等技術(shù)的飛速發(fā)展,數(shù)據(jù)已成為企業(yè)的重要資產(chǎn)和價值來源。面對數(shù)據(jù)的爆炸式增長,公司必須采取行動來實施數(shù)據(jù)資產(chǎn)治理。在整個生命周期中,數(shù)據(jù)經(jīng)歷了創(chuàng)建、更新、復制、移動或傳輸,最終進行存檔和銷毀。由于數(shù)據(jù)的短暫性特征,適用于以圖結(jié)構(gòu)建模其生命周期。關(guān)聯(lián)數(shù)據(jù)是企業(yè)數(shù)據(jù)治理的基礎(chǔ).它整合了所有數(shù)據(jù)的訪問,提升了企業(yè)科學決策的水平。另外,關(guān)聯(lián)數(shù)據(jù)反映了不同組織、系統(tǒng)及計劃間的豐富關(guān)系,允許在企業(yè)環(huán)境中采用重要的數(shù)據(jù)時降低進入障礙。考慮到有許多豐富的開源工具和方法用于存儲、收集和可視化這些異類數(shù)據(jù).本文提供了一個可伸縮和靈活且經(jīng)濟的解決方案。由于以數(shù)據(jù)為中心的企業(yè)項目在實施和采用方面充滿了困難,因此這些較低的準入門檻使該研究成為組織尋求提高其數(shù)據(jù)意識和隨后的數(shù)據(jù)治理工作的可行框架。

        猜你喜歡
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        敢為人先的企業(yè)——超惠投不動產(chǎn)
        云南畫報(2020年9期)2020-10-27 02:03:26
        91国内偷拍一区二区三区| 亚洲香蕉成人av网站在线观看| 粉嫩av国产一区二区三区 | 亚洲国产系列一区二区| 日本真人添下面视频免费| 国产一区二区三区免费小视频 | 一区二区视频观看在线| 麻豆国产乱人伦精品一区二区| 成人av天堂一区二区| 少妇人妻一区二区三飞| 玖玖资源网站最新网站| 少妇激情高潮视频网站| 曰韩少妇内射免费播放| 脱了老师内裤猛烈进入| 在线涩涩免费观看国产精品| 大伊香蕉在线精品视频75| 综合网五月| 人妻av不卡一区二区三区| 日韩人妻免费视频一专区| 亚洲三区在线观看内射后入| 三级做a全过程在线观看| 蜜桃日本免费观看mv| 一本一道av无码中文字幕﹣百度 | 久久一区av蜜桃人妻| 日本女优免费一区二区三区| 在线观看国产成人av天堂野外| 亚洲视频一区二区三区视频| 精品欧洲av无码一区二区14| 国产成人综合亚洲精品| 蜜桃av噜噜一区二区三区| 国产精品爆乳在线播放| 中文岛国精品亚洲一区| 美女一区二区三区在线观看视频| 亚洲无人区乱码中文字幕动画 | 高清国产美女av一区二区| 在线视频日韩精品三区| 国产精品人妻熟女男人的天堂| 三个男吃我奶头一边一个视频| 国产肥熟女视频一区二区三区| 帮老师解开蕾丝奶罩吸乳视频| 亚洲男人第一av网站|