亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Heraclitus II的數(shù)字資源長期保存系統(tǒng)

        2016-02-23 03:38:25鞠彥輝牟冬梅
        計算機技術(shù)與發(fā)展 2016年3期
        關(guān)鍵詞:資源

        鞠彥輝,牟冬梅

        (1.渤海大學(xué) 管理學(xué)院,遼寧 錦州 121000;2.吉林大學(xué) 公共衛(wèi)生學(xué)院,吉林 長春 130021)

        基于Heraclitus II的數(shù)字資源長期保存系統(tǒng)

        (1.渤海大學(xué) 管理學(xué)院,遼寧 錦州 121000;2.吉林大學(xué) 公共衛(wèi)生學(xué)院,吉林 長春 130021)

        為了改進當前數(shù)字資源長期保存技術(shù)存在的缺點,有效構(gòu)建數(shù)字資源長期保存系統(tǒng),在分析當前基于本體的數(shù)字資源長期保存系統(tǒng)存在的如本體集成度差、不能提供本體進化時的時間語義信息、忽視一致性維護和更改傳播等缺點的基礎(chǔ)上,介紹了Heraclitus II雙時態(tài)本體模型及其應(yīng)用特點,主要基于Heraclitus II本體技術(shù)構(gòu)建了數(shù)字資源長期保存系統(tǒng)。具體包括本體構(gòu)建和集成、協(xié)同本體管理、本體演化需求、本體演化過程等組件,詳細分析了各個組件的功能。研究結(jié)果表明,應(yīng)用Heraclitus II雙時態(tài)本體技術(shù)能有效構(gòu)建數(shù)字資源長期保存系統(tǒng),實現(xiàn)數(shù)字資源長期保存的要求。研究結(jié)果對新媒體環(huán)境下數(shù)字資源長期保存系統(tǒng)的構(gòu)建有一定參考作用。

        Heraclitus II本體;本體;長期保存;數(shù)字資源

        0 引 言

        現(xiàn)在如圖書館、檔案館、文化機構(gòu)、科學(xué)組織和政府機構(gòu)等相關(guān)部門信息組織面臨的一個主要挑戰(zhàn)是數(shù)字資源的長期保存和訪問問題。每隔幾年數(shù)字對象保存所依賴的硬件、軟件、數(shù)字資源、數(shù)據(jù)模型和標準就得升級或更換,數(shù)字對象保存需要持續(xù)和昂貴的維護成本。數(shù)據(jù)收集和內(nèi)容創(chuàng)作的加速,數(shù)字資源日益增加的復(fù)雜性意味著許多組織已經(jīng)不能滿足數(shù)據(jù)保存的需要。數(shù)字資源長期保存是指隨著時間的推移,長時間保存和管理數(shù)字資源。它要求數(shù)字資源長期、準確無誤的存儲,在信息需求的整個時間跨度內(nèi)能被檢索、獲取和解釋[1-2]。

        元數(shù)據(jù)(metadata)和本體(ontology)已被證明是數(shù)字資源長期保存的重要因素。然而,元數(shù)據(jù)是描述性的,它將一個對象作為一組屬性的記錄,這使得元數(shù)據(jù)在描述數(shù)字對象間存在的依賴關(guān)系時效率低下,特別是時間關(guān)系的描述,對數(shù)字資源保存過程來說過于簡單,數(shù)字對象之間關(guān)系的描述對長期保存來說是一個關(guān)鍵的要求。此外,由于需要元數(shù)據(jù)有處理繼承的能力,對特定領(lǐng)域的要求來說核心元素集的可擴展性也是一個問題。本體提供組織和表示知識庫語義的方法,以面向?qū)ο蟮姆绞绞褂帽倔w可以更好地描述數(shù)字對象之間的依賴關(guān)系[3-4]。通過調(diào)查發(fā)現(xiàn),現(xiàn)有主要的本體管理和演化方法如GATE,Ellogon,UIMA,Sesame &OMM,OntoView,PROMPT,KAON,SHOE等存在某些不足。首先,本體集成度差,很少采用本體的分層結(jié)構(gòu)。其次,缺乏捕獲和提高本體中時態(tài)信息的本體模型,不能提供本體進化時足夠的時間語義信息。最后,本體演化的關(guān)鍵問題,如一致性維護和更改傳播往往被忽視。

        為了解決這些數(shù)字資源長期保存中存在的問題,文中研究基于Heraclitus II(赫拉克利特II)雙時態(tài)(temporal)本體分層結(jié)構(gòu)模型構(gòu)建數(shù)字資源長期保存系統(tǒng)。

        1 Heraclitus II雙時態(tài)本體模型簡介

        本體論模型描述不同組件之間復(fù)雜的關(guān)系,以及它們隨時間的推移與演化。為了捕獲需要保存的本體的時間因素,有學(xué)者提出了Heraclitus II雙時態(tài)本體模型[5]。概念、關(guān)系和實例是Heraclitus II本體的基本對象。Heraclitus II框架把本體作為信息管理語義豐富的知識庫,并提出這個知識庫管理和演化的方法。Heraclitus II采用本體分層結(jié)構(gòu),從下到上依次為詞匯(Lexical)本體層、領(lǐng)域(Domain)本體層、數(shù)據(jù)源(Data Source)本體層和應(yīng)用(Application)本體層。低層代表更通用的、所有目的的本體,上層是為信息管理系統(tǒng)內(nèi)的某些用途定制。當從底部到頂部穿過每一層時,每層復(fù)用和擴展以前的層,這些通過使用相鄰層本體構(gòu)建單元(如概念、關(guān)系和實例)間的映射執(zhí)行。此外,當一層擴展它下面的層時(例如插入新概念),這些擴展傳播到較低的層。每一層由本體作者的不同群組保持,依靠每一層需求的專門知識。通過屬于同一層(內(nèi)層)或不同層(跨層)本體映射實現(xiàn)本體金字塔層級集成。

        2 基于Heraclitus II雙時態(tài)本體的數(shù)字資源長期保存系統(tǒng)構(gòu)建

        為了有效管理數(shù)字資源相關(guān)的語義及其提供的服務(wù),使用Heraclitus II構(gòu)建一個分層的數(shù)字資源語義知識庫。首先,根據(jù)研究的要求構(gòu)建每個本體層。其次,為了定義不同層的集成,在不同層間創(chuàng)建適當?shù)逆溄樱瓿蒆eraclitus II本體金字塔的構(gòu)建。最后,實現(xiàn)本體演化。

        2.1 本體構(gòu)建和集成

        為了在數(shù)字資源長期保存系統(tǒng)中應(yīng)用Heraclitus II框架,采取以下步驟。首先,根據(jù)研究需求構(gòu)建每個本體層。層間進行彼此映射,以便被集成進Heraclitus II本體金字塔。為建設(shè)每個本體層,需要指定參與的本體作者群體。本體映射取決于它們的范圍,它們的維持需要一或兩個作者群體共同努力。層內(nèi)本體映射被分配給負責(zé)相應(yīng)層的作者群。通過本體映射,本體金字塔層集成到一個可管理的模式。Heraclitus II本體映射由屬于同一個或不同層本體對象間的關(guān)系組成[10]。

        在數(shù)字資源長期保存系統(tǒng)中,使用本體的一個基本問題是建立一個被所有不同背景的用戶接受的一致的本體版本。每個參與方,基于他們的專業(yè)知識和要求,對問題有不同的概念化。在本體構(gòu)建和維護中,Heraclitus II多層次結(jié)構(gòu)通過分配給每個用戶組一個不同的角色來解決這個問題。在這種方式中,因為每個用戶組重點研究他們感興趣的領(lǐng)域,本體構(gòu)建的任務(wù)變得更加容易。

        自頂向下的本體建模方法,不適合表達專家如何看待他們的專業(yè)技術(shù)領(lǐng)域。在模型化一定領(lǐng)域中本體的層級分類可能引起嚴重的問題。此外,為了完全覆蓋領(lǐng)域的所有方面,本體作者要付出大量的努力以創(chuàng)造用于邏輯推理的本體和元數(shù)據(jù)。Heraclitus II通過演化解決這個問題,即使開始的本體是不完整的,它可以通過一個有效的演化過程隨時間提高質(zhì)量。

        為Heraclitus II進行本體構(gòu)建與本體金字塔結(jié)構(gòu)密切相關(guān)。在構(gòu)建Heraclitus II金字塔時,本體作者關(guān)心的主要問題是“本體對象被放置在哪一層?”,有些情況下構(gòu)建的本體可以屬于一個以上的層。由于一層結(jié)束下一層開始,這會引起混亂。在這種情況下,本體的作者必須達成一致協(xié)議,使用層間映射處理包括的層,在演化過程中可以修訂、糾正[11]。

        2.2 協(xié)同本體管理的挑戰(zhàn)

        在構(gòu)建和維護本體過程中,不同部分之間的協(xié)同是現(xiàn)代數(shù)字資源長期保存系統(tǒng)一個重要的成功因素[12]。因為隨著知識庫在規(guī)模和多樣性方面的不斷成長,需要增加更多樣化的本體作者,以支持協(xié)同本體管理環(huán)境的一些重要任務(wù)。使用以下指標評價Heraclitus II協(xié)同情況[13]。

        知識集成:協(xié)同環(huán)境的一個基本任務(wù)是整合多個參與者的貢獻。Heraclitus II提供了一個由多方構(gòu)建和管理的多層結(jié)構(gòu)體系。通過本體映射支持可重用性和集成。

        并發(fā)管理:本體作者需要在知識庫不同部分同時工作。在知識庫同一部分由一個以上作者同時編輯的情況下,可能會導(dǎo)致沖突。Heraclitus II提供各種技術(shù)(非實時)解決這個問題,如并發(fā)版本系統(tǒng)(Concurrent Versions System,CVS)、維基(Wiki)或點對點(peer-to-peer)為基礎(chǔ)的解決方案。

        一致性維護:因為本體通常反映每個作者的觀點,部分知識庫由不同作者開發(fā)可能引起相互不一致。Heraclitus II提供結(jié)構(gòu)和語義一致性維護機制和變更傳播以確保知識庫總是保持完全一致。

        權(quán)限管理:為了保證知識庫的準確性,根據(jù)自己的專業(yè)、權(quán)限和責(zé)任,依需要給用戶分配不同級別的權(quán)限。通過給每個用戶組負責(zé)的層相同的特權(quán),實現(xiàn)權(quán)限管理的完整方案。

        歷史維護:協(xié)同環(huán)境應(yīng)該提供從錯誤恢復(fù)和解決知識庫意外變化的手段。為了能夠跟蹤變化的作者和防止重要信息的丟失,知識庫的所有變化都應(yīng)該記錄下來。

        可擴展性:知識庫多個部分長期合作通常會增加其大小,協(xié)同環(huán)境不得不擴展到更大的本體[14]。

        2.3 本體演化需求

        Heraclitus II框架在本體演化方面有一些需求特性。首先,演化過程對作者是透明的。Heraclitus II本體的分層方案為每個本體層定義相應(yīng)的作者。這些作者的任務(wù)是監(jiān)督本體的建設(shè)和維護。特別地,本體金字塔建設(shè)是半自動的,通過聚類或分類算法輔助作者工作。在演化過程中,作者可能需要捕獲變化并復(fù)查系統(tǒng)捕獲的變化,從而改進由此產(chǎn)生的本體質(zhì)量。一致性維護是Heraclitus II本體演化的另一個目標。去除一個有子概念的概念會影響本體的一致性。執(zhí)行變化后需要一組操作保持一致性。這組操作或關(guān)注改變的本體,或關(guān)注依賴改變本體的其他本體。在后一種情況下,為了變化被傳播到依賴本體的相應(yīng)部位將考慮Heraclitus II元本體映射。例如,由于被刪除、合并或分裂,兩個映射概念之一不存在了,這也會影響到其他的映射概念。為了實現(xiàn)演化過程的進一步自動化,作者需要定義一致性維護操作集或傳播策略。通過定義涵蓋最常見不一致情況下的傳播策略以減少作者的負荷。然而,作者應(yīng)該能夠檢查所有提出的本體的變化,包括依賴的任何級聯(lián)影響。如果需要,允許作者通過重寫傳播策略以保持對演化過程的完全控制。

        本體演化過程也應(yīng)該是可逆的,即提供撤消一套本體變化回到一致性以前狀態(tài)的能力。主要有兩種方法來實現(xiàn)可逆性:每一組變化應(yīng)用后保持同一本體的不同版本,或通過保持演化的歷史數(shù)據(jù),包含所有執(zhí)行變化的集合。為了實現(xiàn)高效的版本管理,所有本體版本需要互聯(lián)[15]。在這種情況下,可以應(yīng)用元本體描述不同版本之間的關(guān)系。此外,查詢進化的歷史數(shù)據(jù)將提供本體結(jié)構(gòu)演化的時間信息。例如,通過分析其歷史信息捕獲概念表現(xiàn)出的時間運動的“概念漂移”現(xiàn)象,保存在策略知識庫中。使用時態(tài)關(guān)聯(lián)規(guī)則挖掘,傳播策略里尚未被捕獲的概念之間的依賴性識別也是可能的[5]。

        Heraclitus II本體演化的另一個目標是一致性保存。這在兩個層次上進行:結(jié)構(gòu)和語義。解決因為變化導(dǎo)致本體結(jié)構(gòu)或語義產(chǎn)生的不一致。此外,特殊本體里產(chǎn)生的變化傳播到內(nèi)部(內(nèi)部改變的本體),以及外部(依靠內(nèi)外層映射的本體),實現(xiàn)所有本體層同時演化。Heraclitus II本體金字塔建設(shè)是半自動的,通過聚類或分類算法輔助進行。為構(gòu)建每個本體層,需要指定的本體作者群參與。

        2.4 本體演化過程

        圖1 本體演化過程

        使用Web挖掘和聚類技術(shù)自動捕捉變化,或由作者手動捕捉變化[16]。捕獲的變化主要是應(yīng)用驅(qū)動或數(shù)據(jù)驅(qū)動。本體應(yīng)用驅(qū)動的變化源于本體使用方式的變化,被捕捉的數(shù)據(jù)驅(qū)動的變化源于本體中數(shù)據(jù)的變化。這種差異只影響變化產(chǎn)生的方式。當一個應(yīng)用以相應(yīng)的本體與應(yīng)用持續(xù)正常運行相一致的方式修改時,在應(yīng)用層捕獲應(yīng)用驅(qū)動的變化。被捕獲的本體變化包括在概念間插入新關(guān)系。進一步的改進包括創(chuàng)建新的類別、去除現(xiàn)有的類別以及改變概念所屬層次的水平。每當數(shù)據(jù)源的結(jié)構(gòu)修改時在數(shù)據(jù)源層發(fā)生數(shù)據(jù)驅(qū)動的變化,例如一個新的主題分類加到一個門戶網(wǎng)站或一個主題分類分為更多新的分類。在領(lǐng)域?qū)?,從領(lǐng)域的變化捕獲數(shù)據(jù)驅(qū)動的變化。例如,當一個新公司介紹到該領(lǐng)域或發(fā)生合并時,模型化一個市場領(lǐng)域的本體需要更新。在詞匯層,數(shù)據(jù)驅(qū)動的變化關(guān)系語言上詞典編纂的變化。

        本體演化周期的下一步是不一致性檢測和解決方案。由于檢測到本體的變化或依賴本體的變化,每個捕獲的變化都可能導(dǎo)致不一致[17]。不一致檢測在兩個層面進行:本地(本體內(nèi)部的改變)和遠程(獨立本體)。在第二種情況下,元本體(metaontologies)用于抽取不同層相同本體間的關(guān)系;基于這些關(guān)系,確定受影響的本體部分。

        變化及其結(jié)果建立后,讓作者審查到目前為止演化過程的結(jié)果。在這一階段,涉及相應(yīng)的受影響的本體層的作者。

        在演化的后一階段,審查應(yīng)用和傳播的變化。特別地,修改各層本體以適應(yīng)在演化第一階段捕獲的變化,以及通過認可的傳播政策展示的傳播結(jié)果。

        最后,元本體包括在與前一階段的應(yīng)用變化對齊的不一致解決方案中。例如,元本體含有兩個實例映射,其中一個被刪除就需要更新。因此,在元本體上執(zhí)行一個新的演化周期。變化捕獲階段識別元本體的變化。任何不一致都被檢測并用適當?shù)膫鞑ゲ呗越鉀Q。這個周期執(zhí)行期間唯一的區(qū)別是除了修改沒有傳播到元本體,因為元本體之間沒有依賴關(guān)系。作者審查后,更新元本體保存一致性狀態(tài)[18]。

        3 結(jié)束語

        文中構(gòu)建了基于HeraclitusII本體的數(shù)字資源保存系統(tǒng)模型。提出的知識庫分層結(jié)構(gòu)定義了不同類型的保存本體,在本體作者不同群體中分配責(zé)任。這種架構(gòu)的本體(從通用的到專業(yè)的)通過本體映射集成。詳述了本體構(gòu)建、協(xié)同本體管理、本體演化需求、本體演化過程等內(nèi)容。研究結(jié)果對新媒體環(huán)境下數(shù)字資源長期保存系統(tǒng)的構(gòu)建有一定的參考作用。

        [1]JonesM,BeagrieN.Preservationmanagementofdigitalmaterials:ahandbook[M].London,UK:BritishLibraryPublish,2001.

        [2] 趙玉宇.國外數(shù)字資源長期保存的熱點問題研究[J].圖書館建設(shè),2011(6):19-23.

        [3]NgK,PhamTV,OngB,etal.Ontologyforpreservationofinteractivemultimediaperformances[M]//Metadataandsemantics.US:Springer,2009:37-38.

        [4] 劉金花,張友華,李紹穩(wěn),等.本體演化研究進展[J].計算機系統(tǒng)應(yīng)用,2011,20(7):239-243.

        [5]MikroyannidisA,TheodoulidisB.HeraclitusII:aframeworkforontologymanagementandevolution[C]//Procof2006IEEE/WIC/ACMinternationalconferenceonwebintelligence.HongKong,China:IEEE,2006:514-521.

        [6]KakoudakisI,TheodoulidisB.TAU:towardsatemporalobject-orientedDBMS[C]//Procof9thinternationaldatabaseconference.HongKong:[s.n.],1999.

        [7]MikroyannidisA,OngB,NgK,etal.Ontology-basedtemporalmodellingofprovenanceinformation[C]//Procof14thIEEEmediterraneanelectrotechnicalconference.Ajaccio,France:IEEE,2008:178-179.

        [8] 田曉云,方麗英,閆健卓,等.有時態(tài)本體模型及其管理原型系統(tǒng)[J].計算機工程,2010,36(3):41-43.

        [9]MikroyannidisA,OngB,NgK.Ontology-drivendigitalpreservationofinteractivemultimediaperformances[C]//Proceedingsofthe3rdinternationalconferenceonautomatedproductionofcrossmediacontentformulti-channeldistribution.[s.l.]:[s.n.],2008:3-5.

        [10]NgK,MikroyannidisA,OngB,etal.Ontologymanagementfor

        preservation of interactive multimedia performances[C]//Proceedings of the international computer music conference.Belfast:[s.n.],2008.

        [11] Mikroyannidis A,Theodoulidis B.Ontology management and evolution for business intelligence[J].International Journal of Information Management,2010,30(6):559-566.

        [12] 李偉超.數(shù)字資源長期協(xié)同保存問題研究[J].創(chuàng)新科技,2013(7):58-59.

        [13] Bao J,Hu Z,Caragea D,et al.A tool for collaborative construction of large biological ontologies[C]//Proc of 17th international conference on database and expert systems applications.Krakow,Poland:[s.n.],2006.

        [14] Mikroyannidis A.A semantic framework for cloud learning environments[M]//Cloud computing for teaching and learning:strategies for design and implementatio.[s.l.]:IGI Global,2012:17-31.

        [15] 王 興,何婷婷,莊 超.本體演化及本體的版本管理機制研究[J].計算機與數(shù)字工程,2006,34(7):7-10.

        [16] 徐 靜,宋 文.本體演化管理的方法和關(guān)鍵技術(shù)研究進展[J].圖書情報工作,2011,55(14):122-124.

        [17] 薛建武,趙 娜,高俊萍,等.本體演化過程中的實例完備性研究[J].情報雜志,2013,32(9):175-179.

        [18] Mikroyannidis A.Evolving e-learning ontologies for personal and cloud learning environments[C]//Proc of 2011 seventh international conference on signal image technology & internet-based systems.[s.l.]:[s.n.],2011.

        Long-term Preservation System of Digital Resources Based on Heraclitus II

        JU Yan-hui1,MU Dong-mei2

        (1.Management School of Bohai University,Jinzhou 121000,China;2.School of Public Health,Jilin University,Changchun 130021,China)

        In order to improve the shortcomings of current long-term preservation technology of digital resources and effectively construct long-term preservation system of digital resources,based on the analysis of the problems such as poor ontology integration,not providing time semantic information of ontology evolution,neglecting consistency maintenance and propagating changes of long-term preservation system of digital resources based on ontology,the Heraclitus II bitemporal ontology model and its application characteristics are introduced.It mainly constructs long term preservation system of digital resources based on Heraclitus II ontology technology in this paper.The system includes the ontology construction and integration,ontology collaborative management,ontology evolution requirements,ontology evolution process components,and the function of each component is analyzed in detail.The research indicates that long-term preservation system of digital resources can be effectively constructed based on Heraclitus II bitemporal ontology technology,achieving requirements of long-term preservation system of digital resources,which gives a certain reference to construct long-term preservation system of digital resources under the environment of new media.

        Heraclitus II ontology;ontology;long-term preservation;digital resources

        2015-06-12

        2015-09-16

        時間:2016-02-18

        國家自然科學(xué)基金資助項目(71273111)

        鞠彥輝(1974-),男,副教授,碩導(dǎo),博士,研究方向為信息資源管理。

        http://www.cnki.net/kcms/detail/61.1450.TP.20160218.1630.038.html

        G250.76

        A

        1673-629X(2016)03-0172-04

        10.3969/j.issn.1673-629X.2016.03.040

        猜你喜歡
        資源
        讓有限的“資源”更有效
        污水磷資源回收
        基礎(chǔ)教育資源展示
        崛起·一場青銅資源掠奪戰(zhàn)
        一樣的資源,不一樣的收獲
        我給資源分分類
        資源回收
        做好綠色資源保護和開發(fā)
        當代貴州(2018年28期)2018-09-19 06:39:04
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        激活村莊內(nèi)部治理資源
        決策(2015年9期)2015-09-10 07:22:44
        蜜臀av毛片一区二区三区 | av天堂手机在线免费| 亚洲国产综合精品中久| 高潮抽搐潮喷毛片在线播放| 国产剧情麻豆女教师在线观看| 国产精品久久久久久久专区| 日本在线无乱码中文字幕| 国产精品美女久久久网av| 人妻在线日韩免费视频| 欧美色图50p| 射进去av一区二区三区| 五月四房播播| 精品一区二区三区在线观看| 久久精品综合国产二区| 国产午夜免费一区二区三区视频 | 久久99精品国产99久久6尤物| 亚洲福利天堂网福利在线观看| 久久精品国产亚洲av夜夜| 国产日产欧产精品精品蜜芽| 国产成人午夜精华液| 日韩在线视精品在亚洲| 亚洲一区在线二区三区| 中文字幕在线日亚州9| 又粗又大又黄又爽的免费视频| 色窝综合网| 日本a级黄片免费观看| 妇女bbbb插插插视频| 亚洲自偷自偷偷色无码中文| 好爽要高潮了在线观看| 美女视频在线观看亚洲色图| 久久久久亚洲av片无码v| 美女高潮黄又色高清视频免费| 法国啄木乌av片在线播放| 手机在线中文字幕国产| 中文字幕中文字幕在线中二区| 小鲜肉自慰网站| 亚洲AV综合A∨一区二区| 精品亚洲一区二区在线观看| 浪货趴办公桌~h揉秘书电影| 亚洲国产中文在线二区三区免| 亚洲中文字幕熟女五十|