亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        資源同步框架ResourceSync及其在機(jī)構(gòu)知識(shí)庫(kù)中的應(yīng)用場(chǎng)景*

        2021-08-28 06:21:46王超
        數(shù)字圖書館論壇 2021年6期
        關(guān)鍵詞:源端知識(shí)庫(kù)列表

        王超

        (遼寧工業(yè)大學(xué)圖書館,錦州 121000)

        2017年11月,開放獲取知識(shí)庫(kù)聯(lián)盟(COAR)經(jīng)過(guò)長(zhǎng)期調(diào)研發(fā)布報(bào)告[1],描述了新一代機(jī)構(gòu)知識(shí)庫(kù)(IR)應(yīng)具有的11項(xiàng)新功能,并稱新一代機(jī)構(gòu)知識(shí)庫(kù)的資源轉(zhuǎn)移(resource transfer)、批量發(fā)現(xiàn)(batch discovery)、收集和公開活動(dòng)(collecting and exposing activities)、長(zhǎng)期保存(preserving resources)5項(xiàng)新功能主要依托于資源同步框架規(guī)范ResourceSync實(shí)現(xiàn)。

        ResourceSync是由美國(guó)國(guó)家標(biāo)準(zhǔn)協(xié)會(huì)(ANSI)指導(dǎo)研發(fā),并于2014年頒布。2017年更新的資源同步框架規(guī)范[2],可用于實(shí)現(xiàn)互聯(lián)網(wǎng)上不同系統(tǒng)之間的資源同步。郭少友等[3]和曹迪[4]對(duì)于ResourceSync在數(shù)字圖書館中的應(yīng)用場(chǎng)景進(jìn)行了探索,其中部分應(yīng)用場(chǎng)景同樣適應(yīng)于機(jī)構(gòu)知識(shí)庫(kù)的資源同步,但ResourceSync在數(shù)字圖書館中的應(yīng)用側(cè)重于資源的收集和保存,而機(jī)構(gòu)知識(shí)庫(kù)更側(cè)重于資源的開放和共享。筆者通過(guò)相關(guān)調(diào)研并結(jié)合現(xiàn)有研究,分析ResourceSync資源同步規(guī)范的基本原理,并探討其在機(jī)構(gòu)知識(shí)庫(kù)中應(yīng)用場(chǎng)景及應(yīng)注意的問(wèn)題及對(duì)策,使機(jī)構(gòu)知識(shí)庫(kù)功能更強(qiáng)大,最大程度地實(shí)現(xiàn)資源開放與共享。

        1 數(shù)字資源同步現(xiàn)行方法分析及Resource Sync的應(yīng)用

        筆者基于國(guó)內(nèi)外學(xué)者郭少友等[3]、曹迪[4]、劉樹等[5]、Zhen[6]、Haslhofer等[7]、Klein等[8]的研究并結(jié)合相關(guān)調(diào)研,認(rèn)為目前數(shù)字資源常用的同步方法可歸納為軟件同步、中間件同步、發(fā)布變化通知同步3類。

        1.1 軟件同步

        該方法的核心是將同步軟件分別安裝于源數(shù)據(jù)庫(kù)和目標(biāo)數(shù)據(jù)庫(kù),資源變化時(shí)使用軟件實(shí)現(xiàn)資源同步。此方法要求源數(shù)據(jù)庫(kù)和目標(biāo)數(shù)據(jù)庫(kù)是完全相同的網(wǎng)絡(luò)系統(tǒng),而且同步軟件需要根據(jù)數(shù)據(jù)庫(kù)情況自主研發(fā)。其優(yōu)勢(shì)在于源數(shù)據(jù)庫(kù)和目標(biāo)數(shù)據(jù)庫(kù)不分主從、互相同步,但軟件對(duì)環(huán)境要求較高,而且需要自主研發(fā)或修改,通用性不強(qiáng)。國(guó)內(nèi)此類同步軟件較多,比較有代表性的有劉樹等[5]研發(fā)的基于觸發(fā)器的變化捕獲器。

        1.2 中間件同步

        中間件是一種安裝于數(shù)據(jù)庫(kù)系統(tǒng)的應(yīng)用程序或者軟件,用于數(shù)據(jù)中轉(zhuǎn)站管理、傳輸計(jì)算機(jī)資源、實(shí)現(xiàn)網(wǎng)絡(luò)通信。源數(shù)據(jù)庫(kù)和目標(biāo)數(shù)據(jù)庫(kù)可通過(guò)中間件共享資源,當(dāng)源數(shù)據(jù)庫(kù)發(fā)生資源變化時(shí),向中間件發(fā)送變化信息,目標(biāo)數(shù)據(jù)庫(kù)獲取變化信息后進(jìn)行解析和轉(zhuǎn)儲(chǔ)。Zhen[6]使用JMS中間件程序,用4個(gè)步驟來(lái)實(shí)現(xiàn)不同數(shù)據(jù)庫(kù)之間的數(shù)據(jù)同步:①通過(guò)觸發(fā)器獲取源端的增量數(shù)據(jù);②增量數(shù)據(jù)轉(zhuǎn)換為XML文件;③以消息格式發(fā)送XML文件到目標(biāo)端;④使用XML解析器解析數(shù)據(jù)。利用中間件同步的優(yōu)點(diǎn)是可以在不同網(wǎng)絡(luò)系統(tǒng)之間共享資源,且中間件程序較為簡(jiǎn)單、開發(fā)難度低,還能實(shí)現(xiàn)一對(duì)多的資源同步。其缺點(diǎn)在于使用中轉(zhuǎn)站傳輸數(shù)據(jù),步驟較多、過(guò)程復(fù)雜,同時(shí)中間件需要使用專有的API和協(xié)議,不同中間件互操作困難。

        1.3 發(fā)布變化通知同步

        此類方法把資源提供者稱為源端,目的地?cái)?shù)據(jù)庫(kù)稱為目標(biāo)端,源端通過(guò)Sitemap協(xié)議發(fā)布變化通知(XML格式文件),目標(biāo)端獲知變化信息,再通過(guò)某種規(guī)范執(zhí)行資源同步操作。DSNotify的資源同步方法和ResourceSync資源同步規(guī)范均可歸為發(fā)布變化通知同步的方法。維也納大學(xué)Haslhofer等[7]提出一種基于DSNotify的資源同步方法,也稱資源斷鏈檢測(cè)與修復(fù)。從源端所有資源中抽取描述性特征,生成資源特征向量,通過(guò)DSNotify附加組件提取并導(dǎo)出資源的特征項(xiàng)(資源的URI及其特征向量),再由監(jiān)視器通過(guò)反復(fù)比對(duì)監(jiān)控本地資源變化情況,監(jiān)視器將檢測(cè)到的變化情況寫入事件日志,并發(fā)送通知到目標(biāo)端,目標(biāo)端據(jù)此修復(fù)資源斷鏈。DSNotify方法應(yīng)用的可行性已經(jīng)被網(wǎng)絡(luò)同步仿真實(shí)驗(yàn)證明,但DSNotify應(yīng)用仍有一定局限性,其適合處理關(guān)聯(lián)數(shù)據(jù),主要用于鏈接的同步,無(wú)法同步非文本資源。

        1.4 ResourceSync的優(yōu)越性及應(yīng)用

        ANSI頒布的ResourceSync資源同步框架規(guī)范,同時(shí)提供了兩款開源軟件——resync-simulator和resync,前者是資源同步信息發(fā)布工具,后者是資源同步工具。ResourceSync把元數(shù)據(jù)和元數(shù)據(jù)描述的對(duì)象數(shù)據(jù)視為資源,賦予它們不同的URI,使用Sitemap協(xié)議語(yǔ)法對(duì)元數(shù)據(jù)和對(duì)象數(shù)據(jù)進(jìn)行描述。ResourceSync把內(nèi)容提供者稱為源端,把打算復(fù)制源內(nèi)容的站點(diǎn)稱為目標(biāo)端。源端對(duì)資源進(jìn)行描述并對(duì)外發(fā)布能力列表,其中包括4種同步能力:資源列表、變化列表、資源轉(zhuǎn)儲(chǔ)庫(kù)、變化轉(zhuǎn)儲(chǔ)庫(kù),目標(biāo)端獲取能力列表后按規(guī)范步驟完成資源同步。相較于現(xiàn)行的數(shù)字資源同步方法,ResourceSync具有如下優(yōu)越性:與軟件同步方法相比,它不但省略了軟件研發(fā),而且具有4種同步能力,即環(huán)境適用性和通用性更強(qiáng);與中間件同步方法相比,它同樣具有在不同網(wǎng)絡(luò)系統(tǒng)之間實(shí)現(xiàn)一對(duì)多的同步能力,除此之外其源端和目標(biāo)端使用Sitemap協(xié)議直接建立聯(lián)系,不需要中間件,過(guò)程簡(jiǎn)單、不易出錯(cuò),還可減少延遲;與DSNotify相比,ResourceSync同步規(guī)范具有更強(qiáng)的通用性,DSNotify無(wú)法同步非文本資源,而ResourceSync適用于任何具有URI的資源之間的同步。

        自2014年頒布以來(lái),ResourceSync便因其優(yōu)越性受到廣泛重視。ResourceSync已經(jīng)在康奈爾大學(xué)圖書館和電子預(yù)印本數(shù)據(jù)庫(kù)arXiv中實(shí)現(xiàn)部分功能的成功應(yīng)用,并受到歐洲數(shù)字人文項(xiàng)目(Europeana)、美國(guó)數(shù)字公共圖書館(DPLA)等的關(guān)注。截至2020年底,DPLA的部分成員庫(kù)之間已經(jīng)采用ResourceSync實(shí)現(xiàn)數(shù)字資源互操作[9]。COAR工作組也將ResourceSync作為新一代機(jī)構(gòu)知識(shí)庫(kù)的核心技術(shù)、標(biāo)準(zhǔn)、協(xié)議之一。

        現(xiàn)代機(jī)構(gòu)知識(shí)庫(kù)不僅收錄了各種類型的海量數(shù)字資源,而且其資源是高度動(dòng)態(tài)化的,不斷地收錄新資源,更新或刪除舊的數(shù)據(jù)。ResourceSync適用于任何具有URI的資源之間的同步,而且采用模塊化設(shè)計(jì),靈活性強(qiáng),易于操作,具有廣泛的適用性。根據(jù)COAR報(bào)告的描述,ResourceSync主要應(yīng)用于3個(gè)方面。①資源長(zhǎng)期保存。采用鏡像同步備份等措施,為數(shù)據(jù)的長(zhǎng)期保存提供保障。②批量發(fā)現(xiàn)和獲取資源。在ResourceSync框架下,用戶可實(shí)現(xiàn)資源的批量發(fā)現(xiàn)和打包下載,提升機(jī)構(gòu)知識(shí)庫(kù)資源價(jià)值。③資源轉(zhuǎn)移?!癛esourceSync是一種基于站點(diǎn)地圖(Sitemap)的規(guī)范,存儲(chǔ)庫(kù)管理器可以使用該規(guī)范提供信息,允許第三方系統(tǒng)持續(xù)與其存儲(chǔ)庫(kù)中的資源保持同步,即創(chuàng)建、更新和刪除。站點(diǎn)地圖允許公開知識(shí)庫(kù)內(nèi)容和搜索引擎所需的元數(shù)據(jù)。ResourceSync可使用Sitemaps XML格式實(shí)現(xiàn)內(nèi)容和元數(shù)據(jù)的發(fā)現(xiàn)和同步”[10]。

        2 ResourceSync資源同步的基本原理

        2.1 ResourceSync框架結(jié)構(gòu)

        ResourceSync資源同步框架如圖1所示。源描述是目標(biāo)端了解數(shù)據(jù)源情況,實(shí)現(xiàn)同步的接入點(diǎn)。源描述枚舉數(shù)據(jù)源的能力列表,每個(gè)資源集都指向一個(gè)能力列表。如只有單一的源集合,則同步描述只包含一個(gè)指針;對(duì)于多個(gè)數(shù)據(jù)源(多個(gè)源使用索引的方法)的情況,其描述包括源描述和能力列表兩個(gè)層次。能力列表列舉了一組資源支持的4種能力:資源列表、變化列表、資源轉(zhuǎn)儲(chǔ)庫(kù)、變化轉(zhuǎn)儲(chǔ)庫(kù)的URI。

        圖1 ResourceSync資源同步框架

        ResourceSync框架規(guī)范把數(shù)字資源同步定義為4種情況:資源列表、變化列表、資源轉(zhuǎn)儲(chǔ)庫(kù)、變化轉(zhuǎn)儲(chǔ)庫(kù),分別與4種同步能力相對(duì)應(yīng)。

        (1)資源列表。ResourceSync框架規(guī)范將源端某一時(shí)刻(列表中時(shí)間戳屬性)允許同步的資源以列表呈現(xiàn),使用標(biāo)簽將其URI逐一列出。對(duì)于每個(gè)資源,資源列表最低限度地提供資源的URI,再添加

        圖2 ResourceSync資源同步過(guò)程

        (1)基準(zhǔn)同步。基準(zhǔn)同步是指目標(biāo)端與源端首次同步,目標(biāo)端復(fù)制源端基礎(chǔ)數(shù)據(jù)。按照ResourceSync規(guī)范,可通過(guò)資源列表和資源轉(zhuǎn)儲(chǔ)庫(kù)獲取源端基礎(chǔ)資源,實(shí)現(xiàn)基準(zhǔn)同步。第一,目標(biāo)端通過(guò)資源列表中資源的URIs,逐一發(fā)出HTTP請(qǐng)求,完成基準(zhǔn)同步。第二,目標(biāo)端還可以獲取源端發(fā)布的資源轉(zhuǎn)儲(chǔ)庫(kù)ZIP文件中的比特流信息,在資源清單的指導(dǎo)下解引內(nèi)容包。

        (2)增量同步。增量同步是指在基準(zhǔn)同步的基礎(chǔ)上,通過(guò)重復(fù)執(zhí)行增量同步,目標(biāo)端可以與源端保持動(dòng)態(tài)同步。源端發(fā)布變化列表傳達(dá)關(guān)于資源變化的信息,目標(biāo)端通過(guò)變化列表中列出的新創(chuàng)建或更新資源的URI獲取最新的內(nèi)容,同時(shí)同步刪除已刪除資源。目標(biāo)端還可以獲取源端的變化轉(zhuǎn)儲(chǔ)庫(kù)實(shí)現(xiàn)增量同步,和基準(zhǔn)同步類似,目標(biāo)端通過(guò)變化資源的URI獲取數(shù)據(jù)包,然后在變化清單的指導(dǎo)下解包。

        (3)審校。為了驗(yàn)證同步效果,目標(biāo)端必須能夠檢查它獲得的內(nèi)容是否與源端當(dāng)前資源在覆蓋率和準(zhǔn)確性方面相匹配。審校時(shí),目標(biāo)端將獲取資源(數(shù)據(jù)包)包含的元數(shù)據(jù)與源端提供資源的元數(shù)據(jù)進(jìn)行匹配驗(yàn)證,這些元數(shù)據(jù)描述了資源的最新狀態(tài),如上次修改時(shí)間、長(zhǎng)度和基于內(nèi)容的散列及其長(zhǎng)度。

        2.3 ResourceSync資源發(fā)現(xiàn)機(jī)制

        在實(shí)際操作中,目標(biāo)端如何發(fā)現(xiàn)源端發(fā)布的能力列表是實(shí)現(xiàn)資源同步的前提。在ResourceSync框架規(guī)范下,資源發(fā)現(xiàn)主要有:well-known URI、Link鏈接、robots協(xié)議3種方式(見圖3)。

        圖3 ResourceSync資源發(fā)現(xiàn)機(jī)制

        (1)well-known URI方法。一個(gè)數(shù)據(jù)源要發(fā)布源描述,源描述的URI:http://example.com。well-known URI資源發(fā)現(xiàn)方法就是在源描述URI添加前綴“/.wellknown/”,添加前綴的URI:http://www.example.com/.well-known/resourcesync。此特殊URI是目標(biāo)端獲取源端能力列表的適當(dāng)入口點(diǎn)。

        (2)Link鏈接方法。目標(biāo)端對(duì)于web(網(wǎng)頁(yè))類數(shù)字資源的同步,一般采用Link方法。在HTML文檔頂部()添加元素,此<鏈接> 必有一個(gè)rel屬性值為resourcesync,這表明可以通過(guò)的值URI可以發(fā)現(xiàn)源端的能力列表。由于Sitemap協(xié)議不提供目標(biāo)端從具有根元素文檔直接導(dǎo)航到其“父”文檔的方法,所以可通過(guò)標(biāo)簽up(向上)獲取源描述。

        (3)robots協(xié)議方法。該方法是首先向一個(gè)源端的robots.txt文件中添加一個(gè)Sitemap指令(Sitemap: http://example.com/dataset1/resourcelist.xml),“通過(guò)http://www.example.com/robots.txt,可獲取源數(shù)據(jù)端的robots.txt文件,該文件的值是資源列表的URI,目標(biāo)端據(jù)此發(fā)現(xiàn)源端的資源列表,進(jìn)而獲取能力列表。”[4]如果一個(gè)源端支持多個(gè)資源集,那么可以添加多個(gè)指令,每個(gè)指令對(duì)應(yīng)一個(gè)與特定資源集相關(guān)聯(lián)的資源列表。

        3 基于ResourceSync規(guī)范機(jī)構(gòu)知識(shí)庫(kù)資源同步場(chǎng)景

        國(guó)內(nèi)現(xiàn)有的機(jī)構(gòu)知識(shí)庫(kù)大多采用的是DSpace開源軟件作為系統(tǒng)平臺(tái),利用OAI進(jìn)行數(shù)據(jù)收割,然后導(dǎo)入中間元數(shù)據(jù)池,再通過(guò)數(shù)據(jù)接口或數(shù)據(jù)關(guān)聯(lián)等數(shù)據(jù)處理工具實(shí)現(xiàn)不同合集或不同區(qū)域資源的整合和分享,完成源數(shù)據(jù)的更新或同步。這種資源同步由于使用中轉(zhuǎn)站傳輸數(shù)據(jù),不同中間件互操作較困難,而且操作步驟較多、過(guò)程復(fù)雜,容易出現(xiàn)數(shù)據(jù)遲滯或混亂。ResourceSync框架規(guī)范由于環(huán)境適用性和通用性較強(qiáng),既可批量“收割”元數(shù)據(jù),也可實(shí)現(xiàn)對(duì)象資源的批量互操作,且過(guò)程簡(jiǎn)單,將成為下一代機(jī)構(gòu)知識(shí)庫(kù)資源同步的技術(shù)支撐。ResourceSync框架規(guī)范在機(jī)構(gòu)知識(shí)庫(kù)中實(shí)現(xiàn)資源同步主要有以下3個(gè)應(yīng)用場(chǎng)景。

        3.1 機(jī)構(gòu)知識(shí)庫(kù)與鏡像庫(kù)的同步方法

        學(xué)術(shù)機(jī)構(gòu)可以根據(jù)自身情況為機(jī)構(gòu)知識(shí)庫(kù)設(shè)立一個(gè)或多個(gè)鏡像站點(diǎn)(備份庫(kù)),機(jī)構(gòu)知識(shí)庫(kù)與其鏡像庫(kù)進(jìn)行備份同步。這既有利于機(jī)構(gòu)知識(shí)庫(kù)資源的長(zhǎng)期保存,也具有一定的分流作用,可減輕主服務(wù)器壓力。ResourceSync框架規(guī)范在資源發(fā)現(xiàn)機(jī)制上,由于雙方的隸屬關(guān)系,作為目標(biāo)端的鏡像站點(diǎn)無(wú)論采用何種發(fā)現(xiàn)方法都可輕易獲取作為源端的機(jī)構(gòu)知識(shí)庫(kù)資源。在同步方法上,鏡像站點(diǎn)可略過(guò)資源列表,直接獲取機(jī)構(gòu)知識(shí)庫(kù)資源轉(zhuǎn)儲(chǔ)庫(kù)數(shù)據(jù)包,完成基準(zhǔn)同步。增量同步和基準(zhǔn)同步類似,當(dāng)機(jī)構(gòu)知識(shí)庫(kù)資源發(fā)生變化(更新、刪除、創(chuàng)建)時(shí),直接獲取變化轉(zhuǎn)儲(chǔ)庫(kù),在資源清單的指導(dǎo)下完成增量同步。由于鏡像數(shù)據(jù)作為機(jī)構(gòu)知識(shí)庫(kù)備份,同步數(shù)據(jù)準(zhǔn)確性和完整性至關(guān)重要,同步操作完成后再根據(jù)清單常用信息對(duì)所有同步資源進(jìn)行審校。

        3.2 機(jī)構(gòu)知識(shí)庫(kù)與用戶之間的同步方法

        ResourceSync框架規(guī)范在機(jī)構(gòu)知識(shí)庫(kù)中的第二個(gè)應(yīng)用場(chǎng)景是通過(guò)機(jī)構(gòu)知識(shí)庫(kù)與用戶之間的同步,幫助用戶精準(zhǔn)發(fā)現(xiàn)、批量獲取機(jī)構(gòu)知識(shí)庫(kù)資源,提升用戶的使用體驗(yàn)。機(jī)構(gòu)知識(shí)庫(kù)用戶又分為個(gè)人用戶和機(jī)構(gòu)用戶兩類。首先,機(jī)構(gòu)知識(shí)庫(kù)按照ResourceSync框架規(guī)范對(duì)自建資源進(jìn)行源描述,為了兼顧不同的用戶,機(jī)構(gòu)知識(shí)庫(kù)為用戶提供全部同步能力,用戶根據(jù)需要選擇同步能力。其次,用戶可根據(jù)需求選擇資源發(fā)現(xiàn)方法。ResourceSync提供了3種資源發(fā)現(xiàn)機(jī)制,用戶可自主選擇。如用戶只需獲取機(jī)構(gòu)知識(shí)庫(kù)資源列表,那么選用robots協(xié)議方法即可實(shí)現(xiàn);若需要4種同步能力,則選用well-known URI或Link鏈接方法。在同步過(guò)程中,個(gè)人用戶一般對(duì)于資源的覆蓋率和準(zhǔn)確率要求較低,只需執(zhí)行基準(zhǔn)同步和增量同步,審校可略過(guò),而機(jī)構(gòu)用戶對(duì)于同步資源的準(zhǔn)確性和完整性要求較高,因而要嚴(yán)格按步驟執(zhí)行同步,審校環(huán)節(jié)不可省略。

        3.3 機(jī)構(gòu)知識(shí)庫(kù)與資源提供者之間的同步方法

        近年來(lái)機(jī)構(gòu)知識(shí)庫(kù)從機(jī)構(gòu)下轄科研院(所)或團(tuán)隊(duì)數(shù)據(jù)庫(kù)獲取資源正成為擴(kuò)大機(jī)構(gòu)知識(shí)庫(kù)資源持有量的主要途徑。縱觀國(guó)內(nèi)外知名機(jī)構(gòu)知識(shí)庫(kù)(國(guó)外如麻省理工圖書館機(jī)構(gòu)知識(shí)庫(kù)等,國(guó)內(nèi)如中國(guó)科學(xué)院系統(tǒng)機(jī)構(gòu)知識(shí)庫(kù)等)都采用ResourceSync框架規(guī)范與下轄的研究院(所)數(shù)據(jù)庫(kù)保持資源同步,這樣既可擴(kuò)大機(jī)構(gòu)知識(shí)庫(kù)資源持有量,也能保障資源實(shí)時(shí)更新。

        盡管機(jī)構(gòu)知識(shí)庫(kù)與機(jī)構(gòu)下轄的研究院(所)數(shù)據(jù)庫(kù)具有隸屬或者合作關(guān)系,但與鏡像站點(diǎn)數(shù)據(jù)備份不同,機(jī)構(gòu)知識(shí)庫(kù)從子數(shù)據(jù)庫(kù)中獲取資源要遵循既定目標(biāo)選擇性地同步。因此,在資源發(fā)現(xiàn)機(jī)制上,雙方可采用約定的發(fā)現(xiàn)方法。由于是選擇性同步,同步過(guò)程也較為簡(jiǎn)單,作為目標(biāo)端的機(jī)構(gòu)知識(shí)庫(kù)可略過(guò)子庫(kù)的資源轉(zhuǎn)儲(chǔ)庫(kù)和變化轉(zhuǎn)儲(chǔ)庫(kù),只需獲取子庫(kù)的資源列表和變化列表,根據(jù)資源的URI下載元數(shù)據(jù)或全文數(shù)據(jù),即可完成基準(zhǔn)同步。當(dāng)子庫(kù)資源發(fā)生變化時(shí),與基準(zhǔn)同步方法相同,通過(guò)獲取變化列表,完成增量同步。最后再根據(jù)獲取資源的常用信息(最新修改時(shí)間和散列及其長(zhǎng)度信息)驗(yàn)證同步效果。

        4 機(jī)構(gòu)知識(shí)庫(kù)資源同步中應(yīng)注意的問(wèn)題及對(duì)策

        機(jī)構(gòu)知識(shí)庫(kù)運(yùn)行是復(fù)雜的“生態(tài)系統(tǒng)”,Resource Sync資源同步框架規(guī)范在實(shí)際應(yīng)用中可能出現(xiàn)以下若干問(wèn)題。

        4.1 資源同步的實(shí)時(shí)性問(wèn)題及對(duì)策

        在機(jī)構(gòu)知識(shí)庫(kù)資源同步實(shí)踐中如何減少延遲,保障同步的實(shí)時(shí)性,是無(wú)法回避的現(xiàn)實(shí)問(wèn)題。在Resource Sync同步框架規(guī)范中,為保障同步的實(shí)時(shí)性,在實(shí)際操作中應(yīng)采用“推”“拉”結(jié)合的方式。當(dāng)機(jī)構(gòu)知識(shí)庫(kù)資源發(fā)生變化時(shí),應(yīng)及時(shí)發(fā)布(推送)變化通知,并提供變化列表或變化轉(zhuǎn)儲(chǔ)庫(kù),以便目標(biāo)端及時(shí)同步更新。同時(shí),目標(biāo)端應(yīng)動(dòng)態(tài)監(jiān)測(cè)源端資源變化情況,及時(shí)發(fā)送同步請(qǐng)求,根據(jù)比特流信息判斷資源變化情況,量少則通過(guò)變化列表完成同步,量大則打包下載變化轉(zhuǎn)儲(chǔ)庫(kù)。

        4.2 資源同步過(guò)程中數(shù)據(jù)格式轉(zhuǎn)換問(wèn)題及對(duì)策

        當(dāng)兩個(gè)網(wǎng)絡(luò)系統(tǒng)之間要實(shí)現(xiàn)大量同步資源,在數(shù)據(jù)傳輸?shù)倪^(guò)程中極易出現(xiàn)格式不一致的數(shù)據(jù)異構(gòu)性問(wèn)題。導(dǎo)致數(shù)據(jù)格式異構(gòu)的原因很多,主要源于計(jì)算機(jī)系統(tǒng)本身的復(fù)雜性。如何有效解決此類問(wèn)題是實(shí)現(xiàn)資源同步的關(guān)鍵。在機(jī)構(gòu)知識(shí)庫(kù)與鏡像庫(kù)同步中,“IR數(shù)據(jù)格式應(yīng)嘗試應(yīng)用可重復(fù)使用的Latex或TEI格式”[10],鏡像備份過(guò)程中盡量避免數(shù)據(jù)格式轉(zhuǎn)換,直接傳輸數(shù)據(jù)保存?zhèn)浞?。在機(jī)構(gòu)知識(shí)庫(kù)與用戶或資源提供者同步中,IR與資源使用者或提供者之間資源同步時(shí),目標(biāo)端獲取源端資源后,先使用ETL(抽取-轉(zhuǎn)換-加載)工具進(jìn)行格式轉(zhuǎn)換,數(shù)據(jù)轉(zhuǎn)換成功之后,再執(zhí)行基準(zhǔn)同步、增量同步以及審校。

        4.3 元數(shù)據(jù)與對(duì)象數(shù)據(jù)的協(xié)調(diào)同步問(wèn)題及對(duì)策

        現(xiàn)代機(jī)構(gòu)知識(shí)庫(kù)不僅收錄海量的數(shù)字資源,而且資源類型十分豐富。ResourceSync同步框架規(guī)范將元數(shù)據(jù)和對(duì)象數(shù)據(jù)分別賦予不同URI,兩者之間是描述與被描述的關(guān)系,如果元數(shù)據(jù)發(fā)生變化,其描述的對(duì)象數(shù)據(jù)也隨之變化,反之亦然。因此,在同步過(guò)程中可能出現(xiàn)兩類資源不協(xié)同的問(wèn)題,為了避免此類問(wèn)題,“應(yīng)在繼續(xù)保持二者之間描述與被描述關(guān)系的基礎(chǔ)上,分別對(duì)元數(shù)據(jù)資源及其所描述的對(duì)象資源間實(shí)施同步”[3]。

        5 結(jié)語(yǔ)

        機(jī)構(gòu)知識(shí)庫(kù)的研究和應(yīng)用已受到廣泛的重視和獲得長(zhǎng)足的發(fā)展,而ResourceSync資源同步框架規(guī)范在機(jī)構(gòu)知識(shí)庫(kù)中的應(yīng)用研究才初見端倪,利用Resource Sync同步原理,研究其在機(jī)構(gòu)知識(shí)庫(kù)中具體應(yīng)用場(chǎng)景,提出應(yīng)用過(guò)程中需要注意的問(wèn)題并給出相應(yīng)對(duì)策,才能更好地實(shí)現(xiàn)機(jī)構(gòu)知識(shí)庫(kù)的資源轉(zhuǎn)移、批量發(fā)現(xiàn)、長(zhǎng)期保存等新功能,使機(jī)構(gòu)知識(shí)庫(kù)功能更強(qiáng)大,最大程度地實(shí)現(xiàn)資源開放和共享。

        猜你喜歡
        源端知識(shí)庫(kù)列表
        巧用列表來(lái)推理
        學(xué)習(xí)運(yùn)用列表法
        擴(kuò)列吧
        融合源端句法和語(yǔ)義角色信息的AMR解析
        基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
        基于仿真分析的傳輸線電路特性研究
        飛機(jī)燃油系統(tǒng)對(duì)多路輸入信號(hào)源選擇的方法
        科技視界(2016年22期)2016-10-18 15:53:02
        高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
        基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
        圖書館研究(2015年5期)2015-12-07 04:05:48
        不含3-圈的1-平面圖的列表邊染色與列表全染色
        久久精品国产熟女亚洲av麻豆| 日日噜噜夜夜狠狠久久无码区| 一本一本久久a久久精品| 亚洲午夜看片无码| 激情偷拍视频一区二区| 国产一区二区三区四色av| 亚洲综合av一区二区三区| 国产主播一区二区三区在线观看| 国产av综合一区二区三区最新 | 欧美疯狂做受xxxxx高潮| 国产精品无码久久久久久久久作品 | 国产精品一区二区av麻豆日韩| 色偷偷亚洲第一成人综合网址 | 亚洲欧美日韩另类精品一区 | 亚洲av无码日韩精品影片| 日韩AV无码一区二区三不卡| 国产亚洲精品综合一区二区| 一边摸一边做爽的视频17国产 | 亚洲a∨天堂男人无码| 亚洲午夜精品国产一区二区三区| 青青草在线这里只有精品| 欧美乱人伦人妻中文字幕| 无码AV高潮喷水无码专区线| 果冻国产一区二区三区| 激情五月开心五月麻豆| 色www视频永久免费| 国产一区二区精品在线观看 | 国产综合自拍| 亚洲国产一区中文字幕| 又黄又刺激的网站久久| 男人扒开女人下面狂躁小视频| 久久99热精品免费观看欧美| 口爆吞精美臀国产在线| 色多多性虎精品无码av| 成人亚洲性情网站www在线观看| 中国女人a毛片免费全部播放 | 中文字幕大乳少妇| 在线观看午夜视频国产| 少妇粉嫩小泬喷水视频www| 91久久精品国产91久久| 一区二区三区四区日韩亚洲|