亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量管理研究

        2018-08-16 02:52:32
        中國(guó)科技資源導(dǎo)刊 2018年3期
        關(guān)鍵詞:生命周期維度流程

        董 微 趙 捷

        (中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)

        0 引言

        伴隨著網(wǎng)絡(luò)信息基礎(chǔ)設(shè)施的完善以及學(xué)術(shù)信息交流模式的轉(zhuǎn)變,開(kāi)放獲取運(yùn)動(dòng)逐步得到學(xué)術(shù)團(tuán)體、政府等支持,資源數(shù)量急劇增長(zhǎng)。而開(kāi)放期刊資源作為知識(shí)傳承、傳播的重要載體,通過(guò)全面采集、組織與揭示實(shí)現(xiàn)了高效傳播與有效利用,形成“互聯(lián)網(wǎng)+”時(shí)代滿(mǎn)足用戶(hù)需求的新信息資源體系。元數(shù)據(jù)作為揭示開(kāi)放資源內(nèi)容、屬性及特征等信息的一種數(shù)據(jù)形式,在資源整合、資源檢索、資源發(fā)現(xiàn)、資源評(píng)估及資源管理等應(yīng)用中發(fā)揮著非常重要的作用[1-4],因而開(kāi)放期刊資源的元數(shù)據(jù)質(zhì)量直接影響著開(kāi)放期刊資源的建設(shè)水平與服務(wù)質(zhì)量。目前,由于開(kāi)放期刊資源獲取渠道多樣、著錄格式不統(tǒng)一、管理流程不盡合理以及圖書(shū)館缺乏不同專(zhuān)業(yè)背景的技術(shù)人員等原因,造成了開(kāi)放期刊資源的數(shù)據(jù)質(zhì)量參差不齊,從而影響了開(kāi)放期刊資源的有效利用。如何對(duì)開(kāi)放期刊資源進(jìn)行質(zhì)量管理、建設(shè)高質(zhì)量的元數(shù)據(jù)倉(cāng)儲(chǔ)、為用戶(hù)提供更好的服務(wù)是圖書(shū)館亟待解決的問(wèn)題。

        開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量管理是通過(guò)建立統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),對(duì)管理流程進(jìn)行規(guī)劃,并運(yùn)用相應(yīng)的技術(shù)和方法,對(duì)人員進(jìn)行培訓(xùn)和要求,以提高元數(shù)據(jù)質(zhì)量,最終向用戶(hù)提供資源服務(wù)。目前,針對(duì)開(kāi)放期刊資源的元數(shù)據(jù)質(zhì)量管理尚不成熟,還沒(méi)有一套能夠適合國(guó)內(nèi)實(shí)際情況的元數(shù)據(jù)質(zhì)量管理方案。因此,本文結(jié)合國(guó)家科技圖書(shū)文獻(xiàn)中心(NSTL)開(kāi)放期刊資源建設(shè)的實(shí)踐經(jīng)驗(yàn),對(duì)期刊元數(shù)據(jù)質(zhì)量管理的相關(guān)問(wèn)題進(jìn)行研究與探討。

        1 影響開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量因素分析

        開(kāi)放期刊資源具有分布廣泛、來(lái)源各異,具有數(shù)量巨大、生命周期短暫、存儲(chǔ)分散、類(lèi)型格式復(fù)雜、資源組織異構(gòu)、粒度層級(jí)復(fù)雜等特點(diǎn)[5-6],而開(kāi)放期刊資源元數(shù)據(jù)采集、加工的單位眾多,著錄者對(duì)元數(shù)據(jù)元素理解不準(zhǔn)確,使得元數(shù)據(jù)在質(zhì)量方面存在參差不齊的現(xiàn)象,不僅降低了開(kāi)放期刊資源服務(wù)的質(zhì)量,而且為開(kāi)放期刊資源信息的采集、整合和服務(wù)帶來(lái)了新的挑戰(zhàn)。

        結(jié)合實(shí)際工作,通過(guò)分析發(fā)現(xiàn),目前影響開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量的主要因素有元數(shù)據(jù)、管理流程、人員、技術(shù)支持等4個(gè)方面。

        (1)元數(shù)據(jù)。在開(kāi)放期刊資源建設(shè)過(guò)程中,元數(shù)據(jù)的生成主要通過(guò)兩種方式:一是利用軟件通過(guò)元數(shù)據(jù)抽取 (metadata extraction) 和元數(shù)據(jù)收集 (metadata harvesting) 自動(dòng)生成[7];二是對(duì)采集到的元數(shù)據(jù)進(jìn)行補(bǔ)充加工。然而,通過(guò)兩種方式生成的元數(shù)據(jù)質(zhì)量存在諸多問(wèn)題,比如:數(shù)據(jù)源所在平臺(tái)較多、頁(yè)面揭示多樣、更新時(shí)間不穩(wěn)定、元數(shù)據(jù)厚薄不均、全文格式不統(tǒng)一等,從而造成采集的元數(shù)據(jù)準(zhǔn)確性、完整性、及時(shí)性、有效性較差;數(shù)據(jù)補(bǔ)充加工由不同的著錄者進(jìn)行著錄,這是一種分散的、難以控制的行為,若著錄者對(duì)元數(shù)據(jù)元素理解不準(zhǔn)確,則造成數(shù)據(jù)著錄不一致、格式各異等問(wèn)題。

        (2)管理流程。開(kāi)放期刊資源數(shù)據(jù)量巨大,對(duì)于大型服務(wù)系統(tǒng)往往是由多成員單位共同承擔(dān)建設(shè),因此科學(xué)性、規(guī)范化的管理流程至關(guān)重要。通過(guò)從整體流程考慮元數(shù)據(jù)的質(zhì)量控制,對(duì)元數(shù)據(jù)的質(zhì)量控制貫穿于元數(shù)據(jù)的整個(gè)生命周期,實(shí)現(xiàn)對(duì)元數(shù)據(jù)質(zhì)量的完全控制,從根本上提高元數(shù)據(jù)質(zhì)量。

        (3)人員。開(kāi)放期刊資源的元數(shù)據(jù)質(zhì)量管理是一項(xiàng)復(fù)雜的工作,對(duì)于工作人員的專(zhuān)業(yè)水平要求較高,如對(duì)編目流程、著錄規(guī)則和著錄規(guī)范的掌握、對(duì)數(shù)據(jù)定期抽樣審核以及輔助工具的使用等,因此需要安排專(zhuān)業(yè)人員把控各個(gè)環(huán)節(jié),及時(shí)發(fā)現(xiàn)其中的錯(cuò)誤并進(jìn)行改正,以防止問(wèn)題的長(zhǎng)期積累。

        (4)技術(shù)支持。隨著開(kāi)放期刊資源的飛速增長(zhǎng),描述資源的元數(shù)據(jù)數(shù)量也在劇增,完全依賴(lài)于人工的質(zhì)量控制已經(jīng)無(wú)法實(shí)現(xiàn),因此機(jī)器的自動(dòng)化輔助十分必要。

        2 開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量管理模型

        本文提出的模型構(gòu)建基于多成員單位協(xié)同建設(shè)開(kāi)放期刊資源,考慮到開(kāi)放期刊資源不同于普通的數(shù)字資源,具有動(dòng)態(tài)更新的特點(diǎn),即對(duì)于已發(fā)布的數(shù)據(jù)由于字段缺失、錯(cuò)誤等原因?qū)е略俅伟l(fā)布數(shù)據(jù)等問(wèn)題。本文在總結(jié)NSTL開(kāi)放期刊資源質(zhì)量管理工作經(jīng)驗(yàn)、分析影響開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量因素的基礎(chǔ)上,構(gòu)建了開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量管理模型。

        該模型主要由三大組件構(gòu)成,分別為元數(shù)據(jù)生命周期、元數(shù)據(jù)質(zhì)量維度以及影響要素(圖1)。元數(shù)據(jù)的生命周期說(shuō)明了開(kāi)放期刊資源元數(shù)據(jù)在整個(gè)生命周期的管理活動(dòng);元數(shù)據(jù)的質(zhì)量維度則提供了評(píng)估和控制元數(shù)據(jù)在整個(gè)生命周期質(zhì)量的依據(jù);影響要素是影響元數(shù)據(jù)管理與質(zhì)量控制的因素。這三大組件緊密聯(lián)系,相輔相成。下面對(duì)構(gòu)成元數(shù)據(jù)質(zhì)量管理模型的三大組件進(jìn)行詳細(xì)介紹。

        2.1 開(kāi)放期刊資源元數(shù)據(jù)生命周期

        圖1 元數(shù)據(jù)質(zhì)量管理模型

        元數(shù)據(jù)的生命周期反映了元數(shù)據(jù)的管理活動(dòng),元數(shù)據(jù)質(zhì)量控制應(yīng)該從元數(shù)據(jù)創(chuàng)建的全局考慮,貫穿于元數(shù)據(jù)整個(gè)生命周期,實(shí)現(xiàn)元數(shù)據(jù)質(zhì)量的全程控制,從根本上提高元數(shù)據(jù)質(zhì)量。在各元數(shù)據(jù)的整個(gè)生命周期里,都要依據(jù)下面即將敘述的數(shù)據(jù)質(zhì)量維度實(shí)施質(zhì)量控制。本文考慮了多成員單位協(xié)同建設(shè)開(kāi)放期刊資源,并且采用了“總—分—總”的管理模式,將元數(shù)據(jù)的生命周期劃分為以下5個(gè)階段。

        (1)籌備階段。在元數(shù)據(jù)采集的籌備階段,需要構(gòu)建資源的遴選標(biāo)準(zhǔn)、制定統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)、元數(shù)據(jù)標(biāo)準(zhǔn)的執(zhí)行細(xì)則以及元數(shù)據(jù)的質(zhì)量標(biāo)準(zhǔn)。資源的遴選標(biāo)準(zhǔn)首先將質(zhì)量較高的期刊資源進(jìn)行遴選;元數(shù)據(jù)標(biāo)準(zhǔn)一般由元素名稱(chēng)、標(biāo)識(shí)符、定義/描述、注釋、著錄規(guī)則以及示例組成;元數(shù)據(jù)標(biāo)準(zhǔn)的執(zhí)行細(xì)則是對(duì)元數(shù)據(jù)標(biāo)準(zhǔn)的進(jìn)一步描述與統(tǒng)一規(guī)定;元數(shù)據(jù)的質(zhì)量標(biāo)準(zhǔn)對(duì)每個(gè)環(huán)節(jié)提出質(zhì)量要求。

        (2)任務(wù)分配階段。由于考慮到多成員單位協(xié)同建設(shè)開(kāi)放期刊資源,需要在任務(wù)分配階段將不同的任務(wù)分給不同的成員單位,避免重復(fù)采集。

        (3)采集、加工、質(zhì)檢階段。各成員單位在接到采集任務(wù)后將完成元數(shù)據(jù)在該階段的生命周期,包括采集、加工、質(zhì)檢的工作。

        采集:將不同來(lái)源、不同渠道的元數(shù)據(jù)按照統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范進(jìn)行采集。

        加工:由于不同平臺(tái)來(lái)源的數(shù)據(jù)頁(yè)面揭示多樣、更新時(shí)間不穩(wěn)定、元數(shù)據(jù)厚薄不均、全文格式不統(tǒng)一,導(dǎo)致完全依賴(lài)于工具進(jìn)行采集的數(shù)據(jù)質(zhì)量較差,在加工階段,需要著錄人員進(jìn)行補(bǔ)充加工。

        質(zhì)檢:在元數(shù)據(jù)質(zhì)檢階段,結(jié)合機(jī)器自動(dòng)化質(zhì)檢的同時(shí),需要人工進(jìn)行抽樣檢查,匯總?cè)雮}(cāng)之前需要進(jìn)一步進(jìn)行機(jī)器質(zhì)檢與人工抽檢,分析可能存在的數(shù)據(jù)問(wèn)題,并利用輔助修正機(jī)器質(zhì)檢功能。

        (4)查重和入倉(cāng)階段。將不同成員單位提交的元數(shù)據(jù)進(jìn)行查重,構(gòu)建統(tǒng)一的元數(shù)據(jù)倉(cāng)儲(chǔ)。對(duì)于完全重復(fù)的數(shù)據(jù)則直接剔除;對(duì)于相同卷期下的數(shù)據(jù),相似度大于閾值則機(jī)器進(jìn)行沖突解決,合并為一條數(shù)據(jù),并對(duì)元數(shù)據(jù)進(jìn)行字段補(bǔ)齊,增加元數(shù)據(jù)厚度;若是不同數(shù)據(jù),則對(duì)數(shù)據(jù)均進(jìn)行入倉(cāng)處理。

        (5)更新數(shù)據(jù)與更新倉(cāng)儲(chǔ)階段。對(duì)于不同卷期下的數(shù)據(jù),相似度大于閾值則需要人工進(jìn)行核查,對(duì)開(kāi)放期刊資源動(dòng)態(tài)更新數(shù)據(jù),并及時(shí)更新數(shù)據(jù)倉(cāng)儲(chǔ)的數(shù)據(jù)。

        2.2 開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量維度

        元數(shù)據(jù)的質(zhì)量維度提供了評(píng)估和控制元數(shù)據(jù)在整個(gè)生命周期質(zhì)量的依據(jù)。國(guó)外專(zhuān)門(mén)討論元數(shù)據(jù)質(zhì)量的研究大約始于2004年。Moen等[8]在GILS項(xiàng)目評(píng)估中提出了一套元數(shù)據(jù)質(zhì)量評(píng)估的指標(biāo)和方法。該模型設(shè)計(jì)的出發(fā)點(diǎn)是GILS系統(tǒng)的評(píng)估而非僅僅針對(duì)元數(shù)據(jù)質(zhì)量,評(píng)估范圍廣、內(nèi)容多,使得該評(píng)估模型難以在更廣的范圍內(nèi)推廣[9]。Stvilia等[10]在Moen等[8]提出模型的基礎(chǔ)上提出了評(píng)估信息質(zhì)量的模型。該模型的使用需要再根據(jù)元數(shù)據(jù)創(chuàng)建、使用環(huán)境進(jìn)一步明確各指標(biāo)的涵義、確定量化方法。Bruce和Hillman[11]對(duì)Stvilia等[10]提出的指標(biāo)維度加以濃縮,歸納為7個(gè)指標(biāo)。該模型的使用更為廣泛。

        本文綜合考慮開(kāi)放期刊資源的特性、元數(shù)據(jù)規(guī)范、管理流程以及圖書(shū)館實(shí)際業(yè)務(wù)需求等因素,制定了以下7個(gè)方面的開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量維度,該元數(shù)據(jù)質(zhì)量維度貫穿于上述整個(gè)管理流程。

        (1)完整性。根據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范要求,詳盡地描述資源信息。如果元數(shù)據(jù)不完整,將會(huì)影響其他質(zhì)量的評(píng)價(jià),最終影響整個(gè)元數(shù)據(jù)質(zhì)量管理的流程。

        (2)準(zhǔn)確性。元數(shù)據(jù)對(duì)資源內(nèi)容客觀、準(zhǔn)確反應(yīng)的程度。

        (3)一致性。保障元數(shù)據(jù)所有字段所描述的資源是同一資源,避免不同字段指向不同資源。

        (4)唯一性。保障元數(shù)據(jù)倉(cāng)儲(chǔ)中的數(shù)據(jù)都是唯一的,沒(méi)有重復(fù),以更好地為用戶(hù)提供服務(wù)。

        (5)及時(shí)性。針對(duì)資源易逝性的特點(diǎn),及時(shí)獲取開(kāi)放資源信息,對(duì)資源進(jìn)行保障。

        (6)有效性。開(kāi)放期刊資源具有動(dòng)態(tài)性,需要?jiǎng)討B(tài)地監(jiān)測(cè)元數(shù)據(jù)是否仍然有效,是否被更新、刪除等。

        (7)關(guān)聯(lián)性。揭示開(kāi)放資源與相關(guān)資源、相關(guān)系統(tǒng)及數(shù)據(jù)庫(kù)的關(guān)系,如印本轉(zhuǎn)為開(kāi)放獲取的資源與其對(duì)應(yīng)的印刷型資源的關(guān)聯(lián)。

        2.3 影響要素

        元數(shù)據(jù)質(zhì)量的影響要素是影響元數(shù)據(jù)管理與質(zhì)量控制的關(guān)鍵因素,主要有以下4個(gè)方面。

        (1)元數(shù)據(jù)。元數(shù)據(jù)是質(zhì)量控制與管理的研究對(duì)象,對(duì)于多來(lái)源、多類(lèi)型的元數(shù)據(jù)進(jìn)行質(zhì)檢,把控質(zhì)量,為用戶(hù)提供高品質(zhì)服務(wù)。

        (2)流程。對(duì)元數(shù)據(jù)管理的流程進(jìn)行合理劃分,保障元數(shù)據(jù)的管理活動(dòng)能夠科學(xué)開(kāi)展。

        (3)人員。開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量管理需要在不同的管理環(huán)節(jié)進(jìn)行把控,如元數(shù)據(jù)標(biāo)準(zhǔn)的制定、元數(shù)據(jù)的錄入、元數(shù)據(jù)的分析以及元數(shù)據(jù)的沖突處理等,因此需要多種不同專(zhuān)業(yè)背景和專(zhuān)業(yè)技能的技術(shù)人員團(tuán)結(jié)協(xié)作,共同承擔(dān)質(zhì)量管理的重任。

        (4)技術(shù)。由于元數(shù)據(jù)質(zhì)量管理的相關(guān)工作需要機(jī)器輔助完成,因此需要選用相關(guān)的系統(tǒng)、技術(shù)、軟件、工具等,如數(shù)據(jù)格式轉(zhuǎn)換工具、元數(shù)據(jù)格式校驗(yàn)工具、數(shù)據(jù)查重系統(tǒng)、數(shù)據(jù)倉(cāng)儲(chǔ)等。

        3 開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量管理流程

        在NSTL實(shí)際開(kāi)放期刊資源建設(shè)工作中,對(duì)質(zhì)量管理流程采用“總—分—總”的管理模式。根據(jù)上述模型中所述的元數(shù)據(jù)的生命周期構(gòu)建元數(shù)據(jù)質(zhì)量管理流程,在各階段,利用質(zhì)量維度對(duì)元數(shù)據(jù)質(zhì)量進(jìn)行控制。由于開(kāi)放資源數(shù)量巨大,因此在質(zhì)量檢查上采用以機(jī)器為主、人工為輔的抽檢方式,制定了對(duì)開(kāi)放期刊的元數(shù)據(jù)質(zhì)量管理的流程,如圖2所示。

        (1)第一總階段,根據(jù)遴選標(biāo)準(zhǔn)遴選出質(zhì)量高的品種,并根據(jù)制定的查重規(guī)則對(duì)品種進(jìn)行去重操作,保證各成員單位承擔(dān)的采集任務(wù)并無(wú)重復(fù)。

        (2)第二分階段,各成員單位在采集數(shù)據(jù)時(shí)應(yīng)構(gòu)建本地倉(cāng)儲(chǔ)數(shù)據(jù)庫(kù),避免數(shù)據(jù)重復(fù)采集;根據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)、執(zhí)行細(xì)則,結(jié)合上述的質(zhì)量維度,制定自動(dòng)化的格式、內(nèi)容質(zhì)檢工具,并根據(jù)工具的質(zhì)檢結(jié)果,人工進(jìn)行質(zhì)量抽檢。若數(shù)據(jù)質(zhì)量合格方可提交至總倉(cāng)儲(chǔ)。

        (3)第三總階段,將各成員單位提交至總倉(cāng)儲(chǔ)的數(shù)據(jù)再次查重,在此階段可以發(fā)現(xiàn)第一階段品種重復(fù)分配的可能,并及時(shí)調(diào)整第一階段任務(wù);質(zhì)檢人員再次利用工具進(jìn)行格式、內(nèi)容的質(zhì)量檢查,在此階段可以發(fā)現(xiàn)由于網(wǎng)絡(luò)或人工疏忽等原因造成的文件丟失等問(wèn)題。再次的人工質(zhì)量抽檢可以有效地發(fā)現(xiàn)采集數(shù)據(jù)質(zhì)量的問(wèn)題,并能及時(shí)調(diào)整輔助工具,提高工作效率。

        圖2 元數(shù)據(jù)質(zhì)量控制流程

        4 結(jié)語(yǔ)

        本文提出的開(kāi)放期刊元數(shù)據(jù)質(zhì)量管理模型對(duì)于承擔(dān)大型資源建設(shè)具有非常重要的作用,采用了“總—分—總”的管理模式,多單位可以協(xié)同工作,共同建設(shè)開(kāi)放期刊資源。根據(jù)開(kāi)放期刊的特性,制定了元數(shù)據(jù)質(zhì)量的維度,為元數(shù)據(jù)的采集標(biāo)準(zhǔn)提供了參考,提高開(kāi)放期刊資源元數(shù)據(jù)質(zhì)量,為用戶(hù)提供更好的服務(wù)。然而,開(kāi)放資源具有易逝性,如何探測(cè)資源的有效性及可訪(fǎng)問(wèn)性需要進(jìn)一步的探討和研究。

        猜你喜歡
        生命周期維度流程
        動(dòng)物的生命周期
        全生命周期下呼吸機(jī)質(zhì)量控制
        吃水果有套“清洗流程”
        淺論詩(shī)中“史”識(shí)的四個(gè)維度
        從生命周期視角看并購(gòu)保險(xiǎn)
        民用飛機(jī)全生命周期KPI的研究與應(yīng)用
        違反流程 致命誤判
        本刊審稿流程
        析OGSA-DAI工作流程
        光的維度
        燈與照明(2016年4期)2016-06-05 09:01:45
        亚洲av男人的天堂在线| 国产av影片麻豆精品传媒| 在线亚洲+欧美+日本专区| 天堂av一区二区在线| 三级黄色片免费久久久 | 污污内射在线观看一区二区少妇 | 中文字幕34一区二区| 潮喷大喷水系列无码久久精品| 人妻丰满熟妇av无码处处不卡| 91福利国产在线观看网站| 亚洲日产乱码在线中文字幕| 99久久99久久久精品齐齐 | 久久久久亚洲精品天堂| 国产免费一区二区三区在线视频 | 少妇厨房愉情理伦片bd在线观看| 美女裸体无遮挡黄污网站| 国产老熟女伦老熟妇露脸| 久久久久人妻一区精品| 国产欧美日韩视频一区二区三区 | 亚洲97成人精品久久久| 东京热人妻系列无码专区| 狠狠色噜噜狠狠狠狠888奇禾| 国产精品香蕉网页在线播放| 国产三级精品三级男人的天堂 | 中文字幕无码高清一区二区三区| 一本色道精品亚洲国产一区| 国产电影一区二区三区| 久久精品岛国av一区二区无码| 视频一区二区三区中文字幕狠狠| 国产av精品一区二区三区久久| 蜜臀av性久久久久蜜臀aⅴ| 国产农村三片免费网站| 日韩女优一区二区在线观看| 亚洲成熟丰满熟妇高潮xxxxx| 国农村精品国产自线拍| 日本女优一区二区在线免费观看| 少妇下面好爽好紧好湿一区二区| 一区二区三区在线 | 欧| 久久精品爱国产免费久久| 亚洲国产一区一区毛片a| 天天摸夜夜摸摸到高潮|