楊陽(yáng) 崔紅
摘要:隨著我國(guó)逐漸進(jìn)入大數(shù)據(jù)信息時(shí)代,信息資源的發(fā)布已經(jīng)逐漸從傳統(tǒng)的實(shí)體承載走向了網(wǎng)絡(luò)資源的傳播。而隨著教育體制對(duì)于高校綜合實(shí)力和學(xué)科設(shè)置優(yōu)化的要求,越來(lái)越多的高校面臨合并,作為高校信息資源重點(diǎn)的大數(shù)據(jù)背景下的圖書(shū)館,也面臨管理信息系統(tǒng)合并的問(wèn)題。本文以不同管理信息系統(tǒng)合并中書(shū)目數(shù)據(jù)整合為例,通過(guò)對(duì)該過(guò)程中出現(xiàn)的問(wèn)題進(jìn)行成因分析,運(yùn)用魚(yú)骨圖為工具匯總了管理信息系統(tǒng)合并的數(shù)目數(shù)據(jù)整合過(guò)程中影響因素并提出了實(shí)施保障。通過(guò)本文分析,對(duì)于高校圖書(shū)館合并中的多源數(shù)據(jù)整合工作的影響因素進(jìn)行了匯總并針對(duì)這些影響因素制定了實(shí)施保障,可以供此類工作參考,以規(guī)避多源數(shù)據(jù)整合工作中各因素對(duì)于整合工作的干擾及提高整合后數(shù)據(jù)質(zhì)量。
關(guān)鍵詞:圖書(shū)館;數(shù)據(jù)整合;影響因素;實(shí)施保障
隨著大數(shù)據(jù)時(shí)代的來(lái)臨,信息資源共享與數(shù)據(jù)優(yōu)化成為了信息資源發(fā)展的新課題。由于圖書(shū)館信息資源分布于不同的管理信息系統(tǒng),類型異構(gòu)、格式不同,導(dǎo)致了一站式集成管理平臺(tái)實(shí)現(xiàn)中存在很多困難。無(wú)論是區(qū)域化圖書(shū)館集成管理平臺(tái)的構(gòu)建,還是高校合校后的原管理信息系統(tǒng)的數(shù)據(jù)合并,都需要對(duì)不同系統(tǒng)源數(shù)據(jù)整合,以達(dá)到能夠在統(tǒng)一管理平臺(tái)中應(yīng)用的目標(biāo)。本文將以不同管理信息系統(tǒng)合并中書(shū)目數(shù)據(jù)整合為例,對(duì)于多源數(shù)據(jù)整合過(guò)程進(jìn)行分析。
1.大數(shù)據(jù)背景下高校圖書(shū)館多源數(shù)據(jù)整合的需求
1.1 大數(shù)據(jù)時(shí)代的資源共享需求
大數(shù)據(jù)時(shí)代背景下,信息資源的發(fā)布主要以管理信息系統(tǒng)為載體。管理信息系統(tǒng)的多樣性導(dǎo)致了元數(shù)據(jù)的異構(gòu)性。由于圖書(shū)館所應(yīng)用管理信息系統(tǒng)的不同導(dǎo)致了信息資源互通困難,而各高校圖書(shū)館之間資源信息交叉重復(fù)導(dǎo)致了信息采集重復(fù)勞動(dòng)、信息利用率不高的結(jié)果。這就要求無(wú)論是信息資源集成管理平臺(tái)共享,還是進(jìn)行管理信息系統(tǒng)的合并工作,都必須加強(qiáng)信息資源的管理。
1.2 圖書(shū)館信息資源服務(wù)質(zhì)量?jī)?yōu)化的需求
大數(shù)據(jù)時(shí)代,圖書(shū)館的讀者服務(wù)已經(jīng)不再以紙本圖書(shū)借閱為主要形式。而是逐漸邁入了信息資源發(fā)布與共享的時(shí)代。對(duì)任何一個(gè)高校圖書(shū)館來(lái)說(shuō),無(wú)論是引進(jìn)各種數(shù)據(jù)庫(kù)還是資源發(fā)現(xiàn)系統(tǒng),其與本館基礎(chǔ)數(shù)據(jù)的兼容都存在一定的困難。不同管理信息系統(tǒng)中多源數(shù)據(jù)的整合,可以達(dá)到讓不同格式的元數(shù)據(jù)有效融合,以更好的達(dá)到讀者的信息資源檢索與利用需求。
1.3 高校合校后圖書(shū)館管理信息系統(tǒng)合并的需求
當(dāng)前中國(guó)教育機(jī)制背景下,一些高校的合并成為一中新的教育體制方式,在高校合并過(guò)程中,涉及到的高校圖書(shū)館也隨之進(jìn)行合并。而作為合并成員的圖書(shū)館往往具有不同的管理信息系統(tǒng),在原系統(tǒng)格式不同的基礎(chǔ)上,還不乏有與其他館基礎(chǔ)數(shù)據(jù)及信息資源重復(fù)的情況。
2.管理信息系統(tǒng)合并中書(shū)目數(shù)據(jù)整合工作步驟及存在問(wèn)題
2.1.1 管理信息系統(tǒng)合并中書(shū)目數(shù)據(jù)整合步驟
管理信息系統(tǒng)中書(shū)目數(shù)據(jù)整合步驟如下:
①數(shù)據(jù)情況調(diào)研分析;②制定合并方案;③系統(tǒng)升級(jí)調(diào)試;④對(duì)于各管理信息系統(tǒng)中數(shù)據(jù)進(jìn)行抽?。虎迶?shù)據(jù)標(biāo)準(zhǔn)格式轉(zhuǎn)化;⑦數(shù)據(jù)判重與整理,包括數(shù)據(jù)的合并、刪除;⑧規(guī)范導(dǎo)入目標(biāo)系統(tǒng);⑨測(cè)試及問(wèn)題反饋。
2.1.2 信息系統(tǒng)合并中書(shū)目數(shù)據(jù)整合工作存在的問(wèn)題
在進(jìn)行管理信息系統(tǒng)合并的書(shū)目數(shù)據(jù)整合過(guò)程中,存在問(wèn)題以魚(yú)骨圖的方式表達(dá),如下圖1.1:
3.多源數(shù)據(jù)整合工作的影響因素及保障計(jì)劃
3.1 多源數(shù)據(jù)整合影響因素
綜上所述,在多源數(shù)據(jù)整合過(guò)程中影響最終數(shù)據(jù)質(zhì)量的因素共有以下幾點(diǎn):
(1)對(duì)整合前源數(shù)據(jù)的調(diào)研分析不足。由于多源數(shù)據(jù)整合涉及到不同管理系統(tǒng)中不同格式和著錄方式的數(shù)據(jù)合并、判重與刪除等處理。其情況復(fù)雜,操作繁瑣,需要預(yù)先進(jìn)行數(shù)據(jù)的全面調(diào)研分析。
(2)數(shù)據(jù)整合標(biāo)準(zhǔn)不確定。多源數(shù)據(jù)整合工作由于需要多人多部門配合進(jìn)行,所以缺少統(tǒng)一完善的整合標(biāo)準(zhǔn),將導(dǎo)致多余同一情況處理方式不同的情況,導(dǎo)致整合后數(shù)據(jù)不統(tǒng)一的問(wèn)題。
(3)數(shù)據(jù)整合執(zhí)行人員工作疏忽。多源數(shù)據(jù)整合工作漫長(zhǎng)而復(fù)雜,在此過(guò)程中,執(zhí)行人員的工作疏忽、不細(xì)致、不到位,將導(dǎo)致數(shù)據(jù)整合工作出現(xiàn)各種系統(tǒng)問(wèn)題與數(shù)據(jù)質(zhì)量問(wèn)題。
(4)人員的業(yè)務(wù)水平不足。多源數(shù)據(jù)整合工作所要求的業(yè)務(wù)能力和技術(shù)水平比較高。工作人員的水平不足,將導(dǎo)致數(shù)據(jù)整合工作進(jìn)行困難,或整合結(jié)果出現(xiàn)問(wèn)題。
3.2 多源數(shù)據(jù)整合的實(shí)施保障
為保證數(shù)據(jù)整合工作的順利進(jìn)行,盡量避免數(shù)據(jù)質(zhì)量問(wèn)題,針對(duì)影響數(shù)據(jù)整合的因素,制定出一系列的保障措施:
(1)做好充分的數(shù)據(jù)前期調(diào)研分析工作。數(shù)據(jù)整合前,對(duì)于各管理信息系統(tǒng)中的源數(shù)據(jù)進(jìn)行充分的調(diào)研分析,具體內(nèi)容包括:各系統(tǒng)中數(shù)據(jù)格式;各系統(tǒng)中數(shù)據(jù)的著錄方式是否相同,索書(shū)號(hào)取號(hào)原則;對(duì)于版本與卷次的著錄方式及數(shù)據(jù)集中行使;對(duì)同一文獻(xiàn)資源的表達(dá)方式是否一致等等。
(2)制定合理的數(shù)據(jù)整合方案。多源數(shù)據(jù)整合的最終要求是實(shí)現(xiàn)在統(tǒng)一數(shù)據(jù)庫(kù)或統(tǒng)一門戶檢索與應(yīng)用,要求數(shù)據(jù)標(biāo)準(zhǔn)性和唯一性并避免重復(fù)數(shù)據(jù)與垃圾數(shù)據(jù)的出現(xiàn)。而數(shù)據(jù)整合工作是由多人同時(shí)進(jìn)行的。為了避免出現(xiàn)同一情況不同處理方式的情況,對(duì)數(shù)據(jù)整合的規(guī)則和方式,應(yīng)當(dāng)具有統(tǒng)一的標(biāo)準(zhǔn)。因此在進(jìn)行數(shù)據(jù)整合工作前應(yīng)根據(jù)具體工作目標(biāo)和最終整合結(jié)果的適應(yīng)需求制定全面合理的數(shù)據(jù)整合方案。
(3)建立工作人員的培訓(xùn)機(jī)制。在大數(shù)據(jù)時(shí)代背景下,圖書(shū)館中一切的服務(wù)與管理活數(shù)據(jù)整合過(guò)程中,業(yè)務(wù)人員及技術(shù)人員的水平是影響數(shù)據(jù)錄動(dòng),都要求圖書(shū)館員具備一定的信息素養(yǎng)。針對(duì)此問(wèn)題應(yīng)當(dāng)建立工作人員的培訓(xùn)機(jī)制。對(duì)整合工作實(shí)施人員進(jìn)行培訓(xùn)并檢查培訓(xùn)結(jié)果,通過(guò)測(cè)試后,方可參加數(shù)據(jù)整合的實(shí)施活動(dòng)。
(4)制定管理措施,強(qiáng)化責(zé)任。多源數(shù)據(jù)整合工作的進(jìn)行過(guò)程中,具體執(zhí)行人員是工作的直接主導(dǎo)。因此,對(duì)具體執(zhí)行人員的管理程度決定著數(shù)據(jù)整合工作的完成速度與質(zhì)量。進(jìn)行多源數(shù)據(jù)整合工作前,應(yīng)當(dāng)制定相應(yīng)的管理措施和獎(jiǎng)懲制度,并明確工作責(zé)任,實(shí)行責(zé)任到部門乃至于個(gè)人的方式。
結(jié)論:本文以管理信息系統(tǒng)合并過(guò)程中的書(shū)目數(shù)據(jù)整合工作為例,對(duì)工作中存在的數(shù)據(jù)問(wèn)題進(jìn)行歸納及成因分析,匯總出影響多源數(shù)據(jù)整合工作的幾個(gè)主要因素,并針對(duì)這些因素,制定了多源數(shù)據(jù)整合工作的保障措施。通過(guò)這些措施,可以在進(jìn)行類似工作時(shí)盡量避免此類因素對(duì)于多源數(shù)據(jù)整合工作的影響,以提高工作效率保證工作質(zhì)量。
參考文獻(xiàn):
[1]馬曉亭.基于大數(shù)據(jù)的圖書(shū)館異構(gòu)數(shù)據(jù)整合機(jī)制研究[J].現(xiàn)代情報(bào).2015.8:47-50
[2]陳倬.基于異構(gòu)數(shù)據(jù)資源整合的方法和系統(tǒng)實(shí)現(xiàn)[J].信息科學(xué).2017.12:142-144
[3]伍德鵬.數(shù)字校園網(wǎng)異構(gòu)數(shù)據(jù)整合研究[J].福建電腦.2016.9:122-122,6
作者簡(jiǎn)介:
第一作者:楊陽(yáng)(1981年2月),女,吉林省長(zhǎng)春市,碩士,吉林大學(xué)圖書(shū)館采編部副主任,館員,從事中文文獻(xiàn)編目工作。
第二作者:崔紅(1970年4月),女,吉林省長(zhǎng)春市,碩士,副研究館員,從事中文文獻(xiàn)編目工作。