趙春輝
(中原工學(xué)院圖書館,河南 鄭州 450007)
基于云計(jì)算環(huán)境的數(shù)字檔案館發(fā)展機(jī)遇研究
趙春輝
(中原工學(xué)院圖書館,河南 鄭州 450007)
文章在介紹云計(jì)算和數(shù)字檔案館概念的基礎(chǔ)上,重點(diǎn)剖析了云計(jì)算技術(shù)在數(shù)字檔案館建設(shè)中的優(yōu)勢(shì),最后概述了目前云計(jì)算技術(shù)在數(shù)字檔案館建設(shè)應(yīng)用中存在的問題及改進(jìn)對(duì)策。
云計(jì)算;數(shù)字檔案館;信息資源
云計(jì)算被稱為繼計(jì)算機(jī)、互聯(lián)網(wǎng)之后的第三次IT領(lǐng)域的革命浪潮,而IT領(lǐng)域每一次技術(shù)革新都會(huì)極大地改變著人類的生產(chǎn)生活方式以及商業(yè)運(yùn)營模式。云計(jì)算作為一種新型的計(jì)算機(jī)技術(shù),具有網(wǎng)絡(luò)分布式、大數(shù)據(jù)存儲(chǔ)、服務(wù)遠(yuǎn)程化、資源共享化、功能開放化等優(yōu)勢(shì),將其應(yīng)用到數(shù)字檔案館的建設(shè)及服務(wù)中,為數(shù)字檔案館資源共建共享、信息知識(shí)服務(wù)等功能的拓展與升級(jí),提供了技術(shù)條件和應(yīng)用空間。
1.1 云計(jì)算的內(nèi)涵
云計(jì)算,又被稱為云端計(jì)算,是基于計(jì)算機(jī)技術(shù)、互聯(lián)網(wǎng)計(jì)算、通信技術(shù)而產(chǎn)生的一種新的計(jì)算方式,這個(gè)概念的最初起源來自2006-2008年間Dell的數(shù)據(jù)中心解決方案、亞馬遜EC2產(chǎn)品和Google-IBM分布式計(jì)算項(xiàng)目,之所以成為“云”技術(shù),很大程度上因這些項(xiàng)目與網(wǎng)絡(luò)的關(guān)系十分密切,而“云”在很多示意圖里面是表示互聯(lián)網(wǎng)的,云計(jì)算的原始含義即將計(jì)算能力放在互聯(lián)網(wǎng)上。經(jīng)過十余年的實(shí)踐應(yīng)用及理論升級(jí),云計(jì)算技術(shù)已經(jīng)廣泛應(yīng)用于互聯(lián)網(wǎng)應(yīng)用服務(wù)的各個(gè)行業(yè)的方方面面,并在很大程度上引導(dǎo)著互聯(lián)網(wǎng)技術(shù)的發(fā)展方向。
通過搜索引擎檢索“云計(jì)算”的概念,可以得到多種解釋,不同行業(yè)、不同領(lǐng)域、不同專家對(duì)其解釋也是仁者見仁智者見智,至今,有關(guān)云計(jì)算的基本內(nèi)涵仍無統(tǒng)一的定義。如中國云計(jì)算專家委員會(huì)主任委員李德毅從資源整合的角度提出了云計(jì)算的內(nèi)涵,即對(duì)數(shù)據(jù)資源、計(jì)算資源、存儲(chǔ)資源、軟件資源等組成的資源庫,進(jìn)行互聯(lián)網(wǎng)或物聯(lián)網(wǎng)加工,使其成為廣大用戶便于獲取、共享、擴(kuò)展的虛擬資源[1];國際知名競(jìng)爭(zhēng)情報(bào)領(lǐng)域?qū)<襊eter Fingar則從純技術(shù)角度定義了云計(jì)算的概念,即包括網(wǎng)格技術(shù)、公共計(jì)算技術(shù)、對(duì)等計(jì)算、自主計(jì)算、遠(yuǎn)程技術(shù)等在內(nèi)的技術(shù)組合體[2];而較為權(quán)威的美國國家標(biāo)準(zhǔn)技術(shù)研究所(NIST)的定義:云計(jì)算是一種資源配置及使用模式,是對(duì)可供配置和共享的資源如服務(wù)器資源、存儲(chǔ)資源、應(yīng)用和服務(wù)資源,提供一種方便、快捷、實(shí)時(shí)、個(gè)性的網(wǎng)絡(luò)訪問的平臺(tái)[3]。
對(duì)于非專業(yè)人士而言,云計(jì)算的概念略顯抽象,但從實(shí)踐應(yīng)用的角度來說,云計(jì)算之于行業(yè)應(yīng)用的優(yōu)點(diǎn)是十分突出且一致的,即①規(guī)模性:云計(jì)算突破了原有的單機(jī)或局域互聯(lián),它是由不同規(guī)模的計(jì)算機(jī)集群組成的,具有強(qiáng)大的存儲(chǔ)和計(jì)算能力。②易用性:云計(jì)算幫助企業(yè)或行業(yè)實(shí)現(xiàn)了粗放型向集約型的升級(jí),使分散式、高耗能的運(yùn)營模式成為過去,在很大程度上節(jié)約了用戶的服務(wù)獲取成本。③靈活性:云計(jì)算環(huán)境下的資源共建、共享、配置有利于進(jìn)行有機(jī)整合,按需調(diào)整,用戶可根據(jù)自身需求動(dòng)態(tài)實(shí)時(shí)增減資源配置。④虛擬化:云計(jì)算本是一種基于共建共享理念的技術(shù)平臺(tái),它允許多個(gè)用戶參與和共享,但又無須了解各種資源的存儲(chǔ)位置和加工過程,虛擬化的工作模式大大降低了使用成本。⑤計(jì)量化:由于云計(jì)算模式所提供服務(wù)的系統(tǒng)性,其服務(wù)內(nèi)容更加透明化,即易于監(jiān)測(cè)、分析、評(píng)估,用戶只需按需購買即可,極大地避免了資源閑置與浪費(fèi)。
1.2 數(shù)字檔案館的內(nèi)涵
數(shù)字檔案館的概念,多數(shù)學(xué)者認(rèn)為其已經(jīng)突破了簡(jiǎn)單的檔案數(shù)字化或檔案信息化的范疇,更多的是通過計(jì)算機(jī)網(wǎng)絡(luò)和通信網(wǎng)絡(luò)形成的一種信息平臺(tái),通過這個(gè)平臺(tái)可以實(shí)現(xiàn)電子文件的系統(tǒng)化、集成化、有序化的加工、利用和管理,并最終實(shí)現(xiàn)電子文件的完整性和持久性,簡(jiǎn)單來說,數(shù)字檔案館就是一種超大規(guī)模和分布式的數(shù)字檔案信息處理系統(tǒng)。當(dāng)然,部分學(xué)者的觀點(diǎn)與這種“系統(tǒng)論”的內(nèi)涵略有不同,他們認(rèn)為數(shù)字檔案館的重心不在于技術(shù),而是一種信息組織模式,技術(shù)需要不斷升級(jí)換代,但組織模式則是引導(dǎo)檔案館創(chuàng)新升級(jí)的精髓所在,因此,他們強(qiáng)調(diào)數(shù)字檔案館“其實(shí)就是一種基于計(jì)算機(jī)技術(shù)和通信技術(shù)的虛擬信息中心,這個(gè)信息中心突破時(shí)空限制,更好地為信息提供者服務(wù)”。
兩種觀點(diǎn)雖然從不同角度剖析了數(shù)字檔案館的內(nèi)涵精髓,但都離不開對(duì)通信技術(shù)、建設(shè)模式、管理模式因素的概括,因此,數(shù)字檔案館是尤其固定的本質(zhì)特征共識(shí)的:首先是資源數(shù)字化,數(shù)字檔案館中數(shù)字資源取代了傳統(tǒng)的紙質(zhì)檔案資源,不但便于查閱、傳遞、共享、利用,更便于其長期保存和圖譜分析,呈現(xiàn)出了大數(shù)據(jù)的優(yōu)勢(shì);其次是資源的網(wǎng)絡(luò)化,正如上所說,數(shù)字化加工后的檔案資源由于其基于的信息網(wǎng)絡(luò)平臺(tái),使得檔案信息更易于流轉(zhuǎn)和共享,用戶獲取檔案信息的難度和成本大大降低,而且這種客觀資源網(wǎng)絡(luò)不會(huì)隨著時(shí)間推移而發(fā)生結(jié)構(gòu)性變化;第三則是其管理的自動(dòng)化,數(shù)字檔案館不再依靠傳統(tǒng)的人力分類、編排、調(diào)取等步驟,很大程度上靠預(yù)先設(shè)定的計(jì)算機(jī)程序?qū)崿F(xiàn)自動(dòng)化管理,大大降低了人力成本,提升了運(yùn)行效率[4]。
綜合以上觀點(diǎn),可以看出,數(shù)字檔案館其實(shí)就是一種依靠網(wǎng)絡(luò)技術(shù)和通信技術(shù)而打造成的網(wǎng)絡(luò)虛擬圖書館,其依靠高度電子化的技術(shù)運(yùn)轉(zhuǎn)使得檔案資源數(shù)據(jù)庫的服務(wù)行為呈現(xiàn)出極大的便捷性、低耗性、增殖性。
自2008年云計(jì)算開始進(jìn)入國內(nèi)相關(guān)領(lǐng)域,一直到2010年,在國內(nèi)的行業(yè)應(yīng)用進(jìn)入高峰期,云計(jì)算的嘗試至成功再至成熟的案例日漸增多,獲得了行業(yè)人士和專家學(xué)者的一致認(rèn)可。在這種大環(huán)境下,檔案界也可是嘗試抓住這個(gè)契機(jī)實(shí)現(xiàn)轉(zhuǎn)型,即開始分析嘗試如何根據(jù)自身需要選擇性的將云技術(shù)和日常業(yè)務(wù)甚至增值業(yè)務(wù)結(jié)合起來,通過檔案領(lǐng)域的數(shù)字化和網(wǎng)絡(luò)化建設(shè),在提升工作效率和改善工作模式的同時(shí),提升檔案行業(yè)的服務(wù)水平。
從資金投入角度來看,云計(jì)算可以在很大程度上減少數(shù)字檔案館建設(shè)中的IT投入,數(shù)字檔案館建設(shè)如同其他領(lǐng)域的業(yè)務(wù)數(shù)字化建設(shè)一樣,需要大量的包括服務(wù)器、計(jì)算機(jī)、數(shù)據(jù)庫等方面的軟硬件投入,同時(shí)后期的升級(jí)維護(hù)和人員配備成本更高,一定程度上制約了數(shù)字檔案館的建設(shè)宗旨。有了云計(jì)算技術(shù),數(shù)字檔案館的建設(shè)可以更多地交給專業(yè)的云服務(wù)提供商去做,通過這種“半外包化”的運(yùn)營模式使檔案館工作人員從日常的設(shè)備建設(shè)、升級(jí)、管理中解脫出來,更好地為用戶服務(wù)。這種運(yùn)營模式下,專業(yè)的云計(jì)算服務(wù)商通過專業(yè)的技術(shù)和服務(wù)人員幫助檔案館建設(shè)人員彌補(bǔ)了較多的技術(shù)短板,而檔案館建設(shè)人員只需要采集用戶需求并將其轉(zhuǎn)變?yōu)榭刹僮鞯慕M織模式,這樣有的放矢的建設(shè)、管理和服務(wù)模式自然會(huì)節(jié)約很多無用的和重復(fù)成本,從而降低了服務(wù)開銷。
從資源存儲(chǔ)和共享角度來說,云服務(wù)的提供商自身往往會(huì)擁有龐大的云計(jì)算服務(wù)器集群,不但能夠?yàn)閿?shù)字檔案館建設(shè)主體提供海量的信息存儲(chǔ)空間,而且在很大程度上保證了數(shù)據(jù)的穩(wěn)定性和安全性,基于安全技術(shù)和專業(yè)團(tuán)隊(duì)的信息管理系統(tǒng),在數(shù)據(jù)備份恢復(fù)、抗災(zāi)難能力、權(quán)限管理等方面擁有較大的優(yōu)勢(shì)。同時(shí),云計(jì)算的自身優(yōu)勢(shì)可以在信息平臺(tái)搭建之初就避免了資源限制、資源重復(fù)、信息壁壘等問題。通過各種信息資源的集成分析,各數(shù)字檔案館的資源可以輕松地實(shí)現(xiàn)共建共享、空間存儲(chǔ)、資源互借等集成化功能,使以往數(shù)字檔案館建設(shè)中的信息孤島不復(fù)存在[5]。這種基于大數(shù)據(jù)和共享理念的檔案信息資源服務(wù)模式,更能體現(xiàn)當(dāng)下的信息用戶需求,提高檔案資源利用率。
從利用成本角度來看,基于云計(jì)算的數(shù)字檔案館的開放化服務(wù)使得用戶的信息資源利用成本大大降低,而且更能夠根據(jù)不同用戶或用戶群需求實(shí)現(xiàn)有的放矢的個(gè)性化服務(wù)、定題服務(wù)、知識(shí)服務(wù)等,恰恰體現(xiàn)了“用戶需求為中心”的建設(shè)思路。另外,云計(jì)算的終端易用性能夠更好地提升用戶體驗(yàn),使其只需通過易掌握的終端入口利用云環(huán)境下的分布式數(shù)字檔案館資源,即一旦用戶通過終端提出自身需求,云計(jì)算平臺(tái)會(huì)根據(jù)用戶意圖最快最優(yōu)地將檢索結(jié)果呈現(xiàn)到檢索界面,大大降低了用戶的時(shí)間成本和經(jīng)濟(jì)成本。
從增值服務(wù)角度來看,基于云計(jì)算的數(shù)字檔案館不僅可以實(shí)現(xiàn)傳統(tǒng)的信息傳遞、聯(lián)合加工、資源共享等增值服務(wù),還可以實(shí)現(xiàn)更高層次的信息服務(wù),如數(shù)據(jù)挖掘和知識(shí)服務(wù)。云技術(shù)的一大特點(diǎn)便是其集成化和系統(tǒng)化,基于這種技術(shù)環(huán)境下的信息資源可以更好地實(shí)現(xiàn)聯(lián)合發(fā)現(xiàn)和知識(shí)挖掘,進(jìn)而向用戶提供更好的新智力要素的知識(shí)服務(wù),提升用戶的知識(shí)創(chuàng)新能力。當(dāng)然,愈實(shí)現(xiàn)這種增值性的知識(shí)挖掘服務(wù),需在數(shù)字檔案館建設(shè)之初就進(jìn)行分布式、結(jié)構(gòu)化的資源組織處理,通過初期的數(shù)據(jù)分析、標(biāo)引技術(shù)以及網(wǎng)格化技術(shù)等將龐大的計(jì)算機(jī)程序拆分成可以自主結(jié)合的子程序,進(jìn)而建立起強(qiáng)大的數(shù)字處理和運(yùn)算中心,從基礎(chǔ)平臺(tái)上為數(shù)字檔案館各種增值服務(wù)的開展提供標(biāo)準(zhǔn)和技術(shù)。
3.1 數(shù)字檔案館建設(shè)過程中的權(quán)限及涉密問題
對(duì)于不同檔案館的信息資源來說,一般都是有保密要求或者保密期限的,將這些資源全盤放到云計(jì)算平臺(tái)上,需要對(duì)公開的對(duì)象有特定設(shè)置,如保密權(quán)限的時(shí)間設(shè)置、特定訪問人群的修改等,而有的資源則是對(duì)所有用戶全面開放的。所以,這就產(chǎn)生了一個(gè)問題,面對(duì)龐大的數(shù)字化檔案資源和用戶,如何根據(jù)用戶需求和自身保密需要,定時(shí)有機(jī)地設(shè)置訪問權(quán)限,且盡量避免權(quán)限混亂以及由此帶來的信息泄露等問題。
3.2 數(shù)字檔案館中技術(shù)層面的安全保密問題
因?yàn)樵谠朴?jì)算環(huán)境下,數(shù)字檔案館的資源數(shù)據(jù)并不是保存在本地服務(wù)器上,而是保存在云計(jì)算處理中心的數(shù)據(jù)處理中心,一定程度上存在著檔案信息的安全保密隱患。目前,大多數(shù)云服務(wù)提供商均在數(shù)據(jù)傳輸環(huán)節(jié)加大了數(shù)據(jù)加密力度,最大限度地降低了信息安全隱患,但在用戶存儲(chǔ)和日常處理環(huán)節(jié)的加密保護(hù)問題仍然存在。因此,如何在數(shù)據(jù)意外丟失、損壞,非正常收集、傳遞、利用,以及提升數(shù)據(jù)抗風(fēng)險(xiǎn)和數(shù)據(jù)恢復(fù)能力,則是目前云服務(wù)提供商需要重視的問題,它不僅涉及到云計(jì)算方面的技術(shù)性問題,還需要保證在不影響檔案館服務(wù)提供方和用戶使用的情況下來實(shí)現(xiàn)。
3.3 檔案館資源數(shù)字化過程中的資源版權(quán)問題
因?yàn)榘凑赵品?wù)的服務(wù)理念,各檔案館間的信息資源是需要按照相關(guān)協(xié)議進(jìn)行共建共享的,這樣才能最大程度降低檔案館運(yùn)營成本和用戶的使用成本,但這種無邊界的共享協(xié)議也必然會(huì)涉及版權(quán)問題。目前,關(guān)于檔案館各類型資源的版權(quán)爭(zhēng)議解決方案尚無官方版本,大多僅是自發(fā)形成的一種協(xié)議處理文件,面對(duì)需要訴諸法律的版權(quán)爭(zhēng)議的時(shí)候顯得力不從心。因此,有關(guān)云服務(wù)環(huán)境下檔案館信息資源的版權(quán)保護(hù)亟須配套相應(yīng)的解決方案,方便用戶使用檔案信息資源的同時(shí),也降低用戶可能遇到的版權(quán)壁壘,更好地提升云服務(wù)在數(shù)字檔案館建設(shè)中的合理合規(guī)性[6]。
3.4 不同協(xié)議環(huán)境下的統(tǒng)一接口問題
在云計(jì)算各服務(wù)提供商之間,目前并不存在統(tǒng)一的介入標(biāo)準(zhǔn),不同檔案館在數(shù)字化接入“云端”的過程中,從計(jì)算機(jī)、服務(wù)器、文件格式、傳輸方式及協(xié)議等多個(gè)方面千差萬別,這就產(chǎn)生了一定的接口障礙。云計(jì)算服務(wù)提供商的單一接口難以滿意不同類型檔案館數(shù)字化建設(shè)的需要,導(dǎo)致很多時(shí)候的數(shù)字化接入云端服務(wù)心有余而力不足,因此,云服務(wù)提供商需要針對(duì)不同類型的資源操作平臺(tái),有針對(duì)性地開發(fā)相應(yīng)的接口插件,以提升其靈活性來面對(duì)不同的云服務(wù)終端。
云計(jì)算服務(wù)的價(jià)值精髓并非其技術(shù)本身,而是在于基于這種技術(shù)能夠使相關(guān)行業(yè)先進(jìn)的服務(wù)理念及模式得到實(shí)現(xiàn)的可能,節(jié)約建設(shè)和服務(wù)成本的同時(shí),進(jìn)而將信息資源的共建共享理念深入人心,使得大數(shù)據(jù)和超共享得到實(shí)踐和拓展。當(dāng)然,要融入數(shù)字檔案館的云共享體系中,還需要在技術(shù)、模式、法律、標(biāo)準(zhǔn)等多方面進(jìn)行改進(jìn)。
首先,需要不斷提升安全保護(hù)技術(shù),以保證各類檔案數(shù)字資源的安全存儲(chǔ),如服務(wù)等級(jí)協(xié)議、訪問策略控制、存儲(chǔ)訪問日志、數(shù)據(jù)定期備份等均是需要云服務(wù)提供商需要開發(fā)或完善的基本功能[7]。其次,針對(duì)不同類型用戶,需要差異化訪問權(quán)限,以更好的保證用戶隱私,如將管理員權(quán)限和密匙管理者權(quán)限分離以防止非法授權(quán)訪問,再如建立起即時(shí)的數(shù)據(jù)銷毀機(jī)制,即當(dāng)用戶進(jìn)行數(shù)據(jù)刪除后,云端服務(wù)器也定期進(jìn)行清理以防止被非法恢復(fù)進(jìn)而泄露;最后,需要不斷完善建設(shè)和服務(wù)標(biāo)準(zhǔn),以消除資源共享壁壘,這就需要成立相關(guān)的數(shù)字檔案館云服務(wù)的協(xié)調(diào)或監(jiān)督機(jī)構(gòu),不但在建設(shè)之初就統(tǒng)一其各技術(shù)標(biāo)準(zhǔn),減少后期重復(fù)建設(shè)成本,同時(shí),還可以協(xié)調(diào)處理各檔案館數(shù)字化資源共建共享中出現(xiàn)的各類爭(zhēng)議和問題,并對(duì)其服務(wù)效能進(jìn)行科學(xué)評(píng)估,以更好地提升云服務(wù)水平。
[2]黃正鴻.云計(jì)算在檔案信息化領(lǐng)域的應(yīng)用啟示[J].中國檔案,2011(5).
[3]賈聰聰.淺談云環(huán)境下數(shù)字檔案館的建設(shè)[J].蘭臺(tái)世界,2015(1).
[4]劉偉謙.云計(jì)算在檔案館中的應(yīng)用模式初探[J].檔案學(xué)研究,2012(2).
[5]黎春蘭,鄧仲華.云計(jì)算下的信息資源共享研究[J].中國信息界,2011(12).
Study of DigitalArchivesDevelopmentOpportunity Based on Cloud Com puting Environment
Zhao Chunhui
(Library,Zhongyuan University of Technology,Zhengzhou Henan 450007)
Based on the introduction on the conceptof cloud computingand digitalarchives,thearticleanalyzes the advantages of cloud computing technology in the construction of digitalarchiveson focus;finally summarizesthe existing problems in the construction of digital archives based on cloud computing technology and puts forward some countermeasures for improvement.
Cloud Computing;Digital Archives;Information Resource
C39
A
1671-0037(2015)12-82-3
2015-11-28
2015年河南省檔案局科技項(xiàng)目“基于云計(jì)算的數(shù)字檔案館信息資源服務(wù)研究”(2015-X-16)。
趙春輝(1983-),男,碩士,館員,研究方向:信息咨詢。