目前,數(shù)字資源在圖書館館藏資源的比重在不斷增加,并且還有進(jìn)一步擴(kuò)大的趨勢(shì)。在這樣的背景下,各國(guó)國(guó)家圖書館都非常重視館藏?cái)?shù)字資源的建設(shè),中國(guó)國(guó)家圖書館也已將數(shù)字資源建設(shè)視為文獻(xiàn)資源建設(shè)的重點(diǎn)。同時(shí),中國(guó)國(guó)家圖書館作為我國(guó)的國(guó)家總書庫(kù)必須將大量記載著人類文化遺產(chǎn)的數(shù)字資源進(jìn)行長(zhǎng)期保存,使數(shù)字資源得到持續(xù)利用和保護(hù),以便將來人們所使用。
由此可見,隨著數(shù)字資源數(shù)量的日益增多、種類的日益豐富、重要性的逐漸增強(qiáng),如何構(gòu)建合理的數(shù)字資源保存體系,制定合理的數(shù)字資源保存策略,將有價(jià)值的數(shù)字資源進(jìn)行永久保存,確保各種數(shù)字資源能隨時(shí)提取利用,以便為今后的數(shù)字信息提供保障,是國(guó)家數(shù)字圖書館當(dāng)前亟待解決的問題。
國(guó)家圖書館信息中心主任、總工程師于洪波表示:“為實(shí)現(xiàn)國(guó)家圖書館全面數(shù)字化,國(guó)家圖書館一直在進(jìn)行改造,預(yù)計(jì)建成之后的數(shù)字化圖書館從非結(jié)構(gòu)數(shù)據(jù)存儲(chǔ)量上,將達(dá)到800TB左右??紤]到數(shù)據(jù)的安全性、穩(wěn)定性,目前國(guó)家圖書館的數(shù)據(jù)多以光存儲(chǔ)為主?!?/p>
但是暫且不說光存儲(chǔ)能否真正做到永久保存,其離線保存功能也使得數(shù)據(jù)讀取會(huì)較為復(fù)雜,同時(shí)在大數(shù)據(jù)時(shí)代,它也無法將數(shù)據(jù)的最大價(jià)值充分發(fā)揮出來。
進(jìn)入2013年,全球數(shù)據(jù)迅速膨脹并變大,數(shù)據(jù)價(jià)值越來越被重視,數(shù)據(jù)爆炸性增長(zhǎng)給像國(guó)家圖書館類似的企業(yè)帶來了諸多問題,于是,在大數(shù)據(jù)時(shí)代,企業(yè)駕馭數(shù)據(jù)的能力遭到空前挑戰(zhàn)。
“對(duì)企業(yè)而言,大數(shù)據(jù)時(shí)代把各種技術(shù)都推至極限,其中包括獲取數(shù)據(jù)、管理數(shù)據(jù)、處理數(shù)據(jù)等?!崩ヲvStorNext工程副總裁Ivan Pittaluga指出,“目前,在全球范圍內(nèi)部署了85000套獲得許可的StorNext系統(tǒng)客戶端,管理的數(shù)據(jù)總量超過400PB,而且這個(gè)數(shù)據(jù)量每天仍在不斷增長(zhǎng)中。通過對(duì)這些用戶的分析我們發(fā)現(xiàn),大數(shù)據(jù)時(shí)代,企業(yè)對(duì)于數(shù)據(jù)的全生命周期管理和永久保存需求旺盛?!?/p>
那么,對(duì)于企業(yè)而言,什么樣的存儲(chǔ)平臺(tái)最具優(yōu)勢(shì)——它應(yīng)該能夠給數(shù)據(jù)流提供最高的性能,如果數(shù)據(jù)需要長(zhǎng)期保存起來,其成本是最低的,同時(shí)數(shù)據(jù)的耐久度又非常好??傊徽搹男阅芊矫娉霭l(fā)還是從存儲(chǔ)周期方面出發(fā),都能夠?yàn)槠髽I(yè)提供靈活的選擇?!半S著數(shù)據(jù)對(duì)于企業(yè)的重要性愈發(fā)明顯,對(duì)于數(shù)據(jù)的永久存儲(chǔ),有相當(dāng)一部分企業(yè)早已出現(xiàn)需求,但由于成本過于昂貴只得作罷。”Ivan Pittaluga表示,但隨著技術(shù)不斷演進(jìn),把數(shù)據(jù)永久保存起來,對(duì)企業(yè)來說已經(jīng)不再遙不可及。
“一個(gè)明顯的趨勢(shì)可以看出,此前傳統(tǒng)的存儲(chǔ),幾乎都是通過在線方式對(duì)數(shù)據(jù)進(jìn)行加工、保留以及歸檔,但現(xiàn)在已經(jīng)開始有一些企業(yè)采用新的數(shù)據(jù)流的方式,他們將加工完的數(shù)據(jù)、現(xiàn)階段不用的數(shù)據(jù)放到歸檔里面,需要用的時(shí)候再將其提取出來,同時(shí),將歸檔存儲(chǔ)實(shí)現(xiàn)永久保留,也就是幾千年甚至幾萬年的保留。”Ivan Pittaluga表示,“而這些也正是我們一直在推動(dòng)的,比如說高性能文件系統(tǒng)、可拓展文件系統(tǒng)和可拓展文件管理系統(tǒng),這些技術(shù)就能夠使得用戶以最快的速度實(shí)現(xiàn)數(shù)據(jù)的存取自如,這些性能的提升在StorNext5.0上已有充分體現(xiàn),從數(shù)據(jù)的產(chǎn)生、獲取過程,再到分發(fā)、歸檔存儲(chǔ),StorNext貫穿了整個(gè)大數(shù)據(jù)生命周期的管理?!?/p>
此外,對(duì)于數(shù)據(jù)永久保存,針對(duì)其成本過高的問題,目前的技術(shù)也對(duì)其有了應(yīng)對(duì)之策。以昆騰新推出的Lattus存儲(chǔ)技術(shù)為例,這個(gè)技術(shù)最大的功能就是支持海量的數(shù)據(jù),幾乎是無線的拓展能力,在地理分布上可以把整個(gè)系統(tǒng)分布到不同的位置;具有自我治愈、自我遷移的功能,在一定程度上損失多少外盤、損失多少界面,數(shù)據(jù)仍然可以在線訪問。此外,相比于傳統(tǒng)的RAID,Lattus將使用更少的磁盤,由此,耗電量和占用機(jī)房空間自然也都有不同程度的減少。
“總之,無論是硬盤的購(gòu)置成本、能耗成本、冷卻成本還是節(jié)省空間的成本,Lattus都比其他技術(shù)要少,除了降低成本外,使用該技術(shù)后,硬盤的利用率也比傳統(tǒng)RAID技術(shù)的硬盤提升了44%?!盜van Pittaluga表示。