吳 非
目前海關(guān)對于報關(guān)單證的檔案管理仍采用 “紙質(zhì)歸檔、人工管理”的模式。海關(guān)業(yè)務(wù)現(xiàn)場將理單后的紙質(zhì)報關(guān)單證移交到檔案保管部門,歸檔、調(diào)檔等工作全部由檔案保管部門人工完成。近年來隨著海關(guān)報關(guān)單量連年攀升,紙質(zhì)檔案的保存和調(diào)閱面臨著巨大的壓力。日常管理中,紙質(zhì)報關(guān)單證存在著流轉(zhuǎn)過程散失、火災(zāi)、水侵、損壞等風險,刪改單、涉案調(diào)查等需要將紙質(zhì)檔案借出的,未知風險更不可測。此外,紙質(zhì)報關(guān)單證檔案管理無法滿足檔案實時在線調(diào)閱的要求,信息流轉(zhuǎn)存在滯后性,且受紙質(zhì)報關(guān)單調(diào)檔環(huán)節(jié)多、流轉(zhuǎn)時間長等因素制約,作為海關(guān)重要資源的原始報關(guān)單證的利用效率低下。
構(gòu)建海關(guān)報關(guān)單證電子檔案庫是緩解紙質(zhì)單證庫存及管理壓力的現(xiàn)實選擇。通過企業(yè)級的高速掃描儀將完成理單的紙質(zhì)報關(guān)單證轉(zhuǎn)換為電子圖像,并且結(jié)合光學文字識別(OCR)技術(shù)進一步精確捕捉掃描信息(如報關(guān)單號),從而形成報關(guān)單證電子檔案,并統(tǒng)一保存到電子檔案庫。電子檔案確立法律上的有效地位后,紙質(zhì)檔案可逐步退出,有效解決庫存所需場地不足的問題。在此基礎(chǔ)上可以實現(xiàn)報關(guān)單證檔案的在線實時調(diào)閱,強化報關(guān)單證的二次利用。通過與現(xiàn)有海關(guān)應(yīng)用系統(tǒng)進行對接,延伸系統(tǒng)應(yīng)用,為海關(guān)各部門實現(xiàn)及時監(jiān)控創(chuàng)造有利條件,有效提高防控三大風險的能力。
掃描后的電子文件數(shù)據(jù)量巨大。按上海海關(guān)業(yè)務(wù)量測算,日均報關(guān)單約7萬份,掃描單證70萬張,每張單證以300KB計,每日需要存儲200GB,每年需要近50TB??紤]到電子檔案需要長期存放和在線調(diào)閱的需求,后臺存儲無疑是此項目的關(guān)鍵。
非結(jié)構(gòu)化數(shù)據(jù)是相對于結(jié)構(gòu)化數(shù)據(jù)而言的,結(jié)構(gòu)化數(shù)據(jù)一般存放在數(shù)據(jù)庫中,具有統(tǒng)一的結(jié)構(gòu)和格式,可以通過二維表結(jié)構(gòu)邏輯來表達,其它如圖片、音頻、視頻等無法使用統(tǒng)一結(jié)構(gòu)來表示的數(shù)據(jù)則歸為非結(jié)構(gòu)化數(shù)據(jù)。通過掃描形成的海關(guān)報關(guān)單證電子檔案屬于非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)一般具有以下特點:
一是數(shù)據(jù)增長快。結(jié)構(gòu)化數(shù)據(jù)往往是Byte或KB級別,而非結(jié)構(gòu)化數(shù)據(jù)的增長量在MB級別,反映到存儲容量上,存放結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫一般在GB級別,而非結(jié)構(gòu)化數(shù)據(jù)動輒若干TB(1TB=1000GB),甚至達到PB(1PB=1000TB)級別。
二是吞吐需求高。對結(jié)構(gòu)化數(shù)據(jù)的訪問較一般的頻度高,每次讀寫數(shù)據(jù)量小,每次數(shù)據(jù)庫讀寫操作的數(shù)據(jù)量在若干Byte到KB,而非結(jié)構(gòu)化數(shù)據(jù)的訪問特點是讀寫相對不頻繁,但一次讀寫操作涉及若干MB甚至GB的數(shù)據(jù)。
三是文件級別存儲。結(jié)構(gòu)化數(shù)據(jù)是以數(shù)據(jù)塊(Block)進行存儲,而一般情況下,非結(jié)構(gòu)化數(shù)據(jù)存放的是文件(File)。
據(jù)IDC①IDC:International Data Corporation(國際數(shù)據(jù)公司),全球著名的信息技術(shù)、電信行業(yè)和消費科技市場咨詢、顧問和活動服務(wù)專業(yè)提供商。在IT領(lǐng)域的市場跟蹤數(shù)據(jù)已經(jīng)成為行業(yè)標準。的報告顯示,現(xiàn)在全球數(shù)據(jù)量每18個月就要翻一番,每年全球產(chǎn)生的數(shù)據(jù)量已經(jīng)高達40EB(1EB=1000PB),這些數(shù)據(jù)主要來自非結(jié)構(gòu)化數(shù)據(jù)。面對日益激增的非結(jié)構(gòu)化數(shù)據(jù)需求,傳統(tǒng)存儲面臨著越來越多的問題。SAN(Storage-Area Networks)用于塊級別存儲,如果要完成對文件級別的非結(jié)構(gòu)化數(shù)據(jù)的讀寫,需要用文件服務(wù)器通過SCSI或FC協(xié)議來進行,這樣無疑會增大了文件服務(wù)器的壓力,服務(wù)器的處理能力也會成為整個系統(tǒng)架構(gòu)的瓶頸。此外,SAN雖具有很高的性能,但構(gòu)建和維護相對復雜。NAS(Network-Attached Storage)用于文件級別存儲,通過自有的文件系統(tǒng)對文件進行控制,但是受到其聚合設(shè)備(NAS頭)的性能限制,NAS的整體性能一般低于SAN。無論是SAN還是NAS,傳統(tǒng)存儲由于受到其物理架構(gòu)的限制,比如磁盤控制器、總線、內(nèi)存、NAS頭以及所連接服務(wù)器等,最終會對存儲整體的容量和性能帶來無法逾越的瓶頸。一旦遇到存儲瓶頸,一般是通過更換更為強大的存儲硬件這種解決方案,但存儲的切換往往需要經(jīng)歷設(shè)備選型、購置、安裝調(diào)試、復制或重建數(shù)據(jù)、應(yīng)用測試等一系列工作,耗時耗力。
需要存儲的文件將呈指數(shù)級增長態(tài)勢,這就要求存儲系統(tǒng)的容量擴展能夠跟得上數(shù)據(jù)量的增長,甚至無限擴容。擴容過程最好要簡便易行,對應(yīng)用系統(tǒng)乃至計算中心的整體運行的影響應(yīng)降到最低。此外,用戶數(shù)量不斷增加,應(yīng)用需求不斷豐富,尤其是對于非結(jié)構(gòu)化數(shù)據(jù)訪問請求的日益增加,要求存儲系統(tǒng)也必須隨著容量的增加而擁有線性增長的吞吐性能,這些顯然都是傳統(tǒng)的存儲架構(gòu)無法達到的目標。為了應(yīng)對這些問題,“集群存儲”作為一種新興的存儲體系架構(gòu)應(yīng)運而生了。
根據(jù)百度百科詞條的解釋,“集群存儲”是指 “由若干個 ‘通用存儲設(shè)備’組成的用于存儲的集群,組成集群存儲的每個存儲系統(tǒng)的性能和容量均可通過 ‘集群’的方式得到疊加和擴展?!蓖ㄓ么鎯υO(shè)備被稱為存儲節(jié)點(node),除了用于存儲的磁盤外,還有單獨的處理器、控制器、內(nèi)存等組件。集群存儲由多個節(jié)點組成,通過存儲網(wǎng)絡(luò)連接。集群存儲一般沒有主控節(jié)點,所有節(jié)點在定位和功能上沒有分別,數(shù)據(jù)訪問是通過分布式的操作系統(tǒng)進行統(tǒng)一的調(diào)度,分散到各個節(jié)點上去完成的,因此比較容易做到負載均衡,從而實現(xiàn)訪問性能最優(yōu)。最重要的是,集群存儲由于采用開放式的基礎(chǔ)架構(gòu),變更或擴展每個存儲節(jié)點時無需對整個集群存儲的架構(gòu)進行調(diào)整,能夠做到方便靈活地進行存儲的擴容,一般均可達到PB級別。
在云計算時代,云存儲成為今后存儲發(fā)展的必然趨勢。對于云存儲的準確定義,目前業(yè)界沒有一個公認的、權(quán)威的表述,百度百科詞條的解釋可供參考:“云存儲是從云計算概念上延伸和發(fā)展出來的一個新的概念,是指通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的一個系統(tǒng)?!焙唵蔚卣f,云存儲要實現(xiàn)的目標是使用者可以在任何地方、任何時間方便地通過聯(lián)網(wǎng)設(shè)備存取數(shù)據(jù)資源。從這個角度看,集群存儲實際上是云存儲從概念到現(xiàn)實的一種落地表現(xiàn)形式。
從構(gòu)建海關(guān)報關(guān)單證電子檔案庫的需求來看,這是一個針對大量非結(jié)構(gòu)化數(shù)據(jù)存取的項目。雖然試點期間只考慮存放三年內(nèi)的數(shù)據(jù)量,但是從電子檔案長期保存的趨勢看,對于今后的數(shù)據(jù)增長較難預測,存儲容量需要平滑擴展,因此比較適合采用集群存儲。
云存儲的實現(xiàn)一般有兩種方式:一種是通過專用軟件對現(xiàn)有分散的傳統(tǒng)存儲進行整合;另一種就是使用專用集群存儲,比如EMC Isilon。第一種將傳統(tǒng)存儲進行整合的方式需要詳細了解計算中心內(nèi)現(xiàn)有的存儲資源,在此基礎(chǔ)上做出一個整體的規(guī)劃,以充分挖掘現(xiàn)有存儲資源的潛力,提高使用效率。第二種方式需要單獨購置專用集群存儲,但成本一般比傳統(tǒng)存儲要高。
作為一個獨立的具有探索性質(zhì)的項目,既不能對現(xiàn)有運行的其他應(yīng)用系統(tǒng)帶來影響,也不可能在項目初期投入過多,這兩種方式都不太適合,因此在項目的架構(gòu)設(shè)計過程中,項目組考慮了一種基于對象存儲技術(shù)的服務(wù)器集群存儲——OpenStack對象存儲,這種技術(shù)通過對單位成本較低的服務(wù)器進行堆疊,組成服務(wù)器集群存儲,在投入成本可控的情況下實現(xiàn)存儲容量的自由擴展和數(shù)據(jù)訪問性能的線性提升。
不同于傳統(tǒng)的存儲系統(tǒng)中用文件或數(shù)據(jù)塊作為基本的存儲單位,對象存儲中的基本存儲單位是對象(Object)。一個對象實際上就是文件的數(shù)據(jù)和一組屬性信息(metadata)的組合,這些屬性信息可以定義基于文件的RAID參數(shù)、數(shù)據(jù)分布和服務(wù)質(zhì)量等內(nèi)容。簡單地說,對象也可理解為一個容器,容納了文件數(shù)據(jù)和基本的存儲屬性。文件被分解為若干個存儲對象,并分發(fā)到一個或多個被稱為基于對象的存儲設(shè)備(OSD,Objected-based Storage Devices)上去。每個OSD都有自己的本地處理能力、內(nèi)存和網(wǎng)絡(luò)①在OpenStack對象存儲中,每個OSD實際上就是一臺Linux服務(wù)器。,OSD是整個分布式存儲網(wǎng)絡(luò)的核心。
這種存儲結(jié)構(gòu)帶來的好處是可以實現(xiàn)數(shù)據(jù)的智能化管理,因為對象本身包含了元數(shù)據(jù)甚至更多的屬性,比如對象使用狀況的統(tǒng)計信息,這些信息可以用于數(shù)據(jù)訪問的服務(wù)質(zhì)量控制,并在此基礎(chǔ)上實現(xiàn)訪問動態(tài)分配,最終達到OSD間的負載均衡。
OpenStack是由美國國家航空航天局(NASA)和Rackspace②Rackspace:全球三大云計算中心之一,1998年成立。在全球擁有10個以上的數(shù)據(jù)中心,管理超過64000臺服務(wù)器。合作研發(fā)的云平臺管理項目,包括HP、Intel、AMD、Microsoft、Cisco在內(nèi)的諸多IT企業(yè)均參與其中。Open-Stack對象存儲是OpenStack云項目的子項目,目標是使用標準的服務(wù)器集群為數(shù)千萬億字節(jié)的存取數(shù)據(jù)提供冗余的、可伸縮的數(shù)據(jù)存儲。不同于傳統(tǒng)文件系統(tǒng)和實時數(shù)據(jù)存儲系統(tǒng),OpenStack對象存儲技術(shù)最適合的用例就是永久類型的靜態(tài)數(shù)據(jù)的長期存儲,如圖片存儲、虛擬機鏡像等。海關(guān)報關(guān)單證的電子檔案正是此類典型用例。
1.OpenStack對象存儲的架構(gòu)
OpenStack一般由代理節(jié)點(Proxy node)、存儲節(jié)點(Storage node)、認證節(jié)點(Auth node)組成。三種類型節(jié)點的作用大致如下:
①Proxy node部署代理服務(wù)(Proxy Server),負責架構(gòu)內(nèi)組件間的相互通信以及客戶端與集群存儲的交互。根據(jù)客戶端的請求,查詢具體對象的存放位置,并轉(zhuǎn)發(fā)給相應(yīng)的Storage node。
②Storage node部署存儲服務(wù)(Storage Server)和一致性檢查服務(wù)(Consistency Server),Storage Server具體負責對象在磁盤上的存放,接收Proxy Server對于客戶端讀取數(shù)據(jù)的請求;Consistency Server負責查找并解決由數(shù)據(jù)損壞和硬件故障引起的錯誤,保證數(shù)據(jù)備份間的一致性。
③Auth node部署認證服務(wù),目的在于實現(xiàn)OpenStack各個項目間的認證管理。
2.數(shù)據(jù)冗余和集群無單點
整個集群中用于存放具體對象的部分可以被規(guī)劃成多個區(qū)(zone),每個區(qū)中包含若干個節(jié)點。對象被存儲在節(jié)點上,每個對象在多個不同節(jié)點上留有備份(默認情況,每個對象會留有3個副本),備份均勻地分布在集群服務(wù)器上,從而保證了系統(tǒng)的穩(wěn)定性和數(shù)據(jù)的冗余。集群存儲可以通過增加節(jié)點來線性地擴充存儲空間,對象本身包含的元數(shù)據(jù)和其他屬性可以讓系統(tǒng)自動完成數(shù)據(jù)遷移,使各節(jié)點重新達到平衡狀態(tài)。
在集群中,存儲的數(shù)據(jù)往往實現(xiàn)了冗余,但元數(shù)據(jù)信息的存儲一般是單點,一旦出現(xiàn)問題,同樣會對數(shù)據(jù)訪問帶來影響。而OpenStack對象存儲中的各個節(jié)點完全對稱,元數(shù)據(jù)和對象一起完全隨機均勻分布的,同時也有3個副本,因此整個集群中基本上不存在單點故障①OpenStack對象存儲技術(shù)不存在單點故障的理論依據(jù)主要來源于NWR策略。NWR是一種在分布式存儲系統(tǒng)中用于控制一致性級別的策略。N代表同一份數(shù)據(jù)副本的份數(shù),W代表更新一個數(shù)據(jù)對象時需要確保成功更新的份數(shù),R代表讀取一個數(shù)據(jù)需要讀取的副本的份數(shù)。公式W+R〉N,保證某個數(shù)據(jù)不被兩個不同的事務(wù)同時讀和寫;公式W〉N/2保證兩個事務(wù)不能并發(fā)寫某一個數(shù)據(jù)。假如把N設(shè)置成為2,那么只要有一個存儲節(jié)點發(fā)生損壞,就會有單點的存在,所以N必須大于2。默認情況下,OpenStack對象存儲的N=3,W=2,R=2,符合NWR策略。。此外,當一個節(jié)點出現(xiàn)故障時,OpenStack對象存儲會從其他正常節(jié)點上復制數(shù)據(jù)對故障節(jié)點進行恢復。
3.REST API接口
OpenStack對象存儲不能像傳統(tǒng)文件系統(tǒng)那樣進行掛載和訪問,只能通過REST API接口來訪問數(shù)據(jù)。REST(Representational State Transfer)②REST是一種輕量級的Web Service架構(gòu)風格,通過HTTP協(xié)議對資源進行操作,獲取、創(chuàng)建、修改和刪除資源正好對應(yīng)HTTP協(xié)議的GET、POST、PUT和DELETE方法,REST把HTTP對一個URL資源的操作限制在這四個方法之內(nèi)。的實現(xiàn)和操作完全通過HTTP協(xié)議,降低了開發(fā)的復雜性。REST還可以利用Cache來提高響應(yīng)速度,性能、效率和易用性上都優(yōu)于SOAP協(xié)議。
4.與傳統(tǒng)存儲比較的相對優(yōu)勢
如表1所示,和傳統(tǒng)存儲相比較,OpenStack對象存儲技術(shù)具有以下一些基本特性和相對優(yōu)勢。
表1 OpenStack對象存儲的特性和優(yōu)勢
圖1 各子系統(tǒng)及服務(wù)分解
海關(guān)報關(guān)單證電子檔案庫項目在進行系統(tǒng)設(shè)計時,分為生產(chǎn)作業(yè)子系統(tǒng)、數(shù)據(jù)存儲子系統(tǒng)和查詢應(yīng)用子系統(tǒng),各子系統(tǒng)又可細分為若干服務(wù),如圖1所示。
1.生產(chǎn)作業(yè)子系統(tǒng),通過高速掃描儀對紙質(zhì)單證進行集中掃描,生成電子圖像后,由光學文字識別軟件識別出單證報關(guān)單號,并建立以報關(guān)單號為索引的電子圖像集合,再由人工進行單證審核和掃描質(zhì)量抽檢等環(huán)節(jié),形成可交付歸檔的電子圖像包。該子系統(tǒng)由生產(chǎn)服務(wù)器、客戶端微機和高速掃描儀組成。客戶端主要完成掃描前的信息錄入、單證審核、質(zhì)檢、抽檢以及作業(yè)流程管理等工作。生產(chǎn)服務(wù)器負責暫存可交付的電子圖像和相關(guān)錄入信息,記錄生產(chǎn)日志,并進行生產(chǎn)系統(tǒng)的運行監(jiān)控。
2.數(shù)據(jù)存儲子系統(tǒng),將生產(chǎn)子系統(tǒng)生成的暫存在生產(chǎn)服務(wù)器上的電子圖像包通過存儲服務(wù)上傳至后臺服務(wù)器,通過數(shù)據(jù)加密服務(wù)進行加密,并調(diào)用集群存儲的代理接口傳輸給后臺的服務(wù)器集群存儲。集群存儲采用OpenStack對象存儲技術(shù),存儲代理服務(wù)接收加密后的電子圖像數(shù)據(jù)包,分解成相應(yīng)的若干對象,每個對象復制成為3份后,存放在集群存儲內(nèi)的不同服務(wù)器節(jié)點上。
數(shù)據(jù)存儲子系統(tǒng)由1臺代理服務(wù)器、1臺數(shù)據(jù)庫服務(wù)器和5臺存儲服務(wù)器組成。代理服務(wù)器用來部署數(shù)據(jù)存儲代理服務(wù)。數(shù)據(jù)庫服務(wù)器部署的SQLite數(shù)據(jù)庫是存放OpenStack對象存儲賬號和容器管理進程的組成部分,加解密的服務(wù)也部署在該臺服務(wù)器上。5臺存儲服務(wù)器組成集群,集群共劃分為5個zone,每個zone就是1臺存儲服務(wù)器,每臺服務(wù)器配12塊2TBSATA磁盤,5臺存儲服務(wù)器磁盤滿配容量可達120TB,由于存放3份數(shù)據(jù),因此可用容量為40TB。項目試點時,會根據(jù)不同關(guān)區(qū)區(qū)分進出口分步推進,因此在系統(tǒng)設(shè)計初期只投入了5臺存儲服務(wù)器,之后可以根據(jù)業(yè)務(wù)需要,增配磁盤或者服務(wù)器。
3.查詢應(yīng)用子系統(tǒng),通過REST API接口從存儲子系統(tǒng)中讀取并調(diào)閱相關(guān)的電子圖像,通過B/S方式完成海關(guān)業(yè)務(wù)部門提出的調(diào)檔、打印、流轉(zhuǎn)、出證等具體工作。
如圖2所示,系統(tǒng)整體處于海關(guān)內(nèi)部網(wǎng)絡(luò),數(shù)據(jù)存儲子系統(tǒng)和查詢應(yīng)用子系統(tǒng)的服務(wù)器部署在主機房內(nèi),受場地限制,生產(chǎn)作業(yè)子系統(tǒng)部署在郊區(qū)紙質(zhì)檔案庫房的掃描作業(yè)現(xiàn)場。試點初期,生產(chǎn)作業(yè)和數(shù)據(jù)存儲子系統(tǒng)間通過30Mbps網(wǎng)絡(luò)連接進行數(shù)據(jù)傳輸。海關(guān)用戶通過個人辦公電腦以瀏覽器方式進行單證圖像調(diào)閱和流轉(zhuǎn)。
圖2 系統(tǒng)網(wǎng)絡(luò)架構(gòu)
根據(jù)上海海關(guān)信息系統(tǒng)安全等級保護的相關(guān)要求,各子系統(tǒng)均被劃分為獨立的安全域,并在網(wǎng)絡(luò)、數(shù)據(jù)、應(yīng)用、客戶端及作業(yè)場地等層面實施了相關(guān)的安全控制策略。網(wǎng)絡(luò)層面,各安全域間由防火墻隔離,在系統(tǒng)模塊間通信多采用HTTPS方式,信息在每個環(huán)節(jié)的傳輸都采用TLS安全保護;數(shù)據(jù)層面,掃描文件在靜態(tài)存儲時,系統(tǒng)采用數(shù)據(jù)加密措施,加密算法為業(yè)界公認的AES-256,可以防止因為物理硬盤丟失而造成電子信息的泄露;應(yīng)用層面,基于用戶所在關(guān)區(qū)、部門、職務(wù),設(shè)計完備的授權(quán)體系,系統(tǒng)提供用戶登錄及操作日志記錄,以及報關(guān)單證電子檔案借閱、歸還、加鎖等相關(guān)操作的日志;客戶端層面,所有客戶端操作均在瀏覽器環(huán)境下進行,工作人員只能從事自己權(quán)限內(nèi)的工作,本地并不留存電子數(shù)據(jù)??蛻舳说耐獠拷涌诰捎梦锢砘蜍浖绞浇?,與外網(wǎng)沒有任何連接,以保證數(shù)據(jù)的安全性,防止數(shù)據(jù)外泄;作業(yè)場地層面,部署24小時視頻監(jiān)控。
項目上線后,日均處理報關(guān)單證12000份。每日生成的電子圖像文件約20萬個,數(shù)據(jù)容量60GB。報關(guān)單證電子檔案庫的建成極大地提升了海關(guān)對于報關(guān)單證這一寶貴資源的再次利用能力,刪改單、稽查、緝私取證等以往需要耗費較多人工的調(diào)檔過程變成了在線完成,調(diào)檔時間從平均2天減少到不足2秒。據(jù)統(tǒng)計,單證檔案的調(diào)閱率由原來的0.3%顯著提高至3.5%。
電子檔案的調(diào)閱在線完成,基本上可以杜絕紙質(zhì)檔案的借出,從源頭上嚴格控制住紙質(zhì)檔案出庫時所面臨的被損毀甚至被篡改的風險。電子檔案庫開放訪問接口,允許其他作業(yè)或監(jiān)控分析系統(tǒng)調(diào)閱檔案數(shù)據(jù),可以進一步拓展應(yīng)用范圍,上海海關(guān)已經(jīng)實現(xiàn)了電子檔案庫與海關(guān)廉政風險預警處置系統(tǒng)(HL2008)、報關(guān)單批量復審系統(tǒng)等的對接,為有效防控執(zhí)法、廉政風險,提高相關(guān)應(yīng)用系統(tǒng)使用效能提供了有效的輔助手段。
此外,除了現(xiàn)場批量掃描紙質(zhì)報關(guān)單,系統(tǒng)還預留了電子圖像數(shù)據(jù)導入接口,便于今后通過光盤或其它形式直接遞交的電子圖像歸檔入庫。將電子檔案庫前推至通關(guān)作業(yè)環(huán)節(jié)前,甚至可以逐步實現(xiàn)與分類通關(guān)作業(yè)無紙化的無縫銜接,為實現(xiàn)最終全程通關(guān)無紙化這一目標積累有益的經(jīng)驗。
海關(guān)報關(guān)單證電子檔案庫項目是上海海關(guān)對于應(yīng)用集群存儲系統(tǒng)乃至今后搭建云存儲和云計算環(huán)境做出的有益探索和實踐。與傳統(tǒng)存儲相比,應(yīng)用OpenStack對象存儲技術(shù)在存儲設(shè)備投入相對較少的情況下,實現(xiàn)了海量非結(jié)構(gòu)化數(shù)據(jù)的有效存儲和冗余,并且在保證數(shù)據(jù)訪問性能的前提下,具備良好的擴展性。
當然,作為新興技術(shù),集群存儲、OpenStack對象存儲等都還面臨一些問題,比如海關(guān)各層面對于這些技術(shù)的認知程度還不高,技術(shù)應(yīng)用范圍還不夠廣泛,技術(shù)本身可能還需進一步完善等。但隨著云計算時代的腳步日益臨近,云存儲必將成為今后存儲服務(wù)的發(fā)展趨勢。對此,海關(guān)科技部門確有必要提前準備,加強對于新知識、新技術(shù)、新產(chǎn)品的學習和研究,以迎接全新的技術(shù)管理理念和模式的變革。
〔1〕Lambert M.Surhone Marian T.Tennoe Susan F.Henssonow.Openstack 〔M〕.BetaScript Publishing.2011.
〔2〕Openstack維基.http://zh.wikipedia.org/wiki/OpenStack.
〔3〕Openstack Object Storage Administrator Manual-CACTUS.http://docs.openstack.org/cactus/openstack-objectstorage/admin/content/index.html.
海關(guān)與經(jīng)貿(mào)研究2013年1期