姜曉旭,羅 輝
第四軍醫(yī)大學教育技術中心,西安 710032
隨著信息技術在高校信息資源建設中的普及與應用,高校信息資源建設成果顯著。在數(shù)量激增的基礎上,信息資源建設正朝向內(nèi)容多元化、形式多樣化、結(jié)構(gòu)復雜化方向發(fā)展。面對紛繁復雜的海量信息資源,有效提高服務質(zhì)量,發(fā)揮資源最大效能,是對資源深層開發(fā)和利用的更高要求。云計算作為一種新興的共享基礎架構(gòu)方法,在高校信息資源建設與應用方面大有可為。
高校為支撐信息資源建設的數(shù)據(jù)中心配備了大量的服務器、網(wǎng)絡和存儲等基礎設施。然而,這些設備更新?lián)Q代很快,一旦利用率低,就會造成無形的資源浪費,增加數(shù)據(jù)中心建設成本。
高校資源建設尚未遵照統(tǒng)一的技術標準規(guī)范,導致數(shù)據(jù)異構(gòu)、格式?jīng)_突、可擴展性和通用性差,缺乏開放的互操作接口,“信息孤島”現(xiàn)象層出不窮,優(yōu)質(zhì)信息資源難以共享。
不同區(qū)域間高校的信息資源建設水平良莠不齊。國內(nèi)一些知名高校擁有豐富的信息資源,但僅能使有限區(qū)域內(nèi)的少數(shù)人獲益,供大于求會造成優(yōu)質(zhì)信息資源閑置。而一些普通高校由于缺乏有效的共享渠道和機制,難以獲取優(yōu)質(zhì)的信息資源而造成資源的緊缺[1]。
面對復雜多變的信息環(huán)境,高校不僅面臨著高成本的人力、物力投入,還面臨著更高難度的系統(tǒng)運維。單純增加人員管理,難以提高系統(tǒng)運維的效率。一旦發(fā)生故障很難快速恢復,從根本上來說系統(tǒng)的安全穩(wěn)定性有待提高。
云計算作為一種新型的服務交付和使用模式,通過網(wǎng)絡以按需、易擴展的方式向用戶提供所需的硬件、平臺、軟件和網(wǎng)絡資源[2]。提供資源的網(wǎng)絡被稱為“云”,“云”中的資源在使用者看來是可以無限擴展的,并且可以隨時獲取、按需使用和擴展、按使用量付費。這種特性經(jīng)常被稱為像水電一樣使用IT基礎設施、軟件和資源服務。
虛擬化技術作為云計算的核心技術之一,將高?,F(xiàn)有的硬件設備整合為虛擬資源池,屏蔽服務器、網(wǎng)絡、存儲等物理設備間的差異,動態(tài)部署、分配給不同的應用和服務,提高底層資源的利用率,降低建設成本。實驗證明,采用虛擬化技術能使每臺服務器的平均利用率從7%提高到68% ~80%;部署時間從小時級降低到分鐘級;服務器重建和應用加載時間從20 h~40 h降低到15 min~30 min;建設成本節(jié)約 30%以上[3]。
將高校物理位置分散的異構(gòu)信息資源進行整合,存儲在“云”這個龐大的計算與存儲集群中,由云端集中管理和調(diào)度。實現(xiàn)信息資源的分布存儲和集中管理,避免信息資源重復建設,消除信息孤島,共同營造一個信息共享空間。例如:Amazon Simple Storage Service(S3)是Amazon公司提供的基于云平臺的網(wǎng)絡存儲服務。借助S3,用戶可將數(shù)據(jù)存放到存儲云上,通過互聯(lián)網(wǎng)進行訪問和管理,可以節(jié)省用戶維護數(shù)據(jù)的成本。通過S3提供的REST或者SOAP接口,云平臺中的應用程序也可以自動訪問、調(diào)用存儲云中的數(shù)據(jù)。
通過大規(guī)模分布式文件系統(tǒng),將信息資源以分塊和多副本備份的方式分散存儲在云中,對數(shù)據(jù)的分析處理也以大規(guī)模并行計算和分布式計算技術實現(xiàn)。例如:谷歌文件系統(tǒng)(google file system,GFS)和Hadoop分布式文件系統(tǒng)(hadoop distributed file system,HDFS)共同采用的MapReduce編程模型,運行于一個虛擬服務器集群上,采用并行處理的方式將數(shù)據(jù)或應用程序的功能分割成若干個模塊,由網(wǎng)絡上多臺計算機協(xié)同完成。此外,云平臺提供各種開放API支持異構(gòu)接入,根據(jù)需求靈活擴展,自動同步、實時更新信息資源,為在更廣的范圍內(nèi)實現(xiàn)信息資源共享創(chuàng)造條件。
通過云計算實現(xiàn)分布式、異構(gòu)信息資源的負載均衡,避免網(wǎng)絡過載。利用冗余備份、容錯容災等技術避免因操作不當而造成的數(shù)據(jù)丟失、破壞以及病毒入侵、服務中斷、硬件損壞等威脅高校信息資源共建共享的安全問題。同時,也使用戶從復雜、專業(yè)性極強的網(wǎng)絡安全與系統(tǒng)運維中解脫出來,而專注于資源應用本身?,F(xiàn)有的云服務提供商如Amazon、IBM、Google大多提供了集VPN、身份認證、數(shù)據(jù)加密、冗余備份、安全存儲等技術于一體的安全保障體系,用于保障云平臺的安全性和服務的連續(xù)性。
結(jié)合高校信息資源建設存在的問題及云計算在資源建設中的優(yōu)勢,擬采用云計算技術構(gòu)建高校信息資源共享云平臺。設計理念是以面向服務的架構(gòu)(SOA)為基礎。對信息資源實施分布存儲和集中管理為方法,以實現(xiàn)信息資源開放共享為目的。其體系架構(gòu)自下而上分為物理層、平臺層、資源整合層、應用層和訪問層(如圖1所示)。
物理層也稱基礎設施層,主要負責為整個平臺的正常運行提供硬件支持。主要包含服務器集群、網(wǎng)絡設施和高性能存儲集群等。利用虛擬化軟件將這些設備虛擬為一個大型資源池,屏蔽各類不同型號設備之間的差異,對上層提供統(tǒng)一的服務接口,以基礎設施即服務(IaaS)的方式向上提供動態(tài)可伸縮的物理資源。
平臺層以平臺即服務(PaaS)的方式提供上層應用程序開發(fā)環(huán)境、運行環(huán)境、數(shù)據(jù)庫環(huán)境、開放API和Web Service模塊。開放API是一種新型Web 2.0服務模式,利用這些API可以對分散資源和服務進行整合,能帶來具有新價值的Web服務[4]。將平臺層部署在物理層提供的虛擬硬件資源上,構(gòu)建相互隔離的、基于不同業(yè)務需求的虛擬機,并且通過多機冗余備份,提高數(shù)據(jù)的安全性和服務的可用性。
圖1 高校信息資源共享云平臺體系架構(gòu)
資源整合層介于平臺層和應用層之間,是高校信息資源共享平臺不可或缺的組成部分。該層主要實現(xiàn)各種元數(shù)據(jù)庫、索引庫的構(gòu)建,借助一系列標準化輔助工具(導入導出工具、編目工具、元數(shù)據(jù)生成工具等[5])進行資源元數(shù)據(jù)的生成、編輯、轉(zhuǎn)換、導入、導出等操作。將高校分散、異構(gòu)的多媒體素材、網(wǎng)絡課程、視頻等各類信息資源進行標準化,整合成統(tǒng)一的信息資源視圖,簡化高校信息資源管理,同時為上層應用服務的實現(xiàn)打好基礎。值得指出的是,在對高校信息資源進行標準化時,必須嚴格遵循相關的技術標準規(guī)范,使標準化的資源具有規(guī)范性和互操作性。在構(gòu)建云平臺前期,已結(jié)合國內(nèi)外資源建設現(xiàn)行標準,構(gòu)建了教育資源標準化的概念模型及元數(shù)據(jù)實例表,為資源的標準化做好了準備。借助元數(shù)據(jù)生成工具對資源進行元數(shù)據(jù)提取的流程(如圖2 所示)[6]。
圖2 元數(shù)據(jù)提取流程
應用層包含管理中間件和應用服務兩部分。在管理中間件的統(tǒng)一調(diào)控下,使資源按照用戶需求進行安全、高效地配置,保證資源共享云平臺發(fā)揮最佳效能。在此基礎上,應用服務部分再根據(jù)用戶需求靈活定制個性化的資源應用系統(tǒng)。用戶只需通過云平臺提供的用戶交互接口進行一次登錄,就可實現(xiàn)對校內(nèi)所有信息資源系統(tǒng)的登錄和訪問[7]。
訪問層包括用戶自助服務門戶和云平臺管理門戶,是不同身份角色的用戶訪問云平臺的入口。用戶通過SaaS方式獲取個性化云服務,系統(tǒng)管理員負責統(tǒng)一身份認證和系統(tǒng)管理。此外,各種軟硬件、應用程序均存儲、運行在云中,而不是本地計算機。用戶不需要配置高端設備,利用現(xiàn)有的各種移動設備如智能手機、筆記本電腦、平板電腦通過網(wǎng)絡即可接入云平臺。
高校信息資源共享云平臺的實現(xiàn)主要涉及虛擬化技術、分布式存儲、并行計算等關鍵技術在云平臺上的具體實現(xiàn)。下面結(jié)合具體實例加以介紹:
物理層主要提供IaaS服務,實現(xiàn)的關鍵技術是虛擬化技術,包括對服務器、網(wǎng)絡和存儲設備的虛擬化。目前比較成熟的硬件虛擬化軟件有VMware公司的vSphere系列、微軟公司的Hyper-V系列和思科公司的XenServer平臺[8]。這些虛擬化軟件提供對物理設備的系統(tǒng)管理。以服務器虛擬化為例,將服務器虛擬化為多個虛擬機,根據(jù)上層應用需求分配合適的虛擬硬件資源,實現(xiàn)資源的統(tǒng)一調(diào)度以及不同進程之間的負載均衡,提高服務器利用率。在對服務器進行虛擬化時,可借助市場主流虛擬化軟件如VMware ESX將虛擬化平臺直接架構(gòu)在物理層之上,客戶機原有OS無需做任何修改即可被劃分成多個相互獨立的虛擬OS相互隔離運行于虛擬化平臺上。由VMware ESX構(gòu)建的虛擬機架構(gòu)主要包括兩大模塊:虛擬機管理器(VMM)負責對硬件資源進行抽象,包括CPU和內(nèi)存等的虛擬化。VMkermel作為監(jiān)控平臺,負責對虛擬機進行托管以及對物理資源的管理和調(diào)度。利用VMware ESX進行虛擬化的應用實例如圖3所示[9]。
圖3 服務器虛擬化實例
平臺層主要提供PaaS服務,實現(xiàn)的關鍵技術是分布式計算和并行處理,主要負責解決云平臺服務器集群間的協(xié)同工作,同時提供超大規(guī)模計算和海量存儲能力??山柚F(xiàn)有比較成熟的Google App Engine(GAE)在線應用平臺,提供在線開發(fā)、測試、部署、運行網(wǎng)絡應用程序、Microsoft Windows Azure平臺為應用程序提供運行環(huán)境、Salsforce.com應用程序開發(fā)平臺以及Hadoop平臺進行平臺層的構(gòu)建。以Hadoop平臺為例,Hadoop分布式文件系統(tǒng)HDFS用于實現(xiàn)大規(guī)模數(shù)據(jù)可靠的分布式讀寫,它是一個結(jié)構(gòu)化、可擴展、具體日志功能,適用于大數(shù)據(jù)集應用程序的分布式文件系統(tǒng),具有高效的數(shù)據(jù)讀寫和容錯能力[10]。它以文件和目錄的形式組織用戶數(shù)據(jù),支持創(chuàng)建、刪除、修改、復制文件和目錄等操作,用戶可通過命令接口或HTTP瀏覽器即可瀏覽HDFS文件。HBase分布式數(shù)據(jù)庫運行于HDFS之上,作為數(shù)據(jù)的實際存放容器,具有良好的伸縮性、有序、高可用性。MapReduce分布式計算模型用于實現(xiàn)大規(guī)模數(shù)據(jù)計算,它是一個數(shù)據(jù)分析任務的編程模型,提供了在大規(guī)模計算機集群上對海量數(shù)據(jù)進行分布式并行處理的方法,采用主從結(jié)構(gòu),主服務器負責調(diào)度所有任務,子服務器執(zhí)行被調(diào)配的Map任務和Reduce任務。利用Hadoop平臺構(gòu)建平臺層的實例如圖4所示。
圖4 Hadoop分布式計算實例
應用層主要提供SaaS服務,面向用戶提供個性化定制、資源導航、智能檢索等服務,具有統(tǒng)一接口界面、單點登錄和一站式訪問等特性。保證實現(xiàn)的關鍵技術有Web 2.0、多租戶技術、認證安全、定價計費、服務整合、開發(fā)定制等技術[11]。Web 2.0技術作為新一代互聯(lián)網(wǎng)技術,具有交互性、社會性等特征,用于實現(xiàn)系統(tǒng)界面和用戶接口的封裝,以提高界面的交互性和靈活性。多租戶技術實現(xiàn)用戶共享同一資源池中的軟硬件資源,按需使用資源并能夠進行靈活配置,且用戶之間相互隔離、互不影響。以Force.com多租戶架構(gòu)的實現(xiàn)為例,它通過元數(shù)據(jù)驅(qū)動的體系結(jié)構(gòu),實現(xiàn)數(shù)據(jù)、公共元數(shù)據(jù)和用戶專用元數(shù)據(jù)等組成的共享數(shù)據(jù)庫。在運行時引擎的調(diào)度下使每個用戶的數(shù)據(jù)和定制的專用元數(shù)據(jù)之間相互隔離,能夠按照用戶需求個性化定制應用程序,實現(xiàn)高性能、可擴展、按需定制的多租戶應用。利用Force.com多租戶技術構(gòu)建多租戶應用的實例如圖5所示。
圖5 基于元數(shù)據(jù)驅(qū)動的多租戶應用實例
文章結(jié)合云計算技術構(gòu)建了高校信息資源共享云平臺,并對其體系架構(gòu)及實現(xiàn)進行了深入剖析。該平臺的實現(xiàn)需要虛擬化、分布式計算、多租戶等多種關鍵技術之間的協(xié)同,借助現(xiàn)有比較成熟的云平臺應用實例構(gòu)建高校信息資源共享云平臺,可縮短平臺開發(fā)周期、為平臺的上線應用提供良好的技術支持。此設計方案旨在將云計算技術應用于高校信息資源建設,以期為資源共建共享提供新思路,其應用效果還應在實踐運行中得以驗證,也是下一步需要完成的重點工作。當然,高校信息資源共享云平臺的構(gòu)建也同樣面臨著挑戰(zhàn)。云計算的標準化尚未完善,支撐云平臺運行的云服務商尚未達成統(tǒng)一的技術標準、服務標準。在服務能力、服務質(zhì)量、運行維護和能效管理等方面參差不齊,同時還面臨不同云平臺的數(shù)據(jù)和應用無法相互遷移,造成云平臺孤立、云服務商壟斷等問題。因而,加快云計算技術標準化,為云平臺提供統(tǒng)一標準的接口,為用戶提供統(tǒng)一標準的云服務,成為今后亟待解決的問題。
[1]沈丹丹,江正.對高校教育信息資源共享策略的思考[J].軟件導刊,2010,(11):81
[2]褚軍亮,宋立榮.云計算用于網(wǎng)絡科技信息資源整合服務初探[J].中國科技資源導刊,2010,11(6):43
[3]陳江靜.云計算環(huán)境下地方高校信息資源共享的最大化[J].科技情報開發(fā)與經(jīng)濟,2011,(15):84
[4]王文清,陳凌.CALIS數(shù)字圖書館云服務平臺模型[J].大學圖書館學報,2009,(5):13
[5]嚴冰,單從凱.數(shù)字化學習資源中心建設的探索與創(chuàng)新[J].中國遠程教育,2011,(8):45
[6]苗麗,彭月英,裴國慶.基于語義網(wǎng)格的高校信息資源共享探索[J].廣西師范學院學報,2008,(3):85
[7]孫榮,孟凡立,張慰.論數(shù)字校園環(huán)境下高校教學資源的整合運行策略[J].現(xiàn)代教育技術,2012,(5):48
[8]雷萬云.云計算技術、平臺及應用案例[M].北京:清華大學出版社,2011:5
[9]虛擬化與云計算小組.云計算寶典技術與實踐[M].北京:電子工業(yè)出版社,2011:152
[10]王翔,潘郁.基于云計算的協(xié)同技術創(chuàng)新平臺[J].計算機工程與應用,2011,47(15):59
[11]虛擬化與云計算小組.云計算寶典技術與實踐[M].北京:電子工業(yè)出版社,2011:298