鐘細軍 厲 亞
云計算與期刊云
——科技期刊未來的新平臺
鐘細軍 厲 亞
期刊作為新知識傳播的載體與平臺,隨著科技的進步,自身也在不斷地改變,特別是網(wǎng)絡信息技術使期刊的出版方式和載體形式產(chǎn)生了質的變化。如遠程采編系統(tǒng)改變了傳統(tǒng)稿源收集和專家審稿的郵遞方式,有效地縮短了出版周期;網(wǎng)絡化期刊、數(shù)字化期刊、開放存取(Open Access,OA)期刊和大型期刊數(shù)據(jù)庫的出現(xiàn)可方便用戶查閱文獻,促進科技信息的傳播與交流,降低出版成本。總之,期刊的網(wǎng)絡技術對期刊的發(fā)展起到了積極的作用。
我國現(xiàn)有期刊的網(wǎng)絡技術成果一般還停留在期刊社或出版單位各自為政的基礎上,主要是自建或依托專門的IT機構代建期刊社網(wǎng)站。其投資大,網(wǎng)站硬件資源有限,系統(tǒng)維護任務繁重,資源擴展或升級不方便,不利于期刊社的發(fā)展壯大。盡管有維普、萬方、知網(wǎng)等大型期刊數(shù)據(jù)庫專門收錄已發(fā)表的論文供讀者搜索,但收錄時間滯后,各數(shù)據(jù)庫之間的共享不方便,造成“信息資源孤島”現(xiàn)象出現(xiàn),更不能改進期刊的編輯、出版、發(fā)行、傳播方式,表現(xiàn)出一定的局限性。
近幾年蓬勃發(fā)展的云計算,通過互聯(lián)網(wǎng)絡組成大規(guī)模運算系統(tǒng)和分布式存儲系統(tǒng),“按需付費”,為用戶提供運算與存儲服務,具有高性能、低成本、通用性強、安全性高等顯著特點,在電信、科學計算、檔案管理、圖書情報管理和圖書出版等領域得到了廣泛應用。也有人探討科技期刊審稿過程中,使用云計算甄別學術造假或剽竊。但是,還沒有人探討和研究應用云計算實現(xiàn)科技期刊編輯、出版、發(fā)行。
借鑒云計算在已有領域應用的經(jīng)驗,本文基于云計算的特點和核心服務功能,探討期刊運用云計算的可能性,提出一種科技期刊的未來實現(xiàn)方式設想——期刊云,并對期刊云的功能、基本結構、運行與管理方式進行探討,力圖拋磚引玉,啟動云計算在期刊中的應用研究,以利于我國科技期刊的進一步發(fā)展。
云計算是新一代基于互聯(lián)網(wǎng)絡的高性能并行計算模型,通過互聯(lián)網(wǎng)把分布在不同地方的服務器或者PC機連接起來,構成服務器集群,即所謂的“云”,獲得超級計算能力和大規(guī)模分布式存儲系統(tǒng)。在體系、結構上主要有終端、服務目錄、管理系統(tǒng)和部署工具、資源監(jiān)控、服務器集群等。用戶只需使用簡單的可上網(wǎng)的終端設備,向云管理系統(tǒng)申請實時任務,由云的管理系統(tǒng)和部署工具根據(jù)云的運行狀況,實時分配服務器,就可以“透明地”、“隨需應變”地使用云中的資源,實現(xiàn)按需計算,提高工作效率和計算資源的利用率。本質上,云計算就是通過網(wǎng)絡協(xié)同工作,實現(xiàn)IT基礎架構共享,由許多互相連接的計算機,協(xié)同完成數(shù)據(jù)存儲和計算等任務。
1.典型云計算服務體系
近10年,云計算及平臺有了迅速發(fā)展,典型的云有Google云、微軟Live Mesh、谷歌搜索、Gmail、Google Docs、Amazon的彈性云EC2和瑞星的“云安全”等。不論是哪種云平臺,其服務體系可用圖1描述,圖中以太、因特等網(wǎng)絡連接著各類用戶終端和云。云包含云平臺和技術支持系統(tǒng),可劃分為計算云、存儲云、云管理與維護等。用戶終端通過向云管理中心登錄請求,按需按時使用云,云完成任務后向用戶終端輸出結果。
圖1 云計算服務體系
現(xiàn)有云計算中,Google云是一個典型的應用云平臺,其基礎架構包括4個相互獨立又緊密結合在一起的系統(tǒng):Google File System(GFS),Map Reduce(MR),Chubby和Big Table。
GFS是為Google應用程序設計的分布式文件管理系統(tǒng),云中一般會部署多個GFS集群,供上百個客戶端連續(xù)不斷地頻繁訪問。GFS集群一般由一個主服務器和多個塊服務器構成,將大文件按塊分割,并對文件和塊規(guī)定一些有效的屬性數(shù)據(jù)信息,如文件的名詞空間、塊句柄、塊大小、塊物理位置等,這些信息稱為文件系統(tǒng)的元數(shù)據(jù),由主服務器管理。文件按塊存儲,每個塊對應一個存儲器物理位置,由塊服務器在主服務器訪問控制下,完成對塊數(shù)據(jù)的讀寫與多備份存儲。主服務器根據(jù)元數(shù)據(jù)完成對塊服務器的訪問控制和文件到塊的映射存儲與讀取。
MR是分布式編程模式,其編程規(guī)范簡化分布式系統(tǒng)的編程,用戶只需認真編寫應用程序。MR通過Map(映射)和Reduce(化簡)構成運算基本單元,用戶只需提供自己的Map函數(shù)和Reduce函數(shù)即可并行處理海量數(shù)據(jù)。
Chubby是一個高可用、分布式數(shù)據(jù)鎖服務。當云中有機器失效時,Chubby使用Paxos算法保證備份的一致性。
Big Table為大規(guī)模分布式數(shù)據(jù)庫,使用1臺主服務器和多臺tablet服務器(數(shù)據(jù)服務器)。應用Search History、Maps、Orkut,RSS閱讀器等,Big Table可以處理大量的格式化以及半格式化數(shù)據(jù)??蛻舳送ㄟ^編程接口(API)與主服務器進行元數(shù)據(jù)通信,與tablet服務器進行數(shù)據(jù)通信。
2.云計算的使用
使用云計算相當簡單,當相應的應用程序被云管理系統(tǒng)配置好后,用戶只要使用基于云計算構架的在線操作系統(tǒng)(WebOS),就可以在一臺連接互聯(lián)網(wǎng)的最小配置計算機上,通過瀏覽器訪問運行在服務器上的所有基于網(wǎng)絡的應用。
WebOS用戶可以從不同的計算機登錄,同時使用多個工作中心協(xié)作,完成多位置信息訪問和用戶協(xié)作。如網(wǎng)絡文件系統(tǒng)(Network File System)和遠程桌面(Remote Desktop),用戶可從Web桌面上存儲、查找以及管理文件和服務,且在OS提供商的服務器上存儲應用、文件和服務。同一個WebOS可以在Windows、Mac和Linux系統(tǒng)上運行,具有極高的兼容性。
3.云計算的特點
云計算作為一種新型超大規(guī)模網(wǎng)絡計算與存儲模式,有著現(xiàn)有大型計算方式和網(wǎng)絡模式所沒有的4個特點:
一是計算資源的虛擬化與按需實時分配。云計算的數(shù)據(jù)中心一般都由成千上萬臺工業(yè)標準級服務器組成,用戶需要的計算資源均由云平臺統(tǒng)一管理、按需分配,如計算機、存儲系統(tǒng)、計算過程和應用軟件等資源的提供、變更請求、重新映像、工作負荷平衡、資源解除和資源監(jiān)測等。用戶并不知曉他所使用的計算機,只需按使用付費。
二是服務面向的廣泛性。云計算事實上是一種通過Internet可以同時提供給上百萬名不同用戶的IT服務。
三是服務的安全性?!霸啤钡奶峁┥淌且活悓嵙姶蟮膶I(yè)機構,如世界最專業(yè)的信息管理團隊,最先進的數(shù)據(jù)中心,具有最嚴格的權限管理策略。
四是用戶端設備成本低廉。大量的計算與存儲工作被放到網(wǎng)絡上,用戶端只需使用具有WebOS上網(wǎng)功能的簡單設備,如瀏覽器、智能手機等,這些終端設備功耗小、成本低、使用簡單、維護方便。
云計算作為一種新型網(wǎng)絡IT服務,其核心服務有基礎設施服務、軟件服務、平臺服務、基于互聯(lián)網(wǎng)的服務。
1.基礎設施服務(IAAS,Infrastructure As A Service)
通過互聯(lián)網(wǎng)在龐大的服務器集群中按用戶需求,以服務方式給用戶提供一個完整的IT基礎設施,如計算、存儲、網(wǎng)絡等,滿足用戶實際需要。用戶的運算、操作任務可以同時由多臺服務器協(xié)同工作,如期刊編輯、制作、存儲、獲取、下載,參考文獻查對、計算數(shù)據(jù)驗證、創(chuàng)新性評判、學術不端行為甄別、過刊上網(wǎng)入庫、審稿專家信息搜尋、論文數(shù)據(jù)庫建立與維護等。
2.軟件服務(SAAS,Software As A Sevrice)
將應用軟件統(tǒng)一部署在服務器或服務器集群上,通過互聯(lián)網(wǎng)給用戶提供所需應用軟件,如Windows操作系統(tǒng)、excel、方正排版系統(tǒng)、學術不端檢查系統(tǒng)、遠程投稿系統(tǒng)等。用戶也可以根據(jù)實際需要,通過定制或租用的方式使用基于Web的軟件,如Google文件系統(tǒng)。
3.平臺服務(PAAS,Platform As AService)
給用戶提供開發(fā)環(huán)境、服務器平臺、硬件資源等服務,用戶可以在服務提供商的基礎架構上開發(fā)程序,并通過互聯(lián)網(wǎng)傳給其他用戶,如遠程采編系統(tǒng)、約稿須知、編輯部管理、人事檔案等。
4.基于互聯(lián)網(wǎng)的服務
網(wǎng)絡服務提供商提供的API能幫助開發(fā)者開發(fā)基于互聯(lián)網(wǎng)的應用。如遠程上網(wǎng)、網(wǎng)上發(fā)行、遠程編輯、郵電服務和信用卡處理服務等。
云計算的應用就是要有效使用上述核心服務,滿足各類用戶的需求??萍计诳瘧迷朴嬎阋膊焕狻?梢哉f,云計算是一種非常適合科技期刊發(fā)展的新型平臺,完全能滿足科技期刊的網(wǎng)絡化需求。
1.期刊云的定義
期刊云可以定義為:由期刊聯(lián)盟或大型期刊社團等組織機構牽頭,租用基礎設施提供商和軟件服務商構建的云平臺,開發(fā)專供期刊社使用,實現(xiàn)期刊社管理,期刊組稿、審稿、編輯、出版、發(fā)行、存儲與交流全套流程的一類子云。
2.期刊云的建設與影響
云是一類非常復雜與龐大的網(wǎng)絡計算機系統(tǒng),技術水平高、資金投入大,絕不是一家或幾家期刊社、中小企業(yè)可以單獨建設的,事實上也沒有必要建設專用期刊云。組建期刊聯(lián)盟,或由大型期刊社團牽頭管理,租賃已有云平臺,統(tǒng)一由軟件開發(fā)商為云平臺提供與維護期刊所需的基于Web的應用程序,不失為期刊云建設的最佳形式。
首先,組建期刊聯(lián)盟或由大型期刊社團牽頭,才能保障云計算所需要的海量數(shù)據(jù)和超計算需求,充分發(fā)揮云計算的作用和價值,這也是云計算平臺提供商的利益所求。
其次,組建期刊聯(lián)盟或由大型期刊社團牽頭,有利于期刊云的管理與營運,如統(tǒng)一部署期刊云所需的應用程序和系統(tǒng):遠程投稿系統(tǒng)、遠程編輯系統(tǒng)、出版系統(tǒng)、學術不端檢查系統(tǒng)及各種通用或專用期刊編輯應用軟件,保障期刊云的長效發(fā)展。
對于某家期刊社來說,它僅需向聯(lián)盟或牽頭社團申請屬于自己的專用賬號,只需承擔加盟或管理費用、云平臺按需按時使用費用等,就可在期刊云完成本刊的所有任務。
顯然,按照上述方式建設期刊云,可以產(chǎn)生以下影響:
(1)實現(xiàn)期刊信息資源共享。我國期刊數(shù)量已經(jīng)居于世界期刊大國前列,但期刊管理渠道多,可以分為科協(xié)期刊、部委辦期刊、社會團體期刊、高校期刊等。通過云計算模式,可以在期刊社團、各大型數(shù)據(jù)庫之間共同構筑論文信息共享池,隨時獲取相互之間的資料,極大地滿足用戶對信息的需求。
(2)節(jié)省投資。在云模式下,各期刊社辦刊所需要的計算機硬件資源、軟件資源、系統(tǒng)升級維護可以共享,期刊完整的編輯出版和管理工作也全在期刊云上實現(xiàn),僅需配備簡單的可上網(wǎng)終端。因此,對于我國期刊界而言,整體辦刊成本低投資小。
(3)提高可靠性。現(xiàn)在期刊的所有數(shù)據(jù)都集中在本社團或者編輯部的服務器上,一旦服務器出現(xiàn)故障,編輯部就無法正常工作,甚至會導致數(shù)據(jù)丟失。在云計算模式中,“云”中有眾多服務器,且數(shù)據(jù)與信息均同時多備份,如果某臺服務器出現(xiàn)故障,由云平臺統(tǒng)一調(diào)度,可以在極短的時間內(nèi)啟動另一臺服務器工作,并完整地恢復數(shù)據(jù)和信息,使編輯部真正實現(xiàn)無間斷安全服務。另外,云擁有龐大的、嚴密的、最新的病毒和黑客防護系統(tǒng),保障云的安全,能確保系統(tǒng)和數(shù)據(jù)庫不被病毒感染、黑客侵襲,具有極高的可靠性。
(4)解決中小期刊社信息化人才短缺的問題。云擁有專業(yè)的管理人員維護系統(tǒng)軟硬件,對用戶端的設備要求很低,使用方便,可以有效降低期刊社對信息化人才的需求水平。
3.期刊云基本構成
不同期刊的出版宗旨不同,刊發(fā)論文所屬學科、專業(yè)不同,服務對象也不同,表現(xiàn)出不同的辦刊特色和期刊風格。但是,期刊社管理、期刊編輯流程、信息交流是相通的,參與期刊各個流程和信息交流的對象屬性具有確定性,這就為確定期刊云的基本構成提供了充分必要條件。
按照期刊云的定義,期刊云是通用云平臺的子系統(tǒng),屬于期刊社的公共資源,用于實現(xiàn)期刊社管理、期刊編輯出版發(fā)行的完整流程,以及信息交流與傳播。
期刊聯(lián)盟的成員——期刊社及其編輯、期刊服務對象——讀者、其他用戶——審稿專家或檢索機構等,都構成期刊云的用戶,在請求生效后按權限通過以太、因特等網(wǎng)絡使用云。云平臺的管理與維護系統(tǒng)根據(jù)用戶請求,按需提供相關資源,完成用戶任務。云平臺可被合理調(diào)度配置為無數(shù)小云,實現(xiàn)期刊云的各項功能。
4.期刊云的基本配置
根據(jù)期刊社發(fā)展需求和期刊編輯出版的完整流程,期刊云的基本配置可根據(jù)功能分為:云使用權限管理、期刊社管理、期刊編輯流程管理、信息交流與傳播、數(shù)據(jù)信息庫等。
(1)云使用權限管理是有效使用期刊云的基本保障,采用分級分類授權。加盟期刊社從期刊聯(lián)盟或牽頭期刊社團獲得在云中的辦刊權,為最高權限。獲得辦刊權,期刊社就可以使用期刊云完成期刊社管理、期刊編輯出版發(fā)行、信息交流與傳播的完整流程,在期刊云中創(chuàng)辦自己的刊物,并對期刊社成員、審稿專家、作者、讀者等用戶分類授權。同時,授權也是云平臺使用計費的唯一依據(jù)。
(2)期刊社管理是期刊云的一項重要功能,用于實現(xiàn)期刊社的無紙化現(xiàn)代管理。可分為內(nèi)務管理、相關費用、審稿專家遴選管理、收錄檢索管理等。
(3)期刊編輯流程管理是期刊出版的全過程管理,包括:稿源收集、文章編修、稿件三審、稿件退修、編輯審處、出版發(fā)行、資料存儲保管等,其涉及的對象有作者、編務、責任編輯、主編、外審專家等。需要配置征稿啟事、投稿須知、遠程投稿系統(tǒng)、專家評審系統(tǒng)、學術不端檢查系統(tǒng)、編輯軟件、出版系統(tǒng)、在線交流等。
(4)信息交流與傳播用于實現(xiàn)作者、編輯、專家、讀者等之間的在線交流、下載、打印、閱讀與復制保存等。
(5)數(shù)據(jù)信息庫是期刊云的重要組成部分,用于存儲期刊所需要的各種文件、資料、數(shù)據(jù)、結果和信息。根據(jù)科技期刊的內(nèi)容及工作流程,大致需要配置以下基本數(shù)據(jù)信息庫:廣告庫、原稿庫、待審庫、外審庫、審結庫、退修庫、退稿庫、評價庫、待編庫、編輯庫、出版庫、期刊庫、過刊庫、預印庫、OA(開放存?。?、專家?guī)?、作者信息庫等?/p>
云計算技術的研究和應用還處于初級階段,特別是在期刊應用方面。還存在許多需要解決的問題,如通用編輯應用軟件在云平臺中的開發(fā)與提供、各期刊社團的數(shù)據(jù)集成、云期刊的編輯出版標準、版權認定等。但云計算技術作為“既能提高資源利用率、節(jié)省總擁有成本,又能增強IT靈活性和效率”的新方法,將帶來期刊社團與編輯部門工作方式和商業(yè)模式的根本性改變。
(作者單位:湖南大學期刊社)