程妍妍/南京政治學院上海校區(qū)軍事信息管理系
本文系國家社科基金重點資助項目“云計算環(huán)境下電子文件管理元數據智能化研究”(項目編號:13ATQ008)和“邁向知識時代的數字檔案館頂層設計與需求研究”(項目編號:16CTQ031)階段性成果之一。
國外網絡教育課程發(fā)展甚廣,英國3/4的大學開設了網絡教育課程[1],美國諸如哈佛大學、斯坦福大學、普林斯頓大學、紐約大學等多家世界知名大學都啟用了網絡教育課程。在此過程中形成的網絡教育課程文件能夠說明整個課程從開設到結束的所有流程,具有憑證價值,且其中的大量信息可以在下一次課程中被重復使用,因此網絡教育課程文件應被視為檔案,并應歸檔和長久保存。筆者以美國圣何塞州立大學的網絡教育課程文件歸檔項目為個案展開研究,為國內同類課程的開設和其文件長久保存提供參考。
2015年,美國圣何塞州立大學啟動網絡教育課程文件歸檔項目,項目主要目標是幫助后續(xù)課程的開發(fā)者能夠從歸檔的課程歷史信息中獲取成功經驗和教訓,從而開發(fā)新課程。項目主要研究對象是該大學網絡教育系列課程——“都鐸王朝”,該課程采用3D建模技術營造出虛擬的歷史情境,包括一系列運行在網絡虛擬環(huán)境中的虛擬事件、課程課件和負責布置學生作業(yè)的社交網絡站點,課程網址是www.secondlife.com。該課程自2013年開設,每年根據不同課程主題增加不同的模塊,目前包括文藝復興意大利(2013年)、大革命前法國(2014年)、美國內戰(zhàn)(2015年)等模塊。
課程要求學生在學期中選擇一個特定角色,再根據角色所處的社會地位和歷史階段選擇生活區(qū),參與所處歷史時代的相關課程。課程采用3D建模技術,為學生生成該時代的生活場景、著名歷史事件。學生的任務是生成角色動畫、參與歷史文化特點討論,并在深度研究其所處時代文化特征的基礎上形成課程總結課件、視頻等。網絡課程結束會形成類型多樣的文件材料:第一種是文檔類的材料,例如每一個學生提交的文本報告、視頻資料、老師課件等;第二種是3D建模技術生成的虛擬世界中的3D對象,例如建筑物對象、人物角色對象、課程設計的歷史事件對象等,這些信息非常重要,需要保存下來,以便下一次授課時參考。因此圣何塞州立大學急需解決該類課程文件的歸檔和長久保存問題。
從該網絡教育課程使用的社交網絡平臺來看,文件歸檔主要存在三個問題:第一,歸檔平臺分散和多樣化。每一個新學期開始,課程設計者會在社交網絡平臺Spruz上創(chuàng)建新的站點,為每個學生提供專門賬戶上傳課程經驗、課程作業(yè)和照片展示。而采用虛擬世界課程中提供的視頻記錄功能可以記錄下學生在虛擬世界課程中經歷的歷史事件和歷史活動,這些視頻會被存儲至另一個社交網絡平臺——YouTube的賬戶中。另外,YouTube也用于存儲一些特邀教授的課件。除Spruz和YouTube外,課程還采用了Pinterest平臺賬號來保管虛擬世界圖像,WordPress博客和Twitter賬戶用來記錄課程計劃和過往事件。課程相關文件分散在Spruz、YouTube、Pinterest和WordPress四個不同的社交網絡平臺中,而學生的隨機行為更是增加了檔案的分散性特征,例如,項目組發(fā)現部分學生在錄制完視頻后將視頻上傳到自己的YouTube賬戶中且將鏈接提供給了課程的YouTube賬號,而不是將完整的視頻內容上傳到課程專用賬號中,這就意味著部分學生形成的課程作業(yè)被分散保存在互聯(lián)網中,無法對其進行長久保存,因為鏈接可能出現斷鏈等問題,致使文件消失在互聯(lián)網中。第二,歸檔平臺賬號具有不穩(wěn)定性。課程使用的社交網絡平臺如Spruz,為課程授課老師提供一個月的免費賬號,這就意味著如果一個月內課程尚未結束,原有課程賬號若不續(xù)費,賬戶就會被關閉而無法使用。第三,社交網絡平臺歸檔經驗缺乏。目前大部分研究都集中在單一社交網絡平臺歸檔上[2],如針對Pinterest[3],Instagram[4]和Flickr[5]的歸檔研究等,因此項目組歸檔問題的難點之一在于如何將分散在不同社交網絡平臺上的課程文件整合一體化歸檔。
為解決上述難題,大學項目組決定建立統(tǒng)一的YouTube文件歸檔中心,用來記錄所有課程和學生作業(yè)視頻。為了便于控制歸檔,項目組要求學生將完整視頻內容提交給老師,而不允許采用發(fā)送鏈接的方式,這些視頻將會上傳至專門的YouTube文件檔案管理賬戶中進行統(tǒng)一管理;對于虛擬世界中形成的且可以以特定格式保存的文件,要求學生必須以統(tǒng)一規(guī)范的存儲格式保存,便于下次課程中重新輸入;對于無法導出和保存的對象,要求學生必須以視頻錄像的形式記錄下來,上傳到統(tǒng)一的YouTube賬號中進行管理;學生還必須將參加本次課程完整的信息,錄制成一系列視頻,例如將都鐸王朝、文藝復興時代的活動記錄全部錄制下來,便于下次課程設計時作參考。用這種方式進行歸檔控制后,所有課程文件都會集中存放在YouTube平臺中進行歸檔。目前,YouTube對于上傳視頻總體數量沒有限定,對單個視頻的尺寸限制大約是128GB,最長時限大約是11小時。這樣的限制對課程視頻文件歸檔來說可以滿足需求,也可以方便未來的檢索利用。但是,采用YouTube歸檔很可能并非長久之計,因為未來YouTube平臺一旦發(fā)生變化,存儲的課程文件很可能消失,因此項目組認為單獨依靠任何一種社交網絡平臺歸檔,無論是WordPress、Pinterest還是Spruz課程站點,并不利于課程文件的長期保存。因此,在每學期末,大學檔案管理中心都會將社交網絡平臺上的文件統(tǒng)一導出歸檔,主要工作如下:所有的視頻都以MP4格式輸出,并且和原始的捕獲格式、視頻腳本一起保存;社交平臺上的圖像文件進行查重、模糊圖像排除等操作后,輸出歸檔;社交平臺上的網頁和博客頁面以HTML格式輸出歸檔。
項目組從社交網絡平臺的文件檔案管理中心將歸檔文件統(tǒng)一導出后,需要進行長久保存。最初項目組準備利用大學自建的服務器存儲空間,采用頻繁備份的方法來長久保存歸檔文件,并確保文件安全。但是由于課程文件以視頻、3D對象為主,文件較大,自建服務器存儲空間有限,再加上課程文件數量急劇增長,傳統(tǒng)的存儲模式難以適應文件保管需求。而隨著云存儲技術的成熟,項目組正在評估采用三種云存儲產品來進行歸檔數據的長久保存,即亞馬遜公司提供的Amazon Glacier Services、谷歌的Google Nearline service和Preservica公司的云存儲服務。
Amazon Glacier Services是亞馬遜公司提供的云存儲服務,項目組對數據保存成本進行評估,發(fā)現其收費標準為每月每GB數據0.01美元,TB級的數據每月10美元左右。存儲的費用是確定的,而另一部分費用主要是來自歸檔數據的利用(上傳和下載)次數,次數越頻繁收費越高。這種收費模式對于網絡教育課程文件比較適用,因為課程教育文件一年集中上傳的次數并不多,一旦歸檔后利用頻次偏低,基本只會在下次課程制作之前參考利用。此外,按數據量收費也便于制定歸檔預算。該云存儲的數據上傳和傳輸采用SSL加密,自動加密歸檔數據,多個系統(tǒng)間冗余備份,以此確保數據的安全性。該云存儲不足之處在于:一是使用該云服務必須重新制定規(guī)范的歸檔標準和流程,如云存儲格式標準、數據歸檔結構、數據捕獲和上傳標準等都必須和云服務商協(xié)商后明確;二是必須培訓專門的云存儲使用歸檔人員,目前項目組正在考慮于學期末培訓學生志愿者學會使用云存儲界面,完成大量數據云歸檔工作;三是檔案檢索速度慢,檢索時間達小時級,這個問題導致項目組對選用該云存儲與否猶豫不決。
Google Cloud Storage Nearline是谷歌公司提供的云存儲服務,項目組對其進行了評估和測試,發(fā)現其收費標準為每月每GB數據0.01美元,成本低廉、性價比高。它與亞馬遜公司提供的云存儲相比,具有數據檢索效率高的優(yōu)勢,如后者需要消耗幾個小時的檢索,它可以在3秒內完成。盡管3秒的檢索時間并不算快,但是對于滿足課程文件利用需求而言已是綽綽有余了,因為里有課程文件并不強調其及時性。該云存儲提供異地冗余存儲服務,并且能和其他谷歌云服務完美集成。其缺點是在檔案專業(yè)性管理需求方面設計不夠,如缺乏檔案采集、遷移等業(yè)務流程設計。
Preservica公司提供的云存儲專門針對檔案領域,目前已有多個檔案機構應用,例如歐洲國家檔案館、18家美國州檔案館[6]和耶魯大學檔案館等。它的專業(yè)優(yōu)勢非常明顯,提供的云存儲能夠支持開放檔案信息系統(tǒng)(OAIS)工作流,提供檔案采集、過時載體和文件格式的遷移功能,提供友好的用戶界面用于數據管理,支持歸檔數據自動采集,并且可以為內部和外部用戶提供自行定制的歸檔界面;具備完善的歸檔流程,無需建立歸檔標準、規(guī)范、流程等,而且運行在亞馬遜云存儲服務平臺之上,自動繼承了亞馬遜云平臺的安全性和冗余備份功能。其缺點是收費昂貴,每100GB的數據存儲年收費為3950美元,250GB數據成本高達6950美元一年,并且對上傳數據量設定容量限制,為250GB。由于課程視頻本身的文件量較大,再加上需要保存視頻腳本文件,這樣三個學期形成的視頻文件總量能達到332GB,即使壓縮后存儲,也因超過容量限制而無法滿足歸檔需求。因此,項目組希望能和云服務商進行進一步的合作,解決容量限制等問題。
在各種社交網絡平臺流行的今天,依托社交網絡平臺方便快捷地開展網絡教學,已成為國外多所大學的首選。該項目研究表明:一是使用社交網絡平臺發(fā)布、管理、歸檔網絡教育資源是可行的;二是課程文件可以使用云資源長久保存,這是一種方便而且經濟的手段。我國開發(fā)網絡教育課程時,應當提前考慮這類課程文件的形成和歸檔問題,具體包括:一是明確歸檔范圍。明確課程文件應歸檔的內容,應包括課程課件、學生作業(yè)、相關課程計劃等文檔資料,還應包括課程中的關鍵對象,例如學生在3D建模環(huán)境中設定的歷史事件、體現時代特征的3D對象等,便于后續(xù)課程開展時參考或重構3 D虛擬環(huán)境。二是明確歸檔平臺。如果在課程開展中使用社交網絡平臺,例如利用博客、微博、微信等社交網絡平臺進行課程相關文件發(fā)布、作業(yè)提交等任務時,應當盡可能使用同一個平臺,便于統(tǒng)一集中歸檔,同時要選擇賬戶安全可靠、運行穩(wěn)定的平臺。三是規(guī)范歸檔流程和歸檔格式。歸檔流程可以預先在課程建設規(guī)范中加以明確,例如規(guī)定學生在提交相關文檔、視頻、3D建模對象時應提交完整內容而不是提交鏈接,避免造成無法歸檔的問題;應規(guī)范各種課程文件的歸檔格式,例如社交網絡平臺頁面歸檔格式、3D虛擬建模歸檔格式等。四是明確歸檔時間。對于部分時間周期較短的網絡教育課程,可以在本次課程結束后就立即歸檔;對于部分時間周期較長,例如跨學期的網絡教育課程,可以在學期結束后進行歸檔。這樣做的意義在于避免因歸檔周期過長,社交平臺出現斷鏈而導致檔案丟失。五是積極評估采用新興技術應用于歸檔數據量較大而利用頻次較低的課程文件歸檔工作,例如采用云存儲技術。六是明確課程檔案長久保存策略。在項目開始之初,大學對目前國際上網絡教育資源保存項目進行了充分調研,發(fā)現國際上對網絡教育資源的長久保存一般采用兩種策略。一是采用OAIS模型創(chuàng)建檔案信息包(AIP)[7]的方法進行長久保存,這時需要將網絡課程中需要歸檔的所有文件附加上相應的背景信息元數據,再運用一致的封裝標準打包,例如用METS、MPEG21 DIDI、FOXML和OAI-ORE等標準打包,形成一個整體的文件,再進行保存。項目組經過評估,認為這種方法雖然可行,但是需要專門的人員去編制復雜的檔案信息包,時間花費太多、所需成本太高。第二種方法是采用3D CAD模型長久保存方法保管網絡教育課程文件[8]。但項目組認為,如果采用這一方法則更為復雜,因為網絡教育課程文件中雖有一部分是3D建模技術形成的文件,但它們并不是保管的重點,重點應該是圍繞課程展開形成的文件資料,因此在以保管文件為中心的總體目標下,項目組制定了以保存文件材料為主的長久保存策略。
本文系國家社科基金重點資助項目“云計算環(huán)境下電子文件管理元數據智能化研究”(項目編號:13ATQ008)和“邁向知識時代的數字檔案館頂層設計與需求研究”(項目編號:16CTQ031)階段性成果之一。
注釋與參考文獻:
[1]Kirriemuir,J.A spring 2008 snapshot of UK higher and Further Education developments in Second Life.Eduserv Virtual World Watch[DB/OL].[2016-7-21].http://www.eduserv.ac.uk/~/media/foundation/sl/uksnapshot052008/final%20pdf.ashx.
[2]Theimer,K.What is the Meaning of Archives 2.0?[J].American Archivist(74):58-68.
[3]Zarro,M.and Hall.C.Pinterest: Social collecting for linking using sharing.Proceedings of the 12th ACM/IEEE-CS joint conference on Digital Libraries.ACM,2012.
[4]Jensen,B.Instagram as Cultural Heritage: User Participation, Historical Documentation, and Curating in Museums and Archives through Social Media[J].Digital Heritage International Congress,2015.
[5]Library of Congress.Prints and Photographs Division, et al.For the common good:The Library of Congress Flickr pilot project.Library of Congress,Prints and Photographs Division,2008.
[6]Preservica.About us[EB/OL].[2015-4-22].http://preservica.com/about-us/.
[7]Consultative Committee for Space Data Systems, Reference Model for an Open Archival Information System (OAIS), CCSDS 650.0-B-1,CCSDS Scretariat,Washington D.C.,2002.
[8]Smith,M.Curating architectural 3D CAD models[J].International Journal of Digital Curation(4):98-106.