秦長江
進(jìn)入21世紀(jì)以來,傳統(tǒng)封閉式的檔案管理系統(tǒng)逐漸顯露出諸多弊端,開放源碼系統(tǒng)逐漸得到設(shè)計(jì)者的青睞,檔案管理系統(tǒng)的設(shè)計(jì)中也開始引入開源理念。從2002年第一個開源式檔案管理系統(tǒng)誕生以來,美國的開源式檔案管理系統(tǒng)已經(jīng)從以AT(Archivists?Toolkit)系統(tǒng)和Archon系統(tǒng)為代表的第一代進(jìn)入到了以ArchivesSpace系統(tǒng)為代表的下一代。作為一種新技術(shù)的初期應(yīng)用,開源式檔案管理系統(tǒng)在開發(fā)和管理中存在著諸多問題,本文通過回顧兩代管理系統(tǒng)的開發(fā)過程,思考開源式檔案管理系統(tǒng)的發(fā)展與未來。
1??第一代開源式檔案管理系統(tǒng)
第一代開源式檔案管理系統(tǒng)最具代表性的就是AT和?Archon系統(tǒng),兩個項(xiàng)目源于同樣一種需要,即找到一種工具用來支持檔案管理和檔案數(shù)據(jù)能夠按照反映檔案實(shí)際的方式進(jìn)行自動化操作,并能夠按照行業(yè)標(biāo)準(zhǔn)輸出數(shù)據(jù)。這種需要首先在2002年得以滿足,當(dāng)時聯(lián)邦數(shù)字圖書館和加利福尼亞數(shù)字圖書館共同贊助的一系列檔案管理工作坊開始探討此項(xiàng)議題,并發(fā)表了《“檔案管理工作坊”白皮書》,白皮書設(shè)想通過開發(fā)一套開放源碼工具來整合檔案描述分類和元數(shù)據(jù)編碼功能,通過數(shù)字化目標(biāo)管理達(dá)到提升檔案管理效率的目的。
1.1??AT系統(tǒng)。2004年7月,紐約大學(xué)和加利福尼亞大學(xué)(圣迭戈校區(qū)),聯(lián)合其他五個學(xué)院,在梅隆基金的資助下開啟AT項(xiàng)目。AT項(xiàng)目成功地整合了之前分離式的數(shù)據(jù)存儲模式,取得了突破性的創(chuàng)新。AT系統(tǒng)通過把館藏層次的機(jī)讀編目記錄上傳到資源庫的母組織,實(shí)現(xiàn)權(quán)限控制技術(shù)。訪問信息、描述數(shù)據(jù)、存儲單元信息和權(quán)限控制記錄等所有信息都保存在同一個搜索空間,同時還有利于生成報告和數(shù)據(jù)輸出標(biāo)準(zhǔn)化。項(xiàng)目為檔案和圖書館的元數(shù)據(jù)提供執(zhí)行標(biāo)準(zhǔn),包括檔案內(nèi)容描述標(biāo)準(zhǔn)(DACS)、文獻(xiàn)編碼標(biāo)準(zhǔn)(EAD)、元數(shù)據(jù)對象描述標(biāo)準(zhǔn)(MODS)、元數(shù)據(jù)編碼和傳輸標(biāo)準(zhǔn)(METS)等。該系統(tǒng)工作流程靈活,并能夠整合以前的各種檔案數(shù)據(jù),集成傳統(tǒng)科層化檔案管理過程中的登記入冊、清單管理、產(chǎn)品描述和權(quán)威控制等各項(xiàng)職能。
1.2??Archon系統(tǒng)。Archon系統(tǒng)是伊利諾大學(xué)香檳分校開發(fā)的,始于2004年秋,當(dāng)時作為一個試點(diǎn)項(xiàng)目用來研究通過開發(fā)軟件輔助編碼、線上進(jìn)入檔案描述和權(quán)威控制數(shù)據(jù)的合理性,使用“基于網(wǎng)絡(luò)的工具推動檔案描述標(biāo)準(zhǔn)付諸實(shí)踐和操作”,同時具有集成的面向員工的編寫界面和面向公眾的搜索與獲取界面。
與AT項(xiàng)目一樣,Archon項(xiàng)目同樣針對系統(tǒng)的可持續(xù)性問題而開發(fā),項(xiàng)目希望吸納更多外部機(jī)構(gòu)的支持,以便能夠更進(jìn)一步地開發(fā)和發(fā)展該項(xiàng)目。隨著越來越多的用戶因?yàn)閭€人偏好而使用Archon系統(tǒng),文檔編制開始成為基于用戶社群的活動。即便如此,香檳分校發(fā)現(xiàn)難以滿足用戶的期待,通過志愿者活動提供更多的文獻(xiàn)資料來提高檔案館成員參與的層次仍然是一項(xiàng)挑戰(zhàn)。同時,Archon系統(tǒng)還面臨著檔案資料的更新、對Archon編碼的維護(hù)保養(yǎng)、修復(fù)電腦病毒、滿足新功能要求、由于后端技術(shù)更新必須進(jìn)行的代碼重構(gòu)等諸多挑戰(zhàn)。
1.3??AT系統(tǒng)與Archon系統(tǒng)的比較。AT是用Java語言編寫的客戶密集型、基于桌面的應(yīng)用系統(tǒng),而Archon是基于瀏覽器的PHP網(wǎng)頁應(yīng)用系統(tǒng)。兩個應(yīng)用系統(tǒng)各自有其功能優(yōu)勢:AT系統(tǒng)集中于構(gòu)建與元數(shù)據(jù)的內(nèi)容和結(jié)構(gòu)標(biāo)準(zhǔn)緊密耦合的應(yīng)用軟件,致力于使檔案館的后臺業(yè)務(wù)工作流程效率更高,開發(fā)元數(shù)據(jù)標(biāo)準(zhǔn)是為了通過標(biāo)準(zhǔn)的逐漸普及達(dá)到互通性目的。實(shí)際上,AT系統(tǒng)提供了輸出EAD、HTML、PDF等版本的檔案檢索工具的途徑和方法,并沒有解決線上直接訪問問題。Archon系統(tǒng)基于網(wǎng)絡(luò)的用戶個人,界面相對簡潔,提供聯(lián)機(jī)搜索、訪問機(jī)制,能夠覆蓋檔案描述編碼和數(shù)據(jù)搜集等功能,較好地適應(yīng)了小型機(jī)構(gòu)對后續(xù)應(yīng)用程序必須按比例遞減的要求,不僅能被大型的研究和學(xué)術(shù)性檔案館所采用,還可以獲得單一用戶或者小用戶的支持。二者同樣都面對可擴(kuò)展性的問題,實(shí)現(xiàn)更大數(shù)據(jù)收集能力問題或者大量的描述性數(shù)據(jù)在配置方面的效能問題。
2??第二代開源式檔案管理系統(tǒng)
第二代開源式檔案管理系統(tǒng)的典型代表是ArchivesSpace系統(tǒng),項(xiàng)目開始于2009年9月,由紐約大學(xué)圖書館等五家圖書館合作開發(fā),并得到梅隆基金會資助。項(xiàng)目的推出是為了整合與集成AT和Archon系統(tǒng)的功能,以解決AT和Archon?的技術(shù)局限性和市場推廣的可持續(xù)性問題。
2.1??ArchivesSpace系統(tǒng):功能、使命與技術(shù)
2.1.1??功能界定。2010年6月項(xiàng)目組舉行了一次技術(shù)規(guī)劃會議,會議決定要將兩個系統(tǒng)的功能整合進(jìn)一個新的系統(tǒng),同時將通過社區(qū)反饋過程中整理的新的管理需求整合進(jìn)來,解決系統(tǒng)的可持續(xù)性問題。系統(tǒng)的功能需求確定以后,需要挑選外部供應(yīng)商完成軟件開發(fā)任務(wù),并挑選項(xiàng)目的組織中心。來自紐約大學(xué)、伊利諾州立大學(xué)香檳分校、加州大學(xué)圣迭戈分校的代表組成指導(dǎo)小組,負(fù)責(zé)制定政策層面的建議,并將建議轉(zhuǎn)達(dá)給組織中心。2011年9月,項(xiàng)目組選擇了HM作為項(xiàng)目開發(fā)伙伴,HM?是一家信息技術(shù)咨詢公司,對于數(shù)字圖書館和檔案管理系統(tǒng)的開發(fā)研究具有深厚的基礎(chǔ)和豐富的經(jīng)驗(yàn)。在挑選軟件開發(fā)商的同時,技術(shù)團(tuán)隊(duì)完成了軟件功能說明的評估并初步設(shè)計(jì)了數(shù)據(jù)模型。
2.1.2??項(xiàng)目使命。2012年7月,HM開始開發(fā)軟件,項(xiàng)目開始集中將ArchivesSpace作為一種開源軟件加以開發(fā)。學(xué)習(xí)AT系統(tǒng),為檔案管理提供一套完整的、端對端的后臺應(yīng)用系統(tǒng),支持檔案的核心業(yè)務(wù)以及特別收藏圖書館,比如登記入冊、館藏出售、圖書安排和描述、倉儲管理、名稱和權(quán)限控制,以及數(shù)字資料的元數(shù)據(jù)管理等業(yè)務(wù)。學(xué)習(xí)Archon項(xiàng)目,通過一個可配置的接口為檔案描述和數(shù)字資料提供強(qiáng)有力的訪問機(jī)制和更高級的可擴(kuò)展性更強(qiáng)的集成機(jī)制。
2.1.3??技術(shù)結(jié)構(gòu)。軟件作為解耦后端和前端應(yīng)用程序而設(shè)計(jì),通過表述性狀態(tài)傳輸程序界面進(jìn)行溝通。JRuby用Sinatra框架編寫的后端應(yīng)用程序,利用Apache?Derby?或MySQL等關(guān)系數(shù)據(jù)庫提高數(shù)據(jù)的持續(xù)性,用Apache?Solr搜索服務(wù)器作為搜索和索引程序。兩個前端應(yīng)用程序(員工面對的后臺應(yīng)用程序和公眾面對的訪問界面)是利用Ruby?on?Rails編寫的JRuby軟件,利用Twitter引導(dǎo)框架提供一致的用戶界面元素。
2.2??可持續(xù)性的構(gòu)建:治理體系。治理體系分為三塊:組織中心、會員組成和治理結(jié)構(gòu)。2012年3月,紐約大學(xué)宣布LYRASIS被選為ArchivesSpace的組織中心后,軟件開發(fā)、運(yùn)營支持和管理用戶群參與的責(zé)任從ArchivesSpace團(tuán)隊(duì)轉(zhuǎn)移到LYRASIS。項(xiàng)目將會員分為五個等級:微小型、小型、中型、大型、特大型,會員費(fèi)用按照規(guī)模比例征收。
ArchivesSpace由其成員進(jìn)行治理,治理結(jié)構(gòu)由理事會、用戶咨詢委員會和技術(shù)咨詢委員會組成。(1)理事會:通過對軟件開發(fā)、技術(shù)設(shè)施和用戶支持路線圖的評估和優(yōu)化向LYRASIS提出關(guān)于可持續(xù)發(fā)展和對ArchivesSpace的支持建議。(2)用戶咨詢委員會:識別、接收、討論并投票決定關(guān)于改進(jìn)軟件的觀點(diǎn);代表檔案系統(tǒng)用戶和其他相關(guān)的專業(yè)團(tuán)體,向ArchivesSpace項(xiàng)目經(jīng)理和其他治理團(tuán)體提出關(guān)于服務(wù)設(shè)計(jì)和服務(wù)提供的建議。(3)技術(shù)咨詢委員會:評估由用戶咨詢委員會確定的功能改進(jìn)和優(yōu)化方案,并向ArchivesSpace的項(xiàng)目經(jīng)理和開發(fā)人員提供全方位的技術(shù)指導(dǎo)?;谟脩羯缛禾崦陀脩糌暙I(xiàn)代碼的質(zhì)量來確定代碼提交者和代碼發(fā)布人。制定指導(dǎo)方針,用于檢查和測試所有外部代碼貢獻(xiàn),評估外部代碼對代碼庫的貢獻(xiàn)。
3??關(guān)于第二代開源式檔案管理系統(tǒng)的思考
3.1??面臨的挑戰(zhàn)。成功的開源性項(xiàng)目一般都要依賴用戶和開發(fā)者之間構(gòu)成的協(xié)作性志愿群體,然而ArchivesSpace項(xiàng)目卻沒能成功地培育出足夠的志愿群體。目前很明顯存在兩方面的問題:第一,缺乏用戶基礎(chǔ),帶來項(xiàng)目的不可持續(xù)性風(fēng)險;第二,項(xiàng)目的治理結(jié)構(gòu)需要更加開放化,盡可能地給用戶委派任務(wù),降低日常管理費(fèi)用,使項(xiàng)目在本質(zhì)上真正具有協(xié)作性和基于用戶社群的開源性特征。
3.2??發(fā)展建議
3.2.1??改變軟件開發(fā)的理念。改變以往基于設(shè)計(jì)師的立場,采用基于為用戶提供服務(wù)支持的立場。通過組織區(qū)域用戶團(tuán)體會議,開展行業(yè)論壇會議,促進(jìn)開發(fā)團(tuán)隊(duì)之間正式溝通、用戶之間的非正式溝通,在論壇上通過軟件的展示證明系統(tǒng)的可行性,為現(xiàn)有用戶提供機(jī)會與潛在用戶分享他們成功的應(yīng)用案例,同時也讓潛在的用戶能夠更加了解軟件及其功能。從一開始的應(yīng)用開發(fā)就優(yōu)先考慮易用性;在軟件開發(fā)中評估插件程序,將其作為評估用戶真正需求的一種途徑;提供完整產(chǎn)品包,包括發(fā)布和編輯、版本升級修正等。
3.2.2??創(chuàng)造更加開放和參與性的環(huán)境。提供大部分最新的代碼;指導(dǎo)如何處理代碼貢獻(xiàn),誰可以獲得提交者的地位;將一切可以分配給開發(fā)團(tuán)隊(duì)外的任務(wù)都分配出去,在用戶群中而不是在項(xiàng)目團(tuán)隊(duì)中培養(yǎng)文檔編制、軟件測試、規(guī)范說明等方面的專家;注意開發(fā)與第三方的伙伴關(guān)系,與第三方的關(guān)系有助于軟件項(xiàng)目傳遞整個產(chǎn)品的所有方面的信息,第三方的存在還能夠說明該產(chǎn)品的穩(wěn)定性,獲得了潛在使用者的較多支持。利用圓桌會議作為一種治理方式、決策方式和任務(wù)分配平臺,使項(xiàng)目中領(lǐng)薪人員數(shù)量達(dá)到最小值。
3.2.3??提供志愿者奉獻(xiàn)框架,減少日常管理費(fèi)用。在資金有限的條件下,可以尋找一個能夠?qū)⒃擁?xiàng)目作為其分支機(jī)構(gòu)的孵化機(jī)構(gòu),這個孵化機(jī)構(gòu)要充分尊重ArchivesSpace的價值理念,并有意愿通過資源共享的形式提供孵化,直到項(xiàng)目資金來源穩(wěn)定。如果不能為項(xiàng)目找到合適的孵化機(jī)構(gòu),可以給有奉獻(xiàn)精神的用戶分配任務(wù),建立讓志愿者奉獻(xiàn)的框架??梢詫⑴c實(shí)際編寫程序不相關(guān)的成本,包括測試、文檔、技術(shù)參數(shù)等,由來自用戶社群的志愿者提供。在這些任務(wù)上依靠檔案管理者社群的貢獻(xiàn)能夠減少日常開支,以確保該項(xiàng)目能夠具有可持續(xù)性和可行性。在管理開源性軟件項(xiàng)目中,要想能夠吸納和鼓勵志愿者們?yōu)轫?xiàng)目做貢獻(xiàn),首先是將每一位用戶都視作潛在的志愿者。團(tuán)隊(duì)要將用戶視為平等的水平,而不是以專家的腔調(diào)與用戶相處,讓每一位使用者認(rèn)識到他們與項(xiàng)目團(tuán)隊(duì)成員之間并沒有截然不同的區(qū)別。