徐亞娟 陳建
摘? 要:本文基于英國(guó)國(guó)家檔案館官網(wǎng)開展的11個(gè)歷史檔案開發(fā)利用眾包項(xiàng)目進(jìn)行網(wǎng)絡(luò)調(diào)研和文獻(xiàn)分析,從眾包選題、眾包平臺(tái)、眾包任務(wù),以及眾包激勵(lì)與質(zhì)量控制等方面對(duì)英國(guó)國(guó)家檔案館歷史檔案開發(fā)利用的整個(gè)眾包生態(tài)的特點(diǎn)進(jìn)行探析,并結(jié)合我國(guó)檔案眾包項(xiàng)目存在的不足,從準(zhǔn)備設(shè)計(jì)、群體管理、質(zhì)量把控三個(gè)層面提出了立足豐富館藏、選擇合適平臺(tái)、加強(qiáng)教學(xué)訓(xùn)練、培養(yǎng)社區(qū)精神、即時(shí)更新指南、多種審核并用等切實(shí)可行建議,以期為我國(guó)檔案部門開展歷史檔案開發(fā)利用眾包提供借鑒。
關(guān)鍵詞:英國(guó)國(guó)家檔案館;檔案眾包;社會(huì)參與
Abstract:? Based on the network research and literature analysis of 11 crowdsourcing projects of development and utilization in the historical Archives carried out by the official website of the UK National Archives, this paper analyzes the characteristics of the whole crowdsourcing ecology of development and utilization in the historical Archives of the UK National Archives from the aspects of crowdsourcing topics, crowdsourcing platforms, crowdsourcing tasks, and crowdsourcing incentives and quality control. Combined with the shortcomings of China's Archives crowdsourcing projects, this paper puts forward practical suggestions from three aspects of preparation design, group management and quality control, such as standing on rich collections, selecting the appropriate platform, strengthening teaching and training, cultivating community spirit, updating the guideline immediately, combining multiple audits. It is expected to provide some references for the Archives department in China to carry out the crowdsourcing of development and utilization in historical Archives.
Keywords: UK National Archives; Archives crowdsourcing; Public engagement
2006年,杰夫·豪(Jeff·Howe)在美國(guó)《連線》(Wired)雜志首次提出“眾包”一詞,并將其界定為“一個(gè)公司或機(jī)構(gòu)將過去由員工執(zhí)行的工作任務(wù)以自由自愿的方式外包給非特定大眾網(wǎng)絡(luò)的做法”。[1]此后,基于互聯(lián)網(wǎng)的眾包模式便憑借其高效靈活、分布協(xié)同、公開號(hào)召、大眾生產(chǎn)等核心優(yōu)勢(shì)在國(guó)內(nèi)外眾多實(shí)踐領(lǐng)域迅速推廣開來,并引發(fā)學(xué)術(shù)領(lǐng)域的廣泛關(guān)注和探討。檔案領(lǐng)域也不例外,通過文獻(xiàn)梳理發(fā)現(xiàn),目前我國(guó)檔案學(xué)界對(duì)檔案眾包的研究主要集中在理論和實(shí)踐兩個(gè)層面。理論層面主要針對(duì)檔案眾包的管理環(huán)節(jié)和平臺(tái)進(jìn)行探索,涵蓋了“檔案眾包質(zhì)量控制與管理”[2-4]、“檔案眾包平臺(tái)與內(nèi)容構(gòu)建”[5-7]、“公眾參與意愿與動(dòng)因”[8-9]、“檔案編研眾包”[10]等主題;在實(shí)踐研究層面強(qiáng)調(diào)對(duì)具體檔案眾包項(xiàng)目的分析,主要涵蓋了“國(guó)外檔案眾包實(shí)踐與經(jīng)驗(yàn)”[11-13]、“國(guó)內(nèi)外檔案眾包單個(gè)案例介紹與比較”[14-15]、“我國(guó)檔案眾包實(shí)踐”[16]等主題。
整體來講,我國(guó)學(xué)界對(duì)檔案眾包的研究已經(jīng)取得了較為豐富的成果,對(duì)于國(guó)外檔案眾包項(xiàng)目的介紹和經(jīng)驗(yàn)總結(jié)已有較多,但不足在于:其一,學(xué)界關(guān)注的部分國(guó)外檔案眾包實(shí)踐項(xiàng)目的發(fā)起主體不是檔案機(jī)構(gòu),這對(duì)我國(guó)檔案機(jī)構(gòu)開展檔案眾包項(xiàng)目的啟示作用有限,如美國(guó)的“反奴隸制手稿”轉(zhuǎn)錄項(xiàng)目[17]的發(fā)起主體是波士頓公共圖書館;英國(guó)的“邊沁手稿轉(zhuǎn)錄”項(xiàng)目[18]的發(fā)起者是倫敦大學(xué)學(xué)院圖書館。其二,學(xué)界對(duì)國(guó)外檔案眾包實(shí)踐項(xiàng)目的研究大多停留在某個(gè)國(guó)家的單一項(xiàng)目上,缺乏對(duì)某個(gè)國(guó)家整體檔案眾包生態(tài)的系統(tǒng)研究,目前僅有一篇全面介紹澳大利亞國(guó)家檔案館檔案眾包項(xiàng)目[19]的文章。其三,學(xué)界在總結(jié)國(guó)外檔案眾包項(xiàng)目的經(jīng)驗(yàn)與啟示時(shí),與我國(guó)檔案眾包的實(shí)踐現(xiàn)狀和具體情況結(jié)合不深,部分經(jīng)驗(yàn)流于表面。
基于此,本文擬在既有研究的基礎(chǔ)上,以英國(guó)國(guó)家檔案館(The National Archives,UK,以下簡(jiǎn)稱NAUK)的歷史檔案開發(fā)利用眾包項(xiàng)目為調(diào)研對(duì)象,結(jié)合我國(guó)歷史檔案開發(fā)利用眾包開展現(xiàn)狀和具體實(shí)際,探討NAUK歷史檔案開發(fā)利用眾包項(xiàng)目對(duì)我國(guó)的借鑒與啟示意義。
1 NAUK歷史檔案開發(fā)利用眾包項(xiàng)目的背景、目標(biāo)與成效
NAUK組建于2003年4月,前身是1938年成立的英國(guó)公共檔案館,現(xiàn)由公共檔案館、皇家歷史手稿委員會(huì)、公共部門信息辦公室和皇家文書局共同構(gòu)成,主要保存自11世紀(jì)末以來英國(guó)政府產(chǎn)生的文件和公共記錄,館藏?cái)?shù)量超過1100萬份。NAUK在官網(wǎng)中設(shè)有“在線目錄”和“參與其中”兩個(gè)模塊,主要職責(zé)是為了提供檢索利用、開展包括檔案眾包在內(nèi)的各種公共參與項(xiàng)目。
NAUK開展檔案眾包項(xiàng)目旨在促進(jìn)館藏檔案的數(shù)字化和在線獲取利用,為用戶提供機(jī)會(huì)參與館藏資源優(yōu)化,增強(qiáng)公眾與傳統(tǒng)檔案館之間的互動(dòng)。近年來,NAUK通過自建平臺(tái)、第三方平臺(tái)、社交媒體平臺(tái)等開展了大量的與檔案眾包相關(guān)的社會(huì)公眾參與項(xiàng)目,本文介紹的歷史檔案開發(fā)利用眾包項(xiàng)目主要包括近期完成的、正在進(jìn)行和計(jì)劃進(jìn)行的項(xiàng)目。
1.1 基于自建平臺(tái)開展的歷史檔案開發(fā)利用眾包項(xiàng)目
1.1.1 “發(fā)現(xiàn)——我們的目錄”項(xiàng)目(Discovery-our catalogue)?!鞍l(fā)現(xiàn)——我們的目錄”項(xiàng)目是NAUK網(wǎng)站常項(xiàng)項(xiàng)目,NAUK在官網(wǎng)中的Discovery頁面引入標(biāo)簽工具,用戶可以在瀏覽檔案時(shí)標(biāo)記關(guān)鍵詞或短語,幫助其他用戶找到他們以前無法識(shí)別的檔案。由于許多目錄數(shù)據(jù)使用舊的語言來著錄檔案,該項(xiàng)目提供了一個(gè)機(jī)會(huì)來刷新和更新這些語言,使其與今天的用戶相關(guān)。目前,Discovery網(wǎng)頁擁有超過3200萬份國(guó)家檔案館保存的檔案著錄,以及全國(guó)2500多份數(shù)字檔案,超過900萬份檔案可供下載。截至2022年3月底,公眾累計(jì)已為82201份檔案添加了46882個(gè)標(biāo)記。
1.1.2 “C115-時(shí)間表”項(xiàng)目(C115–Schedule Project)。C115系列檔案是托馬斯·伯德在1816年編制的一份公爵夫人(弗朗西斯·斯庫達(dá)摩爾)家庭文件的清單,內(nèi)容包括斯庫達(dá)摩爾家族在英格蘭各郡的地產(chǎn)轉(zhuǎn)讓或產(chǎn)權(quán)契約,斯庫達(dá)摩爾家族自15世紀(jì)以來的通信、遺囑、債券、家庭協(xié)議等,該系列中一份1085年的契約是NAUK持有的最古老的檔案之一。
為了使時(shí)間表中包含的信息能夠被轉(zhuǎn)錄成詳細(xì)的描述,更好地挖掘利用這份珍貴檔案、改善研究人員的訪問,NAUK已經(jīng)在官網(wǎng)中“志愿服務(wù)”模塊上線了“C115-時(shí)間表”項(xiàng)目的相關(guān)信息和聯(lián)系方式。目前該項(xiàng)目仍在籌備培訓(xùn)中,暫未托管相關(guān)平臺(tái)。
1.1.3 “貿(mào)易委員會(huì)設(shè)計(jì)登記冊(cè)”項(xiàng)目(Board of Trade Design Registers Project,1901-1932)。NAUK收集了豐富的1839年至1991年間注冊(cè)的版權(quán)保護(hù)的設(shè)計(jì),注冊(cè)外觀設(shè)計(jì)收藏包括代表作和登記冊(cè)兩部分:代表作是指被注冊(cè)的物品的樣品、照片或圖紙,登記冊(cè)是指關(guān)于注冊(cè)外觀設(shè)計(jì)的人或公司(稱為業(yè)主)的信息。但是NAUK的檢索目錄中沒有這一時(shí)期外觀設(shè)計(jì)的任何信息,公眾只能到NAUK現(xiàn)場(chǎng)查閱,為此NAUK開展了“貿(mào)易委員會(huì)設(shè)計(jì)登記冊(cè)”項(xiàng)目。
NAUK的登記冊(cè)和《插圖官方期刊》已被掃描并保存為PDF文件,PDF中的信息已經(jīng)用光學(xué)字符識(shí)別(OCR)軟件進(jìn)行了“閱讀”,但是有些部分OCR軟件沒有正確的讀取字符,電子表格中存在錯(cuò)誤,所以該項(xiàng)目的志愿者需要比較PDF和電子表格,以確定信息不匹配的地方,并將正確的信息輸入到注釋欄。目前該項(xiàng)目仍在籌備培訓(xùn)中,暫未托管相關(guān)平臺(tái)。
1.1.4 “第一次世界大戰(zhàn)的護(hù)理檔案”項(xiàng)目(First World War Nursing Records)。NAUK收藏的WO399系列檔案——由近16000份第一次世界大戰(zhàn)期間在軍事護(hù)理單位服務(wù)的婦女的服務(wù)檔案組成,這些檔案中包含了這些婦女及其服務(wù)的豐富而詳細(xì)的歷史。為從檔案中獲取更多信息和更詳細(xì)的數(shù)據(jù),如軍銜、婚前姓名和確切的服役日期,同時(shí)更準(zhǔn)確地追蹤20世紀(jì)上半葉在世界各地醫(yī)院服務(wù)的婦女,NAUK決定開展“第一次世界大戰(zhàn)的護(hù)理檔案”項(xiàng)目,在該項(xiàng)目中志愿者們需要從Discovery下載相關(guān)檔案,使用MS Excel轉(zhuǎn)錄20世紀(jì)的手寫體。
1.2 基于第三方專門平臺(tái)開展的歷史檔案開發(fā)利用眾包項(xiàng)目。專門平臺(tái)是指具有成熟的眾包經(jīng)驗(yàn)、完備的眾包制度和工具、可直接利用的龐大志愿者資源的專業(yè)眾包平臺(tái),NAUK托管檔案眾包項(xiàng)目的專門平臺(tái)是FromThePage網(wǎng)站和Zooniverse網(wǎng)站。FromThePage是一款用于轉(zhuǎn)錄文件和與他人協(xié)作轉(zhuǎn)錄的軟件,被稱為“地球上最好的眾包手稿轉(zhuǎn)錄軟件”,擁有OCR校正、自動(dòng)標(biāo)記、版本控制、多格式導(dǎo)入和輸出、多語言翻譯等強(qiáng)大功能。
Zooniverse是世界領(lǐng)先的在線眾包研究平臺(tái),該平臺(tái)現(xiàn)在擁有90多個(gè)正在進(jìn)行的項(xiàng)目、來自全球234個(gè)國(guó)家超過246萬注冊(cè)志愿者,該平臺(tái)不僅可以轉(zhuǎn)錄,還擁有分類、收集數(shù)據(jù)等多項(xiàng)功能,任何人都可以在Zooniverse平臺(tái)上免費(fèi)構(gòu)建眾包項(xiàng)目。
1.2.1 以FromThePage網(wǎng)站為依托。(1)“版權(quán)登記表:繪畫和素描”項(xiàng)目(Copyright entry forms: Paintings and drawings)。為統(tǒng)計(jì)1862年至1912年交付The Stationers' Company(書商公會(huì))已獲得版權(quán)保護(hù)的繪畫和素描的基本信息,幫助公眾更好通過線上檢索作品的名字、描述、作者等關(guān)鍵詞快速找到作品的照片,NAUK借助FromThePage轉(zhuǎn)錄平臺(tái)開展了“版權(quán)登記表:繪畫和素描”項(xiàng)目。該項(xiàng)目的主要轉(zhuǎn)錄內(nèi)容為登記表和樣本中對(duì)繪畫或圖畫的描述、版權(quán)所有者的姓名和地址、作品作者的姓名和地址、登記的日期等,截至2022年4月,NAUK在該平臺(tái)上發(fā)布了7個(gè)合集,共5232頁,共有124個(gè)志愿者參與,完成轉(zhuǎn)錄5171頁。
(2)“英國(guó)陸軍:著錄和繼承書”項(xiàng)目(British Army: Description and Succession Books)。英國(guó)陸軍起源于1642年的英國(guó)內(nèi)戰(zhàn),組建于1707年,是現(xiàn)代英國(guó)軍隊(duì)前身的重要組成部分,在18世紀(jì)至19世紀(jì),英國(guó)陸軍在各種殖民化行動(dòng)中扮演了主要角色,該時(shí)期形成的英國(guó)陸軍士兵、軍官的詳細(xì)資料是珍貴的研究史料。
為便于公眾和研究人員更好挖掘利用這一時(shí)期的英國(guó)陸軍士兵和軍官資料,NAUK借助FromThePage轉(zhuǎn)錄平臺(tái)開展了“英國(guó)陸軍:著錄和繼承書”項(xiàng)目,該項(xiàng)目包括3個(gè)子項(xiàng)目,分別是針對(duì)團(tuán)級(jí)士兵、軍官和軍士的繼承書。NAUK在該平臺(tái)上發(fā)布的數(shù)字化微縮膠卷提供了英國(guó)陸軍士兵和軍官包括入伍、任命(晉升)和退伍或死亡的詳細(xì)資料。志愿者需要轉(zhuǎn)錄繼承書中的入職日期(證明)、晉升日期等額外信息。截至2022年4月,團(tuán)級(jí)士兵的繼承書包括11個(gè)合集,共1571頁。共有62個(gè)志愿者參與,完成轉(zhuǎn)錄629頁;軍官的繼承書包括3個(gè)合集,共699頁,共有45個(gè)志愿者參與,完成轉(zhuǎn)錄314頁;軍士的繼承書包括8個(gè)合集,共1335頁,47個(gè)志愿者參與,完成轉(zhuǎn)錄157頁。
(3)“索引轉(zhuǎn)錄”項(xiàng)目(Index transcription project)。NAUK收藏了大量未公布的紙質(zhì)版檔案檢索工具和索引,這些資料包括印刷品和手稿,只能在倫敦邱園的現(xiàn)場(chǎng)獲得。為方便公眾利用、提高這些檔案檢索工具和索引的可用性,NAUK借助FromThePage轉(zhuǎn)錄平臺(tái)開展了“索引轉(zhuǎn)錄”項(xiàng)目,志愿者需要將這些資料數(shù)字化,轉(zhuǎn)錄成可重復(fù)使用的格式,以便添加到NAUK官網(wǎng)的在線目錄——discovery中。截至2022年4月,NAUK在該平臺(tái)發(fā)布了12個(gè)合集,共327頁,共有19個(gè)志愿者參與,完成轉(zhuǎn)錄322頁。
(4)“張伯倫勛爵:雜項(xiàng)檔案”項(xiàng)目(Lord Chamberlain: Miscellaneous Records)。張伯倫勛爵是英國(guó)歷史上著名的政治家,曾任英國(guó)首相,是英國(guó)歷史上舉足輕重的人物。LC5系列檔案包含了1516年—1920年期間與皇家家庭有關(guān)的不同材料,許多材料都是張伯倫勛爵發(fā)出的關(guān)于任命或付款的授權(quán)書原件或復(fù)印件,或者是授權(quán)書的記錄簿。在其余的雜項(xiàng)中,有家庭條例、先例書、各種命令以及與張伯倫勛爵對(duì)劇院的管轄權(quán)有關(guān)的記錄。為豐富張伯倫勛爵人物檔案的數(shù)字館藏,NAUK借助FromThePage轉(zhuǎn)錄平臺(tái)開展了“張伯倫勛爵:雜項(xiàng)檔案”項(xiàng)目,截至2022年4月,在該平臺(tái)上發(fā)布了3個(gè)合集,共152頁,共有16個(gè)志愿者參與,完成轉(zhuǎn)錄152頁。
(5)“外貿(mào)商船船長(zhǎng)和副船長(zhǎng)的合格證書登記冊(cè)”項(xiàng)目(Registers of Certificates of Service,Masters and Mates,F(xiàn)oreign Trade)。根據(jù)1845年的命令,貿(mào)易委員會(huì)授權(quán)對(duì)打算成為英國(guó)外輪船長(zhǎng)或大副的人進(jìn)行自愿能力考試,這一制度在1850年由《商船法》規(guī)定強(qiáng)制性執(zhí)行,這些合格登記冊(cè)由海員總登記處和檔案辦公室及其后續(xù)機(jī)構(gòu)保存,現(xiàn)由國(guó)家檔案館保存。NAUK借助FromThePage轉(zhuǎn)錄平臺(tái)開展了“外貿(mào)商船船長(zhǎng)和副船長(zhǎng)的合格證書登記冊(cè)”項(xiàng)目,目的是轉(zhuǎn)錄BT122卷冊(cè)中列出的1845年—1906年期間強(qiáng)制考試后頒發(fā)的證書和自愿制度下頒發(fā)的證書,這些卷冊(cè)提供了該人的姓名、出生地和出生日期、登記票號(hào)和被審查或服務(wù)的等級(jí),以及證書的日期和編號(hào)。截至2022年4月,在該平臺(tái)上發(fā)布了BT122卷冊(cè)中的3個(gè)合集,共850頁,共有13個(gè)志愿者參與,完成轉(zhuǎn)錄561頁。
1.2.2 以Zooniverse網(wǎng)站為依托。“戰(zhàn)地日記”項(xiàng)目(Operation War Diary)于2014年啟動(dòng),由“公民歷史學(xué)家”對(duì)第一次世界大戰(zhàn)中的英國(guó)陸軍西線戰(zhàn)地日記進(jìn)行標(biāo)記,標(biāo)記項(xiàng)目包括日期、地點(diǎn)、活動(dòng)類型和個(gè)人姓名。該項(xiàng)目是由NAUK和帝國(guó)戰(zhàn)爭(zhēng)博物館通過Zooniverse平臺(tái)合作開展的,旨在豐富NAUK對(duì)戰(zhàn)爭(zhēng)日記的目錄描述,為帝國(guó)戰(zhàn)爭(zhēng)博物館“第一次世界大戰(zhàn)的生活”項(xiàng)目提供有關(guān)指定個(gè)人經(jīng)歷的證據(jù),向?qū)W術(shù)界提供大量準(zhǔn)確數(shù)據(jù)。8年來,志愿者們轉(zhuǎn)錄并注釋了來自國(guó)家檔案館收集的英軍西線戰(zhàn)地日記的數(shù)字化圖像,總頁數(shù)超過一百萬頁,這個(gè)項(xiàng)目的第一階段已經(jīng)完成,轉(zhuǎn)錄平臺(tái)暫時(shí)關(guān)閉無任務(wù)。
1.3 基于社交媒體平臺(tái)開展的歷史檔案開發(fā)利用眾包項(xiàng)目。社交媒體(Social Media)指互聯(lián)網(wǎng)上基于用戶關(guān)系的內(nèi)容生產(chǎn)與交換平臺(tái),用于公眾彼此間的信息分享和交流。NAUK目前用于托管檔案眾包項(xiàng)目的社交媒體平臺(tái)是照片共享網(wǎng)站Flickr,該平臺(tái)主要功能包括圖片服務(wù)、聯(lián)系人服務(wù)、組群服務(wù),其重要特點(diǎn)就是基于社會(huì)網(wǎng)絡(luò)的人際關(guān)系拓展與內(nèi)容組織。
NAUK依托Flickr開展檔案眾包項(xiàng)目的主要內(nèi)容為給每一張檔案圖片加入標(biāo)題(Title)、著錄(Description)和標(biāo)簽(Tag),代表性項(xiàng)目為“鏡頭下的世界”項(xiàng)目(World through a lens),其開展目標(biāo)為維護(hù)公共歷史檔案的完整性,通過鼓勵(lì)公眾為NAUK館藏檔案貼上標(biāo)簽并提出意見和建議來改進(jìn)檔案目錄描述和地理參考,該項(xiàng)目涉及四個(gè)專題,分別是“鏡頭下的非洲”“鏡頭下的美洲”“鏡頭下的亞洲”“鏡頭下的大洋洲”,這些照片取自外交和聯(lián)邦事務(wù)部的攝影集(CO1069),時(shí)間跨度超過100年。
目前,NAUK已將完整的CO1069系列攝影集放在了Flickr平臺(tái)上,公眾可以通過Flickr平臺(tái)添加注釋和標(biāo)簽。截至2022年4月,公眾已經(jīng)在該系列攝影集里添加了7400多個(gè)描述標(biāo)簽,8000多個(gè)地理標(biāo)簽。其中完成描述的4558張照片可以通過NAUK官網(wǎng)的展覽頁面向公眾提供利用,同時(shí)也可以在官網(wǎng)的Discovery頁面供下載。
2 NAUK歷史檔案開發(fā)利用眾包項(xiàng)目的特點(diǎn)
2.1 眾包選題豐富多樣,館藏需求和社會(huì)需求相結(jié)合。為了保證檔案眾包項(xiàng)目具有持續(xù)的社會(huì)影響力,充分激發(fā)社會(huì)公眾的參與熱情,NAUK充分結(jié)合自身館藏實(shí)際和社會(huì)公眾的需求,形成了豐富多樣的眾包主題。
具體來說,第一,NAUK的檔案眾包項(xiàng)目選題涵蓋了戰(zhàn)爭(zhēng)、藝術(shù)、衛(wèi)生、軍隊(duì)、商業(yè)、世界地理等諸多方面,這些選題自古便與公眾生活密切相關(guān)且為人們所津津樂道,如“第一次世界大戰(zhàn)的護(hù)理檔案”項(xiàng)目中挖掘出的感人故事、“戰(zhàn)地日記”項(xiàng)目中軍人的生活狀態(tài)等。第二,NAUK所有的檔案眾包項(xiàng)目選題均是基于自身豐富的館藏資源,這樣不但可以完善NAUK官網(wǎng)的索引條目,也可以加快推動(dòng)歷史檔案館藏的數(shù)字化。
2.2 眾包平臺(tái)類型多樣,以專門平臺(tái)為主。為更好吸引到不同類型的志愿群體、提高歷史檔案開發(fā)利用眾包的質(zhì)量和效率,NAUK根據(jù)眾包內(nèi)容的不同選擇了類型多樣的眾包平臺(tái),由表1可知這些平臺(tái)以專門平臺(tái)為主。其特點(diǎn)主要體現(xiàn)在三個(gè)方面:
第一,對(duì)于眾包內(nèi)容側(cè)重于檔案整理環(huán)節(jié)的項(xiàng)目,NAUK傾向于托管于專業(yè)化的眾包平臺(tái)。例如被托管于FromThePage轉(zhuǎn)錄平臺(tái)的“版權(quán)登記表:繪畫和素描”“英國(guó)陸軍:著錄和繼承書”“張伯倫勛爵:雜項(xiàng)檔案”等項(xiàng)目,這些項(xiàng)目眾包內(nèi)容單一、數(shù)量龐大,尤其適合托管于志愿群體龐大、專業(yè)化程度高、轉(zhuǎn)錄工具多樣的專業(yè)眾包平臺(tái)。FromThePage支持自由文本和結(jié)構(gòu)化文本轉(zhuǎn)錄,并為個(gè)人、小型組織和大型機(jī)構(gòu)提供計(jì)劃;Zooniverse支持圖像分類和結(jié)構(gòu)化轉(zhuǎn)錄,并且可以免費(fèi)使用。
第二,對(duì)于眾包內(nèi)容側(cè)重于檔案收集和傳播的項(xiàng)目,NAUK一般會(huì)在社交媒體平臺(tái)上開展。例如被托管于照片共享網(wǎng)站Flickr的“鏡頭下的世界”項(xiàng)目,該項(xiàng)目以照片檔案為主、趣味性強(qiáng)、貼近公眾的日常社交習(xí)慣,比較適合在用戶活躍度高、圖片服務(wù)功能強(qiáng)大的社交媒體開展。
第三,對(duì)于單個(gè)眾包任務(wù)簡(jiǎn)單易操作、尚未試點(diǎn)成功的檔案眾包項(xiàng)目,NAUK會(huì)在自家官網(wǎng)上開展。例如“發(fā)現(xiàn)——我們的目錄”項(xiàng)目,用戶僅需要在瀏覽記錄時(shí)標(biāo)記關(guān)鍵詞或短語即可完成一條任務(wù);“貿(mào)易委員會(huì)設(shè)計(jì)登記冊(cè)”“第一次世界大戰(zhàn)的護(hù)理檔案”等項(xiàng)目在未確定是否托管之前,會(huì)在NAUK官網(wǎng)上進(jìn)行小規(guī)模的試點(diǎn)。
2.3 眾包任務(wù)獨(dú)立明確,以件、頁為切分單位。為了讓志愿者能夠充分利用其碎片化時(shí)間從事檔案眾包、持續(xù)獲得滿足感和新鮮感,NAUK在歷史檔案開發(fā)利用眾包項(xiàng)目的任務(wù)設(shè)計(jì)上短小簡(jiǎn)單、單一且明確,大多都以件、頁為切分單位。例如,NAUK在自建平臺(tái)上開展的“發(fā)現(xiàn)——我們的目錄”檔案眾包項(xiàng)目中是以一件檔案為一個(gè)任務(wù)。用戶只要注冊(cè)登錄,通過搜索或?yàn)g覽查找要標(biāo)記的單件檔案,在檔案詳細(xì)信息頁面上點(diǎn)擊“添加標(biāo)記”選項(xiàng)輸入標(biāo)簽,然后點(diǎn)擊“提交”選項(xiàng),這樣一個(gè)任務(wù)就完成了,用時(shí)極短且步驟簡(jiǎn)單。
NAUK在FromThePage平臺(tái)上開展的檔案眾包項(xiàng)目的單個(gè)任務(wù)形式包括件、頁兩種形式,用戶可以選擇注冊(cè)或者以游客的身份開始一頁或者一件檔案任務(wù),通過搜索感興趣的項(xiàng)目名稱,便可到達(dá)項(xiàng)目主頁,點(diǎn)擊任何一頁或者一件已完成或者未完成的檔案都可以在原件的右側(cè)轉(zhuǎn)錄,無論轉(zhuǎn)錄多少都可以點(diǎn)擊保存,保存后算完成一個(gè)任務(wù),并且在下次登錄時(shí)仍然可以繼續(xù)上次的轉(zhuǎn)錄。
2.4 多重情感激勵(lì)并存,質(zhì)量控制手段多樣。情感激勵(lì)是指以滿足人的心理和社會(huì)需要為手段,使人對(duì)工作和集體產(chǎn)生肯定性的情感,從而強(qiáng)化人的工作動(dòng)機(jī),調(diào)動(dòng)人的積極性和創(chuàng)造性的一類方法。NAUK在開展檔案眾包項(xiàng)目時(shí)所使用的情感激勵(lì)方式主要體現(xiàn)在三方面:
其一,志愿者與平臺(tái)之間的尊重性激勵(lì),主要體現(xiàn)在眾包平臺(tái)主動(dòng)了解志愿群體、主動(dòng)宣傳志愿群體的貢獻(xiàn)、鼓勵(lì)志愿群體貢獻(xiàn)智慧,從而使志愿群體認(rèn)同自身工作的重要性。例如NAUK的自建平臺(tái)上有志愿者日志模塊、FromThePage轉(zhuǎn)錄平臺(tái)首頁開設(shè)有“用戶說了什么”模塊。
其二,志愿者之間的挑戰(zhàn)性激勵(lì),主要體現(xiàn)在每個(gè)項(xiàng)目首頁的貢獻(xiàn)排行榜,志愿者會(huì)為了保持自己的名次或超越排在自己前面的志愿者而不斷工作,排行榜的形式在FromThePage轉(zhuǎn)錄平臺(tái)、Zooniverse平臺(tái)和Flickr平臺(tái)都存在。
其三,社區(qū)內(nèi)部的互動(dòng)性激勵(lì),這體現(xiàn)在志愿者在空間社區(qū)內(nèi)部可以通過評(píng)論、求助等與其他志愿者建立聯(lián)系,這樣可以增強(qiáng)志愿者之間的黏性。例如,在FromThePage平臺(tái)上志愿者可以在他人轉(zhuǎn)錄過的頁面進(jìn)行評(píng)價(jià)、添加注釋和尋求幫助。
NAUK對(duì)檔案眾包質(zhì)量控制方式主要有三種:第一種是開放式社區(qū)修訂,這種方法是指用戶可以永久修改轉(zhuǎn)錄的文本,所有的更改記錄都會(huì)記錄下來,最后導(dǎo)出時(shí)由發(fā)包方判斷眾包成果的可用性,F(xiàn)romThePage平臺(tái)主要采用這種質(zhì)量控制方式。第二種是定期社區(qū)修訂,這種方式是指專家定期審查眾包結(jié)果,一旦專家團(tuán)認(rèn)定該成果可用,該任務(wù)就會(huì)被鎖定且無法更改,NAUK自建平臺(tái)主要采用這種質(zhì)量控制方式。第三種是開放式社區(qū)修訂與定期社區(qū)修訂相結(jié)合,Zooniverse平臺(tái)采用的是這種方式。
3 我國(guó)歷史檔案開發(fā)利用眾包項(xiàng)目的開展現(xiàn)狀與不足
相較于NAUK歷史檔案開發(fā)利用眾包的成熟實(shí)踐,我國(guó)開展歷史檔案開發(fā)利用眾包的時(shí)間較晚,目前整體處于試點(diǎn)探索階段,具有代表性的檔案眾包項(xiàng)目是2017年由上海圖書館在其歷史文獻(xiàn)眾包平臺(tái)啟動(dòng)的盛宣懷檔案抄錄項(xiàng)目,這是我國(guó)首個(gè)歷史檔案開發(fā)利用眾包項(xiàng)目。
截至2022年4月,該項(xiàng)目共在歷史文獻(xiàn)眾包平臺(tái)發(fā)布了33個(gè)合集,共2180頁,注冊(cè)人數(shù)近200人,已完成轉(zhuǎn)錄1346頁,完成率為61.74%。此外,我國(guó)也開展了一些有檔案眾包色彩的項(xiàng)目,包括2013年中國(guó)人民大學(xué)開展的“我的北京記憶”互動(dòng)網(wǎng)站項(xiàng)目、2016年上海圖書館開展的家譜知識(shí)服務(wù)平臺(tái)項(xiàng)目、2010年沈陽市檔案局開展的家庭檔案網(wǎng)站項(xiàng)目,這些項(xiàng)目多集中于開展檔案收集眾包的低層次任務(wù)上,且多數(shù)網(wǎng)站處于沉寂狀態(tài)。
經(jīng)文獻(xiàn)分析和網(wǎng)絡(luò)調(diào)研,我國(guó)歷史檔案開發(fā)利用眾包項(xiàng)目的不足之處主要體現(xiàn)在以下三方面。
3.1 準(zhǔn)備設(shè)計(jì)不足。其一,項(xiàng)目選題與館藏資源的聯(lián)系性不強(qiáng)。在已開展的檔案眾包項(xiàng)目中,僅有盛宣懷檔案抄錄項(xiàng)目和家譜知識(shí)服務(wù)平臺(tái)項(xiàng)目是基于自身特色檔案資源進(jìn)行選題。其二,缺乏專門的檔案眾包平臺(tái)。我國(guó)的檔案眾包項(xiàng)目多是依托某個(gè)機(jī)構(gòu)的網(wǎng)站,僅有盛宣懷檔案抄錄項(xiàng)目有自己獨(dú)立的眾包平臺(tái)。其三,單個(gè)任務(wù)量大,且認(rèn)領(lǐng)任務(wù)后無法更換其他志愿者。這種任務(wù)劃分方式對(duì)志愿者無疑增加了無形的壓力,雖然盛宣懷檔案抄錄項(xiàng)目的任務(wù)主頁有“任務(wù)難度”標(biāo)識(shí),但是志愿者未經(jīng)測(cè)試,無法確認(rèn)自己是否能夠勝任。
3.2 群體管理不夠。其一,眾包平臺(tái)上缺乏志愿者的社區(qū)建設(shè)模塊。上海圖書館歷史文獻(xiàn)眾包平臺(tái)僅有意見反饋一欄,說明志愿者內(nèi)部溝通交流渠道較少,這不但阻礙了社區(qū)精神的培育,且無法形成完成同一目標(biāo)的強(qiáng)大合力;其二,群體活力明顯不足。在盛宣懷檔案抄錄項(xiàng)目中,“文化遺產(chǎn)數(shù)字化”競(jìng)賽活動(dòng)前期發(fā)布的南大競(jìng)賽合集(1~11)的完成率均在90%,中后期發(fā)布的南大競(jìng)賽合集(12~24)的完成率不足50%,競(jìng)賽結(jié)束后發(fā)布的32個(gè)合集中,僅有3個(gè)合集全部完成。
3.3 質(zhì)量把控較弱。其一,項(xiàng)目主頁上缺少志愿者手冊(cè)和抄錄說明的規(guī)范性文件。缺乏志愿者手冊(cè)和抄錄說明這類必需的規(guī)范性文件,不僅不利于對(duì)志愿者群體的管理和約束,且會(huì)弱化志愿者對(duì)眾包項(xiàng)目的認(rèn)同感,對(duì)志愿者的動(dòng)力、眾包結(jié)果的有用性都有較大影響。其二,單一的專家定期審核制度。該制度審核周期較長(zhǎng)、效率較低,且專家組不能自己控制工作量,需要依據(jù)該時(shí)期內(nèi)志愿者的工作量開展工作,工作強(qiáng)度分異顯著。
4 NAUK歷史檔案開發(fā)利用眾包項(xiàng)目對(duì)我國(guó)的借鑒意義
4.1 準(zhǔn)備設(shè)計(jì)層面。對(duì)歷史檔案開發(fā)利用眾包項(xiàng)目進(jìn)行充分準(zhǔn)備和設(shè)計(jì)是其能夠順利開展的前提,這要求我國(guó)歷史檔案開發(fā)利用眾包的發(fā)包方應(yīng)至少從以下三個(gè)方面進(jìn)行努力。
第一,立足于本館豐富的館藏資源,結(jié)合多方的需求進(jìn)行選題,且選題必須豐富以契合不同志愿群體的興趣。例如,可以通過開展檔案機(jī)構(gòu)內(nèi)部征詢會(huì)確定館藏自身的實(shí)際需求,通過對(duì)學(xué)術(shù)研究群體進(jìn)行訪談確定學(xué)術(shù)研究的迫切需求,通過社會(huì)性的問卷調(diào)查確定社會(huì)公眾的需求等。第二,根據(jù)檔案眾包內(nèi)容的側(cè)重點(diǎn),選擇合適的眾包平臺(tái)。例如,照片、地圖等檔案材料的標(biāo)引、收集和展覽可以借鑒NAUK的“鏡頭下的世界”項(xiàng)目,托管于用戶基數(shù)大、活躍度高的社交媒體平臺(tái),這樣不僅能夠保證志愿群體的廣泛性,也能在社會(huì)中有較廣的傳播度和較大的社會(huì)影響力。第三,在單個(gè)任務(wù)設(shè)計(jì)中,任務(wù)要求要明確簡(jiǎn)潔,任務(wù)量要小且允許多個(gè)志愿者協(xié)作,這里可以借鑒NAUK托管于FromThePage平臺(tái)的項(xiàng)目。任務(wù)要求明確簡(jiǎn)潔可以減少志愿者的閱讀時(shí)間,提高眾包結(jié)果的可用性;任務(wù)量小能夠適應(yīng)當(dāng)今人們時(shí)間碎片化的特征;允許多個(gè)志愿者進(jìn)行協(xié)作且各不影響,能夠有效減少志愿者的心理壓力,提高其參與眾包的積極性,同時(shí)可以提高眾包的效率和眾包結(jié)果的可用性。
4.2 群體管理層面。志愿群體的持續(xù)有效參與是歷史檔案開發(fā)利用眾包成功的關(guān)鍵,因此,作為發(fā)包方的檔案機(jī)構(gòu)應(yīng)加強(qiáng)歷史檔案開發(fā)利用眾包參與群體的引導(dǎo)和管理。第一,加強(qiáng)教學(xué)和訓(xùn)練,撰寫明確的工作指南。教學(xué)和訓(xùn)練是管理眾包群體的重要環(huán)節(jié),檔案機(jī)構(gòu)可以通過PPT、視頻、文檔的形式展示完成任務(wù)的流程、具體工作中的問題指南等,這樣可以提高志愿者工作的效率,減少眾包管理者的工作壓力,這里可以借鑒NAUK在FromThePage和Zooniverse平臺(tái)項(xiàng)目首頁的教學(xué)視頻和工作指南。第二,構(gòu)建空間社區(qū),培養(yǎng)社區(qū)精神。這個(gè)空間社區(qū)可以是一個(gè)論壇,也可以是一個(gè)社區(qū)博客,允許志愿者發(fā)表評(píng)論、感想等,同時(shí)檔案機(jī)構(gòu)必須把握空間社區(qū)的主動(dòng)權(quán),通過更新工作進(jìn)度、上傳工作照片等樹立起志愿者的認(rèn)同感,增強(qiáng)對(duì)志愿群體的情感激勵(lì),這里可以參考NAUK的托管平臺(tái)FromThePage和Zooniverse的社區(qū)博客。
4.3 質(zhì)量把控層面。檔案眾包結(jié)果的質(zhì)量是衡量檔案眾包項(xiàng)目目標(biāo)是否實(shí)現(xiàn)的最終標(biāo)準(zhǔn)。為保證檔案眾包結(jié)果的可用性、實(shí)現(xiàn)項(xiàng)目最初的開展目標(biāo),我國(guó)檔案機(jī)構(gòu)可以從以下兩個(gè)方面對(duì)檔案眾包的質(zhì)量進(jìn)行控制和改善。第一,在項(xiàng)目進(jìn)行的過程中,即時(shí)更新操作指南。項(xiàng)目推進(jìn)過程中志愿者可能會(huì)因?yàn)槔斫獠坏轿?、能力有限等問題,進(jìn)行錯(cuò)誤的標(biāo)記或者抄寫,項(xiàng)目的管理者必須及時(shí)發(fā)現(xiàn)問題,并將該類問題的解決方法及時(shí)更新進(jìn)志愿者操作指南。這樣可以避免更多錯(cuò)誤的產(chǎn)生,提高任務(wù)完成準(zhǔn)確率,具體可以借鑒NAUK的自建網(wǎng)站中“發(fā)現(xiàn)——我們的目錄”項(xiàng)目的主頁。第二,在項(xiàng)目終期審核的過程中,多種審核方式并用。我國(guó)目前主要采取定期社區(qū)修訂,也就是專家定期審核眾包結(jié)果,這種審核方式過于單一、審核效率較低。為此可以借鑒NAUK采用開放式社區(qū)修訂和定期社區(qū)修訂相結(jié)合的方式,任務(wù)完成后先由社區(qū)內(nèi)部的志愿者對(duì)不同的版本進(jìn)行投票,對(duì)于得票最多的版本進(jìn)入專家審核階段,專家審核完畢后可以鎖定該任務(wù)以供出版和導(dǎo)出。這種方式不僅可以減少專家審核時(shí)所用時(shí)間,而且可以充分發(fā)揮大眾智慧的力量,提高最終眾包成果的可靠性和準(zhǔn)確性。
*本文系2018年度國(guó)家社科基金青年項(xiàng)目——基于過程管理的歷史檔案開發(fā)利用眾包模式研究(18CTQ039)資助成果。
參考文獻(xiàn):
[1]Howe·Jeff.The Rise of Crowdsouring[J].Wired,2006,14(06):176-183.
[2]鍋艷玲,陳紅.我國(guó)檔案眾包質(zhì)量控制探析[J].檔案學(xué)通訊,2019(03):43-48.
[3]裘麗.檔案眾包質(zhì)量管理及評(píng)價(jià)體系研究[J].檔案與建設(shè),2017(09):14-17.
[4]蘇君華,姜璐.檔案眾包服務(wù):模式、特征及質(zhì)量控制策略[J].浙江檔案,2020(07):28-31.
[5]聶勇浩,董子晗.檔案信息資源建設(shè)中眾包的實(shí)施框架與路徑[J].檔案學(xué)通訊,2019(04):63-69.
[6]葛悅,邵華.新修訂《檔案法》視角下中國(guó)特色檔案眾包建設(shè)研究[J].浙江檔案,2022(02):49-51+48.
[7]趙宇.檔案眾包平臺(tái)的構(gòu)建及運(yùn)行機(jī)制研究[J].浙江檔案,2016(04):23-25.
[8]張軒慧,趙宇翔,宋小康.數(shù)字人文類公眾科學(xué)項(xiàng)目持續(xù)發(fā)展階段的公眾參與動(dòng)因探索——基于盛宣懷檔案抄錄案例的扎根分析[J].圖書情報(bào)知識(shí),2018(03):4+16-25+77.
[9]譚宇彤.數(shù)字人文視域下檔案眾包項(xiàng)目公眾參與意愿影響因素研究[D].長(zhǎng)春:吉林大學(xué),2021.
[10]劉芮,張麗華.基于眾包模式的檔案編研工作構(gòu)建分析[J].北京檔案,2017(12):27-29.
[11]閆靜.檔案事業(yè)公眾參與特點(diǎn)及新趨勢(shì)探析——基于英國(guó)“檔案志愿者”和美國(guó)“公民檔案工作者”的思考[J].檔案學(xué)研究,2014(03):81-84.
[12]陳建.澳大利亞國(guó)家檔案館檔案眾包項(xiàng)目實(shí)踐探析[J].檔案學(xué)通訊,2019(06):72-78.
[13]顧麗婭.國(guó)外檔案眾包實(shí)踐及啟示[J].浙江檔案,2015(07):13-15.
[14][17]李可兒,陳建.基于眾包模式的美國(guó)反奴隸制手稿轉(zhuǎn)錄項(xiàng)目探析及其啟示[J].檔案管理,2021(05):117-119.
[15][18]蔡棟梁.中外檔案資源數(shù)字眾包項(xiàng)目比較研究——以盛宣懷檔案抄錄項(xiàng)目和邊沁手稿轉(zhuǎn)錄項(xiàng)目為考察對(duì)象[J].浙江檔案,2021(06):37-39.
[16][19]陳建.我國(guó)檔案眾包實(shí)踐特點(diǎn)?問題及完善路徑[J].浙江檔案,2021(12):29-31.