田艷羅 陳建
摘 要:通過對荷蘭阿姆斯特丹檔案館“VeleHanden”(眾在參與)眾包案例的調(diào)研發(fā)現(xiàn),其在館藏選擇、用戶激勵、平臺設(shè)計和質(zhì)量控制方面有成熟完善的措施。我國檔案眾包實踐目前存在政策支持不明確、社會關(guān)注度不足、平臺管理不完善及檔案開放工作滯后等困境,可以充分借鑒荷蘭先進(jìn)經(jīng)驗,從制度規(guī)范、檔案開放、公眾參與、平臺建設(shè)、質(zhì)量控制等方面著手進(jìn)行改進(jìn),提高我國檔案眾包實踐質(zhì)量和水平。
關(guān)鍵詞:荷蘭;阿姆斯特丹;眾在參與;檔案眾包;檔案數(shù)字化;質(zhì)量控制;檔案開放
Abstract: The research on the case of 'VeleHanden' crowdsourcing in the Netherlands Amsterdam Archives showsthat it has mature and perfect measures in archival collection selection, user motivation, platform design and qualitycontrol. The current dilemmas of China's archival crowdsourcing practice include unclear policy support, insufficientsocial attention, imperfect platform management, and lagging archival openness. We can fully learn from theadvanced experience of the Netherlands and start to make improvement in terms of system regulation, archiveopening, public participation, platform construction and quality control to improve the quality and level of archivalcrowdsourcing practice in China.
Keywords: Netherlands; Amsterdam; Velehanden; Archival crowdsourcing; Archival digitization; Quality control;Archive opening
眾包即“一個公司或機(jī)構(gòu)把過去由員工執(zhí)行的工作任務(wù),以自由自愿的形式外包給非特定的大眾網(wǎng)絡(luò)的做法”[1],眾包模式在檔案領(lǐng)域的應(yīng)用也有著許多成功的例子,形成了良好的示范效應(yīng)。綜合國內(nèi)外學(xué)者的研究發(fā)現(xiàn),對國外檔案眾包實踐的關(guān)注更多集中在英語語言國家。荷蘭的檔案眾包項目“VeleHanden”雖然具備開始時間早、參與人數(shù)多、平臺設(shè)計完善等特點,但是因為項目網(wǎng)站和檔案文字更多使用的是荷蘭語,受到語言的限制并沒有引起更多學(xué)者的注意。目前國內(nèi)對于此項目的直接研究成果僅有一篇,即鄧成雯從檔案眾包的角度對VeleHanden的運行、組織、法律、激勵和質(zhì)量控制機(jī)制進(jìn)行了全面的介紹,也從規(guī)范、主體和客體3個層面提出了對我國開展檔案眾包的啟示,[2]但其研究僅局限于平臺本身,沒有參考足夠的外文文獻(xiàn),對平臺的前期設(shè)計關(guān)注較少,并未分析我國檔案眾包的開展困境,其啟示缺乏針對性。
本文對荷蘭VeleHanden眾包項目進(jìn)行研究,分別從檔案部門、眾包網(wǎng)站設(shè)計、眾包項目參與者等多個角度總結(jié)歸納出項目特點,尋找其項目開展及順利運行傳播的因素,在分析我國目前檔案眾包實踐及其阻礙因素的基礎(chǔ)上,根據(jù)項目研究及我國檔案眾包的現(xiàn)實情況提出更具針對性的啟示。
1 荷蘭“VeleHanden”項目的開展背景及內(nèi)容分析
1.1 項目開展背景。阿姆斯特丹市檔案館成立于1848年,館藏的各類檔案材料排架長度超過55公里。阿姆斯特丹市的檔案數(shù)字化工作開始時間早,數(shù)字化程度高。檔案館自20世紀(jì)90年代推出網(wǎng)絡(luò)查檔系統(tǒng),2005年為公眾提供按需掃描服務(wù),截止到2020年,已經(jīng)有3000萬次的掃描。從2023年4月起,檔案館開始提供下載服務(wù),利用者可以根據(jù)需求以多種格式下載檔案。
“VeleHanden”的概念由阿姆斯特丹市檔案館首次提出,期望能夠創(chuàng)建一個可持續(xù)的眾包平臺,檔案館對平臺的不同部分應(yīng)該以什么樣的方式開展工作提出構(gòu)想,由Picturae公司的軟件工程師去具體完成。在項目準(zhǔn)備期招募志愿者組建測試小組,提前參與檔案眾包的項目并提出反饋意見,[3]這也為之后吸引公眾參與,維持VeleHanden項目的持續(xù)良好運行奠定了基礎(chǔ)。
1.2 平臺簡介。VeleHanden眾包平臺歸Picturae公司所有,負(fù)責(zé)網(wǎng)站的創(chuàng)建、日常維護(hù)和進(jìn)一步開發(fā)以及參與者論壇的管理,并將檔案館提供的檔案材料進(jìn)行數(shù)字化后上傳網(wǎng)站供眾包參與者選擇和開展任務(wù)。除阿姆斯特丹市檔案館之外,VeleHanden眾包平臺也歡迎其他檔案機(jī)構(gòu)參與進(jìn)來,只需要支付一筆服務(wù)費[4]。檔案機(jī)構(gòu)是某個具體眾包項目的所有者,提供館藏物品負(fù)責(zé)具體項目的創(chuàng)建、管理和整體實施[5]。
VeleHanden的網(wǎng)站平臺頁面簡潔,內(nèi)容清晰明了,主要包括“首頁”“項目”“參與者”“新聞”“關(guān)于我們”“幫助”6個模塊。首頁展示了項目、新聞、參與者采訪的精選內(nèi)容。項目模塊統(tǒng)計了VeleHanden平臺自2011 年創(chuàng)建以來所有的眾包項目,其中已完成(結(jié)束)項目98個,用戶還可參與的活躍項目19個。每個眾包項目都有項目信息介紹、參與者可獲得的獎勵、詳細(xì)的輸入和操作說明以及可視化的項目進(jìn)度,并設(shè)置了交流論壇可供管理者與參與者和參與者之間的交流互動,方便公眾能夠更順暢地選擇和完成項目任務(wù)。新聞部分更新十分頻繁,是平臺發(fā)布的關(guān)于眾包項目的更新預(yù)告、平臺維護(hù)說明、重要節(jié)日祝福等新聞。截至2023年5月,VeleHanden已經(jīng)有22367人注冊參與眾包項目,累計完成了1300余萬份掃描件的眾包工作。[6]
1.3 眾包任務(wù)分析。在VeleHanden眾包平臺上參與者需要完成的主要任務(wù)包括編制索引、著錄照片和添加標(biāo)簽、校對人工智能的工作等。
為歷史檔案編制索引是平臺上絕大部分眾包項目的主要任務(wù),檔案館館藏的歷史檔案在經(jīng)過數(shù)字化掃描后上傳到平臺,參與者需對文件中的手寫文本進(jìn)行識別并按要求輸入,這就需要志愿者有一定的古文字水平和必要的外文能力。
為方便更多的初學(xué)者參與此類眾包項目,檔案館提供了詳細(xì)的輸入說明和部分古代手寫文字與現(xiàn)代字母的對比。2011 年VeleHanden平臺建立之初的首個眾包項目“民兵登記冊1814—1941”是按姓名、出生日期和出生地編制民兵登記冊索引,共吸引了1397名志愿者參與,項目歷時三年多完成并于2022年12月存檔。
照片檔案是歷史畫面的生動寫照,但是由于年代久遠(yuǎn),照片背后的故事和人物信息已經(jīng)隨時間消逝,為了使這些照片檔案被更方便地檢索到,需要眾包參與者對照片信息進(jìn)行著錄和添加標(biāo)記。例如“格羅寧根的形象:新聞攝影機(jī)構(gòu) D.van der Veen”項目,格羅寧根檔案館保留了新聞攝影機(jī)構(gòu)拍攝的格羅寧根市二十世紀(jì)六七十年代大小事件的底片,為了這些圖片能夠更好地被查找和使用,需要參與者對這些圖片進(jìn)行著錄,如果參與者曾居住在格羅寧根市,或者是格羅寧根足球俱樂部的體育迷,那么將會對著錄這些圖片有很大幫助,對照片中的信息描述得越具體越有利于對照片的檢索利用。
計算機(jī)通過深度學(xué)習(xí)能夠識別早年的手寫筆跡、可以對照片中的場景進(jìn)行識別和簡單分類,然而計算機(jī)的轉(zhuǎn)錄與識別并不是十分準(zhǔn)確,這就需要眾包參與者將原歷史檔案與計算機(jī)生成的文本進(jìn)行比對并更正錯誤,經(jīng)過糾正,計算機(jī)能夠重新獲得訓(xùn)練提升轉(zhuǎn)錄的準(zhǔn)確性。2022年的“布魯日奧爾德曼銀行檔案的證人證詞”是一個更正類型的眾包項目,參與者對計算機(jī)錯誤識別的文本進(jìn)行更正并做好標(biāo)記,能夠幫助計算機(jī)獲得廣泛的文本語料庫,為研究者提供十八世紀(jì)荷蘭南部日常生活的信息。“攝影記憶:訓(xùn)練計算機(jī)”項目首次訓(xùn)練人工智能應(yīng)用于識別照片中的場景,參與者從計算機(jī)提供的五個類別中選擇出最合適的一個,人工的參與可以訓(xùn)練計算機(jī)更精確地識別出照片的主要主題。
2 荷蘭“VeleHanden”眾包項目的特點
2.1 選擇合適的館藏檔案。所選擇用來參與眾包的檔案包括各種與公眾生活密切相關(guān)的信息登記冊,參與者有機(jī)會從中找到自己祖先的相關(guān)信息,激發(fā)了公眾的參與熱情。平臺上的眾包項目除了歷史、民政的類別,還涉及法律契約、證人證詞、地圖標(biāo)記等,能夠吸引到文史、政法、地理等多領(lǐng)域的愛好者參與進(jìn)來。
2.2 低門檻與便捷的進(jìn)入通道。VeleHanden項目是低門檻的,歡迎荷蘭內(nèi)外的所有人參與眾包。大部分的眾包任務(wù)簡單易做,公眾可以很容易地參與進(jìn)來。除電子郵箱地址必須是真實信息,參與者的姓名、性別和地區(qū)等內(nèi)容都可以虛構(gòu),充分尊重志愿者對個人隱私信息的公開權(quán)利。平臺在設(shè)計時遵循的三個原則是確??焖佟⒑唵魏捅M可能地自動化,在參與者輸入字段的過程中,掃描圖像會自動定位到相應(yīng)位置,方便用戶操作提高效率和體驗感。[7]
平臺使用OpenID技術(shù),用戶可以通過Google、Facebook、Twitter等世界通用的社交媒體賬號直接登錄平臺,這也方便了世界上其他地區(qū)的用戶參與眾包項目。每周三下午,志愿者還可以到阿姆斯特丹市檔案館大樓的信息中心,在線下與小組成員一起參與轉(zhuǎn)錄和輸入數(shù)據(jù)。[8]
2.3 穩(wěn)定的平臺功能與活躍的平臺氛圍。開發(fā)檔案眾包任務(wù)依托網(wǎng)絡(luò)平臺,因此平臺的穩(wěn)定性和安全性至關(guān)重要。VeleHanden網(wǎng)站的開發(fā)商Picturae公司是荷蘭專業(yè)的大規(guī)模文化遺產(chǎn)數(shù)字化服務(wù)機(jī)構(gòu),提供長期在線存儲數(shù)字化藏品的服務(wù),有成熟的軟件開發(fā)技術(shù)和平臺維護(hù)能力。為了在線用戶良好的參與體驗,平臺有明文規(guī)定的個人信息和隱私保護(hù)細(xì)則,使用先進(jìn)的技術(shù)維護(hù)用戶在操作時的流暢性。
交流論壇和平臺發(fā)布的新聞有效地維持了網(wǎng)站的活躍度。平臺設(shè)計者很早就意識到溝通是平臺成功的關(guān)鍵因素,在每個項目都設(shè)了留言和討論區(qū)域,參與者可以在討論區(qū)發(fā)布問題并分享自己的經(jīng)驗和發(fā)現(xiàn),還可以就其他用戶的問題給出自己的解答?;钴S的網(wǎng)站給用戶積極的反饋,使用戶有較高的參與感和獲得感,而不是像完成任務(wù)一樣孤零零地輸入數(shù)據(jù),能夠有效地增強用戶黏性。
2.4 全過程的質(zhì)量控制,保障眾包項目的質(zhì)量。阿姆斯特丹市檔案館很注重眾包項目的質(zhì)量,從前期設(shè)計、中期管理到后期審核做好了全過程的質(zhì)量控制。
前期合理設(shè)計眾包平臺。“在沒有公眾的反饋下開發(fā)他們將要使用的工具是錯誤做法”,在VeleHanden眾包平臺的設(shè)計過程中,阿姆斯特丹市檔案館就招募志愿者組成測試小組[9],充分考慮參與用戶的意見,開發(fā)更適合參與者操作的平臺。在注冊前,公眾可以通過輸入“索引示例”來判斷自己能否勝任這份工作,平臺也能篩選出更適合的參與者。
中期規(guī)范參與者的輸入操作。平臺上發(fā)布的每個具體的眾包項目都有詳細(xì)的具體操作說明,項目介紹能夠讓參與者快速了解項目從而選擇自己感興趣的部分,示例視頻和PDF輸入說明幫助參與者學(xué)習(xí)如何輸入數(shù)據(jù)。在用戶第一次操作時,在數(shù)據(jù)輸入框下還會有自動的步驟引導(dǎo)。網(wǎng)站的自動檢查程序能夠?qū)Ω袷藉e誤的輸入提出警告,參與者如果發(fā)現(xiàn)異常情況可以通過溝通按鈕直接向項目協(xié)調(diào)員發(fā)送郵件。[10]
后期的檢查審核。VeleHanden使用復(fù)式系統(tǒng),將同一份掃描文件派發(fā)給兩個不同的人獨立輸入數(shù)據(jù),完成后交由第三人進(jìn)行審查,如果檢查員不能確定結(jié)果的正誤,可以提交給項目負(fù)責(zé)人進(jìn)行處理。歷史檔案大部分為手寫文字并且年代久遠(yuǎn),檔案原件會出現(xiàn)手寫錯誤或模糊不清的情況,這給參與者的工作造成很大困擾,兩個參與者較多的輸入分歧也會影響檢查員的審查。為了維護(hù)檔案數(shù)據(jù)的真實性,學(xué)會與原始材料的錯誤與缺漏共處至關(guān)重要。民兵登記冊項目的搜索系統(tǒng)設(shè)計得十分巧妙,在克服原始數(shù)據(jù)本身存在的錯誤的情況下,能夠方便用戶很輕松地檢索到相應(yīng)的信息。[11 ]
3 我國檔案眾包實踐困境分析
為更好開發(fā)檔案資源,我國已經(jīng)進(jìn)行了一些具有檔案眾包色彩的實踐,經(jīng)過調(diào)研發(fā)現(xiàn),目前已開展的項目有“我的北京記憶”項目、盛宣懷檔案抄錄項目、籍合網(wǎng)古籍整理眾包平臺等。這些項目吸引到一定數(shù)量的眾包參與者,能夠有效地幫助保護(hù)城市記憶、提高檔案轉(zhuǎn)錄和古籍出版效率,為我國檔案收集眾包、轉(zhuǎn)錄眾包提供了優(yōu)秀范例。但是我國的檔案眾包實踐總體來說處于萌芽試點階段,開展數(shù)量稀少,公眾參與度低,社會影響較小,面臨著諸多困境。
3.1 制度環(huán)境方面:缺乏明確的政策指導(dǎo)。開展檔案眾包缺乏明確的政策支持。2020年新出臺的《中華人民共和國檔案法》第七條增加“國家鼓勵社會力量參與和支持檔案事業(yè)的發(fā)展”的表述,然而對于何種社會力量以什么樣的方式參與檔案事業(yè)并沒有具體的解釋。檔案眾包作為社會力量參與檔案事業(yè)的一種形式并沒有專門針對性的規(guī)章制度進(jìn)行指導(dǎo),從前期準(zhǔn)備、平臺設(shè)計到參與雙方的權(quán)責(zé)都沒有統(tǒng)一的規(guī)范,只能依靠檔案眾包的發(fā)起方在實踐中摸索。
3.2 檔案開放方面:檔案資源開放較滯后。豐富有特色的館藏檔案資源是公眾積極參與檔案眾包的內(nèi)在動機(jī)。然而《中國統(tǒng)計年鑒2022》的相關(guān)數(shù)據(jù)顯示,2001年至2021年,我國綜合檔案館的館藏檔案迅速增長,與之相比的開放檔案數(shù)量增速相對緩慢,利用檔案在開放檔案中所占的比例越來越低,這說明我國的檔案開放工作還有很大的提升空間,如表1所示[12]。而在檔案資源的開放過程中,檔案館還應(yīng)關(guān)注到數(shù)字化副本的開放問題。近年來隨著檔案數(shù)字化項目的開展,極大地提高了館藏紙質(zhì)檔案的數(shù)字化率,但是由于檔案專業(yè)人員有限,開放鑒定進(jìn)程相對緩慢,數(shù)字化副本的開放速度滯后于數(shù)字化速度[13],影響了公眾對檔案的檢索利用。檔案未經(jīng)開放也就不能上傳到網(wǎng)站供公眾瀏覽和參與眾包工作,難以吸引到更多的眾包參與者,影響檔案眾包的進(jìn)程。
3.3公眾意識方面:社會總體關(guān)注度不足。自2006年眾包的概念被首次提出以來,眾包模式逐漸在各行各業(yè)被廣泛應(yīng)用,但與營利性質(zhì)的商業(yè)眾包相比,知識文化類眾包的關(guān)注度相對較低。此外,檔案眾包的特殊性也使其并沒有獲得足夠的關(guān)注。首先,檔案通常被封閉在昏暗的庫房中,在社會大眾的觀念里檔案是神秘嚴(yán)肅的。其次,檔案部門沒有很好地進(jìn)行檔案宣傳。大多數(shù)檔案館官方公眾號與公眾的互動很少,對推文留言板塊的留言不予回應(yīng),這也消耗了公眾參與檔案事業(yè)的積極性。[14]最后,檔案相關(guān)信息的受眾有限,傳播范圍小,公眾在網(wǎng)絡(luò)上和實際生活中通常沒有機(jī)會接收到檔案信息。這些因素阻斷了公眾對檔案眾包的關(guān)注,也使得其難以轉(zhuǎn)化成檔案眾包參與者,為檔案資源的開發(fā)貢獻(xiàn)智慧。
3 . 4 平臺建設(shè)方面: 平臺管理不完善嚴(yán)密。與VeleHanden網(wǎng)站相比,我國現(xiàn)有的檔案眾包平臺缺乏參與者與項目管理者便捷的溝通渠道、眾包任務(wù)單一且未進(jìn)行明確的難度分級、未能做好項目的全程管理。以盛宣懷檔案抄錄項目和古籍整理眾包平臺為例:第一,盛宣懷檔案抄錄項目和古籍整理眾包平臺均未設(shè)計交流區(qū),用戶與項目管理者溝通只能通過上一級的上海市圖書館或籍合網(wǎng)平臺進(jìn)行反饋,不能及時解決在參與眾包過程中遇到的問題,影響參與者的體驗。第二,盛宣懷檔案抄錄項目的任務(wù)是將手寫歷史檔案抄錄為現(xiàn)代漢語,對檔案材料中的文本進(jìn)行識別有一定困難,即便是專業(yè)人員也要花費大量時間。第三,平臺的難度分級十分模糊,僅針對項目進(jìn)行難度分級,而每個項目中的具體任務(wù)沒有明確的難度說明,使得參與者不能較快地找到適合自己的任務(wù),影響眾包效率和參與者的積極性。第四,眾包平臺在全程管理方面有所欠缺,在已經(jīng)截止的75個抄錄項目中僅有23個項目的完成度是百分之百,部分項目甚至沒有人參與抄錄。注冊的用戶可以隨意選擇認(rèn)領(lǐng)和刪除認(rèn)領(lǐng)抄錄任務(wù),已經(jīng)過期的任務(wù)仍在任務(wù)列表中并未刪除。隨意的項目和用戶管理會影響最終的檔案眾包結(jié)果,未及時更新的眾包任務(wù)影響了用戶的抄錄效率。
4 “VeleHanden”項目對我國開展檔案眾包的啟示
針對目前我國檔案眾包實踐面臨的困境, 借鑒VeleHanden項目的優(yōu)秀經(jīng)驗,我國可以從制度規(guī)范、檔案開放、公眾參與、平臺建設(shè)、質(zhì)量控制等方面進(jìn)行改進(jìn)。4.1 完善相關(guān)制度規(guī)范。開展檔案眾包實踐,要政策先行。檔案眾包涉及檔案機(jī)構(gòu)、平臺開發(fā)者和公眾等多方主體,流程復(fù)雜,運行管理有一定的難度,檔案主管部門應(yīng)當(dāng)制定統(tǒng)一的制度規(guī)范指導(dǎo)檔案眾包實踐更好地開展。在檔案眾包的開展過程中,需將檔案資源上傳到開放的網(wǎng)站平臺上供大家瀏覽,存在信息安全風(fēng)險;用戶在眾包平臺上貢獻(xiàn)內(nèi)容屬于個人的智慧勞動,涉及知識產(chǎn)權(quán)保護(hù)的問題[15];參與者在注冊時一般需要填寫較多的個人信息,關(guān)系到個人隱私的獲取與保護(hù)。為了充分尊重各方主體的權(quán)利,保障眾包項目的良好運行,VeleHanden平臺制定了專門的信息政策,嚴(yán)格遵守荷蘭的法律規(guī)范、歐盟的信息數(shù)據(jù)管理規(guī)定,明確了各參與主體的權(quán)責(zé)。我國也應(yīng)當(dāng)參考現(xiàn)有的網(wǎng)絡(luò)安全法、個人信息保護(hù)法等法律法規(guī)制定更適合檔案眾包的制度規(guī)范,保障檔案眾包各參與主體的合法權(quán)益。
4.2 做好檔案的鑒定開放。雖然我國的檔案開放數(shù)量在逐年增長,但因為檔案存量和增量巨大,檔案開放率還處于較低的水平[16],難以滿足開發(fā)檔案眾包項目的需求。此外,經(jīng)過鑒定達(dá)到開放標(biāo)準(zhǔn)的檔案是否能上傳到眾包平臺供公眾查看和轉(zhuǎn)錄,也是實際工作中需要考慮的問題。2022年8月開始實施的《國家檔案館檔案開放辦法》在檔案開放主體和范圍、檔案開放程序和方式、開放檔案利用和保護(hù)、保障和監(jiān)督方面提供了新的指導(dǎo)。
檔案館可以根據(jù)本館檔案的利用現(xiàn)狀,總結(jié)出用戶對館藏利用最多的內(nèi)容,優(yōu)先開展這類檔案的鑒定開放工作。大部分公眾首先對檔案館的館藏檔案感興趣,然后才會參與基于本館館藏開發(fā)的檔案眾包項目。隨著歷史上行政區(qū)劃的變遷,部分反映同一事件的歷史檔案分散保存在不同省市的檔案館,這時檔案部門之間可以進(jìn)行溝通交流,合作開發(fā)同一個眾包項目。以長征檔案為例,主體收藏在中央檔案館,另一部分存留在中國第二歷史檔案館和云南、貴州、四川等省級檔案館,館際之間的合作能夠聚合更多的相關(guān)檔案,達(dá)到更好的眾包效果。
4.3 采取多種方式提高公眾參與度。用戶是檔案眾包的核心[17],為了吸引更多的眾包參與者,我國可以采用線上線下兩種方式進(jìn)行針對性的宣傳,而不僅僅依賴于線上平臺。比如,可以在館內(nèi)的電子閱覽室開設(shè)專門的檔案眾包工作區(qū)域,供來館的參觀者和查檔者注冊試用。再如,可在文化機(jī)構(gòu)、學(xué)校等場所進(jìn)行專題宣傳,吸引對歷史和文化感興趣的參與者。
此外,檔案眾包平臺可以適當(dāng)添加中英雙語切換的功能,吸引對我國歷史檔案感興趣的外國人參與眾包。簡化注冊登錄方式,使公眾能夠較快地開始眾包任務(wù),提高效率。建立眾包項目的互動討論區(qū)、制定積分兌換規(guī)則、組織參與者的線下活動等用戶激勵方式能夠有效地吸引新用戶,留住已有的參與者。我國可以從這些做法中借鑒優(yōu)秀經(jīng)驗,選擇更適合我國國情和公眾的激勵方式。
4.4 選擇合適的眾包平臺。眾包平臺的持續(xù)穩(wěn)定是眾包項目順利運行的重要保障。VeleHanden自上線以來,已持續(xù)運行12年之久,這也說明了一個穩(wěn)定長期的軟件合作公司的重要性。因此選擇合適可靠的軟件開發(fā)商共同開發(fā)檔案眾包平臺應(yīng)當(dāng)作為檔案眾包項目設(shè)計的首要任務(wù),軟件開發(fā)商應(yīng)當(dāng)兼具專業(yè)能力與人文素養(yǎng)。一個成熟的眾包平臺還應(yīng)當(dāng)包括詳細(xì)的規(guī)則說明,對平臺開發(fā)者、發(fā)包方和參與者的權(quán)利和義務(wù)進(jìn)行明確的規(guī)定。國外的數(shù)字人文眾包平臺對用戶個人的隱私保護(hù)十分重視,其關(guān)注點集中在信息內(nèi)容、信息安全和信息存儲等七個主要類別[18],尊重眾包參與者的個人權(quán)利,同時也對用戶的行為進(jìn)行約束和規(guī)范,以保障其他用戶和檔案資產(chǎn)的信息安全。
4.5 做好眾包全過程質(zhì)量控制。對眾包結(jié)果的質(zhì)量擔(dān)憂阻礙了部分檔案機(jī)構(gòu)開發(fā)眾包項目的步伐,因此需要做好充分的準(zhǔn)備,預(yù)防錯誤的發(fā)生。第一,在設(shè)計眾包項目時,綜合考慮本館實際需要和參與者的能力,選取恰當(dāng)?shù)臋n案材料并按難易程度分類,便于參與者根據(jù)自身能力選擇項目。同時需要為項目編寫詳細(xì)的輸入說明和系統(tǒng)使用說明,必要時錄制教學(xué)視頻,為參與者的正確輸入做好保障。第二,在參與者錄入的過程中,設(shè)計自動程序識別錯誤格式并發(fā)出提醒,設(shè)置討論區(qū)供參與者交流遇到的問題與經(jīng)驗體會,項目管理者通過討論平臺能夠了解參與情況并及時解決參與者的問題。第三,眾包任務(wù)完成后的審核過程,應(yīng)對有經(jīng)驗的眾包參與者進(jìn)行審核培訓(xùn),審核結(jié)果由檔案員進(jìn)行檢查,以確保檔案眾包成果的最終質(zhì)量。
5 結(jié)語
荷蘭“VeleHanden”眾包項目幫助檔案館切實解決了檔案在線檢索利用的難題,滿足了用戶快速檢索檔案的需求。對其眾包平臺設(shè)計、項目選擇、用戶激勵和質(zhì)量審核等方面進(jìn)行分析探討,對我國開展檔案眾包實踐具有重要啟發(fā)借鑒意義,對于促進(jìn)我國檔案信息資源開發(fā)利用模式轉(zhuǎn)型升級,提高檔案事業(yè)社會參與度具有重要參考價值。
*本文系2018年度國家社科基金青年項目──基于過程管理的歷史檔案開發(fā)利用眾包模式研究(項目編號:18CTQ039)資助成果;山東大學(xué)2022年度教育教學(xué)改革研究一般項目《檔案學(xué)概論》(項目編號:2022Y059)資助成果。
參考文獻(xiàn):
[1]HOWE J.The Rise of Crowdsouring[J].Wired,2006(6):176-183.
[2]鄧成雯.荷蘭阿姆斯特丹檔案館“VeleHanden”眾包項目機(jī)制研究及啟示[J].檔案管理,2021(6):11 6-11 9.
[3][7][9] NEIIEKE,SIGNE.Participatorytranscription in Amsterdam and Copenhagen[C]//Edward Benoit III,Alexandra Eveleigh.ParticipatoryArchives:Theory and practice.London:FacetPublishing,2019:103-11 3.
[4][10][11 ] FLEURBAAY E,EVELEIGH A.Crowdsourcing:prone to error?[C]// International Council onArchives conference.2012.
[5]Gebruiksvoorwaarden VeleHanden.nl[EB/OL].[2023-05-01].https://velehanden.nl/Inhoud/paginas/index/id/gebruiksvoorwaarden
[6]VeleHanden.nl[EB/OL].[2023-05-01].https://velehanden.nl/.
[8]Ontdek de geheimen van het archief[EB/OL].[2023-05-01].https://www.amsterdam.nl/stadsarchief/agenda/vrijwilligers/
[12]中華人民共和國國家統(tǒng)計局.中國統(tǒng)計年鑒2022[M].北京:中國統(tǒng)計出版社,2022.
[13]馬雪雯.我國紙質(zhì)檔案數(shù)字化工作研究[D].南京:南京大學(xué),2020.
[14]馬志穎.社交媒體時代檔案領(lǐng)域公眾參與研究[D].蘇州:蘇州大學(xué),2020.
[15]祝一,陳建.參與共治與開放共享:新加坡國家檔案館檔案眾包項目實踐及啟示[J].北京檔案,2022(10):43-47.
[16] 曲春梅,劉曉雨,王溶琨.檔案開放促發(fā)展 數(shù)據(jù)共享惠民生:2022年中國檔案利用體系建設(shè)發(fā)展報告[J].中國檔案,2023(3):26-27.
[17]丁越.開放融合與參與共贏:美國國家檔案與文件署的檔案眾包實踐及其啟示[J].檔案與建設(shè),2022(12):48-52.
[18]徐孝娟,趙澤瑞,賈海洋,史如菊.國外數(shù)字人文眾包個人信息保護(hù)研究及啟示:以網(wǎng)站運營者“隱私政策”為視角[J].現(xiàn)代情報,2023,43(2):168-177.
(作者單位:山東大學(xué)歷史文化學(xué)院 田艷羅,碩士研究生;陳建,管理學(xué)博士,歷史學(xué)博士后,副教授,碩士生導(dǎo)師,澳大利亞莫納什大學(xué)訪問學(xué)者 來稿日期:2023-06-01)