摘 要:文章探究“互聯(lián)網(wǎng)+網(wǎng)絡大眾”的檔案眾包及實施策略,以介紹國外檔案眾包實踐為基礎,分析眾包可在收集、加工(整理、鑒定、檢索、編研)、利用上開展應用,并以構(gòu)建眾包平臺、控制眾包內(nèi)容質(zhì)量、激勵用戶參與眾包、保障眾包用戶權(quán)益為思路論述數(shù)字檔案信息資源建設眾包的實施路徑。
關(guān)鍵詞:互聯(lián)網(wǎng)+;數(shù)字檔案信息資源;眾包
目前,國內(nèi)檔案領(lǐng)域?qū)Ρ姲难芯恐饕墙榻B國外檔案館如何利用眾包促進數(shù)字檔案信息資源建設的實踐案例,極少有人探究如何利用眾包來建設我國數(shù)字檔案信息資源。因而,本文從網(wǎng)絡信息消費大眾數(shù)量將更多、大眾參與創(chuàng)新將更盛的“互聯(lián)網(wǎng)+”時代背景下,提出以眾包為實施路徑,即“互聯(lián)網(wǎng)+網(wǎng)絡大眾”的方法,探究我國檔案館實施眾包的策略。
1 國外檔案眾包實踐
2013年,美國行政會議(行政立法機關(guān))宣布美國國家檔案館的“公民檔案工作者倡議”獲得2012年度沃爾特·蓋爾霍恩(Walter Gellhorn,美國知名法律專家,公民權(quán)利和法律的現(xiàn)代研究先驅(qū)之一)創(chuàng)新獎,以表彰“公民檔案工作者倡議”通過眾包項目在轉(zhuǎn)變機構(gòu)與公眾之間的關(guān)系中取得的成績。[1]美國國家檔案與文件管理署實施的公民檔案工作者(Citizen Archivist)項目有11項活動提供公眾參與:標簽、轉(zhuǎn)錄、制作字幕視頻、上傳和分享、轉(zhuǎn)錄舊天氣、編輯維基文章、進入比賽、提出建議、志愿者等。這些活動可直接在網(wǎng)頁上檢索到,或通過國家網(wǎng)站如Archives.gov、Challenge.gov及受公眾青睞的社交站點如Flickr、Tumblr找到。對每一活動的操作和公眾所做意義,都有相應的文字介紹,部分有視頻。登錄進入tag活動,其分主題提供圖片,選擇感興趣的主題,對圖片做關(guān)鍵詞、貼標簽、詳細描述等,每個主題下所要做的任務不是相同的,有的是關(guān)鍵詞、有的是貼標簽等,都會詳細說明。除美國外,英國、荷蘭等國家也有檔案眾包項目,具體如表1所示。檔案眾包是指檔案館以互聯(lián)網(wǎng)為基礎,將自身所承擔的信息資源建設以及相關(guān)服務的工作,以自由自愿的形式外包給非特定的廣大的網(wǎng)絡大眾的做法。[2]
2 眾包的基本認知
2.1 眾包。眾包(crowdsourcing)一詞于2006年6月由杰夫·豪(Jeff·Howe)在美國《連線》(wired)雜志上首次提出。眾包是指一個公司或機構(gòu)把過去由員工執(zhí)行的工作任務,以自由自愿的形式外包給非特定(而且通常是大型的)的大眾網(wǎng)絡的做法。其中,眾包的重要的先決條件是開放的形式和大規(guī)模潛在的勞動力網(wǎng)絡。[3]由此可見,眾包具有基于互聯(lián)網(wǎng)、開放共建、網(wǎng)絡大眾協(xié)同創(chuàng)作等基本特征。
2.2 眾包與外包的關(guān)系。對于組織機構(gòu)而言,眾包與外包的相同點在于都是將任務“包出去”,委托給組織機構(gòu)以外的人員完成。不同點在于:第一,對象不同。眾包的對象是網(wǎng)絡環(huán)境下的大眾用戶,是一對多的關(guān)系;外包的對象是某一專業(yè)機構(gòu)或組織,是一對一的關(guān)系。第二,協(xié)作關(guān)系不同。眾包由任務吸引大眾自由自愿參與,具有“自愿協(xié)作”大規(guī)模交互關(guān)系;外包是雇傭人員提供服務,具有勞資雙方關(guān)系,具有“雇傭”雙向合作關(guān)系。第三,經(jīng)濟報酬不同。眾包分為有償和無償兩種方式:有償方式為發(fā)包方需付費購買接包方提供的成果,無償方式為接包方為網(wǎng)絡上的業(yè)余愛好者、志愿者等,其成果可供無償使用,其多為追求精神滿足和自我價值的實現(xiàn);外包僅有有償方式且要價較高,需要支付高昂的費用。
3 “互聯(lián)網(wǎng)+”時代眾包在數(shù)字檔案信息資源建設中的應用
3.1 眾包在數(shù)字檔案信息資源收集中的應用。
3.1.1 思維上創(chuàng)作成果的收集。網(wǎng)絡大眾在眾包平臺上開發(fā)檔案眾包項目,在創(chuàng)作過程中,由于著作者思維的活躍,有的著作者會增補相關(guān)內(nèi)容,完善成果。如此,眾多新型的有價值的成果毫無疑問地豐富或活化了數(shù)字檔案信息資源,從而有利于數(shù)字檔案信息資源的收集,而這種側(cè)重于思維意義上創(chuàng)作成果的收集,相較于一般意義上的實體收集則更高層次化。
3.1.2 實體上征集成果的收集。以收集更多相關(guān)方面的實體數(shù)字檔案信息資源為目的的檔案眾包項目,則更多側(cè)重于實體收集。這些實實在在的成果可共享給眾包平臺上的網(wǎng)絡大眾,也可由檔案館收集整理,豐富館藏。在美國國家檔案與文件管理署(NARA)的“Citizen Archivist”項目中,就允許用戶上傳相關(guān)方面的數(shù)字圖像、上傳并分享檔案。
3.2 眾包在數(shù)字檔案信息資源加工中的應用。
3.2.1 整理。集中體現(xiàn)在對數(shù)字檔案信息資源的序化與詮釋等。網(wǎng)絡大眾對其進行轉(zhuǎn)錄、翻譯、編輯,譬如使經(jīng)掃描后一些特定年代和特殊背景下的數(shù)字檔案信息資源,能夠以現(xiàn)行的語言或翻譯件表達出來,讓人們看得懂,能體會其中的含義。如澳大利亞愛荷華大學的“DIY History”項目,網(wǎng)絡大眾在轉(zhuǎn)錄過程中遇見的陌生詞語、縮寫等,都要以現(xiàn)行的語言表示出來,無法翻譯的時候也要以相關(guān)的猜測([小鎮(zhèn)?])或以(?)的形式表示出來。
3.2.2 檢索。集中體現(xiàn)在對數(shù)字檔案信息資源的著錄及提取關(guān)鍵詞等。檔案館對某一件檔案提取的關(guān)鍵詞,有時并非符合大眾檢索習慣,以致部分檔案檢索查找較為困難,檢索后并不能快速找到目標檔案,輕者浪費查找時間及影響利用者心情,重者使這部分檔案無法發(fā)揮功用,“埋沒”檔案自身價值。因此,由大眾對部分數(shù)字檔案信息資源自行歸納提取關(guān)鍵詞,參與著錄過程,使檢索詞能更加貼近大眾檢索需求,部分意義上可提高檢索詞的精準度。
3.2.3 鑒定。集中體現(xiàn)在對數(shù)字檔案信息資源的考證辨?zhèn)蔚取τ谟兄鴼v史神秘感以及在真實性、完整性等方面存在問題的可公開數(shù)字檔案信息,可交給龐大的網(wǎng)絡大眾進行推敲驗證,這種對腦力活動要求較高的鑒定項目,極大可能地激發(fā)網(wǎng)絡大眾對“檔案”的好奇心理和研究心性,從而提高檔案尤其是檔案內(nèi)容的真實可靠性。
3.2.4 編研。集中體現(xiàn)在編前研究的建言獻策等。編前研究是編研的重中之重,網(wǎng)絡大眾可對編研的主題給出意見,為查找相關(guān)于主題的檔案資料提供線索,也可在主題所涉及的政策、研究熱點等方面給予提示。
3.3 眾包在數(shù)字檔案信息資源利用中的應用。
3.3.1 參考咨詢。對于一般的網(wǎng)絡大眾而言,發(fā)出檔案基本知識、檔案法規(guī)、檔案查找利用方法等方面的咨詢的可能性較大;對于有著檔案教育背景的網(wǎng)絡大眾,更多會發(fā)出檔案研究課題、檔案學科發(fā)展等方面的咨詢;對于從事檔案服務的商業(yè)性專業(yè)機構(gòu),可能會發(fā)出檔案外包、數(shù)字檔案館建設等咨詢;對于存儲檔案的檔案館,發(fā)出的多為檔案業(yè)務外包招標、檔案信息服務大眾滿意度調(diào)查等咨詢。因此可設置分眾的參考咨詢欄目,針對這些咨詢都可由網(wǎng)絡大眾有選擇性地回答,清楚明了的解說與答疑,使有著各種檔案需求的大眾及機構(gòu)獲得相應信息。
3.3.2 休閑檔案。根據(jù)自己的興趣做事本身就是一種休閑,網(wǎng)絡大眾根據(jù)自己的興趣參加檔案眾包項目,在這個開放的眾包項目中,無論是在參與開發(fā)建設,還是在隨意瀏覽,都展現(xiàn)著網(wǎng)絡大眾休閑的情緒。開展檔案眾包活動,不僅融入了休閑檔案的理念,也促進了檔案開放共享的動力。
4 “互聯(lián)網(wǎng)+”時代眾包在數(shù)字檔案信息資源建設中實施的路徑
4.1 構(gòu)建數(shù)字檔案信息資源眾包平臺。眾包這一模式得以實施的關(guān)鍵就是網(wǎng)絡平臺的搭建和潛在參與者的網(wǎng)絡連接。[4]
4.1.1 “自給自足”式構(gòu)建平臺。“自給自足”式構(gòu)建平臺,是指以現(xiàn)已存在的檔案信息官方網(wǎng)站為基礎,只是從中嵌入和開發(fā)進行檔案眾包的相關(guān)網(wǎng)頁,便于直接發(fā)布和管理眾包項目的平臺構(gòu)建方式。其中,檔案館可選擇與相關(guān)企業(yè)、科研院所、高等學校進行技術(shù)合作,合力開發(fā)眾包平臺或自行開發(fā)。譬如,荷蘭阿姆斯特丹檔案館的“保存肖像”“眾人參與”項目,都與Picturae公司合作進行。
4.1.2 “頂層設計”式構(gòu)建平臺。“頂層設計”式構(gòu)建平臺,即國家級檔案館或省級檔案館牽頭構(gòu)建檔案眾包總平臺的方式。該平臺是共用的,其他檔案館可借助此平臺將檔案眾包項目發(fā)布,不需其自行構(gòu)建開發(fā),如此省去大量的開發(fā)眾包平臺所需的資源消耗,使人、物、財資源相對薄弱的市縣級檔案館也有可發(fā)布眾包項目的平臺。同時,也鼓勵將眾包平臺構(gòu)建方式開源給其他檔案館,便于自愿自行構(gòu)建眾包平臺的檔案館利用。
4.2 控制數(shù)字檔案信息資源眾包內(nèi)容質(zhì)量。
4.2.1 源頭——參與者的控制。美國麻省理工大學進行的一個名為the Edgerton Digital Collections的項目,旨在為一名在學校中極受歡迎的教授(Harold Edgerton)轉(zhuǎn)錄和數(shù)字化其筆記。為吸引人員參與項目,發(fā)包方在麻省理工大學的校友雜志上發(fā)布廣告,以此來提高參與者知識水平較高的可能性。從宣傳的角度把控參與者的質(zhì)量,以此增加獲得高質(zhì)量檔案眾包成果的可能性。所以發(fā)包方在鼓勵網(wǎng)絡大眾參與檔案眾包項目的同時,也可以適當?shù)赜兴鶅A斜,在知識水平或?qū)I(yè)性集群較高的平臺上宣傳眾包項目,以期獲得更好的參與主體。
4.2.2 中流——制作過程的助力。為了確保最終完成的眾包內(nèi)容質(zhì)量,除了重視參與者這一主要因素外,也不可忽視眾包平臺在創(chuàng)作過程中發(fā)揮的助力作用這一次要因素。大眾在項目開發(fā)平臺中創(chuàng)作時,眾包平臺應提供盡可能的幫助,如提供鏈接到國家公共圖書館、各個數(shù)字檔案館、維基百科等網(wǎng)頁;提供可能用到的工具書、軟件等;允許參與者提問到該眾包平臺內(nèi)外的社區(qū)。這種微小而不可或缺的助力作用,在解決大眾開發(fā)過程中的問題,使其在困惑不解時能柳暗花明、提高眾包內(nèi)容質(zhì)量等方面起著重要作用,所以檔案眾包平臺應從各個方面為眾包項目開發(fā)建設提供可助之力。
4.2.3 收尾——制作成果的審核。第一,強調(diào)“人”在審核中的作用。對于轉(zhuǎn)錄等基本操作性業(yè)務而言,可通過“多方參與—彼此比對—第三方定奪”的形式減少由于粗心造成的差錯;對于添標簽、注釋等工作,可采取“公眾、專家雙評審”機制;如遇到多方爭執(zhí)、難以定奪的問題,便可交給專家團來商議解決。[5]強調(diào)公眾參與成果審核的同時,還需要強調(diào)該成果的完成者,應該認真審核自己的“作品”,注意語句是否通順、注釋是否標注、轉(zhuǎn)錄是否一致等。此外,也應在每個項目中適當?shù)叵拗迫藬?shù)或適時地控制時間,否則無限制地提交成果,不利于成果的收集及審核。因此規(guī)定每個項目中每個小任務的參與人數(shù),如轉(zhuǎn)錄該圖片僅限20人,該項目的截止時間為××是極為必要的。如在限定的人數(shù)和時間內(nèi)最終成果沒有達到發(fā)包方的要求,則另外加人或延時。第二,強調(diào)“智能系統(tǒng)”的審核作用。對于不限制時間和人數(shù)而允許龐大網(wǎng)絡大眾參與的項目,可采取智能的審核系統(tǒng),其對海量數(shù)據(jù)進行初步過濾,以避免出現(xiàn)打廣告、政治傾向有較大偏頗或完全脫離問題等答案,該“智能系統(tǒng)”若能做到語義、答案相似度的集群歸類審核則更佳,保證成果的可讀性、可用性。
4.2.4 升華——專家小組的整合。對于參與者眾多、成果豐碩的重大的檔案眾包項目,卻缺乏對成果的系統(tǒng)梳理和整合,豈不是巨大的浪費?可將最終形成的豐富的成果進行專家級的審核校驗和整合編纂,具體做法為在平臺上形成專家小組,小組成員可為實名認證的國內(nèi)外檔案領(lǐng)域或其他領(lǐng)域的專家、教授等以及眾包平臺上具有資深經(jīng)驗的網(wǎng)絡大眾。針對不同的眾包項目,對不同的人發(fā)出邀請形成專家小組,未被邀請的人也可申請加入。這樣利于數(shù)字檔案信息資源的深度加工,再一次升華成果,進而得到更精細的作品。
4.3 激勵用戶參與眾包項目。舉例來說,興趣、享受和社會交往都可認為是參與者加入眾包的內(nèi)在動機。[6]經(jīng)濟報酬或其他利益可認為是參與者加入眾包的外在動機。
4.3.1 經(jīng)濟報酬或獎勵式的有償激勵方式。抓住參與者的外在動機,設置兩種有償激勵方式。一種是實在的經(jīng)濟報酬,以貨幣激勵;另一種是用“獎勵”替代報酬,比如可贈送相關(guān)的檔案編研成果、相應的積分、允許訪問不向外界公開的檔案等。目前,在荷蘭阿姆斯特丹檔案館的眾人參與項目中,根據(jù)網(wǎng)絡大眾在項目中貢獻的多少給予相應的積分獎勵,其可利用這些積分兌換自己中意的與檔案相關(guān)的復制品。
4.3.2 志愿者式的無償激勵方式。把握參與者的內(nèi)在動機,設置無償激勵方式。無償激勵方式也可看做志愿者模式,其重點在于抓住眾包參與用戶的內(nèi)心情感或自我實現(xiàn)價值的需求,讓參與眾包的網(wǎng)絡大眾,從內(nèi)心深處感受到被需要、被重視及被信任,從而積極地、持續(xù)地投身到檔案眾包項目中,最后獲得自我價值實現(xiàn)的幸福感,這也正符合馬斯洛需求層次理論中的第五階層——自我實現(xiàn)需求。外國學者Brabham認為,相較于外在動機如金錢、報酬,大眾參與者的內(nèi)在動機包括學習、樂趣、自我肯定等更能影響參與者的行為。[7]
4.4 保障眾包用戶權(quán)益安全。
4.4.1 眾包平臺的保駕護航。一是對于金額懸賞或是賦予權(quán)益的獎勵,發(fā)包方要及時提供給參與者,贏得公眾信任。二是保證眾包用戶申訴渠道的暢通與及時受理申訴,實實在在為參與者服務。
4.4.2 眾包用戶提高維權(quán)意識。如果沒有用戶的積極響應和使用,眾包平臺制定實施的權(quán)益保障策略也難以得到踐行和提升。用戶權(quán)益在受到威脅與損害時,要有強烈的維權(quán)意識,不能只有“認栽”“下次再也不來”等消極心態(tài),應增強維權(quán)意識,為自己的權(quán)益安全盡心盡力。
參考文獻:
[1]美國家檔案館的“公民檔案工作者倡議”榮獲2012年度政府最佳創(chuàng)新實踐獎[J].陜西檔案,2013(2):17.
[2]趙宇.檔案眾包平臺的構(gòu)建及運行機制研究[J].浙江檔案,2016(4):23~25.
[3]Howe J. The Rise of Crowdsouring[J].Wired,2006,14(6):176~183.
[4]邵平.“互聯(lián)網(wǎng)+”催生服務眾包新業(yè)態(tài)[J].服務外包,2015(5):78~80.
[5]談偉.國外“檔案眾包”實踐及引發(fā)的思考[J].四川檔案,2014(2):51~52+57.
[6]夏恩君,趙軒維,李森.國外眾包研究現(xiàn)狀和趨勢[J].技術(shù)經(jīng)濟,2015(1):28~36.
[7]BRABHAM D C.The myth of amateur crowds,information[J].Communication&Society,2012,15(3):394~410.
(作者單位:上海大學圖書情報檔案系 來稿日期:2016-11-30)