亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于網(wǎng)絡(luò)眾包模式的海量歷史文獻數(shù)字化處理方法研究

        2019-03-18 02:14:32席運江林瑤瑤廖曉俞寬
        現(xiàn)代情報 2019年2期

        席運江 林瑤瑤 廖曉 俞寬

        摘要:[目的/意義]針對海量歷史文獻數(shù)字化所面臨的文獻數(shù)量龐大、耗時長、成本過高等問題,本文將眾包理念引入傳統(tǒng)文獻數(shù)字化工作中,形成基于網(wǎng)絡(luò)眾包模式的海量歷史文獻數(shù)字化處理方法。[方法/過程]該模式根據(jù)歷史文獻特點,將網(wǎng)絡(luò)大眾自發(fā)知識生產(chǎn)模式與專家定向模式相結(jié)合,提出了相應(yīng)的用戶激勵和質(zhì)量控制方案,從而保證眾包任務(wù)的高效率、低成本、質(zhì)量可控。此外,以粵海關(guān)清末歷史文獻為試點驗證眾包模式在大規(guī)模文獻數(shù)字化處理工作中的可行性、高效性。[結(jié)果/結(jié)論]該模式為處理歷史文獻處理提供了新的思路與方法,且具有廣闊的應(yīng)用前景。

        關(guān)鍵詞:眾包模式;定向眾包;粵海關(guān)歷史文獻;數(shù)字化處理;PDCA

        DOI:10.3969/j.issn.1008-0821.2019.02.019

        〔中圖分類號〕G250.76〔文獻標(biāo)識碼〕A〔文章編號〕1008-0821(2019)02-0161-08

        歷史文獻作為國家歷史文化的物質(zhì)載體,記錄著各個階段的社會發(fā)展?fàn)顩r,內(nèi)容涵蓋史、經(jīng)、哲等多個方面,反映著我國數(shù)千年歷史文化傳承與發(fā)展。歷史文獻的數(shù)字化處理逐漸取代原有的純紙質(zhì)文獻整理,從而解決紙質(zhì)文獻不易存儲、查閱標(biāo)注及難以深入分析等問題。但對于海量歷史文獻的數(shù)字化處理工作,目前尚存在較多亟待克服的困難:歷史文獻數(shù)量龐大、種類形式多樣、專業(yè)性強,因而人、物、財力成本巨大,嚴(yán)重制約了歷史文獻的數(shù)字化處理及應(yīng)用。

        針對這一問題,本文提出了基于網(wǎng)絡(luò)眾包模式的海量歷史文獻數(shù)字化處理方法,將眾包理念與傳統(tǒng)文獻數(shù)字化處理工作相結(jié)合,以實現(xiàn)海量歷史文獻的數(shù)字化處理問題。

        1文獻綜述

        1.1眾包概念及主要內(nèi)容

        眾包(Crowdsourcing)[1]一詞最早由美國《連線》(Wired)雜志記者杰夫·豪(Jeff Howe)于2006年提出,并在維基百科上將其定義為:“一個公司或機構(gòu)把過去由員工執(zhí)行的工作任務(wù),以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網(wǎng)絡(luò)的做法”。Surowiecki J(2006)曾在《群體的智慧》中提出“群眾比少數(shù)人更聰明”這一觀點,認(rèn)為團體基于群體智慧所做出的決策往往要好于個體的單獨決策[2]。而基于互聯(lián)網(wǎng)的眾包模式作為一種以網(wǎng)絡(luò)作為共享平臺,廣泛吸收整合企業(yè)內(nèi)外創(chuàng)新資源的合作模式,實際上就是對這種“群體智慧”的創(chuàng)新應(yīng)用。

        眾包的興起得益于互聯(lián)網(wǎng)的普及、網(wǎng)絡(luò)技術(shù)的發(fā)展、網(wǎng)絡(luò)一代的出現(xiàn)以及個性消費者的崛起[3]。仲秋雁[4]等認(rèn)為眾包實際上是將軟件開發(fā)領(lǐng)域中開放源代碼的方法應(yīng)用到其他領(lǐng)域中。Panchal等將眾包分為基于競爭和基于合作兩種不同的眾包創(chuàng)新模式[5]。

        眾包不同于外包,外包強調(diào)的是將企業(yè)非核心的業(yè)務(wù)以一對一的形式外包給具備專業(yè)性的特定用戶;而眾包更傾向于資源共享、用戶共創(chuàng)的生產(chǎn)方式,吸引外部非特定用戶自愿參與企業(yè)事務(wù)中,倡導(dǎo)的是多樣化及差異化[6]帶來的創(chuàng)新潛力,利用群體智慧來實現(xiàn)企業(yè)競爭力的提升。

        1.2眾包平臺及應(yīng)用

        眾包問題的研究對象包括發(fā)包方、參與者和眾包平臺。發(fā)包方和參與方通過眾包中介平臺聯(lián)系在一起,后者利用自身資源為前者提供任務(wù)解決方案并獲得相應(yīng)報酬。眾包平臺通常被分為解決問題和創(chuàng)意產(chǎn)生平臺[7],例如亞馬遜推出的土耳其機器人網(wǎng)站[8]和Dell的“創(chuàng)意風(fēng)暴”[9]。

        近年來,越來越多公司認(rèn)識到眾包的重要價值:IBM投入10億美元開發(fā)眾包模型;搜狗輸入法、豬八戒網(wǎng)借助眾包的思維和形式,成功獲取了數(shù)以萬計的皮膚設(shè)計和詞庫及超過700萬的“線上工人”;2014年在馬航MH370的搜救過程中,美國衛(wèi)星地圖公司Digital Globe旗下眾包平臺Tomnod也曾采用眾包方式招募大眾參與處理其拍攝的高清海域衛(wèi)星照,以加快搜尋效率。盛芳[10]等在其研究中展示了眾包模式在圖書館界的成功應(yīng)用,其中紐約公共圖書館利用眾包模式,成功借助大眾的力量將館藏的4萬多份菜單圖片轉(zhuǎn)換為可供檢索的文本。以上案例都充分說明了眾包模式在生產(chǎn)效率和成本方面的優(yōu)勢,也為本文眾包模式的設(shè)計提供了有價值的參考。

        2海量歷史文獻數(shù)字化處理工作分析

        2.1海量歷史文獻數(shù)字化處理難點

        歷史文獻數(shù)字化雖在一定程度改善了傳統(tǒng)紙質(zhì)文獻的整理、查閱、存儲及分析工作,但對于海量古籍的數(shù)字化處理方面,目前尚存在較多亟待克服的困難:其一,歷史文獻數(shù)量龐大且種類形式繁多,給文獻全文識別、翻譯等數(shù)字化工作帶來很大困難。海量文獻通常涉及多種匯編語言,同時手寫紙質(zhì)文獻還易出現(xiàn)紙質(zhì)老化、字體繁雜、字跡模糊涂改等現(xiàn)象,無法完全借助OCR等工具進行快速識別,依賴大量人工識別;其二,專業(yè)性較強的古籍要求翻譯人員具備相關(guān)的專業(yè)及背景知識儲備,見圖1。以上這些都表明,海量歷史文獻的數(shù)字掃描、信息獲取、圖像處理計算機輔助設(shè)計等諸多步驟都需要耗費大量的人力、物力、財力,若單單依靠館藏機構(gòu)內(nèi)少數(shù)專業(yè)人士,往往事倍功半。因此,若要高效保質(zhì)的解決海量歷史文獻數(shù)字化的問題,就需要解決海量文獻和專業(yè)性兩個問題。

        本文所研究的基于網(wǎng)絡(luò)眾包的海量歷史文獻數(shù)字化系統(tǒng)正是從以上兩個問題的角度入手,借由網(wǎng)絡(luò)眾包平臺,非定向招募普通用戶參與到海量古籍

        數(shù)字化工作中,以提高文獻數(shù)字化的整體效率;此外,針對歷史文獻中強專業(yè)性的核心文獻,采用“定向眾包”的形式招募一定數(shù)量的領(lǐng)域?qū)<?,從而形成“網(wǎng)絡(luò)大眾+領(lǐng)域?qū)<摇钡暮献髂J?,利用多方資源以實現(xiàn)海量文獻的高效數(shù)字化。

        2.2基于WBS的工作分解

        針對海量歷史文獻數(shù)字化處理工作,本文采用WBS方法對眾包工作進行結(jié)構(gòu)分解,逐步細(xì)化任務(wù)目標(biāo),依次確定各層級順序及相應(yīng)工作內(nèi)容,使整體眾包工作更為清晰明確。海量歷史文獻數(shù)字化處理核心工作分為以下4部分:歷史文獻數(shù)字化存儲、歷史文獻文本化、歷史文獻翻譯及歷史文獻挖掘與分析,見圖2。

        3眾包模式設(shè)計

        本文所設(shè)計的雙向眾包模式將是非定向眾包和定向眾包模式相結(jié)合,嵌入在難度系數(shù)較高的歷史文獻文本化和歷史文獻翻譯兩個部分,實現(xiàn)網(wǎng)絡(luò)大眾自發(fā)知識生產(chǎn)和領(lǐng)域?qū)<业亩ㄏ蛑R服務(wù),從而兼顧海量歷史文獻數(shù)字化處理的效率和專業(yè)性要求,為后續(xù)的文獻挖掘與分析提供堅實基礎(chǔ)。

        3.1非定向眾包模式設(shè)計

        非定向眾包模式主要適用于非專業(yè)性任務(wù)。針對數(shù)量龐大、難度系數(shù)和專業(yè)性要求偏低的文獻數(shù)字化任務(wù),借由網(wǎng)絡(luò)平臺非定向眾包給普通用戶,利用“群體智慧”及資源實現(xiàn)海量歷史文獻的高效低成本數(shù)字化。同時借助質(zhì)量控制策略在一定程度上解決眾包用戶知識儲備、能力素質(zhì)差異及所貢獻成果質(zhì)量參差不齊等問題。

        3.2定向眾包模式設(shè)計

        定向眾包模式適用于強專業(yè)性任務(wù)。針對部分難度系數(shù)及專業(yè)性要求較高的核心文獻的數(shù)字化任務(wù),普通用戶往往在能力等多個方面無法勝任。此時就要根據(jù)實際需要定向招募一定數(shù)量的領(lǐng)域?qū)<覅⑴c眾包工作,可借助豬八戒等眾包網(wǎng)站或是通過內(nèi)推形式招募。借助領(lǐng)域?qū)<业膶I(yè)知識服務(wù),以保障眾包文獻的專業(yè)性和準(zhǔn)確性。另外,領(lǐng)域?qū)<乙材軌驗槠胀ㄓ脩舻谋姲ぷ骷昂罄m(xù)眾包任務(wù)的質(zhì)量審核提供一定的指導(dǎo),從而提高整體的工作效率和質(zhì)量。

        3.3眾包模式總體架構(gòu)設(shè)計

        海量歷史文獻數(shù)字化處理眾包模式的總體架構(gòu)設(shè)計分為以下3層:基礎(chǔ)層、眾包運作層及應(yīng)用服務(wù)層,各層之間相互獨立,功能上層層遞進,如圖3所示。

        基礎(chǔ)層負(fù)責(zé)海量原始?xì)v史文獻的初步數(shù)字化處理及存儲工作,即將原始文獻拍攝為微縮膠片,再轉(zhuǎn)化為數(shù)字圖像存儲于基礎(chǔ)層,是整個雙向眾包模式得以順利進行的資源保證和根基所在;眾包運作層是以非定向大眾知識生產(chǎn)為核心,輔以領(lǐng)域?qū)<覅f(xié)同的定向眾包模式,依托網(wǎng)絡(luò)平臺及眾包資源庫支撐進行海量文獻資料的上傳整理、用戶招募篩選和任務(wù)分發(fā)審核,從而實現(xiàn)海量文獻的數(shù)字化進程,具體涵蓋眾包資料管理、眾包用戶管理、眾包質(zhì)量管理及眾包薪酬管理4個板塊,各板塊間相互關(guān)聯(lián),形成運作閉環(huán),與基礎(chǔ)層相互支撐,確保眾包模式的順利運作;應(yīng)用服務(wù)層則主要面向?qū)<覍W(xué)者、歷史知識愛好者,用戶可根據(jù)個人需求下載或購買相應(yīng)的數(shù)字文獻資源,以進行深入地分析和挖掘。

        3.4眾包模式的組織形式

        本文眾包模式采用傳統(tǒng)組織形式和新型網(wǎng)絡(luò)社區(qū)形式相結(jié)合的組織模式。傳統(tǒng)組織模式偏重職能性,按職能將人員分類并負(fù)責(zé)指定的工作內(nèi)容;新型網(wǎng)絡(luò)社區(qū)形式即基于眾包網(wǎng)站構(gòu)建社區(qū),即“眾包社區(qū)”,實現(xiàn)眾包參與者的知識共享、工作經(jīng)驗交流等。眾包模式組織模式參考圖4。

        由管理員負(fù)責(zé)社區(qū)及用戶維護和管理。將眾包社區(qū)中的用戶分為眾包用戶和非眾包用戶,各類用戶之間均可進行相互交流。眾包用戶包含普通用戶和定向招募的領(lǐng)域?qū)<遥械谋姲脩艟鶑墓芾韱T處領(lǐng)取眾包任務(wù),提交后由校審員進行審核評估,最終根據(jù)評估結(jié)果由管理員下發(fā)薪酬。

        3.5眾包模式業(yè)務(wù)流程設(shè)計

        基于雙向眾包模式的總體架構(gòu)設(shè)計,進一步確定具體工作流程以保證文獻數(shù)字化工作順利開展。眾包模式流程具體分為:海量歷史文獻整理分包流程、雙向眾包實施流程、眾包任務(wù)校審及薪酬分發(fā)流程和文獻資源存儲發(fā)布流程。

        3.5.1海量歷史文獻整理分包流程

        從基礎(chǔ)層調(diào)取存儲的初步數(shù)字化的文獻圖片資源和待翻譯的任務(wù)包,根據(jù)難度系數(shù)判別進行文本化和翻譯任務(wù)分包,都區(qū)分核心和一般任務(wù)包,以便下一步雙向眾包流程的實施。參見圖5。

        3.5.2雙向眾包實施流程

        雙向眾包實施流程包括眾包用戶招募與眾包任務(wù)分發(fā),其中眾包用戶招募包括非定向招募普通用戶和定向招募領(lǐng)域?qū)<?。本文眾包模式流程基于網(wǎng)站設(shè)計:首先,依托網(wǎng)絡(luò)進行眾包任務(wù)發(fā)布及宣傳、眾包用戶招募,并根據(jù)報名者個人素質(zhì)能力評估進行眾包用戶篩選;其次,通過篩選的眾包用戶,可在眾包網(wǎng)站上瀏覽并選取感興趣的眾包任務(wù)。每個用戶單次領(lǐng)取任務(wù)包不得超過3個,且難度系數(shù)在7及7以上的眾包任務(wù)僅限領(lǐng)域?qū)<矣脩纛I(lǐng)取,即由領(lǐng)域?qū)<叶ㄏ蛱幚肀姲ぷ髦泻诵那译y度較大的文獻,以避免眾包任務(wù)堆積而降低眾包效率和確保眾包結(jié)果的專業(yè)性。參見圖5。

        3.5.3眾包任務(wù)校審及薪酬分發(fā)流程

        眾包用戶完成相應(yīng)任務(wù)包后可在平臺提交個人眾包結(jié)果,校審員將會對其進行審核。未通過質(zhì)量審核的眾包文件將進行返工或取消該用戶眾包資質(zhì);針對通過審核的眾包結(jié)果將根據(jù)質(zhì)量進行薪酬評估,再由管理員進行薪酬支付。參見圖6。

        3.5.4文獻資源存儲及發(fā)布流程

        最后,審核通過的文本化及翻譯眾包結(jié)果將管理員存儲于基礎(chǔ)層,并及時發(fā)布在網(wǎng)站上,以便后續(xù)的查閱研究。參見圖6。

        3.6眾包用戶激勵及質(zhì)量控制

        3.6.1眾包用戶激勵。

        合理的激勵機制能夠有效激發(fā)參與者的積極性,并激勵其持續(xù)輸出高質(zhì)量且具備創(chuàng)新性的成果。常見的激勵形式有精神激勵和物質(zhì)激勵,而對大多數(shù)用戶來說,單純的精神激勵并不能持續(xù)性地

        激勵用戶[11]參與。線性激勵機制較固定薪酬激勵機制來說,也更能夠激發(fā)用戶的參與積極性[12]。

        1)眾包激勵機制

        本文所提出的眾包激勵機制以物質(zhì)激勵(線性激勵機制)為主,并輔以精神激勵(如可接觸優(yōu)質(zhì)歷史資源等),激勵眾包用戶輸出高質(zhì)量成果。因此,眾包薪酬體系即眾包任務(wù)定價將是眾包激勵機制的核心部分。這里設(shè)眾包任務(wù)薪酬為:

        Y=γ(a.0+λn)

        其中,γ為質(zhì)量控制系數(shù)(根據(jù)眾包成果達(dá)標(biāo)與否,取γ=0,1;若γ=0,將該眾包成果無效,需退回處理),a.0為固定薪酬,λ為激勵系數(shù),n為線性薪酬基數(shù)。激勵系數(shù)取決于眾包任務(wù)難度、眾包質(zhì)量及其他未知因素;而眾包質(zhì)量與受眾包用戶能力水平、努力程度相關(guān)[12]。

        2)眾包任務(wù)定價

        基于以上,本文采用分級薪酬體系,根據(jù)具體的眾包任務(wù)難度和眾包質(zhì)量、以及相應(yīng)的激勵系數(shù),從而確定最終的眾包薪酬,如表1。其中,q為任務(wù)質(zhì)量,q=∑3.i=1q.i/3,分為不及格、及格、良好、優(yōu)秀4個等級;d為任務(wù)難度d=∑2.i=1d.i/2,分為高、低兩個等級;因此,共可得出7個薪酬激勵等級(若q為不及格時,任務(wù)難度高低均為同一等級),可根據(jù)實際眾包實施情況對具體激勵系數(shù)設(shè)置進行自定義調(diào)整。

        3.6.2眾包質(zhì)量控制

        由于眾包面向的是非特定的網(wǎng)絡(luò)大眾,參與者能力、素質(zhì)等多方面的不確定性導(dǎo)致最終眾包任務(wù)完成質(zhì)量不一,往往事倍功半。因此,完善的質(zhì)量控制體系是眾包系統(tǒng)設(shè)計中必須考慮的重點之一。鑒于整個眾包過程是動態(tài)變化的,本文考慮引入基于監(jiān)測點的多層嵌套PDCA質(zhì)量模型對眾包質(zhì)量進行階段式動態(tài)控制,具體模型見圖7。

        首先將眾包過程劃分為眾包準(zhǔn)備、眾包實施、眾包質(zhì)量審核及反饋改進4個階段性進行質(zhì)量控制,并各階段選取相應(yīng)監(jiān)測點,嵌套PDCA進行階段式

        質(zhì)量反饋,以便及時發(fā)現(xiàn)并排除質(zhì)量異常點,確保眾包工作順利進行。

        主要質(zhì)量監(jiān)測點選取如下:眾包用戶篩選和眾包質(zhì)量審核。首先,將眾包用戶篩選作為首個質(zhì)量控制點,通過控制用戶質(zhì)量以確保眾包工作能夠兼顧質(zhì)量與專業(yè)性。借助個人信息審查和能力測驗等形式篩選合適的普通用戶并定向招募一定數(shù)量的領(lǐng)域?qū)<?,以開展后續(xù)的眾包工作。其次,眾包任務(wù)執(zhí)行階段,注意控制眾包任務(wù)的分發(fā),避免單個用戶單次領(lǐng)取的任務(wù)數(shù)量過多而導(dǎo)致眾包計劃超時。再次,將任務(wù)質(zhì)量審核作為第二個監(jiān)測點,校審人員對所有眾包用戶提交的結(jié)果進行審核,通過審核的用戶可重新領(lǐng)取新任務(wù)。質(zhì)量未達(dá)標(biāo)的任務(wù)將被退回修改或取消該用戶眾包參與資質(zhì),遺留任務(wù)將回到第二階段重新進行分發(fā),從而形成閉環(huán),循環(huán)迭代以實現(xiàn)整體眾包質(zhì)量的提升。

        4粵海關(guān)歷史文獻數(shù)字化眾包試點及效果評估

        本文以廣東省檔案館館藏粵海關(guān)歷史文獻為數(shù)據(jù)源,通過小規(guī)模試點形式驗證眾包模式在海量歷史文獻數(shù)字化工作中的可行性并評估其實際效果。廣東省檔案館約有藏檔共321個全宗,其中的粵海關(guān)檔案涉及1860-1949年的檔案共13 260卷,內(nèi)容涉及海關(guān)業(yè)務(wù)、貿(mào)易協(xié)定、社情民意等,以英文文獻居多。

        此次試點工作中,我們選取部分粵海關(guān)歷史文獻,人工將微縮膠片的掃描件按照章節(jié)編號整合成PDF文檔,并將其錄入上傳至數(shù)據(jù)庫作為待領(lǐng)任務(wù)包,以便后續(xù)試點眾包工作運作。

        4.1基于試點的眾包模式運作

        首先抽取500份左右粵海關(guān)英文文獻整合成文本化任務(wù)包50個,其中標(biāo)準(zhǔn)件任務(wù)包46個、文本化后的待翻譯任務(wù)包預(yù)計118個,具體分包及定價見表2。此外,每個任務(wù)包中都有必要的任務(wù)說明、操作流程、質(zhì)量審核標(biāo)準(zhǔn)、保密協(xié)議等。

        通過線上渠道結(jié)合E-mail的形式替代網(wǎng)站作為眾包模式運作平臺,將上述眾包任務(wù)包通過線上渠道發(fā)布以招募眾包用戶,以高校學(xué)生為主要群體。少量核心、難度較大的任務(wù)包則通過專業(yè)網(wǎng)站(如豬八戒網(wǎng))進行懸賞招募或定向招募專家進行處理。眾包用戶領(lǐng)取相應(yīng)任務(wù)包后,在1~2周內(nèi)提交個人完成結(jié)果。之后由校審員進行質(zhì)量審核評估,經(jīng)審核無誤后將薪酬打入眾包用戶支付寶賬戶。同時將眾包用戶個人信息登記表、工作量及工作質(zhì)量評估表、信譽度評價等進行整理歸檔,以建立眾包用戶資源庫,可作為人才儲備供今后使用。

        4.2基于試點的眾包模式完成情況及效果評估

        經(jīng)過為期1個月的眾包試點運行,50個文本化任務(wù)包和118個翻譯任務(wù)包均被領(lǐng)取,完成率都接近100%,較少出現(xiàn)退訂,具體試點完成情況見表3。

        基于以上粵海關(guān)歷史文獻眾包試點的結(jié)果反饋,驗證了本文設(shè)計的眾包模式在歷史文獻數(shù)字化處理方面具備較大優(yōu)勢。

        4.2.1用戶參與度高

        眾包模式使得文獻數(shù)字化工作難度得以拆解,從而降低了普通大眾的參與門檻。非定向的招募形式為文獻數(shù)字化工作帶來了源源不斷的人力資源,同時借由定向招募領(lǐng)域?qū)<业男问綇浹a普通大眾在知識儲備和專業(yè)性上的缺陷,極大提高了用戶的參與度。

        4.2.2時間優(yōu)勢明顯

        針對約500份粵海關(guān)歷史文獻眾包試點的耗時分析(見圖8)可得,相較于傳統(tǒng)模式,眾包模式的應(yīng)用使得原來文本化和翻譯任務(wù)耗時從原來的2~3天和8~10天縮短至1天和3天,具備較大的時間優(yōu)勢。同時當(dāng)眾包模式應(yīng)用在海量歷史文獻的數(shù)字化工作時,其人才、時間優(yōu)勢和規(guī)模效應(yīng)也就越強。

        4.2.3定向眾包模式成本優(yōu)勢明顯

        基于試點結(jié)果統(tǒng)計得,文本化眾包用戶時薪約為9~12元/時,低于市場平均兼職價格13~18元;翻譯工作用戶每個任務(wù)包薪酬為40元,即時薪為15元/時,25元/千詞,遠(yuǎn)低于市場價格。故眾包模式通過其規(guī)模優(yōu)勢降低了對單個用戶投入的成本,具有低成本性。具體如圖9。

        4.2.4定向眾包模式質(zhì)量可保證

        基于眾包模式的全流程質(zhì)量控制,普通粵海關(guān)歷史文獻文本化及翻譯試點工作各項關(guān)鍵指標(biāo)平均分均在8分以上。標(biāo)準(zhǔn)件識別、翻譯工作全部合格,優(yōu)秀率分別達(dá)65%、60%以上,結(jié)合專家定向處理核心手寫件,以保證眾包質(zhì)量。

        綜上,雙向眾包模式在整體運作上是完全可行的,且具有高效的、低成本的特點,同時擁有較高的參與度、專業(yè)性與完成質(zhì)量,完全可以持續(xù)應(yīng)用于海量歷史文獻數(shù)字化處理項目,可大規(guī)模開展與實施,且規(guī)?;瘍?yōu)勢明顯。

        5結(jié)論

        本文針對海量歷史文獻數(shù)字化過程中所面臨的文獻數(shù)量龐大、耗時長、成本過高等問題,將眾包理念引入傳統(tǒng)文獻數(shù)字化工作中,采用WBS方法分解海量歷史文獻處理工作,從基礎(chǔ)層、眾包運作層和應(yīng)用服務(wù)層三方面構(gòu)建基于網(wǎng)絡(luò)平臺的雙向眾包模式,創(chuàng)新性的將網(wǎng)絡(luò)大眾自發(fā)知識生產(chǎn)模式與專家定向模式相結(jié)合,實現(xiàn)高效、低成本的歷史文獻價值挖掘。本文從組織構(gòu)建和流程設(shè)計兩大模塊剖析眾包模式的運作,針對用戶激勵和質(zhì)量控制提出了具體的解決方案,并通過粵海關(guān)歷史文獻試點驗證眾包模式在大規(guī)模文獻數(shù)字化處理工作中的可行性、高效性,具有較高的應(yīng)用前景。但同時也存在一些不足,具體如下:其一,本文中僅大致描述整個眾包系統(tǒng)及功能需求,尚未實現(xiàn)眾包系統(tǒng)建設(shè),在今后研究工作中需進一步完善;其二,本文的眾包激勵機制以物質(zhì)激勵為主,較為單一,日后可考慮根據(jù)用戶反饋優(yōu)化激勵方案,以達(dá)到更好的激勵效果;其三,眾包模式的質(zhì)量控制體系雖然通過了試點驗證,當(dāng)考慮到試點文獻數(shù)量有限,如何確保大規(guī)模文獻數(shù)字化處理的高質(zhì)量依舊是未來探索的重點。

        參考文獻

        [1]Howe J.The Rise of Crowdingsourcing[J].Wired Magazine,2006,14(6):1-4

        [2]Surowiecki J.The Wisdom of Crowds:Why the Many are Smarter than the Few and How Collective Wisdom Shapes Business,Economies,Societies,and Nations.[J].Personnel Psychology,2006,59(4):982-985.

        [3]張利斌,鐘復(fù)平,涂慧.眾包問題研究綜述[J].科技進步與對策,2012,29(6):154-160.

        [4]仲秋雁,王彥杰,裘江南.眾包社區(qū)用戶持續(xù)參與行為實證研究[J].大連理工大學(xué)學(xué)報:社會科學(xué)版,2011,32(1):1-6.

        [5]Le Q,Panchal J H.Modeling the Effect of Product Architecture on Mass-Collaborative Processes[J].Journal of Computing & Information Science in Engineering,2011,11(1):1-12.

        [6]馬衛(wèi),方麗,屠建洲.從外包到眾包的商業(yè)模式變革及啟示[J].商業(yè)時代,2008,(1):13-14.

        [7]Howe J,Booksx I.Crowdsourcing:Why the Power of the Crowd is Driving the Future of Business[C]//Crown Publishing Group,2008:1565-1566.

        [8]Bloodgood M,Callison-Burch C.Using Mechanical Turk to Build Machine Translation Evaluation Sets[C]//NAACL Hlt 2010 Workshop on Creating Speech and Language Data with Amazons Mechanical Turk.Association for Computational Linguistics,2010:208-211.

        [9]Jeppesen L B,Lakhani K R.Marginality and Problem-Solving Effectiveness in Broadcast Search[J].Organization Science,2010,21(5):1016-1033.

        [10]盛芳,李正龍,焦坤,等.眾包與眾包館員制度:助推圖書館服務(wù)轉(zhuǎn)型[J].圖書情報知識,2012,(4):95-102.

        [11]張志強,逄居升,謝曉芹,等.眾包質(zhì)量控制策略及評估算法研究[J].計算機學(xué)報,2013,36(8):1636-1649..

        [12].張鵬,魯若愚.眾包式創(chuàng)新激勵機制研究——基于委托代理理論[J].技術(shù)經(jīng)濟與管理研究,2012,2012(6):45-48.

        (責(zé)任編輯:郭沫含)

        性感人妻av在线播放| 日日碰狠狠添天天爽五月婷 | 国产午夜精品视频观看| 久久熟妇少妇亚洲精品| 亚洲国产精品无码aaa片| 成年免费a级毛片免费看| 欧美一区二区三区红桃小说 | 人妻中文字幕在线中文字幕| 国产成人无码综合亚洲日韩| 又白又嫩毛又多15p| 99精品久久久中文字幕| 俺来也三区四区高清视频在线观看| 国产精品日韩av一区二区三区 | 亚洲加勒比久久88色综合| 国产无套护士在线观看| 亚洲欧美日韩中文综合在线不卡| 果冻蜜桃传媒在线观看| 亚洲av乱码国产精品观| 91日韩东京热中文字幕 | 免费看黄片视频在线观看| 亚洲国产色一区二区三区| 一本色道久久88综合日韩精品| 免费做爰猛烈吃奶摸视频在线观看| 丝袜美女污污免费观看的网站| 国产精品日日摸夜夜添夜夜添| 亚洲成av人片在线天堂无| 午夜亚洲精品视频在线| 97人妻人人揉人人躁九色| 成人性生交大片免费| 成人无码一区二区三区网站| 国产精品久久综合桃花网| 国产一区二区三区影片| 国产自拍视频在线观看免费| 特级精品毛片免费观看| 成全视频高清免费| 久久麻豆精亚洲av品国产精品| 国产黑丝美女办公室激情啪啪| 亚洲av无码久久| 欧美极品美女| 国产人妖在线免费观看| 国产一品二品精品在线|