羅小路 葉飛 程秀峰
(1. 華中師范大學(xué)信息管理學(xué)院,武漢 430079;2. 華中師范大學(xué)研究生院,武漢 430079)
會議資源是國家科技情報(bào)的重要來源,也是國家文獻(xiàn)信息資源保障體系中的關(guān)鍵一環(huán),它反映學(xué)科前沿動態(tài),為了解各國科技水平、預(yù)測未來發(fā)展提供參考,無論對企業(yè)、教育科研機(jī)構(gòu)還是政府來說都至關(guān)重要。但實(shí)際上,由于出版流程復(fù)雜、管理標(biāo)準(zhǔn)各異、獲取途徑有限,會議資源的流失問題十分嚴(yán)重。
隨著Web 2.0時(shí)代的到來,用戶參與式資源開發(fā)模式——“眾包”逐漸引起圖書館界的關(guān)注。眾包以社會化協(xié)作的方式將用戶融入資源建設(shè)與服務(wù)中,其開放、集成的獨(dú)特優(yōu)勢可以打破圖書館組織邊界,拓寬會議資源建設(shè)渠道,緩解會議資源建設(shè)資金不足、人員短缺的現(xiàn)狀,有效提升資源利用率和服務(wù)水平。與國外豐富的應(yīng)用相比,國內(nèi)圖書館對資源眾包的討論還停留在方案設(shè)計(jì)、經(jīng)驗(yàn)分享上,對資源眾包平臺建設(shè)、技術(shù)選型方面的關(guān)注稍顯不足。
微服務(wù)是近幾年開始流行的一種軟件系統(tǒng)架構(gòu),其核心在于將單個(gè)應(yīng)用程序分解成若干可獨(dú)立運(yùn)行的小服務(wù),這些服務(wù)圍繞不同的業(yè)務(wù)邏輯建立,獨(dú)立部署,服務(wù)之間采用輕量級協(xié)議進(jìn)行通信。相比單一的系統(tǒng)架構(gòu),微服務(wù)的先進(jìn)性不僅體現(xiàn)在技術(shù)上,還體現(xiàn)在業(yè)務(wù)和組織上[1],具有易開發(fā)、易維護(hù)、多技術(shù)支持、擴(kuò)展靈活、可復(fù)用等優(yōu)點(diǎn)。
會議資源建設(shè)的復(fù)雜性使得用戶對眾包平臺功能的要求不斷增加,傳統(tǒng)的系統(tǒng)構(gòu)架已經(jīng)無法適應(yīng)資源眾包多任務(wù)場景的需求,而微服務(wù)能夠快速構(gòu)建標(biāo)準(zhǔn)的功能模塊且支持模塊的拓展,恰好能為眾包平臺的開發(fā)提供理想的解決方案。鑒于此,本文將會議資源建設(shè)與眾包模式結(jié)合起來,通過構(gòu)建基于微服務(wù)架構(gòu)的會議資源眾包平臺,深入探討圖書館會議資源眾包的實(shí)現(xiàn)路徑,為改善會議資源建設(shè)現(xiàn)狀做出新的嘗試。
會議資源是指學(xué)術(shù)會議中形成的學(xué)術(shù)論文、科技報(bào)告、會議演講稿等一系列資料。作為資源服務(wù)機(jī)構(gòu)的代表,圖書館開展會議資源建設(shè)的必要性主要體現(xiàn)在3個(gè)方面。
會議資源基數(shù)大、種類多,但流通范圍十分有限,屬于灰色文獻(xiàn),國家圖書館曾明確灰色文獻(xiàn)的搜集范圍,會議資源是其中重要的組成部分[2]。經(jīng)過圖書館界幾十年的探索,灰色資源整體建設(shè)已經(jīng)初具規(guī)模,但是會議資源情況特殊,建設(shè)水平仍較為落后。一方面,會議資源的價(jià)值被嚴(yán)重低估導(dǎo)致這些資源在會后無法順利出版,造成重要情報(bào)的流失;另一方面,受到出版機(jī)構(gòu)、檢索工具等條件的限制,即便是順利出版的資源也很難得到有效利用。為此,圖書館應(yīng)加大會議資源開發(fā)力度,通過合理的宣傳來提高用戶的資源意識,幫助拓展會議資源的開發(fā)渠道,以達(dá)到提高會議資源利用率的目的。
圖書館發(fā)展經(jīng)歷了以資源為中心和突出開放借閱的第一代、第二代圖書館,現(xiàn)在已經(jīng)進(jìn)入以服務(wù)為中心的第三發(fā)展階段[3],各地圖書館正借助先進(jìn)技術(shù)積極探索資源服務(wù)的新模式。但是,館藏資源的同質(zhì)化和單一化仍是當(dāng)前圖書館服務(wù)創(chuàng)新的障礙[4],這對圖書館服務(wù)質(zhì)量有直接的影響。因此,讓會議資源作為科學(xué)數(shù)據(jù)的重要補(bǔ)充,能夠使圖書館服務(wù)內(nèi)容多元化,同時(shí)促進(jìn)圖書館資源服務(wù)創(chuàng)新。
圖書館想要突出行業(yè)地位,保持核心競爭力是關(guān)鍵。資源定位觀認(rèn)為,具有獨(dú)特、持久、專用、不可替代的資源是圖書館的核心競爭力[5]。但是,隨著用戶數(shù)量和需求的增加,越來越多商業(yè)化的服務(wù)機(jī)構(gòu)加入市場,這些機(jī)構(gòu)以盈利為主要目的,服務(wù)針對性強(qiáng),專業(yè)化程度高,對圖書館界的發(fā)展也產(chǎn)生了較大的沖擊。在這種情況下,將會議資源容納入館藏資源建設(shè)體系,可以提高圖書館行業(yè)競爭力,提升其在嚴(yán)酷市場環(huán)境下的生存力。
綜上所述,做好會議資源的建設(shè)工作,既是圖書館長期發(fā)展的業(yè)務(wù)需要,也是實(shí)現(xiàn)科學(xué)資源共享的責(zé)任擔(dān)當(dāng),圖書館有必要重視會議資源的開發(fā)與利用,為解決圖書館資源流失、實(shí)現(xiàn)服務(wù)創(chuàng)新、增強(qiáng)行業(yè)競爭力提供支持和保障。
2006年6月,Howe[6]在《連線》雜志上正式提出眾包的概念,認(rèn)為它是一個(gè)公司或機(jī)構(gòu)將過去由員工負(fù)責(zé)的業(yè)務(wù)以公開、自愿的形式外包給非特定大眾的做法。眾包的本質(zhì)是基于價(jià)值共創(chuàng)理念,充分利用大眾的知識盈余來實(shí)現(xiàn)資源的共建共享。一個(gè)眾包項(xiàng)目由發(fā)包方、接包方和眾包平臺組成,發(fā)包方根據(jù)需求設(shè)計(jì)任務(wù),然后借由網(wǎng)絡(luò)平臺發(fā)布,接包方利用自己的空閑時(shí)間參與任務(wù),創(chuàng)造內(nèi)容,解決問題。眾包模式最早應(yīng)用于商業(yè)領(lǐng)域,企業(yè)依托互聯(lián)網(wǎng)將社會資源以極低的成本匯聚起來用于企業(yè)生產(chǎn),后來這一做法被數(shù)字人文、公共衛(wèi)生、旅游交通等眾多領(lǐng)域借鑒使用。
將眾包應(yīng)用到圖書館資源建設(shè)中就是以圖書館為發(fā)包主體,將社會資源集中起來共同完成資源建設(shè),該模式一經(jīng)引入就在圖書館界得到了廣泛傳播。在國外,澳大利亞國家圖書館、美國國會圖書館、英國倫敦大學(xué)圖書館、紐約公共圖書館、芬蘭國家圖書館等都有過應(yīng)用并取得了不錯(cuò)的成效。在國內(nèi),上海圖書館在這方面實(shí)踐最多,學(xué)界則更集中于理論研究:國外眾包經(jīng)驗(yàn)介紹[7]或是針對眾包方案中的某個(gè)環(huán)節(jié)進(jìn)行設(shè)計(jì),如方案策略[8]、質(zhì)量管理[9]、激勵(lì)機(jī)制[10]、風(fēng)險(xiǎn)控制[11]等內(nèi)容。
根據(jù)任務(wù)性質(zhì)的不同,圖書館常見的資源建設(shè)眾包類型有轉(zhuǎn)錄與校對、情境化、補(bǔ)充收藏、分類、聯(lián)合策展和眾籌[12]。李書寧等[13]指出圖書館數(shù)字館藏建設(shè)的三大類實(shí)踐,即資源征集與整理、數(shù)字化資源光學(xué)字符識別(Optical Character Recognition,OCR)錯(cuò)誤校正和數(shù)字資源組織描述。資源建設(shè)經(jīng)歷收集、加工、維護(hù)更新,每個(gè)階段所對應(yīng)的眾包任務(wù)各有側(cè)重。資源收集階段的主要任務(wù)就是補(bǔ)充收藏,有圖書館采用“用戶決策采購”模式邀請讀者發(fā)現(xiàn)并獲取圖書館未收藏的資源,還有圖書館采取自愿捐贈的形式向公眾征集資源。資源數(shù)字化轉(zhuǎn)錄也是征集數(shù)字資源的重要手段,而且該任務(wù)通常與資源校對工作(如OCR錯(cuò)誤校正)同時(shí)完成,因此也屬于資源加工的范疇。除此之外,資源加工的任務(wù)具體還包括元數(shù)據(jù)方案制定、資源評論與標(biāo)注、資源分類等,這些任務(wù)一般需要用戶為內(nèi)容添置tag標(biāo)簽從而實(shí)現(xiàn)資源的描述,方便資源的檢索與利用,對用戶的專業(yè)能力有較高的要求。由于資源更新速度快,圖書館很難時(shí)刻關(guān)注數(shù)據(jù)庫的變化,資源或設(shè)備中任意一方出現(xiàn)故障都會導(dǎo)致資源建設(shè)工作功虧一簣,所以資源維護(hù)的目的就是要聯(lián)合用戶一起關(guān)注資源的變化情況,及時(shí)發(fā)現(xiàn)漏洞和更新數(shù)據(jù),保證圖書館資源的正常運(yùn)行。通過總結(jié)發(fā)現(xiàn),雖然眾包類型各不相同,但它們都存在一些共同特征:工作量大,任務(wù)可拆分,需要大量用戶參與;單個(gè)任務(wù)相對簡單、耗時(shí)短、具有趣味性;以特色數(shù)字館藏建設(shè)為主。
眾包平臺作為連接接包方和發(fā)包方的橋梁,其系統(tǒng)性能、功能設(shè)計(jì)直接關(guān)乎眾包的效果。目前常見的眾包平臺包括自建平臺、第三方平臺和嵌入式平臺。自建平臺根據(jù)眾包需求自行建立,如英國倫敦大學(xué)圖書館的邊沁手稿錄入項(xiàng)目[14]和上海圖書館的盛宣懷檔案抄錄[15]及家譜項(xiàng)目[16]等。自建平臺嚴(yán)格依照眾包方案單獨(dú)建立,所以系統(tǒng)性能相對完善,具有很好的擴(kuò)展性,但是單獨(dú)開發(fā)的成本較高,與圖書館服務(wù)平臺的聯(lián)系較少,服務(wù)功能可能會受到影響。也有部分圖書館避開系統(tǒng)開發(fā)的程序,直接選擇成熟的專業(yè)平臺即第三方平臺發(fā)布眾包項(xiàng)目,如大英圖書館、美國國會圖書館、澳大利亞國家圖書館在Flickr平臺上開展的圖片眾包項(xiàng)目。[17]第三方平臺雖然擁有用戶基礎(chǔ),但是受限于自身功能的自定義、針對性弱,圖書館的一些特殊要求不能得到滿足。嵌入式平臺直接依托圖書館網(wǎng)站來進(jìn)行構(gòu)建,將眾包功能與讀者服務(wù)融為一體,如澳大利亞國家圖書館的數(shù)字項(xiàng)目[18]、紐約公共圖書館的餐廳菜單轉(zhuǎn)錄項(xiàng)目[19]、芬蘭國家圖書館的Digitalkoot項(xiàng)目[20]、新加坡南洋技術(shù)大學(xué)圖書館的中國旗袍項(xiàng)目[21]。嵌入式設(shè)計(jì)可以節(jié)省系統(tǒng)開發(fā)費(fèi)用,但平臺的普適性較弱,需要針對眾包類型分別進(jìn)行開發(fā)。
第三代圖書館注重人的需求,追求多樣化、智能化的讀者服務(wù),對圖書館的空間特征、形態(tài)特征和服務(wù)特征[22]提出了更高的要求。眾包作為一種無限開放、全民參與、無組織邊界、智慧創(chuàng)新[23]的工作模式,對推動圖書館實(shí)現(xiàn)組織與服務(wù)變革,提升圖書館社會影響力具有重要的價(jià)值。第一,與急速增長的數(shù)字資源相比,圖書館的人力資源儲備顯然已經(jīng)無法應(yīng)對煩瑣的業(yè)務(wù)需求。管理者迫切需要從封閉的工作環(huán)境中解放出來,主動向公眾尋求幫助,借助社會力量來解決組織的內(nèi)部問題。眾包通過提供較低酬勞的方式吸引公眾參與圖書館建設(shè),以較低的預(yù)算換取更大的回報(bào),不僅可以降低運(yùn)作成本,還可以減少待處理工作的堆積。第二,以用戶為中心的服務(wù)理念逐漸流行,圖書館的服務(wù)重心開始發(fā)生轉(zhuǎn)移,管理者更多地關(guān)心“用戶是誰”“用戶喜歡什么”“用戶如何評價(jià)”等問題,與用戶互動的需求逐漸增多。而眾包最大的優(yōu)勢在于能夠提高用戶的參與度,為圖書館搭建一個(gè)與用戶溝通交流的平臺,讓管理者有機(jī)會在與用戶交互的過程中了解用戶的真實(shí)想法,這是以用戶為中心服務(wù)理念的具體體現(xiàn)。第三,以眾包的方式參與資源建設(shè),將圖書館置身于公眾視野之中,通過與讀者、機(jī)構(gòu)合作建立情感紐帶不僅可以吸引一批具有相同文化觀念、忠誠可靠的用戶群體,還能幫助圖書館樹立開放、親民的組織形象,從一定程度上提升社會影響力和行業(yè)競爭力。
綜上所述,在參照國內(nèi)外圖書館眾包的成功經(jīng)驗(yàn)后,結(jié)合我國會議資源建設(shè)的特點(diǎn),筆者提出一個(gè)基于眾包模式的圖書館會議資源建設(shè)方案,旨在鞏固圖書館會議資源建設(shè),加快實(shí)現(xiàn)多源異構(gòu)的會議資源的深度融合,實(shí)現(xiàn)會議資源更高水平的共建共享。
與一般的商業(yè)化眾包模式不同,會議資源專業(yè)性很強(qiáng),因此接包方的選擇不是任意大眾,而是具有一定專業(yè)背景的個(gè)人或機(jī)構(gòu)。其中:個(gè)人主要是參會人員和具有經(jīng)驗(yàn)的專家;機(jī)構(gòu)主要是會議的主辦方和承辦方,包括學(xué)協(xié)會、出版社、科研機(jī)構(gòu)、圖書館等。眾包平臺的構(gòu)建以圖書館官方網(wǎng)站為基礎(chǔ),嵌入新的眾包服務(wù)設(shè)計(jì)。嵌入式設(shè)計(jì)的優(yōu)勢在于:①官方網(wǎng)站擁有一定知名度和用戶基礎(chǔ);②與第三方平臺相比,用戶更熟悉原系統(tǒng),參與者不需要額外的培訓(xùn)或只需經(jīng)過簡單的培訓(xùn)就可以熟練使用系統(tǒng)進(jìn)行操作;③在系統(tǒng)內(nèi)部完成任務(wù)不僅方便命令的執(zhí)行與反饋,還能避免跨系統(tǒng)傳輸可能造成的數(shù)據(jù)損耗,方便數(shù)據(jù)的整合與利用。
傳統(tǒng)的眾包模式分為競賽眾包和協(xié)作眾包,競賽眾包強(qiáng)調(diào)最優(yōu)方案的選擇,而協(xié)作眾包強(qiáng)調(diào)方案的聚合[24]。會議資源建設(shè)涉及資源采集、數(shù)據(jù)加工、資源出版和資源維護(hù)四個(gè)階段,不同階段的任務(wù)性質(zhì)存在差異,因此模式的選擇必須具有針對性。資源的采集、出版和維護(hù)階段的任務(wù)內(nèi)容明確,難度適中,應(yīng)該利用協(xié)作眾包集思廣益。在協(xié)作模式下,機(jī)構(gòu)眾包和個(gè)人眾包同時(shí)進(jìn)行且始終保持互動,圖書館作為眾包的領(lǐng)導(dǎo)者,不僅要負(fù)責(zé)任務(wù)的策劃、發(fā)布和回收,還要主動協(xié)調(diào)二者之間的工作。相對而言,數(shù)據(jù)加工階段的任務(wù)復(fù)雜,對結(jié)果質(zhì)量要求嚴(yán)格,所以應(yīng)該選擇競賽眾包,通過比較從眾多方案中選擇最優(yōu)方案,防止因某一部分工作的失誤影響眾包整體的質(zhì)量。眾包的參與主體及角色分工見圖1。
圖1 會議資源眾包理論運(yùn)行框架
會議資源建設(shè)流程以及各階段的具體任務(wù)見圖2。
圖2 會議資源眾包建設(shè)流程圖
3.3.1 資源采集
采集資源是會議資源建設(shè)的第一步。借助個(gè)人和機(jī)構(gòu)的力量可以擴(kuò)大會議資源采集的范圍和深度,尤其是在采集灰色文獻(xiàn)資源時(shí)眾包的優(yōu)勢更加突出:用戶可以將自己從互聯(lián)網(wǎng)、專業(yè)數(shù)據(jù)庫、出版社和會議現(xiàn)場獲得的會議資源上傳,而這些資源是圖書館很難憑借自身努力獲得的。預(yù)處理的目的是規(guī)范會議資源的形式和內(nèi)容,通過人工轉(zhuǎn)錄或者OCR識別將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù),充分評估內(nèi)容的相關(guān)度、完整度后對數(shù)據(jù)進(jìn)行篩選,這部分工作枯燥煩瑣,將其拆分成簡單的小任務(wù)交給廣大用戶處理可快速完成。
3.3.2 數(shù)據(jù)加工
建立元數(shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)加工的前提,只有規(guī)范抽取出題名、責(zé)任者、會議名稱、會議時(shí)間、舉辦機(jī)構(gòu)等關(guān)鍵信息,才能進(jìn)行資源的組織和檢索。受圖書館條件的限制,編目人員對標(biāo)準(zhǔn)理解的差異容易導(dǎo)致著錄格式混亂,給普通用戶的檢索帶來困擾。而在眾包模式下,用戶有機(jī)會參與會議資源元數(shù)據(jù)標(biāo)準(zhǔn)的制定,以用戶生成標(biāo)簽的方式對會議資源的名稱和內(nèi)容進(jìn)行揭示,然后以此為標(biāo)準(zhǔn)進(jìn)行資源分類、名稱規(guī)范、實(shí)體標(biāo)注等操作。這一模式除了能夠充分發(fā)揮群體智慧,彌補(bǔ)圖書館思維的局限性之外,還有利于加深用戶和圖書館雙方對資源編目規(guī)則的理解,提高會議資源的查準(zhǔn)率。
3.3.3 資源出版
眾包所得資源包含已正式出版和未正式出版兩種類型,資源出版是針對后者而言的。在這方面開放式的出版是目前比較流行的模式,可以很好地解決會議資源老化速度快,重視程度低的問題。但是現(xiàn)階段會議資源開放出版的參與度不高,各大機(jī)構(gòu)還處于分散經(jīng)營、各自出版的狀態(tài),會議資源難以集中獲取。引入眾包就是為會議資源集中式開放出版創(chuàng)造條件,圖書館一方面借助活動宣傳提高出版方對會議資源的關(guān)注度,另一方面聚集出版商、學(xué)協(xié)會等機(jī)構(gòu)形成會議資源開放出版聯(lián)盟,統(tǒng)一規(guī)劃會議資源開放出版的流程和保障機(jī)制,使會議資源得到集中、有序出版,進(jìn)而保障資源的質(zhì)量與版權(quán)問題。
3.3.4 資源維護(hù)
會議資源開發(fā)重視資源的采集、加工、出版,卻容易忽視資源維護(hù)工作的重要性,同時(shí),數(shù)字資源的飛速膨脹也給會議資源的穩(wěn)定存儲帶來不小的挑戰(zhàn),如果不能實(shí)現(xiàn)資源的有效保存,將會使會議資源陷入“藏而無用”的尷尬境地。圖書館應(yīng)該利用眾包廣泛召集用戶搜集、追蹤會議動態(tài)信息,從公眾的視角挖掘會議資源中的潛在價(jià)值,通過補(bǔ)充會議資料、處理失效鏈接、解決版權(quán)糾紛等途徑實(shí)現(xiàn)會議資源的維護(hù)與更新,降低網(wǎng)絡(luò)、技術(shù)和人為因素對會議資源數(shù)據(jù)庫的干擾,確保館藏資源在任何環(huán)境下都具有長期可用性,能為會議資源的循環(huán)建設(shè)提供新的發(fā)展動力。
眾包方案是開展眾包活動的基礎(chǔ),但是方案的具體實(shí)現(xiàn)還得靠眾包平臺來完成,可以說,構(gòu)建眾包平臺是眾包方案的核心。從平臺的應(yīng)用場景來看,會議資源眾包平臺不僅要支持資源采編、流典等常規(guī)的資源服務(wù)項(xiàng)目,更重要的是支持眾包任務(wù)的交互、流通和管理項(xiàng)目。因此平臺的設(shè)計(jì)要兼顧圖書館的傳統(tǒng)服務(wù)需求和眾包的個(gè)性化需求,同時(shí)根據(jù)眾包進(jìn)展靈活調(diào)整。傳統(tǒng)的單體應(yīng)用架構(gòu)開發(fā)周期長、維護(hù)成本高,模塊僵化等因素都會嚴(yán)重阻礙眾包的執(zhí)行,而微服務(wù)架構(gòu)采用高內(nèi)聚、低耦合的組件化開發(fā)方案,不僅能降低系統(tǒng)開發(fā)和維護(hù)的難度,還能有效提升系統(tǒng)的性能。將微服務(wù)架構(gòu)應(yīng)用于圖書館會議資源眾包平臺設(shè)計(jì),把原本固化的業(yè)務(wù)系統(tǒng)打散成多個(gè)開放、靈活的微服務(wù)模塊,就可以更好地應(yīng)對眾包不斷變化的場景需求。
基于微服務(wù)架構(gòu)的圖書館會議資源眾包式設(shè)計(jì)契合第三代圖書館“以用戶服務(wù)為中心”的發(fā)展理念,遵循開放、兼容、協(xié)同、靈活、自主的設(shè)計(jì)原則,目標(biāo)是建立集眾包業(yè)務(wù)管理和眾包用戶服務(wù)于一體的圖書館微服務(wù)平臺。
平臺采用前后端分離的開發(fā)模式,前端負(fù)責(zé)界面呈現(xiàn)與用戶交互,后端負(fù)責(zé)業(yè)務(wù)邏輯和數(shù)據(jù)存儲,總體設(shè)計(jì)參考FOLIO架構(gòu)[25],由系統(tǒng)層、網(wǎng)關(guān)層、應(yīng)用層、界面層構(gòu)成,整體架構(gòu)見圖3。
圖3 基于微服務(wù)的圖書館會議資源眾包平臺架構(gòu)
(1)系統(tǒng)層:負(fù)責(zé)數(shù)據(jù)存儲、索引、日志和配置管理。底層數(shù)據(jù)包括資源數(shù)據(jù)(圖書、期刊、圖片、音視頻等)、用戶數(shù)據(jù)(名稱、身份、聯(lián)系方式等)、日志數(shù)據(jù)(用戶訪問、操作、接口數(shù)據(jù)等)、業(yè)務(wù)數(shù)據(jù)(采集、編目、流通、典藏等)和統(tǒng)計(jì)數(shù)據(jù),數(shù)據(jù)存儲統(tǒng)一采用MySQL(事務(wù)型數(shù)據(jù)庫)和MongoDB(元數(shù)據(jù)庫)。
(2)網(wǎng)關(guān)層:OKAPI核心網(wǎng)關(guān),提供代理服務(wù)、發(fā)現(xiàn)服務(wù)和部署服務(wù)[26],主要職責(zé)為身份驗(yàn)證、負(fù)載均衡、日志監(jiān)控等。具體而言,獲取模塊、租戶、接口信息,并完成注冊;在平臺接收到服務(wù)請求后,根據(jù)服務(wù)內(nèi)容調(diào)用相應(yīng)模塊對應(yīng)的接口,然后將接口響應(yīng)信息返回給服務(wù)請求方。
(3)應(yīng)用層:針對眾包需求建立的微服務(wù),各個(gè)模塊之間相互獨(dú)立,允許使用不同的編程語言開發(fā),開發(fā)完成后將統(tǒng)一注冊到OKAPI網(wǎng)關(guān)。在不同的眾包階段,依靠OKAPI網(wǎng)關(guān)根據(jù)任務(wù)場景實(shí)現(xiàn)應(yīng)用模塊的靈活調(diào)用和配置,搭建出能同時(shí)滿足任務(wù)共性需求和個(gè)性需求的系統(tǒng)環(huán)境。也可以根據(jù)任務(wù)的執(zhí)行情況隨時(shí)開發(fā)新的功能模塊,對原有模塊進(jìn)行二次開發(fā)或接入第三方應(yīng)用,使平臺服務(wù)功能始終能夠滿足項(xiàng)目的發(fā)展。
(4)界面層:將應(yīng)用層模塊封裝成面向不同類型用戶的訪問界面?;贐/S架構(gòu)的平臺允許多種身份用戶的接入,通過請求OKAPI網(wǎng)關(guān)實(shí)現(xiàn)平臺應(yīng)用的調(diào)度,協(xié)助用戶完成系統(tǒng)操作。
平臺強(qiáng)調(diào)服務(wù)功能與用戶需求間的契合,以解決會議資源建設(shè)問題為導(dǎo)向,協(xié)助眾包方完成會議資源的收集、加工、整合,形成規(guī)范化的會議資源庫,為圖書館會議資源服務(wù)提供幫助。系統(tǒng)功能應(yīng)該包含但不局限于用戶管理、資源開發(fā)、任務(wù)交互、消息流通、參考咨詢、數(shù)據(jù)分析,第三方機(jī)構(gòu)或個(gè)人可以根據(jù)設(shè)計(jì)規(guī)范接入已有應(yīng)用,由平臺根據(jù)用戶需求和項(xiàng)目進(jìn)展隨時(shí)調(diào)整布局。
(1)用戶管理。提供訪問登錄入口,用戶只需經(jīng)過身份認(rèn)證,系統(tǒng)就會為其分配相應(yīng)的操作界面和使用權(quán)限,該模塊通常與圖書館統(tǒng)一身份認(rèn)證系統(tǒng)對接。用戶管理模塊記錄用戶的基本信息、聯(lián)系方式和項(xiàng)目參與情況,允許接包方按規(guī)定編輯、修改個(gè)人信息,方便管理人員進(jìn)行統(tǒng)計(jì)和查詢。
(2)資源開發(fā)。負(fù)責(zé)資源采、編、流、典。支持紙、電、多媒體資源的上載,提供接口與第三方數(shù)據(jù)庫實(shí)現(xiàn)資源同步。通過模塊間協(xié)作完成多源異構(gòu)資源的格式轉(zhuǎn)換、內(nèi)容標(biāo)注和數(shù)據(jù)關(guān)聯(lián)等操作,將結(jié)果同步存儲到圖書館已有系統(tǒng),保持眾包平臺與其他平臺的數(shù)據(jù)一致性,實(shí)現(xiàn)資源的互聯(lián)互通。
(3)任務(wù)交互。具體包含任務(wù)發(fā)布、任務(wù)申請、任務(wù)檢索、任務(wù)推送、任務(wù)評價(jià)等功能。以任務(wù)列表的形式發(fā)布眾包任務(wù),列表按照時(shí)間順序排列顯示,用戶可以自由瀏覽并選擇申請;允許用戶以會議名稱、學(xué)科領(lǐng)域、資源類型、任務(wù)性質(zhì)、發(fā)布時(shí)間為關(guān)鍵詞進(jìn)行任務(wù)檢索,幫助用戶直接查找感興趣的任務(wù);根據(jù)用戶注冊信息和歷史數(shù)據(jù)為用戶推薦與其興趣、專業(yè)相符的任務(wù),提高任務(wù)與用戶的匹配度;系統(tǒng)展示任務(wù)結(jié)果,供用戶查看下載或?qū)?nèi)容進(jìn)行評價(jià)標(biāo)注。
(4)消息流通。集中接收和處理系統(tǒng)消息,包括任務(wù)通知、到期提醒、社群消息、好友申請等。
(5)參考咨詢。設(shè)置留言板或使用聊天工具為用戶提供咨詢服務(wù),幫助解決眾包過程中遇到的各種問題,提升工作的效率。建立用戶社區(qū),將眾包用戶組織在一起形成橫向的合作模式,針對眾包中非專業(yè)性、難度較低的基礎(chǔ)性問題,通過用戶間的討論相互解答,用戶對情報(bào)獲取和社交的需求也可以在社區(qū)互動中得到滿足。
(6)數(shù)據(jù)分析。數(shù)據(jù)分析是在實(shí)現(xiàn)基礎(chǔ)功能之上,對微服務(wù)平臺功能的拓展。該模塊基于數(shù)據(jù)挖掘和智能分析,深入挖掘日志數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、用戶數(shù)據(jù)中潛在的價(jià)值,根據(jù)管理與服務(wù)需求定期生成各類統(tǒng)計(jì)報(bào)表和分析報(bào)告,為眾包方案決策和效用評估提供數(shù)據(jù)支持。
4.3.1 用戶界面呈現(xiàn)
采用React和Ant Design框架實(shí)現(xiàn)界面呈現(xiàn)和用戶交互。React起源于Facebook公司的內(nèi)部項(xiàng)目,已經(jīng)由最初的前端Javascript MVC開發(fā)框架發(fā)展成適用于前后端開發(fā)的Web App方案,React最大的優(yōu)點(diǎn)在于能夠以組件化的方式快速搭建前端頁面,當(dāng)數(shù)據(jù)更新時(shí)自動渲染界面。Ant Design是螞蟻金服開發(fā)的一套基于React的UI庫,提供模塊化的設(shè)計(jì)原則及代碼解決方案,可以讓設(shè)計(jì)者專注于UI設(shè)計(jì),滿足多終端用戶的需求。
4.3.2 統(tǒng)一身份認(rèn)證
平臺采用CAS(Central Authentication Service,中央認(rèn)證服務(wù))協(xié)議來實(shí)現(xiàn)用戶信息驗(yàn)證和單點(diǎn)登錄。CAS是美國耶魯大學(xué)研發(fā)的一個(gè)單點(diǎn)登錄項(xiàng)目,結(jié)構(gòu)上包含兩個(gè)部分:CAS Client客戶端和CAS Server服務(wù)器端。當(dāng)用戶通過登錄頁面提交登錄申請時(shí),客戶端會將接收到的HTTP請求與Service Ticket中的信息進(jìn)行比對,若未找到相關(guān)信息則說明該用戶是第一次登錄,然后客戶端就會將用戶請求以及訪問地址轉(zhuǎn)到服務(wù)器端進(jìn)行用戶認(rèn)證,認(rèn)證成功后用戶就可以進(jìn)入系統(tǒng)。
4.3.3 元數(shù)據(jù)管理
眾包平臺遵循微服務(wù)架構(gòu)數(shù)據(jù)管理的域敏感[27],每項(xiàng)應(yīng)用對其租戶建立單獨(dú)的業(yè)務(wù)域(如采集域、編目域、流通域)進(jìn)行數(shù)據(jù)存儲,業(yè)務(wù)域之間依靠Codex方案進(jìn)行鏈接與整合。Codex是FOLIO定義的一個(gè)標(biāo)準(zhǔn)的虛擬化元數(shù)據(jù)模型,它參考BIBFRAME2模型和DC元素形成了一套最小元素集來描述不同域、不同種類的資源,每個(gè)域可擁有自己的元數(shù)據(jù)方案而不需要與其他域保持一致,只需要與作為數(shù)據(jù)注冊中心和數(shù)據(jù)鏈接中介的Codex進(jìn)行交互,就可以消除不同編碼、不同格式和不同存儲位置數(shù)據(jù)間的隔閡,實(shí)現(xiàn)元數(shù)據(jù)集成和資源統(tǒng)一檢索。
4.3.4 微服務(wù)部署
Docker技術(shù)是一個(gè)開源的虛擬化引擎,它通過資源隔離將應(yīng)用、依賴以及一切環(huán)境配置打包在一起,為其創(chuàng)建可移植、輕量級的容器。基于Docker技術(shù)的微服務(wù)部署方式就是將服務(wù)打包成容器的鏡像,實(shí)現(xiàn)虛擬化,然后將服務(wù)實(shí)例部署在容器中,方便隨時(shí)取用。開發(fā)者利用Docker構(gòu)建好應(yīng)用鏡像后,可以在其他環(huán)境中使用相同的鏡像,不需要重復(fù)配置,實(shí)現(xiàn)“一次封裝隨處運(yùn)行”。利用Docker技術(shù)可以解決微服務(wù)細(xì)粒度、多進(jìn)程所導(dǎo)致的應(yīng)用部署難的問題,實(shí)現(xiàn)系統(tǒng)的靈活部署和持續(xù)交付。
4.3.5 服務(wù)間通信
OKAPI網(wǎng)關(guān)層設(shè)計(jì)使用Vert.x框架,官方對它的定義是基于事件驅(qū)動的異步非阻塞的網(wǎng)絡(luò)框架,支持多種編程語言,如Java、JavaScript、Python等。Vert.x可以用很少的內(nèi)核線程來處理大量的并發(fā)事件,多線程無阻塞的特點(diǎn)能夠保證OKAPI網(wǎng)關(guān)具有高性能。微服務(wù)以RESTful API實(shí)現(xiàn)網(wǎng)絡(luò)通信。RESTful API是基于REST(REpresentational State Transfer)的數(shù)據(jù)訪問接口設(shè)計(jì),REST是Web服務(wù)的一種架構(gòu)風(fēng)格,支持HTTP、TCP/IP等廣泛流行的標(biāo)準(zhǔn)和協(xié)議,當(dāng)客戶端發(fā)出請求時(shí),RESTful API通過調(diào)用接口向服務(wù)端發(fā)起HTTP數(shù)據(jù)請求,服務(wù)端響應(yīng)請求并把處理結(jié)果反饋給客戶端,從而形成輕量級、跨平臺的通信機(jī)制。
總之,隨著用戶訴求和應(yīng)用場景的增加,圖書館構(gòu)建開放平臺的趨勢已經(jīng)十分明顯。CALIS在2017年啟動了基于FOLIO微服務(wù)架構(gòu)的下一代圖書館服務(wù)平臺CLSP建設(shè)項(xiàng)目,目前已經(jīng)建成CALIS公共服務(wù)平臺、SaaS服務(wù)平臺和基礎(chǔ)支撐平臺三大應(yīng)用系統(tǒng),取得了良好的效果。上海市圖書館行業(yè)協(xié)會也積極開展FOLIO項(xiàng)目的研究,并將其應(yīng)用于上海圖書館服務(wù)平臺建設(shè),成功實(shí)現(xiàn)上海圖書館服務(wù)平臺向開放平臺的過渡,同時(shí)加速了圖書館應(yīng)用生態(tài)建設(shè)的進(jìn)程。雖然FOLIO項(xiàng)目沒有明確地提出要把眾包模式運(yùn)用到資源建設(shè)中,但是它的核心思想——協(xié)同建設(shè)與眾包的理念幾乎是一脈相承,因此,在設(shè)計(jì)會議資源眾包平臺的技術(shù)架構(gòu)、運(yùn)作模式等問題上,這些圖書館平臺的開發(fā)經(jīng)驗(yàn)同樣具有參考價(jià)值。
圖書館正值服務(wù)轉(zhuǎn)型的關(guān)鍵期,隨著資源建設(shè)的深入,協(xié)同共建的發(fā)展思路會變得愈發(fā)清晰,資源眾包實(shí)為大勢所趨。眾包平臺是圍繞眾包任務(wù)建立的獨(dú)立系統(tǒng),也是對圖書館服務(wù)平臺業(yè)務(wù)形式的重要補(bǔ)充,除了簡單地支持眾包活動之外,還應(yīng)該順應(yīng)下一代圖書館構(gòu)建開放平臺的發(fā)展趨勢,向開放性更強(qiáng)、包容度更高的層次邁進(jìn)。本文從理論層面為圖書館會議資源眾包規(guī)劃了一條實(shí)施路徑,對基于微服務(wù)架構(gòu)的會議資源眾包平臺進(jìn)行了大膽設(shè)想,但是與成熟的眾包方案相比,本研究方案的可行性和有效性還有待驗(yàn)證,平臺建設(shè)具體該如何進(jìn)行以及如何與其他業(yè)務(wù)系統(tǒng)相融合等問題還需要在今后的研究中進(jìn)一步細(xì)化落實(shí)。