張喆昱,張 磊
圖書館、美術(shù)館、博物館、檔案館等作為傳承人類文化遺產(chǎn)的記憶機(jī)構(gòu)(以下簡稱“記憶機(jī)構(gòu)”),致力于收集、保存和管理人文科學(xué)資料,為大眾提供知識(shí)服務(wù)。在互聯(lián)網(wǎng)和數(shù)字化浪潮下,記憶機(jī)構(gòu)紛紛將實(shí)體資料數(shù)字化、加工整理,組織成可用程度不一的網(wǎng)絡(luò)數(shù)據(jù)資源,最終開放為社會(huì)所用。伴隨“數(shù)據(jù)驅(qū)動(dòng)”新興研究范式到來,人們對記憶機(jī)構(gòu)數(shù)字資源的共享和利用的期望急劇攀升,導(dǎo)致記憶機(jī)構(gòu)傳統(tǒng)的資源分享模式與社會(huì)需求之間的鴻溝日趨加大。記憶機(jī)構(gòu)在新形勢下的數(shù)字化服務(wù)轉(zhuǎn)型勢在必行。
在社會(huì)需求和技術(shù)推動(dòng)雙重作用下,國內(nèi)外記憶機(jī)構(gòu)開展了積極探索,推出開放數(shù)據(jù)服務(wù),挖掘人文資料的潛在價(jià)值,促進(jìn)文化創(chuàng)新。記憶機(jī)構(gòu)的社會(huì)定位也在悄然改變,從資源持有者轉(zhuǎn)向創(chuàng)新的使能者。隨之而來的挑戰(zhàn)包括數(shù)字化時(shí)代記憶機(jī)構(gòu)的定位、記憶機(jī)構(gòu)如何利用人類文化知識(shí)寶藏支持?jǐn)?shù)據(jù)驅(qū)動(dòng)的創(chuàng)新活動(dòng)、如何實(shí)現(xiàn)記憶機(jī)構(gòu)的數(shù)字化服務(wù)轉(zhuǎn)型等。本文在總結(jié)國內(nèi)外記憶機(jī)構(gòu)人文開放數(shù)據(jù)建設(shè)實(shí)踐的基礎(chǔ)上,嘗試以開放數(shù)據(jù)內(nèi)容深度、開放數(shù)據(jù)內(nèi)容廣度、開放數(shù)據(jù)的利用3個(gè)分面對國內(nèi)外記憶機(jī)構(gòu)的開放數(shù)據(jù)建設(shè)及使用情況進(jìn)行梳理,為我國記憶機(jī)構(gòu)的數(shù)字化服務(wù)轉(zhuǎn)型提出建議。
在信息通信技術(shù)支持下,記憶機(jī)構(gòu)可以在傳統(tǒng)的基于物理介質(zhì)文獻(xiàn)的人類文化遺產(chǎn)保藏和運(yùn)用方面,借助數(shù)字化手段,提升服務(wù)能力。通過資源的數(shù)字化建設(shè)、數(shù)據(jù)的開放共享,記憶機(jī)構(gòu)不僅可以在更大范圍內(nèi)更全面地傳播藏品資源、挖掘資源價(jià)值、提升服務(wù)水平,更能在文化創(chuàng)新活動(dòng)中起到積極作用。近年國內(nèi)外記憶機(jī)構(gòu)紛紛將推進(jìn)開放數(shù)據(jù)建設(shè)作為發(fā)展方向,采用關(guān)聯(lián)數(shù)據(jù)技術(shù)促進(jìn)記憶機(jī)構(gòu)中結(jié)構(gòu)化與語義化數(shù)據(jù)的建設(shè)和再利用[1]。雖然圖書館、博物館、美術(shù)館和檔案館記憶人類文明的宗旨相同,但鑒于服務(wù)目的的差異和組織機(jī)構(gòu)的分離,本文將按形態(tài)歸類,總結(jié)國內(nèi)外記憶機(jī)構(gòu)的開放數(shù)據(jù)建設(shè)實(shí)踐。
傳統(tǒng)圖書館肩負(fù)著搜集、整理、收藏文獻(xiàn)資料,開發(fā)信息資源,進(jìn)而為民眾服務(wù)的職能。其特點(diǎn)在于藏品是經(jīng)過文獻(xiàn)作者的凝練、圖書管理人員加工整理后的權(quán)威信息。新形勢下,各國圖書館不同程度地開展了開放數(shù)據(jù)探索。
歐洲圖書館的開放數(shù)據(jù)探索非?;钴S。德國數(shù)字圖書館(Deutsche Digitale Bibliothek,DDB)2013年向公眾發(fā)布API(應(yīng)用編程接口)[2],提供基于關(guān)聯(lián)技術(shù)的德國文化和科技數(shù)字資源的開放數(shù)據(jù)服務(wù),促進(jìn)了數(shù)據(jù)創(chuàng)新[3]。從2014年起,德國數(shù)字圖書館聯(lián)合其他機(jī)構(gòu),每年共同舉辦“達(dá)芬奇編碼”競賽活動(dòng),以開放數(shù)據(jù)形式為大眾提供元數(shù)據(jù)、圖像、音頻、視頻、3D模型,不僅揭示了這些文化機(jī)構(gòu)數(shù)據(jù)的潛在價(jià)值,且進(jìn)一步促進(jìn)了開發(fā)者、游戲玩家、設(shè)計(jì)師與各文化機(jī)構(gòu)之間的交流,競賽結(jié)束后不少獲獎(jiǎng)項(xiàng)目跟專業(yè)機(jī)構(gòu)開展了進(jìn)一步的合作[4]。英國大英圖書館建設(shè)了多個(gè)開放數(shù)據(jù)平臺(tái)[5],其中2016 年推出的data.bl.uk公開了74個(gè)數(shù)據(jù)集[6],除提供JPEG、PDF等部分?jǐn)?shù)字化館藏外,還提供結(jié)構(gòu)化的機(jī)讀格式信息,甚至以關(guān)聯(lián)數(shù)據(jù)方式組織和發(fā)布所有書目數(shù)據(jù)BNB(British National Bibliography)[7],以研討會(huì)、數(shù)據(jù)利用大賽等方式推廣開放數(shù)據(jù),開設(shè)British Library Lab,鼓勵(lì)公眾參與研究[8]。
在北美地區(qū),美國國會(huì)圖書館(Library of Congress,LC)2009 年起致力于將主題詞表(LCSH)、名稱規(guī)范檔(LCA)、圖書分類法(LCC)等規(guī)范性文件以關(guān)聯(lián)數(shù)據(jù)方式開放,提供API 訪問和批量下載,幫助開展自動(dòng)化的關(guān)聯(lián)和推理[9]。美國數(shù)字公共圖書館(Digital Public Library of America,DPLA)提供所有DPLA 記錄的批量下載,這些數(shù)據(jù)可以通過API 用于關(guān)聯(lián)應(yīng)用開發(fā)[10]。加拿大多倫多公共圖書館發(fā)布了開放數(shù)據(jù)政策及使用條款,公布了涉及書目、網(wǎng)站搜索、持證讀者、流通等方面的30多個(gè)開放數(shù)據(jù)集[11]。
在亞太地區(qū),作為新西蘭開放獲取許可框架和開放政府信息、數(shù)據(jù)再利用計(jì)劃的一員,新西蘭國家圖書館制訂《開放數(shù)據(jù)計(jì)劃》[12],開放出版物、論文、報(bào)刊索引等的元數(shù)據(jù)以供下載,DigitalNZ API整合150多個(gè)組織的元數(shù)據(jù)用于應(yīng)用集成,鼓勵(lì)對這些數(shù)據(jù)進(jìn)行深度分析或開發(fā)[13]。韓國國家圖書館發(fā)布國家書目的關(guān)聯(lián)開放數(shù)據(jù)(LOD)網(wǎng)站,涵蓋書目、主題、作者等方面的信息,為關(guān)聯(lián)和融合其館藏及網(wǎng)絡(luò)數(shù)據(jù)帶開了方便之門[14]。
在我國,上海圖書館從館藏特色資源——家譜開始,建設(shè)了集人、地、時(shí)、事、物、文獻(xiàn)為一體的人文數(shù)據(jù)基礎(chǔ)設(shè)施[15],以關(guān)聯(lián)數(shù)據(jù)形式提供數(shù)據(jù)服務(wù)。在此基礎(chǔ)上,連續(xù)4年舉辦開放數(shù)據(jù)應(yīng)用開發(fā)競賽,數(shù)據(jù)種類和開放數(shù)量也從首屆5萬種家譜元數(shù)據(jù)發(fā)展到第二屆新增開放24萬種名人手稿檔案元數(shù)據(jù)[16],2019年更與國內(nèi)外6家單位聯(lián)合推出涉及家譜、名人、建筑、紅色文獻(xiàn)、電影、詩詞、民國書刊、藏印等多類型歷史人文內(nèi)容的數(shù)據(jù)數(shù)千萬條,開放數(shù)據(jù)競賽為數(shù)據(jù)合作單位、歷史人文愛好者和數(shù)據(jù)創(chuàng)客提供了良好的學(xué)習(xí)交流平臺(tái),各方共同挖掘歷史人文數(shù)據(jù)背后的應(yīng)用潛力,豐富了數(shù)據(jù)資源利用手段,在國內(nèi)記憶機(jī)構(gòu)開放數(shù)據(jù)應(yīng)用中起到了引領(lǐng)作用。
博物館美術(shù)館收藏具有代表性的人類文化遺產(chǎn),供來訪者觀賞和研究。其特點(diǎn)是歷史性強(qiáng),藏品稀有度高。為讓世界各地的使用者體驗(yàn)特定的歷史文化特色,對特定類別的文物展開全方位研究,國內(nèi)外博物館美術(shù)館在藏品元數(shù)據(jù)、藏品的數(shù)字化對象等多個(gè)層次開展了開放關(guān)聯(lián)數(shù)據(jù)探索,其中以美國洛杉磯Getty博物館、大英博物館最全面。
美國洛杉磯Getty博物館免費(fèi)提供自有版權(quán)藏品及10萬余張無版權(quán)對象的高清數(shù)字圖像下載,這些豐富的數(shù)字化資源反映了Getty研究院和Getty博物館的數(shù)千件藏品,內(nèi)容范圍還在不斷擴(kuò)大[17]。Getty敘詞表關(guān)聯(lián)數(shù)據(jù)包含藝術(shù)、建筑、裝飾藝術(shù)、檔案、書目材料等領(lǐng)域的結(jié)構(gòu)化術(shù)語,為編目員和數(shù)據(jù)加工者提供了權(quán)威規(guī)范,為數(shù)字藝術(shù)史研究和發(fā)現(xiàn)提供了強(qiáng)大的渠道,促進(jìn)了博物館數(shù)據(jù)與網(wǎng)絡(luò)資源的結(jié)合[18]。
大英博物館開放了藏品的數(shù)字化檔案、高清圖像供下載。作為關(guān)聯(lián)數(shù)據(jù)建設(shè)的先驅(qū),2011年大英博物館就基于館藏目錄創(chuàng)建了關(guān)聯(lián)數(shù)據(jù)項(xiàng)目ResarchSpace[19]。
在藏品數(shù)字化服務(wù)方面,洛杉磯郡立美術(shù)館開放了2萬份高清圖像資料,只要注明出處便可無限制使用[20]。2017年起,美國大都會(huì)博物館將無版權(quán)藏品的高清圖像開放給公眾免費(fèi)使用[21]。荷蘭國立博物館[21-22]和芬蘭國家美術(shù)館[23]更勝一籌,不僅提供藏品的高清數(shù)字化圖像供大眾下載,還提供有關(guān)藝術(shù)品及藝術(shù)家數(shù)據(jù)的API,鼓勵(lì)人們進(jìn)行資源整合、應(yīng)用程序創(chuàng)新和藝術(shù)品的衍生創(chuàng)作。
亞洲具有代表性的關(guān)聯(lián)開放數(shù)據(jù)應(yīng)用當(dāng)屬日本關(guān)聯(lián)開放數(shù)據(jù)學(xué)術(shù)博物館。該館以關(guān)聯(lián)數(shù)據(jù)技術(shù)整合全國博物館、館藏文物、作者、設(shè)施等元數(shù)據(jù)記錄,供大眾進(jìn)行SPARQL查詢,有利于與事件數(shù)據(jù)、GIS數(shù)據(jù)、日本DBpedia、物種數(shù)據(jù)等數(shù)據(jù)資源的整合[24]。
檔案館記錄了特定歷史人物或事件的事實(shí)性信息,往往具有原始記錄性。在檔案領(lǐng)域推進(jìn)開放數(shù)據(jù)活動(dòng)有利于公眾了解或核實(shí)某些事實(shí)。開放數(shù)據(jù)應(yīng)用較全面的有英美兩國的國家檔案館。英國國家檔案館整合2,500 多家檔案機(jī)構(gòu)的3,200 萬份記錄,公開了API Discovery,向社會(huì)提供數(shù)字化服務(wù),形成全面的歷史人文記錄數(shù)字化資源[25-26]。美國國家檔案館提供以聯(lián)邦法規(guī)編碼規(guī)范檔和總統(tǒng)公共文件為代表的大批數(shù)據(jù)集、以國家檔案目錄API為代表的訪問接口,以及眾包工具Transcribr[27],促進(jìn)了大眾對檔案數(shù)據(jù)的創(chuàng)新應(yīng)用。新西蘭檔案館2005年起成為政府開放數(shù)據(jù)運(yùn)動(dòng)的重要伙伴,開放了包括公共服務(wù)、歷史文化在內(nèi)的4個(gè)數(shù)據(jù)集,提供API訪問或直接下載,供大眾二次開發(fā)利用[28]。德國聯(lián)邦檔案館在維基百科網(wǎng)站投放了幾千份德國歷史照片[20]。
在資源協(xié)作方面,英國博物館、圖書館和檔案館理事會(huì)(Museums,Libraries and Archives Council,MLA)和加拿大國家圖書檔案館(Library and Archives Canada,LAC)[29]等做出了表率。澳大利亞昆士蘭州立圖書館將近3萬名士兵一戰(zhàn)前拍攝的照片數(shù)字化,作為開放數(shù)據(jù)集發(fā)布在政府網(wǎng)站,同時(shí)與澳大利亞檔案館合作,通過國家檔案館API,將這些士兵肖像與國家檔案館的個(gè)人檔案進(jìn)行匹配[12]。另一個(gè)著名的記憶機(jī)構(gòu)開放數(shù)據(jù)建設(shè)協(xié)作是始于2008 年的Europeana,它整合歐盟數(shù)十個(gè)國家不同類型記憶機(jī)構(gòu)的書籍、繪畫、音樂、檔案、電影等數(shù)據(jù)資料,向全球提供免費(fèi)的數(shù)字資源獲取平臺(tái),在跨機(jī)構(gòu)、跨領(lǐng)域文化資源融合中取得了良好效果;2012年建設(shè)關(guān)聯(lián)開放數(shù)據(jù),提供批量下載、API、SPARQL 查詢等服務(wù),Europeana Lab網(wǎng)站為促進(jìn)文化遺產(chǎn)創(chuàng)新和創(chuàng)造提供了良好的平臺(tái)[30-32]。
整體而言,記憶機(jī)構(gòu)的開放數(shù)據(jù)建設(shè)具有3個(gè)特點(diǎn):(1)國外記憶機(jī)構(gòu)的開放數(shù)據(jù)建設(shè)和數(shù)字化服務(wù)實(shí)踐較豐富,尤以世界級頂尖圖書館和博物館的探索更突出,數(shù)字化內(nèi)容開放程度高,開放比例也大[20]。(2)開放數(shù)據(jù)項(xiàng)目集中在歐美,亞洲地區(qū)日韓的開放數(shù)據(jù)建設(shè)較先進(jìn)[18]。(3)我國記憶機(jī)構(gòu)的開放數(shù)據(jù)整體水平不高,從事開放數(shù)據(jù)探索的機(jī)構(gòu)不多,開放數(shù)據(jù)數(shù)量少,級別較低。比如,國內(nèi)博物館藏品的數(shù)字化資源呈封閉狀態(tài)[20]。盡管國內(nèi)早有基于關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)記憶機(jī)構(gòu)數(shù)字資源整合的研究,但鮮有不同類別的記憶機(jī)構(gòu)聯(lián)合開展開放數(shù)據(jù)建設(shè)和聯(lián)合提供數(shù)字化服務(wù)的成果[28]。
國內(nèi)外記憶機(jī)構(gòu)的開放數(shù)據(jù)建設(shè)特征,可從開放數(shù)據(jù)內(nèi)容深度、內(nèi)容廣度及利用形式3個(gè)分面進(jìn)行梳理,見表1。
表1 國內(nèi)外開放數(shù)據(jù)建設(shè)特點(diǎn)
開放數(shù)據(jù)的深度按照Tim Berners Lee 提出的開放數(shù)據(jù)五星評價(jià)體系[33]劃分。第一級對應(yīng)五星評價(jià)體系的四五星,其特征在于以RDF數(shù)據(jù)模型存儲(chǔ)數(shù)據(jù),利用URI命名數(shù)據(jù)實(shí)體,使數(shù)據(jù)之間互相關(guān)聯(lián)。第二級對應(yīng)五星評價(jià)體系的二三星,以結(jié)構(gòu)化數(shù)據(jù)或非專有格式提供開放。第三級對應(yīng)五星評價(jià)體系的一星,數(shù)據(jù)可在互聯(lián)網(wǎng)上訪問。這樣分級的意義在于,具備第一級特征的開放數(shù)據(jù)可以支持自動(dòng)化的關(guān)聯(lián)和推理,更適合專題研究者和跨領(lǐng)域研究者開展深入或跨界的高水平研究;第二級開放數(shù)據(jù)滿足人們對精準(zhǔn)獲取數(shù)據(jù)和訪問廣泛數(shù)據(jù)資源的需求,更利于大眾創(chuàng)新應(yīng)用;第三級標(biāo)準(zhǔn)降低了開放數(shù)據(jù)的利用門檻,更加激發(fā)公眾對人文藝術(shù)的創(chuàng)意。
從開放數(shù)據(jù)的廣度來說,完整藏品、多種類別數(shù)據(jù)的完全開放最為理想??墒?,一些常見的約束條件,如知識(shí)產(chǎn)權(quán)、法律法規(guī)、社會(huì)影響等使得開放數(shù)據(jù)的廣度呈現(xiàn)多樣化特征。此外,數(shù)字化制作、加工和維護(hù)成本也是一個(gè)不容忽視的要素。
開放數(shù)據(jù)的利用程度是一個(gè)常被忽視但對記憶機(jī)構(gòu)職能轉(zhuǎn)型意義深遠(yuǎn)的一個(gè)維度。與記憶機(jī)構(gòu)傳統(tǒng)職能定位相吻合,以關(guān)聯(lián)數(shù)據(jù)形式開放的規(guī)范檔會(huì)幫助記憶機(jī)構(gòu)更好地揭示藏品內(nèi)容,編織數(shù)字化資源的知識(shí)網(wǎng)絡(luò)。但開放數(shù)據(jù)的爆炸式增長和記憶機(jī)構(gòu)專業(yè)人手不足的矛盾也會(huì)激發(fā)一些新的數(shù)據(jù)建設(shè)和數(shù)字化服務(wù)形態(tài)的出現(xiàn)。例如,利用眾包方式開展數(shù)字化藏品的信息補(bǔ)全可以成功地將記憶機(jī)構(gòu)的數(shù)字化服務(wù)對象(開放數(shù)據(jù)的消費(fèi)者)轉(zhuǎn)變?yōu)殚_放數(shù)據(jù)的建設(shè)者。這將引發(fā)記憶機(jī)構(gòu)原有組織關(guān)系的調(diào)整。此外,帶有地域特征、表現(xiàn)風(fēng)格和文化底蘊(yùn)的文創(chuàng)設(shè)計(jì)也將促使記憶機(jī)構(gòu)人類文化保藏者的社會(huì)定位發(fā)生改變。
依據(jù)上述分面的多類特征審視國內(nèi)外開放數(shù)據(jù)實(shí)踐,可勾勒出我國記憶機(jī)構(gòu)的數(shù)字化服務(wù)轉(zhuǎn)型模式。
(1)根據(jù)各機(jī)構(gòu)的能力、預(yù)期受眾和愿景探索獨(dú)特的數(shù)字化服務(wù)模式。記憶機(jī)構(gòu)定位的不同,藏品內(nèi)容、級別和豐度的差異意味著我們不能限定于唯一一種記憶機(jī)構(gòu)的數(shù)字化服務(wù)模式,而應(yīng)根據(jù)各機(jī)構(gòu)的能力、預(yù)期受眾和愿景探索獨(dú)特的數(shù)字化服務(wù)模式。即便是跨機(jī)構(gòu)、跨領(lǐng)域的開放數(shù)據(jù)協(xié)作,也應(yīng)根據(jù)預(yù)期受眾形成有針對性的數(shù)字化服務(wù)模式。
以上海圖書館(以下簡稱“上圖”)為例,該館一直致力于推動(dòng)歷史人文數(shù)據(jù)的開放利用,倡導(dǎo)多源數(shù)據(jù)融合。一年一度的上圖開放數(shù)據(jù)應(yīng)用開發(fā)競賽為各數(shù)據(jù)合作單位、歷史人文愛好者和數(shù)據(jù)創(chuàng)客提供了良好的學(xué)習(xí)交流平臺(tái),通過競賽宣傳推廣了上圖和各家數(shù)據(jù)合作機(jī)構(gòu)的開放數(shù)據(jù)資源,以豐富的數(shù)據(jù)內(nèi)容、種類和數(shù)量催生高附加值的數(shù)據(jù)應(yīng)用和服務(wù)。在上圖歷年開放數(shù)據(jù)競賽中,達(dá)到第一級開放內(nèi)容深度,廣泛關(guān)聯(lián)多種數(shù)據(jù)源,富有創(chuàng)意的數(shù)據(jù)利用作品盡管占有一定比例,但在與參賽者的溝通過程中,對各類文獻(xiàn)資料原文掃描圖像的需求占比更大??梢?,低端的開放深度(第三級)和極大的開放廣度或許是這一類受眾獲得數(shù)字化服務(wù)的最佳形態(tài)。上圖推出的中文古籍聯(lián)合目錄及循證平臺(tái),以古籍目錄和古籍文獻(xiàn)中蘊(yùn)含的數(shù)據(jù)、事實(shí)和知識(shí),以及基于它們的統(tǒng)計(jì)、分析和推理來協(xié)助各類人文、歷史、社會(huì)科學(xué)研究;而歷史文獻(xiàn)眾包平臺(tái)為用戶提供元數(shù)據(jù)深度著錄和全文標(biāo)引的功能,對無法OCR的全文進(jìn)行抄錄,是低端數(shù)據(jù)深度開放的良好應(yīng)用。
數(shù)字化服務(wù)的目標(biāo)定位也將影響開放數(shù)據(jù)建設(shè)和服務(wù)的形態(tài)。例如,如果要重現(xiàn)老街道、老建筑的文化風(fēng)采,就需要關(guān)聯(lián)眾多機(jī)構(gòu)/數(shù)據(jù)源中歷史上的建筑、人物、事件等信息,這就需要開放數(shù)據(jù)達(dá)到第一級深度。從另一個(gè)角度來說,如果只滿足查閱原版文獻(xiàn)等需求,則建立可查詢(第二級深度)和網(wǎng)上瀏覽(第三級深度)的數(shù)據(jù)庫不見得不是一種恰切的數(shù)字化服務(wù)模式。
開放數(shù)據(jù)的開放深度和廣度以及數(shù)字化服務(wù)能力不得不受到其他因素的制約,如資源持有人開放意愿,資源內(nèi)容涉及人物后代(如家譜)。所以,采用因地制宜的數(shù)字化服務(wù)模式是有效的方法。
(2)加強(qiáng)跨組織的協(xié)作和資源、成果共享??缃M織跨領(lǐng)域的協(xié)作能更全面地揭示隱藏在不同數(shù)據(jù)源間的知識(shí)聯(lián)系,協(xié)作成果也將使資源得到更充分的利用。不同類別記憶機(jī)構(gòu)的協(xié)作、國內(nèi)各地區(qū)機(jī)構(gòu)的協(xié)作、大范圍的國際協(xié)作都有必要[34-35]。比如,歷史街道及歷史建筑重現(xiàn)可以由圖書館提供數(shù)字化服務(wù)來完成,但為了深度發(fā)掘其人文價(jià)值(建筑風(fēng)格、設(shè)計(jì)圖檔)或出于歷史建筑保護(hù)的目的,則需要跨部門(檔案館、博物館)協(xié)作。目前國內(nèi)跨圖博檔機(jī)構(gòu)的協(xié)作較少。上圖古籍聯(lián)合目錄將多館館藏目錄進(jìn)行融合,包括柏克萊加州大學(xué)東亞圖書館、哈佛大學(xué)哈佛燕京圖書館以及澳門大學(xué)圖書館等,提供古籍書目數(shù)據(jù)查詢和全文影像瀏覽。相比單一部門的開放數(shù)據(jù)建設(shè),多方協(xié)作能產(chǎn)出更全面、更深入的技術(shù)成果。充分的資源利用和數(shù)據(jù)共享能破除片面采集、數(shù)據(jù)私有、重復(fù)勞動(dòng)等現(xiàn)象,節(jié)約開放數(shù)據(jù)建設(shè)和數(shù)字化服務(wù)的成本。
(3)人類記憶機(jī)構(gòu)的職能定位應(yīng)從記錄文化演變的資源庫轉(zhuǎn)為數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新的使能者。在生產(chǎn)能力逐步提高、產(chǎn)品日益豐富的社會(huì),借助記憶機(jī)構(gòu)的開放數(shù)據(jù)和數(shù)字化服務(wù),通過活用歷史人文開放數(shù)據(jù),更能在物質(zhì)產(chǎn)品和精神產(chǎn)品開發(fā)的競爭中掌握優(yōu)勢。支撐帶有地域特征、表現(xiàn)風(fēng)格和文化底蘊(yùn)的文創(chuàng)設(shè)計(jì)能促使人類記憶機(jī)構(gòu)的職能從記錄文化演變的資源庫轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)創(chuàng)新的使能者,這種職能轉(zhuǎn)型將從傳統(tǒng)職能的根上開出數(shù)據(jù)驅(qū)動(dòng)的萬眾創(chuàng)新之花。
(4)制訂適應(yīng)于數(shù)字化服務(wù)快速變化的法規(guī)框架。開放數(shù)據(jù)建設(shè)和數(shù)字化服務(wù)必須在法規(guī)框架中實(shí)施,也將伴隨這一框架的演變而發(fā)展。有別于傳統(tǒng)物理世界的產(chǎn)品和服務(wù),數(shù)字化產(chǎn)品和服務(wù)天生迎合了世界快速變化的特質(zhì)。再加上人們的數(shù)字化服務(wù)需求瞬息萬變,加大記憶機(jī)構(gòu)數(shù)字化服務(wù)實(shí)踐的快速發(fā)展與相對滯后的法規(guī)框架之間的沖突。數(shù)據(jù)的安全與保密、個(gè)人隱私與知識(shí)產(chǎn)權(quán)的保護(hù)、內(nèi)容的合規(guī)性和平臺(tái)的法律責(zé)任等一系列問題是最大限度發(fā)揮數(shù)字人文開放數(shù)據(jù)和記憶機(jī)構(gòu)數(shù)字化服務(wù)效用所面臨的挑戰(zhàn),迫切需要研究和立法跟進(jìn)。
本文從開放數(shù)據(jù)的內(nèi)容深度、廣度、利用形式等維度梳理國內(nèi)外記憶機(jī)構(gòu)的開放數(shù)據(jù)建設(shè)實(shí)踐經(jīng)驗(yàn),認(rèn)為我國人類記憶機(jī)構(gòu)的數(shù)字化服務(wù)轉(zhuǎn)型應(yīng)根據(jù)各機(jī)構(gòu)的能力、預(yù)期受眾和愿景探索差異化的數(shù)字化服務(wù)模式;加強(qiáng)跨記憶機(jī)構(gòu)的跨組織協(xié)作和成果共享;記憶機(jī)構(gòu)的職能定位應(yīng)從記錄文化演變的資源庫轉(zhuǎn)型為數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新的使能者;應(yīng)及時(shí)制訂適應(yīng)數(shù)字化服務(wù)快速變化的法律法規(guī)框架。上圖陸續(xù)進(jìn)行一系列探索,今后將結(jié)合上圖數(shù)字化服務(wù)轉(zhuǎn)型實(shí)踐,對上述建議逐步檢驗(yàn)并加以落實(shí)。