楊新涯 文佩丹
(1. 重慶大學(xué)圖書館,重慶 400044;2. 重慶大學(xué)人文社會(huì)科學(xué)高等研究院,重慶 400044)
“數(shù)字人文”(Digital Humanities)就是利用計(jì)算機(jī)及其相關(guān)技術(shù),以更加直觀和可視化的形式來創(chuàng)新傳統(tǒng)紙質(zhì)文獻(xiàn)、音視頻等研究內(nèi)容和方法[1-2]。近年來,隨著人工智能、大數(shù)據(jù)等技術(shù)的不斷發(fā)展,數(shù)字人文越來越凸顯出其在人文研究、新文科發(fā)展方面的優(yōu)勢,進(jìn)而成為新的研究熱點(diǎn),鑒于此,圖檔博領(lǐng)域也開始關(guān)注數(shù)字人文及其與數(shù)字人文的關(guān)系,并逐漸開展相關(guān)研究和實(shí)踐。圖書館特別是高校圖書館作為支持科學(xué)研究的重要機(jī)構(gòu),在數(shù)字人文時(shí)代如何更好地幫助學(xué)者高效、深入地開展人文研究,體現(xiàn)其在支撐學(xué)科發(fā)展中的擔(dān)當(dāng)和作為,是當(dāng)前值得探討和研究的重要內(nèi)容。筆者認(rèn)為,圖書館在數(shù)字人文中發(fā)揮作用,首先就要明確圖書館在其中的角色定位,進(jìn)而才能以角色為核心,看到問題和差距,并展開相關(guān)服務(wù)。
對于數(shù)字人文的研究,目前圖書館和圖書館人的視角重點(diǎn)聚焦在以下方面。
(1)國內(nèi)外圖書館數(shù)字人文發(fā)展現(xiàn)狀及趨勢研究。吳麗萍[3]以《我國圖書館數(shù)字人文研究現(xiàn)狀及展望》為題,總結(jié)了我國圖書館數(shù)字人文的研究主題,并在研究展望中指出關(guān)注圖書館數(shù)字人文的角色和功能研究。尚曉倩[4]以《歐洲研究型圖書館數(shù)字人文發(fā)展現(xiàn)狀及啟示》為題進(jìn)行研究,通過組建工作組對歐洲研究型圖書館協(xié)會(huì)(Association of European Research Libraries)開展有關(guān)圖書館數(shù)字人文發(fā)展?fàn)顩r的問卷調(diào)查,基于調(diào)查結(jié)果總結(jié)出歐洲研究型圖書館數(shù)字人文發(fā)展特點(diǎn)及對我國圖書館開展數(shù)字人文工作的啟示,在啟示中指出找準(zhǔn)定位,促進(jìn)數(shù)字人文活動(dòng)價(jià)值最大化的觀點(diǎn)。胡靜等[5]對國內(nèi)外數(shù)字人文研究進(jìn)行對比分析,總結(jié)國內(nèi)圖書情報(bào)領(lǐng)域數(shù)字人文研究的特征和不足,提出我國研究的努力方向。
(2)國外高校數(shù)字人文項(xiàng)目分析。其中,比較典型的包括對加拿大[6]、美國[7-9]等高校數(shù)字人文項(xiàng)目的研究。通過分析,普遍認(rèn)為我國數(shù)字人文實(shí)踐還處于起步階段,與國外數(shù)字人文研究存在較大差距,國外的數(shù)字人文項(xiàng)目可為我國數(shù)字人文實(shí)踐提供參考和借鑒。
(3)數(shù)字人文平臺(tái)等基礎(chǔ)設(shè)施的構(gòu)建研究。主要包括對圖像庫[10]、手稿特色資源庫[11]、語義支撐平臺(tái)[12]等的構(gòu)建研究。通過對數(shù)字人文技術(shù)體系和研究工具的構(gòu)建,部分圖書館也逐漸有了一些數(shù)字人文的實(shí)踐案例,如上海圖書館的“上海年華”等。
也有少量關(guān)于圖書館在數(shù)字人文中角色定位或發(fā)展策略的研究。其中具有代表性的如李如鵬[13]對數(shù)字人文下圖書館的角色進(jìn)行探討,認(rèn)為在數(shù)字人文項(xiàng)目中,圖書館可為學(xué)者和技術(shù)專家搭建溝通平臺(tái),在數(shù)字人文參與者中間具有協(xié)調(diào)的獨(dú)特作用;朱娜[14]對數(shù)字人文的興起及圖書館的角色進(jìn)行研究,提出圖書館在數(shù)字人文研究和實(shí)踐中可扮演資源提供者、內(nèi)容策展人、學(xué)科聯(lián)絡(luò)員、課程輔導(dǎo)員、咨詢顧問與研究空間提供者等角色;汪莉[15]指出數(shù)字人文需要的不是支持者和服務(wù)者,而是合作者,圖書館需要在新的學(xué)術(shù)環(huán)境中重新定位圖書館學(xué)術(shù)角色。
從以上文獻(xiàn)調(diào)研可以看出,數(shù)字人文的確已經(jīng)得到國內(nèi)圖書館界的廣泛關(guān)注,但是相關(guān)研究和實(shí)踐均處于初始狀態(tài),圖書館人正積極對數(shù)字人文特別是國外數(shù)字人文的發(fā)展趨勢和項(xiàng)目管理進(jìn)行分析和探索,以從中找到圖書館在數(shù)字人文中的定位和發(fā)展路徑。
對于圖書館學(xué)科來講,數(shù)字人文其實(shí)并不陌生。筆者認(rèn)為,數(shù)字人文的核心是計(jì)算科學(xué),即對海量的文獻(xiàn)進(jìn)行數(shù)據(jù)化后,采用人文學(xué)科的方法論進(jìn)行數(shù)據(jù)處理和研究。從這一點(diǎn)上講,圖書館其實(shí)早已開展類似的工作,如利用文獻(xiàn)開展深度的情報(bào)挖掘,Web of Science、Scopus、Scival、ESI、InCites、DLL等平臺(tái)和工具,利用引文、核心期刊評價(jià)體系等進(jìn)行數(shù)據(jù)計(jì)算與數(shù)據(jù)分析,都可視為圖書館學(xué)科的數(shù)字人文基礎(chǔ)。
以近兩年備受推崇的Elsevier公司的SciVal分析平臺(tái)為例,利用主題詞方法,將全球科研內(nèi)容聚類為10萬個(gè)主題,并以這10萬個(gè)主題為基礎(chǔ),將某一研究領(lǐng)域或?qū)W科的文獻(xiàn)增長和衰減趨勢繪制成一個(gè)氣泡圖。如筆者利用該平臺(tái)對材料學(xué)科進(jìn)行分析,近5年材料科學(xué)的主題共計(jì)13 686個(gè),從氣泡圖中進(jìn)一步分析可知,中國材料科學(xué)的研究偏向于與化學(xué)化工相關(guān)的方向,而美國除化工之外,更偏向于與生物學(xué)方向的交叉。
同時(shí),進(jìn)一步對重慶大學(xué)材料學(xué)科的研究主題進(jìn)行分析,全球材料學(xué)主要研究領(lǐng)域的主題詞共計(jì)3 779個(gè),其中重慶大學(xué)參與的共計(jì)407個(gè)(不含僅有1~2篇研究成果的主題)。根據(jù)重慶大學(xué)的參與程度和主題的前沿性,將407個(gè)主題進(jìn)行劃分和組合,如圖1所示,可以清晰地看出重慶大學(xué)材料學(xué)科研究主題與前沿主題的對應(yīng)關(guān)系,從而幫助學(xué)校和學(xué)科找到自身在研究熱點(diǎn)和冷點(diǎn)中的地位,為學(xué)校和學(xué)科發(fā)展提供可靠的數(shù)據(jù)依據(jù)。
圖1 重慶大學(xué)材料科學(xué)研究情況
筆者認(rèn)為,圖書館在數(shù)字人文的發(fā)展中主要扮演著兩個(gè)角色,這兩個(gè)角色是基于圖書館和人文學(xué)者之間的分工產(chǎn)生的。第一個(gè)角色叫“我負(fù)責(zé)食材,你負(fù)責(zé)灶臺(tái)”,第二個(gè)角色叫“我負(fù)責(zé)數(shù)據(jù),你負(fù)責(zé)模型”。
圖書館一定要盡可能地收集學(xué)者所需要的文獻(xiàn)資源,并且把資源進(jìn)行數(shù)據(jù)化,這是數(shù)字人文研究最核心的問題。對于圖書館來說,最艱難也最重要的事情是數(shù)字文獻(xiàn)資源的整理,即將所有紙質(zhì)文獻(xiàn)和電子文獻(xiàn)以元數(shù)據(jù)的形式錄入,并且在元數(shù)據(jù)的基礎(chǔ)上進(jìn)行必要的資源組織,以便應(yīng)用于人文學(xué)者的研究。
資源是圖書館開展科研服務(wù)的基礎(chǔ)和根本,在數(shù)字人文時(shí)代,僅擁有資源顯然不夠,將資源進(jìn)行數(shù)據(jù)化才是關(guān)鍵,這也是圖書館應(yīng)該做的最基礎(chǔ)的工作??梢孕蜗蟮匕褕D書館的文獻(xiàn)資源比喻為沙漠,文獻(xiàn)中的每一個(gè)知識(shí)點(diǎn)或關(guān)鍵詞就是遼闊沙漠中的一粒沙子。圖書館應(yīng)該思考如何將細(xì)小的知識(shí)點(diǎn)抽取出來,并進(jìn)行數(shù)據(jù)化;而怎么治沙,怎么對知識(shí)點(diǎn)進(jìn)行分割和組合以及怎么應(yīng)用知識(shí)點(diǎn)做更深層次的研究,都是學(xué)者的任務(wù)。
基于以上兩個(gè)基本角色,在數(shù)字人文背景下,圖書館還需要實(shí)現(xiàn)一個(gè)角色的轉(zhuǎn)變,即一定要從資源服務(wù)體系變?yōu)閿?shù)據(jù)服務(wù)體系,而且要構(gòu)建圖書館的“數(shù)據(jù)生產(chǎn)體系”。如圖2所示,數(shù)據(jù)生產(chǎn)體系主要包括學(xué)術(shù)數(shù)據(jù)(含文獻(xiàn)資源數(shù)據(jù))、事實(shí)數(shù)據(jù)、用戶數(shù)據(jù)、用戶行為數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù),另外還可包括來自互聯(lián)網(wǎng)的數(shù)據(jù)等。
圖2 圖書館的數(shù)據(jù)生產(chǎn)體系
在明確圖書館數(shù)字人文角色的基礎(chǔ)上,梳理重慶大學(xué)圖書館已經(jīng)開展的相關(guān)工作和實(shí)踐,一方面,了解目前圖書館在數(shù)字人文發(fā)展中的大致進(jìn)展;另一方面,也希望能為未來圖書館深化數(shù)字人文研究和服務(wù)提供更多思路和方向。
重慶大學(xué)圖書館于2016年9月開始自主研發(fā)“全流程電子資源管理系統(tǒng)”,系統(tǒng)采用圖書館學(xué)的思想和方法,具有完整的分類和著錄等流程,將采購流程、元數(shù)據(jù)管理、網(wǎng)絡(luò)服務(wù)、利用服務(wù)全部納入規(guī)范管理。以該系統(tǒng)為依托,重慶大學(xué)圖書館分批分次將所購買的全部文獻(xiàn)資源書目數(shù)據(jù)進(jìn)行數(shù)據(jù)化,目前“紙本+電子”文獻(xiàn)元數(shù)據(jù)已達(dá)2.2億條,其中期刊文獻(xiàn)共計(jì)165 614 527條,占比78.7%;圖書共計(jì)8 117 789條,占比3.9%;其他如專利、會(huì)議、學(xué)位論文等共計(jì)36 517 740條,占比17.4%。
情報(bào)與智庫服務(wù)也是研究的重點(diǎn)。重慶大學(xué)圖書館在這方面已經(jīng)構(gòu)建了一整套服務(wù)體系,包括以資源庫的角色服務(wù)讀者,以情報(bào)員的角色服務(wù)院系和團(tuán)隊(duì),以及以智庫的角色服務(wù)學(xué)校決策者和管理者。
針對不同類型的讀者,開展精準(zhǔn)推送。如對于研究型讀者,推送科技查新、查收查引、科研動(dòng)態(tài)和基于AI的學(xué)術(shù)頭條等;對于學(xué)習(xí)型讀者,開展基于用戶畫像的文獻(xiàn)資源情報(bào)推送;對于非讀者,則進(jìn)行文獻(xiàn)服務(wù)動(dòng)態(tài)推送。對院系和研究團(tuán)隊(duì),圖書館扮演積極參與的情報(bào)員。針對院系決策者,圖書館開展機(jī)構(gòu)科研產(chǎn)出報(bào)告、研究團(tuán)隊(duì)發(fā)展態(tài)勢與影響力以及競爭對標(biāo)等各類情報(bào)服務(wù);針對學(xué)科與團(tuán)隊(duì)負(fù)責(zé)人,圖書館提供學(xué)術(shù)熱點(diǎn)和冷點(diǎn)分析報(bào)告、學(xué)科前沿報(bào)告、重大(重點(diǎn))項(xiàng)目定題以及知識(shí)產(chǎn)權(quán)(培訓(xùn)、專利導(dǎo)航)等服務(wù)。對于學(xué)校決策者,圖書館又扮演智庫的角色。針對職能部門,圖書館提供各學(xué)科和團(tuán)隊(duì)的科研產(chǎn)出報(bào)告、人才評估報(bào)告等;針對學(xué)校領(lǐng)導(dǎo),圖書館提供全球研究態(tài)勢情報(bào)、國際對標(biāo)情報(bào)、學(xué)科貢獻(xiàn)度分析報(bào)告以及學(xué)術(shù)影響力分析報(bào)告等。
在實(shí)踐過程中,圖書館還存在兩個(gè)較大的問題,一是忽視數(shù)字特藏建設(shè),二是嚴(yán)重缺乏圖像、音視頻等多媒體資源。這兩個(gè)問題,重慶大學(xué)圖書館都計(jì)劃在“十四五”期間解決。
(1)忽視數(shù)字特藏建設(shè)。數(shù)字特藏,筆者認(rèn)為既可以是獨(dú)有的數(shù)字館藏,如拍一張獨(dú)一無二的照片并進(jìn)入館藏;也可以是獨(dú)有館藏的數(shù)字化,如將中山大學(xué)的徽州文書、上海圖書館的家譜進(jìn)行數(shù)字化等。身處數(shù)字時(shí)代,我們正在錯(cuò)過很多資源,如曾經(jīng)流行的軟盤、膠卷、隨身聽、傳真機(jī)、Mp3等,都是從我們經(jīng)常使用到現(xiàn)在逐步消失。筆者于2018年參觀國立維多利亞與亞伯特博物館(Victoria & Albert Museum),發(fā)現(xiàn)2011年推出的微信表情包已經(jīng)進(jìn)入博物館。而反思圖書館過去的資源體系,大多采用商業(yè)采購的方式獲取,卻一直在忽略我們身邊的數(shù)字環(huán)境及其產(chǎn)物的收藏和整理。這些獨(dú)特的資源隨著時(shí)間的推移,都可能會(huì)成為人文學(xué)者研究當(dāng)時(shí)社會(huì)變遷或時(shí)代發(fā)展的重要素材。因此,作為保留社會(huì)記憶、人類記憶的圖書館,亟需重新審視數(shù)字特藏建設(shè)的重要性。
(2)多媒體文獻(xiàn)資源缺失。如華為技術(shù)有限公司創(chuàng)始人任正非,1963年就讀于重慶建筑工程學(xué)院(已并入重慶大學(xué)),于1968年畢業(yè)離校,整理歷史資料,發(fā)現(xiàn)留存的關(guān)于他當(dāng)年在學(xué)校的學(xué)習(xí)生活的多媒體資源非常少。又如,城中村、地方文化的消失和城市歷史的變遷,導(dǎo)致傳承地域文化的聲音或影像逐步消失。這些正在消失的資源都是開展數(shù)字人文研究的重要基礎(chǔ)。對于圖書館來講,聲音文獻(xiàn)如何保存?珍貴電子文件私密存儲(chǔ)卻無處典藏?學(xué)者人類學(xué)、社會(huì)學(xué)研究的第一手資料從哪里獲???這些問題都值得思考和探討。
上述這些問題,雖然僅是作為一個(gè)學(xué)術(shù)的假設(shè)提出,但事實(shí)上,如果圖書館繼續(xù)忽略數(shù)字特藏建設(shè),不能構(gòu)建起完整的資源體系,可能真的難以支撐數(shù)字人文的研究。
(1)持續(xù)開展數(shù)據(jù)收割。重慶大學(xué)圖書館用了3年時(shí)間積累了接近3億條數(shù)據(jù)(含運(yùn)行數(shù)據(jù)),并且在“十四五”期間還會(huì)持續(xù)致力于知識(shí)基礎(chǔ)設(shè)施體系的建設(shè)。包括數(shù)據(jù)標(biāo)準(zhǔn)、基礎(chǔ)知識(shí)庫、人名庫、機(jī)構(gòu)庫、學(xué)術(shù)關(guān)鍵詞庫的建設(shè),以及基于數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)庫建立關(guān)聯(lián)數(shù)據(jù)和知識(shí)圖譜等。同時(shí),也將嘗試進(jìn)行文獻(xiàn)的全文數(shù)據(jù)化。這些都是圖書館未來努力的方向,將有助于支撐數(shù)字人文的研究。
(2)加強(qiáng)數(shù)字特藏建設(shè)。重慶大學(xué)圖書館已經(jīng)啟動(dòng)重慶大學(xué)數(shù)字記憶項(xiàng)目,在“十四五”期間,將全面收集重慶大學(xué)自1929年建校以來的所有文獻(xiàn)、圖片、聲音和各類檔案,并進(jìn)行深度標(biāo)引和展示,從而構(gòu)建起一個(gè)完整的采購、收藏和服務(wù)生態(tài)體系。
(3)進(jìn)一步深化學(xué)科支持。在學(xué)科支持方面,主題方法是圖書館行業(yè)長期使用的,但目前的學(xué)科分析平臺(tái)和工具,其數(shù)據(jù)分析普遍基于外文核心期刊,圖書館可以構(gòu)建一個(gè)基于所有文獻(xiàn)的全文主題詞抽取模型,優(yōu)化分析策略。同時(shí),還可基于數(shù)據(jù)構(gòu)建場景化的科研和決策支持體系,如提供學(xué)科科研動(dòng)態(tài)、博碩士選題、投稿引導(dǎo)、精準(zhǔn)人才引進(jìn)、學(xué)者績效全方位評價(jià)、學(xué)科評估、競爭情報(bào)、學(xué)科趨勢等全方位的數(shù)字化服務(wù),只有這樣才能真正實(shí)現(xiàn)圖書館“望遠(yuǎn)鏡+顯微鏡”的功能。
通過以上3個(gè)方面的努力,圖書館將會(huì)構(gòu)建起更完整的資源體系,提供更豐富的數(shù)據(jù)化文獻(xiàn),學(xué)者將可運(yùn)用資源的元數(shù)據(jù)去開展更多科學(xué)研究,并且免去傳統(tǒng)手工、煩瑣的資料收集和整理工作,提升科研效率和準(zhǔn)確性。數(shù)字人文研究和實(shí)踐,是智慧圖書館建設(shè)的重要內(nèi)容,甚至是其中一個(gè)全新的篇章。圖書館將通過不斷探索和實(shí)踐,逐漸認(rèn)清自身的角色、找到合適的發(fā)展路徑、順應(yīng)數(shù)字人文發(fā)展潮流,落實(shí)和踐行“文獻(xiàn)支撐”的宗旨,最大程度助力科學(xué)研究和學(xué)科創(chuàng)新發(fā)展。