亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶需求視角的古籍數(shù)字資源獲取路徑研究

        2022-11-24 08:47:51
        圖書館 2022年9期
        關鍵詞:古籍數(shù)據(jù)庫文獻

        許 莉

        (湖南圖書館 長沙 410011)

        1 引言

        古籍是珍貴的特色文化遺產(chǎn),出于對古籍文獻價值的認同,我國政府非常重視古籍保護和開發(fā)利用工作。特別是進入21世紀以來,在國家經(jīng)濟文化大發(fā)展的背景下,政府發(fā)布了一系列政策文件,指導古籍保護工作。2007年,國務院辦公廳發(fā)布了《關于進一步加強古籍保護工作的意見》(國辦發(fā)[2007] 6號)。2011年,文化部下發(fā)《關于進一步加強古籍保護工作的通知》(文社文發(fā)[2011] 12號)。2017年,文化部印發(fā)《“十三五”時期全國古籍保護工作規(guī)劃》,系我國古籍保護工作方面的首個五年規(guī)劃。2022年4月,中共中央辦公廳、國務院辦公廳印發(fā)了《關于推進新時代古籍工作的意見》。在政策支持和現(xiàn)代信息技術背景下,大量古籍實現(xiàn)了數(shù)字化,古籍數(shù)字資源向多元化、智能化、開放化的信息獲取方向發(fā)展。

        2 推動古籍數(shù)字資源獲取的現(xiàn)實意義

        2.1 助力古籍文獻保護工作

        古籍文獻記載了古代社會生活的信息符號,其載體和裝幀形式也體現(xiàn)了古代手工和生產(chǎn)力發(fā)展水平。古籍價值珍貴,已經(jīng)退出了日常閱讀流通市場,通常被收藏在圖書館、博物館等公共文化服務機構中。古籍載體已存在幾百年甚至上千年,已經(jīng)處于自然衰退的過程。出于原生性保護的目的,古籍已不適于多次提取閱覽和使用。對古籍進行數(shù)字化,就是將古籍信息內(nèi)容進行轉移,實現(xiàn)古籍文物價值和信息價值的分離,以數(shù)字資源取代古籍對外開放閱覽和服務,從而延長古籍的壽命。2007年國務院《關于進一步加強古籍保護工作的意見》明確指出,要規(guī)范古籍數(shù)字化工作,向社會和公眾開放古籍資源,發(fā)揮古籍應有的作用[1]。古籍保護工作既要保護古籍原件,又要將古籍承載的內(nèi)容化身千百,傳播給社會大眾。古籍數(shù)字資源形式多樣,存儲空間小,通過網(wǎng)絡可實現(xiàn)跨區(qū)域的大范圍傳播。古籍數(shù)字資源便于開發(fā)和利用,對信息知識進行深入發(fā)現(xiàn)和挖掘,實現(xiàn)其再生性價值,為用戶提供優(yōu)質(zhì)的知識服務。用數(shù)字資源取代紙質(zhì)文獻,符合社會信息傳播發(fā)展趨勢,是傳承歷史和發(fā)揚傳統(tǒng)文化的科學性選擇。

        2.2 推動社會信息公平的實現(xiàn)

        信息公平是人類社會的基本權利之一,是圖書館核心價值觀的體現(xiàn)。1948年的《世界人權宣言》是最早規(guī)定人的權利的規(guī)范性文件,其中包括人類獲取信息的權利。聯(lián)合國人權憲章確定了信息獲取權應當作為基本人權受到尊重與保護。1994年,國際圖聯(lián)和聯(lián)合國教科文組織聯(lián)合發(fā)布《公共圖書館宣言》,重申讀者信息獲取的自由和權利[2]。2017年11月,全國人大常委會通過了《公共圖書館法》,這是我國信息獲取權保障基本制度建設的重要內(nèi)容。

        古籍資源稀缺且分布不均衡,存在明顯的地區(qū)差異、機構差異。在傳統(tǒng)古籍服務模式下,用戶必須到現(xiàn)場閱覽紙質(zhì)文獻或縮微文獻,獲取路徑單一,收藏機構服務范圍有限。非本地區(qū)的用戶很難獲得古籍收藏機構提供的信息服務?,F(xiàn)存中文古籍總量約為20萬種,主要集中在國家圖書館、北京大學圖書館、上海圖書館、南京圖書館等古籍重點保護單位。其他單位所藏的古籍文獻種類和數(shù)量相對不足,也限制了現(xiàn)場用戶信息需求的滿足。古籍數(shù)字資源可以通過計算機存儲和網(wǎng)絡傳播的特征,突破了古籍文獻傳播的時空限制。推廣古籍數(shù)字資源,能夠顯著擴大用戶地區(qū)范圍,彌補古籍信息獲取的社會差距,從而實現(xiàn)古籍信息獲取的相對公平,減輕資源分配不公造成的公共文化服務不均衡現(xiàn)象,也有利于古籍文獻的社會化傳播和閱讀推廣。

        2.3 助力數(shù)字時代優(yōu)秀傳統(tǒng)文化傳承

        古籍是燦爛中華文明的結晶,是中華民族優(yōu)秀文化的載體,記錄了我國各朝代各階層人民的生產(chǎn)和生活狀況,是不可再生、不可替代的歷史資料。保存和開發(fā)古籍,對于傳承發(fā)揚中華民族文化,加強民族團結,具有不可替代的重要意義。

        近年來,以計算機、互聯(lián)網(wǎng)以及數(shù)字化為核心的變革,影響了全社會的信息生產(chǎn)和傳播模式,以及用戶的信息獲取和使用方式。人們的生產(chǎn)和生活已經(jīng)進入全新的數(shù)字時代,數(shù)字閱讀逐漸成為社會閱讀和學習的常態(tài)。據(jù)第七屆中國數(shù)字閱讀大會上發(fā)布的《2020年度中國數(shù)字閱讀報告》,2020年中國數(shù)字閱讀產(chǎn)業(yè)規(guī)模達351.6億,數(shù)字閱讀用戶規(guī)模達4.94億,日均數(shù)字閱讀時長為29分鐘[3]。數(shù)字閱讀具有成本低、易存儲、信息更新快等優(yōu)點,對促進全民閱讀、提升全民文化素質(zhì)具有不可忽視的意義。古籍數(shù)字資源是數(shù)字時代的傳統(tǒng)知識文化載體,是適應現(xiàn)代社會閱讀習慣和閱讀潮流的信息資源。將古籍轉化為數(shù)字資源,再整理加工為多種形式的數(shù)字產(chǎn)品,實現(xiàn)了傳統(tǒng)文化與現(xiàn)代社會的知識連接,產(chǎn)生了新的社會效益。傳統(tǒng)文化內(nèi)容以數(shù)字時代的傳播方式進行擴散,迎合了用戶的信息獲取和閱讀習慣,有利于古籍閱讀活動推陳出新,有利于現(xiàn)代技術助力古籍研究工作。

        3 古籍數(shù)字信息資源獲取之多重選擇

        3.1 信息源選擇

        3.1.1 數(shù)據(jù)庫

        全國范圍內(nèi)的中文古籍數(shù)字化工作已經(jīng)取得階段性成果,由古籍收藏機構、高校、信息技術開發(fā)公司等合作開發(fā)的古籍數(shù)據(jù)庫已經(jīng)推廣使用,成為教師、學生、古籍研究者的重要信息來源。

        (1)全文數(shù)據(jù)庫

        全文數(shù)據(jù)庫有文本型、圖像型和圖文型3種類型,通過人工將古籍全文錄入數(shù)據(jù)庫, 再進行分類標引形成可檢索的文本數(shù)據(jù)庫。它為使用者提供了文本格式的古籍全文,可以實現(xiàn)全文檢索、文本復制和編輯[4]。由南開大學組合數(shù)學研究中心、天津永川軟件技術有限公司等聯(lián)合開發(fā)的“二十五史全文閱讀檢索系統(tǒng)(網(wǎng)絡版)”就是文本型全文數(shù)據(jù)庫。文本型全文數(shù)據(jù)庫運用于古籍文獻,是古籍數(shù)字化的最初嘗試。但是手工錄入工作量大,繁體字、異體字辨認和校對難度高,古籍的版本特征不復存在。

        鑒于此,我們可以通過掃描古籍全文,建立圖像數(shù)據(jù)庫,同時著錄相應的元數(shù)據(jù),形成基于元數(shù)據(jù)的古籍全文數(shù)據(jù)庫[5]。公共圖書館自建的館藏古籍數(shù)據(jù)庫以圖像型全文數(shù)據(jù)庫居多,如首都圖書館“館藏古籍珍善本圖像數(shù)據(jù)庫”、上海圖書館“古籍善本全文光盤”等。圖像全文數(shù)據(jù)庫建設對掃描設備和技術要求較高,前期經(jīng)費投入大,占用存儲空間大。但采集錄入環(huán)節(jié)相對簡單,省去了文字校對的步驟,對數(shù)據(jù)技術要求不高,適合圖書館文獻基礎強而技術力量弱的現(xiàn)實情況。圖像能保存古籍原貌,為用戶提供版式、批注、印章等有用信息。最大的缺點是只能閱覽和基于元數(shù)據(jù)檢索,不能進行文字全文檢索和復制編輯。

        圖文型古籍數(shù)據(jù)庫是圖像型與文本型的結合[6]。它不僅支持基于文本的檢索,還提供影像形式的古籍原文內(nèi)容對照,可有效避免文字識別時出現(xiàn)的錯漏,對古籍版本的研究具有重要價值。目前數(shù)字出版商開發(fā)的古籍全文數(shù)據(jù)庫以圖文型為主,例如愛如生公司開發(fā)的“中國基本古籍庫”、書同文公司開發(fā)的《四部叢刊》全文檢索系統(tǒng)、時代瀚堂公司開發(fā)的《瀚堂典藏》古籍數(shù)據(jù)庫等[7]。圖文型古籍數(shù)據(jù)庫是古籍數(shù)據(jù)庫的發(fā)展趨勢,結合了文本數(shù)據(jù)庫和圖像數(shù)據(jù)庫的優(yōu)點,既能夠進行全文檢索,也能通過切換文本和原圖像,瀏覽原文圖片來校對內(nèi)容,查看原書版式。

        (2)參考數(shù)據(jù)庫

        參考數(shù)據(jù)庫是能指引用戶到另一信息源獲取原文或其他細節(jié)的數(shù)據(jù)庫[8]。古籍參考數(shù)據(jù)庫以書目數(shù)據(jù)庫、索引數(shù)據(jù)庫居多。

        古籍書目數(shù)據(jù)庫主要指圖書館目錄數(shù)據(jù)庫,針對特定的館藏圖書資料等進行內(nèi)容及存儲地址的揭示與報道,在統(tǒng)一機讀目錄格式下,將古籍文獻的基本信息著錄到計算機存儲。用戶可檢索古籍的館藏地點、版本等信息,為進一步利用古籍提供依據(jù)。上海圖書館古籍書目數(shù)據(jù)庫2001年推出使用,包含數(shù)據(jù)近13 萬條。2004年,國家圖書館完成全部館藏古籍書目數(shù)據(jù)庫建設,數(shù)據(jù)達39 萬余條[9]。目前,古籍聯(lián)合書目數(shù)據(jù)庫的建設成為發(fā)展趨勢。我國及海外一些古籍收藏機構開始統(tǒng)一標準、規(guī)范,進而實現(xiàn)聯(lián)合編目的歷程,出現(xiàn)了一些比較有影響力的古籍聯(lián)合編目項目,如中國高等教育文獻保障系統(tǒng)(CALIS) 的“古籍善本聯(lián)合目錄數(shù)據(jù)庫”、美國的“中國古籍國際聯(lián)合目錄”項目等[10]。

        索引數(shù)據(jù)庫是存貯書名、刊名、篇名、主題、人名、地名等信息的外部特征,并將這些外部特征按一定方式編排,注明出處,以供檢索的數(shù)據(jù)庫[11]。歐美地區(qū)在編制中文古籍索引數(shù)據(jù)庫實踐方面發(fā)展較早。日本學者編制的中文古籍索引數(shù)據(jù)庫較多,如東京大學圖書館編制的“東京大學總合圖書館漢籍目錄·索引”。國內(nèi)于1988年啟動電腦編制索引,此后古籍索引數(shù)字化越來越普遍,如北京師范大學圖書館開發(fā)的“全元文篇名作者索引”,南京師范大學開發(fā)的“全唐五代宋詞索引”“全宋詞索引”。索引數(shù)據(jù)庫大大減少了用戶對古籍文獻的翻檢時間,是用戶進一步利用古籍文獻的有效工具。

        3.1.2 電子圖書

        (1)光盤電子圖書

        早在20世紀80年代,各研究機構和出版社就聯(lián)合將原有古籍原版書轉化為電子圖書,通過精選優(yōu)質(zhì)的古籍底本,再進行數(shù)字轉化后匯編,將其存儲在光盤中。香港迪志文化出版有限公司與上海人民出版社合作出版的“文淵閣《四庫全書》”電子版, 1997年開始制作,1998年推出“原文及標題檢索版”(167張光盤),1999年推出“原文及全文檢索版”(183張光盤)[12]。光盤版古籍容量大,一張光盤可以記錄多部圖書,便于攜帶。大多數(shù)光盤版古籍,可以在電腦上實現(xiàn)多種途徑檢索,還有整理、裁剪等多種編輯功能?,F(xiàn)在因為網(wǎng)絡技術的發(fā)展,光盤版古籍已經(jīng)逐漸被網(wǎng)絡版電子圖書取代。

        (2)網(wǎng)絡電子圖書

        網(wǎng)絡電子圖書是指以互聯(lián)網(wǎng)為媒介,以電子文檔方式發(fā)行、傳播和閱讀的電子圖書。網(wǎng)絡古籍電子圖書,有綜合數(shù)字圖書館中收錄的,由古籍文獻轉化的電子圖書,如方正阿帕比數(shù)字圖書館,其中包括12萬冊珍貴古籍,可以提供翻閱、全文檢索和在線試讀;還有獨立制作的專題古籍電子圖書系統(tǒng),如“‘中醫(yī)藥珍善本古籍多媒體數(shù)據(jù)庫’對320種中醫(yī)藥珍善本古籍進行了數(shù)字化處理,初步建成了網(wǎng)絡版的中醫(yī)古籍電子圖書系統(tǒng)”[13]。

        3.1.3 網(wǎng)絡數(shù)字資源

        一些專業(yè)性網(wǎng)站或綜合性網(wǎng)站的專題欄目,也收錄了許多古籍數(shù)字資源。國內(nèi)最有影響的古籍網(wǎng)站是國學網(wǎng)和愛如生網(wǎng)站。國學網(wǎng)所辟“文獻部”為免費數(shù)字資源,分經(jīng)、史、子、集四部分,但只能按卷或篇名瀏覽,不設字詞檢索功能。愛如生網(wǎng)站內(nèi)所設“典?!保詳?shù)字化古籍為主要內(nèi)容,收錄歷代典籍和民國書刊10萬種。該網(wǎng)站收錄的大量的明清人詩文筆記、學術著作,成為其一大亮點。古籍收藏單位和研究機構,也會在網(wǎng)站上開放自制古籍數(shù)字資源,供用戶免費使用或注冊使用。國家圖書館的國際敦煌項目(IDP),提供敦煌及絲綢之路其他遺址出土的10萬余件寫卷數(shù)字資源。國圖還開辟了甲骨世界、碑帖菁華、西夏碎金等欄目,提供各種出土古書的數(shù)字資源[14]。

        3.2 獲取路徑選擇

        3.2.1 公共獲取路徑

        信息資源公共獲取,即“一定區(qū)域范圍內(nèi)某一社會共同體的不特定成員免費或低成本、無歧視、無障礙地獲取有關信息資源”[15]。國內(nèi)公共圖書館集中了我國大部分現(xiàn)存古籍,是保障公民基本文化權益的公共文化設施。

        公共圖書館向用戶提供兩種來源的古籍數(shù)字資源,即自建的和購買的古籍數(shù)字資源。隨著“中華古籍保護計劃”的深入開展,各圖書館相繼建設各具特色的古籍數(shù)據(jù)庫,開放古籍在線發(fā)布平臺,供用戶免費或注冊使用;將小部分館藏古籍內(nèi)容制作成單本光盤、U盤型數(shù)字資源,收取制作成本費,滿足用戶個性化信息需求。公共圖書館利用公共文化服務資金采購商業(yè)化古籍數(shù)據(jù)庫,免費提供給注冊用戶使用,基于維護公共文化權利的立場,為用戶提供古籍數(shù)字資源的公共獲取路徑。

        公共圖書館向用戶提供的古籍數(shù)字資源內(nèi)容有:公有領域的古籍信息內(nèi)容,著作權法豁免保護范圍內(nèi)的古籍數(shù)字資源。古籍因為年代久遠,其信息內(nèi)容已經(jīng)進入公有領域,不受《著作權法》的限制。但是古籍載體本身又是文物,受到《文物保護法》的保護。因此,將古籍文獻進行信息轉移,制作成數(shù)字資源再提供給用戶閱覽,是解決古籍文物價值和信息價值之間矛盾的優(yōu)選方案。我國《信息網(wǎng)絡傳播權保護條例》規(guī)定:圖書館可向其服務對象提供本館收藏的合法出版的數(shù)字作品。因此,公共圖書館可以購買古籍商業(yè)數(shù)據(jù)庫,供到館用戶和注冊用戶閱覽學習。

        近年來,我國加大了推進公共文化服務的力度,公共圖書館古籍數(shù)字資源顯著增長,服務能力增強。用戶可以通過公共獲取途徑取得古籍數(shù)字資源,在文獻種類、供給機構、服務形式上都有較大選擇空間。這能夠滿足絕大部分用戶的基本信息需求,而且有效降低了信息獲取成本。但是,公共獲取路徑并不支持涉及商業(yè)化傳播和營利性的古籍信息需求。

        3.2.2 商業(yè)獲取路徑

        信息資源商業(yè)獲取,是指信息用戶通過付出經(jīng)濟成本的方式,從商品流通市場上交換取得所需的信息資源。古籍文獻的收藏機構,如圖書館、博物館,是古籍數(shù)字資源商業(yè)獲取的源頭。超越古籍數(shù)字資源公共獲取邊界,公共圖書館、博物館向營利性機構提供商業(yè)使用目的的古籍數(shù)字資源轉讓,屬于商業(yè)獲取行為。圖書出版商、信息技術企業(yè),向古籍收藏機構購買古籍數(shù)字資源后,經(jīng)過再次技術化加工,增加資源的附加知識價值,再向用戶提供古籍數(shù)字資源的商業(yè)化知識產(chǎn)品。

        古籍數(shù)字出版是在古籍數(shù)字化的基礎上,通過篩選、點校整理和編輯加工后,以數(shù)字產(chǎn)品的形式提供給用戶的一種出版活動。相關機構在古籍數(shù)字出版過程中打破了傳統(tǒng)出版模式,發(fā)揮計算機處理技術優(yōu)勢,使用Unicode編碼字符集、OCR移動數(shù)據(jù)采集、自然語言處理與語義關聯(lián)、知識組織體系建設等方式實現(xiàn)古籍數(shù)字出版及數(shù)字資源合作[16]。不同于紙質(zhì)資源,用戶更看重古籍數(shù)字資源智能化、自動化、個性化的功能以及服務的多元、質(zhì)量和效率。這就要求對古籍數(shù)字資源進行組織、標引、檢索、分析、數(shù)據(jù)挖掘,實現(xiàn)深度知識揭示和呈現(xiàn)。信息技術公司和學術研究機構合作,將數(shù)字人文前沿研究應用于古籍數(shù)字化實踐已成為趨勢。例如:借助GIS技術進行文獻知識與歷史進程的靜態(tài)與動態(tài)可視化分析;構建基于網(wǎng)絡數(shù)據(jù)采集、專業(yè)數(shù)據(jù)庫獲取、詞頻分析的古籍文本信息可視化展示庫;在全文人工標注的基礎上,將大量電子化的文本集合為語料庫,構建自動識別模型[17]。這種以古籍文本數(shù)據(jù)為對象的知識加工服務,增加了古籍數(shù)字資源的知識價值和經(jīng)濟價值,成為制造商的優(yōu)勢知識商品。進入信息資源市場后,用戶通過付出經(jīng)濟成本購買其使用權,完成商業(yè)獲取。

        3.2.3 開放獲取路徑

        信息資源開放獲取(OA),是指任何用戶可以免費在線獲取數(shù)字化信息資源,并允許其進行閱讀、下載、復制、傳遞、打印、檢索等合理利用[18]。嚴格來講,開放獲取也是公共獲取的一種形式,但是兩者有共性也有區(qū)別。公共獲取的資源可以是所有的信息資源載體形式,開放獲取的資源則是在線典藏的學術數(shù)字資源。公共獲取的資源,要依據(jù)法律法規(guī)和國家政策,在資源提供機構的管理和服務許可范圍內(nèi)有限獲?。婚_放獲取資源,免費開放就是其本質(zhì)屬性。古籍數(shù)字化是傳統(tǒng)古籍整理研究工作在數(shù)字時代的延續(xù)與發(fā)展,以此為基礎的古籍開放獲取將逐漸成為古籍整理工作的未來發(fā)展方向[19]。

        世界各國知名公共圖書館,在收藏大量珍貴古籍的基礎上,積極開放在線古籍數(shù)字資源,取得了豐碩成果。通過哈佛大學圖書館中文研究導航頁的鏈接可查看寶卷、中國珍稀舊方志、拓片收藏、明清婦女著作等專題集,所有用戶無需登錄即可在線瀏覽古籍圖片,支持無級縮放、下載打印等操作[19]?!皶瘛笔菄鴥?nèi)為數(shù)不多的古籍開放獲取資源整合網(wǎng)絡平臺,匯集了日本國立國會圖書館、德國柏林國家圖書館、法國國家圖書館、美國國會圖書館等海外眾多著名圖書館的中文古籍數(shù)字資源,為用戶提供開放獲取服務[20]。

        海外古籍文獻的數(shù)字化水平和開放獲取程度要高于國內(nèi),流失于海外的中文古籍開放獲取資源,使我國用戶不出國門就能方便地獲取和利用許多國內(nèi)不復存在的古籍文獻,可以有效地挖掘古籍文獻中珍貴的歷史信息資源。開展對于海外收藏的古籍文獻的相關研究,具有重要的歷史意義和現(xiàn)實意義[21]。開放獲取資源建設也存在投入經(jīng)費高、建設周期長、受收藏機構文獻種類所限等缺點。相對于現(xiàn)存的中文古籍文獻總量來說,全球開放獲取的中文古籍數(shù)字資源還很有限,開放獲取只能是獲取部分古籍資源的選擇途徑。

        4 推動古籍數(shù)字資源獲取的實施策略

        4.1 資源策略:優(yōu)化古籍數(shù)字資源建設,做好源頭供給保障

        做好古籍數(shù)字資源建設,為用戶提供更多可獲取的資源種類和數(shù)量,是推動古籍數(shù)字資源獲取的基礎性工作。優(yōu)質(zhì)高效的古籍數(shù)字資源是滿足不同用戶需求的基礎保障。

        (1)挖掘珍貴特色古籍數(shù)字資源

        對古籍進行數(shù)字資源建設,為用戶挖掘珍貴古籍的文獻價值,要選擇優(yōu)質(zhì)主題的古籍文獻,選取那些既具有較高文獻價值又高度契合用戶需求,知識性和市場性完整統(tǒng)一的古籍,擴展古籍數(shù)字資源的學科范圍。盡量避免對同類別古籍數(shù)字資源的重復建設,如文淵閣《四庫全書》電子版,就曾出現(xiàn)了包括武漢大學圖書館、岳麓書社等8個機構參與的3個電子版書目。這些電子版書籍內(nèi)容大體一致,帶來較大的資源浪費,多個數(shù)字版本也容易使用戶難以辨別與取舍[22]。因此,建設古籍數(shù)字資源要做好前期選題規(guī)劃,挖掘?qū)W科類價值高和稀缺的文獻資源,避免盲目追求熱點內(nèi)容,細化古籍數(shù)字資源的學科類別,擴大資源覆蓋廣度。

        (2)開發(fā)深層次的古籍數(shù)字資源

        以存檔和檢索為目的的古籍文獻表層數(shù)字化已取得豐碩成果,深層次的古籍文獻開發(fā)主要是古籍知識單元標注及知識網(wǎng)絡構建、古籍文獻之間的關聯(lián)、文本內(nèi)容分析及挖掘等[23]。

        在檢索功能上,要加強知識組織與關聯(lián)技術的研究,實現(xiàn)檢索擴展和智能檢索,由專家對本領域知識進行組織整序,形成一種內(nèi)部知識相互關聯(lián)的網(wǎng)絡結構。一方面擴大檢索入口,提高檢全率,另一方面為用戶提供知識鏈接的環(huán)境[24]。嵌入外部知識工具,常見的外部知識工具有古漢語字典、人名與地名詞典、生僻字輸入工具、時間換算法 (古今紀年、干支公元換算)等。

        基于自然語言處理技術,對古籍的文本進行分析,實現(xiàn)相似度對比,以及字詞頻分析。相似度對比可以用于分析文獻的引用關系,或者文獻校勘。字詞頻分析,可以收集數(shù)據(jù)庫中詞匯的出現(xiàn)頻次,從而找到相似內(nèi)容。古籍數(shù)字化可通過技術邏輯和人文邏輯相耦合的“數(shù)字人文”的研究,構建可持續(xù)完善和豐富的數(shù)據(jù)集和分析工具,充分利用新的信息技術與跨學科方法對古籍進行深層次的分析與挖掘[25]。

        4.2 版權策略:加大對公共使用的資金投入,擴大古籍數(shù)字資源的合理使用邊界

        著作權法在保護權利人基于作品的專有性著作權的同時,通過一系列的專有權例外的公共領域保留機制,確保其促進文化科學事業(yè)發(fā)展與繁榮的制度目標得以實現(xiàn)[26]。公共領域具有使用的自由性,即著作權法下任何人都可以自由使用的部分和領域。

        (1)公有領域作品

        公共領域重要內(nèi)容之一,為著作權保護期限屆滿的作品。古籍文獻基本都過了著作權的保護期,其信息內(nèi)容進入公有領域,可以提供給用戶使用。但是古籍文獻作為文物被收藏在公共文化單位,用戶使用受到文物保護政策的限制。最好的解決方式就是推動古籍文獻的公益性數(shù)字化建設,方便用戶使用。2016年, “中華古籍資源庫”向社會公眾免費發(fā)布,已經(jīng)在線發(fā)布超過 80%的館藏古籍善本數(shù)字影像,是我國公共圖書館古籍數(shù)字化的重要成果[27]。2017 年文化部印發(fā)的《“十三五”時期全國古籍保護工作規(guī)劃》明確指出,要加強古籍數(shù)字化工作,鼓勵和支持各古籍收藏單位加快古籍數(shù)字化步伐,擴大古籍數(shù)字資源開放,促進資源共享,提高利用效率。古籍收藏單位對館藏古籍進行數(shù)字化建設,雖然不受著作權約束,但是會產(chǎn)生其他費用,比如硬件設備采購、人力資源投入、信息技術支持等。特別是一些大型的古籍數(shù)字化建設項目,要集中多個收藏單位的古籍文獻資源統(tǒng)籌開發(fā),項目經(jīng)費投入較高。鑒于此,大型古籍數(shù)字化建設項目可由政府投入經(jīng)費,或積極籌集其他慈善組織、基金會、民間機構和個人的資金,以實現(xiàn)古籍數(shù)字化成果的公共使用。

        (2)合理使用內(nèi)容

        著作權法公共領域的另一項重要內(nèi)容,即對著作權作品特定情況下的“合理使用”。我國《信息網(wǎng)絡傳播權保護條例》規(guī)定,圖書館可以不經(jīng)著作權人許可,通過信息網(wǎng)絡向本館館舍內(nèi)服務對象提供本館收藏的合法出版的數(shù)字作品和依法為陳列或者保存版本的需要以數(shù)字化形式復制的作品。此項規(guī)定將合理使用限制在館舍和保存版本的數(shù)字化,不適于網(wǎng)絡發(fā)達的現(xiàn)實需要。圖書館應尋求立法改革支持,擴大合理使用邊界,可購買一些商業(yè)古籍數(shù)字資源,供到館用戶和注冊用戶使用。具體可以采購商業(yè)數(shù)據(jù)庫鏡像副本,安裝在本地服務器,供館舍內(nèi)用戶使用,如單機版、局域網(wǎng)版;也可以采購遠程訪問包庫服務,分年或按照點次付費,用戶遠程訪問產(chǎn)品官網(wǎng)。經(jīng)統(tǒng)計,53所在古籍研究方面有專長的高校圖書館累計購買古籍全文數(shù)據(jù)庫64個,其中獲購量最多的是“中國基本古籍庫”[7]。政府部門要加大對圖書館的公共服務資金支持力度,支持為用戶個人學習和研究免費或低成本提供商業(yè)化古籍數(shù)字資源。

        4.3 技術策略:大力探求技術突破,推進古籍數(shù)字資源的整合和處理

        商業(yè)信息機構對古籍信息價值的追逐,使得古籍商業(yè)數(shù)據(jù)庫大量涌現(xiàn)。商業(yè)信息機構要專注于發(fā)揮自身技術優(yōu)勢,把開發(fā)古籍數(shù)字資源的內(nèi)在信息和知識作為服務特色,吸引對古籍信息有深層次科研需求的用戶。

        (1)信息整合

        信息整合主要是指通過分類法、主題詞法等信息組織體系,將不同信息源、不同信息結構、不同信息載體的相對獨立的信息進行集成,實現(xiàn)原有信息的優(yōu)化配置和價值增值[28]。數(shù)據(jù)庫是信息整合的成熟方式之一,有高效的數(shù)據(jù)處理能力和良好的檢索性能,還適合通過網(wǎng)絡傳輸信息。因此,古籍數(shù)據(jù)庫可以提供快速檢索瀏覽、主題排序、下載分享、定制推送等常見信息獲取功能,為古籍用戶提供集成化信息服務。同時,大量生產(chǎn)的古籍數(shù)據(jù)庫、數(shù)字圖書、數(shù)字產(chǎn)品也為用戶篩選帶來了不便,為了幫助用戶提高資源的檢索效率,還應該對分散的古籍數(shù)字資源進行整合。細粒度的整合,即對具體典籍資源進行整合,構建互聯(lián)互通的古籍資源聯(lián)合平臺;粗粒度的整合,即對古籍數(shù)據(jù)庫進行整合,構建古籍數(shù)據(jù)庫導航平臺[29]。

        有學者提出,建立古籍數(shù)據(jù)庫分類分面體系,收集多個古籍數(shù)據(jù)庫,并采用都柏林核心元數(shù)據(jù)集來標注古籍數(shù)據(jù)庫的特征,再設置不同分面,來表示古籍數(shù)據(jù)庫的不同維度。用戶可以通過分面篩選來快速檢索到需要的古籍數(shù)據(jù)庫條目[29]。還有研究提出,古籍數(shù)字資源存在資源分散、建設主體多元、數(shù)據(jù)格式多樣化的特征,適宜建立古籍數(shù)字資源導航系統(tǒng),將多種數(shù)字資源的網(wǎng)絡入口集合在一起,在線發(fā)布給用戶使用[30]。

        (2)信息處理

        信息處理是對古籍數(shù)字資源的深加工,掃清用戶使用的淺層文字障礙,提取用戶所需的深層知識內(nèi)容,并加以呈現(xiàn)。古漢語文字的特點,又區(qū)別于現(xiàn)代漢語,學術研究機構和信息技術企業(yè)應加快古籍信息處理的研究和實踐探索。“古籍信息處理是利用現(xiàn)代信息技術對古籍文本的音、形、義進行加工和處理,并基于此實現(xiàn)古籍文本的數(shù)據(jù)挖掘和知識發(fā)現(xiàn)。”[31]古籍數(shù)據(jù)挖掘主要的方法有:建立古漢語精加工語料庫,為古籍斷句、標點、分詞和標注提供數(shù)據(jù)支撐;將序列標注模型應用于古漢語詞法分析;開發(fā)古漢語一體化詞法分析平臺等[32]。利用現(xiàn)代技術對海量古籍文本進行自動分析,可以大大減輕人工標注的負擔,還可以挖掘出文本的特征和規(guī)律。

        在古籍知識挖掘方面,結合數(shù)字人文的研究方法,利用知識抽取、知識融合、知識推理等技術和方法,可以實現(xiàn)古籍信息服務智能化。一些學者提出要“利用文本挖掘技術提取事先未知、容易理解、有潛在價值的知識;借助GIS技術進行文獻知識與歷史進程的靜態(tài)與動態(tài)可視化分析;構建基于網(wǎng)絡數(shù)據(jù)采集、專業(yè)數(shù)據(jù)庫獲取、詞頻分析的古籍文本信息可視化展示庫;在全文人工標注的基礎上,將大量電子化的文本集合為語料庫,構建自動識別模型”[16]。

        4.4 服務策略:精準分層用戶群體,提升用戶數(shù)字素養(yǎng)

        古籍數(shù)字資源在完成資源建設、技術處理后,掃清版權障礙,最后到達用戶終端。通過服務機構輔助和用戶自主獲取,古籍數(shù)字資源才得以完成信息知識的最后傳遞過程。

        (1)用戶群體分層服務

        古籍數(shù)字資源的服務提供者,應精準區(qū)分服務用戶群體。公共文化服務機構面對的用戶群體存在需求差異,應該對用戶需求進行差異化管理,根據(jù)用戶群體的綜合需求做好古籍數(shù)字資源的內(nèi)容建設,提出針對性服務方案。對有鑒賞、閱覽需求的用戶,提供自建和共建共享的古籍數(shù)字資源,實現(xiàn)公共獲??;對學術研究型用戶,提供自建古籍數(shù)字資源和公共資金購買的商業(yè)古籍數(shù)據(jù)庫,實現(xiàn)公共獲取,盡可能保障古籍數(shù)字資源在著作權許可下的公共傳播權利;對于對特藏文獻有營利性需求的用戶,提供特藏古籍數(shù)字資源,實現(xiàn)商業(yè)獲??;對需求復雜的用戶,提供綜合途徑的獲取方案。公共服務機構應主動引導用戶,選擇符合其自身利益和價值需求的資源獲取途徑,節(jié)省公共資源,滿足大眾文化需求。提供商業(yè)獲取資源的服務者,應在正常營利性服務模式下,做好版權處理和審查,保障用戶對獲取的古籍數(shù)字資源免于著作權糾紛。對海外特藏中文古籍的開放獲取,有利于開展專業(yè)領域研究。

        (2)提升用戶數(shù)字素養(yǎng)

        “數(shù)字素養(yǎng)與技能是數(shù)字社會公民學習工作生活應具備的數(shù)字獲取、制作、使用、評價、交互、分享、創(chuàng)新、安全保障、倫理道德等一系列素質(zhì)與能力的集合?!盵33]數(shù)字素養(yǎng)是信息素養(yǎng)的“升級版”。2021年12月27日中央網(wǎng)絡安全和信息化委員會發(fā)布的《“十四五”國家信息化規(guī)劃》,將“全民數(shù)字素養(yǎng)與技能提升”作為十大優(yōu)先行動之首。數(shù)字素養(yǎng)已成為數(shù)字化社會公民的核心素養(yǎng),是公民生存的基本能力。

        古籍文獻用戶要適應數(shù)字智能時代,從研究傳統(tǒng)文獻轉變?yōu)槔霉偶當?shù)字資源,要形成和培養(yǎng)自身的數(shù)字素養(yǎng)。培養(yǎng)古籍用戶的數(shù)字素養(yǎng),是提升古籍用戶數(shù)字資源獲取能力的基本途徑。數(shù)字時代,獲取信息依靠的是對數(shù)字工具和技術的運用能力。古籍數(shù)字資源用戶,需掌握的數(shù)字技能主要有:數(shù)字設備的物理操作和軟件操作,通過互聯(lián)網(wǎng)平臺和數(shù)字工具瀏覽、搜索和篩選古籍數(shù)字資源,通過數(shù)字工具進行網(wǎng)絡溝通和互動,網(wǎng)絡安全風險下個人隱私和數(shù)據(jù)保護,使用數(shù)字工具和技術對古籍數(shù)字資源進行分析和研究等。古籍數(shù)字資源服務平臺對用戶開設數(shù)字素養(yǎng)教育培訓課程,是便捷有效的途徑。平臺可以開展集中專業(yè)的培訓課程,用戶還可以通過平臺進行交流研討,提高資源獲取和利用效率。

        猜你喜歡
        古籍數(shù)據(jù)庫文獻
        中醫(yī)古籍“疒”部俗字考辨舉隅
        Hostile takeovers in China and Japan
        速讀·下旬(2021年11期)2021-10-12 01:10:43
        關于版本學的問答——《古籍善本》修訂重版說明
        天一閣文叢(2020年0期)2020-11-05 08:28:06
        Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
        大東方(2019年12期)2019-10-20 13:12:49
        關于古籍保護人才培養(yǎng)的若干思考
        天一閣文叢(2018年0期)2018-11-29 07:48:08
        The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
        我是古籍修復師
        金橋(2017年5期)2017-07-05 08:14:41
        The Role and Significant of Professional Ethics in Accounting and Auditing
        商情(2017年1期)2017-03-22 16:56:36
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        色偷偷88888欧美精品久久久| 国产精品一区二区三区专区| 丰满熟女高潮毛茸茸欧洲视频| 亚洲日本va午夜在线电影| 国产丶欧美丶日本不卡视频| 国产无遮挡a片又黄又爽| 99久久99久久精品免观看| 在线观看中文字幕不卡二区| 极品少妇xxxx精品少妇偷拍| 精品欧洲av无码一区二区三区| 亚洲狼人社区av在线观看| 国产三级韩三级日产三级| 国产精品乱码人妻一区二区三区| 丰满人妻被中出中文字幕| AⅤ无码精品视频| 久久国产精品美女厕所尿尿av| 国产二区交换配乱婬| 色妺妺视频网| 午夜一区二区三区av| 亚洲不卡高清av网站| 精品少妇爆乳无码av无码专区| 国产精品欧美久久久久老妞| 青青草成人免费播放视频| 欧美嫩交一区二区三区 | 日日躁夜夜躁狠狠躁超碰97| 毛片一级精油按摩无码| 亚洲av第一区国产精品| √新版天堂资源在线资源| 欧美成人专区| 中文字幕一区二区在线| 精品亚洲麻豆1区2区3区| 免费a级毛片出奶水| 无码91 亚洲| 亚洲黄色一级在线观看| 久久久久人妻精品一区蜜桃| 亚洲国产另类久久久精品小说| 日本韩国一区二区高清| 综合色就爱涩涩涩综合婷婷 | 久久久久av无码免费网| 99久久久久国产| av免费在线观看在线观看|