亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        國(guó)內(nèi)外數(shù)字保存研究發(fā)展分析

        2024-06-27 22:27:59張鶴揚(yáng)臧國(guó)全
        檔案管理 2024年2期
        關(guān)鍵詞:發(fā)文領(lǐng)域文獻(xiàn)

        張鶴揚(yáng) 臧國(guó)全

        關(guān)鍵詞:數(shù)字保存;數(shù)字資源;圖書(shū);檔案;合作網(wǎng)絡(luò);知識(shí)圖譜;數(shù)字保存;信息技術(shù)

        1 引言

        數(shù)字保存是一系列必要的確保數(shù)字資源可持續(xù)利用的管理活動(dòng)。2022年6月23日國(guó)務(wù)院發(fā)布了《關(guān)于加強(qiáng)數(shù)字政府建設(shè)的指導(dǎo)意見(jiàn)》[1],進(jìn)一步推動(dòng)數(shù)字政府建設(shè),同時(shí)也對(duì)檔案部門(mén)的數(shù)字檔案歸檔和長(zhǎng)期保存能力提出挑戰(zhàn)?!丁笆奈濉比珖?guó)檔案事業(yè)發(fā)展規(guī)劃》指出2025年要基本實(shí)現(xiàn)數(shù)字轉(zhuǎn)型[2],數(shù)字檔案資源有效保存成為一個(gè)重要問(wèn)題。數(shù)字保存可確保對(duì)數(shù)字信息跨時(shí)間、技術(shù)和語(yǔ)義轉(zhuǎn)換的長(zhǎng)期訪問(wèn),并具有諸如社會(huì)效益(政府證據(jù))、文化效益(國(guó)家認(rèn)同)和經(jīng)濟(jì)效益(利用與再利用、創(chuàng)新)等長(zhǎng)期效益。因此,數(shù)字遺產(chǎn)的長(zhǎng)期訪問(wèn)和可信保存已引起全球的關(guān)注。

        2012年9月,在加拿大溫哥華召開(kāi)了旨在探討數(shù)字遺產(chǎn)保存關(guān)鍵問(wèn)題的國(guó)際會(huì)議。會(huì)上通過(guò)了《溫哥華宣言》(UNESCO/UBC VANCOUVER DECLARATION),為數(shù)字遺產(chǎn)領(lǐng)域的理論與實(shí)踐發(fā)展提供了指南與參考。2013年12月聯(lián)合國(guó)教科文組織正式啟動(dòng)“全球增強(qiáng)信息社會(huì)可持續(xù)性發(fā)展平臺(tái)”(Platform to Enhance the Sustainability ofthe Information Society Transglobally,PERSIST)項(xiàng)目,共同推動(dòng)數(shù)字保存政策、技術(shù)、內(nèi)容與最佳實(shí)踐等核心主題的發(fā)展。2016年,聯(lián)合國(guó)教科文組織發(fā)布《數(shù)字遺產(chǎn)長(zhǎng)期保存鑒選指南》(The UNESCO/PERSIST Guidelinesfor the Selection of Digital Heritage for Long-TermPreservation)(第一版),旨在為圖書(shū)館、檔案館、博物館和其他遺產(chǎn)機(jī)構(gòu)制定數(shù)字遺產(chǎn)長(zhǎng)期可持續(xù)性保存的鑒選政策提供重要支撐。2021年,聯(lián)合國(guó)教科文組織發(fā)布了《數(shù)字遺產(chǎn)長(zhǎng)期保存鑒選指南》第二版。在國(guó)際組織的推動(dòng)下,各國(guó)也開(kāi)展了數(shù)字保存的相關(guān)規(guī)劃。例如,2017年8月,美國(guó)國(guó)家檔案與文件署(National Archives and RecordsAdministration,NARA)發(fā)布了首個(gè)《數(shù)字檔案資源長(zhǎng)期保存策略》(Strategy for Preserving Digital ArchivalMaterials),專門(mén)針對(duì)數(shù)字檔案資源的長(zhǎng)期保存進(jìn)行戰(zhàn)略規(guī)劃。[3]2022年6月,NARA在此基礎(chǔ)上修訂并發(fā)布了《數(shù)字保存戰(zhàn)略2022—2026》(Digital Preservation Strategy2022-2026),提出了8項(xiàng)關(guān)鍵性戰(zhàn)略來(lái)確保數(shù)字資產(chǎn)的長(zhǎng)期保存和有效訪問(wèn)。加拿大國(guó)家圖書(shū)檔案館于2017年11 月發(fā)布了《數(shù)字保存計(jì)劃戰(zhàn)略》,并于2022年8月對(duì)該戰(zhàn)略進(jìn)行了修訂并重新發(fā)布。[4]丹麥國(guó)家檔案館發(fā)布了《數(shù)字保存戰(zhàn)略2025》(Digital Preservation Strategy 2025),提出數(shù)字保存未來(lái)發(fā)展的重點(diǎn)領(lǐng)域及實(shí)施意見(jiàn)。[5]

        為從整體上把握國(guó)內(nèi)外數(shù)字保存領(lǐng)域研究的脈絡(luò)與現(xiàn)狀,本文對(duì)國(guó)內(nèi)外數(shù)字保存領(lǐng)域研究文獻(xiàn)進(jìn)行計(jì)量分析,以期探索數(shù)字保存領(lǐng)域研究發(fā)展的基本脈絡(luò)。

        2 研究設(shè)計(jì)

        2.1 數(shù)據(jù)來(lái)源。本文利用中國(guó)知網(wǎng)(CNKI)數(shù)據(jù)庫(kù)和Webof Science作為中英文文獻(xiàn)數(shù)據(jù)源檢索平臺(tái),開(kāi)展數(shù)字保存領(lǐng)域的文獻(xiàn)研究。以2023年12月為截止時(shí)間,對(duì)1997年以來(lái)的文獻(xiàn)進(jìn)行檢索,共獲得11 85篇中文文獻(xiàn),見(jiàn)圖1;1207篇外文文獻(xiàn)(其中622篇來(lái)自Web of Science核心合集),見(jiàn)圖2。通過(guò)人工逐篇篩查,剔除相關(guān)程度較低和非學(xué)術(shù)類文獻(xiàn),最終有11 21篇中文文獻(xiàn),1073篇英文文獻(xiàn)(其中514篇來(lái)自Web of Science核心合集)。

        2.2 研究與分析方法。本文應(yīng)用Co-Occurrence14.9(后文簡(jiǎn)稱COOC)[6]研究文獻(xiàn)數(shù)量發(fā)展特征、主體特征、熱點(diǎn)主題,綜合使用CiteSpace、VOSviewer展示研究趨勢(shì)發(fā)展特征。

        3 國(guó)內(nèi)外數(shù)字保存研究建制化過(guò)程

        3.1 研究趨勢(shì)分析

        (1)國(guó)內(nèi)數(shù)字保存研究趨勢(shì)分析。國(guó)內(nèi)對(duì)數(shù)字保存的研究始于20世紀(jì)90年代末,根據(jù)發(fā)文趨勢(shì),可將研究進(jìn)程大致分為三個(gè)階段。

        第一階段:1997年—2004年,即數(shù)字保存研究的起步階段。該階段年發(fā)文量低于20篇,主要探討電子信息時(shí)代的新挑戰(zhàn),研究如何走出傳統(tǒng)知識(shí)保存的束縛,強(qiáng)調(diào)利用數(shù)字圖像技術(shù)開(kāi)展保護(hù)與利用并軌的重要性。

        第二階段:2005年—2019年,即數(shù)字保存研究的快速發(fā)展階段。該階段文獻(xiàn)發(fā)表數(shù)量增長(zhǎng)迅速且累計(jì)發(fā)文量呈指數(shù)增長(zhǎng),圖書(shū)館、檔案館等信息機(jī)構(gòu)也加大了在數(shù)字保存上的研究力度。研究主要包括:日益豐富和復(fù)雜的數(shù)字對(duì)象類型、長(zhǎng)期保存關(guān)鍵技術(shù)問(wèn)題、長(zhǎng)期保存的可持續(xù)發(fā)展問(wèn)題等。

        第三階段:2020年至今,即數(shù)字保存研究的成熟階段。年發(fā)文量開(kāi)始回落,發(fā)文速度逐漸放緩。這一階段,云計(jì)算和大數(shù)據(jù)技術(shù)等新技術(shù)的出現(xiàn)為數(shù)字保存提供了高效、可持續(xù)的策略。

        (2)國(guó)外數(shù)字保存研究趨勢(shì)分析。國(guó)外關(guān)于數(shù)字保存的實(shí)踐最早開(kāi)始于1998年由歐洲國(guó)家圖書(shū)館啟動(dòng)的“書(shū)目記錄計(jì)算機(jī)化行動(dòng)NEDLIB(Networked European DepositLibrary)項(xiàng)目”。該項(xiàng)目研制了DLS(數(shù)字圖書(shū)館系統(tǒng))中的編目、信息采集、DSEP(deposit system electronicpublication)等11 個(gè)模塊。國(guó)外最早關(guān)于數(shù)字保存的文獻(xiàn)出現(xiàn)在2000年,根據(jù)發(fā)文量趨勢(shì),可將國(guó)外研究劃分為兩個(gè)階段。

        第一階段:2000年—2008年,即數(shù)字保存研究的起步階段。該階段,年發(fā)文量低于20篇。2001年,聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心(OCLC)和研究圖書(shū)館集團(tuán)(Research LibraryGroup,RLG)聯(lián)合發(fā)布了《數(shù)字對(duì)象保存元數(shù)據(jù)現(xiàn)狀回顧》白皮書(shū)(Preservation Metadata for Digital Objects:A Review of the State of the Art)開(kāi)啟了數(shù)字信息資源長(zhǎng)期保存元數(shù)據(jù)的研究。2003年開(kāi)放檔案信息系統(tǒng)(Open Archival Information System,OAIS)模型正式成為ISO標(biāo)準(zhǔn)。2004年開(kāi)始舉辦數(shù)字資源長(zhǎng)期保存國(guó)際會(huì)議(International Conference on Digital Preservation,iPRES)促進(jìn)了該領(lǐng)域的研究發(fā)展。

        第二階段:2009年至今,即數(shù)字保存研究的快速發(fā)展階段。該階段,數(shù)字保存技術(shù)和理論的研究獲得了顯著進(jìn)展,包括數(shù)字存儲(chǔ)介質(zhì)的演進(jìn)、保存格式的多樣化以及保護(hù)策略的創(chuàng)新。2023年的研究開(kāi)始轉(zhuǎn)向利用數(shù)字領(lǐng)域新技術(shù)解決數(shù)字保存出現(xiàn)的新挑戰(zhàn),如人工智能在保存中的應(yīng)用,以及運(yùn)用新技術(shù)應(yīng)對(duì)不斷演變的數(shù)字格式。在實(shí)踐方面,自2017年開(kāi)始,美國(guó)、澳大利亞、加拿大、丹麥等為防范因設(shè)備、軟件過(guò)時(shí)或存儲(chǔ)介質(zhì)故障等造成的無(wú)法訪問(wèn)和使用的風(fēng)險(xiǎn),實(shí)施了相應(yīng)的數(shù)字保存戰(zhàn)略,在戰(zhàn)略中都注重風(fēng)險(xiǎn)監(jiān)測(cè)和標(biāo)準(zhǔn)制定,并強(qiáng)調(diào)保存好數(shù)字檔案資源的重要性。

        對(duì)比國(guó)內(nèi)外文獻(xiàn)發(fā)文趨勢(shì)可見(jiàn),我國(guó)在數(shù)字保存領(lǐng)域文獻(xiàn)研究早于國(guó)外,且我國(guó)先于國(guó)外進(jìn)入該領(lǐng)域發(fā)展的成長(zhǎng)階段和成熟階段。從發(fā)文數(shù)量可見(jiàn),我國(guó)每年的發(fā)文數(shù)量占據(jù)了該領(lǐng)域全球發(fā)文量的半邊天。

        3.2 研究機(jī)構(gòu)及其合作網(wǎng)絡(luò)可視化分析。對(duì)研究機(jī)構(gòu)及其合作關(guān)系分析可以揭示該領(lǐng)域的研究力量和研究網(wǎng)絡(luò)特征。本文對(duì)文獻(xiàn)的研究機(jī)構(gòu)進(jìn)行統(tǒng)計(jì)(僅統(tǒng)計(jì)第一作者所在機(jī)構(gòu),如果第一作者有多個(gè)所在機(jī)構(gòu),則僅計(jì)入第一機(jī)構(gòu)),以揭示研究機(jī)構(gòu)發(fā)展特征。

        (1)國(guó)內(nèi)研究機(jī)構(gòu)統(tǒng)計(jì)及分析。通過(guò)對(duì)CNKI數(shù)據(jù)庫(kù)中數(shù)字保存領(lǐng)域研究機(jī)構(gòu)進(jìn)行統(tǒng)計(jì),發(fā)文數(shù)量最多的機(jī)構(gòu)分別是鄭州大學(xué)(108篇)、武漢大學(xué)(83篇)和中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心(67篇)。發(fā)文量排名前10的研究機(jī)構(gòu)以及具體的發(fā)文數(shù)量如表1所示。由此可見(jiàn),該領(lǐng)域的國(guó)內(nèi)研究力量主要聚集于鄭州大學(xué)、武漢大學(xué)、中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心、國(guó)家圖書(shū)館和中國(guó)人民大學(xué)等。

        進(jìn)一步探索該領(lǐng)域研究機(jī)構(gòu)間的合作網(wǎng)絡(luò),利用CiteSpace對(duì)國(guó)內(nèi)研究機(jī)構(gòu)合作關(guān)系網(wǎng)絡(luò)進(jìn)行可視化,見(jiàn)圖3。

        由國(guó)內(nèi)研究機(jī)構(gòu)合作網(wǎng)絡(luò)可見(jiàn),目前形成了以武漢大學(xué)、中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心和中國(guó)人民大學(xué)為中心的合作網(wǎng)絡(luò)研究集群,體現(xiàn)出當(dāng)前對(duì)于數(shù)字保存的研究呈現(xiàn)出全域性合作的研究特征。此外,鄭州大學(xué)、河北大學(xué)、東北師范大學(xué)等,雖然發(fā)文量較大,但較少參與研究機(jī)構(gòu)間的合作。在這些研究機(jī)構(gòu)中,鄭州大學(xué)、武漢大學(xué)和中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心較早進(jìn)入該領(lǐng)域進(jìn)行研究,并在該領(lǐng)域持續(xù)深耕至今。

        (2)國(guó)外研究機(jī)構(gòu)統(tǒng)計(jì)及分析。通過(guò)對(duì)W e b o fScience核心集中的文獻(xiàn)進(jìn)行統(tǒng)計(jì),總發(fā)文數(shù)量最多的機(jī)構(gòu)分別是University of Maryland(11 篇)、TechnischeUniversitat Wien(10篇)和Old Dominion University(10篇),其中發(fā)文量排名前10的研究機(jī)構(gòu)以及具體的發(fā)文數(shù)量如表2所示。由此可見(jiàn)該領(lǐng)域的國(guó)外研究力量主要聚集于University of Maryland、Technische Universitat Wien、Old Dominion University和University of Illinois等。

        使用CiteSpace軟件對(duì)國(guó)外研究機(jī)構(gòu)的合作關(guān)系網(wǎng)絡(luò)進(jìn)行可視化(見(jiàn)圖4),可見(jiàn),國(guó)外合作網(wǎng)絡(luò)整體較為松散,故將軟件中的過(guò)濾方式調(diào)整為顯示最大K個(gè)子網(wǎng)絡(luò),得出合作關(guān)系較為緊密的若干研究機(jī)構(gòu)合作網(wǎng)絡(luò),分別是以Technische Universitat Wien為中心的研究子群,DrexelUniversity和Old Dominion University為中心構(gòu)成的研究子群,以及以University System of Maryland等為中心的研究子群。這些研究子群進(jìn)入數(shù)字保存領(lǐng)域各有先后,尚未形成在該領(lǐng)域長(zhǎng)期深耕的研究機(jī)構(gòu)。

        3.3 核心作者合作網(wǎng)絡(luò)可視化分析。核心作者被認(rèn)為是在特定研究領(lǐng)域中具有較深的造詣、較高的行業(yè)影響力,并且獲得行業(yè)領(lǐng)域認(rèn)可,科研成果較多,能提出較為新穎學(xué)術(shù)思想與觀點(diǎn)的學(xué)者。[7]通過(guò)對(duì)數(shù)字保存領(lǐng)域核心作者進(jìn)行分析,能更好地把握該領(lǐng)域發(fā)展的趨勢(shì)和熱點(diǎn)。

        (1)國(guó)內(nèi)核心作者合作關(guān)系網(wǎng)絡(luò)分析。為了更好地呈現(xiàn)作者之間的合作關(guān)系,使用CiteSpace軟件對(duì)作者間的合作關(guān)系網(wǎng)絡(luò)進(jìn)行可視化,見(jiàn)圖5。圖中節(jié)點(diǎn)面積的大小代表其發(fā)文量,節(jié)點(diǎn)間的連線代表作者間的合作關(guān)系,網(wǎng)絡(luò)密度由節(jié)點(diǎn)間連線的稀疏程度反映。國(guó)內(nèi)數(shù)字保存領(lǐng)域的核心作者為臧國(guó)全、吳振新、董曉莉等,且形成了以臧國(guó)全和吳振新為核心的研究子群。

        (2)國(guó)外核心作者合作關(guān)系網(wǎng)絡(luò)分析。使用CiteSpace軟件對(duì)英文文獻(xiàn)作者間的合作關(guān)系網(wǎng)絡(luò)進(jìn)行可視化,見(jiàn)圖6。國(guó)外核心作者合作關(guān)系呈整體分散,局部密集的特點(diǎn)。國(guó)外數(shù)字保存領(lǐng)域的核心作者為Christoph Becker,MichealL Nelson,Richard Marciano等人,且形成了以核心作者為中心的合作研究子群。

        3.4 高被引論文分析。論文的影響程度和在學(xué)術(shù)交流中的地位、作用可以在一定程度上通過(guò)論文被引頻次的高低所反映,引用次數(shù)高且引用周期長(zhǎng)的論文被稱為高被引論文。高被引論文在一定程度上反映了該學(xué)科領(lǐng)域的知識(shí)源流。[8]

        (1)國(guó)內(nèi)高被引論文分析。本文將從中國(guó)知網(wǎng)中檢索到的文獻(xiàn)按被引次數(shù)進(jìn)行降序排列,其中排名前10的高被引文獻(xiàn)如表3所示。

        通過(guò)對(duì)高被引文獻(xiàn)逐一閱讀,按照內(nèi)容關(guān)注點(diǎn)的不同,可以把論文主題分成三個(gè)方面:

        一是數(shù)字保存發(fā)展過(guò)程中遇到的問(wèn)題和挑戰(zhàn)。主要觀點(diǎn)包括區(qū)塊鏈技術(shù)雖然具有存儲(chǔ)、傳輸和數(shù)據(jù)信任方面的實(shí)用性,但對(duì)于數(shù)字檔案可靠性和可用性、多節(jié)點(diǎn)管理等方面還存在不足和風(fēng)險(xiǎn),以及知識(shí)產(chǎn)權(quán)問(wèn)題[9,10]。

        二是數(shù)字保存的技術(shù)策略。該項(xiàng)研究成果主要體現(xiàn)為區(qū)塊鏈技術(shù)應(yīng)用發(fā)展的可能性、非物質(zhì)文化遺產(chǎn)數(shù)字化采集保存和開(kāi)發(fā)、云存儲(chǔ)技術(shù)應(yīng)用和安全風(fēng)險(xiǎn)等[11 —13]。

        三是數(shù)字保存推進(jìn)的管理策略。馮惠玲[14]認(rèn)為檔案單軌管理制是推進(jìn)數(shù)字保存的重要環(huán)節(jié),并給出了單軌管理制實(shí)施的法律、政策和管理方面的必要條件。其他方面的相關(guān)研究包括:歐美國(guó)家在數(shù)據(jù)管護(hù)和數(shù)字資源長(zhǎng)期保存方面的研究進(jìn)展和啟示[15,16],主體責(zé)任和建立數(shù)字信息歸檔系統(tǒng)和選擇策略[17],非遺數(shù)字信息保護(hù)和管理的理論和知識(shí)體系[18],中歐數(shù)字資源長(zhǎng)期保存國(guó)際研討會(huì)關(guān)于管理和技術(shù)策略的介紹[19]和標(biāo)準(zhǔn)化等方面[20]。

        (2)國(guó)外高被引論文分析。將Web of Science的檢索結(jié)果按被引次數(shù)最高優(yōu)先的模式排序,排名前10的高被引論文如表4所示。通過(guò)仔細(xì)研讀Web of Science數(shù)據(jù)庫(kù)中10篇高被引論文,按照研究主題可分成硬件和軟件兩個(gè)方面。

        一是數(shù)字保存的硬件解決方案。Gomes等[21]提出了運(yùn)用3D技術(shù)對(duì)文化遺產(chǎn)進(jìn)行數(shù)字化保存的策略。Abel等[22]提出創(chuàng)建在線虛擬博物館對(duì)數(shù)據(jù)進(jìn)行保存。Bok等[23]提出利用一種創(chuàng)新的手持融合傳感器系統(tǒng),為大規(guī)模文化遺產(chǎn)的3D重建和數(shù)字化保存提供了一個(gè)實(shí)用且高效的解決方案。Kerne等[24]討論了Information-Based Ideation(IBI)的框架和評(píng)估方法,并且強(qiáng)調(diào)了數(shù)字策展在IBI任務(wù)中的重要作用。Lemieux[25]提出了區(qū)塊鏈技術(shù)記錄保存數(shù)據(jù)存在的問(wèn)題以及三種類型的解決方案。Vincent等[26]認(rèn)為眾包攝影測(cè)量技術(shù)(Crowd-Sourced Photogrammetric Reconstructions)能夠重建失落遺產(chǎn)和對(duì)遺產(chǎn)進(jìn)行記憶。Li等[27]介紹了3D數(shù)字化技術(shù)在數(shù)字檔案、3D線圖繪制、虛擬修復(fù)和虛擬展示等方面的作用。Blanco-Pons等[28]討論了通過(guò)AR技術(shù),以交互式虛擬信息展示方式解析暗淡、受損巖畫(huà)和數(shù)字化長(zhǎng)期保存的途徑。

        二是數(shù)字保存的軟件解決方案。Malone[29]介紹了專門(mén)為生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)分析和保存而開(kāi)發(fā)的軟件本體(SWO),并為其在存儲(chǔ)、管理和分析數(shù)據(jù)等方面的應(yīng)用提供了一個(gè)詳細(xì)的描述框架。Uhl等[30]通過(guò)整合 Convolutional NeuralNetworks(CNNs)和弱監(jiān)督學(xué)習(xí)方法,提供了一個(gè)能高效提取歷史地圖中人類聚居模式的方法。

        4 國(guó)內(nèi)外數(shù)字保存研究議題嬗變的可視化分析

        通過(guò)對(duì)檢索文獻(xiàn)進(jìn)行關(guān)鍵詞共現(xiàn)分析、聚類分析以及突變分析后,可得到數(shù)字保存研究的關(guān)鍵詞共現(xiàn)圖、關(guān)鍵詞聚類表及關(guān)鍵詞突現(xiàn)圖,由此可分析國(guó)內(nèi)外數(shù)字保存研究領(lǐng)域的發(fā)展脈絡(luò)、主題分布及熱點(diǎn)前沿。

        4.1 國(guó)內(nèi)外數(shù)字保存領(lǐng)域關(guān)鍵詞共現(xiàn)可視化分析

        (1)國(guó)內(nèi)數(shù)字保存領(lǐng)域文獻(xiàn)關(guān)鍵詞共現(xiàn)分析。運(yùn)用COOC軟件,對(duì)1 121篇中文文獻(xiàn)進(jìn)行統(tǒng)計(jì),共有關(guān)鍵詞1 652個(gè),其中單元頻次大于等于10的關(guān)鍵詞共有34個(gè)。由于在文獻(xiàn)檢索時(shí)使用“數(shù)字保存”和“數(shù)字長(zhǎng)期保存”作為檢索詞,所以在關(guān)鍵詞分析時(shí)不對(duì)上述關(guān)鍵詞進(jìn)行分析,并排除掉同義詞“長(zhǎng)期保存”與無(wú)意義詞“對(duì)策”“綜述”,余下的30個(gè)高頻關(guān)鍵詞見(jiàn)表5。

        根據(jù)關(guān)鍵詞兩兩共現(xiàn)原則,統(tǒng)計(jì)出30個(gè)高頻關(guān)鍵詞共同出現(xiàn)的頻次,形成30×30的共詞矩陣,并根據(jù)共詞矩陣,使用VOSviewer軟件進(jìn)行關(guān)鍵詞共現(xiàn)知識(shí)圖譜可視化(圖7),發(fā)現(xiàn)“數(shù)字信息資源”“圖書(shū)館”“數(shù)字圖書(shū)館”“保存策略”“數(shù)字檔案”等為數(shù)字保存相關(guān)研究領(lǐng)域的重要熱點(diǎn)。

        (2)國(guó)外數(shù)字保存領(lǐng)域文獻(xiàn)關(guān)鍵詞共現(xiàn)分析。由于Web of Science數(shù)據(jù)庫(kù)中并非所有在庫(kù)的文獻(xiàn)都存在關(guān)鍵詞,因此只對(duì)Web of Science核心合集中的514篇英文文獻(xiàn)進(jìn)行統(tǒng)計(jì),得到關(guān)鍵詞1588個(gè),其中出現(xiàn)頻次大于等于7的關(guān)鍵詞共有22個(gè)。由于在檢索文獻(xiàn)時(shí)使用“DigitalPreservation”和“Digital Curation”作為檢索詞,所以在關(guān)鍵詞分析時(shí)不對(duì)上述關(guān)鍵詞進(jìn)行分析,余下的20個(gè)高頻關(guān)鍵詞展示見(jiàn)表6。

        根據(jù)兩兩共現(xiàn)原則,統(tǒng)計(jì)出20個(gè)高頻關(guān)鍵詞在514篇中共同出現(xiàn)的頻次,形成20×20的共詞矩陣,并根據(jù)共詞矩陣,使用VOSviewer進(jìn)行可視化(圖8)。根據(jù)節(jié)點(diǎn)大小,可以看出“Cultural Heritage”“Digital Humanities”“Metadata”“OAIS”等關(guān)鍵詞是國(guó)外研究數(shù)字保存領(lǐng)域的熱點(diǎn)話題??梢?jiàn)國(guó)外主要以文化遺產(chǎn)為對(duì)象研究數(shù)字人文解決方案,重點(diǎn)關(guān)注元數(shù)據(jù)和開(kāi)放檔案管理系統(tǒng)。

        4.2 國(guó)內(nèi)外數(shù)字保存領(lǐng)域關(guān)鍵詞聚類分析

        (1)國(guó)內(nèi)文獻(xiàn)關(guān)鍵詞聚類分析。使用VOSviewer軟件將研究領(lǐng)域中具有高度相似特性的關(guān)鍵詞進(jìn)行聚類,在分辨率為1.00的條件下形成7個(gè)簇,見(jiàn)表7。

        Cluster1聚焦于數(shù)字檔案的管理,包括數(shù)字檔案信息、數(shù)字檔案館建設(shè)以及與電子文件相關(guān)的議題,尤其探討了美國(guó)在該方面的研究;Cluster2著重于研究數(shù)字圖書(shū)館,及數(shù)字圖書(shū)館信息資源數(shù)字化過(guò)程中的知識(shí)產(chǎn)權(quán);Cluster3更關(guān)注數(shù)字資源有效保存的策略、資源以及與之相關(guān)的風(fēng)險(xiǎn)管理;Cluster4更關(guān)注于數(shù)字保存具體的技術(shù)解決方案,如OAIS、元數(shù)據(jù)在保存中的應(yīng)用,以及監(jiān)測(cè)數(shù)字保存風(fēng)險(xiǎn)的方法;Cluster5側(cè)重于圖書(shū)館中的數(shù)字文獻(xiàn)保存;Cluster6聚焦于公共圖書(shū)館的數(shù)字化進(jìn)程、大數(shù)據(jù)應(yīng)用以及LOCKSS的使用;Cluster7專注于云存儲(chǔ)技術(shù)在數(shù)字保存中的應(yīng)用和實(shí)踐。

        (2)國(guó)外文獻(xiàn)關(guān)鍵詞聚類分析。對(duì)Web of Science核心合集中的514篇英文文獻(xiàn),使用VOSviewer設(shè)置分辨率為1.00對(duì)高頻關(guān)鍵詞進(jìn)行聚類,形成7個(gè)不同的簇(表8)。

        Cluster1和Cluster7專注于3D技術(shù)在文化遺產(chǎn)數(shù)字化方面的應(yīng)用,著重使用三維技術(shù)通過(guò)對(duì)文化遺產(chǎn)的物理形態(tài)進(jìn)行掃描、建模等方式實(shí)施數(shù)字化,以便長(zhǎng)期保存;Cluster2集中于數(shù)據(jù)的組織、管理和標(biāo)準(zhǔn)化,Metadata和Ontology作為信息的橋梁確保信息以一種標(biāo)準(zhǔn)化和互操作的方式被記錄和共享;Cluster3涉及數(shù)字資料的真實(shí)性以及檔案信息系統(tǒng)的標(biāo)準(zhǔn)(OAIS和Premis);Cluster4聚焦利用圖像捕捉技術(shù)對(duì)物理實(shí)體進(jìn)行記錄和保護(hù);Cluster5關(guān)注于CNNs(卷積神經(jīng)網(wǎng)絡(luò))在數(shù)字人文領(lǐng)域中的應(yīng)用,例如CNNs在圖像識(shí)別、語(yǔ)音處理和自然語(yǔ)言理解等方面為人文學(xué)科的研究提供了新的工具;Cluster6包括數(shù)字圖書(shū)館和網(wǎng)絡(luò)存檔,著重于數(shù)字信息資源的保管、檢索以及長(zhǎng)期可用性。

        4.3 國(guó)內(nèi)外數(shù)字保存領(lǐng)域關(guān)鍵詞突現(xiàn)可視化分析。為了進(jìn)一步把握數(shù)字保存領(lǐng)域研究熱點(diǎn)的演進(jìn)趨勢(shì),并推斷和預(yù)測(cè)出可能對(duì)未來(lái)研究和發(fā)展具有重大影響的新概念或前沿話題,使用COOC軟件對(duì)數(shù)字保存領(lǐng)域中英文文獻(xiàn)的關(guān)鍵詞進(jìn)行突發(fā)性檢測(cè),并將結(jié)果進(jìn)行可視化,以清晰地展示在不同時(shí)間段內(nèi)關(guān)鍵詞的流行程度以及關(guān)注度的變化。

        (1)國(guó)內(nèi)文獻(xiàn)關(guān)鍵詞突現(xiàn)分析。使用COOC軟件的突現(xiàn)檢測(cè)功能,過(guò)濾掉單元頻次小于5的關(guān)鍵詞,按照順序?qū)⑶?0個(gè)關(guān)鍵詞保留并進(jìn)行可視化(圖9),以分析各階段研究主題關(guān)注度的演變。

        在數(shù)字保存研究的起步階段(2000年—2004年)主要關(guān)注數(shù)字圖書(shū)館。

        在數(shù)字保存研究的快速發(fā)展階段,研究出現(xiàn)了三個(gè)階段的變化。2005年—2011 年關(guān)鍵詞突現(xiàn)為OAIS、LOCKSS、數(shù)字信息保存、檔案館、長(zhǎng)期保存、數(shù)字信息資源、質(zhì)量標(biāo)準(zhǔn)框架、數(shù)字保存系統(tǒng)。這一時(shí)期的研究者著重關(guān)注于數(shù)字信息資源保存的途徑、方式以及統(tǒng)一的規(guī)范,表明了數(shù)字化資源管理成了研究和實(shí)踐的焦點(diǎn)。2011 年—2015年關(guān)鍵詞突現(xiàn)為知識(shí)產(chǎn)權(quán)、認(rèn)知調(diào)查、實(shí)踐調(diào)查、保存成本、數(shù)字保存項(xiàng)目。在這個(gè)階段數(shù)字保存的知識(shí)產(chǎn)權(quán)問(wèn)題開(kāi)始受到重視,并且數(shù)字保存項(xiàng)目及其成本也受到了關(guān)注。2015年—2019年關(guān)鍵詞突現(xiàn)包括美國(guó)、數(shù)字檔案、電子文件、風(fēng)險(xiǎn)檢測(cè)。在這4年間研究者更關(guān)注于電子文件和檔案以及對(duì)于它們保存系統(tǒng)的風(fēng)險(xiǎn)評(píng)估,以保證這些資料的安全、可靠和完整性。

        在數(shù)字保存研究的成熟階段(2019年—2023年)產(chǎn)生的突現(xiàn)詞為公共圖書(shū)館和檔案數(shù)字資源。學(xué)者們更多地關(guān)注公共圖書(shū)館在提供數(shù)字保存服務(wù)方面的作用以及檔案數(shù)字資源的保存。

        (2)國(guó)外文獻(xiàn)關(guān)鍵詞突現(xiàn)分析。Web of Science核心合集中從2009年開(kāi)始出現(xiàn)關(guān)鍵詞。使用COOC軟件的突現(xiàn)檢測(cè)功能,過(guò)濾掉單元頻次小于3的關(guān)鍵詞,并按照順序?qū)⑶?0個(gè)關(guān)鍵詞保留并進(jìn)行可視化(圖10),以分析各階段研究主題關(guān)注度的演變。

        2009年—2011 年的突現(xiàn)詞有Digital Libraries、Preservation。在這一階段數(shù)字圖書(shū)館以及對(duì)文獻(xiàn)和數(shù)字內(nèi)容長(zhǎng)期保存的方法和策略得到了廣泛關(guān)注。

        2012年—2015年突現(xiàn)的關(guān)鍵詞包括Image Processing、Ontology、Cloud、Web Archiving,這一時(shí)期的學(xué)者著重于數(shù)字信息資源的結(jié)構(gòu)化保存以及通過(guò)在線的方式將數(shù)字信息資源進(jìn)行長(zhǎng)期的存儲(chǔ)。

        2 0 1 6 年— 2 0 2 0 年產(chǎn)生了較多的突現(xiàn)詞, 包括Convolution Neural Networks、Ontology、Deep Learning、Conservation、Digitization、Computational ArchivalScience、Research Data Management、Interoperability、Computational Thinking、Privacy、Virtual Reality??梢钥闯?,這一時(shí)期數(shù)字保存領(lǐng)域的發(fā)展比較活躍,同時(shí)機(jī)器學(xué)習(xí)和人工智能開(kāi)始在數(shù)字保存領(lǐng)域得到重視。

        2021年—2023年隨著大數(shù)據(jù)和數(shù)據(jù)科學(xué)的發(fā)展,該階段突現(xiàn)詞包括Data Management、Digital Humanities、Cultural Heritage,數(shù)據(jù)管理在數(shù)字保存中的作用得到重視。

        5 結(jié)論與啟示

        基于文獻(xiàn)計(jì)量分析和文獻(xiàn)研究方法,本文在橫向上勾勒了數(shù)字保存研究建制化過(guò)程;在縱向上梳理了數(shù)字保存研究趨勢(shì)、研究主題的演進(jìn)脈絡(luò)??傮w而言,數(shù)字保存文獻(xiàn)研究始于20世紀(jì)90年代末,發(fā)展至今已有20余載,文獻(xiàn)數(shù)量從年發(fā)文量個(gè)位數(shù)實(shí)現(xiàn)了累計(jì)發(fā)文量指數(shù)級(jí)增長(zhǎng)。隨著數(shù)字資源采購(gòu)經(jīng)費(fèi)的大幅增加,館藏資源結(jié)構(gòu)越來(lái)越向數(shù)字資源方向傾斜,相關(guān)研究與實(shí)踐愈加豐富。本文綜合運(yùn)用Co-Occurrence軟件及其他輔助軟件,直觀形象地揭示了國(guó)內(nèi)外數(shù)字保存領(lǐng)域發(fā)展脈絡(luò)。

        (1)國(guó)內(nèi)外數(shù)字保存的發(fā)文量經(jīng)歷了緩慢起步和快速發(fā)展兩個(gè)階段。我國(guó)在文獻(xiàn)研究方面起步較早,國(guó)外則在相關(guān)實(shí)踐方面起步較早,我國(guó)先于國(guó)外進(jìn)入成熟階段。數(shù)字檔案長(zhǎng)期保存是一項(xiàng)艱巨的系統(tǒng)工程,文獻(xiàn)研究的側(cè)重點(diǎn)也越來(lái)越多樣化,包括:日益豐富和復(fù)雜的數(shù)字對(duì)象類型、長(zhǎng)期保存關(guān)鍵技術(shù)問(wèn)題、長(zhǎng)期保存可持續(xù)發(fā)展的管理策略等。

        (2)從研究主體角度分析,通過(guò)對(duì)比國(guó)內(nèi)外研究機(jī)構(gòu)合作網(wǎng)絡(luò)圖譜可見(jiàn),我國(guó)的研究機(jī)構(gòu)主要集中于大學(xué)、情報(bào)中心和圖書(shū)館等研究機(jī)構(gòu),且發(fā)文量較大,而國(guó)外研究機(jī)構(gòu)主要集中于大學(xué),且發(fā)文量較小。我國(guó)在該領(lǐng)域形成了以核心節(jié)點(diǎn)為中心的較為緊密的合作網(wǎng)絡(luò),且核心節(jié)點(diǎn)在該領(lǐng)域持續(xù)深耕,保持了較好的研究傳承;國(guó)外合作關(guān)系整體較為松散,存在規(guī)模較小的研究子群,且核心節(jié)點(diǎn)在該領(lǐng)域持續(xù)深耕現(xiàn)象并不明顯。通過(guò)對(duì)比國(guó)內(nèi)外核心作者合作網(wǎng)絡(luò)圖譜可見(jiàn),在國(guó)內(nèi)形成了以臧國(guó)全和吳振新為核心的較大的合作網(wǎng)絡(luò),且核心作者在該領(lǐng)域持續(xù)深耕;國(guó)外合作網(wǎng)絡(luò)呈整體分散,局部密集的特點(diǎn),形成了進(jìn)入該領(lǐng)域早晚不一的研究子群。

        (3)從研究議題角度分析,國(guó)內(nèi)側(cè)重于研究圖書(shū)館、數(shù)字檔案等“數(shù)字信息資源”的“保存管理策略”,而國(guó)外則側(cè)重于研究基于元數(shù)據(jù)的文化遺產(chǎn)、數(shù)字人文方面的開(kāi)放檔案信息系統(tǒng),以及先進(jìn)數(shù)字技術(shù)在數(shù)字保存應(yīng)用中的研究,側(cè)重于數(shù)字保存的技術(shù)解決方案。綜合國(guó)內(nèi)外文獻(xiàn)關(guān)鍵詞聚類分析可見(jiàn),國(guó)內(nèi)外均關(guān)注于數(shù)字信息資源的組織、管理和標(biāo)準(zhǔn)化;在數(shù)字保存方法上均探討了OAIS、元數(shù)據(jù)等方式的使用。國(guó)外更多側(cè)重于使用3D技術(shù)和圖像捕捉等技術(shù)在文化遺產(chǎn)數(shù)字化方面的應(yīng)用。綜合國(guó)內(nèi)外數(shù)字保存高頻關(guān)鍵詞突現(xiàn)分析,可見(jiàn)我國(guó)數(shù)字保存的文獻(xiàn)研究從2005年開(kāi)始進(jìn)入了多元化研究領(lǐng)域,國(guó)外2012年開(kāi)始多元化;我國(guó)的研究側(cè)重于數(shù)字保存的管理方式和風(fēng)險(xiǎn)規(guī)避等方面,國(guó)外則側(cè)重于數(shù)字保存技術(shù)的研究;OAIS、LOCKSS等圖書(shū)館數(shù)字資源長(zhǎng)期保存新方式和新機(jī)制的研究是國(guó)內(nèi)外共同的研究熱點(diǎn)。

        猜你喜歡
        發(fā)文領(lǐng)域文獻(xiàn)
        Hostile takeovers in China and Japan
        速讀·下旬(2021年11期)2021-10-12 01:10:43
        10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
        Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
        大東方(2019年12期)2019-10-20 13:12:49
        領(lǐng)域·對(duì)峙
        青年生活(2019年23期)2019-09-10 12:55:43
        校園拾趣
        爺孫趣事
        以牙還牙
        The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
        The Role and Significant of Professional Ethics in Accounting and Auditing
        商情(2017年1期)2017-03-22 16:56:36
        新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
        国产人妻人伦精品1国产盗摄| 日本久久大片中文字幕| 丰满少妇被猛进去高潮| 轻点好疼好大好爽视频| 国产又黄又大又粗视频| 亚洲精品国产成人| 欧美狠狠入鲁的视频777色| 国产精品v片在线观看不卡| 久久偷看各类wc女厕嘘嘘偷窃| 久久综合久久鬼色| 亚洲地区一区二区三区| 日韩亚洲一区二区三区在线| 亚洲成av人片不卡无码| 久久老子午夜精品无码怎么打 | 成人精品国产亚洲欧洲| 国产一区二区熟女精品免费| 乱人伦中文视频在线| 美女自卫慰黄网站| 亚洲青青草视频在线播放| 青青草小视频在线观看| 欧美人与动人物牲交免费观看久久| 欧美亚洲日本在线| 蜜桃视频高清在线观看| 色偷偷激情日本亚洲一区二区 | 亚洲产国偷v产偷v自拍色戒| 一亚洲一区二区中文字幕| 美女视频在线观看亚洲色图 | 国产天堂av手机在线| 日本女优在线一区二区三区| 真人作爱免费视频| 在线无码国产精品亚洲а∨| 亚洲综合中文日韩字幕| 四川丰满妇女毛片四川话| 四虎4545www国产精品| 日本大片在线一区二区三区 | 国产强被迫伦姧在线观看无码| 久久久久亚洲av无码网站| 蜜臀av国内精品久久久人妻| 国产一区二区三区在线观看完整版| 性一交一乱一伧国产女士spa | 久久久久AV成人无码网站|