亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        我國文獻資源保障體系論文主題識別與演化分析

        2021-01-23 00:54:30田栩冉馬笑笑李玉海
        知識管理論壇 2021年6期

        田栩冉 馬笑笑 李玉海

        摘要:[目的/意義]對我國文獻資源保障體系論文主題演化的路徑進行分析,為重構(gòu)我國文獻資源保障體系提供借鑒。[方法/過程]主要使用LDA模型對所搜集到的文獻進行聚類,首先以時間段為劃分依據(jù),繪制主題詞共現(xiàn)網(wǎng)絡(luò),探索各主題之間的交互關(guān)系,后通過相似度計算判定各主題內(nèi)部的演化路徑并繪制桑基圖以可視化形式展現(xiàn)演化結(jié)果。[結(jié)果/結(jié)論]研究發(fā)現(xiàn)我國文獻資源保障體系的相關(guān)主題在2000年左右均已基本出現(xiàn),主題主要包含資源角度和機構(gòu)角度兩大類,且受計算機技術(shù)和國家政策影響較大,并針對該兩大類主題,給出相應(yīng)的對策與建議。

        關(guān)鍵詞:文獻資源保障體系? ? LDA? ? 主題識別? ? 主題演化

        分類號:G253

        引用格式:田栩冉, 馬笑笑, 李玉海. 我國文獻資源保障體系論文主題識別與演化分析[J/OL]. 知識管理論壇, 2021, 6(6): 303-314[引用日期]. http://www.kmf.ac.cn/p/263/.

        1? 引言

        目前全球競相步入5G(第五代移動電話行動通信標(biāo)準(zhǔn),也稱第五代移動通信技術(shù))時代,相比之前的4G時代,網(wǎng)絡(luò)數(shù)據(jù)的傳輸速度將會更快,5G技術(shù)可以被更快速更高效地運用到多個領(lǐng)域。傳統(tǒng)的文獻資源與新型的數(shù)字文獻資源數(shù)量不斷累積,通過文獻信息資源的整體建設(shè),建立起能在一定范圍內(nèi)有效保障社會文獻需求的文獻信息資源系統(tǒng)——文獻資源保障體系[1]。

        在這樣一個本該互聯(lián)互通的時代浪潮之下,國外數(shù)據(jù)庫商依仗其豐富的文獻資源,坐地起價,企圖繼續(xù)壟斷資源,引發(fā)了國內(nèi)圖書館人的不滿。歐洲大學(xué)協(xié)會(European University Association,EUA)發(fā)布的一份報告顯示,學(xué)術(shù)機構(gòu)、圖書館與美國化學(xué)學(xué)會(ACS)、愛思唯爾(Elsevier)、威利(Wiley)、施普林格·自然(Springer Nature)和泰勒弗朗西斯集團(Taylor&Francis)等出版商的交易成本正以每年3.6%的速度上漲。文獻資源,尤其是科技文獻資源,是對科學(xué)最新前沿研究結(jié)果的展現(xiàn),如果放棄相關(guān)資源的購買,則會喪失國際科研競爭力;如果繼續(xù)服從霸王條款,依然無法改變被動的局面。故而,在以程煥文先生為代表的《十問數(shù)據(jù)商?。?!》等一系列詰問之后,重構(gòu)我國的文獻資源保障體系成為當(dāng)務(wù)之急。

        目前國外已有一部分高校通過開放獲取出版的方式應(yīng)對數(shù)據(jù)商壟斷價格的脅迫。2019年2月,加州大學(xué)在終止與愛思唯爾的協(xié)議后,于同年4月,同劍橋大學(xué)出版社簽署了美國史上第一個開放獲取出版協(xié)議。但我國至今還沒有能夠有效應(yīng)對漲價的完整的文獻資源保障體系方案。重構(gòu)文獻資源保障體系長路漫漫,把握好重構(gòu)之路需要對過往已有的研究進行宏觀上的把握。通過對過往研究的梳理,了解文獻資源保障體系這一框架之下具有哪些方面的研究主題和工作內(nèi)容,有利于為重構(gòu)文獻資源保障體系提供指導(dǎo)借鑒,有利于改變近幾年被計算機技術(shù)牽著鼻子被動向前的發(fā)展局面,從而以歷史為指針,以新興技術(shù)為滾輪,構(gòu)建起自給自足的、能夠與國內(nèi)外數(shù)據(jù)庫商相抗衡的文獻資源保障體系。

        2? LDA模型與研究設(shè)計

        2.1? LDA模型介紹

        為探究過往文獻資源保障體系相關(guān)文獻的研究主題,需要對已發(fā)表的相關(guān)文獻主題演化趨勢進行研究。而一篇文章的關(guān)鍵詞有的代表研究問題,有的代表研究方法,有的代表研究對象,因此僅從關(guān)鍵詞入手不利于對文獻主題進行識別[2]。目前既有研究大多采用主題模型的方法挖掘主題和探究主題演化。其中最簡單的是詞頻-逆文檔頻率(Term Frequency- Inverse Document Frequency,TF-IDF),將文檔集表示成以文檔為行、以單詞為列的矩陣,該矩陣的值與某一詞在特定文檔中的頻率成正比,與其在多個文檔中的頻率成反比。TF-IDF容易出現(xiàn)矩陣稀疏的情況,即只是從詞頻的角度而非以語義的形式表示文檔[3],還容易低估在一個類中高頻出現(xiàn)的卻能夠代表這個類的主題的詞[4],因此需要不斷調(diào)整TF-IDF的各項參數(shù)以適應(yīng)實際需求[5]。故本文以LDA(Latent Dirichlet allocation)主題模型為基礎(chǔ),對歷年文獻資源保障體系相關(guān)文獻進行主題識別。LDA即隱含狄利克雷分布,是基于“文檔-主題-詞”的三層貝葉斯概率模型[6]。具體的聯(lián)合概率公式為:

        其中,θ表示主題分布,α是主題分布θ的先驗分布(即Dirichlet分布)參數(shù),β是關(guān)鍵詞分布的先驗分布參數(shù),z表示模型生成的主題,w表示模型最終生成的關(guān)鍵詞,N表示文檔的詞語數(shù)量,M表示文檔數(shù)量,三層概率模型如圖1所示:

        2.2? 研究設(shè)計

        此前較少有學(xué)者對我國文獻資源保障體系相關(guān)文獻進行主題演化分析,本文主要利用LDA模型對相關(guān)文獻進行主題識別,實現(xiàn)LDA模型對文獻資源保障體系相關(guān)文獻的應(yīng)用。進一步繪制關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)和主題演化?;鶊D,從宏觀數(shù)量層面和微觀時間線層面進行演化分析,主題識別流程具體分為4個模塊,如圖2所示:

        (1)數(shù)據(jù)庫選擇和數(shù)據(jù)搜集。本文的研究對象是國內(nèi)文獻資源保障體系論文主題演化發(fā)展,故選擇CNKI期刊全文數(shù)據(jù)庫作為數(shù)據(jù)來源。檢索主題詞為“文獻資源保障體系”“文獻信息資源保障體系”“文獻保障體系”和“文獻資源保障”,邏輯連接詞為“OR”。檢索年份為2021年之前的所有相關(guān)文獻。在人工去除部分不相關(guān)的文獻之后,累積相關(guān)文獻共計1 429篇,將相關(guān)文獻的標(biāo)題、關(guān)鍵詞、摘要匯總作為數(shù)據(jù)源備用。

        (2)數(shù)據(jù)預(yù)處理。根據(jù)以上所收集到的數(shù)據(jù),對所有文獻的標(biāo)題、關(guān)鍵詞和摘要信息進行合并,將其視為代表該文獻的長文本,之后利用Python的jieba分詞工具包進行中文分詞。為了提高分詞的效果,需要設(shè)置用戶自定義詞典,根據(jù)多次的分詞試驗結(jié)果,將“文獻資源”“雙一流”“大數(shù)據(jù)”等專有名詞保存進自定義詞典以提高分詞結(jié)果的有效性。分詞過程中還要添加停用詞表,本文選用的是常用的中文停用詞表——哈工大停用詞表。最后將分詞的結(jié)果進行保存,作為LDA模型構(gòu)建的數(shù)據(jù)。

        (3)LDA建模。在用LDA 模型進行主題識別前需要計算最優(yōu)的主題數(shù)目。本文采用Python中的scikit-learn工具包中的K-means算法,通過計算分詞文本的簇內(nèi)誤差平方和系數(shù)(Distortions)和輪廓系數(shù)(Silhouette)來確定最優(yōu)聚類數(shù)k,其中Distortions 系數(shù)越小越好,Silhouette系數(shù)越大越好,結(jié)果如圖3、圖4所示:

        由圖3、圖4可知,綜合考慮簇內(nèi)誤差平方和系數(shù)(Distortions)和輪廓系數(shù)(Silhouette),選擇12個聚類數(shù)較為合適。筆者在后續(xù)的LDA建模中將聚類主題數(shù)設(shè)置為12,α和β均保持python庫中的默認(rèn)值。由于本文將標(biāo)題、摘要和關(guān)鍵詞統(tǒng)一視為一段長文本,故在此各權(quán)重一致。

        要想在LDA模型聚類結(jié)果中探索不同主題的演化路徑,除了結(jié)合文獻發(fā)表時間這一自然屬性之外,還要通過計算文本相似度、設(shè)定一定的閾值來確定具有較高相關(guān)性的文本主題,進而判定為演化關(guān)系,以形成該類主題的演化路徑。本文采用計算余弦相似度的方法來衡量不同年份下同一聚類內(nèi)部文本的相似度,從而確定主題間的演化路徑。余弦相似度的計算公式如下:

        余弦相似度的取值范圍在(0,1)之間,取值越大說明兩文本越相關(guān),由于文摘部分內(nèi)容較長,為避免數(shù)據(jù)過于稀疏,將相似度指標(biāo)設(shè)置在0.1,即兩文本相似度大于0.1時,可認(rèn)定為具有演化關(guān)系,并結(jié)合文本發(fā)表年份繪制主題演化路徑。

        (4)主題結(jié)果分析。結(jié)合文獻資源保障體系相關(guān)文獻的數(shù)量分布和LDA模型聚類的主題結(jié)果,進行進一步的深入分析,一方面從宏觀的數(shù)量層面探究我國文獻資源保障體系的相關(guān)文獻數(shù)量的變化,另一方面從微觀的主題層面探究我國文獻資源保障體系相關(guān)文獻的主題演化路徑。

        3? 文獻資源保障體系主題結(jié)果及演化分析

        3.1? LDA模型主題識別結(jié)果分析

        根據(jù)歷年發(fā)表的相關(guān)文獻數(shù)量,繪制逐年折線圖(圖5)。在1983年,我國頒布了《中華人民共和國國家標(biāo)準(zhǔn)·文獻著錄總則》(GB3792.1-83),該文件將“文獻”定義為“記錄有知識的一切載體”。這一概念的提出,使得學(xué)術(shù)界對于“文獻”的內(nèi)涵與外延有了較為統(tǒng)一的定論。漸漸地,“圖書”“藏書”這兩個名詞也都逐漸被涵蓋在“文獻”這一定義之下。根據(jù)檢索結(jié)果,從1984年起,陸續(xù)有文獻資源保障體系相關(guān)的文獻發(fā)表,與之伴隨的正是圖書館職能轉(zhuǎn)變的探討:將圖書館藏書從收藏化為利用,更好地為社會各界的文獻資源需求提供保障。2000年前后,相關(guān)文獻的數(shù)量開始快速上升,而在2010年往后,相關(guān)文獻的數(shù)量開始呈現(xiàn)下降的趨勢。

        表1為LDA主題模型識別結(jié)果,從同一主題下的詞項中,選取概率較高且具有主題意義的詞項,并歸納出相應(yīng)的主題標(biāo)識來代表該主題。由表1可知,信息資源評價、文獻資源建設(shè)、文獻資源共享、數(shù)字圖書館等一系列與文獻資源保障體系相關(guān)的主題被識別出來。根據(jù)相關(guān)文獻發(fā)表數(shù)量的逐年變化,將相關(guān)的文獻數(shù)據(jù)劃分為三個部分,分別為Ⅰ時期(1984-1999年)、Ⅱ時期(2000-2010年)和Ⅲ時期(2011-2020年),并利用CiteSpace可視化軟件繪制相關(guān)文獻的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)(圖6-圖8),展現(xiàn)相關(guān)主題詞之間的聯(lián)系。

        Ⅰ時期(1984-1999年)的主題主要集中在Topic3圖書情報機構(gòu)、Topic4文獻資源共享、Topic6高校圖書館、Topic8文獻資源建設(shè)、Topic10文獻收藏與Topic12文獻組織。研究內(nèi)容主要是傳統(tǒng)的圖書館等圖書情報機構(gòu)職能研究與新世紀(jì)的展望和規(guī)劃。

        20世紀(jì)的文獻資源主要還是以紙質(zhì)文獻資源為主,但是數(shù)字化的文獻資源也逐漸發(fā)展起來,與之相對應(yīng)的是數(shù)據(jù)庫的變化發(fā)展,1986年,國家海洋局情報所首先引進國外只讀光盤(CD-ROM)數(shù)據(jù)庫以后,各高校圖書館和情報機構(gòu)也紛紛引入只讀光盤,用于課題檢索,具體包括定題服務(wù)、回溯檢索、專題服務(wù)、成果查新和專利審查的查新等[7]。1992年,由中國科技情報研究所重慶分所數(shù)據(jù)庫研究中心推出的《中文科技期刊篇名數(shù)據(jù)庫》(CB ISTIC/CEPC Periodicals ChinaBase)只讀光盤版正式發(fā)行,系我國大陸第一張中文數(shù)據(jù)光盤。1997年1月,《中國學(xué)術(shù)期刊(光盤版)》正式定期發(fā)行,是我國第一部大規(guī)模集成化學(xué)術(shù)期刊全文數(shù)據(jù)庫,圖書館界將此視為我國進入數(shù)字圖書館時代的標(biāo)志和里程碑。

        然而,互聯(lián)網(wǎng)的發(fā)展速度遠(yuǎn)快于光盤數(shù)據(jù)庫的發(fā)展速度。在世界銀行的《1998年度世界發(fā)展報告》提出國家知識基礎(chǔ)設(shè)施(National Knowledge Infrastructure,NKI)的概念之后,1999年3月,王明亮提出要建設(shè)中國知識基礎(chǔ)設(shè)施工程(China National Knowledge Infrastructure,CNKI)。重慶維普資訊有限公司于2000年建立了維普資訊網(wǎng)。萬方數(shù)據(jù)公司在20世紀(jì)90年代初推出國內(nèi)第一個資訊產(chǎn)品——《中國企業(yè)、公司及產(chǎn)品數(shù)據(jù)庫》。至此,知網(wǎng)、維普和萬方逐漸成為國內(nèi)主流的三大數(shù)據(jù)服務(wù)平臺。

        Ⅱ時期(2000-2010年)和 Ⅲ時期(2011-2020年)的主題主要集中在Topic8文獻資源建設(shè)、Topic4文獻資源共享、Topic6高校圖書館、Topic5文獻資源保障系統(tǒng)等主題。可見21世紀(jì)所面臨的主要挑戰(zhàn)是建設(shè)面向新時代、面向社會各個領(lǐng)域的文獻信息資源,逐步建立起文獻資源保障體系。

        文獻資源保障體系是一個集文獻的收集、貯存、揭示、傳遞、利用等諸多功能為一體的社會系統(tǒng)[8]。在整個文獻資源保障體系的運行模式上,肖希明認(rèn)為等級結(jié)構(gòu)控制的方式是構(gòu)建我國文獻資源保障體系模式的正確選擇,在以大系統(tǒng)的等級結(jié)構(gòu)控制為基本構(gòu)架的同時,吸收其他控制方式的優(yōu)點,構(gòu)建一個由地區(qū)(省、市、自治區(qū))級、區(qū)域(行政大區(qū))級和國家級文獻資源網(wǎng)構(gòu)成的三級網(wǎng)絡(luò)結(jié)構(gòu)模式[8]。孫瑞英在此基礎(chǔ)上提出增加建立國際級保障體系的建議[9]。

        Topic5文獻資源保障系統(tǒng)是文獻資源保障體系研究中的重要實踐。作為我國最早啟動的文獻信息資源保障系統(tǒng),“中國高等教育文獻保障系統(tǒng)”(China Academic Library & Information System,CALIS)于1998年正式成立,CALIS作為“211工程”建設(shè)的公共服務(wù)體系之一,為各高校的重點學(xué)科發(fā)展起到了支撐保障作用,內(nèi)容上涵蓋了農(nóng)業(yè)文獻、法學(xué)文獻、商業(yè)文獻、醫(yī)學(xué)文獻、體育文獻等各個不同學(xué)科領(lǐng)域,結(jié)構(gòu)上包括了標(biāo)準(zhǔn)文獻、科技文獻和外文文獻等不同類型的文獻。除CALIS之外,后續(xù)開發(fā)出了多個文獻資源保障系統(tǒng),例如:北京地區(qū)高校圖書館文獻資源保障體系(BALIS)[10]、江蘇省高等教育文獻保障系統(tǒng)(JALIS)[11]、中國高校人文社會科學(xué)文獻中心(CASHL)[12]、國家科技圖書文獻中心(NSTL)[13]和國家科學(xué)數(shù)字圖書館(CSDL)[14]等。

        進入Ⅲ時期(2011-2020年),自2015年國務(wù)院發(fā)布了《統(tǒng)籌推進世界一流大學(xué)和一流學(xué)科建設(shè)總體方案》(簡稱“雙一流”建設(shè))[15] 之后,“211工程”建設(shè)逐漸轉(zhuǎn)為“雙一流”建設(shè),CALIS以及其他文獻資源保障系統(tǒng)的職能也發(fā)生了相應(yīng)變化,主要為高校“一流學(xué)科”的文獻信息需求提供保障。

        3.2? 主題演化分析

        除了較為粗粒度地將文獻主題劃分為三大時期進行關(guān)鍵詞共現(xiàn)分析之外,本文還根據(jù)余弦相似度,結(jié)合文獻的發(fā)表時間來繪制桑基圖(Sankey Diagram),進一步探究文獻資源保障體系主題的演化路徑。?;鶊D,又稱為?;芰糠至鲌D,起源于1898年的“蒸汽機的能源效率圖”。在桑基圖中,對象用元素塊來表示,對象間產(chǎn)生能量的流動方向及聯(lián)系則通過連線來表示。本文的元素塊表示某一研究主題,主題之間的連線表示主題之間的演化關(guān)系,主題元素塊后面的括號中標(biāo)注了首次出現(xiàn)該主題的年份。為使主題的演化路徑更清晰,重復(fù)出現(xiàn)的主題詞在后續(xù)的演化路徑中將不再表現(xiàn)出來。

        由圖9可知,文獻資源保障體系的主要研究內(nèi)容形成時間都比較早,到2000年左右,文獻資源保障體系的相關(guān)文獻主題已基本涵蓋,后續(xù)具體探討的是新世紀(jì)新環(huán)境之下,不同建設(shè)領(lǐng)域其內(nèi)容和方式方法上的更新與完善。下文主要對各個主題內(nèi)部的演化進行分析。

        (1)Topic4文獻資源共享是文獻資源保障體系的主要探究主題。1973年,國際圖書館協(xié)會聯(lián)合會(國際圖聯(lián),International Federation of Library Associations and Institutions,IFLA)首先提出了UAP(Universal Availability of Publications)的概念,即“國際圖書館資源共享”。該理念引入國內(nèi)后,引起了國內(nèi)學(xué)者們的高度贊同。遠(yuǎn)征就指出,實現(xiàn)文獻資源共享,有利于高校圖書館擺脫“自給自足”的自然經(jīng)濟狀況,可以緩解圖書經(jīng)費不足、管理人員欠缺、編目能力有限、藏書空間飽和等一系列問題[16]。其中,館際互借是實現(xiàn)文獻資源共享的重要途徑與手段,我國最早提出館際互借大約是在1939年,當(dāng)時民國政府教育部頒布了《修正圖書館規(guī)程》和《圖書館工作大綱》,文中有提到“館際互借與郵寄”[17],某種程度上說,這是文獻資源共享的開端。但受限于當(dāng)時國內(nèi)時代背景,文獻資源共享一直未能得到良好的發(fā)展。到了20世紀(jì)末,由于信息技術(shù)的發(fā)展,眾多學(xué)者開始倡導(dǎo)圖書館自動化[18-19]和數(shù)字圖書館[20-21],實體書的館際互借也慢慢發(fā)展為線上的更具有廣泛意義上的資源共享,從而演化出了一系列與互聯(lián)網(wǎng)技術(shù)發(fā)展緊密相關(guān)的研究主題,例如編目標(biāo)準(zhǔn)化、網(wǎng)絡(luò)建設(shè)、信息資源網(wǎng)絡(luò)化等問題。在這期間,也有學(xué)者倡議建設(shè)文獻資源共享服務(wù)網(wǎng)絡(luò)中心,或是采用有償共享的模式[22],但后續(xù)的相關(guān)研究成果較為有限。在2006年8月,Google首席執(zhí)行官埃里克·施密特(E. Schmidt)在搜索引擎大會(SESSanJose2006)上首次提出“云計算”(Cloud Computing)這一概念[23]。云計算本質(zhì)上是一種全新的網(wǎng)絡(luò)應(yīng)用概念,使用者可以隨時獲取“云”上的資源,按需求量使用[24],這一概念的提出,給文獻資源的共享模式帶來了新的思路。

        與此同時,中國作為農(nóng)業(yè)大國,農(nóng)業(yè)文獻信息資源的共享對于國家的發(fā)展進步同樣具有戰(zhàn)略意義。全國農(nóng)業(yè)文獻資源共建共享的最終目的是為全國的農(nóng)業(yè)教學(xué)、科研、生產(chǎn)和經(jīng)營所需要的資源支持和服務(wù)提供保障,進而促進我國農(nóng)業(yè)的突破性發(fā)展[25]。為提高西部地區(qū)的經(jīng)濟和社會發(fā)展水平,鞏固國防,國務(wù)院于2000年1月成立了西部地區(qū)開發(fā)領(lǐng)導(dǎo)小組。此前,已有學(xué)者針對西部地區(qū)的農(nóng)業(yè)文獻資源共建共享提出相應(yīng)的舉措[26]。而相關(guān)文獻保障體系的建立,也將有利于圖書館為西部大開發(fā)建言獻策,同時為西部地區(qū)做好文獻保障[27]。隨著技術(shù)的發(fā)展,目前,中國農(nóng)業(yè)科學(xué)院信息化服務(wù)網(wǎng)也已經(jīng)上線,通過一系列信息化服務(wù),打造智慧農(nóng)科協(xié)同平臺。2013年9月和10月由中國國家主席習(xí)近平分別提出的建設(shè)“新絲綢之路經(jīng)濟帶”和“21世紀(jì)海上絲綢之路”的合作倡議,打開了我國西部地區(qū)和沿海地區(qū)的大門。做好相關(guān)歷史文獻的梳理和保障工作,不僅有利于申報世界文化遺產(chǎn),推動特色文獻資源的建設(shè),還可以加強對周邊國家地域文化的研究,甚至在一定程度上緩解邊境或沿海島嶼的爭端[28-29]。

        (2)Topic9文獻傳遞、Topic10文獻收藏、Topic11信息服務(wù)和Topic12文獻組織均是Topic8文獻資源建設(shè)過程中演化出來更加細(xì)分的主題。文獻傳遞與收藏是圖書館的基本職能。高校圖書館館藏文獻資源是高校重點學(xué)科建設(shè)的重要保障。由于不同省市的經(jīng)濟發(fā)展情況和當(dāng)?shù)靥厣墨I的數(shù)量不同,文獻資源布局的情況均有所不同,對相關(guān)文獻進行采購與收藏之前,需要對文獻資源布局進行充分的調(diào)研,然后對缺少的有需求的文獻資源進行采購并收藏。文獻收藏與傳遞除了關(guān)注數(shù)據(jù)庫技術(shù)的演化發(fā)展之外,還涉及多重備份與適時遷移、開放描述方式、模擬環(huán)境與環(huán)境封裝、數(shù)據(jù)恢復(fù)與數(shù)據(jù)考古、技術(shù)框架與整體解決方案、標(biāo)準(zhǔn)化技術(shù)等多個方面[30]。

        為了更好地收藏與傳遞文獻資源,需要對其進行有效的描述。元數(shù)據(jù)是文獻資源組織中信息描述的重要部分,元數(shù)據(jù)不但在數(shù)字資源著錄方面具有重要的作用,也是使得圖書館走向自動化的關(guān)鍵技術(shù)。MARC(Machine-Readable Catalogue,機器可讀目錄)與Dublin Core(都柏林核心集)兩種元數(shù)據(jù)發(fā)展較為成熟,并且在圖書情報界得到廣泛的認(rèn)可。1965年,由美國國會圖書館研發(fā)的MARC(后來稱之為MARCⅠ),代表了機讀目錄的初步成果,后在英美合作之下,MARCⅡ于1968年問世。我國有關(guān)部門于1991年在UNIMARC的基礎(chǔ)上加上特定字段,編制了《中國機讀目錄通訊格式》(CNMARC),并多次修訂。1995年,OCLC和NCSA聯(lián)合召開了第一次都柏林核心集會議,最終確立了包含15個核心元素的核心集。由于MARC在粒度、語言和可擴展性方面具有一定的局限,美國國會圖書館(Library of Congress,LC)于2011年5月提出了書目框架模型(Bibframe),力求大大整合現(xiàn)有的書目資源,但其如何適應(yīng)中文的編目環(huán)境還有待深入研究。新時代互聯(lián)網(wǎng)環(huán)境的迅速發(fā)展將持續(xù)推動文獻信息資源組織方法及理念的創(chuàng)新和改革,文獻信息資源組織將朝著跨學(xué)科融合、智能語義組織以及信息方法一體化等方向快速發(fā)展[31]。

        文獻資源建設(shè)的最終目的依然是服務(wù)用戶、服務(wù)讀者。1995年5月,江澤民同志在全國科技大會上的講話中提出了要實施科教興國的戰(zhàn)略。這促使圖書館從信息服務(wù)走向知識服務(wù),通過知識服務(wù)助推科教興國戰(zhàn)略的實施。知識服務(wù)是指從各種顯性和隱性信息資源中,針對人們的需要將知識提煉出來、傳輸出去的過程[32]。知識服務(wù)正是以文獻信息資源建設(shè)為基礎(chǔ)的高級階段的信息服務(wù)。要想充分開展知識服務(wù),需要深入挖掘用戶的知識需求,通過智慧的手段使顯性知識增值,使隱性知識可以被傳遞和接收,從而提供個性化信息服務(wù)[33],這些都需要知識挖掘、知識組織、知識開發(fā)和知識服務(wù)人員素養(yǎng)等多方面的提升[34]。與此同時,在線信息服務(wù)提供商和大型出版商逐漸開始了語義網(wǎng)應(yīng)用實驗,產(chǎn)生了語義出版這種新的出版形態(tài),語義出版將文獻資源從一個孤立、靜止的知識包變成了嵌入在相互關(guān)聯(lián)和相互作用的知識體系中的知識工具[35]。語義出版一方面幫助用戶發(fā)現(xiàn)或驗證新知識,另一方面能使出版機構(gòu)獲得新的利潤回報和盈利空間。長遠(yuǎn)看來,知識服務(wù)和語義出版仍將是信息服務(wù)領(lǐng)域的一片紅海。

        (3)Topic1信息資源評價。在宏觀層面上,建設(shè)文獻資源保障體系離不開高層次的宏觀調(diào)控機構(gòu),相應(yīng)的政策、法規(guī)和標(biāo)準(zhǔn)以及社會各界的力量[36]。微觀層面上,為了保證更好地建設(shè)文獻資源保障體系,需要對相關(guān)的主體和客體進行評價評估。索傳軍等將評價主體分為個體和機構(gòu)兩類,評價者個體是指來自于不同領(lǐng)域的專家學(xué)者,而評價機構(gòu)則包括經(jīng)營性機構(gòu)、服務(wù)性機構(gòu)、學(xué)術(shù)性機構(gòu)等[37],再根據(jù)不同的評價客體形成不同的評價體系,例如期刊評價體系、館藏文獻資源評價體系、數(shù)字文獻資源評價體系等。安月英構(gòu)建了一個二級的館藏資源評價體系,其中一級指標(biāo)包括資源內(nèi)容、檢索系統(tǒng)、經(jīng)濟性和存儲系統(tǒng),二級指標(biāo)包括館藏資源保障能力、權(quán)威性、時效性、規(guī)范性、檢索功能、檢索效果、易用性、成本、使用情況、存儲系統(tǒng)的效率和安全性[38]。馬海群等從信息源內(nèi)容、信息源組織、信息源性能、其他指標(biāo)這四大層面構(gòu)建了一套含有16個指標(biāo)的網(wǎng)絡(luò)信息資源評價體系[39]。而期刊評價體系的指標(biāo)包括但不限于總下載量、影響因子、5年影響因子、他引影響因子、平均引文數(shù)、Web即年下載率、即年指標(biāo)、綜合總被引、可被引文獻量、引用期刊數(shù)、被引期刊數(shù)、等各類指標(biāo)[40]。

        與其同時,高校的學(xué)科評估一部分也是對相關(guān)學(xué)科的文獻資源進行評估。通常,我國高校院系可根據(jù)科研工作和教學(xué)需要,自主購買中、外文文獻,這種自主采購的方式針對性和專業(yè)性很強[41]。但也有高校圖書館文獻資源采購,在以滿足師生的閱讀需求的前提之下,兼顧院校的重點學(xué)科的發(fā)展,打造特色館藏和重點學(xué)科館藏。隨著“雙一流”等一系列工程的實施,各個高校在辦學(xué)的過程中還出現(xiàn)了高校合并、多校區(qū)辦學(xué)的情況,這使得高校圖書館在政治思想工作、機構(gòu)設(shè)置和人事管理、規(guī)章制度標(biāo)準(zhǔn)化、網(wǎng)絡(luò)和軟件更新、經(jīng)費管理、資源共享、館藏布局等多個方面面臨變革[42-43]。這一系列高校和學(xué)科的變革終將需要相關(guān)文獻資源服務(wù)的配套優(yōu)化。

        總的來看,文獻資源保障體系的各個主題是相互交織在一起一同發(fā)展的,其主題演化大致與圖書館自動化的四個發(fā)展階段和信息技術(shù)發(fā)展的趨勢保持一致。第一階段為圖書館自動化管理集成系統(tǒng)發(fā)展階段,第二階段為圖書館在網(wǎng)上進行全球性、整體化的電子文獻信息服務(wù)的階段[44],第三階段為數(shù)字化圖書館階段,第四階段便是智慧圖書館階段。在這期間,信息技術(shù)不斷地更新迭代,如光盤CD-ROM的興衰,從局域網(wǎng)到互聯(lián)網(wǎng),Bibframe模型逐漸替代MARC,云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等一系列新技術(shù)蓬勃發(fā)展。國家層面也發(fā)布不同的政策文件,從“211工程”到“雙一流學(xué)科”,從“西部大開發(fā)”到“一帶一路”,從“九五”的“金圖”工程到“十四五”的網(wǎng)絡(luò)空間命運共同體,都在不斷地推進我國文獻資源保障體系的發(fā)展演化。綜合來看,我國文獻資源保障體系的演化是在圖書情報、計算機等眾多學(xué)界的共同努力之下,依托先進的信息技術(shù),不斷為中國文獻保障事業(yè)添磚加瓦的過程。

        4? 結(jié)論與討論

        本文主要基于LDA主題模型進行主題識別,實現(xiàn)了LAD主題模型在文獻資源保障體系領(lǐng)域的應(yīng)用。在文獻資源保障體系的主題演化路徑中,形成了豐富多樣的主題,2000年左右基本已包含主要的文獻資源保障體系研究主題,主要可以分為文獻資源層面和機構(gòu)層面兩大內(nèi)容。從資源層面來看,研究內(nèi)容包括文獻資源類型與收集、文獻資源組織與建設(shè)、文獻資源服務(wù)與共享。從機構(gòu)層面來看,高校圖書館一直是研究的主要對象,隨著文獻資源保障體系發(fā)展建設(shè),全國性機構(gòu)與地方基層機構(gòu)建設(shè)發(fā)展迅速。這兩大內(nèi)容還受到“西部大開發(fā)”、“雙一流”學(xué)科建設(shè)、“一帶一路”等一系列宏觀政策和“大數(shù)據(jù)”“云計算”“數(shù)據(jù)挖掘”等一系列新興技術(shù)的交叉影響。

        為重構(gòu)文獻資源保障體系,同樣需要從資源角度和機構(gòu)角度進行相應(yīng)的調(diào)整。從資源的角度來看,在文獻資源類型與收集環(huán)節(jié),部分高校的文獻資源向重點學(xué)科、強勢學(xué)科傾斜,忽視弱勢學(xué)科、少數(shù)民族地區(qū)、非英語外文文獻等資料的采購,但從體系優(yōu)化的層面上看,同樣要兼顧“弱勢學(xué)科”和多元發(fā)展,從而帶動各高校各學(xué)科的水平提升。在文獻資源組織與建設(shè)環(huán)節(jié),數(shù)字化建設(shè)是文獻資源建設(shè)的大方向,要將元數(shù)據(jù)建設(shè)作為其核心,實現(xiàn)多渠道元數(shù)據(jù)融合、多類型元數(shù)據(jù)映射、多層次元數(shù)據(jù)識別,建立具有知識關(guān)聯(lián)功能的智慧的文獻組織平臺。在文獻資源服務(wù)與共享環(huán)節(jié),建立以開放數(shù)據(jù)、開放獲取、開放出版等為手段的數(shù)字資源開放生態(tài)新模式的同時,應(yīng)充分重視用戶需求與用戶價值,通過抓取分析用戶的主觀特征、行為數(shù)據(jù)、偏好數(shù)據(jù)、意見反饋,構(gòu)建用戶畫像,為用戶提供細(xì)粒度的個性化的資源服務(wù)。

        從機構(gòu)的角度來看,雖然多年來發(fā)展出各類專門專項的機構(gòu)成員,但存在不同程度的冗雜、分塊嚴(yán)重、職責(zé)重復(fù)、缺乏統(tǒng)一管理等問題。建立統(tǒng)籌協(xié)調(diào)、部門聯(lián)動的文獻資源保障體系的管理機制,首先需要在中央設(shè)立跨系統(tǒng)、跨學(xué)科、跨部門的全國統(tǒng)一常設(shè)機構(gòu),總攬相關(guān)文獻資源的指揮與協(xié)調(diào);其次,向下設(shè)立全國性的專家委員會與具體辦事機構(gòu)負(fù)責(zé)技術(shù)指導(dǎo)與執(zhí)行;最后,依托各級學(xué)會與地方圖書館下設(shè)各系統(tǒng)間的地區(qū)聯(lián)盟和基層組織,實現(xiàn)分類、分級、分工保障[45],從而建成全國性的橫跨各個領(lǐng)域的文獻資源保障體系系統(tǒng)。

        本文具有一定的局限:LDA模型聚類中,個別聚類內(nèi)的文獻數(shù)較少,不能充分反映文獻的演化規(guī)律。在進行演化路徑分析的時候,后續(xù)再次出現(xiàn)的主題詞不再作為分析展示的對象,一定程度上會忽略主題演化過程中更為微觀的演進變化,后續(xù)還將繼續(xù)在文獻資源保障體系主題演化更為細(xì)致的方面深入研究,并探討演進的機理機制和未來新主題的識別預(yù)測。

        參考文獻:

        [1] 王翠萍, 楊沛超. 國家文獻信息資源保障體系建設(shè)論綱[J]. 圖書館學(xué)研究, 2000(2): 15-17,14.

        [2] 劉自強, 王效岳, 白如江. 多維度視角下學(xué)科主題演化可視化分析方法研究——以我國圖書情報領(lǐng)域大數(shù)據(jù)研究為例[J]. 中國圖書館學(xué)報, 2016, 42(6): 67-84.

        [3] 范云滿, 馬建霞. 利用LDA的領(lǐng)域新興主題探測技術(shù)綜述[J]. 現(xiàn)代圖書情報技術(shù), 2012(12): 58-65.

        [4] 張玉芳, 彭時名, 呂佳. 基于文本分類TFIDF方法的改進與應(yīng)用[J]. 計算機工程, 2006(19): 76-78.

        [5] 施聰鶯, 徐朝軍, 楊曉江. TFIDF算法研究綜述[J]. 計算機應(yīng)用, 2009, 29(S1): 167-170,180.

        [6] BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet allocation. Journal of machine learning research, 2003, 3: 993-1022.

        [7] 夏旭, 曾海標(biāo). CD-ROM數(shù)據(jù)庫的引進、開發(fā)、利用現(xiàn)狀及對策[J]. 圖書館雜志, 1996(3): 32-35.

        [8] 肖希明. 我國文獻資源保障體系論綱[J]. 圖書館, 1996(6): 8-12.

        [9] 孫瑞英. 建立國家文獻信息保障體系的構(gòu)想[J]. 情報科學(xué), 2002(7): 680-683.

        [10] 黎曉. 北京高校文獻資源保障體系發(fā)展現(xiàn)狀分析[J]. 農(nóng)業(yè)圖書情報學(xué)刊, 2014, 26(3): 16-20.

        [11] 楊永厚. 江蘇省高校文獻保障系統(tǒng)建設(shè)的回顧與思考[J]. 大學(xué)圖書館學(xué)報, 2002(1): 72-74,92.

        [12] 李朵. 中國高校人文社會科學(xué)文獻中心(CASHL)網(wǎng)絡(luò)服務(wù)系統(tǒng)現(xiàn)狀與發(fā)展[J]. 大學(xué)圖書館學(xué)報, 2005(3): 27-29.

        [13] 袁海波, 孟連生. 網(wǎng)絡(luò)環(huán)境下信息資源共建共享的實踐——兼述國家科技圖書文獻中心的建設(shè)與發(fā)展[J]. 情報學(xué)報, 2002(1): 57-62.

        [14] 張曉林. 國家科學(xué)數(shù)字圖書館及其建設(shè)進展[J]. 中國科學(xué)院院刊, 2005(4): 344-346,343.

        [15] 朱麗莉. “雙一流”建設(shè)背景下高校圖書館文獻資源建設(shè)策略探討[J]. 圖書情報導(dǎo)刊, 2018, 3(8): 7-11.

        [16] 遠(yuǎn)征. 實現(xiàn)資源共享對高校圖書館的現(xiàn)實意義[J]. 大學(xué)圖書館通訊, 1987(4): 10-13,19.

        [17] 崔慕岳, 代根興. 論館際互借[J]. 河南圖書館學(xué)刊, 1990(3): 54-57.

        [18] 夏旭. 資源共享發(fā)展的一大趨勢──光盤技術(shù)與通信技術(shù)的整合[J]. 大學(xué)圖書館學(xué)報, 1995(5): 40-42.

        [19] 黃建年. MARC數(shù)據(jù)與圖書館[J]. 津圖學(xué)刊, 1997(4): 28-34.

        [20] 曹作華. 論網(wǎng)絡(luò)化、數(shù)字化與高校圖書館館藏建設(shè)策略的轉(zhuǎn)化[J]. 情報科學(xué), 2002(1): 16-18.

        [21] 王元如, 寧圣紅. 數(shù)字圖書館和文獻信息資源共建共享[J]. 現(xiàn)代情報, 2000(6): 15-16.

        [22] 郭曄. 淺談創(chuàng)建文獻資源有償共享體系[J]. 寧德師專學(xué)報(哲學(xué)社會科學(xué)版), 2004(2): 82-83,86.

        [23] 許子明, 田楊鋒. 云計算的發(fā)展歷史及其應(yīng)用[J]. 信息記錄材料, 2018, 19(8): 66-67.

        [24] 羅曉慧. 淺談云計算的發(fā)展[J]. 電子世界, 2019(8): 104.

        [25] 宛章齊. 試論全國農(nóng)業(yè)文獻資源的共建與共享[J]. 農(nóng)業(yè)圖書情報學(xué)刊, 1997(1): 21-22.

        [26] 王子玉. 關(guān)于西北五省農(nóng)業(yè)圖書館文獻資源共享建設(shè)的構(gòu)想[J]. 甘肅科技, 1998(6): 2-3.

        [27] 黃權(quán)才. 圖書館參與西部大開發(fā)的策略[J]. 圖書館界, 2001(4): 1-6.

        [28] 陳彬強. 海上絲綢之路文獻資源保障體系建設(shè)[J]. 圖書館建設(shè), 2015(5): 88-92.

        [29] 周純, 馮彩芬, 馬翠嫦. 中國周邊區(qū)域研究文獻的需求與保障——以中山大學(xué)為例[J]. 大學(xué)圖書館學(xué)報, 2016, 34(5): 73-77,83.

        [30] 王偉. 數(shù)字資源長期保存的技術(shù)研究[J]. 情報科學(xué), 2012, 30(11): 1751-1754.

        [31] 魏敏. 信息組織4.0:變革歷程和未來圖景[J]. 國家圖書館學(xué)刊, 2018, 27(1): 78-85.

        [32] 田紅梅. 試論圖書館從信息服務(wù)走向知識服務(wù)[J]. 情報理論與實踐, 2003(4): 312-314.

        [33] 易明, 王學(xué)東, 鄧衛(wèi)華. 基于社會網(wǎng)絡(luò)分析的社會化標(biāo)簽網(wǎng)絡(luò)分析與個性化信息服務(wù)研究[J]. 中國圖書館學(xué)報, 2010, 36(2): 107-114.

        [34] 趙萍, 馬江寶. 論圖書館的知識服務(wù)及其實現(xiàn)[J]. 圖書館學(xué)研究, 2005(8): 32-35.

        [35] 魏蕊, 初景利. 學(xué)術(shù)圖書開放獲取與美國大學(xué)圖書館出版服務(wù)[J]. 大學(xué)圖書館學(xué)報, 2014, 32(3): 17-22.

        [36] 汪濤, 肖希明. 新信息環(huán)境下的文獻資源保障系統(tǒng)建設(shè)[J]. 圖書與情報, 1999(1): 33-36.

        [37] 索傳軍, 吳啟琳. 國內(nèi)外網(wǎng)絡(luò)信息資源評價研究進展[J]. 現(xiàn)代圖書情報技術(shù), 2006(8): 55-59,93.

        [38] 安月英. 基于層次分析法的數(shù)字館藏評價指標(biāo)體系[J]. 圖書館, 2008(4): 82-84.

        [39] 馬海群, 呂紅. 網(wǎng)絡(luò)信息資源評價指標(biāo)體系及其動態(tài)模糊評價模型構(gòu)建研究[J]. 情報科學(xué), 2011, 29(2): 166-171.

        [40] 陳小山, 陳國福, 張瑞. 基于因子分析和SEM模型的期刊評價指標(biāo)結(jié)構(gòu)關(guān)系研究[J]. 情報科學(xué), 2016, 34(10): 61-64,71.

        [41] 唐定海. 院系自采文獻管理初探[J]. 圖書館建設(shè), 2009(1): 52-54.

        [42] 李家清. 合并高校圖書館面臨的問題及對策[J]. 大學(xué)圖書館學(xué)報, 2001(S1): 10-12,30.

        [43] 楊樹雨. 論如何建立多校園的效益型圖書館[J]. 情報資料工作, 2001(2): 54-56.

        [44] 楊宗英, 鄭巧英, 夏佩農(nóng). 圖書館自動化發(fā)展的新階段[J]. 大學(xué)圖書館學(xué)報, 1997(3): 1-5.

        [45] 朱澤, 李玉海, 王常玨, 等. 重構(gòu)之路,我國數(shù)字資源保障體系的發(fā)展與未來——“2021年全國數(shù)字資源保障體系重構(gòu)學(xué)術(shù)研討會”評述[J]. 數(shù)字圖書館論壇, 2021(6): 30-35.

        作者貢獻說明:

        田栩冉:進行數(shù)據(jù)分析、論文撰寫及修訂;

        馬笑笑:進行數(shù)據(jù)分析、論文撰寫及修訂;

        李玉海:負(fù)責(zé)論文選題,提出論文框架,進行論文修訂與定稿。

        97女厕偷拍一区二区三区 | 国产自拍成人免费视频| 色婷婷av一区二区三区丝袜美腿| 日本视频一区二区三区| 福利视频偷拍一区二区| 亚洲精品女同一区二区三区| 国产亚洲aⅴ在线电影| 无码熟妇人妻av在线网站 | 国产黄片一区视频在线观看| 久久午夜伦鲁鲁片免费| 偷拍偷窥在线精品视频| 亚洲成人av一二三四区| 人人妻人人狠人人爽| 97人人模人人爽人人少妇| 人妻激情偷乱一区二区三区| 亚洲妓女综合网99| 亚洲国产A∨无码影院| 国产美女自拍国语对白| 人妻少妇偷人精品一区二区三区| 久久99精品久久久久麻豆| 又黄又硬又湿又刺激视频免费| 精品国产人妻一区二区三区| 国产精品久久婷婷六月丁香| 精品国产AⅤ一区二区三区V免费 | 国产精品一区二区三区蜜臀| 亚洲乱码中文字幕一线区| 人妻久久一区二区三区| 国产在线观看免费视频软件| 99麻豆久久久国产精品免费| 97久久超碰国产精品旧版| 国产av无码专区亚洲av极速版| 无码精品色午夜| 亚洲综合网中文字幕在线| 偷拍美女上厕所一区二区三区| 97se色综合一区二区二区| 网禁拗女稀缺资源在线观看| 亚洲中文字幕无码永久在线| 亚洲午夜无码久久久久软件| 亚洲国内精品一区二区在线| 午夜蜜桃视频在线观看| 国色天香社区视频在线|