亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        圖書館數字資源統(tǒng)計系統(tǒng)建設研究

        2023-12-29 00:00:00張曉敬,楊行,毛琛瑜,肖嬋
        江蘇科技信息 2023年18期

        摘要:為獲取有效且可分析的數字資源使用數據,解決當前圖書館依賴數據庫商提供統(tǒng)計數據的困境,文章在分析數字資源統(tǒng)計系統(tǒng)實現原理與應用、國內外數字資源統(tǒng)計標準的基礎上,結合首都師范大學圖書館館藏資源情況提出數字資源統(tǒng)計系統(tǒng)的指標和功能需求,以此提出系統(tǒng)構建的總體框架和功能模塊。

        關鍵詞:數字資源;統(tǒng)計分析;COUNTER;HTTP/HTTPS傳輸協議

        中圖分類號:G251.4" "文獻標志碼:A

        0引言

        一方面,隨著計算機技術、網絡技術的發(fā)展,數字資源逐漸成為文獻信息的主要表現形式,圖書館數字資源購置經費的比例也逐年攀升。2020年, 中國高校圖書館基本統(tǒng)計數據報告揭示1 224所高校圖書館的紙質資源購置費均值為206.9萬元(2019年是221.1萬元),比2019年減少了14.2萬元,且呈逐年下降的趨勢;1 141所高校圖書館提交的電子資源購置費均值為343.6萬元(2019年是323.3萬元),占館均文獻資源購置費率的56.8%,較2019年增長了2.2個百分點[1]。另一方面,隨著數據庫購買價格的上漲,圖書館經費可購置的數字資源變少,反映資源使用情況的統(tǒng)計變得尤為重要。

        圖書館對數字資料的使用數據一般由數據庫廠商提供,主要利用數據庫的統(tǒng)計平臺自動下載與整理數據報表,或是要求數據庫商提交統(tǒng)計數據,但實際上部分數據庫商所提供數據的準確性還有待商榷。另外,對于中文數據庫而言,除中國知網遵循COUNTER標準,其他數據庫遵循或參考的統(tǒng)計標準各不相同,統(tǒng)計數據的來源也有差異,不能客觀真實地反映數據庫使用情況[2]。在圖書購置經費逐年減縮、數據庫購買價格逐年上漲的背景下,圖書館需要相對客觀、可信、持續(xù)、可對比的數據來引導數字資源配置的合理化、科學化,支持教師的科研工作,助推學校“雙一流”建設。

        1數字資源統(tǒng)計系統(tǒng)調研分析

        1.1數字資源統(tǒng)計系統(tǒng)的技術類型

        圖書館界很早就對數字資源統(tǒng)計系統(tǒng)開展研究,在中國知網、維普期刊和萬方數據平臺以主題詞“數字資源”“電子資源統(tǒng)計”進行檢索,在2003年就已經有關于數字資源統(tǒng)計的相關文章。通過對已有文獻調查發(fā)現,構建數字資源統(tǒng)計系統(tǒng)的技術主要歸為以下3項。

        1.1.1基于網關日志采集的分析模式

        該分析模式應用較早,圖書館的網關設備會對流經網關的訪問數據進行記錄并形成日志文件,通過開發(fā)日志采集與分析系統(tǒng)對日志文件進行采集、過濾與分析,進而生成數字資源使用統(tǒng)計報告。優(yōu)點是不會改變網絡拓撲和增加新硬件設備,通過對網關設備已有的日志功能進行分析產生使用統(tǒng)計報告;缺點是受日志文件生成頻次、采集分析系統(tǒng)的轉換性能等因素限制,統(tǒng)計報告難以做到實時生成,并且僅對部署在館內的本地鏡像數字資源進行日志分析,無法對遠程訪問資源進行分析[3]。

        1.1.2基于旁路監(jiān)聽的分析模式

        在本地已有網絡拓撲結構的基礎上增加專門用于數據采集的服務器,將數據采集器與圖書館核心交換機相連,在網關設備上通過端口鏡像功能將數據包復制到數據采集器上,數據采集器完成對數據包的捕獲、過濾和分析[4]。優(yōu)點是無需改變已有的網絡拓撲結構,也不會影響用戶已形成的訪問行為,即可實時監(jiān)控數字資源的使用情況并對違規(guī)下載行為進行預警;缺點是需要部署專門的服務器用于采集分析數據,投入成本高,需專業(yè)網絡硬件設備支持,且數據包分析也相對復雜,不適宜在圖書館大范圍推廣。

        1.1.3基于反向代理技術的分析模式

        圖書館通過本地代理服務器收集用戶訪問請求并將請求轉換后發(fā)送到數據庫商服務器,通過對代理服務器上的訪問請求與響應數據包進行分析,獲取用戶訪問信息[5]。優(yōu)點是構建相對簡單且無需購買服務器,并且能夠實現用戶統(tǒng)一認證登錄和數字資源管理;缺點是僅支持HTTP協議的數字資源。

        1.2數字資源統(tǒng)計系統(tǒng)的應用現狀

        數字資源統(tǒng)計系統(tǒng)在圖書館的應用主要包括引進商用系統(tǒng)、自建系統(tǒng)、與第三方公司合作開發(fā)系統(tǒng)3種模式。國外商用系統(tǒng)主要是針對遵循COUNTER標準和采用SUSHI收割協議的數據庫進行的數據統(tǒng)計,而我國圖書館數據資源除了外文資源,還有大量不支持COUNTER標準的中文數據庫,因此,本項目考察的商用系統(tǒng)對象不包括ProQuest公司的Intota和英國JISC采購聯盟開發(fā)的JUSP期刊統(tǒng)計平臺,而是本地化的商用系統(tǒng)。

        在商用系統(tǒng)的實踐應用上,西安交通大學、西安電子科技大學和北京交通大學部署了誠泰科技RGS1800圖書館電子資源利用與統(tǒng)計系統(tǒng),同濟大學、華東理工大學和上海圖書館部署泰和盛劍ERU圖書分析系統(tǒng),中國科技大學、上海外國語大學、華南師范大學部署了復旦華光ERU。RGS1800和ERU都是采用旁路監(jiān)聽的分析模式,在不改變用戶資源訪問習慣的基礎上對用戶訪問流量進行實時捕獲和統(tǒng)計分析[6]。RGS1800系統(tǒng)的主要優(yōu)點是數據統(tǒng)計算法嚴格遵循COUNTER統(tǒng)計標準,能夠統(tǒng)計各資源的檢索量、下載量、被拒絕請求量等數據,并生成COUNTER格式的統(tǒng)計報表[7]。ERU系統(tǒng)的主要優(yōu)點是通過用戶Web訪問頁面進行頁面仿真建模分析,可以實現基于“訪問內容級”的統(tǒng)計分析和建模,深層次獲取圖書館知識發(fā)現和學科服務所需的數據集;同時,可以實現圖書館電子資源使用統(tǒng)計按照COUNTER標準進行統(tǒng)計分析和對惡意下載行為的實時監(jiān)控[7-9]。

        不少圖書館也投入大量精力自行開發(fā)數據資源統(tǒng)計系統(tǒng),例如:深圳大學圖書館2013年基于COUNTER使用統(tǒng)計數據研發(fā)的電子資源使用統(tǒng)計平臺USSER[10]用于收集分析經SUSHI收割的使用數據;南京曉莊學院圖書館在重新調整統(tǒng)計數據指標的基礎上采用端口鏡像方式自建了數字資源統(tǒng)計系統(tǒng)[11];南京圖書館先后采用旁路監(jiān)聽模式和反向代理方式自建數字資源統(tǒng)計系統(tǒng),南京圖書館的應用案例反映了反向代理方式比旁路監(jiān)聽模式更適合圖書館。

        在自建和商用之外,也有圖書館尋求和第三方合作研發(fā)適合本館和國內圖書館的統(tǒng)計系統(tǒng)。深圳圖書館與第三方合作開發(fā)了“電子資源利用統(tǒng)計系統(tǒng)”[12];上海交通大學與南京昆蟲軟件有限公司合作研發(fā)ERS;上海財經大學圖書館將ERS應用于外文電子期刊[13]的資源管理。

        2數字資源的統(tǒng)計標準分析

        2.1國內外代表性數字資源統(tǒng)計標準

        國外圍繞數字資源統(tǒng)計標準展開了眾多大型的研究項目,并形成了一些相對成熟的標準[14-15],例如:由國際標準化組織與國際圖書館協會聯合會為圖書館統(tǒng)計制定國際標準ISO 2789;由美國圖書館及其他類型組織機構制定圖書館與信息服務機構統(tǒng)計指標NISO Z39.7;由英國圖書館界、出版界和中間商共同發(fā)起的網絡電子資源在線使用統(tǒng)計標準COUNTER。這些標準中COUNTER是目前影響力最大,也是使用最為廣泛的,其優(yōu)勢在于明確要求內容提供商需滿足規(guī)范性要求,使圖書館能夠獲得一致、可信和可比較的使用統(tǒng)計數據。

        國內針對數字資源統(tǒng)計的研究起步較晚,近年來也出臺了一些標準規(guī)范,代表性的有教育部高校圖工委和CALIS管理中心牽頭出版的《高等學校圖書館數字資源計量指南》[16]、中科院國家科學圖書館負責制定的《信息與文獻圖書館統(tǒng)計》(GB/T 13191—2009)、國家圖書館數字圖書館標準規(guī)范研究項目的項目成果《國家圖書館數字資源統(tǒng)計標準和應用指南》[17],以及由國家圖書館、文化和旅游部全國文化信息資源建設管理中心等起草的《圖書館數字資源統(tǒng)計規(guī)范》(WH/T 47—2012)[18]。國內數字資源統(tǒng)計標準在制定過程中以圖書館為主要對象,缺少對數據庫商的要求束縛,推行較為困難。

        國外數字資源使用統(tǒng)計標準研究雖相對比較成熟,COUNTER標準在境外數據庫商中的認可度也很高,但中文數據庫商對COUNTER的支持度并不高[19],各種基于COUNTER標準設計的數字資源使用統(tǒng)計平臺也無法適用于中文數據庫。中國知網遵循COUNTER標準提供統(tǒng)計數據,其他中文數據庫采用或參考的標準協議也有較大差異。國內外數字資源使用統(tǒng)計標準中制定的統(tǒng)計指標雖不相同,但也存在一些共同點,如資源檢索次數、下載次數、訪問(會話)次數等。

        2.2數字資源統(tǒng)計系統(tǒng)的統(tǒng)計指標

        根據統(tǒng)計數據和數字資源績效評價的需求,參考COUNTER標準和《圖書館數字資源統(tǒng)計規(guī)范》,本文本著客觀可行的原則、統(tǒng)計數據縱向對比的歷史延續(xù)性以及未來應用的可擴展性與前瞻性,確定并定義了本系統(tǒng)的統(tǒng)計指標。

        (1)瀏覽量:點入查看數據庫記錄詳細信息頁面的次數。對于一條記錄被多次點擊瀏覽的情況視為一次瀏覽行為。

        (2)訪問量:用戶登錄系統(tǒng)且成功訪問30 s算一次訪問量。限定訪問時間是為了剔除誤操作產生的數據。

        (3)下載量:全文或描述性內容成功請求的次數。對于期刊、圖書數據庫指下載到本地和全文在線瀏覽數量之和,對于多媒體、平臺類數據庫指在線瀏覽內容資源量。對于30 s內的重復下載行為僅記錄一次,不重復計數。

        (4)檢索量:用戶對資源內容進行檢索的次數。一次完整、標準的檢索行為應包括用戶輸入檢索條件、數據庫服務器根據檢索請求返回檢索結果。

        3數字資源統(tǒng)計系統(tǒng)總體框架及功能

        3.1數字資源統(tǒng)計系統(tǒng)總體框架

        作為數字資源績效考核的基礎和了解用戶使用情況的依據,圖書館需要掌握數據庫的使用數據。目前,外文數據庫通過訪問數據庫統(tǒng)計平臺自行下載,對于沒有統(tǒng)計平臺數據庫的則由數據庫商直接提供。由于數據反映了數據庫的使用情況,對于訪問量小的數據庫,數據庫商提供數據的真實性有待商榷;并且數據庫商提供數據會有一定的延遲性,不能滿足臨時需要。因此,圖書館需要一款系統(tǒng)既可以整合存儲所有數據庫的使用數據,還能提供挖掘分析功能用于支持圖書館工作。

        圖書館訂購和試用數據庫共184個,對所有數據庫采用的傳輸協議、是否需要安裝客戶端、是否遵循COUNTER標準且支持SUSHI收割進行統(tǒng)計。統(tǒng)計結果顯示,采用HTTP超文本傳輸協議的數據庫116個、采用HTTPS傳輸協議的數據庫66個、需安裝客戶端的數據庫2個,其中符合COUNTER標準且支持SUSHI收割的數據庫共有25個,且均為外文數據庫。

        基于反向代理技術的分析模式不會改變網絡拓撲結構、構建簡單且無須購買專用服務器,可以實現數據實時統(tǒng)計,在圖書館設備采購經費緊張的背景下是優(yōu)選方案。但是,基于反向代理技術的分析模式也有缺點,只能采集使用HTTP通信協議且無須安裝客戶端的數據庫,對于采用HTTPS通信協議和需安裝客戶端的資源無法采集使用數據。陳廣[20]提出采用支持中間人技術的代理程序解析HTTPS,但該技術需要用戶安裝SSL證書和網絡部門配合配置策略路由功能。考慮首都師范大學圖書館資源面向全校師生,用戶群體大,建議用戶在客戶端安裝SSL證書的難度較大,并且館藏資源中采用HTTPS通信協議的數據庫約占1/3,相對較少,故暫不考慮此種方式。綜上所述,從通信協議角度、統(tǒng)計數據準確性角度,擬選擇反向代理方式為主自行獲取用戶使用數據,輔以SUSHI收割數據和第三方數據導入的方式作為補充。

        3.2數字資源統(tǒng)計系統(tǒng)功能模塊

        建立在數據采集、統(tǒng)計分析基礎上的數字資源統(tǒng)計系統(tǒng)是圖書館掌握數字資源使用情況、評估數字資源績效指標和指導學科館員服務院系科研工作的工具,由資源管理模塊、讀者管理模塊、數據采集模塊、數據整合模塊、數據挖掘模塊、用戶管理模塊、圖形化展示模塊等組成。

        (1)資源管理模塊。系統(tǒng)可根據學科類型、文獻類型添加/修改/刪除中外文數據庫(引進)、試用數據庫、OA開放獲取數據庫、教學教參等自建數據庫,支持批量導入和導出功能。

        (2)讀者管理模塊。系統(tǒng)采用用戶統(tǒng)一身份認證登錄,導入讀者信息并根據不同角色的讀者劃分不同的用戶組實現分組管理,便于后期分析讀者行為。

        (3)數據采集模塊。使用數據自采模塊:基于反向代理方式采集HTTP通信協議數據資源的使用數據,這部分數據中不包含支持COUNTER標準的資源使用數據。SUSHI收割模塊:對于支持SUSHI收割的數據庫實現自動收割COUNTER數據。第三方數據導入模塊:對于反向代理方式無法采集到的資源使用數據及支持COUNTER標準的資源歷史使用數據,可按照特定格式導入統(tǒng)計系統(tǒng)中。

        (4)數據整合模塊。依據COUNTER標準和《圖書館數字資源統(tǒng)計規(guī)范》,將不同來源的使用統(tǒng)計數據規(guī)范化處理。

        (5)數據挖掘模塊。資源使用分析模塊:采用大數據挖掘技術挖掘分析用戶使用數據,可以實現對瀏覽量、訪問量、下載量、檢索量的統(tǒng)計和分析,支持數據的橫向、縱向對比分析。用戶行為分析模塊:對用戶的使用行為進行分析,構建用戶畫像,從而實現面向用戶的個性化資源推薦。統(tǒng)計報表模塊:根據制定的統(tǒng)計指標產生統(tǒng)計報告,統(tǒng)計報告支持多種條件的篩選,支持EXCEL、PDF、XML格式導出。

        (6)用戶管理模塊。系統(tǒng)提供用戶管理、權限管理和日志管理,在分級管理模式下方便學科館員查看本學科相關數據庫的訪問情況。

        (7)圖形化展示模塊。統(tǒng)計結果及分析采用圖形化展示,可采用功能強大、使用簡單的ECharts圖表插件定制數據可視化圖表,滿足用戶對數據進行挖掘整合的需求。

        4數字資源統(tǒng)計系統(tǒng)的不足與展望

        文章基于首都師范大學圖書館當前數字資源采購情況及HTTP/HTTPS通信協議使用情況,在設備采購經費緊縮的背景下提出的建設框架,能滿足多來源數據收集以及實時統(tǒng)計分析等方面的實際需求,但也存在一些現實問題。

        圖書館網絡及相關設備的使用受限于學校網絡總體管控,數字資源統(tǒng)計系統(tǒng)的建設需要數字校園建設中心的配合,反向代理服務器安裝在圖書館后,需遵守學校網絡安全規(guī)定接受安全漏洞掃描,出現“高危漏洞”時需關閉服務器的對外訪問權限。

        隨著數據庫商對網絡安全要求的加強,原有HTTP協議逐漸轉換到HTTPS協議,使得采用HTTPS通信協議的數據庫商占大多數時,使用反向代理方式采集使用數據的缺點就會更加凸顯。

        無法兼顧移動圖書館場景下的用戶使用數據。隨著移動互聯網的不斷發(fā)展,部分數據庫也推出了獨立的移動客戶端,如CNKI全球學術快報、超星數字圖書館。當前,系統(tǒng)架構主要適用于桌面訪問方式,未介入此類移動端訪問過程,無法實現此類數據的采集和有效統(tǒng)計。

        上述問題是當前數字資源統(tǒng)計系統(tǒng)架構持續(xù)完善的動力。數字資源數量的增多使得圖書館需要一個系統(tǒng)整合揭示所有資源的使用數據,實現數字資源的橫縱向使用對比,而受限于當前技術水平、數據資源統(tǒng)計標準及數據庫使用方式,不能采用單一方式采集到所有數字資源的使用數據,未來需要多種方式共同使用,甚至仍然需要一定的人工干預。此外,圖書館建議數據庫商遵循COUNTER標準的呼聲越來越高,數字資源統(tǒng)計標準的日趨統(tǒng)一對數字資源統(tǒng)計系統(tǒng)的優(yōu)化也有積極的推動作用。

        參考文獻

        [1]吳漢華,王波.2020年中國高校圖書館基本統(tǒng)計數據分析[J].大學圖書館學報,2021(4):5-11.

        [2]胡大琴.中文數字資源使用統(tǒng)計數據的調查研究[J].圖書情報工作,2017(15):104-110.

        [3]閆曉弟,邵晶,周奇,等.電子資源利用統(tǒng)計網關系統(tǒng)的設計與實現[J].現代圖書情報技術,2008(8):97-100.

        [4]倪劼.基于SharpPcap的圖書館數字資源訪問統(tǒng)計系統(tǒng)設計與實現[J].圖書館工作與研究,2017(12):48-53.

        [5]倪劼.圖書館數字資源訪問統(tǒng)計系統(tǒng)構建研究——基于OpenResty平臺[J].圖書館工作與研究,2019(10):75-82.

        [6]孫瑾.基于應用層的高校圖書館數字資源統(tǒng)計系統(tǒng)[J].農業(yè)圖書情報學刊,2018(6):43-47.

        [7]佚名.誠泰科技圖書館電子資源利用與統(tǒng)計系統(tǒng)RSG1800[EB/OL].(2023-02-08)[2023-02-08].http://www.chengtaikj.com/mobile/product/rgs/.

        [8]張計龍,殷沈琴,陳鐵.基于ERU的圖書館用戶信息行為數據采集方法研究——以復旦大學圖書館為例[J].圖書館雜志,2014(12):10-16.

        [9]佚名.泰和盛創(chuàng)ERU圖書分析系統(tǒng)[EB/OL].(2014-10-04)[2023-02-08].http://thetech.com.cn/a/chanpinzhongxin/ERU/2014/0918/162.html.

        [10]陳大慶,葉蘭,楊巍,等.電子資源使用統(tǒng)計平臺USSER的設計與實現[J].圖書情報工作,2015(1):106-112.

        [11]陸康.高校圖書館數字資源統(tǒng)計系統(tǒng)建設研究[J].現代情報,2015(9):140-145.

        [12]于淼.電子資源利用統(tǒng)計與分析——以深圳圖書館為例[J].公共圖書館,2017(4):18-21.

        [13]李娜.電子資源管理與評估——以上海財經大學圖書館的外文電子期刊為例[J].圖書情報工作,2018(15):60-64.

        [14]彭康通.圖書館數字資源使用統(tǒng)計指標構建與思考[J].圖書館界,2016(4):25-30.

        [15]劉蔚,王長宇.ISO2789、NISOZ39.7和E-METRICS數字資源評價標準比較[J].圖書館學刊,2010(8):102-105.

        [16]劉葵波,章華云.《高等學校圖書館數字資源計量指南》評析及其實際應用研究[J].圖書館建設,2010(2):84-86.

        [17]趙保穎,范雪.國內外數字資源統(tǒng)計標準比較分析[J].圖書與情報,2010(6):39-43.

        [18]胡大琴.面向數據庫商的數字資源利用統(tǒng)計調查研究[J].圖書館雜志,2018(1):41-49.

        [19]胡大琴.圖書館數字資源利用統(tǒng)計調查研究[J].圖書館建設,2017(12):69-74.

        [20]陳廣.本地化電子資源使用統(tǒng)計系統(tǒng)解析HTTPS訪問數據方法的對比研究[J].圖書情報工作,2019(14):36-42.

        (編輯李春燕編輯)

        Research on the construction of library digital resource statistics system

        Zhang" Xiaojing, Yang" Xing, Mao" Chenyu, Xiao" Chan

        (Library, Capital Normal University, Beijing 100089, China)

        Abstract:" In order to obtain effective and analyzable data on the use of digital resources and solve the current dilemma of libraries relying on database providers to provide statistical data, this paper puts forward the indicators and functional requirement of the digital resources statistics system based on the analysis of the implementation principle and application of the digital resources statistics system and the statistical standards of digital resources at home and abroad, combined with the collection of resources in the library of Capital Normal University, based on this, the overall framework and functional modules for system construction are proposed.

        Key words: digital resource; statistical analysis; COUNTER; HTTP/HTTPS transport protocol

        国产午夜无码视频免费网站| 久久久99精品免费视频| 乱中年女人伦av三区| 亚洲国产精品久久久久秋霞影院| 久久婷婷五月综合色欧美| 国产在线无码一区二区三区视频| 国产女女精品视频久热视频| 丝袜美腿在线观看视频| 天码av无码一区二区三区四区 | 国产欧美一区二区精品仙草咪| 亚洲丝袜美腿精品视频| 精品99在线黑丝袜| 亚洲av成人无码网站大全| 国产亚洲精品福利在线| 人人妻人人爽人人澡人人| 国产亚洲一区二区三区综合片| 亚洲高清一区二区三区在线观看| a人片在线观看苍苍影院| 免费久久久一本精品久久区| 国产一级做a爱视频在线| 国产成人精品成人a在线观看| 亚洲国产中文字幕视频| 亚洲av成人波多野一区二区| 色欲AV成人无码精品无码| 久久久久亚洲av无码专区桃色| 少妇粉嫩小泬喷水视频www| 特级毛片a级毛片在线播放www | 久久精品免视看国产成人| 精品国产亚洲第一区二区三区 | 免费无码AⅤ片在线观看| 久久无码av中文出轨人妻| 精品国产自在现线看久久| 亚洲永久无码7777kkk| 国产区女主播一区在线| 免费观看视频在线播放| 亚洲天堂2017无码中文| 成人大片免费视频播放一级| 国产精品美女久久久浪潮av| 97碰碰碰人妻无码视频| 草青青视频手机免费观看| 欧美性猛交xxxx黑人猛交|