祝紅藝 羅紅彬
(西北農林科技大學圖書館,陜西楊凌712100)
數(shù)字資源計量規(guī)范研究
——基于事實數(shù)據(jù)庫專項數(shù)據(jù)填報的思考
祝紅藝 羅紅彬
(西北農林科技大學圖書館,陜西楊凌712100)
數(shù)字資源事實數(shù)據(jù)的計量是圖書館統(tǒng)計工作的重要組成部分。本文根據(jù)筆者多年從事館藏數(shù)字資源計實踐經驗,提出了數(shù)字資源計量中存在標準不連續(xù)、含義指代不明及使用統(tǒng)計不規(guī)范等主要問題,分享了西北農林科技大學圖書館在具體操作中的解決辦法,即人工統(tǒng)計、導航匯總與等同下載。在此基礎上,筆者建議圖工委、DRAA與各館首先各司其職,共同致力于數(shù)字資源計量的可持續(xù)、可比較服務;其次指出國內數(shù)據(jù)庫商需要根據(jù)國際計量標準的變化采取相應調整措施;針對第四版COUNTER規(guī)范標準,圖工委報表填報內容需要適時改進及展開相關內容與理論知識的培訓;增設高校圖書館數(shù)字資源統(tǒng)計系統(tǒng)的評估,開展COUNTER標準與國內相關數(shù)字資源統(tǒng)計規(guī)范的比較研究。
數(shù)字資源;計量規(guī)范;COUNTER;大學圖書館
2011年以來,教育部高等學校圖書情報工作指導委員會結合以往統(tǒng)計中出現(xiàn)的問題和高校圖書館發(fā)展的實際情況,對高校圖書館事實數(shù)據(jù)庫的統(tǒng)計項目作了修訂[1]。該舉措為事實數(shù)據(jù)填報得以持續(xù)開展打下了良好的基礎,具有十分重要的意義。但是985和211工程院校由于數(shù)字資源類型多樣,數(shù)量龐大,想要精確掌握并計量每個統(tǒng)計項目依然顯得尤為困難。目前,2007版《高等學校圖書館數(shù)字資源計量指南》(簡稱《指南》)是進行該項統(tǒng)計工作的主要依據(jù)和綱領性文件。筆者在該項工作中主要負責西北農林科技大學圖書館數(shù)字資源當年新增量、館藏累計量及其使用情況的計量,連續(xù)幾年的統(tǒng)計實踐促使筆者想從數(shù)字資源計量角度談談對該問題的一些看法和思考。
本文所闡述的數(shù)字資源計量主要包含兩個方面的內容,館藏數(shù)字資源數(shù)量及其使用計量。筆者發(fā)現(xiàn)此過程存在以下諸多弊端。
1.1 標準不連續(xù)
如外文期刊種、冊數(shù)問題。2010-2012年度普通高校圖書館統(tǒng)計報表(擴展版)中“C當年新增文獻量”填報細則里規(guī)定中文電子刊每種1個年份算1冊,外文電子刊每種1個年份算2冊,但是2013-2014年度該統(tǒng)計報表(擴展版)填報細則改為中、外文電子刊都是每種1個年份算1冊[4]。另外,按照強自力對于《指南》的解讀,學位論文、會議錄、報告、標準均作為圖書計量成“冊”,其換算標準為學位論文1篇計1冊,會議錄1本計1冊,報告、標準5份計1冊[2],這樣計算下來每年新增與館藏總量的增值龐大,有時候又會與數(shù)據(jù)庫商能提供的數(shù)據(jù)出入很大。所以統(tǒng)計人員對究竟采用何種標準易于產生困惑。
1.2 含義指代不明
再如Proquest學位論文全文數(shù)據(jù)庫采用單館采購,集團共享訂購模式[3],按照強自力對于《指南》的解讀,共建共享電子書按共享的總數(shù)每1種計1冊[2];但同時報表中C1.3填報細則又規(guī)定,電子資源有永久使用權的,納入D館藏資源累積量的下屬項目中[4]。以西北農林科技大學圖書館為例,西北農林科技大學圖書館每年購買具有永久使用權的200篇學位論文,但可以使用共享成員館購買的上萬篇論文,實際購買的具有永久使用權的量200篇與成員館實際訪問(可使用的量)存在數(shù)字上的巨大差異。這里就產生一個問題,當年新增量與館藏總量該如何計量?是將具有永久使用權的200篇計入當年新增,共享使用資源(上萬篇論文)計入館藏總量?亦或是反之計量,再或者是二者都以共享總量計入?好像都有一定道理。另外還有工具書與年鑒的歸屬問題。將其歸于圖書并參與種、冊數(shù)量的統(tǒng)計還是歸于數(shù)值事實型數(shù)據(jù)庫(其他數(shù)據(jù)庫類型)只進行數(shù)據(jù)庫個數(shù)的統(tǒng)計?
1.3 使用統(tǒng)計不規(guī)范
“G6電子資源下載量”是反映數(shù)字資源使用情況的極為重要的指標。填報細則里既沒有具體說明電子資源包括哪些類型,也沒有解釋“下載量”究竟指的是下載次數(shù),篇數(shù)亦或是下載頁(面)數(shù)。顯然,在進行數(shù)字資源使用計量時倘若對文獻類型及計量單位不進行規(guī)范或約定,就會對統(tǒng)計結果造成不同程度的影響。表1反映的是國內外常用數(shù)據(jù)庫使用情況的計量指標。從表1可以看出,國內外數(shù)據(jù)庫使用統(tǒng)計存在很大差別,國內以沿襲舊有的計量指標為主,而國外以國際慣例COUNTER標準為主,尤其是期刊與圖書。國內外計量指標的差異增加了統(tǒng)計工作的難度,如子會話(Subsession)、頁面瀏覽量、被拒量、訪問量以及全文成功下載量、搜索次數(shù)等不一而足,要從眾多的計量指標中找到一個與電子資源下載相匹配的使用指標是需要一番功夫斟酌的。當然表中未列出的數(shù)據(jù)庫中也有極為簡單的統(tǒng)計個案,如新東方是按照課程明細,只有一個“使用次數(shù)”指標、愛迪科森僅有點擊量、美國探索教育視頻資源也只給出了瀏覽次數(shù)統(tǒng)計。
表1 國內外常用數(shù)據(jù)庫使用統(tǒng)計報告計量指標比較
2.1 人工統(tǒng)計
逐一詢問各出版商庫存圖書期刊等資源的數(shù)量,或通過數(shù)據(jù)庫網(wǎng)站查詢其資源列表,結合自己館內實際購買情況計算期刊與圖書的種冊數(shù)量。
2.2 導航匯總
利用西北農林科技大學圖書館期刊導航功能匯總中文期刊題名信息,而后再借助Excel表進行手動去重處理獲得最終期刊種數(shù)信息。通過搜索平臺或導航聚類功能匯總外文期刊資源數(shù)量,如利用西北農林科技大學圖書館文獻信息搜索平臺通過全部字段“of”查詢外文期刊種數(shù);或利用CCC“館員專欄——圖書館館藏期刊維護”查詢外文電子期刊種數(shù)。
2.3 等同下載
針對“G6電子資源下載量”,西北農林科技大學圖書館通常的做法是數(shù)據(jù)庫商提供的報表中有直接下載數(shù)據(jù)的采用該數(shù)據(jù)為準,沒有下載數(shù)據(jù)的則選取與下載量含義最為貼近的指標替代,并認定為等同下載。如中文圖書(期刊)通常采用下載次數(shù)、外文圖書(期刊)使用全文成功請求量,多媒體資源以全文內容單元請求量,文摘索引資源采用“記錄瀏覽”、“結果點擊”為等同下載指標。
綜上所述,標準不連續(xù)、含義不明確以及使用統(tǒng)計不規(guī)范等客觀存在的事實因素以及后期采用的解決辦法等都會對數(shù)字資源計量結果造成不同程度的誤差。
3.1 前 提
每個數(shù)據(jù)庫的內容資源都在不斷更新變化中,尤其是國外引進的期刊數(shù)據(jù)庫——新增刊、轉庫刊(Transfer Titles)、新發(fā)行刊以及開放獲取刊、當年不再出版刊、其他變化(如更名、卷期頻次改變、僅在線(Online-only)出版、付費刊改為開放獲取刊)等。即便數(shù)字資源采訪人員要弄明白自己館內究竟訂了哪些刊、不同刊都具有哪些權限等都不是一件易事。因此筆者建議,圖工委在事實數(shù)據(jù)庫填報前應做好數(shù)字資源統(tǒng)計的填報指南,主要包括數(shù)據(jù)庫各購買單元,如圖書、期刊、標準,報告、會議錄、博碩士學位論文等及其子庫所對應的種、冊、份、個等數(shù)量信息,盡可能涉及高校館購買的國內外所有數(shù)據(jù)庫(子庫)。數(shù)據(jù)于每年年初更新一次,以正式文件形式發(fā)給各高校館作參考,各館以此為基礎計量其數(shù)字資源。ARL每年在實施統(tǒng)計時專門提供一個文檔作為項目填報指南,指南中除了對統(tǒng)計項目作出定義外,還采用舉例等方式對項目進行詳細說明,以此來幫助填報人員準確地理解各項目的含義[5]。其次,DRAA應要求出版商提供遵循COUNTER規(guī)范的使用統(tǒng)計報告,并作為條款之一寫進訂購合同[7],并要求向成員館開放管理員賬戶,以便采購人員隨時自主查詢所購資源使用情況。最后,各館也要努力完善館內搜索平臺建設,重點在于期刊和圖書的導航。它的意義不僅僅在于方便讀者查找資源,對館員而言,導航的功用可能更在于對專項資源內容的清點與統(tǒng)計。筆者以為,以上舉措都是數(shù)字資源計量的基礎性工作,也是館際間進行比較的前提。
3.2 標 準
COUNTER(Counting Online Usage of NeT-worked Electronic Resources)是集成在線期刊、數(shù)據(jù)庫、在線圖書及多媒體內容等電子資源的使用統(tǒng)計規(guī)范。盡管《COUNTER電子資源使用統(tǒng)計實施規(guī)范》(第四版)已經發(fā)布并規(guī)定要求電子資源銷售商在2013年12月31日前應用新版實施規(guī)范,但是由國內數(shù)據(jù)庫商提供使用報告的內容來看顯然他們還沒跟上這一新形勢。因此,筆者以為在數(shù)據(jù)庫商層面(尤其是國內數(shù)據(jù)庫商)普及規(guī)范使用統(tǒng)一標準很有必要。首先需要他們明確新版COUNTER的變化與優(yōu)勢,以第四版COUNTER修改數(shù)據(jù)庫使用報告1和3為例,原來要求提供訪問次數(shù),現(xiàn)在已不做要求,而要求提供“檢索量”和新的數(shù)據(jù)庫使用評價指標“記錄瀏覽”、“結果點擊”[8]。另外,該版本還擴展了被拒絕訪問的類型,增加了因資源未獲得授權訪問而導致的被拒絕[8]。國內數(shù)據(jù)庫商需要根據(jù)這些變化內容迅速做出相應調整。
3.3 改 進
圖工委要求填報“G6電子資源下載量”,數(shù)據(jù)本身是一個含義模糊的量。筆者建議針對第四版COUNTER規(guī)范標準,圖工委報表填報內容應做出適時改進。據(jù)COUNTER標準,統(tǒng)計內容包括全文請求成功的數(shù)量和被拒絕的全文請求數(shù)量(均按月和期刊統(tǒng)計)。全文請求成功的數(shù)量指瀏覽、下載或通過其他方式提供給用戶的全文(包括HTML格式和PDF格式)數(shù)據(jù)的數(shù)量,這些全文數(shù)據(jù)是由服務器而不是瀏覽器所控制的。因此,下載量只是所有全文請求成功數(shù)量的一部分,并不能完全代表電子資源的使用效能。改進的具體措施為:將“電子資源下載量”進行分解,如電子資源檢索量、中外文電子書刊成功全文(或Section章節(jié))請求量,中外文文摘索引記錄瀏覽或結果點擊量,多媒體全文內容單元的成功請求量等。其次,開展報表填報培訓。如組織相關館員學習圖書館數(shù)字資源統(tǒng)計規(guī)范等理論,讓用戶明晰每個指標與專業(yè)術語的含義。以檢索與登陸概念為例,檢索是指一個明確的、有智力的詢問,相當于將在線服務請求提交到服務器。無論是通過查詢表格提交服務器或是使用菜單選項進行選擇提交都作為一次檢索來進行統(tǒng)計。一次檢索指的是一次獨立的查詢,登錄指一次在線服務的成功請求[6]。通過這種有針對性的培訓有助于我們理解各種計量指標的含義,從而明確把握統(tǒng)計內容的內涵。
3.4 評 估
數(shù)字資源的使用效益分析是近年來各高校圖書館工作的重中之重。目前有些館如西安交通大學、上海交通大學、復旦大學及其他機構清華同方、聯(lián)圖科技等都自主研發(fā)了高校圖書館數(shù)字資源統(tǒng)計系統(tǒng)。這些系統(tǒng)的核心旨在支持對圖書館各類型數(shù)字資源建設、服務與利用的多維度統(tǒng)計管理,基本能夠滿足國際主流標準中數(shù)字資源評估相關指標的數(shù)據(jù)需求。表2是筆者了解到的幾個系統(tǒng)的功能比較,建議業(yè)內人士結合館內需求做出判斷。
表2 高校圖書館數(shù)字資源統(tǒng)計系統(tǒng)或平臺的比較
3.5 研 究
國際上已經開展了若干關于圖書館統(tǒng)計相關標準規(guī)范的研究,其中產生重要影響的成果有:ISO2789:2006 Information and Documentation——International Library Statistic、ANSI/NISO Z39.7:2004 Information Services and Use:Metrics and Statistic for Libraries and Information Providers——Data Dictionary和Measure for Electric Resource(E-metrics)Complete Set等。上述成果中有關數(shù)字資源的統(tǒng)計規(guī)范遠不能滿足我國圖書館界的實際需求、國內圖書館界所采用的統(tǒng)計指標體系和統(tǒng)計方法均存在相當大的差異,降低了數(shù)據(jù)的比較、分析和決策參考價值[9]。COUNTER作為規(guī)范網(wǎng)絡化電子資源使用統(tǒng)計報告數(shù)據(jù)處理、審核和提交的國際化標準與目前國內自主制定的數(shù)字資源使用標準仍有很大區(qū)別。我國數(shù)字圖書館標準規(guī)范建設項目(CDLS)于2002年10月啟動,不僅包括數(shù)字資源加工、元數(shù)據(jù)、惟一標識符等數(shù)字圖書館有關標準規(guī)范的研究與制定,而且對我國數(shù)字圖書館標準規(guī)范的發(fā)展戰(zhàn)略、建設機制進行了研究分析[10],但是涉及數(shù)字資源計量統(tǒng)計標準規(guī)范方面內容似乎不多。Counter標準究竟適用于哪些類型的數(shù)字文獻,與國內相關數(shù)字資源統(tǒng)計規(guī)范有哪些相同與不同之處,應用該標準對國內數(shù)據(jù)庫商將產生哪些沖擊等問題已逐漸引起業(yè)內人士的重視,但這些問題都還需要在實際工作中仔細考量。
繁雜的圖工委報表填報在2015年的統(tǒng)計工作已經結束,但是留給筆者的思考遠還沒有結束。毋庸置疑,在沒有統(tǒng)一標準和規(guī)范的前提下,或者即便是有但缺乏強有力執(zhí)行的情況下,數(shù)字資源報表的填報缺乏可以比較的基礎。因此,業(yè)內人士應該借此工作的開展逐步推動我國數(shù)字資源的計量統(tǒng)計向規(guī)范化的方向改進與發(fā)展。
[1]關于審議高校圖書館事實數(shù)據(jù)庫統(tǒng)計項目的通知[EB/OL].http:∥www.chinalibs.net/Zhaiyao.aspx?id=216277,2015-07-22.
[2]《高等學校圖書館數(shù)字資源計量指南》解讀[EB/OL].http:∥wenku.baidu.com/view/432e946203d8ce2f0166230d.html?from=search,2015-07-22.
[3]Proquest學位論文全文數(shù)據(jù)庫評估報告[EB/OL].http:∥www.docin.com/p-296900244.html,2015-07-22.
[4]陜西高校圖工委.《2013年普通高校圖書館統(tǒng)計報表(擴展版)》.2014:5-6.
[5]胡秀梅,何雪梅,李睦,等.美國研究圖書館協(xié)會統(tǒng)計與高校圖書館事實數(shù)據(jù)庫統(tǒng)計的對比研究[J].大學圖書館學報,2011,(6):95-98.
[6]張靜,魏青山.SUSHI對電子資源規(guī)范化管理的影響[J].圖書情報工作,2014,58(10):112-116.
[7]朱兵,李春明.COUNTER與電子資源的使用評估[J].圖書情報工作,2006,50(1):100-102.
[8]李洪.新版COUNTER的特征及未來發(fā)展[J].中國圖書館學報,2012,(11):29-37.
[9]中華人民共和國文化部.圖書館數(shù)字資源統(tǒng)計規(guī)范WH/T 47-2012[M].北京:國家圖書館出版社,2013:1.
[10]林忠娜,葛丹陽.我國數(shù)字圖書館標準規(guī)范的構建[J].圖書館界,2014,(5):49-51.
(本文責任編輯:馬 卓)
Research on Statistics for Digital Resource——Based on Filing and Submitting Specialized Data of Fact Database
Zhu Hongyi Luo Hongbin
(Library,Northwest A&F University,Yangling 712100,China)
Measurement for the factual datas of digital resources is one of the most important parts in library statistics.The author put forward some problems as discontinuous standards,ambiguous meaning and nonstandard statistics in measuring digital resources,based on years of work experience in measurement in digital resources of library.Then the author shared the methods of the library of Northwest A&F University to solve the problems including in manual statistics,navigation summary and equivalent download.On this basis,the author proposed:Firstly,the working committee of library,DRAA and all libraries should cooperate and focus on the sustainability of the measurement to digital resources and comparable services;Secondly,the domestic vendors on database should adjust quickly corresponding to the change of international measuring standard;Thirdly,theworking committee of library need improving report contents in time and carry out some relevant treatments,according to the COUNTER standard of the fourth edition;In the end,the digital resource system or the platform of university libraries should be studied and evaluated,the COUNTER standard and the statistics standard of domestic relevant digital resources should be compared and studied.
digital resources;measuring standard;COUNTER;university library
10.3969/j.issn.1008-0821.2016.01.020
G250.74
A
1008-0821(2016)01-0114-04
2015-10-30
祝紅藝(1972-),女,副研究館員,研究方向:信息資源建設。