宋春勝 張志杰 梁世民
關鍵詞:數(shù)字資源;統(tǒng)計系統(tǒng);統(tǒng)計數(shù)據(jù);公共圖書館;代理訪問
摘要:圖書館數(shù)字化已經(jīng)成為當前圖書館的主要發(fā)展方向,數(shù)字資源是數(shù)字化圖書館的重要館藏,數(shù)字資源的使用率直接影響數(shù)字資源服務水平的高低,而圖書館傳統(tǒng)的使用率統(tǒng)計方法無法較好地掌握數(shù)字資源的利用情況。文章主要對數(shù)字資源統(tǒng)計系統(tǒng)進行了設計分析。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2018)10-0116-03
1背景
數(shù)字資源是文獻信息的表現(xiàn)形式之一,是圖書館資源建設不可或缺的部分。隨著信息技術的發(fā)展與互聯(lián)網(wǎng)的普及應用,基于Web的數(shù)字資源發(fā)展迅猛,在不斷擴大知識儲備、豐富館藏資源的同時,科學、全面、精細、簡便地駕馭和掌握數(shù)字資源,合理地對數(shù)字資源的訪問情況和實用價值進行統(tǒng)計、分析和科學評價,是信息時代為圖書館帶來海量數(shù)字化資源的同時又對圖書館的科學決策支持體系提出的一個現(xiàn)實問題。筆者以廣西壯族自治區(qū)圖書館為例,主要針對數(shù)據(jù)庫的訪問次數(shù)、檢索次數(shù)、鏈接次數(shù)、全文下載次數(shù)等基本指標統(tǒng)計進行設計。
2數(shù)字資源統(tǒng)計的意義
2.1有利于提高圖書館的數(shù)字資源服務水平
廣西壯族自治區(qū)圖書館是廣西綜合性省級公共圖書館,近年來緊跟信息技術發(fā)展的步伐,大力建設數(shù)字化文獻資源,目前該館正式采購的商業(yè)電子資源約30個,試用商業(yè)資源約15個,自建特色資源19個。因受地區(qū)發(fā)展水平、學歷、經(jīng)濟狀況、年齡、性別等諸多因素的影響,讀者對數(shù)字資源的需求都不一致。圖書館要統(tǒng)計讀者的使用情況,分析讀者的需求,有針對性地采購商業(yè)數(shù)字資源或自建特色資源,同時將統(tǒng)計數(shù)據(jù)通過圖書館的可視化平臺進行數(shù)據(jù)展示,以便引導讀者正確使用數(shù)字資源。因此,圖書館建立高效、準確的使用統(tǒng)計模式,對提高數(shù)字資源服務水平有著重要作用。
2.2有效幫助圖書館采購商業(yè)數(shù)字資源
目前,商業(yè)數(shù)字資源生產(chǎn)商、資源種類越來越多,讀者的個性化需求也越來越大,但各個圖書館購買資源的經(jīng)費卻相對有限。在這種矛盾日益加劇的情況下,圖書館在商業(yè)數(shù)字資源的購買和使用過程中需要建設一套比較合理的評價和分析體系,通過一系列評估指標的評定,為圖書館商業(yè)數(shù)字資源的購買、成本計算、資源利用及相關服務提供科學合理的依據(jù)。圖書館每年都會對已采購的數(shù)字資源進行續(xù)費,或?qū)υ囉脭?shù)字資源進行新增采購,對于已采購的數(shù)字資源是否進行續(xù)費的主要依據(jù)之一是該廠商提供的該數(shù)字資源庫的使用量,而這些數(shù)據(jù)的真實性和準確性有待商榷。對于新采購的數(shù)字資源,圖書館無任何使用統(tǒng)計數(shù)據(jù),無法真正了解讀者的需求。因此,建設數(shù)字資源統(tǒng)計系統(tǒng)能有效幫助圖書館在商業(yè)數(shù)字資源建設和使用方面制定正確的決策。
2.3有效幫助圖書館建設特色數(shù)字資源
在文化共享工程實施過程中,除接收國家管理中心提供的文化信息資源外,廣西壯族自治區(qū)圖書館還制作了舞臺藝術、旅游文化、科普知識、農(nóng)業(yè)科技、文物珍品和人物等具有廣西民族特色和地方特色的文化信息資源。廣西壯族自治區(qū)圖書館依托豐富的館藏以及地方特有的珍貴文獻資料,自建廣西戲劇、廣西文壇、廣西新農(nóng)村建設、廣西民國人物、八桂詩詞等專題數(shù)字資源,逐步形成了以地方文獻、少數(shù)民族文獻和東盟文獻為館藏特色,紙質(zhì)文獻和數(shù)字文獻并重的復合型圖書館資源結構體系。建設數(shù)字資源統(tǒng)計系統(tǒng)能夠統(tǒng)計讀者對自建資源的使用情況,促使圖書館有針對性地對本館自建資源進行充實和完善。
2.4有效幫助圖書館規(guī)范數(shù)字資源的統(tǒng)計
廣西壯族自治區(qū)圖書館購置了中國知網(wǎng)、維普期刊、萬方數(shù)據(jù)、讀秀知識庫、人大復印報刊資料等眾多數(shù)字資源,覆蓋數(shù)字型學術期刊、報紙、博碩士論文、會議論文、年鑒和圖書等文獻類型。目前,數(shù)字資源庫一般采用傳統(tǒng)的數(shù)據(jù)庫統(tǒng)計模式,即數(shù)字資源使用統(tǒng)計數(shù)據(jù)均由數(shù)字資源廠商提供,真實性和準確性有待商榷,同時,商業(yè)數(shù)字資源的類型繁多,各個廠商均采用各自的方式進行統(tǒng)計,缺乏統(tǒng)一的標準。針對以上問題,尋找有效的數(shù)字資源統(tǒng)計模式,建設符合廣西壯族自治區(qū)圖書館需求的數(shù)字資源統(tǒng)計分析平臺,開展數(shù)字資源的使用統(tǒng)計分析,對該館數(shù)字資源建設具有重大意義。
3主要功能模塊設計
3.1HTTP代理訪問模塊設計
廣西壯族自治區(qū)圖書館為了提高圖書館數(shù)字服務水平,將數(shù)字資源庫掛載到圖書館數(shù)字資源平臺上供讀者使用,讀者通過HTTP代理方式訪問數(shù)字資源后,所有的訪問數(shù)據(jù)均會儲存在圖書館內(nèi)部的代理服務器中,為數(shù)據(jù)分析統(tǒng)計業(yè)務提供基礎。
由圖1可知,數(shù)字資源平臺安裝在圖書館代理服務器中,讀者向圖書館代理服務器發(fā)送請求報文,代理服務器需要正確地處理請求和連接,同時向目標服務器發(fā)送請求,并將收到的來自目標服務器的響應轉發(fā)給客戶端。代理服務器扮演的是“中間人”角色,對于連接到代理服務器的客戶端來說,它是服務端;對于要連接的服務端來說,代理服務器是客戶端。代理服務器負責在兩端之間來回傳送HTTP報文。
3.2讀者登錄認證模塊設計
宋春勝,張志杰,梁世民:圖書館數(shù)字資源統(tǒng)計系統(tǒng)研究考慮到所需統(tǒng)計數(shù)據(jù)的完整性,無論讀者是否在圖書館局域網(wǎng)內(nèi),系統(tǒng)均使用代理訪問的方式進行。讀者在圖書館局域網(wǎng)范圍內(nèi)免賬號登錄(IP授權登錄)就能直接連接到數(shù)字資源;而讀者在局域網(wǎng)外任意地方使用有效讀者證號進行登錄,登錄之后使用代理方式訪問數(shù)字資源平臺。
讀者登錄認證模塊部分代碼如下:
public class IPFilter implements Filter{
public void Filter () {
IPbean ipbean = UserManager.getInstance().checkIP(httpRequest);
if(ipbean != null)
{
int departmentId = ipbean.getDepartmentId();
String sid = UserManager.getInstance().createSessionID();//如果為空就用本地的sessionId
if(sid == null)
sid = httpRequest.getSession().getId();
User user = new User(sid);
user.setIp(httpRequest.getRemoteAddr());
user.setUserName(user.getIp());
user.setDepartmentId(departmentId);
if(ipbean == null || ipbean.getNeedAgent() == 0)
{
user.setInIp(true);
UserManager.getInstance().addInUser(user);httpRequest.getSession().setAttribute(Constant.USER_SESSION,sid);
httpRequest.getSession().setAttribute(Constant.INIP,"in");
LogRecord loginMsg = new LogRecord(LogType.userlog,LogLevel.veryImportant,"IPLoginFilter doFilter","內(nèi)網(wǎng)用戶訪問");
loginMsg.addInfos("logtype","iplogin");
loginMsg.addInfos("cwsid",user.getSid());
loginMsg.addInfos("user",user.doJson());
loginMsg.addInfos("user-agent",httpRequest.getHeader("User-Agent"));
Log.getInstance().logInfo(loginMsg);
}else{
Cookie cookie=CookieUtil.createCookie("cwsid",sid,24*60*60);
httpResponse.addCookie(cookie);//加入
user.setInIp(false);
user.setIslogin(true);
UserManager.getInstance().addOutUser(user);//sid加入session中
httpRequest.getSession().setAttribute(Constant.USER_SESSION,user.getSid());
LogRecord loginMsg=new LogRecord(LogType.userlog,LogLevel.veryImportant,"RewriteServlet visitUrl","ip范圍內(nèi)用戶,ip代理登錄");
loginMsg.addInfos("type","login");
loginMsg.addInfos("user",user.doJson());
Log.getInstance().logInfo(loginMsg);
}
}else{//外網(wǎng)用戶
if(checkPath(request_uri)){//遠程用戶在還沒有登錄之前,允許訪問部分網(wǎng)站頁面,這時先設置一個臨時賬戶
if(sidObj==null||!UserManager.getInstance().hasTempUser((String)sidObj))
{
user.setUserName(user.getIp());
user.setIslogin(false);
UserManager.getInstance().addTempUser(user);
httpRequest.getSession().setAttribute(Constant.USER_SESSION,sid);
}
filterChain.doFilter(req,res);
return;
}else {
httpRequest.getSession().setAttribute(Constant.INIP,"out");
String loginUrl=UserManager.getInstance().viewLoginPage(httpRequest,msgCode);
}
}
3.3訪問量統(tǒng)計模塊設計
讀者登錄代理訪問服務器后,代理服務器將記錄讀者所發(fā)送的全部請求報文及數(shù)據(jù)庫服務器返回的全部響應報文,統(tǒng)計計數(shù)器按照相應的統(tǒng)計規(guī)則對所有的報文進行分析處理,從而得到相應的統(tǒng)計結果。而不同廠商的數(shù)字資源系統(tǒng)設計千差萬別,在數(shù)據(jù)結構、存儲方式、信息數(shù)據(jù)格式、檢索語言、檢索方法以及操作要求、應用系統(tǒng)等方面都存在差異。因此,不同的數(shù)字資源庫系統(tǒng)調(diào)用不同的程序模塊進行統(tǒng)計。筆者主要對首頁訪問次數(shù)、檢索次數(shù)、明細鏈接次數(shù)、全文下載次數(shù)進行統(tǒng)計,在設計統(tǒng)計模塊計數(shù)器時均使用模塊化設計(見表1)。
4結語
讀者在使用圖書館海量的數(shù)字資源時,數(shù)字資源統(tǒng)計系統(tǒng)能夠精細完整地記錄用戶的訪問瀏覽行為信息,靈活易讀地展現(xiàn)數(shù)字資源的使用統(tǒng)計結果,科學而全面地評價數(shù)字資源的價值與質(zhì)量,有利于圖書館進行數(shù)字資源續(xù)訂與選用的科學決策,提高圖書館的數(shù)字服務水平。
參考文獻:
[1]胡大琴.圖書館數(shù)字資源利用統(tǒng)計調(diào)查研究[J].圖書館建設,2017(12):69-74.
[2]倪劼.基于SharpPcap的圖書館數(shù)字資源訪問統(tǒng)計系統(tǒng)設計與實現(xiàn)[J].圖書館工作與研究,2017(12):48-53,79.
[3]梁超.淺析國內(nèi)圖書館數(shù)字資源統(tǒng)計的具體做法[J].四川圖書館學報,2016(2):41-45.
[4]周欣,陸康,張迎春.數(shù)字資源校外訪問及統(tǒng)計分析系統(tǒng)探討[J].中華醫(yī)學圖書情報雜志,2016(6):39-44.
[5]陸康.高校圖書館數(shù)字資源統(tǒng)計系統(tǒng)建設研究[J].現(xiàn)代情報,2015(9):140-145.
[6]馬建霞.圖書館數(shù)字資源訪問統(tǒng)計研究[J].圖書館雜志,2005(8):25-29.
[7]徐恪,劉亞霄,劉衛(wèi)東.數(shù)據(jù)庫應用系統(tǒng)中的安全訪問代理的設計與實現(xiàn)[J].計算機工程與應用,2000(1):105-107.
(編校:崔萌)第38卷第10期河南圖書館學刊2018年10月
收稿日期:2018-09-05
作者簡介:李麗博(1982—),洛陽職業(yè)技術學院助理館員。