□邵晶 閻曉弟 周琴 張靜
自從開始引進(jìn)國(guó)內(nèi)外電子資源,大學(xué)圖書館就肩負(fù)著維護(hù)電子資源合理使用的責(zé)任。以西安交通大學(xué)圖書館為例,無論在圖書館主頁公告里還是在數(shù)據(jù)庫導(dǎo)航或期刊導(dǎo)航頁面中,都給予了醒目提示,明確電子資源合理使用規(guī)定。應(yīng)該說,電子資源合理使用在大學(xué)中得到了有效的宣傳,獲得了一定的效果。但是隨著讀者越來越依賴電子文獻(xiàn),電子資源下載量不斷攀升,一些問題逐漸凸顯出來:
(1)超量、違規(guī)和盜用下載經(jīng)常發(fā)生,不僅影響了電子資源正常使用,而且導(dǎo)致了電子資源下載量的虛高。
(2)一些數(shù)據(jù)庫提供商對(duì)下載限量或下載速度敏感度過高,導(dǎo)致圖書館頻繁收到警告信,同時(shí)用戶IP地址或地址段被封掉,圖書館經(jīng)常陷于處理查找IP被封的原因、回復(fù)數(shù)據(jù)庫提供商郵件等事務(wù)的煩惱之中。目前,不同數(shù)據(jù)庫對(duì)下載上限要求不盡相同,如:美國(guó)汽車工程師學(xué)會(huì)SAE數(shù)據(jù)庫規(guī)定連續(xù)1小時(shí)內(nèi)下載超過100篇,發(fā)出警告;超過200篇,關(guān)閉數(shù)據(jù)庫;CNKI數(shù)據(jù)庫規(guī)定:每4秒下載不能超過20篇、每10秒內(nèi)不能超過90篇;或者一次登錄后不能連續(xù)下載超過300篇。而大部分?jǐn)?shù)據(jù)庫商并沒有明確提出下載限制,但強(qiáng)調(diào)無論下載幾篇,都不能用工具下載[1]。
(3)一些數(shù)據(jù)庫提供商開始按照年度下載量來制定下個(gè)合同期定價(jià)等級(jí),隨著下載量的升高,下一年或下一個(gè)合同期的價(jià)格不斷遞增。用戶下載行為不僅直接影響到電子資源的正常使用,而且也可能會(huì)影響到圖書館續(xù)訂電子資源下一個(gè)合同期的價(jià)格。
由此可見,如何采取有效措施來控制下載行為,防止電子資源的過度下載、違規(guī)或非法盜用下載,將電子資源使用量控制在合理的范圍內(nèi)已成為大學(xué)圖書館迫切需要解決的問題。
在校園網(wǎng)內(nèi)電子資源下載行為可分為正常下載、過度下載、違規(guī)下載、違法盜用下載。
正常下載通常是指通過檢索,獲取檢索結(jié)果,經(jīng)過認(rèn)真挑選,按部就班地下載自己確實(shí)需要的全文。
過度下載往往是指通過檢索,獲取檢索結(jié)果,沒有經(jīng)過認(rèn)真挑選,即將大量的文獻(xiàn)下載到本地以備后用。
違規(guī)下載則是指利用網(wǎng)絡(luò)螞蟻等各種下載軟件批量下載全文或整本期刊、圖書的下載,這種下載行為能被數(shù)據(jù)提供商偵測(cè)到,并發(fā)出警告信、封殺IP訪問甚至關(guān)閉數(shù)據(jù)庫的訪問。
違法盜用下載,是指為了商業(yè)目的,連續(xù)地、大量地在校園網(wǎng)內(nèi)下載電子資源。
表1列出了四種下載行為方式及產(chǎn)生的后果。由表1可見,四種下載行為方式中,過度下載、違規(guī)下載和違法盜用下載這三種方式,不僅會(huì)占用學(xué)校網(wǎng)絡(luò)資源、影響電子資源的正常使用,而且將使得數(shù)據(jù)庫全文年下載量急劇升高,其中的虛高使用量在很大程度上直接影響到數(shù)據(jù)庫下一年度或下個(gè)合同期的價(jià)格,圖書館將為此付出高昂的訂閱費(fèi)用。
要想既能有效地控制電子資源超量、違規(guī)和盜用下載行為,又不影響讀者對(duì)電子資源的正常使用,需要設(shè)計(jì)一個(gè)實(shí)時(shí)的電子資源流量控制系統(tǒng),其基本功能應(yīng)該滿足以下需求:
表1 電子資源四種下載行為方式
(1)完整捕獲、分析校園網(wǎng)出口的所有電子資源訪問流量。
在不改變讀者正常訪問電子資源習(xí)慣、且不影響讀者使用電子資源的情況下,能完整捕獲到校園網(wǎng)出口的所有訪問電子資源流量,通過分析校園網(wǎng)內(nèi)不同IP對(duì)電子資源的下載行為,對(duì)流量進(jìn)行實(shí)時(shí)監(jiān)控。
(2)對(duì)不同的數(shù)據(jù)庫下載量實(shí)現(xiàn)差異管理。
在流量控制系統(tǒng)中,針對(duì)不同的數(shù)據(jù)庫設(shè)置不同的下載閾值,實(shí)現(xiàn)差異化管理。在對(duì)下載量超過閾值的IP推送警告信息的同時(shí),立即阻斷該IP的訪問。
(3)對(duì)被阻斷的IP地址進(jìn)行有效管理。
需要流量控制系統(tǒng)能夠記錄、統(tǒng)計(jì)被阻斷IP訪問的情況,對(duì)于屢次被阻斷的IP地址進(jìn)行黑名單管理,以便重點(diǎn)監(jiān)視黑名單中的IP,并對(duì)其進(jìn)行重點(diǎn)調(diào)查、控制其訪問權(quán)。
(4)能夠解決數(shù)據(jù)庫URL對(duì)其IP地址解析和維護(hù)問題。
確保電子資源流量有效控制的大前提在于,必須保證被流量控制的數(shù)據(jù)庫URL及其對(duì)應(yīng)的IP地址準(zhǔn)確無誤。如果數(shù)據(jù)庫URL發(fā)生變化或?qū)?yīng)的IP地址發(fā)生變化,都會(huì)出現(xiàn)漏控問題。通常,數(shù)據(jù)庫的URL發(fā)生變化,數(shù)據(jù)庫提供商會(huì)及時(shí)提供變更信息,否則用戶將無法訪問數(shù)據(jù)庫;但是,往往一個(gè)數(shù)據(jù)庫的URL會(huì)對(duì)應(yīng)多個(gè)IP地址,如果數(shù)據(jù)庫URL沒有變化,但其對(duì)應(yīng)的IP地址發(fā)生變更或增加新的IP地址,那么數(shù)據(jù)庫提供商是不會(huì)提醒圖書館這種變化信息的。因此需要流量控制系統(tǒng)不僅能對(duì)數(shù)據(jù)庫URL進(jìn)行IP地址解析,而且還能及時(shí)發(fā)現(xiàn)、并自動(dòng)給出變更的IP地址。
西安交通大學(xué)圖書館為了能夠有效地實(shí)施電子資源流量控制,經(jīng)過與本校網(wǎng)絡(luò)中心討論和協(xié)商之后,圖書館被允許從校園網(wǎng)出口將所有基于HTTP流量旁路到本地,然后通過電子資源流量控制系統(tǒng)進(jìn)行流量分析和控制。電子資源流量控制系統(tǒng)部署在圖書館,硬件設(shè)備包括:一臺(tái)交換機(jī)用于流量過濾;兩個(gè)流量捕獲卡,分別用于流量采集和發(fā)送阻斷信息包;一臺(tái)服務(wù)器用于運(yùn)行電子資源流量控制系統(tǒng)。電子資源流量控制解決方案如圖1所示。
圖1 電子資源流量控制解決方案示意圖
由圖1可見電子資源流量控制整個(gè)過程,即:從校園網(wǎng)出口實(shí)時(shí)采集基于HTTP的所有流量,根據(jù)事先設(shè)置好的數(shù)據(jù)庫下載閾值,對(duì)流量進(jìn)行分析,當(dāng)發(fā)現(xiàn)某個(gè)用戶的下載量超過設(shè)定的閾值時(shí),立即發(fā)出阻斷包,對(duì)其下載文獻(xiàn)進(jìn)行阻斷,并發(fā)出警告信息給該用戶,從而實(shí)現(xiàn)流量控制。
根據(jù)電子資源流量控制需求分析,明確了電子資源流量控制系統(tǒng)應(yīng)具備的核心功能,包括:數(shù)據(jù)庫阻斷閾值設(shè)置模塊、數(shù)據(jù)庫域名及IP地址檢測(cè)管理功能模塊、數(shù)據(jù)庫并發(fā)數(shù)詳情統(tǒng)計(jì)模塊、阻斷控制及阻斷信息統(tǒng)計(jì)模塊和用戶黑白名單管理模塊。
數(shù)據(jù)庫阻斷閾值設(shè)置功能:對(duì)不同數(shù)據(jù)庫實(shí)現(xiàn)差異管理,即針對(duì)不同的數(shù)據(jù)庫設(shè)置不同的下載閾值;閾值單位為:每五分鐘打開全文不超過若干個(gè)進(jìn)程,如,ACS的下載閾值被設(shè)置為20,指每五分鐘打開全文不超過20個(gè)進(jìn)程。此外,可以針對(duì)不同的數(shù)據(jù)庫設(shè)置阻斷警告文本信息以及數(shù)據(jù)庫的URL及其IP地址等信息。
數(shù)據(jù)庫域名及IP地址檢測(cè)管理功能:被控?cái)?shù)據(jù)庫URL地址自動(dòng)對(duì)其進(jìn)行IP地址解析,當(dāng)數(shù)據(jù)庫URL對(duì)應(yīng)的IP地址發(fā)生變更時(shí),系統(tǒng)會(huì)自動(dòng)發(fā)現(xiàn)數(shù)據(jù)庫域名對(duì)應(yīng)的變更IP地址,并提出警告,方便管理員維護(hù)更新。
數(shù)據(jù)庫并發(fā)數(shù)詳情統(tǒng)計(jì)功能:能夠查詢、統(tǒng)計(jì)當(dāng)前時(shí)間段各個(gè)數(shù)據(jù)庫的并發(fā)用戶數(shù)及每個(gè)IP用戶對(duì)不同數(shù)據(jù)庫下載的詳情。
阻斷控制及阻斷信息統(tǒng)計(jì)功能:對(duì)不同的數(shù)據(jù)庫設(shè)置下載最大閾值,對(duì)超過下載閾值的IP地址立即阻斷,并推送頁面警告信息,自動(dòng)阻斷和解除阻斷的時(shí)間間隔可根據(jù)需要進(jìn)行設(shè)置。并能夠基于時(shí)間段查詢阻斷日志詳情,包括:被阻斷用戶IP地址、開始阻斷時(shí)間、結(jié)束阻斷時(shí)間、阻斷數(shù)據(jù)庫名稱、當(dāng)前狀態(tài)等,并提供統(tǒng)計(jì)報(bào)表導(dǎo)出功能。
用戶黑白名單管理功能:可設(shè)置靜態(tài)黑、白名單,根據(jù)實(shí)際情況,實(shí)現(xiàn)對(duì)用戶訪問數(shù)據(jù)庫權(quán)限的靈活控制。例如,可對(duì)經(jīng)常違規(guī)下載的IP進(jìn)行黑名單管理,對(duì)其進(jìn)行長(zhǎng)期監(jiān)控和管制。
陜西誠泰科技訊息有限責(zé)任公司根據(jù)電子資源流量控制需求分析和功能模塊設(shè)計(jì),對(duì)流量控制系統(tǒng)進(jìn)行了研發(fā)和技術(shù)攻關(guān),實(shí)現(xiàn)了電子資源流量控制系統(tǒng)核心功能。
經(jīng)過系統(tǒng)測(cè)試和不同數(shù)據(jù)庫閾值的設(shè)置調(diào)試、摸索,2011年11月電子資源流量控制系統(tǒng)在西安交通大學(xué)正式投入使用。目前,西安交通大學(xué)對(duì)那些曾經(jīng)收到數(shù)據(jù)庫提供商警告信的數(shù)據(jù)庫進(jìn)行了不同閾值的設(shè)置,如:SAE設(shè)置下載閾值為5;ACS、AIP下載閾值為20;APS、IEL下載閾值為25;CNKI下載閾值為280,等等。
自電子資源流量控制系統(tǒng)投入運(yùn)行以來,西安交通大學(xué)幾乎沒有再收到數(shù)據(jù)庫提供商的警告信。特別是平時(shí)發(fā)警告信最多的AIP、APS、ACS、IEEE等數(shù)據(jù)庫,在流量控制系統(tǒng)中能看到那些疑似超量、違規(guī)和盜用下載行為都被及時(shí)發(fā)現(xiàn)并得到有效控制。在近六個(gè)月的時(shí)間里,Elsevier數(shù)據(jù)庫下載被阻斷次數(shù)超過3500多次;Springer Link、AIP、IEEE被阻斷超過1500多次;ACS被阻斷近千次。從流量控制系統(tǒng)中我們?cè)?jīng)發(fā)現(xiàn)一個(gè)典型的案例,某個(gè)IP在凌晨某個(gè)時(shí)間點(diǎn),同時(shí)在下載Elsevier、Springer Link、IEL、Wiley、Nature等全文期刊數(shù)據(jù)庫時(shí)被有效地阻斷,從而在數(shù)據(jù)庫提供商發(fā)現(xiàn)之前,流量控制系統(tǒng)提前發(fā)現(xiàn)和阻斷了這個(gè)IP地址的這種疑似惡意下載行為。
由此可見,電子資源流量控制系統(tǒng)在西安交通大學(xué)的運(yùn)用取得了非常好的效果。
隨著圖書館電子資源不斷增加以及網(wǎng)絡(luò)基礎(chǔ)設(shè)施的不斷完善,讀者閱讀越來越依賴電子文獻(xiàn)、依賴于網(wǎng)絡(luò),因此確保電子資源合理使用尤為重要。
在網(wǎng)絡(luò)信息技術(shù)不斷發(fā)展的今天,大學(xué)與網(wǎng)絡(luò)運(yùn)營(yíng)商的合作更加廣泛,校園網(wǎng)可能存在多條出口鏈路;NAT地址轉(zhuǎn)換、Wi-Fi/3G、遠(yuǎn)程訪問 VPN、移動(dòng)圖書館等技術(shù)使得訪問電子資源網(wǎng)絡(luò)環(huán)境更加復(fù)雜,電子資源訪問方式也更加多樣化。在實(shí)施電子資源流量控制系統(tǒng)過程中必須全面考慮這些情況,否則就會(huì)直接影響到電子資源流量的有效控制。
圖書館只有準(zhǔn)確掌握了不同電子資源過量下載的判定標(biāo)準(zhǔn),才能更合理地配置不同數(shù)據(jù)庫的下載控制參數(shù),在保證合法用戶正常使用的前提下,實(shí)現(xiàn)電子資源下載的有效控制。
1 張靜等 .電子資源違規(guī)使用行為分析及圖書館的應(yīng)對(duì)措施.大學(xué)圖書館學(xué)報(bào),2008(2):64-87