亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電子資源防惡意下載系統(tǒng)研究?——以華東師范大學為例

        2015-10-23 08:08:06汪志莉
        圖書館學刊 2015年1期
        關鍵詞:IP地址校園網(wǎng)報文

        劉 莉 馮 騏 汪志莉

        (1.華東師范大學信息化辦公室;2.華東師范大學圖書館;3.華東師范大學教育信息技術系,上海 200062)

        近年來,隨著教育信息化的迅猛發(fā)展,為了更好地服務于全校師生的教學科研管理和生活,本校圖書館作為文獻資源存儲和傳播中心,購買了大量的國內(nèi)外電子資源。這些電子資源一般通過3種方式提供給師生:①建立電子資源的校內(nèi)鏡像;②采用本地鏡像索引+包庫的方式;③賬號許可方式。

        目前圖書館引進的電子資源大部分是采用第三種方式,有兩種實現(xiàn)途徑:①圖書館從電子資源提供商那里直接購買使用賬號,遠程連接到電子資源服務器上進行使用;②將校內(nèi)IP地址段和賬號進行綁定,直通免身份認證方式。

        但是,目前基于這兩種方式的電子資源訪問,本校和其他很多高校都碰到了類似的困擾——電子資源惡意下載,即電子資源提供商對于電子資源的訪問有嚴格的監(jiān)控和限制,當同一IP地址一段時間內(nèi)或并發(fā)下載超過一定數(shù)量時,就會進行警告,甚至封殺IP地址(段)、進行法律訴訟。一旦學校收到警告信,或者IP地址遭到封殺,就將產(chǎn)生很大的惡劣影響,一是嚴重影響學校的國內(nèi)外形象和聲譽,二是有可能因此大幅增加下一年度的購買成本。

        由于本校電信出口進行了地址映射(NAT),所有校園網(wǎng)地址映射成一個(段)IP地址,所以對于某些以單個IP單位時間內(nèi)下載數(shù)量進行判定的數(shù)據(jù)庫惡意下載的誤判、警告頻率和惡劣影響更大,而且給惡意下載源的控制和追溯帶來了更大的挑戰(zhàn)。

        1 惡意下載的現(xiàn)狀

        雖然幾乎每所圖書館都已經(jīng)發(fā)布了《數(shù)據(jù)庫使用版權公告》,但隨著電子資源總量的日益增加和使用量的遞增,電子資源惡意下載現(xiàn)象仍呈現(xiàn)日益增長的態(tài)勢。

        清華大學圖書館發(fā)布《違規(guī)使用電子資源的處理情況》,例舉了2003~2013年所有違規(guī)下載行為。浙江大學圖書館2011~2013年先后發(fā)布了9條、5條、7條關于違規(guī)下載的通告,這些惡意下載,導致學校部分IP被封;除此以外,很多其他高校也發(fā)布了“違規(guī)下載通告”。

        本校也面臨同樣的問題,例如APS journals,2011年以來先后收到7封違規(guī)下載郵件,ACS也收到6封違規(guī)下載郵件,還有中國知網(wǎng)、申報等也有諸如此類的違規(guī)下載通告。

        以上數(shù)據(jù)顯示,如何防范和應對電子資源惡意下載已經(jīng)成為全國各大高校圖書館共同面臨和研究的課題。根據(jù)學校自身特點和借鑒兄弟院校成功經(jīng)驗,高校應從制度規(guī)范、意識教育和技術防范3個方面來逐步解決此問題。圖書館作為電子資源的管理部門,應加強電子資源的制度規(guī)范建設,經(jīng)常性地對師生進行合理合法的使用意識教育。而高校信息化辦公室作為技術管理部門,應該發(fā)揮自身硬件及軟件的技術優(yōu)勢,對讀者的下載進行實時監(jiān)控,采取有效措施,減少甚至免除惡意下載造成的影響,提高電子資源的服務質(zhì)量。筆者主要從技術角度探討電子資源防惡意下載的應對措施。

        2 電子資源防惡意下載系統(tǒng)的研究現(xiàn)狀

        鑒于惡意下載的不良影響,各大高校也結合自身情況,對文獻下載流量統(tǒng)計與監(jiān)控進行研究與實施。例如,清華大學圖書館建立了“電子資源訪問管理與控制系統(tǒng)”[1];上海交通大學圖書館聯(lián)合校網(wǎng)絡中心建立了“高校電子資源訪問管理控制系統(tǒng)”[2];南京航空航天大學信息學院提出了“一種帶約束特性的網(wǎng)絡信息下載監(jiān)考模型”以及“基于使用控制模型的防惡意下載系統(tǒng)”[3]。

        國內(nèi)各大高校陸續(xù)提出了適合自身的電子資源訪問管理與控制系統(tǒng),本校也結合自身網(wǎng)絡環(huán)境和電子資源情況,提出解決問題的方案,并逐步付諸實施。

        3 電子資源防惡意下載系統(tǒng)的研究思路

        惡意下載通常具備以下特征:利用下載工具或多線程進行下載;同一IP地址(段)的單位時間內(nèi)的下載總量或者并發(fā)超出電子資源服務提供商設置的閾值。

        基于惡意下載的行為特性,通常采取基于流量分析和基于數(shù)據(jù)報文分析兩種方式來進行防惡意下載的研究。

        3.1 基于流量分析(網(wǎng)絡層)

        在校園網(wǎng)出口處,針對數(shù)據(jù)庫所提供的IP地址(段)的特定端口,進行流量分析與跟蹤。當異常流量出現(xiàn)時(如,短時大量80端口的連接請求),采取風險控制措施(中斷該連接或者封禁IP地址)。

        基于流量分析方式處理簡單,僅需處理IP數(shù)據(jù)報頭,系統(tǒng)負荷小,易于實現(xiàn)。但是由于模糊定量,無法精確判斷,造成誤判率較高。此種方式下,應該參考各電子資源提供商的警告閾值,合理設置,可以采取將閾值降低的方式,以降低對惡意下載的漏判率。

        3.2 基于數(shù)據(jù)報文分析(應用層)

        在校園網(wǎng)出口處,將所有出入的數(shù)據(jù)報文鏡像,然后在應用層對數(shù)據(jù)進行分析控制。即:分析應用層的http報文中的url后綴字段,分離出http下載報文和http訪問請求報文。根據(jù)電子資源數(shù)據(jù)庫指定的地址段,對目的地址屬于該范圍的下載報文的特定后綴進行統(tǒng)計分析,如果其單位時間內(nèi)的下載報文次數(shù)超過規(guī)定的閾值(參考各數(shù)據(jù)庫規(guī)定),則對其進行風險控制措施(封禁IP或中斷其連接及警告)?;跀?shù)據(jù)報文分析中的數(shù)據(jù)統(tǒng)計分析通常采用將抓包采集到的數(shù)據(jù),做初步分析之后錄入數(shù)據(jù)庫進行查詢分析或者文本方式存儲在本地,通過搜索引擎建立索引的方式進行文本查詢,數(shù)據(jù)庫中僅保存索引。文本方式對系統(tǒng)負荷小,但性能取決于搜索引擎的優(yōu)化。

        基于數(shù)據(jù)報文分析方式判斷精確,誤判率較低。但由于要實時處理長字符串(http報文),處理復雜,因此系統(tǒng)負荷較大。

        4 電子資源防惡意下載系統(tǒng)設計

        2010年,本校已經(jīng)進行了電子資源防惡意下載系統(tǒng)的探索嘗試,通過部署在校園網(wǎng)出口處的上網(wǎng)行為審計設備進行電子資源數(shù)據(jù)庫的訪問統(tǒng)計分析與追溯。該設備將所有校園網(wǎng)出口的流量進行了鏡像,如圖1所示。

        圖1 流量鏡像配置

        由于上網(wǎng)行為審計設備旁路在校園網(wǎng)出口,僅對流經(jīng)校園網(wǎng)出口的網(wǎng)絡流量進行了鏡像,而且定制功能尚不完善,所以該功能目前僅用于供圖書館進行訪問統(tǒng)計分析和惡意下載的事后追溯,無法進行控制和防護。

        圖2 現(xiàn)狀

        在借鑒學習了諸多其他兄弟院校的解決方案后,本校也積極做了進一步的研究和嘗試。由于基于網(wǎng)絡流量的方式存在誤判率較高的問題,因此筆者選擇基于數(shù)據(jù)報文的方式來進行電子資源防惡意下載系統(tǒng)的研究與探索,以期對電子資源的訪問下載進行有效的管理以及合理的使用。

        基于數(shù)據(jù)報文的電子資源防惡意下載系統(tǒng)的技術方案包括系統(tǒng)網(wǎng)絡架構、軟件架構和技術實施方案3部分。

        4.1 系統(tǒng)網(wǎng)絡架構方案

        電子資源防惡意下載系統(tǒng)的網(wǎng)絡架構與以前的實現(xiàn)方法類似,即在校園網(wǎng)絡出口處將所有流量鏡像給抓包服務器,或者抓包服務器、應用服務器合并串聯(lián)在校園網(wǎng)出口處,如圖3所示。

        圖3 系統(tǒng)網(wǎng)絡架構

        4.2 系統(tǒng)軟件架構及技術方案

        電子資源的下載大多采用HTTP方式和FTP方式。由于數(shù)據(jù)庫提供商一般不會提供BT方式,所以本方案對此暫未考慮。對于控制下載行為及下載計數(shù),首先需要分析應用層網(wǎng)絡數(shù)據(jù)包的包頭,分析包頭中哪些是下載的數(shù)據(jù)包。對于HTTP方式的下載,需要分析每個HTTP請求及響應的參數(shù),根據(jù)HTTP協(xié)議response的Content-Type來判斷響應的類型,如果是規(guī)定的文件類型,則記為一次下載。對于FTP方式的文件下載,可以通過監(jiān)聽tcp協(xié)議的21號端口,如果21端口有數(shù)據(jù)傳輸,則記為下載。

        本方案實現(xiàn)中的難點是對于某些特定的下載,資料鏈接在A網(wǎng)站,而存儲在B網(wǎng)站,于是真正的下載需要跳到B網(wǎng)站進行,此時需要人工創(chuàng)建或者自動建立A網(wǎng)站和B網(wǎng)站之間的關系。關系創(chuàng)建之后,所有B網(wǎng)站的下載可視為A網(wǎng)站的下載。

        本電子資源防惡意下載系統(tǒng)自下而上可分為網(wǎng)絡數(shù)據(jù)包抓取系統(tǒng)、解析HTTP tcp/ip數(shù)據(jù)包系統(tǒng)、下載規(guī)則對比、下載規(guī)則管理平臺、統(tǒng)計報表系統(tǒng)。本解決方案的軟件架構如圖4所示。

        圖4 系統(tǒng)軟件架構

        電子資源防惡意下載系統(tǒng)使用C語言和Java語言編寫,運行在LINUX平臺,也可以運行在Windows平臺。電子資源防惡意下載系統(tǒng)要求HTTP數(shù)據(jù)包抓包率達到100%,每個數(shù)據(jù)包的分析過濾響應時間小于10ms,才能保證每一個可能的惡意下載都納入監(jiān)控之中。因此,網(wǎng)絡數(shù)據(jù)包抓包程序和數(shù)據(jù)包分析協(xié)議解碼程序由C語言編寫,C語言在速度和執(zhí)行效率上要高于Java等其他語言。

        4.2.1 網(wǎng)絡數(shù)據(jù)包抓包程序

        網(wǎng)絡數(shù)據(jù)包抓包程序采用Libpcap作為底層抓包庫。Libpcap是unix/linux平臺下的網(wǎng)絡數(shù)據(jù)包捕獲函數(shù)包,這個抓包庫提供了一個高層次的接口可以捕獲所有網(wǎng)絡上的數(shù)據(jù)包,并充分考慮到應用程序的可移植性。

        4.2.2 數(shù)據(jù)包分析封底&解碼程序

        數(shù)據(jù)包分析封底&解碼程序,負責解析HTTP和TCP/IP數(shù)據(jù)包并將結果放到Pool中。

        對于每一次下載,需要根據(jù)TCP協(xié)議解析TCP協(xié)議包頭得到源端口和目標端口;根據(jù)IP協(xié)議解析IP協(xié)議包頭得到源IP地址和目標IP地址。然后,再解析HTTP協(xié)議請求響應Header,如圖5所示。

        圖5 HTTP請求響應Header

        根據(jù)HTTP 請求頭,取到字段(host,URL,Referer,Request Date,Content-type,Response Date,Response,Contentstype,payload)。最后,把TCP/IP和HTTP協(xié)議解析得到的所有有用字段放入Pool中,供規(guī)則對比程序調(diào)用數(shù)據(jù)。

        4.2.3 分析線程流程

        圖6 數(shù)據(jù)分析線程流程

        ①首先通過數(shù)據(jù)包抓包程序和分析程序抓取IP、TCP和HTTP數(shù)據(jù)報文。

        如果是數(shù)據(jù)包HTTP的Request,則將數(shù)據(jù)包中的RequestURl、REFERER、HOST及HTTP協(xié)議對應的TCP報文的端口、ack號及IP報文的IP地址等信息放到內(nèi)存中緩存Pool中(TCP封裝的http協(xié)議報文中,HTTP的Request數(shù)據(jù)報文TCP的ack編號和Response對應的TCP報文的seq編號相同。根據(jù)這個編號及IP地址、端口建立Request和Response的對應關系)。對于跨站下載方式,真正的下載鏈接在其他網(wǎng)站,可以通過HTTP報文中的REFERER字段來判斷是否是控制網(wǎng)站發(fā)出的請求。

        如果數(shù)據(jù)包是Response報文類型,取到TCP報文的端口、seq和IP報文中的IP地址信息,根據(jù)這些信息從內(nèi)存中緩存Pool取出請求信息,能取出說明是要控制下載的網(wǎng)站的請求的URL。然后取到HTTP協(xié)議報文對應的content_type,根據(jù)content_type判斷請求的URL是否是下載的文件類型。如果是,再從HTTP response報文Content_Disposition中取到下載的文件名,將下載信息存到內(nèi)存緩存中,由另外保存下載的線程存入數(shù)據(jù)庫中。

        常見屬于下載文件content_type類型有application/octetstream、application/pdf、application/msword、application/x-xls、application/vnd.ms-excel、application/x-ppt和application/zip。

        4.2.4 數(shù)據(jù)下載規(guī)則比對

        協(xié)議分析程序分離出需要控制的協(xié)議包,根據(jù)規(guī)則庫定義的規(guī)則進行對比。程序在啟動時把所有網(wǎng)站的下載規(guī)則包括每個網(wǎng)站最后的時間、下載次數(shù)都讀到內(nèi)存中。當有一個HTTP或TCP的數(shù)據(jù)包到達時,和內(nèi)存中的規(guī)則庫比較,如果達到該網(wǎng)站規(guī)則的下載的最大次數(shù),通知阻斷下載的接口,同時更新該網(wǎng)站下載次數(shù),記錄該網(wǎng)站的下載記錄。如果沒有達到允許的下載次數(shù),則只記錄該網(wǎng)站的下載記錄。數(shù)據(jù)下載規(guī)則比對流程如圖7所示。

        圖7 數(shù)據(jù)下載規(guī)則比對流程

        4.3 模擬實現(xiàn)

        電子資源防惡意下載系統(tǒng)使用C語言和Java語言編寫,在Windows平臺下進行了模擬實現(xiàn)。運行環(huán)境:JDK1.6、GCC;數(shù)據(jù)庫:Mysql 6.1;應用服務器:Tomcat6.36。模擬實現(xiàn)效果如圖8所示。

        圖8 模擬實現(xiàn)效果

        5 總結與展望

        隨著電子資源的不斷增加,惡意下載形勢日益嚴峻,我們必須根據(jù)本館的實際情況,積極面對這一挑戰(zhàn)。筆者基于數(shù)據(jù)報文方式進行了一定的研究探索和模擬實現(xiàn),控制下載次數(shù)的統(tǒng)計要求HTTP數(shù)據(jù)包抓包率100%,每個數(shù)據(jù)包的分析過濾響應時間小于10ms,這樣才能保證監(jiān)控到每一次下載。學??偝隹诹髁勘容^大,需要軟件結合性能強大的硬件才能更加完善,因此下一步需要加強硬件的支撐,完善阻斷功能,才能更好地防范惡意下載。

        [1] 鄒榮,等.電子資源訪問管理與控制系統(tǒng)的設計與應用[J].圖書情報工作,2010(1).

        [2] 施曉華,錢吟,謝銳.高校電子資源訪問控制系統(tǒng)的設計和應用[J].計算機應用研究,2011(3).

        [3] 劉大偉,等.基于使用控制模型的防惡意下載系統(tǒng)[J].計算機工程,2009(23).

        猜你喜歡
        IP地址校園網(wǎng)報文
        基于J1939 協(xié)議多包報文的時序研究及應用
        汽車電器(2022年9期)2022-11-07 02:16:24
        數(shù)字化校園網(wǎng)建設及運行的幾點思考
        甘肅教育(2020年18期)2020-10-28 09:05:54
        CTCS-2級報文數(shù)據(jù)管理需求分析和實現(xiàn)
        鐵路遠動系統(tǒng)幾種組網(wǎng)方式IP地址的申請和設置
        淺析反駁類報文要點
        中國外匯(2019年11期)2019-08-27 02:06:30
        試論最大匹配算法在校園網(wǎng)信息提取中的應用
        電子制作(2019年10期)2019-06-17 11:45:26
        NAT技術在校園網(wǎng)中的應用
        電子制作(2017年8期)2017-06-05 09:36:15
        基于SNMP的IP地址管理系統(tǒng)開發(fā)與應用
        黑龍江電力(2017年1期)2017-05-17 04:25:16
        ATS與列車通信報文分析
        VPN在校園網(wǎng)中的集成應用
        狠狠色丁香久久婷婷综合蜜芽五月 | 久久精品国产黄片一区| 西川结衣中文字幕在线| 琪琪的色原网站| 日本久久久| 国产精东一区二区三区| 亚洲国产中文字幕在线视频综合| 国产成人av一区二区三区| 亚洲天堂在线播放| 青青草国内视频在线观看| 人妻制服丝袜中文字幕| 欧美又大又色又爽aaaa片| 国产欧美日韩专区| 国内精品熟女一区二区| 肥老熟女性强欲五十路| 亚洲毛片αv无线播放一区| 在线观看无码一区二区台湾| 日韩中文字幕一区在线| 日本孕妇潮喷高潮视频| 成在人线av无码免观看麻豆 | 产美女被爽到高潮免费a| 消息称老熟妇乱视频一区二区| 无遮挡网站| 国产自拍伦理在线观看| 亚洲综合图色40p| 精品无码国产自产野外拍在线| 制服无码在线第一页| 精品亚洲一区中文字幕精品| 亚洲成在人线av品善网好看| 久久露脸国产精品| 国产主播在线 | 中文| 女同在线视频一区二区| 免费又黄又爽又色的视频| 曰本女人与公拘交酡免费视频| 国产亚洲高清在线精品不卡| 激情五月开心五月麻豆| 在线视频观看免费视频18| 日批视频免费在线观看| 美女和男人一起插插插| 亚洲精品~无码抽插| 欧美一级欧美一级在线播放|