摘 ?要:以現(xiàn)有高校校園網絡體系結構為依托,利用大數(shù)據(jù)的可視化分析和數(shù)據(jù)挖掘技術,分別從大數(shù)據(jù)背景下高校校園網絡體系結構存在的風險、網絡信息安全監(jiān)測與分析、網絡信息安全防護策略三個維度進行分析。通過對網絡環(huán)境下數(shù)據(jù)的清洗、去冗等操作,實現(xiàn)對數(shù)據(jù)的安全訪問和隱私保護,從而為高校校園網絡信息安全實施主動免疫可信計算。
關鍵詞:大數(shù)據(jù);高校網絡安全;數(shù)據(jù)處理
中圖分類號:TP309 ? ? 文獻標識碼:A 文章編號:2096-4706(2020)12-0148-03
Abstract:Relying on the existing university campus network architecture,combined with the big data visualization analysis and data mining technology,from the massive data to the challenges of the existing university campus network model,network information security monitoring and analysis,network information security protection strategy three dimensions are analyzed. Through the operations such as cleaning and deduplication of data in the network environment,safe access to data and privacy protection are realized,so as to implement active immune trusted computing for campus network information security.
Keywords:big data;college network security;data processing
0 ?引 ?言
近年來,隨著互聯(lián)網、云計算和物聯(lián)網的迅猛發(fā)展,數(shù)以億計的互聯(lián)網服務時時刻刻都在產生巨量的數(shù)據(jù),數(shù)據(jù)規(guī)模積極擴大對現(xiàn)有高校校園網絡信息安全造成了一定沖擊。所以在大數(shù)據(jù)背景下,如何確保高校校園網絡信息安全,已經成為一個急需探討的問題。
1 ?大數(shù)據(jù)的概念
大數(shù)據(jù)是指數(shù)據(jù)規(guī)模大、數(shù)據(jù)形式多樣、非結構化特征明顯而導致數(shù)據(jù)存儲、處理和挖掘異常困難的數(shù)據(jù)集,其具有規(guī)模大、種類多、速度快、價值密度低和真實性差等特點。由于高校校園人員密集,大學生防范意識較弱,在現(xiàn)有數(shù)據(jù)存儲與共享環(huán)境下,如何消除各種網絡信息安全隱患與漏洞,有效保護校園網絡信息安全是一個重要的研究方向。
2 ?大數(shù)據(jù)背景下高校校園網絡體系結構存在的風險
2.1 ?數(shù)據(jù)處理的安全
隨著數(shù)據(jù)規(guī)模增大,電子方式存儲的數(shù)據(jù)總量飛速增長,數(shù)據(jù)規(guī)模的急劇擴大超過了當前計算機存儲與處理能力,而且數(shù)據(jù)形式多樣化、非結構化特征明顯。如何有效地提高數(shù)據(jù)處理的安全性至關重要。例如數(shù)據(jù)在錄入、處理、統(tǒng)計或打印中由于硬件故障、斷電、死機、任務的誤操作、程序缺陷、病毒或黑客等造成的數(shù)據(jù)庫損壞或數(shù)據(jù)丟失都是需要關注的問題。
2.2 ?數(shù)據(jù)的存儲安全
大數(shù)據(jù)是計算機和互聯(lián)網相結合的產物,計算機實現(xiàn)了數(shù)據(jù)的數(shù)字化,互聯(lián)網實現(xiàn)了數(shù)據(jù)的網絡化,新的數(shù)據(jù)正在以指數(shù)級加速產生,在“人、機、物”三元世界在網絡空間融合的過程中,網絡大數(shù)據(jù)的規(guī)模和復雜度的增長超出了硬件能力增長的摩爾定律,對高?,F(xiàn)有網絡體系數(shù)據(jù)存儲的物理安全性提出了更高的挑戰(zhàn)。這里的物理安全主要指數(shù)據(jù)信息存儲介質的損壞,物理安全隱患包括網絡異常下的數(shù)據(jù)安全傳輸、人員誤操作導致的文件刪除和信息泄露及停電斷電等設備故障。數(shù)據(jù)存儲的安全是指數(shù)據(jù)庫在系統(tǒng)運行之外的可讀性,對于一個標準的SQL Server數(shù)據(jù)庫,一旦數(shù)據(jù)庫被盜,即使沒有原來的系統(tǒng)程序,也可以另外編寫程序對盜取的數(shù)據(jù)庫進行增刪改查操作。因此需要考慮現(xiàn)有計算機網絡通信的保密、安全及軟件保護等問題。
3 ?大數(shù)據(jù)下網絡信息安全監(jiān)測與分析
西安財經大學行知學院校園網絡體系結構如圖1所示,主要采用混合型拓撲結構,由星型拓撲結構和點對點拓撲結構組成。學校根據(jù)部門及業(yè)務需求進行子網劃分,子網之間根據(jù)用戶需求可以相互訪問。其中行政辦公網、生活區(qū)網、教務系統(tǒng)網、學生宿舍網、DMZ(獨立的網絡區(qū)域)安全網是星型拓撲結構的疊加,網絡管理平臺和對外服務器采用點對點的拓撲結構。
本校校園網絡在核心層采用三層交換機,為了防止其中某個交換機或鏈路失效,在設計時采用主備交換機設備和雙鏈路部署,確保網絡安全的容錯性。核心層的兩個交換機連接的ATM交換機采用GE(1 000 Mbps)的帶寬速率,其余連接均使用FE(100 Mbps)的帶寬速率。對于教務系統(tǒng)來說,其承載著高校師生選課、考試、登錄成績、四六級報名等核心業(yè)務,面對這種噴發(fā)式的數(shù)據(jù)訪問量,為了確保網絡信息的安全性,在對網絡體系結構進行部署時,采用雙鏈路來提高鏈路數(shù)據(jù)傳輸效率及安全性。防火墻和對外服務器間接入IPS(入侵預防系統(tǒng))用來監(jiān)視網絡或網絡設備的網絡資料傳輸行為。
我校網絡信息安全保障體系主要采用深度保護戰(zhàn)略模型,如圖2所示,主要包含保護局域網計算環(huán)境、保護區(qū)域邊界、保護網絡和基礎設施、保護支撐基礎設施。深度保護戰(zhàn)略體系包含人、技術和操作三個要素。在網絡體系結構設計時,分別從內網接口的安全防護和對外網接口的安全防護為切入點。在內網接口設計時,采用防火墻在內外網之間實施訪問控制策略,在沒有采取安全措施的情況下,禁止內容以任何形式直接接入因特網。對外網接口的設計時,設立DMZ(獨立的網絡區(qū)域)與外部網絡交換信息,并采取有效的安全措施,保障該信息交換區(qū)不接受非授權的訪問,來自外部網絡的特定主機,經身份認證后方可訪問內部網絡指定的主機。
在深度保護戰(zhàn)略模型下,如何從數(shù)據(jù)輸入源進行防護尤為重要,因此,利用大數(shù)據(jù)處理技術,通過數(shù)據(jù)采集與記錄,數(shù)據(jù)抽取、清洗與標記、數(shù)據(jù)集成、轉換與約簡,數(shù)據(jù)分析與建模和數(shù)據(jù)解釋對我校網絡信息進行監(jiān)測,從而分析出有價值的數(shù)據(jù)信息,大數(shù)據(jù)處理全過程如圖3所示。
3.1 ?數(shù)據(jù)采集與記錄
數(shù)據(jù)采集主要是利用數(shù)據(jù)庫提取來自Web、APP或傳感器形式的數(shù)據(jù),可通過系統(tǒng)日志采集,如Hadoop的Chukwa、Cloudera的Flume、Facebook的Scribe等,將非結構化數(shù)據(jù)從網頁中抽取出來,將其存儲為統(tǒng)一的本地數(shù)據(jù)文件,并以結構化的方式存儲。本次主要采用網絡爬蟲方式,通過Python語言的Request庫爬取網頁內容,使用Beautiful Soup 4庫分析網頁中的數(shù)據(jù),每個網絡用戶搜索的網頁數(shù)據(jù)信息被封裝在一個tr結構中,然后再提取網絡信息安全關鍵字td,存儲到二維列表中,關鍵代碼如下:
allUniv=[] ? #存儲全部表格數(shù)據(jù),二維列表
def fillUnivlist(soup):
data = soup.find_all('tr') ? #找到所有tr標簽
for tr in data:
singleUniv=[]
ltd = tr.find_all('td') ? ?#在每個tr標簽中找到所有td標簽
for td in ltd:
singleUniv.append(td.string) ? #提取td標簽中的信息
allUniv.append(singleUniv)
3.2 ?數(shù)據(jù)抽取、清洗與標記
在前期對數(shù)據(jù)進行采集之后,需要對數(shù)據(jù)進行有效分析,將前端數(shù)據(jù)抽取到分布式數(shù)據(jù)庫,同時可對數(shù)據(jù)進行清洗,消除異常數(shù)據(jù)、清除重復數(shù)據(jù)、保證數(shù)據(jù)的完整性。這里采用Twitter的Storm對數(shù)據(jù)進行流式計算,數(shù)據(jù)持續(xù)地流經一個轉換實體網絡,如圖4所示,接收器(處理數(shù)據(jù))實現(xiàn)了一個流上的單一轉換和一個Storm拓撲結構中的所有處理,通過過濾、聚合對數(shù)據(jù)進行抽取清洗標記。流起源于噴嘴,噴嘴將數(shù)據(jù)從外部來源流入Storm拓撲結構中。
3.3 ?數(shù)據(jù)集成、轉換與約簡
數(shù)據(jù)集成是把不同來源、格式、特點性質的數(shù)據(jù)在邏輯或物理上有機地集中,從而解決數(shù)據(jù)的分布性和異構性,數(shù)據(jù)集成系統(tǒng)如圖5所示。在對我校校園網絡數(shù)據(jù)的預處理過程中,同時需要進行數(shù)據(jù)轉換與約簡處理。數(shù)據(jù)轉換主要是數(shù)據(jù)平滑、數(shù)據(jù)聚集、數(shù)據(jù)泛化和數(shù)據(jù)規(guī)范化。數(shù)據(jù)約簡是基于數(shù)據(jù)挖掘,尋找網絡信息安全關鍵字,在保持數(shù)據(jù)原貌的前提下,最大限度地精簡數(shù)據(jù)量。
3.4 ?數(shù)據(jù)分析與建模
數(shù)據(jù)分析旨在對雜亂無章的數(shù)據(jù)進行集中、萃取和提煉,進而找出研究對象。采用常用的基本數(shù)據(jù)分析方法中的統(tǒng)計方法,通過制作圖表,計算特征量,使用數(shù)理統(tǒng)計方法選定模型。
3.5 ?數(shù)據(jù)解釋
數(shù)據(jù)解釋的目的是幫助網絡用戶理解分析結果,主要檢查所提出的假設并對分析結果進行解釋,采用云計算、標簽云、關系圖等可視化方式展現(xiàn)大數(shù)據(jù)分析結果。
4 ?高校校園網絡信息安全防護策略
4.1 ?基礎設施支持
針對高校校園網絡基礎設施,從承載大數(shù)據(jù)的角度來看,在數(shù)據(jù)中心和虛擬設備之間使用VLAN作為虛擬主機,由于防火墻需要檢查通過防火墻的每個數(shù)據(jù)包,已經成為大數(shù)據(jù)快速計算能力的瓶頸,因此高校校園需要采用分流策略,分離傳統(tǒng)用戶流量和大數(shù)據(jù)安全數(shù)據(jù)的流量,確保只有受信服務器流量才可以通過加密網絡通道及防火墻。
4.2 ?保護虛擬服務器
通過在服務器上按照NIST標準打補丁,卸載不必要的服務,同時為大數(shù)據(jù)中心部署備份服務,且對備份進行加密,因為安全數(shù)據(jù)站點發(fā)生數(shù)據(jù)泄露事故都是由于備份媒介的丟失或被盜。另外,定期對系統(tǒng)進行更新,部署系統(tǒng)監(jiān)視工具對網絡系統(tǒng)進行集中監(jiān)控和控制。
4.3 ?制定嚴格的培訓計劃
在大數(shù)據(jù)背景下,面對激增的數(shù)據(jù)量和高速運轉的環(huán)境,需要為網絡安全維護人員定制一個系統(tǒng)的培訓計劃,培訓計劃應該著眼于數(shù)據(jù)的分析和使用過程,因為安全大數(shù)據(jù)倉庫將通過這些過程來標記和報告異常的活動和網絡流量。
5 ?結 ?論
隨著數(shù)據(jù)量的不斷增大,網絡和數(shù)字化生活方式使得高校學生更容易成為不法分子的攻擊目標,大數(shù)據(jù)下高校校園網絡信息安全問題已成為熱點問題。將大數(shù)據(jù)處理技術應用于傳統(tǒng)高校的網絡體系結構中,借助于大數(shù)據(jù)的后向分析能力,對網絡數(shù)據(jù)流量做出預測性的判斷,可以提前預防網絡信息安全事件的發(fā)生。
參考文獻:
[1] 李治城,胡欣宇.大數(shù)據(jù)背景下數(shù)據(jù)安全與隱私保護問題研究 [J].物聯(lián)網技術,2020,10(6):76-78.
[2] 張曉宇.大數(shù)據(jù)時代下計算機網絡信息安全問題探討 [J].信息技術與信息化,2020(5):171-173.
[3] 丁曉東.大數(shù)據(jù)與人工智能時代的個人信息立法——論新科技對信息隱私的挑戰(zhàn) [J].北京航空航天大學學報(社會科學版),2020,33(3):8-16+71.
作者簡介:楊佳麗(1987—),女,漢族,陜西西安人,網絡工程師,碩士,研究方向:計算機網絡通信技術。