李恩洲 曹禹 尚志斌 宋承亮
(北京中天鵬宇科技發(fā)展有限公司,北京 100191)
伴隨著大數(shù)據(jù)技術的進步,人們不僅享受到了其帶來的便捷生活方式,同時也面臨著嚴重的網(wǎng)絡安全隱患威脅,而在工業(yè)大數(shù)據(jù)領域,網(wǎng)絡安全問題尤其顯著[1]。
工業(yè)大數(shù)據(jù)泛指工業(yè)領域產(chǎn)生、采集、傳輸、處理、使用的海量數(shù)據(jù),已成為提升制造業(yè)生產(chǎn)力、競爭力、創(chuàng)新力的關鍵要素,是驅(qū)動工業(yè)互聯(lián)網(wǎng)創(chuàng)新發(fā)展的引擎。隨著世界各國積極推動工業(yè)大數(shù)據(jù)發(fā)展,全球工業(yè)大數(shù)據(jù)相關技術產(chǎn)業(yè)得到快速發(fā)展。與此同時,工業(yè)大數(shù)據(jù)安全形勢十分嚴峻,我國工業(yè)大數(shù)據(jù)安全還存在頂層設計不完善、責任落實不到位、技術手段缺乏、產(chǎn)業(yè)支撐能力薄弱等突出問題,因此加快提升工業(yè)大數(shù)據(jù)安全保障能力迫在眉睫[2]。對此,本文通過分析當前數(shù)據(jù)安全問題相關研究,提出一套數(shù)據(jù)安全管理策略。
數(shù)字化時代下,如何有效使用數(shù)據(jù)已成為當前的研究焦點之一。近年來,大數(shù)據(jù)這一詞匯逐漸在互聯(lián)網(wǎng)上流行起來,它起源于網(wǎng)絡領域,但在科學技術與信息的不斷發(fā)展中,其影響已經(jīng)滲透到不同行業(yè)之中。眾多行業(yè)都開始重視并且深入探討大數(shù)據(jù),而大數(shù)據(jù)也在各行各業(yè)產(chǎn)生了更多的、更為深刻的影響[3]。
大數(shù)據(jù)主要由3種類型的數(shù)據(jù)中心構(gòu)成,其中非結(jié)構(gòu)化數(shù)據(jù)中心占據(jù)了關鍵地位,應用范圍極為廣泛。另外兩種類型的數(shù)據(jù)中心,即結(jié)構(gòu)化和半結(jié)構(gòu)化,也在廣泛使用,為眾多行業(yè)帶來了便利[4]。
工業(yè)大數(shù)據(jù)除了擁有傳統(tǒng)大數(shù)據(jù)的“4V”特征,即規(guī)模性、多樣性、高速性和價值性外,還有6個典型特征。
(1)多態(tài)性:工業(yè)大數(shù)據(jù)種類多樣,既包括概念設計、詳細設計、制造工藝、包裝運輸?shù)葮I(yè)務數(shù)據(jù),還涉及服務保障階段的運行狀態(tài)、維修計劃、服務評價等數(shù)據(jù)。
(2)實時性:工業(yè)大數(shù)據(jù)主要來源于生產(chǎn)制造和產(chǎn)品運維等環(huán)節(jié),在數(shù)據(jù)采集頻率、數(shù)據(jù)處理、數(shù)據(jù)分析、異常發(fā)現(xiàn)和應對等方面均具有很高的實時性要求。
(3)閉環(huán)性:既包括產(chǎn)品全生命周期橫向過程的數(shù)據(jù)鏈條,還包括智能制造縱向數(shù)據(jù)采集和處理過程中的所有數(shù)據(jù),以此來支持狀態(tài)感知、分析、反饋、控制等閉環(huán)場景下的動態(tài)持續(xù)調(diào)整和優(yōu)化。
(4)級聯(lián)性:工業(yè)產(chǎn)品生命周期的設計、制造、服務等不同環(huán)節(jié)的數(shù)據(jù)之間需要進行關聯(lián),一旦某一環(huán)節(jié)的數(shù)據(jù)泄露或被篡改,極有可能導致級聯(lián)破壞,造成大規(guī)模影響。
(5)更具價值屬性:相比傳統(tǒng)大數(shù)據(jù),工業(yè)大數(shù)據(jù)更加強調(diào)用戶價值驅(qū)動和數(shù)據(jù)本身的可用性,工業(yè)大數(shù)據(jù)可以提升創(chuàng)新能力和生產(chǎn)經(jīng)營效率,促進個性化定制、服務化轉(zhuǎn)型等智能制造新模式變革。
(6)更具產(chǎn)權(quán)屬性:工業(yè)大數(shù)據(jù)產(chǎn)生于企業(yè)實際生產(chǎn)經(jīng)營過程,依附于企業(yè)的設備設施、資源物料、業(yè)務系統(tǒng)等載體。對企業(yè)而言,這些數(shù)據(jù)更具有明確的產(chǎn)權(quán)屬性,企業(yè)擁有對這些數(shù)據(jù)的掌控能力,能夠決定具體數(shù)據(jù)的具體使用方式,數(shù)據(jù)產(chǎn)權(quán)屬性明顯高于個人用戶[2]。
主數(shù)據(jù)指系統(tǒng)間共享數(shù)據(jù)。每個系統(tǒng)都會用到各類數(shù)據(jù),取各類數(shù)據(jù)共有屬性字段,即可稱這部分屬性字段組成的數(shù)據(jù)為該類型主數(shù)據(jù)。主數(shù)據(jù)的作用是確保屬性字段可跨系統(tǒng)傳輸,防止同一數(shù)據(jù)的多種形式出現(xiàn)。上線主數(shù)據(jù)系統(tǒng)對主數(shù)據(jù)進行管理,可有效提高數(shù)據(jù)質(zhì)量,完美打通各系統(tǒng)間數(shù)據(jù)傳輸鏈路。
主數(shù)據(jù)是應用系統(tǒng)協(xié)同、業(yè)務協(xié)同、數(shù)據(jù)協(xié)同的基礎。本次論述主要為公司已建立的主數(shù)據(jù)系統(tǒng),該系統(tǒng)自2016年開始,依托主數(shù)據(jù),將理論和實踐相結(jié)合,逐步建立了供方、客戶、項目、物資、產(chǎn)品、會計科目、機構(gòu)等13類主數(shù)據(jù),累積主數(shù)據(jù)百萬余條,并根據(jù)需要建立了相關系統(tǒng),形成B2B的數(shù)據(jù)交互模式。隨著主數(shù)據(jù)建設與應用的深入,主數(shù)據(jù)全生命周期管理機制也在不斷完善,其主數(shù)據(jù)產(chǎn)生、傳遞、交互、共享、應用模式已自上而下逐步貫通,其主數(shù)據(jù)應用價值初步顯現(xiàn),但是主數(shù)據(jù)全生命周期的數(shù)據(jù)安全問題越發(fā)顯著。
互聯(lián)網(wǎng)上信息的迅速傳播和廣泛覆蓋特性使數(shù)據(jù)具備了公開性和透明度等特征;同時,計算機科技的不斷發(fā)展促使其對外界的影響力也在不斷擴大,也使網(wǎng)絡系統(tǒng)的安全性能逐步降低、變得較為脆弱且易受攻擊。因此,對于很多企業(yè)來說,日常運營中存在大量的數(shù)據(jù)交換與傳輸,其間會產(chǎn)生各種通信協(xié)議,導致其難以提供充足的保護措施及隱私保障,無法達到客戶的需求標準要求。由此可見,對外的開放程度過高導致的潛在安全隱患是當前信息化社會的一個重要挑戰(zhàn)因素之一[5]。
數(shù)據(jù)安全管理工作是一項社會性工作,工業(yè)大數(shù)據(jù)安全管理策略研究是政府開展數(shù)據(jù)安全管理、保障國家安全和社會穩(wěn)定、提升工業(yè)企業(yè)數(shù)據(jù)安全防護能力、促進工業(yè)大數(shù)據(jù)安全產(chǎn)業(yè)發(fā)展的關鍵組成部分。而大數(shù)據(jù)體量大,來源廣、管理策略不統(tǒng)一,使對漏洞的分析、確定、控制以及風險評估無法形成一個有效的監(jiān)管和防護[6]。
突破傳統(tǒng)工業(yè)封閉可信的生產(chǎn)環(huán)境后,其數(shù)據(jù)發(fā)生了大幅度轉(zhuǎn)變,由單向、單一的少量工業(yè)數(shù)據(jù)轉(zhuǎn)變成了雙向、多維的大量工業(yè)數(shù)據(jù)。工業(yè)互聯(lián)網(wǎng)數(shù)據(jù)在OT層和IT層內(nèi)外共享時,形成了結(jié)構(gòu)復雜且種類繁多的大體量數(shù)據(jù)結(jié)構(gòu)?;谏鲜銮闆r,隨著數(shù)據(jù)流動性大幅增加,其保護難度也會增大,用戶隱私數(shù)據(jù)、生產(chǎn)數(shù)據(jù),以及工業(yè)互聯(lián)網(wǎng)平臺數(shù)據(jù)都成為面臨泄露風險的數(shù)據(jù)內(nèi)容[7]。
電腦病毒和黑客的威脅不僅在于其可以輕易進入計算機系統(tǒng),也因為各種軟硬件使用過程中可能存在安全風險問題。無論是硬件還是軟件,都無法避免潛在的風險和缺陷,比如防病毒軟件、防火墻和入侵探測器等的功能局限性。正是因為這些產(chǎn)品自身存在的弱點,使得黑客得以借助它們來秘密滲透到目標計算機并發(fā)起網(wǎng)絡攻擊或盜取信息[8]。
大數(shù)據(jù)時代下,網(wǎng)絡上基礎數(shù)據(jù)的安全性面臨很大的挑戰(zhàn)。在傳統(tǒng)互聯(lián)網(wǎng)環(huán)境下,傳統(tǒng)信息技術對網(wǎng)絡安全的防范和保護相對比較容易,原因主要有以下幾點:第一,其處理的數(shù)據(jù)大多為日常數(shù)據(jù),安全等級要求不高;第二,數(shù)據(jù)量還未形成規(guī)模,病毒和腳本相對而言容易被發(fā)現(xiàn)并及時清理。然而,大數(shù)據(jù)時代下,信息量極其龐雜。黑客和病毒對基礎數(shù)據(jù)造成了巨大沖擊,而大規(guī)模數(shù)據(jù)丟失將嚴重威脅信息安全。
主數(shù)據(jù)在傳輸過程中容易被攻擊者截取報文和數(shù)據(jù)包,例如可以通過相關技術手段冒充接收者,篡改鏈路,并修改報文的基礎信息,進而在接收者感知不到的情況下截取數(shù)據(jù)。
數(shù)據(jù)來源廣泛且類型復雜,不僅包括內(nèi)部的業(yè)務數(shù)據(jù),還包括來自外部的相關數(shù)據(jù),同時,數(shù)據(jù)還存在內(nèi)部不同業(yè)務系統(tǒng)之間的相互調(diào)用。處理不規(guī)范的數(shù)據(jù)容易數(shù)據(jù)丟失、數(shù)據(jù)泄露等數(shù)據(jù)安全風險。因此,需要在收集數(shù)據(jù)前,采用數(shù)據(jù)分類、分級辦法,有針對性地對數(shù)據(jù)源進行敏感性劃分,確定數(shù)據(jù)重要性和敏感度[9]。根據(jù)劃分的敏感程度,對不同類型的數(shù)據(jù)進行分級分類管理,制定不同安全等級的數(shù)據(jù)安全保護策略,對敏感型數(shù)據(jù)進行重點保護。
在大數(shù)據(jù)時代,傳統(tǒng)單一的電腦儲存科技不能滿足用戶需求,這主要表現(xiàn)在以下方面。
(1)當前存儲的數(shù)據(jù)量巨大,對傳統(tǒng)計算機來說是一個嚴峻的挑戰(zhàn)。尤其是有些公司未能運用先進的儲存系統(tǒng)和服務器集群,導致在面臨大量數(shù)據(jù)存儲時沒有采取相應的數(shù)據(jù)保護策略,從而造成數(shù)據(jù)丟失。
(2)在遭遇計算機病毒和黑客攻擊時,傳統(tǒng)的存儲方式缺乏有效的防護措施,這很可能導致大數(shù)據(jù)信息面臨安全風險[10]。
根據(jù)之前對主數(shù)據(jù)安全威脅的研究和探討,為了滿足主數(shù)據(jù)實時防衛(wèi)的需求,提出如圖1所示的防護框架。
圖1 數(shù)據(jù)安全防護策略框架
本文重點研究主數(shù)據(jù)整個生命周期的各個環(huán)節(jié),并以此為基礎創(chuàng)建了一個“梳理—管理—控制—監(jiān)督—評價—追溯”的主數(shù)據(jù)動態(tài)防衛(wèi)系統(tǒng)框架。在這個架構(gòu)里,利用諸如加密保障隱私、用戶識別驗證、數(shù)據(jù)安全標記、權(quán)限限制、日志審查等數(shù)據(jù)安全研究工具,實現(xiàn)提升數(shù)據(jù)安全服務水平、劃分數(shù)據(jù)等級、跟蹤數(shù)據(jù)流向及評估數(shù)據(jù)防守實力等一系列安全防衛(wèi)功能,從而建立起一套有效的主數(shù)據(jù)防衛(wèi)機制,以確保對主數(shù)據(jù)具有足夠的防護能力。
圖2展示的主數(shù)據(jù)動態(tài)防護模型是從主數(shù)據(jù)生命周期和主數(shù)據(jù)平臺兩個方面全面評估其動態(tài)安全防護能力,并且構(gòu)建了相應的動態(tài)防護流程。
圖2 主數(shù)據(jù)防御模型
(1)整理生產(chǎn)者、消費者和提供者生成的數(shù)據(jù),主要是根據(jù)數(shù)據(jù)分類和等級標準來整理各種敏感數(shù)據(jù),這包括系統(tǒng)信息、員工信息、業(yè)務信息等,以便數(shù)據(jù)管理者了解數(shù)據(jù)的分布情況。
(2)針對數(shù)據(jù)環(huán)境的不同,首先需要按照數(shù)據(jù)安全等級及安全保護要求設置相應的信息安全保障措施,并將其部署到各個防衛(wèi)裝置上,以實現(xiàn)對數(shù)據(jù)的管理控制功能。這些裝備會遵循預設的安全措施來管理所有的數(shù)據(jù)流轉(zhuǎn)過程;同時,要確保每個環(huán)節(jié)都符合授權(quán)范圍并且滿足特定屬性的條件,這包括了主數(shù)據(jù)系統(tǒng)的自我保全能力、從源頭向中心存儲器轉(zhuǎn)移過程中的相關步驟、由中央儲存區(qū)傳輸給商業(yè)軟件的使用者等關鍵情景。
(3)對在數(shù)據(jù)監(jiān)控流程中觀察到的非正?,F(xiàn)象予以追查和溯源,并綜合考慮其后果與設備反映的信息安全策略執(zhí)行情況。同時,也會動態(tài)評估安全性防護效能,依據(jù)評估結(jié)果調(diào)整相應的安全策略。
本文主要從技術層面和管理層面進行討論。
1.數(shù)據(jù)采集傳輸安全
在收集大量信息的過程中,可能會遇到諸如資料損壞、文件遺失、隱私暴露或盜用等問題,所以必須采用實名驗證和數(shù)據(jù)保護等方式來確保信息的保密性和可靠性。數(shù)據(jù)的傳遞通常應滿足以下4個條件:機密性、一致性、真實性和防重復攻擊[11]。
為了滿足數(shù)據(jù)傳輸?shù)陌踩枨?,主要采用了以下方法?/p>
(1)數(shù)據(jù)傳輸?shù)臋C密性通過數(shù)據(jù)加密來實現(xiàn);
(2)數(shù)據(jù)傳輸完整性通過在密文后增加唯一校驗碼來實現(xiàn);
(3)完成傳輸?shù)恼鎸嵭杂稍诮邮斩藢鬏敹诉M行校驗;
(4)由于在數(shù)據(jù)信息的分類中添加了不能復制的標記或日期戳,可以有效防范傳輸中的重放威脅。
當前的虛擬專用網(wǎng)絡(VPN)的常用設置策略與協(xié)議主要是基于以下幾種方式及工具實現(xiàn)的路徑篩選技巧、通用的路徑包裝方案如路由過濾技術、通用路由封裝協(xié)議(GRE)、第二層轉(zhuǎn)發(fā)協(xié)議(L2F)、IP安全協(xié)議(IPSec)、SSL協(xié)議等[12]。
2.數(shù)據(jù)隔離
為了確保用戶權(quán)限差異導致的數(shù)據(jù)信息分離,可以依照應用的特定需求,運用物理隔離、虛擬化和mi-tenancy等技術手段來實現(xiàn)各個用戶之間的數(shù)據(jù)和配置信息的安全隔離,從而維護每一位用戶數(shù)據(jù)的安全性與隱私。
3.數(shù)據(jù)脫敏
為了防止信息泄露并減少安全風險,需要在測試開發(fā)、分析統(tǒng)計和生產(chǎn)環(huán)境等階段對用戶的敏感信息進行模糊化處理。
信息脫敏處理過程是指根據(jù)特定的規(guī)律,對某種敏感性數(shù)據(jù)信息實施加密、遮蔽或者變形等操作,以確保其隱私性。
4.數(shù)據(jù)加密
在主數(shù)據(jù)的環(huán)境中,針對關鍵數(shù)據(jù)實施特定的加密措施,從而達到防止未經(jīng)許可的人員從數(shù)據(jù)傳遞過程中獲得敏感信息的最終目標。這種數(shù)據(jù)加密可以分為兩種類型:一種是涉及計算或者查詢操作的動態(tài)數(shù)據(jù)加密;另一種則是用于存儲如報告、文件、參考材料等不需要參加計算活動的靜態(tài)數(shù)據(jù)加密[13]。
5.數(shù)據(jù)備份
為了確保信息的使用和完整,信息存儲應當具備全面的信息備份與恢復功能。
(1)在線備份:支持庫級別的本地備份,可以大規(guī)模導出和數(shù)據(jù)恢復,并且提供全量和增量兩種備份方式。這主要用于處理由于數(shù)據(jù)庫服務器故障、網(wǎng)絡問題或誤操作引發(fā)的數(shù)據(jù)丟失。
(2)異地備份:現(xiàn)今使用的異地備份主要通過數(shù)據(jù)庫服務提供遠程訪問并將備份文件存儲在系統(tǒng)服務器中,較為穩(wěn)妥的異地備份為服務器集群的備份模式,每個服務器均有其他服務器的處理數(shù)據(jù),同樣支持全量和增量兩種備份模式。
1.數(shù)據(jù)分級保護策略
在多種使用環(huán)境中,數(shù)據(jù)可能具有不同的保密級別,而這些級別下的安全防御需求也會因情況的差異有所區(qū)別。對于主要的數(shù)據(jù)信息來源,需要根據(jù)其特性對其進行分門別類地處理和管理,并通過設定數(shù)據(jù)標記來確定它們的身份。在此基礎上,創(chuàng)建一套統(tǒng)一的數(shù)據(jù)安全架構(gòu),以自動生成相應的安全防范措施,并在數(shù)據(jù)安全的特性和保障能力之間建立起聯(lián)系,從而為用戶提供全方位、多層級的防衛(wèi)方案,最終達到智能化數(shù)據(jù)安全保護的目的。
2.身份認證與數(shù)據(jù)審計
對主數(shù)據(jù)平臺的身份信息進行有效管理,用戶在訪問平臺時會記錄下相關日志。通過分析這些日志,確保訪問記錄的安全性和穩(wěn)定性。實際操作中,訪問權(quán)限安全技術主要包括兩個層面。
(1)在用戶認證這個過程中,當客戶嘗試接觸主數(shù)據(jù)平臺的時候,必須經(jīng)過CA身份確認技術的驗證,只有成功地完成了這個步驟才能無阻礙地進入系統(tǒng)。首先,客戶需要接受身份核實,確定他們的真實身份并獲得認可以后,才會被允許進入訪問控制模塊,根據(jù)他們的實際情況和權(quán)限情況做出相應響應策略。
(2)對用戶行為分析主要依賴于對其訪問歷史與授權(quán)情況的數(shù)據(jù)解析。利用數(shù)據(jù)庫實時追蹤這些活動的發(fā)生,可以顯著提升操作標準性和監(jiān)督工作的統(tǒng)一性。當數(shù)據(jù)庫的信息安全受到威脅時,可以借助此方法提前發(fā)出警報,并在第一時間識別并阻止?jié)撛诘娘L險行動。
本文探討了大數(shù)據(jù)背景下,主數(shù)據(jù)應用系統(tǒng)的實施情況,并深入分析了其所面臨的數(shù)據(jù)保護挑戰(zhàn)。通過關注主數(shù)據(jù)整個生命周期的過程,建立了一個主數(shù)據(jù)防衛(wèi)模式,并在每個階段的關鍵步驟中運用相關技術,從而提高了主數(shù)據(jù)的安全性能。盡管如此,數(shù)據(jù)安全的任務仍任重道遠,未來還需要繼續(xù)探索新的路徑來確保數(shù)據(jù)安全。首先,應提高行業(yè)整體安全產(chǎn)品標準化與整合度,以便增強數(shù)據(jù)安全防范的綜合能力;其次,需要推動建設國家級計算資源集群,配合全國一體化的數(shù)據(jù)中心架構(gòu)規(guī)劃,實現(xiàn)“東數(shù)西算”項目的大規(guī)模推進,這既能提供強大計算能力,也能為中國的數(shù)字經(jīng)濟發(fā)展和信息安全提供支持。