王康?王曉慧
摘 要 論文以數(shù)據(jù)安全相關(guān)文獻為研究對象,選取CNKI核心期刊庫和CSSCI期刊庫為數(shù)據(jù)來源,利用Excel描述論文的年代分布和學科分布,同時利用Bibexcel、Ucinet和CiteSpace可視化軟件對高頻關(guān)鍵詞進行分析。結(jié)果表明:數(shù)據(jù)安全研究熱點主要集中于云計算、云存儲、隱私保護、大數(shù)據(jù)、網(wǎng)絡(luò)安全和圖書館領(lǐng)域,其中研究前沿包括大數(shù)據(jù)、隱私保護、Hadoop架構(gòu)、敏感數(shù)據(jù)、屬性加密、代理重加密、數(shù)據(jù)存儲與數(shù)據(jù)共享研究。
關(guān)鍵詞 數(shù)據(jù)安全 云計算 大數(shù)據(jù) 可視化分析
分類號 TP309.2
DOI 10.16810/j.cnki.1672-514X.2018.09.019
Abstract Taking relevant study achievements on data security as the research object,selecting the CNKI core journals and CSSCI journals as the data source, and using Excel to describe the distribution and discipline distribution of papers.And using Bibexcel, Ucinet and CiteSpace software to analyze the high frequency keywords. The results show that the hot spots of study on data security include cloud computing, cloud storage, privacy protection, big data, network security,libraries and so on,and the research fronts include big data, privacy protection, Hadoop architecture, sensitive data, attribute encryption, proxy re-encryption, data storage and data sharing.
Keywords Data security. Cloud computing. Big data. Visual analysis.
大數(shù)據(jù)、云計算和互聯(lián)網(wǎng)的快速發(fā)展帶來的數(shù)據(jù)安全問題日趨嚴重,數(shù)據(jù)泄露將會給政府、企業(yè)和個人帶來極大的危害。如何在利用新技術(shù)的同時保護隱私數(shù)據(jù)和防止敏感數(shù)據(jù)的泄露是亟待解決的問題,籍此我國學者對數(shù)據(jù)安全做了大量的研究。本文選取中國知網(wǎng)(CNKI) 核心期刊庫和CSSCI期刊庫作為文獻的統(tǒng)計來源,以題名OR關(guān)鍵詞為檢索字段,“數(shù)據(jù)安全”為檢索詞對所有學科領(lǐng)域進行精確檢索,時間限定為2006—2017年。進行數(shù)據(jù)清理,剔除通知、簡訊、報道和無關(guān)鍵詞字段等不符合要求的文獻,得到相關(guān)文獻874篇,檢索時間為2017年4月1日。本文利用文獻處理工具Excel、Bibexcel、Ucinet和CiteSpace對相關(guān)文獻進行統(tǒng)計并繪制圖表,然后利用定性的方法對可視化圖表進行分析,探究和評價國內(nèi)數(shù)據(jù)安全研究現(xiàn)狀與趨勢,以期為后續(xù)研究提供參考。
1 國內(nèi)數(shù)據(jù)安全研究熱點概述
2006-2017年間有關(guān)數(shù)據(jù)安全研究的文獻經(jīng)過統(tǒng)計,可以認為文獻量總體趨勢呈逐年增加的態(tài)勢,其中2016年增加幅度比其它年份大。由此說明,數(shù)據(jù)安全意識有所增強,數(shù)據(jù)安全問題逐漸受到重視。
數(shù)據(jù)安全研究在諸多學科領(lǐng)域均有涉及,其中計算機與互聯(lián)網(wǎng)技術(shù)是數(shù)據(jù)安全中的主要學科陣地,其次是電信技術(shù)、圖書情報與檔案管理、自動化技術(shù)、電力工業(yè)、自然地理學、測繪學和貿(mào)易經(jīng)濟等學科,形成了一種多元化研究的態(tài)勢。隨著大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)等新一代信息技術(shù)的發(fā)展,數(shù)據(jù)安全在計算機、互聯(lián)網(wǎng)、自動化等領(lǐng)域的關(guān)注度有望繼續(xù)升溫。本文以高頻關(guān)鍵詞為基礎(chǔ),采用社會網(wǎng)絡(luò)分析和中心性分析兩種方法,從不同角度進行相互驗證以確定該領(lǐng)域的研究熱點。
1.1 社會網(wǎng)絡(luò)分析提取研究熱點
利用Bibexcel作出高頻關(guān)鍵詞共現(xiàn)矩陣,然后將數(shù)據(jù)安全、安全、安全性等概括性關(guān)鍵詞剔除,利用Ucinet對高頻關(guān)鍵詞進行聚類分析,如圖1所示,其中矩形越大代表關(guān)鍵詞出現(xiàn)的頻率越高,線條代表關(guān)鍵詞之間的聯(lián)系。社會網(wǎng)絡(luò)分析結(jié)果顯示位于網(wǎng)絡(luò)中心位置的云計算、云存儲、大數(shù)據(jù)、物聯(lián)網(wǎng)、隱私保護、網(wǎng)絡(luò)安全、圖書館是數(shù)據(jù)安全研究領(lǐng)域熱點問題。
1.2 中心性分析提取研究熱點
中心性是測量個體處于網(wǎng)絡(luò)中的地位,個體越是處于網(wǎng)絡(luò)中的中心位置,其影響力越大,分為三種形式:點度中心性、接近中心性和中間中心性。點度中心性可以用網(wǎng)絡(luò)中與該點有直接聯(lián)系的點的數(shù)目來衡量[1],數(shù)目越多越是網(wǎng)絡(luò)的核心,擁有的“權(quán)利”越大。接近中心性反映一個節(jié)點不受其他節(jié)點控制的程度[2],是指一個節(jié)點與其它所有節(jié)點的距離之和,這個距離越小說明越是網(wǎng)絡(luò)的核心。中間中心性是指一個節(jié)點若處于許多其他兩點之間的路徑上,可以認為該節(jié)點居于重要地位,因為它具有控制其他兩個節(jié)點之間聯(lián)系的能力[3]。
利用Ucinet對關(guān)鍵詞進行中心性分析得到高頻關(guān)鍵詞的點度中心性、接近中心性和中間中心性,如表1所示,從表1中可知以三種不同的角度對關(guān)鍵詞的中心性進行分析,最終得出的結(jié)果基本相同,即數(shù)據(jù)安全相關(guān)研究主要集中在云計算與云存儲、隱私保護、大數(shù)據(jù)、圖書館、網(wǎng)絡(luò)安全等方面。
綜上,通過社會網(wǎng)絡(luò)分析方法和中心性分析方法對數(shù)據(jù)安全的研究熱點進行提取,最終得出的研究熱點基本相同,從而有效印證了每種方法的可靠性。通過綜合考量提取出的研究熱點,最終概括出國內(nèi)數(shù)據(jù)安全研究的主要熱點領(lǐng)域
2 云計算、云存儲與數(shù)據(jù)安全
隨著云計算與云存儲技術(shù)的快速發(fā)展,越來越多的企業(yè)和個人選擇利用云存儲來保存和備份數(shù)據(jù)。用戶對云存儲數(shù)據(jù)的安全性十分關(guān)切。數(shù)據(jù)加密是確保數(shù)據(jù)安全的有效方法之一,但在云存儲中傳統(tǒng)的數(shù)據(jù)加密將使數(shù)據(jù)的檢索運算異常困難,此外,云存儲在數(shù)據(jù)隔離、數(shù)據(jù)遷移、數(shù)據(jù)殘留和數(shù)據(jù)安全審計方面面臨的挑戰(zhàn)依然嚴峻。目前,密文訪問控制、加密存儲和完整性審計三個方面是云存儲針對數(shù)據(jù)安全的重點研究方面。李暉[4]認為需要綜合采用加密機制、密文搜索、完整性審計機制以及安全數(shù)據(jù)刪除等技術(shù)保護數(shù)據(jù)。胡光永[5]提出一種新的加密、解密方案,用以保護云存儲過程中的數(shù)據(jù),防止數(shù)據(jù)泄漏。此外,在法律制度方面齊愛民,祝高峰[6]以云存儲的特征、架構(gòu)模式、數(shù)據(jù)安全危機為基礎(chǔ)構(gòu)建了云存儲數(shù)據(jù)安全的法律保護制度。
3 大數(shù)據(jù)與數(shù)據(jù)安全
大數(shù)據(jù)技術(shù)具有大量、多樣、高價值和高速等特點,其更加注重事物整體性和事物之間的關(guān)聯(lián)性。大數(shù)據(jù)技術(shù)在提升數(shù)據(jù)價值的同時,數(shù)據(jù)安全問題也伴隨而來。目前,傳統(tǒng)的數(shù)據(jù)安全保護技術(shù)和政策已無法滿足大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全問題,甚至成為大數(shù)據(jù)發(fā)展的瓶頸。大數(shù)據(jù)時代實時在線計算、海量數(shù)據(jù)訪問、實時的數(shù)據(jù)流動、頻繁的數(shù)據(jù)流轉(zhuǎn)和交換利用等業(yè)務(wù)和技術(shù)需要新的安全防護方案給予支撐。因此,在新的環(huán)境下要做到政策和技術(shù)的同步發(fā)展完善。首先,對目前存在的數(shù)據(jù)保護法律政策進一步完善,同時針對大數(shù)據(jù)應(yīng)用制定細化和針對性的指引,明確哪些數(shù)據(jù)未經(jīng)授權(quán)不得私自采集,采集的哪些數(shù)據(jù)屬于敏感數(shù)據(jù),哪些非敏感數(shù)據(jù)通過二次或三次組合有可能成為敏感數(shù)據(jù)以及私自泄露敏感數(shù)據(jù)如何懲罰等問題;其次,要重視大數(shù)據(jù)標準化工作,建立相關(guān)采集、處理、分析和發(fā)布標準,使數(shù)據(jù)脫敏、清洗規(guī)范化,防止數(shù)據(jù)泄露;最后,需要加快研發(fā)數(shù)據(jù)安全保護技術(shù),數(shù)據(jù)處理的每一步都存在數(shù)據(jù)泄露問題,政府和企業(yè)要不斷提高自身技術(shù)水平,提高自身承受非法入侵的能力,加強數(shù)據(jù)加密技術(shù)和訪問權(quán)限等防護措施。
4 隱私保護與網(wǎng)絡(luò)安全
互聯(lián)網(wǎng)的快速發(fā)展給人們的生活帶來了極大的便捷。與此同時,網(wǎng)絡(luò)也成為數(shù)據(jù)泄露的重災(zāi)區(qū),互聯(lián)網(wǎng)安全已成為公眾關(guān)注的焦點。目前,各電商網(wǎng)站、門戶網(wǎng)站、手機APP等對個人數(shù)據(jù)的收集輕而易舉,若其遭受黑客攻擊,數(shù)據(jù)安全將難以得到保證,如大麥網(wǎng)、俄羅斯約會網(wǎng)站和益百利公司都曾發(fā)生過數(shù)據(jù)泄露事件。網(wǎng)絡(luò)安全已嚴重影響到人們的生活,補天平臺統(tǒng)計顯示,2015年由于網(wǎng)站漏洞的存在,可能或已造成55.3億條個人信息的泄露。如何有效保護隱私是亟待解決的問題,政府應(yīng)進一步完善相關(guān)法律,企業(yè)應(yīng)積極研發(fā)數(shù)據(jù)保護技術(shù),公眾應(yīng)該提高隱私保護意識,盡量避免敏感信息的泄露。
同時,網(wǎng)絡(luò)安全也事關(guān)國家安全。目前我國不論個人還是機構(gòu)使用的電腦、操縱系統(tǒng)大部分還是采用美國的核心技術(shù),給我國的網(wǎng)絡(luò)安全留下了重大隱患。隨著大數(shù)據(jù)技術(shù)的應(yīng)用,我國各個領(lǐng)域的海量數(shù)據(jù)流向美國,美國利用先進技術(shù)對我國的政治、經(jīng)濟和社會的最新情況進行分析,有可能給我國造成嚴重的災(zāi)難。國家應(yīng)鼓勵研發(fā)國產(chǎn)操作系統(tǒng),政府等對信息安全要求高的機構(gòu)應(yīng)帶頭使用國產(chǎn)操作系統(tǒng)。
無論是從個人角度還是國家層面都必須重視網(wǎng)絡(luò)安全問題,迫切需要建立健全網(wǎng)絡(luò)安全法律體系,增強網(wǎng)絡(luò)安全意識,同時對危害網(wǎng)絡(luò)安全的行為進行相應(yīng)的處罰。
5 圖書館與數(shù)據(jù)安全
數(shù)據(jù)安全是圖書館服務(wù)用戶與穩(wěn)定發(fā)展的基礎(chǔ)。隨著互聯(lián)網(wǎng)的快速發(fā)展,圖書館面臨的數(shù)據(jù)安全、知識產(chǎn)權(quán)和用戶個人隱私問題日益突出。隨著新一代信息技術(shù)的發(fā)展,圖書館廣泛利用大數(shù)據(jù)、云計算技術(shù)進行自身數(shù)據(jù)的保護。金志敏[7]研究了云計算下的高校圖書館數(shù)據(jù)安全策略。張凌云[8]以天津圖書館為例,研究和探討了連續(xù)數(shù)據(jù)保護技術(shù)在數(shù)據(jù)安全保護中所起的作用。馬曉亭,梁俊榮[9]設(shè)計了敏感大數(shù)據(jù)保護系統(tǒng),用以防護圖書館敏感數(shù)據(jù)的泄露。
此外,圖書館在統(tǒng)一身份認證、嚴格控制訪問權(quán)限、加快信息安全基礎(chǔ)設(shè)施建設(shè)、制定相關(guān)標準及政策法規(guī)等方面也進行了相關(guān)研究。
6 國內(nèi)數(shù)據(jù)安全研究熱點變化分析
關(guān)鍵詞是一篇文獻主題的最精煉表達,因此可以通過關(guān)鍵詞的變化來研究主題的變化。利用Citespace5.0軟件做出數(shù)據(jù)安全的主題演化圖譜(見圖2)。
從圖2可知,2006年出現(xiàn)的“數(shù)據(jù)安全”“網(wǎng)絡(luò)安全”和“信息安全”字體較大,且與后續(xù)出現(xiàn)的關(guān)鍵詞聯(lián)系緊密,說明數(shù)據(jù)安全研究是以“網(wǎng)絡(luò)安全”和“信息安全”為主要研究對象。隨著時間推移,該領(lǐng)域的研究對象正在發(fā)生變化,依次出現(xiàn)了以“隱私保護”“云計算”“云存儲”“物聯(lián)網(wǎng)”和“大數(shù)據(jù)”為主的研究對象。
關(guān)鍵詞的數(shù)量及增長情況能夠有效反映各學術(shù)領(lǐng)域的發(fā)展及熱點前沿問題[10]。為了探究數(shù)據(jù)安全研究前沿,利用Citespace5.0軟件自帶的膨脹詞探測技術(shù)及算法進行突現(xiàn)詞(某一時間段內(nèi)突然大量出現(xiàn)的詞)的探測,如表2所示,較單獨計算關(guān)鍵詞出現(xiàn)頻次的高低確定研究前沿更具可靠性。由表2可知突現(xiàn)度最大的關(guān)鍵詞是大數(shù)據(jù),說明大數(shù)據(jù)是目前數(shù)據(jù)安全中研究的前沿,此外該領(lǐng)域研究的前沿還涉及隱私保護、Hadoop架構(gòu)、敏感數(shù)據(jù)、數(shù)據(jù)加密、數(shù)據(jù)存儲與數(shù)據(jù)共享。
大數(shù)據(jù)技術(shù)的快速發(fā)展給各行各業(yè)帶來了巨大的價值,Hadoop是較為流行的開源大數(shù)據(jù)處理平臺,其為大數(shù)據(jù)處理和分析提供了創(chuàng)新性和低成本基礎(chǔ)架構(gòu),然而在大數(shù)據(jù)存儲、分析、開放和共享過程中數(shù)據(jù)安全存在著一定的隱患,個人隱私與敏感數(shù)據(jù)的保護成為關(guān)注的重點。如何在利用新技術(shù)的同時防止數(shù)據(jù)泄露是亟待解決的問題。今后應(yīng)加強數(shù)據(jù)安全策略的研究,政府應(yīng)該在舊法規(guī)的基礎(chǔ)上制定與大數(shù)據(jù)相適應(yīng)的新法規(guī),以數(shù)據(jù)安全體系建設(shè)為核心,加快數(shù)據(jù)立法的頂層設(shè)計,制定數(shù)據(jù)開放的行動計劃,重視個人數(shù)據(jù)隱私權(quán)保護,而企業(yè)在市場競爭中更應(yīng)研發(fā)新技術(shù)對數(shù)據(jù)安全程度進行有效監(jiān)測,防止企業(yè)關(guān)鍵技術(shù)數(shù)據(jù)泄露。
參考文獻:
張世怡,劉春茂.中文網(wǎng)站社會網(wǎng)絡(luò)分析方法的實證研究[J].情報科學,2011,29(2):246-252.
陳遠,李韞慧,張敏.基于節(jié)點度測度SNS用戶信息傳播貢獻的實證研究:以騰訊微博為例[J].情報雜志,2014,33(10):159-164.
王衛(wèi),吳丹,潘京華.國內(nèi)外博弈論研究的計量分析[J].圖書情報工作,2013(S2)228-232,223.
李暉,孫文海,李鳳華,等.公共云存儲服務(wù)數(shù)據(jù)安全及隱私保護技術(shù)綜述[J].計算機研究與發(fā)展,2014,51(7):1397-1409.
胡光永.基于云計算的數(shù)據(jù)安全存儲策略研究[J].計算機測量與控制,2011,19(10):2539-2541.
齊愛民,祝高峰.論云存儲中數(shù)據(jù)安全的法律保護[J].重慶大學學報(社會科學版),2017,23(1):101-108.
金志敏.基于云計算下的高校圖書館數(shù)據(jù)安全策略的探討[J].計算機安全,2011(6):96-99.
張凌云.略論連續(xù)數(shù)據(jù)保護技術(shù)為圖書館數(shù)據(jù)安全護航:以天津圖書館為例[J].圖書館工作與研究,2013(11):44-47.
馬曉亭,梁俊榮.大數(shù)據(jù)環(huán)境下圖書館敏感數(shù)據(jù)保護方法研究[J].圖書館學研究,2016(21):50-55.
陳美家,于海洋,張婉瀅,等.我國OA期刊研究的可視化分析[J].圖書情報工作,2011,55(22):133-137.
王 康 遼寧師范大學管理學院2016級碩士研究生。 遼寧大連, 116029。
王曉慧 遼寧師范大學管理學院副教授、系主任。 遼寧大連, 116029。
(收稿日期:2017-05-04 編校:劉 明,陳安琪)