歐陽秋梅,吳 超
(中南大學 資源與安全工程學院,湖南 長沙 410083)
安全重大事件具有破壞性大、持續(xù)性久和影響范圍廣等特性,具體表現(xiàn)為事件原因難確定、演化擴散機理難預測、對特定區(qū)域內造成重大危害等[1]。安全學科具有綜合屬性,安全大數(shù)據(jù)需在不同計算機、不同國家、不同領域之間進行交流與共享。目前安全數(shù)據(jù)分布于多行業(yè)、多部門、多地域,形成資源分散,缺少工具對信息資源進行整合[2],導致出現(xiàn)信息不對稱現(xiàn)象,同時符合市場規(guī)律的共享機制尚未建立,重復建設、信息封閉現(xiàn)象也依然存在[3]。在大數(shù)據(jù)時代,安全協(xié)同治理已成為各國政府和學界高度關注的安全議題,而安全信息共享能力建設已成為發(fā)展戰(zhàn)略亟待解決的問題[3]。
安全大數(shù)據(jù)共享是提高安全資源利用率的重要手段。目前國內外的學者多從計算機科學、經濟學、管理學、圖書館學、教育學等領域研究大數(shù)據(jù)共享行為,多集中于3個視角:基于大數(shù)據(jù)的資源共享影響因素、策略機理研究[4-6];基于大數(shù)據(jù)的共享平臺設計或資源共享庫總體架構研究[1, 7-10];基于大數(shù)據(jù)的資源共享關鍵技術研究[11-13]等。相對地,國內外對于大數(shù)據(jù)在安全領域的共享研究較少,且集中于對安全資源共享庫的總體架構研究及基于大數(shù)據(jù)技術的安全資源共享能力建設研究[1-3,8],研究側重于通過間接依托于計算機科學、信息科學等學科,實現(xiàn)“信息安全”領域的資源共享;或是局限于某安全行業(yè)或部門間實現(xiàn)安全資源共享,缺乏對安全大數(shù)據(jù)資源共享機制、流程、模式等具有廣泛適用性、指導性和實踐性的研究。
綜上,從安全大數(shù)據(jù)共享首要面臨的困境(“不愿、不全、不會、無保障”)出發(fā),以共享觀念文化、共享數(shù)據(jù)有效性、共享技術環(huán)境和共享制度政策4個視角,提出安全大數(shù)據(jù)共享的12個影響因素,然后對安全大數(shù)據(jù)共享的一般模式進行詳細分析,將影響因素與共享流程2個要素結合實現(xiàn)一體化,構建安全大數(shù)據(jù)共享模型,以期為安全大數(shù)據(jù)共享流程化提供參考。
安全大數(shù)據(jù)作為1種資源,具有可重復利用、廣泛共享、可建設、可增值等特性。從安全學科屬性和安全大數(shù)據(jù)的價值鏈及其挖掘方法、原理出發(fā)[14-16],安全大數(shù)據(jù)有狹義和廣義之分,狹義上是指可反映安全狀態(tài)、發(fā)展趨勢和本質規(guī)律的大數(shù)據(jù)集,廣義上還包括處理安全數(shù)據(jù)集所運用的大數(shù)據(jù)技術和大數(shù)據(jù)思維。
結合相關文獻[3,6,17]中對共享的定義,安全大數(shù)據(jù)共享可理解為:在一定規(guī)范、原則、標準和原理基礎上,運用大數(shù)據(jù)技術及其他新興技術,使安全大數(shù)據(jù)集、安全大數(shù)據(jù)技術和安全大數(shù)據(jù)思維在“在一定條件下”與“指定第三方”實現(xiàn)交流與共享的互動活動。它包含的2個限制條件使它不等同于開放與公開,其共享對象主要涉及自然災害、事故災害、公共衛(wèi)生、社會安全等與公眾密切相關的公共安全大數(shù)據(jù),要求在安全大數(shù)據(jù)共享時尋求與數(shù)據(jù)安全、數(shù)據(jù)隱私的平衡點。
安全大數(shù)據(jù)資源共享也具有狹義和廣義之分,狹義上是指不同機構、不同區(qū)域、不同領域之間的安全數(shù)據(jù)集的關聯(lián)與共享;廣義上是指在符合法規(guī)政策規(guī)定條件下,不同機構、不同區(qū)域、不同領域之間的安全數(shù)據(jù)集、安全大數(shù)據(jù)技術和安全大數(shù)據(jù)思維之間的相互關聯(lián)、共享與碰撞。前者是后者的前提與基礎,后者是安全大數(shù)據(jù)共享實現(xiàn)社會化的基本要求和最終目的。因此,以狹義安全大數(shù)據(jù)共享為出發(fā)點,以廣義安全大數(shù)據(jù)共享為落腳點,探討安全大數(shù)據(jù)共享的影響因素及其模型構建。
安全大數(shù)據(jù)共享效率和共享程度受多層次、多維度因素共同作用,呈現(xiàn)明顯的多樣化與動態(tài)化特征。目前國內外關于資源共享影響因素的研究不少,但還不成體系,再結合安全科學的學科屬性,要求安全大數(shù)據(jù)共享研究需有針對性,不可隨意和機械套用影響因素指標。安全大數(shù)據(jù)共享要解決的首要問題是“不全、不愿、不會、無保障”的共享困境,其中“不愿共享”是安全大數(shù)據(jù)思維觀念層面的因素,“共享不全”是安全大數(shù)據(jù)集層面的因素,“不會共享”是安全大數(shù)據(jù)技術層面的因素。借鑒已有研究中對資源共享影響因素探索,結合現(xiàn)階段安全大數(shù)據(jù)的共享現(xiàn)狀,可從共享觀念文化、共享數(shù)據(jù)有效性、共享技術環(huán)境、共享制度政策4個視角進行分析,闡述“不愿、不全、不會、無保障”共享困境的深層原因。
從觀念文化視角出發(fā),安全大數(shù)據(jù)共享活動受共享意愿、共享動機、共享風險等約束,使資源擁有者“不愿”將手中資源共享,同時需求者不敢輕易使用共享資源,具體表現(xiàn)可歸納為以下2種情況:
1)安全大數(shù)據(jù)共享后的預期利益的不確定性。安全大數(shù)據(jù)作為資源,是否可獲得共享活動后的認可以及互利互惠,是擁有者對安全大數(shù)據(jù)共享是否能帶來預期利益的判斷條件。
2)安全大數(shù)據(jù)共享活動本身帶來或將帶來的風險。共享安全大數(shù)據(jù)集本身存在敏感性、隱私性等問題,擁有者考慮到使用者身份資質、資源被誤用的可能性等因素,同時使用者無法獲知安全大數(shù)據(jù)來源,使其無法辨別安全大數(shù)據(jù)是否存在信息安全問題,使得安全大數(shù)據(jù)在源頭上得不到共享。
共享觀念的欠缺,使得安全大數(shù)據(jù)共享活動從源頭上得不到保障。因此,有關機構需完善與共享活動相關的政策法規(guī),明確共享各方權益和共享層次,塑造規(guī)范的共享環(huán)境,保障共享數(shù)量和質量,共同塑造完善的安全大數(shù)據(jù)共享觀。
大數(shù)據(jù)時代以“樣本即總體”為數(shù)據(jù)統(tǒng)計特征,安全大數(shù)據(jù)具有多時空尺度、多對象尺度和多專題尺度等特性。安全大數(shù)據(jù)共享的方向是全、細、可讀與便利,不僅強調在可共享的數(shù)據(jù)集中盡可能共享多種數(shù)據(jù)源下的多維度、多層次數(shù)據(jù)集,還強調保證數(shù)據(jù)集的可讀性和無障礙訪問、查詢、檢索和獲取共享數(shù)據(jù)信息。但目前安全大數(shù)據(jù)集多以安全領域、行業(yè)為單位,存儲分散或冗余,形成數(shù)據(jù)孤島和數(shù)據(jù)壟斷現(xiàn)象,使得收集到的安全數(shù)據(jù)集維度單一、層次簡單、格式多樣、以非結構化數(shù)據(jù)為主,導致使用時數(shù)據(jù)結構化操作困難。目前標準化組織通過制定數(shù)據(jù)類型相關標準,以期實現(xiàn)數(shù)據(jù)全生命周期的標準化、結構化、規(guī)范化[18]。
已有的研究多集中于共享組織雙方之間的資源共享影響因素。在大數(shù)據(jù)形勢下,將安全系統(tǒng)原始數(shù)據(jù)整合到統(tǒng)一的數(shù)據(jù)共享平臺是普遍認同的數(shù)據(jù)平臺建設模式,安全大數(shù)據(jù)共享平臺在資源擁有者和需求者之間起橋梁作用,充當資源協(xié)調者和資源保存者角色,所涉及的共享平臺技術不僅包括安全數(shù)據(jù)處理的全過程(數(shù)據(jù)采集與預處理、存儲、挖掘與數(shù)據(jù)可視化),還包括如何實現(xiàn)資源在擁有者和需求者之間的有效傳播。安全大數(shù)據(jù)共享平臺通過依托大數(shù)據(jù)脫敏、模式識別、標簽化、結構化、整合及可視化等技術,形成更具開放、互聯(lián)、泛在等特征的共享環(huán)境,推動建立遠程共享與虛擬共享體系,實現(xiàn)資源共享服務、配置和管理等一體化服務。
與安全大數(shù)據(jù)共享相關的政策與制度,可保障共享效率和共享程度。從安全大數(shù)據(jù)制度政策視角出發(fā),可從以下4方面進行分析:
1)安全大數(shù)據(jù)共享標準化。建立一套跨部門、跨領域、跨行業(yè)的包含安全大數(shù)據(jù)描述、交互、存儲、管理等一體化的安全大數(shù)據(jù)共享與交換標準規(guī)范,明確共享數(shù)據(jù)接口、共享平臺、共享協(xié)同方式及機制等,尤其是元數(shù)據(jù)和數(shù)據(jù)倉儲標準的建立,可在源頭上避免同類數(shù)據(jù)的異質,實現(xiàn)與事故隱患排查治理、危險源監(jiān)測檢測、應急救援、事故責任追究等信息共建共享。
2)安全大數(shù)據(jù)共享資助政策。以往的資助機構或
企業(yè)只是促進安全大數(shù)據(jù)在某些機構或部門之間的共享,且大部分鼓勵而非強制進行共享活動,同時考慮到企業(yè)利益,資助的企業(yè)一定程度上會限制共享行為[19]。
3)目前安全大數(shù)據(jù)共享活動存在著學科分布不均現(xiàn)象,多集中在計算機科學、圖書館學、教育學、信息科學、管理學、經濟學等,共享活動涉及的廣度不夠,因此需加強開放共享體制法規(guī)環(huán)境塑造,加強多學科、多領域、多行業(yè)、多維度和多層次的共享。
4)加強安全大數(shù)據(jù)人才建設。一方面,結合共享服務標準,建立合理的安全資源共享專業(yè)化人才評價和激勵機制;另一方面,規(guī)范和強化教育培訓機制,提升共享操作能力,促進安全大數(shù)據(jù)開放共享專業(yè)化人才隊伍建設和穩(wěn)定。
綜上,總結安全大數(shù)據(jù)共享的12個影響因素,如圖1所示。
圖1 安全大數(shù)據(jù)共享影響因素Fig.1 Influencing factors of safety big data sharing
安全大數(shù)據(jù)的全面深度共享與開放,涉及公民隱私保護、資源共享標準、資源共享模式、共享成效檢驗等多方面內容,是一項復雜的系統(tǒng)工程。在進行公共安全大數(shù)據(jù)共享時,還有諸多問題待解決,如:可共享的安全數(shù)據(jù),是原始數(shù)據(jù)還是加工整合后的安全數(shù)據(jù)?類型是結構化數(shù)據(jù)還是非結構化數(shù)據(jù)?共享主體包括哪些?被共享的客體(資源使用者)需滿足什么條件?共享需遵循哪些原則和原理?共享的內容包含哪些?共享模式是怎樣?共享渠道有哪些?共享成效如何評估與檢驗?還需哪些機制保障共享有效長久進行?
基于以上問題及安全大數(shù)據(jù)共享影響因素,在構建安全大數(shù)據(jù)共享模型前可做如下分析:
1)從安全大數(shù)據(jù) “共享”概念出發(fā),應先滿足其2個限定條件。由于共享的安全大數(shù)據(jù)集具有高度關聯(lián)性,可能會加大隱私泄露的風險。需要在數(shù)據(jù)共享時先采用數(shù)據(jù)脫敏技術和數(shù)據(jù)分類分級等措施對海量數(shù)據(jù)進行脫敏和清洗處理。此外,考慮到安全大數(shù)據(jù)的潛在價值和不同用戶需求,進行公共安全大數(shù)據(jù)資源共享活動時,應最大程度地共享那些脫敏后不具有隱私信息的“二次原始活數(shù)據(jù)”,可以是結構化數(shù)據(jù),也可以是非結構化數(shù)據(jù)。
2)進行安全大數(shù)據(jù)共享的主體不限,包括政府、企業(yè)、組織或個人等。就目前現(xiàn)狀而言,相關政府部門應在安全大數(shù)據(jù)共享活動中發(fā)揮主導作用,以統(tǒng)一的安全大數(shù)據(jù)共享交換模式和管理方式為基礎,通過政府引導和資源共享模式創(chuàng)新,實現(xiàn)資源的深度融合,進一步推動企業(yè)、組織、個人均能以常態(tài)化、免費且便利的方式開展共享活動。
3)在進行安全大數(shù)據(jù)共享活動時,共享內容需滿足可讀、有效與便利等基本原則,綜合運用安全科學導向、安全價值轉換、安全關聯(lián)交叉、安全資源整合等應用原理[15],主體先按照一定標準和規(guī)范對數(shù)據(jù)集進行預處理,然后對資源需求者進行“資格審查”。若審查合格,共享雙方需對雙方責任和權利有所規(guī)定與約束,采用“契約式”共享模式保障資源流通安全。
4)安全大數(shù)據(jù)共享的內容包含多方面,既包括需求者所需的安全大數(shù)據(jù)集、安全大數(shù)據(jù)技術和安全大數(shù)據(jù)思維,也包括進行共享活動前的機制、責任、權利的確立,以及共享后資源共享成果檢驗、評估與反饋。
5)結合文獻[17]中對數(shù)據(jù)流動和數(shù)據(jù)開放的描述,安全大數(shù)據(jù)的共享模式可歸納如下:首先是狹義的安全大數(shù)據(jù)共享,共享主體以政府為主,把非涉密的政府數(shù)據(jù)及安全基礎數(shù)據(jù)進行共享;其次是廣義的安全大數(shù)據(jù)共享與交換,包括從點到點的雙邊共享,到多邊共享,再到統(tǒng)一的資源共享平臺;借助安全大數(shù)據(jù)共享平臺力量,通過開放安全大數(shù)據(jù)的基礎處理和分析平臺,吸引具有安全大數(shù)據(jù)思維的人才參與大數(shù)據(jù)的共享與使用,實現(xiàn)安全大數(shù)據(jù)基礎設施的共享與開放;實現(xiàn)價值提取能力的共享,即充分利用現(xiàn)有數(shù)據(jù)科學家的專業(yè)知識,幫助共享多邊建立1個聯(lián)通領域和專業(yè)技能的橋梁。
6)安全大數(shù)據(jù)共享活動還需有其他手段推動,包括:根據(jù)安全發(fā)展形勢,建立、健全與安全大數(shù)據(jù)共享有關的法律法規(guī)、標準、制度等;明確共享多方的職責與權利,塑造良好的共享氛圍;以政府為主導,引導和鼓勵多方參與,共同形成整個安全大數(shù)據(jù)資源“共享-開放-公開”的良性數(shù)據(jù)鏈;完善專業(yè)化人才培養(yǎng)機制,加強對專業(yè)人才的扶持力度,共同推動安全大數(shù)據(jù)共享觀普遍化。
基于以上對安全大數(shù)據(jù)資源共享機理的分析,以安全大數(shù)據(jù)共享影響因素為出發(fā)點,以安全大數(shù)據(jù)資源擁有者、需求者和共享平臺(協(xié)調者和保存者)在安全大數(shù)據(jù)共享互動流程為研究路徑,以安全大數(shù)據(jù)共享平臺建設為著重點,建立公共安全大數(shù)據(jù)資源共享模型,如圖2所示。
1)模型有針對性地分別羅列出共享多方在共享活動過程中,克服不利影響需采取的措施,具有指導性和實踐性。
2)安全大數(shù)據(jù)具有價值隱含原理和價值轉換原理。點對點的雙方共享不足以體現(xiàn)的價值,當數(shù)據(jù)集數(shù)聚達到一定量時,可顯現(xiàn)出其潛在價值。因此,安全大數(shù)據(jù)共享平臺建設是挖掘數(shù)據(jù)價值的必然選擇,而著眼于安全大數(shù)據(jù)共享平臺構建共享模型,具有普適性和前瞻性。
3)模型是針對目前安全大數(shù)據(jù)資源共享現(xiàn)狀與困境提出,在實施共享活動時不可一蹴而就,應始終以安全系統(tǒng)方法為指導思想逐步開展共享活動。在進行共享活動時,要始終保障公民隱私權,從共享安全基礎數(shù)據(jù)集開始,逐步實現(xiàn)公共安全大數(shù)據(jù)的整個價值鏈共享,并逐步從共享走向開放與公開。
4)模型可通過不同數(shù)據(jù)集在共享平臺上的數(shù)聚、組構、多維共享、碰撞、關聯(lián)與比較分析,打破以往安全數(shù)據(jù)信息不對稱和信息流通的限制。
5)模型中,整個共享流程涉及到安全數(shù)據(jù)集的采集、傳輸、清洗、轉換、脫敏、組織、標簽化、建模、識別、抽取、集成、挖掘、可視化等多個環(huán)節(jié),要求不斷提升資源處理能力,打破技術瓶頸。
6)安全大數(shù)據(jù)共享流程中,出現(xiàn)多次判斷和循環(huán),因此共享多方不僅需要掌握共享的流程、模式和技術,還需要有自主思考和辨識能力。
圖2 安全大數(shù)據(jù)共享模型Fig.2 The model of safety big data sharing
1)公共安全大數(shù)據(jù)資源共享不同于開放與公開,有2個限制條件,需要在進行共享活動時始終關注公民的隱私權,應運用安全系統(tǒng)思想逐步開展共享活動。
2)安全大數(shù)據(jù)資源共享具有廣義和狹義之分,狹義上主要是指共享安全基礎數(shù)據(jù)集;廣義上是指共享安全大數(shù)據(jù)集、思維和技術。
3)對公共安全大數(shù)據(jù)共享機理進行詳細分析,包括共享數(shù)據(jù)類型、共享多方確立條件及如何建立“契約式”共享模式、共享內容、共享流程及共享支撐要素等。
4)創(chuàng)建公共安全大數(shù)據(jù)共享模型,以安全大數(shù)據(jù)共享影響因素為出發(fā)點,以安全大數(shù)據(jù)共享互動流程為研究路徑,以安全大數(shù)據(jù)共享平臺建設為著重點,具有一定指導性和實踐性。
[1]孔磊. 城市軌道交通公共安全大數(shù)據(jù)共享資源庫研究[J]. 交通與港航, 2015(5):37-41.
KONG Lei. Research on urban rail traffic safety data sharing resource [J]. Public Utilities, 2015(5):37-41.
[2]國家安全生產監(jiān)督管理總局.大數(shù)據(jù)與安全生產綜述(PPT)[EB/OL].(2015-05-11)[2016-11-18] . http://www.chinasafety.gov.cn/newpage/spzx/spzx.htm.
[3]李明. 大數(shù)據(jù)技術與公共安全信息共享能力[J]. 電子政務, 2014(6):10-19.
LI Ming. Big data technology and public security information sharing ability [J]. e-government affairs, 2014(6):10-19.
[4]Welch E W, Feeney M K, Park C H. Determinants of data sharing in U.S. city governments[J]. Government Information Quarterly, 2016, 33(3):393-403.
[5]Sayogo D S, Pardo T A. Exploring the determinants of scientific data sharing: Understanding the motivation to publish research data[J]. Government Information Quarterly, 2013, 30(1):S19-S31.
[6]馬燦. 國內外醫(yī)療大數(shù)據(jù)資源共享比較研究[J]. 情報資料工作, 2016, 37(3):63-67.
MA Can . Comparative study of large domestic and foreign medical big data resource sharing[J]. Information and Documentation Services, 2016,37(3):63-67.
[7]Gutierrez M A F, Ventura N. Mobile Cloud Computing based on service oriented architecture: Embracing network as a service for 3 RD, party application service providers[A]// Kaleidoscope 2011: the Fully Networked Human? - Innovations for Future Networks and Service[C]. IEEE, 2011:1-7.
[8]曾勝. 重大危險源動態(tài)智能監(jiān)測監(jiān)控大數(shù)據(jù)平臺框架設計[J]. 中國安全科學學報, 2014, 24(11):166-171.
ZENG Sheng. Framework design of large data platform for monitoring and cotrolling major hazards dynamically and intelligently[J]. China Safety Science Journal, 2014, 24(11):166-171.
[9]王輝, 林垚, 周紫君. 基于元數(shù)據(jù)的交通運輸科學數(shù)據(jù)共享平臺設計[J]. 交通信息與安全, 2008, 26(2):86-89.
WANG Hui, LIN Yao, ZHOU Zijun. Design of metadata-based traffic scientific data sharing platform[J]. Computer and Communications, 2008, 26(2):86-89.
[10]寧玉文, 郭佳, 高東懷,等. 高校研究生教育信息資源共享庫設計[J]. 計算機技術與發(fā)展, 2014(8):157-160.
NING Yuwen, GUO Jia, GAO Donghuai,et al. Design of educational information resources shared library for graduate students in higher school[J]. Computer Technology and Development, 2014(8):157-160.
[11]Gibbon D C, Liu Z, Basso A, et al. Automated content metadata extraction services based on MPEG standards[J]. Computer Journal, 2013, 56(5):628-645.
[12]馬新民,許鑫,席磊,等.基于元數(shù)據(jù)的農田信息存儲、管理和共享[J].農業(yè)工程學報,2010, 26(11):209-214.
MA Xinming, XU Xin, XI Lei, et al.Storage, management and sharing of farmland information based on metadata[J].Transactions of the Chinese Society of Agricultural Engineering,2010, 26(11):209-214.
[13] 李小濤, 胡曉惠, 郭曉利,等. 基于元數(shù)據(jù)的復雜信息共享技術[J]. 系統(tǒng)工程與電子技術, 2015, 37(3):700-706.
LI Xiaotao, HU Xiaohui, GUO Xiaoli,et al. Complicated information sharing technology based on metadata,[J]. Systems Engineering and Electronics, 2015, 37(3):700-706.
[14]VIKTOR Mayer-Schǒnberger, KENNETH Cukier. Big data: a revolution that will transform how we live, work, and think[M].London: Hodder & Stoughton,2013:136-161.
[15]歐陽秋梅,吳超,黃浪.大數(shù)據(jù)應用于安全領域的基礎原理研究[J].中國安全科學學報,2016,26(10):1-6.
OUYANG Qiumei, WU Chao, HUANG Lang. Research on basic principles of application of big data in the field of safety science[J]. China Safety Science Journal, 2016,26(10):1-6.
[16]歐陽秋梅,吳超.安全生產大數(shù)據(jù)的5W2H采集法及其模式研究[J].中國安全生產科學技術,2016,12(12): 22-27.
OUYANG Qiumei, WU Chao. Research on 5W2H acquisition method and mode of big data for work safety[J].Journal of Safety Science and Technology, 2016,12(12): 22-27.
[17]大數(shù)據(jù)戰(zhàn)略重點實驗室.DT時代:從“互聯(lián)網+”到“大數(shù)據(jù)*”[M].北京:中信出版集團,2015:13-14,268-270.
[18]大數(shù)據(jù)戰(zhàn)略重點實驗室.塊數(shù)據(jù):大數(shù)據(jù)時代真正到來的標志[M].北京:中信出版集團,2015:61-62.
[19]張靜蓓, 呂俊生, 田野. 國外數(shù)據(jù)共享行為影響因素研究綜述[J]. 圖書情報工作, 2014, 58(4):136-142.
ZHANG Jingbei, LV Junsheng, TIAN Ye. Review of factors influencing the data sharing behaviors at abroad[J].Library and Information Service, 2014, 58(4):136-142.