王子剛
摘 要:隨著大數(shù)據(jù)時(shí)代的到來,人工智能技術(shù)的發(fā)展,面對(duì)國家安全與發(fā)展戰(zhàn)略、智庫戰(zhàn)略的需要。情報(bào)工作在新時(shí)代、新環(huán)境、新技術(shù)、新需求下,必須重新審視和定位學(xué)科的未來發(fā)展,重新規(guī)劃和設(shè)計(jì)情報(bào)工作的未來路徑。鑒于此,文章結(jié)合筆者多年工作經(jīng)驗(yàn),對(duì)情報(bào)分析中大數(shù)據(jù)分析技術(shù)與框架研究提出了一些建議,僅供參考。
關(guān)鍵詞:情報(bào)分析;大數(shù)據(jù)分析技術(shù);框架研究
引言
情報(bào)對(duì)提升人們的生活品質(zhì)、促進(jìn)科技的創(chuàng)新與發(fā)展、保障人們的醫(yī)療和健康、促進(jìn)工農(nóng)業(yè)發(fā)展以及輔助政府決策等有積極作用且密切相關(guān),可以說情報(bào)的應(yīng)用領(lǐng)域無所不及。作為研究情報(bào)的采集、處理、分析和交流原理的,以及為各個(gè)領(lǐng)域提供情報(bào)的情報(bào)工作,其未來發(fā)展與科學(xué)發(fā)展的背景、國家安全與發(fā)展的背景、國際大環(huán)境背景有著緊密聯(lián)系。我們必須了解這些影響與情報(bào)工作發(fā)展的背景,把握機(jī)遇迎接挑戰(zhàn)。
1、大數(shù)據(jù)環(huán)境下情報(bào)分析對(duì)象特征
1.1來源多樣化
互聯(lián)網(wǎng)的各項(xiàng)應(yīng)用成為大數(shù)據(jù)的主要來源。在互聯(lián)網(wǎng)的驅(qū)動(dòng)下,電腦、智能手機(jī)、無線傳感器等終端設(shè)備無時(shí)無刻在產(chǎn)生著各種類型的數(shù)據(jù),其來源類型從硬件、網(wǎng)絡(luò)媒體、數(shù)據(jù)類型三個(gè)維度進(jìn)行劃分,硬件維度一般是由自然人部署或操作發(fā)布,網(wǎng)絡(luò)媒體維度則是直接面向用戶的互聯(lián)網(wǎng)應(yīng)用。
1.2低價(jià)值密度
海量數(shù)據(jù)的多維度產(chǎn)生,尤其是社交網(wǎng)站和微信等相對(duì)主觀、自由的網(wǎng)絡(luò)媒體維度的存在,必然會(huì)稀釋數(shù)據(jù)本身的價(jià)值性。除了傳感器是采集的環(huán)境客觀數(shù)據(jù),其他數(shù)據(jù)最初均由自然人主觀發(fā)布,其數(shù)據(jù)的可靠度和可信度殘次不齊。而目前還缺少對(duì)發(fā)布信息真實(shí)性的監(jiān)督。除此之外,這些數(shù)據(jù)中還存在諸多技術(shù)需要但與業(yè)務(wù)沒有直接價(jià)值的數(shù)據(jù)。這兩個(gè)因素加到一起就造成了總體價(jià)值密度低的問題。針對(duì)低價(jià)值密度的數(shù)據(jù),進(jìn)行情報(bào)分析之前需要剔除無價(jià)值的部分,然而傳統(tǒng)的數(shù)據(jù)管理技術(shù)難以實(shí)現(xiàn)此功能,這為情報(bào)分析帶來了前所未有的挑戰(zhàn)。
1.3在大數(shù)據(jù)環(huán)境下,情報(bào)工作發(fā)生巨大變化
情報(bào)工作在范圍、特征、作用、形式、對(duì)象等各個(gè)方面發(fā)生了巨大變化,其主戰(zhàn)場不僅僅是科技與安全領(lǐng)域,已經(jīng)拓展到社會(huì)經(jīng)濟(jì)、人類健康、生態(tài)環(huán)境、歷史文化等方方面面。情報(bào)工作將會(huì)在社會(huì)經(jīng)濟(jì)、科技創(chuàng)新、醫(yī)療衛(wèi)生、國家安全和提升人類的生活品質(zhì)中發(fā)揮“耳目尖兵參謀”的作用。因此,與情報(bào)工作可以此為契機(jī),將情報(bào)理論、技術(shù)和方法影響各個(gè)學(xué)科領(lǐng)域和決策領(lǐng)域,并逐步把各級(jí)(類)情報(bào)所建設(shè)成政府、行業(yè)和各個(gè)領(lǐng)域的重要智庫。
2、情報(bào)分析被弱化為數(shù)據(jù)分析的現(xiàn)狀
情報(bào)分析技術(shù)是情報(bào)技術(shù)的重要組成部分,情報(bào)工作的重要一環(huán)是情報(bào)分析,但情報(bào)學(xué)領(lǐng)域的絕大多數(shù)學(xué)者或從業(yè)人員將其弱化為數(shù)據(jù)分析,與計(jì)算機(jī)領(lǐng)域的相關(guān)工作幾乎沒有區(qū)別。事實(shí)上,數(shù)據(jù)分析是情報(bào)分析的基礎(chǔ),兩者之間區(qū)別顯著:從數(shù)據(jù)對(duì)象維度來看,數(shù)據(jù)分析方法以處理單源數(shù)據(jù)為主,情報(bào)分析方法以處理關(guān)聯(lián)的全源數(shù)據(jù)為主;從產(chǎn)出結(jié)果來看,數(shù)據(jù)分析產(chǎn)出的是新信息、新知識(shí),情報(bào)分析產(chǎn)出的是新智能;從分析起點(diǎn)維度來看,數(shù)據(jù)分析主要是數(shù)據(jù)驅(qū)動(dòng),情報(bào)分析主要是目標(biāo)驅(qū)動(dòng);從分析方法維度來看,數(shù)據(jù)分析以定量分析為主,定性分析、歸納推理、演繹推理為輔,情報(bào)分析在產(chǎn)出新信息、新知識(shí)階段以定量分析為主,在智能產(chǎn)出階段以歸納推理、演繹推理為主;數(shù)據(jù)分析是情報(bào)分析的基礎(chǔ),情報(bào)分析是基于全局的分析,所依據(jù)的數(shù)據(jù)對(duì)象是全部來源的數(shù)據(jù),數(shù)據(jù)分析是基于局部的分析,所依據(jù)的數(shù)據(jù)對(duì)象通常是全部來源數(shù)據(jù)的子集;作為數(shù)據(jù)分析方法體系重要組成的大數(shù)據(jù)分析無法取代情報(bào)分析。
3、情報(bào)信息的大數(shù)據(jù)分析框架
3.1情報(bào)檢索
軍事情報(bào)檢索不同于簡單的文獻(xiàn)查找或數(shù)據(jù)檢索,通過手工檢索、機(jī)械檢索等方式檢索到的信息,還需在原始情報(bào)信息的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行檢索和挖掘,獲得有用的軍事情報(bào)。此外,在檢索過程中需要有明確的檢索目標(biāo),從而提取出原始數(shù)據(jù)中包含的有用情報(bào)。
3.2情報(bào)提取
情報(bào)提取是指將原始數(shù)據(jù)進(jìn)行清洗、比對(duì)、整合等操作后,通過數(shù)據(jù)挖掘等方法對(duì)數(shù)據(jù)進(jìn)行分析。根據(jù)指揮、作戰(zhàn)、決策等不同軍事目的,從數(shù)據(jù)中獲取有用的情報(bào)信息。情報(bào)信息的提取能力,往往會(huì)影響到各國之間軍事政治力量的差距。
3.3數(shù)據(jù)融合
單一數(shù)據(jù)源獲得的信息往往無法滿足情報(bào)分析和決策支持的需求,軍事情報(bào)信息獲取途徑迥異、數(shù)據(jù)類型各不相同、數(shù)據(jù)表現(xiàn)形式多種多樣、信息之間的關(guān)系錯(cuò)綜復(fù)雜。因此,需要對(duì)多源異構(gòu)信息進(jìn)行分析、優(yōu)化,即進(jìn)行基于語義層面的數(shù)據(jù)融合。
3.4情報(bào)分析
傳統(tǒng)的數(shù)據(jù)挖掘算法不論在處理海量數(shù)據(jù)的速度上,還是在挖掘信息的能力上都已明顯無法滿足當(dāng)前戰(zhàn)事分析的需要,當(dāng)代軍事情報(bào)分析需要從已有海量數(shù)據(jù)中,通過多層變換,通過不可分的高階神經(jīng)網(wǎng)絡(luò)推導(dǎo)出能夠支撐決策和作戰(zhàn)指揮的結(jié)論。
3.5關(guān)聯(lián)分析法
對(duì)軍事情報(bào)而言,關(guān)聯(lián)分析法綜合了關(guān)聯(lián)規(guī)則挖掘方法、鏈接方法,以及非相關(guān)文獻(xiàn)知識(shí)發(fā)現(xiàn)方法,可以將多源異構(gòu)數(shù)據(jù)按照關(guān)聯(lián)規(guī)則進(jìn)行跨域關(guān)聯(lián)。再通過聚類分析、路徑分析等方法,對(duì)情報(bào)進(jìn)行發(fā)掘。實(shí)踐證明,關(guān)聯(lián)分析法綜合考慮多種關(guān)聯(lián)因素,可以挖掘出單一數(shù)據(jù)源無法發(fā)現(xiàn)的情報(bào)信息。
3.6數(shù)據(jù)源
數(shù)據(jù)源是整個(gè)體系的最底層,是情報(bào)分析的基石。在大數(shù)據(jù)環(huán)境下,互聯(lián)網(wǎng)和物聯(lián)網(wǎng)兩類應(yīng)用是主要的數(shù)據(jù)源。前者一般使用Web構(gòu)建技術(shù),而后者一般是通過無線傳感器來構(gòu)建,目前Zigbee是公認(rèn)的物聯(lián)網(wǎng)協(xié)議。這兩類應(yīng)用的一般均會(huì)結(jié)合數(shù)據(jù)和文件存儲(chǔ)技術(shù)來構(gòu)建,這與一般的信息系統(tǒng)通常情況下不存在明顯的差別。但是在運(yùn)行過程中,這兩類應(yīng)用會(huì)源源不斷地產(chǎn)生大量的數(shù)據(jù),為情報(bào)分析提供大量數(shù)據(jù)的來源。
3.7數(shù)據(jù)服務(wù)
數(shù)據(jù)服務(wù)直接面向用戶,為用戶提供各類數(shù)據(jù)分析的接口。目前Web和App的相關(guān)開發(fā)方法是構(gòu)建數(shù)據(jù)服務(wù)的主要方法。Web對(duì)應(yīng)的技術(shù)除了基本的構(gòu)建技術(shù)外,云計(jì)算是大數(shù)據(jù)時(shí)代構(gòu)建服務(wù)接口的主流技術(shù),通過調(diào)用云端的服務(wù),用戶可以通過電腦、手機(jī)等互聯(lián)網(wǎng)終端隨時(shí)調(diào)用數(shù)據(jù)分析服務(wù)。App近年來主要的開發(fā)技術(shù)則以iOS和Android為主。
3.8多管理主體的情報(bào)協(xié)同
當(dāng)相互關(guān)聯(lián)的多個(gè)管理行動(dòng)同時(shí)發(fā)生時(shí),管理主體需要協(xié)調(diào)相互之間的目標(biāo)、規(guī)則和分工。不同情報(bào)活動(dòng)的行動(dòng)者單元在協(xié)調(diào)一致或不一致的情況下協(xié)同或分別運(yùn)作,其生產(chǎn)的情報(bào)對(duì)各自管理主體之管理目標(biāo)下的管理決策進(jìn)行支撐。在管理主體協(xié)調(diào)產(chǎn)生共同目標(biāo)的情況下,各行動(dòng)者單元的情報(bào)活動(dòng)及其產(chǎn)出結(jié)果具有協(xié)調(diào)一致的可能,如圖3中的模型。在管理主體不發(fā)生協(xié)調(diào)或者無法協(xié)調(diào)產(chǎn)生一致目標(biāo)的情況下,根據(jù)某個(gè)行動(dòng)者單元所產(chǎn)出的情報(bào),其支撐引導(dǎo)的管理決策和行動(dòng)將對(duì)其他行動(dòng)者單元造成直接作用,這些作用反映為信息資源改變的一個(gè)部分,被納入進(jìn)受到影響的其他行動(dòng)者單元之中。
結(jié)束語
大數(shù)據(jù)時(shí)代的來臨,人工智能等先進(jìn)技術(shù)將逐步進(jìn)入情報(bào)領(lǐng)域。新時(shí)代、新技術(shù)、新環(huán)境、新思維為情報(bào)工作帶來新的活力,情報(bào)工作迎來了極好的發(fā)展機(jī)遇,我們必須砥礪奮進(jìn)。我們相信,在廣大情報(bào)人的共同努力下,未來的與情報(bào)工作一定會(huì)得到更加快速繁榮的發(fā)展。
參考文獻(xiàn):
[1]馬海群,孫瑞英.大數(shù)據(jù)時(shí)代國家情報(bào)工作生態(tài)演替趨勢(shì)研究[J].圖書與情報(bào),2018(06):1-7.
[2]王夢(mèng)瑤.大數(shù)據(jù)背景下偵查創(chuàng)新研究[D].中國人民公安大學(xué),2018.
[3]王煥新.大數(shù)據(jù)時(shí)代競爭情報(bào)對(duì)企業(yè)技術(shù)創(chuàng)新的影響[J].經(jīng)濟(jì)研究導(dǎo)刊,2018(34):17+100.
[4]儲(chǔ)節(jié)旺,吳川徽,陳善姍,是沁,李章超.支撐創(chuàng)新的情報(bào)保障研究進(jìn)展[J].進(jìn)展,2018,12(00):217-247.
[5]唐曉波,鄭杜,翟夏普.基于大數(shù)據(jù)智能的競爭情報(bào)系統(tǒng)模型研究[J].情報(bào)理論與實(shí)踐,2018,41(11):133-137+160.