李廣建 江信昱
(北京大學(xué)信息管理系 北京 100871)
·專題·
不同領(lǐng)域的情報分析及其在大數(shù)據(jù)環(huán)境下的發(fā)展*
李廣建 江信昱
(北京大學(xué)信息管理系 北京 100871)
大數(shù)據(jù)已經(jīng)引起競爭情報、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報等五個領(lǐng)域的重視,為厘清不同領(lǐng)域的情報分析差異,文章通過梳理五個領(lǐng)域?qū)η閳蠓治龅母拍钆c實(shí)踐現(xiàn)況,揭示了不同領(lǐng)域的情報分析特征;通過說明五個領(lǐng)域在大數(shù)據(jù)環(huán)境下的情報分析發(fā)展,指出了大數(shù)據(jù)對情報分析的影響。
大數(shù)據(jù)情報分析競爭情報商務(wù)智能生物醫(yī)學(xué)政府治理軍事情報
不同研究領(lǐng)域有其自身的研究對象、理論源流、學(xué)術(shù)習(xí)慣以及概念框架體系,它們會深刻影響各領(lǐng)域?qū)ν恍g(shù)語的界定和理解。如競爭情報、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報等領(lǐng)域不僅都會涉及“情報分析”這一概念,而且都是圍繞著情報分析而開展相關(guān)研究工作的。但是,這些領(lǐng)域中的情報分析的內(nèi)涵與外延、實(shí)施情報分析的過程等均有其自身的特點(diǎn),不可一概而論。本文的目的,是分析競爭情報、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報等五個領(lǐng)域中“情報分析”概念與實(shí)踐的特點(diǎn),以及大數(shù)據(jù)環(huán)境下這些領(lǐng)域中情報分析的發(fā)展動向,揭示情報分析的學(xué)科差異,為建立統(tǒng)一的情報分析方法體系提供理論素材。
信息與情報是不同概念,情報是對信息進(jìn)行深度加工或從各種文本中挖掘的知識,可以是一種產(chǎn)品、活動、組織,或是一組知識的專門表達(dá)形式;生成情報所采取的分析方法與執(zhí)行過程稱為情報分析研究。對于競爭情報、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報等學(xué)科領(lǐng)域而言,它們的產(chǎn)生與發(fā)展與情報分析研究在具體問題域中的應(yīng)用有著直接、密切的關(guān)系,盡管這五個領(lǐng)域?qū)η閳蠓治龅母拍罾斫饧皩?shí)踐特點(diǎn)不盡相同,但情報分析都是這些領(lǐng)域知識的核心內(nèi)容,也是支持該領(lǐng)域研究的關(guān)鍵,而且,在大數(shù)據(jù)環(huán)境下,大數(shù)據(jù)理念與方法正在對這五個領(lǐng)域產(chǎn)生著深刻的影響。這是本文選取競爭情報、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報等領(lǐng)域作為研究對象的重要原因。
2.1 競爭情報領(lǐng)域
“競爭情報”(Competitive Intelligence,CI)是企業(yè)用來提高競爭優(yōu)勢的情報分析工作,它通過感知外部環(huán)境變化、競爭對手的技術(shù)跟蹤等手段,建立一個關(guān)于競爭對手或外部環(huán)境的預(yù)警系統(tǒng),并支持決策服務(wù),使企業(yè)在激烈的競爭中維持優(yōu)勢地位。由此可見,CI是對外部競爭環(huán)境進(jìn)行全面監(jiān)控的過程,是一種“知己知彼”的交互分析過程。與其他領(lǐng)域的情報分析相比,通過CI分析所得到的情報更具有目的性、針對性及對抗性等特征,同時對自身跟對手的差距、潛在的機(jī)會等問題給出了解答。
企業(yè)進(jìn)行CI活動時,合法性是開展整個活動的基礎(chǔ),即CI活動必須遵守法律或商業(yè)道德規(guī)范。競爭對手或市場的相關(guān)信息主要是通過公開信息來源(如出版資料、科研報告、互聯(lián)網(wǎng)、新聞、數(shù)據(jù)庫、政策法規(guī)等)獲得,其它在不違法的前提下所能獲得的非公開發(fā)表的信息(如通過第三方獲取的信息、錄用對手公司的離職人員所獲得信息、人際網(wǎng)絡(luò)等灰色信息等)也是CI的重要信息來源。也就是說,CI主要的信息來源是基于“文本型式”的科技文獻(xiàn)、網(wǎng)絡(luò)信息、政府信息、新聞、政策研究、產(chǎn)品信息等類型,并結(jié)合灰色信息來提高CI分析的有效性及真實(shí)性。從分析方法來看,因外部競爭環(huán)境復(fù)雜性與競爭對手多樣性而產(chǎn)生出多種CI方法,常見如定標(biāo)比超、SWOT、專利分析、五力分析、財務(wù)分析等方法;此外,朱德利根據(jù)五力分析與SWOT分析拓展出基于競爭要素的CI四維分析框架。在技術(shù)工具方面,分析人員可選擇數(shù)據(jù)挖掘、文本挖掘、網(wǎng)絡(luò)挖掘、可視化技術(shù)、信息抽取、一般統(tǒng)計分析、代理軟件等方法或工具,將數(shù)據(jù)或信息轉(zhuǎn)化為“可操作的情報”(Actionable Intelligence),再根據(jù)企業(yè)的不同需求(如管理決策、營運(yùn)能力、市場監(jiān)控等)形成各種情報產(chǎn)品(如每月情報通訊、咨詢報告、競爭對手文檔、形勢分析等),提供企業(yè)作為戰(zhàn)略行動依據(jù)、危機(jī)預(yù)警判斷、商業(yè)談判等重大決策參考。
大數(shù)據(jù)環(huán)境下,公開信息來源越來越多樣化,考驗(yàn)著企業(yè)的情報獲取與分析能力,特別是企業(yè)對外部環(huán)境變化的及時感知與動態(tài)應(yīng)變能力,CI在企業(yè)戰(zhàn)略預(yù)警與危機(jī)管理等方面發(fā)揮著越來越重要的作用。從當(dāng)前的研究與實(shí)踐來看,CI面臨著“全信息源獲取”、“分析復(fù)雜化與實(shí)時化”兩個急迫解決的問題,就前者而言,企業(yè)可以通過信息技術(shù)解決全信息源獲取的技術(shù)性問題;對后者來說,隨著企業(yè)可以獲取越來越多的異構(gòu)的數(shù)據(jù)及信息,要求CI能夠處理更加復(fù)雜的分析對象,其分析方法需要結(jié)合更多智能化技術(shù),工作流程需要結(jié)合多種方法來解決問題,例如,除了上述常見的分析方法之外,非結(jié)構(gòu)化數(shù)據(jù)處理、關(guān)聯(lián)關(guān)系分析、網(wǎng)絡(luò)挖掘(如輿情分析、觀點(diǎn)挖掘等)、實(shí)時分析及云計算等方法或技術(shù)都是企業(yè)進(jìn)行CI分析的新挑戰(zhàn)。此外,除了獲取公開信息來源之外,由社交媒體產(chǎn)生的社會化數(shù)據(jù),也引發(fā)了企業(yè)CI對競爭對手進(jìn)行實(shí)時監(jiān)控與分析的需求??傃灾?,從基本目的來看CI分析在大數(shù)據(jù)環(huán)境下的發(fā)展,會發(fā)現(xiàn)CI正從對現(xiàn)有競爭對手和外部環(huán)境進(jìn)行分析以輔助企業(yè)保持競爭優(yōu)勢,轉(zhuǎn)向?qū)?shí)時數(shù)據(jù)或信息進(jìn)行快速分析響應(yīng),通過多種分析方法的結(jié)合做到知識發(fā)現(xiàn)以及構(gòu)建適應(yīng)外部環(huán)境的持續(xù)應(yīng)變分析模式,用來支持企業(yè)在競爭環(huán)境中做出高效精準(zhǔn)決策。
2.2 商業(yè)管理領(lǐng)域
商業(yè)管理領(lǐng)域所涉及的情報分析是指“商務(wù)智能”(Business Intelligence,BI)或商業(yè)情報。BI通常被定義為由數(shù)據(jù)倉庫、ETL、聯(lián)機(jī)分析、數(shù)據(jù)挖掘、客戶關(guān)系管理、知識管理等多種技術(shù)融合而成的方法及系統(tǒng),用來管理企業(yè)內(nèi)的相關(guān)商業(yè)數(shù)據(jù)、專家信息及知識。不同于CI關(guān)注外部情報,BI針對企業(yè)內(nèi)部的各種數(shù)據(jù)及信息進(jìn)行分析,從而達(dá)到企業(yè)績效管理、客戶關(guān)系優(yōu)化、監(jiān)控商業(yè)活動等管理目的。由此可見,BI是一種用來提高企業(yè)營銷管理能力的一套集成分析方法與系統(tǒng),分析所得的情報被應(yīng)用在解決客戶及產(chǎn)品的需求趨勢、潛在服務(wù)與產(chǎn)品的關(guān)系、銷售預(yù)測、營銷策略創(chuàng)新等問題。
從實(shí)踐角度看,BI的實(shí)施包括了輸入、流程及輸出等三個主要步驟:①輸入是指數(shù)據(jù)來源,BI的信息源是基于“數(shù)值型式”的業(yè)務(wù)數(shù)據(jù)、客戶相關(guān)數(shù)據(jù)、專家信息、檢索日志記錄等,或是企業(yè)內(nèi)部現(xiàn)有數(shù)據(jù)倉庫的存儲內(nèi)容。②流程是指數(shù)據(jù)處理與分析過程,在BI的實(shí)施過程中,利用ETL等技術(shù)方法將企業(yè)的各種業(yè)務(wù)數(shù)據(jù)導(dǎo)入數(shù)據(jù)倉庫、或是進(jìn)行數(shù)據(jù)集成,并進(jìn)行數(shù)據(jù)分析與挖掘,再將分析結(jié)果結(jié)合企業(yè)的戰(zhàn)略、運(yùn)營、關(guān)鍵績效指標(biāo)或模型庫等加以實(shí)踐應(yīng)用,最終達(dá)到組織層次的商業(yè)績效管理、以及戰(zhàn)略層次的戰(zhàn)略規(guī)劃。③輸出是指BI系統(tǒng)或平臺產(chǎn)生的各種情報產(chǎn)品,如產(chǎn)品銷售報表、客戶分析報表、產(chǎn)品定價方案、績效管理報表、財務(wù)報表等。從技術(shù)角度來看,Chen等人認(rèn)為BI分析經(jīng)歷過三個演化階段:第一個階段是BI1.0,其技術(shù)基礎(chǔ)是結(jié)構(gòu)化數(shù)據(jù)管理與數(shù)據(jù)倉庫;到了2000年的互聯(lián)網(wǎng)出現(xiàn)后,BI進(jìn)入了BI2.0階段,即以網(wǎng)絡(luò)環(huán)境為主的商業(yè)情報分析,BI開始重視實(shí)時數(shù)據(jù)分析、集體智慧、觀點(diǎn)挖掘、關(guān)聯(lián)數(shù)據(jù)、網(wǎng)絡(luò)分析或文本挖掘等技術(shù),表明了基于企業(yè)內(nèi)及結(jié)構(gòu)化數(shù)據(jù)的情報分析已無法滿足決策要求了,而是需要結(jié)合更多的企業(yè)外部及非結(jié)構(gòu)化數(shù)據(jù),來挖掘用戶對企業(yè)業(yè)務(wù)開展、市場活動的想法;第三階段是BI3.0階段,它是在移動終端、RFID及情景感測等技術(shù)發(fā)展背景下產(chǎn)生的,對企業(yè)而言,如何高效處理這類移動性強(qiáng)、與位置相關(guān)、以人為中心、情境敏感的數(shù)據(jù),將是BI分析的巨大挑戰(zhàn)。
大數(shù)據(jù)環(huán)境下,各種新型信息技術(shù)改變了企業(yè)的營銷決策與商業(yè)模式,也對BI的架構(gòu)、功能和所要發(fā)揮的作用產(chǎn)生了巨大的影響。馮芷艷等人從管理學(xué)角度提出大數(shù)據(jù)背景下現(xiàn)代企業(yè)商業(yè)管理研究的前沿課題,例如,企業(yè)應(yīng)利用智能化技術(shù)等手段,挖掘提煉出社會化網(wǎng)絡(luò)環(huán)境中典型的行為模式、個性化行為,其中對新型數(shù)據(jù)源的實(shí)時清洗、實(shí)時挖掘、實(shí)時建模、實(shí)時輿情監(jiān)測等都是值得發(fā)展的分析技術(shù),同時,還要在精準(zhǔn)性與實(shí)時分析之間尋求企業(yè)績效管理的平衡點(diǎn)。由此可以看出,企業(yè)的BI分析在大數(shù)據(jù)環(huán)境下,正從過去基于歷史數(shù)據(jù)的情報分析向“實(shí)時分析”(Real-Time Analysis)的方向轉(zhuǎn)變。具體來說,BI若要進(jìn)行實(shí)時分析,必須先解決數(shù)據(jù)采集、數(shù)據(jù)分析、決策支持及信息反饋等環(huán)節(jié)中的滯后問題,Seufert及Schiefer等人認(rèn)為必須通過信息集成設(shè)施與商業(yè)環(huán)境集成來解決這些問題,包括以事件(Events)驅(qū)動機(jī)制替代周期性的批量處理方式來解決數(shù)據(jù)采集滯后的問題,利用聯(lián)機(jī)分析或數(shù)據(jù)挖掘來解決分析滯后的問題等等。此外,Lim等人強(qiáng)調(diào)新型數(shù)據(jù)源對BI分析的影響,并指出現(xiàn)有的BI系統(tǒng)與大數(shù)據(jù)分析技術(shù)(如Hadoop、MapReduce)、文本挖掘(如從搜索引擎轉(zhuǎn)向企業(yè)搜索系統(tǒng)、從情感分析轉(zhuǎn)向觀點(diǎn)挖掘、從信息抽取轉(zhuǎn)向Q&A系統(tǒng))、網(wǎng)絡(luò)分析(如鏈接挖掘、社區(qū)發(fā)現(xiàn)、社會化推薦)等技術(shù)進(jìn)行整合,是最值得深入研究的內(nèi)容。
2.3 生物醫(yī)學(xué)領(lǐng)域
生物醫(yī)學(xué)領(lǐng)域中的情報分析主要是指“生物醫(yī)學(xué)信息學(xué)”(Biomedical Informatics,BMI),它是由信息計量學(xué)、醫(yī)學(xué)信息學(xué)(Medical Informatics)與生物信息學(xué)(Bioinformatics)等多種學(xué)科融合而產(chǎn)生的新興領(lǐng)域,主要利用情報學(xué)、護(hù)理學(xué)、生物工程、統(tǒng)計學(xué)和計算機(jī)科學(xué)等領(lǐng)域的分析方法與技術(shù)來研究生物醫(yī)學(xué)問題,支持衛(wèi)生保健、臨床實(shí)驗(yàn)及醫(yī)學(xué)知識發(fā)現(xiàn)過程中的決策與服務(wù)。具體來說,BMI分析的基本目的在于了解生命的起源、進(jìn)化、遺傳和發(fā)育的本質(zhì),通過相關(guān)分析方法或技術(shù)挖掘出潛藏在眾多生物信息數(shù)據(jù)庫中的新知識,輔助或直接開展基因組序列分析、基因進(jìn)化分析、藥物設(shè)計、預(yù)測蛋白質(zhì)分子結(jié)構(gòu)與功能、基因區(qū)域預(yù)測及基因功能預(yù)測等工作。
BMI的分析對象是生物醫(yī)學(xué)數(shù)據(jù)(Biomedical Data),包括患者的敘述性數(shù)據(jù)(如病征描述內(nèi)容)、數(shù)據(jù)測量的文本數(shù)據(jù)、遺傳信息、記錄信號、圖紙或影像數(shù)據(jù)等,這些素材除了可從綜合數(shù)據(jù)庫(如Web of Knowledge、Science Direct等)獲得之外,BMI領(lǐng)域的專業(yè)數(shù)據(jù)庫(如Genebank、EMBL、DDBJ、Swiss2Port等)、醫(yī)學(xué)中心或生物信息中心(如EBI、EMBL、NCBI、NIH等)也是主要的獲取渠道。由于生物醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)復(fù)雜性,促使人們必須開發(fā)更新、更靈敏的計算機(jī)技術(shù)或算法來處理及分析生物醫(yī)學(xué)數(shù)據(jù)。從分析方法來看,BMI除了沿用生物醫(yī)學(xué)領(lǐng)域的專門分析方法(如序列對比、結(jié)構(gòu)對比、功能對比預(yù)測等)之外,也借鑒了數(shù)據(jù)挖掘、文本挖掘、本體構(gòu)建、知識發(fā)現(xiàn)等相關(guān)方法和技術(shù),借鑒相關(guān)領(lǐng)域的分析方法原因有二:一是幫助加快及改進(jìn)生物計算分析效率,并降低人工分析及物力投入成本;二是解決遺傳語言中存在的語義鴻溝(Semantic Gap)、生物醫(yī)學(xué)本體構(gòu)建及其概念分類與檢索等障礙。通過BMI分析所得到的情報產(chǎn)出有各種形式,如研究論文、特定主題分析報告、診斷報告書、基因表達(dá)圖譜等,其產(chǎn)出結(jié)果可用來解釋生命進(jìn)化、人體生理與病理關(guān)系等現(xiàn)象,同時對疾病診斷、藥物研發(fā)或遺傳解碼等實(shí)踐應(yīng)用提供了有效支持。
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)分析及信息處理方法已經(jīng)成為BMI分析的基礎(chǔ)工作,同時,大數(shù)據(jù)理念與方法,對BMI分析從“發(fā)現(xiàn)及關(guān)聯(lián)”轉(zhuǎn)向“組合及預(yù)測”、從系統(tǒng)層次的分析轉(zhuǎn)向分子層次的分析,起到了重大影響。Miller也認(rèn)為BMI面對急速增加的生物醫(yī)學(xué)數(shù)據(jù)數(shù)量的問題,特別是下一世代的序列分析技術(shù),將能解析出更多的基因序列,致使數(shù)據(jù)結(jié)構(gòu)更加復(fù)雜化,因此需要在全基因組層面上開展多中心、大樣本、反復(fù)驗(yàn)證的基因關(guān)聯(lián)研究(Genome-wide Association Studies),從而輔助科研人員對基因組或疾病做深入的科學(xué)探究。此外,BMI也開始關(guān)注生物醫(yī)學(xué)數(shù)據(jù)與網(wǎng)絡(luò)數(shù)據(jù)的結(jié)合,通過社會網(wǎng)絡(luò)分析、網(wǎng)絡(luò)分析或云計算等方法來鑒別、預(yù)測或追蹤藥物治療、不同地區(qū)人口的關(guān)注疾病等問題??傃灾瑸榱四苤С稚鲜鯞MI分析,分析前的預(yù)處理工作必須做到真正意義上的“整合”,即情報分析活動的第一步驟,對多源數(shù)據(jù)進(jìn)行抽取、比對、清洗與轉(zhuǎn)換,從而提高及保證生物醫(yī)學(xué)多源數(shù)據(jù)融合的效率與質(zhì)量。
2.4 政府治理領(lǐng)域
Web2.0與開放數(shù)據(jù)(Open Data)對政府治理產(chǎn)生了許多刺激作用,說明了公共數(shù)據(jù)(Public Data)開放對提高政府運(yùn)作的透明度、治理效率及影響決策等的重要性。目前,政府治理領(lǐng)域所指的情報分析尚無公認(rèn)定義,整體來說,更傾向通過“政府?dāng)?shù)據(jù)挖掘”(Government Data Mining,GDM),即通過對稅務(wù)、就業(yè)、執(zhí)法、國家安全(如航空運(yùn)輸、金融交易、恐怖分子監(jiān)視等)等相關(guān)數(shù)據(jù)的深入挖掘,分離出潛藏在數(shù)據(jù)中的噪音及有價值的情報,用來提高政府治理的水平。由此可見,GDM的基本目的是促進(jìn)公共治理與解決社會服務(wù)問題,即強(qiáng)化數(shù)據(jù)-治理-服務(wù)三者之間的關(guān)聯(lián)關(guān)系,并涉及了信息公開與共享、信息增值與再利用、數(shù)據(jù)訪問與存取、數(shù)據(jù)保密、數(shù)據(jù)整合等研究課題。
GDM的分析對象是政府開放的公共數(shù)據(jù),如,美國政府以數(shù)據(jù)共享及再利用為目標(biāo),建立了開放美國政府?dāng)?shù)據(jù)的Data.gov網(wǎng)站,對用戶提供多種數(shù)據(jù)集和輸出接口,以方便政府?dāng)?shù)據(jù)再利用及增值開發(fā),并結(jié)合Data.gov與云計算,構(gòu)建了面向美國所有政府部門的Apps.gov云服務(wù)門戶。以美國Data.gov網(wǎng)站開放的數(shù)據(jù)類型為例,截至2014年7月5日,網(wǎng)站上共開放了110,875個數(shù)據(jù)集,涉及了企業(yè)、地球觀測、教育、地理空間等21類。從分析方法來看,數(shù)據(jù)挖掘是GDM的關(guān)鍵技術(shù),常見如統(tǒng)計分析、分類、聚類、關(guān)聯(lián)規(guī)則、決策樹、神經(jīng)網(wǎng)絡(luò)等。劉典文梳理了數(shù)據(jù)挖掘在公共管理領(lǐng)域的各種應(yīng)用,如通過孤立點(diǎn)分析找出詐欺行為的特征、通過聚類分析找出城市交通系統(tǒng)規(guī)劃及站點(diǎn)分布等,而電子政務(wù)、政府績效管理、公共危機(jī)管理等也是廣泛運(yùn)用數(shù)據(jù)挖掘來找出更多有價值的情報。通過GDM分析得到的情報,可通過每月統(tǒng)計報表、問題解決方案、特定事件監(jiān)測匯報等型式呈現(xiàn)結(jié)果,向決策者或管理者提供政府信息資源增值、信息孤島與社會服務(wù)問題解決、城市管理與監(jiān)控等方面的治理支持。
大數(shù)據(jù)環(huán)境下,Yiu認(rèn)為大數(shù)據(jù)分析是改變政府治理與社會服務(wù)的重要方法或技術(shù),它強(qiáng)化了跨部門之間的數(shù)據(jù)共享與關(guān)聯(lián)、支持組織學(xué)習(xí)與績效管理,并將管理顆粒度細(xì)化到個人,從而可廣泛地應(yīng)用于各種政府服務(wù)管理,如實(shí)時信息管理、多源數(shù)據(jù)融合分析稅務(wù)詐欺、個性化服務(wù)、城市人口監(jiān)控與預(yù)測等。為了解決部門條塊分割的管理碎片化及資源分配問題,陳美認(rèn)為可以通過建立集成各種交通數(shù)據(jù)的綜合多維交通信息體系,實(shí)現(xiàn)各種政府?dāng)?shù)據(jù)的綜合分析,快速解決交通事故、應(yīng)對惡劣氣候?qū)煌ǖ牟涣加绊?、及時實(shí)施道路養(yǎng)護(hù)等等。王志軍以北京石景山區(qū)的城市供水管網(wǎng)漏損應(yīng)用示范點(diǎn)為例,以流量法、壓力法和噪音法分析該區(qū)的供水管網(wǎng)相關(guān)數(shù)據(jù),找出漏損情況及匹配適合的檢漏方法,達(dá)到了精細(xì)化分析、智能化管理,并取得了節(jié)約耗能的效果。除了分析公共數(shù)據(jù)外,喻國明利用數(shù)據(jù)挖掘及社會語義分析工具分析百度搜索詞,探討了中國社會的輿情現(xiàn)實(shí)的走勢與發(fā)展,發(fā)現(xiàn)社會民生、公共安全、衛(wèi)生及環(huán)境生態(tài)是近年來中國社會輿論持續(xù)關(guān)注的基本問題,對于社會管理和社會協(xié)調(diào)有重要的啟示。由此可見,在大數(shù)據(jù)環(huán)境下GDM分析的發(fā)展重點(diǎn)在于,從公共數(shù)據(jù)或其他開放數(shù)據(jù)分析中,精準(zhǔn)、及時掌握政府部門在各種社會服務(wù)中的運(yùn)行規(guī)律,以及深刻察覺其中的治理問題,并提供以數(shù)據(jù)為支撐的決策情報與問題解決方案。
2.5 軍事情報領(lǐng)域
軍事情報(Military Intelligence,MI)是指是為了保障軍事斗爭,有目的地搜集敵方、我方、友方、中立方等相關(guān)方面的素材信息(包括公開信息、秘密信息、部隊及技術(shù)偵查情報、軍事戰(zhàn)備相關(guān)情報等),再經(jīng)深入的綜合分析后得到的情報。在這種情報分析中,特別強(qiáng)調(diào)要避免因忽視危機(jī)信號、過度過濾信息、信息交流不暢、情報政治化等因素造成的情報失察(Intelligence Failure)或情勢誤判。也就是說,MI分析的基本目的在于情報保障及避免情報失察,其分析任務(wù)是面向國家安全的情報偵察探測、分析模擬、戰(zhàn)略研擬、決策參考等方面。
MI的分析對象依據(jù)不同標(biāo)準(zhǔn)而劃分不同類型,按真實(shí)程度可劃分真假情報;按性質(zhì)可劃分軍事指揮、后勤、裝備等情報;按載體可劃分文字、聲像、實(shí)物等情報。具體來說,MI是從公開與非公開數(shù)據(jù)源、軍事信息系統(tǒng)、衛(wèi)星預(yù)警系統(tǒng)等各種渠道取得的基于“戰(zhàn)事局勢”的偵查情報、傳感數(shù)據(jù)、地理數(shù)據(jù)、照片、聲音、武器裝備等等相關(guān)素材。從分析方法來看,MI除了一般的基礎(chǔ)分析方法(如數(shù)學(xué)方法、文獻(xiàn)研究等)之外,情報素材鑒別方法(先期過濾工作)、作戰(zhàn)想定方法(基于軍事任務(wù))、成果評估方法(確定軍事情報價值)都是體現(xiàn)軍事情報領(lǐng)域研究特點(diǎn)的專門分析方法。經(jīng)過MI分析得到的情報,可通過戰(zhàn)略分析評估報告、戰(zhàn)情模擬分析報告、特定目標(biāo)監(jiān)控報告等形式呈現(xiàn)內(nèi)容,并支撐軍事情報單位的軍事斗爭準(zhǔn)備,達(dá)到戰(zhàn)事情況監(jiān)控、戰(zhàn)勝對手、及時預(yù)測客觀情況等各項(xiàng)目標(biāo)。
大數(shù)據(jù)環(huán)境下,面對公開信息來源及新型網(wǎng)絡(luò)環(huán)境的數(shù)據(jù)過剩問題,情報人員沒有足夠時間篩選潛在的有價值情報,例如,軍事情報單位得知恐怖分子可能在某日下午發(fā)動網(wǎng)絡(luò)攻擊,但這樣的情報量是不足夠的,必須具體知道何人、何時、何地及如何阻止他們,而該網(wǎng)絡(luò)恐怖事件即將發(fā)生,不允許情報人員花費(fèi)時間分析該網(wǎng)絡(luò)攻擊的時間、地點(diǎn)與人物。又例如,2012年美國國防部高級研究計劃局推出XDATA項(xiàng)目,目的是開發(fā)大數(shù)據(jù)處理與分析相關(guān)的計算技術(shù)與開放源碼軟件,用來滿足國防軍事需求。但除了開發(fā)軟件工具包之外,項(xiàng)目更涉及了可拓展的分析與數(shù)據(jù)處理技術(shù)、可視化用戶界面技術(shù)、軟件集成研究及評價等等技術(shù),將來可以具體應(yīng)用在網(wǎng)絡(luò)科技、電子戰(zhàn)、電子防護(hù)、數(shù)據(jù)決策、大規(guī)模殺傷性武器防御、工程化彈性系統(tǒng)及監(jiān)視偵察系統(tǒng)等。上述例子說明,大數(shù)據(jù)環(huán)境給MI分析智能化帶來巨大的挑戰(zhàn),研究的課題包括但不限于:信息情報的自動監(jiān)控與關(guān)鍵信息的自動識別定位;不同來源的數(shù)據(jù)與同一事件的對應(yīng)關(guān)系發(fā)現(xiàn);非關(guān)鍵信息之間的隱藏關(guān)聯(lián)規(guī)則等等。
本文梳理了競爭情報、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報五個領(lǐng)域中情報分析的概念與實(shí)踐的特點(diǎn),揭示了不同領(lǐng)域的情報分析的特征,以及大數(shù)據(jù)理念與技術(shù)對五個領(lǐng)域中的情報分析帶來的影響。為更加清楚起見,本文從基本目的、問題情景、研究任務(wù)、數(shù)據(jù)類型、數(shù)據(jù)來源、分析活動、分析技術(shù)、產(chǎn)出形式、結(jié)果價值以及大數(shù)據(jù)的影響等十個方面列出了不同領(lǐng)域情報分析的特征(見表1),期望能幫助我們更加清楚地認(rèn)識情報分析的內(nèi)涵和外延。
表1 不同領(lǐng)域的情報分析及其在大數(shù)據(jù)環(huán)境下的發(fā)展
[1]包昌火.情報研究方法論[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,1990.
[2]Moore D T.Critical Thinking and Intelligence Analysis[M].Washington,D.C.:Joint Military Intelligence College,2010.
[3]陳峰.競爭情報概念及相關(guān)因素分析[J].圖書情報知識,2003,(1):20-22.
[4]包昌火.加強(qiáng)競爭情報工作提高我國企業(yè)競爭能力[J].中國信息導(dǎo)報,1998,(11):30-33.
[5]王知津.競爭情報[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2005.
[6]李正中,許蕾.競爭情報行為的正當(dāng)性與灰色信息收集方式的研究[J].情報學(xué)報,2000,19(1):77-81.
[7]朱德利.基于要素細(xì)分的競爭情報四維分析框架[J].情報學(xué)報,2007,26(1):89-99.
[8]Bose R.Competitive intelligence process and tools for intelligence analysis[J].Industrial Management&Data Systems,2008,108(4):510-528.
[9]包昌火,趙剛,黃英,等.略論競爭情報的發(fā)展走向[J].情報學(xué)報,2004,23(3):352-366.
[10]化柏林.網(wǎng)絡(luò)海量信息環(huán)境下的情報方法體系研究[J].情報理論與實(shí)踐,2012,35(11):1-5.
[11]李廣建,楊林.大數(shù)據(jù)視角下的情報研究與情報研究技術(shù)[J].圖書與情報,2012,(6):1-8.
[12]劉高勇,汪會玲,吳金紅.大數(shù)據(jù)時代的競爭情報發(fā)展動向探析[J].圖書情報知識,2013,(2):105-111.
[13]謝志航,冷洪霞,楊晶晶.大數(shù)據(jù)背景下社會化媒體數(shù)據(jù)的情報價值探討[J].情報探索,2013,(10):6-8.
[14]黃曉斌,鐘輝新.基于大數(shù)據(jù)的企業(yè)競爭情報系統(tǒng)模型構(gòu)建[J].情報雜志,2013,32(3):37-43.
[15]Negash S.Business intelligence[J].Communications of the Association for Information Systems,2004,(13):177-195.
[16]Ranjan J.Business Intelligence:Concepts,Components,Techniques and Benefits[J].Journal of Theoretical and Applied Information Technology,2009,9(1):60-70.
[17]朱曉武.商務(wù)智能的理論和應(yīng)用研究綜述[J].計算機(jī)系統(tǒng)應(yīng)用,2007,(1):114-117.
[18]Chen H C,Chiang R H L,Storey V C.Business Intelligence and Analytics:From Big Data to Big Impact[J].MISQuarterly,2012,36(4):1165-1188.
[19]Trujillo J,MatéA.Business Intelligence 2.0:A General Overview[M].Aufaure M,Zimányi E,Springer Berlin Heidelberg,2012:96,98-116.
[20]馮芷艷,郭迅華,曾大軍,等.大數(shù)據(jù)背景下商務(wù)管理研究若干前沿課題[J].管理科學(xué)學(xué)報,2013,16(1):1-9.
[21]Seufert A,Schiefer J.Enhanced business intelligencesupporting business processes with real-time business analytics:16th International Workshop on Database and Expert Systems Applications[Z].Copenhagen,Denmark:IEEE Computer Society,2005.
[22]Lim E P,Chen H C,Chen G Q.Business Intelligence and Analytics:Research Directions[J].ACM Transactions on Management Information Systems,2013,3(4):1-10.
[23]Bernstam E V,Smith JW,Johnson T R.What is biomedical informatics?[J].Journal of Biomedical Informatics,2010,43(1):104-110.
[24]黃科,曹家樹,吳秋云,等.生物信息學(xué)[J].情報學(xué)報,2002,21(4):491-496.
[25]陳銘.后基因組時代的生物信息學(xué)[J].生物信息學(xué),2004,(2):29-34.
[26]陳潤生.當(dāng)前生物信息學(xué)的重要研究任務(wù)[J].生物工程進(jìn)展,1999,19(4):11-14.
[27]Shortliffe E,Barnett G O.Biomedical Data:Their Acquisition,Storage,and Use[M].London:Springer,2014:39-66.
[28]Bellazzi R,Diomidous M,Sarkar I,et al.Data analysis and datamining current issues in biomedical informatics[J].Methods of Information in Medicine,2011,50(6):536-544.
[29]Pardue J H,Gerthoffer W T.Knowledge acquisition,semantic textmining,and security risks in health and biomedical informatics[J].World Journal of Biological Chemistry,2012,(2):27-33.
[30]Miller K.Big Data Analytics in Biomedical Research[J].Biomedical Computation Review,2012,(2):14-21.
[31]Costa F F.Social networks,web-based tools and diseases:implications for biomedicalresearch[J].Drug Discovery Today,2013,18(5-6):272-281.
[32]Cate F H.Government datamining:The need for a legal framework[J].Harvard Civil Rights-Civil Liberties Law Review,2008,43(2):435-489.
[33]劉增明,賈一葦.美國政府Data.gov和Apps.gov的經(jīng)驗(yàn)與啟示[J].電子政務(wù),2011,(4):90-95.
[34]劉典文.數(shù)據(jù)挖掘技術(shù)在公共管理領(lǐng)域的應(yīng)用[J].行政論壇,2010,17(2):42-46.
[35]Yiu C.The Big Data Opportunity:Making government faster,smarter and more personal[R].London:Policy Exchange,2012.
[36]陳美.大數(shù)據(jù)在公共交通中的應(yīng)用[J].圖書與情報,2012,(6):22-28.
[37]王志軍.大數(shù)據(jù)時代下的城市供水管網(wǎng)漏損管理[J].中國科技產(chǎn)業(yè),2014,(2):74-75.
[38]喻國明.大數(shù)據(jù)分析下的中國社會輿情:總體態(tài)勢與結(jié)構(gòu)性特征[J].中國人民大學(xué)學(xué)報,2013,(5):2-9.
[39]周軍.試論軍事情報的概念[J].情報雜志,2004,(1):33-34.
[40]沈固朝.情報失察——西方情報研究的重要課題及其對我們的啟示[J].圖書情報工作,2009,(2):34-37.
[41]程立斌,林春應(yīng).軍事情報研究方法體系探析[J].情報雜志,2007,(2):87-89.
[42]Magnuson S.Defense,Intel Communities Wrestle With the Promise and Problems of'Big Data'(UPDATED)[J/OL].[2014-08-20].https://www.questia.com/read/ 1G1-323351157/defense-intel-communities-wrestlewith-the-promise.
[43]陳明奇,姜禾,張娟,等.大數(shù)據(jù)時代的美國信息網(wǎng)絡(luò)安全新戰(zhàn)略分析[J].信息網(wǎng)絡(luò)安全,2012,(8):32-35.
In telligence Analysis in Different Domains and Its Developmen tunder the Environment of Big Data
Big data has caught the attention of five domains:competitive intelligence,business management,bioinformatics,government governance and m ilitary intelligence.In order to understand the differences between different domains of intelligence analysis,this article reviews the current status of the conception and practice on intelligence analysis across five domains,reveals the characteristics of intelligence analysis,and then illustrates the development of intelligence analysis across five domains under the big data environment,and points out the effects of big data for intelligence analysis.
big data;intelligence analysis;competitive intelligence;business intelligence;bioinformatics;government governance;military intelligence
G250.2
:A
:1003-6938(2014)05-0007-06
李廣建(1963-),男,北京大學(xué)信息管理系教授,博士生導(dǎo)師,研究方向:信息資源管理與網(wǎng)絡(luò)信息系統(tǒng)研究;江信昱(1985-),男,北京大學(xué)信息管理系博士研究生,研究方向:信息資源管理與網(wǎng)絡(luò)信息系統(tǒng)研究。
*本文系國家社科基金重點(diǎn)項(xiàng)目“大數(shù)據(jù)環(huán)境下的計算型情報分析方法與技術(shù)研究”(項(xiàng)目編號:14ATQ005)研究成果之一。
2014-09-10;責(zé)任編輯:魏志鵬