白亮 郭金林 老松楊
隨著物聯(lián)網(wǎng)、云計(jì)算以及多傳感技術(shù)的不斷發(fā)展,圖、文、聲、像融合表現(xiàn)的多源跨媒體信息呈現(xiàn)“爆發(fā)式”的涌現(xiàn)現(xiàn)象.以互聯(lián)網(wǎng)為例,截至2015年底,全球互聯(lián)網(wǎng)圖、文、聲、像等多媒體數(shù)據(jù)總存儲(chǔ)量已達(dá)數(shù)百億TB以上,并且還在以59%以上的年增長(zhǎng)率迅速增長(zhǎng).不同的學(xué)科領(lǐng)域,正在不同的層面上廣泛地關(guān)注著大數(shù)據(jù)對(duì)自己的研究和實(shí)踐帶來的深刻影響,信息化戰(zhàn)爭(zhēng)中的情報(bào)分析與預(yù)測(cè)工作也不例外.
信息化戰(zhàn)爭(zhēng)中各種傳感器和數(shù)據(jù)獲取手段極大豐富,情報(bào)數(shù)據(jù)存在形態(tài)表現(xiàn)為:多源跨媒體情報(bào)大數(shù)據(jù),即在多媒體數(shù)據(jù)的基礎(chǔ)上,利用各種媒體的形式和特征,對(duì)相同或相關(guān)的情報(bào)信息用不同的媒體表達(dá)形式進(jìn)行處理,由此而產(chǎn)生存儲(chǔ)、處理、檢索和共享等活動(dòng),其特點(diǎn)是:1)多源跨媒體情報(bào)數(shù)據(jù)來自于不同類型傳感器,時(shí)空尺度大、模態(tài)多樣化;2)多種類型媒體數(shù)據(jù)混合并存,包括圖像、視頻、音頻等相互關(guān)聯(lián)的不同模態(tài),且動(dòng)態(tài)變化、真?zhèn)位祀s;3)跨媒體情報(bào)數(shù)據(jù)組織結(jié)構(gòu)復(fù)雜;4)不同類型媒體數(shù)據(jù)從不同側(cè)面表達(dá)同一語(yǔ)義;5)感知主題跨越時(shí)空,檢索中需要根據(jù)媒體之間存在的各種聯(lián)系,從一種媒體跨越到另一種媒體.因此,多源跨媒體情報(bào)數(shù)據(jù)具有復(fù)雜、海量、異質(zhì)多源、大范圍時(shí)空關(guān)聯(lián)等特點(diǎn),它們構(gòu)成了復(fù)雜的情報(bào)感知網(wǎng)絡(luò).一方面,以圖像、視頻為代表的非結(jié)構(gòu)化數(shù)據(jù)處理帶來的挑戰(zhàn),使得對(duì)海量、復(fù)雜的跨媒體數(shù)據(jù)進(jìn)行有效的分析、處理與挖掘,成為亟待解決的難題;另一方面,跨媒體特性對(duì)于海量數(shù)據(jù)語(yǔ)義理解具有重要意義,原因在于交叉關(guān)聯(lián)信息可加強(qiáng)被檢索特征的表示,有利于實(shí)現(xiàn)被檢索資源的綜合、歸納和過濾,有助于從海量數(shù)據(jù)中搜索發(fā)現(xiàn)有價(jià)值的情報(bào)信息,進(jìn)而提供“從數(shù)據(jù)到?jīng)Q策”的各種智能情報(bào)分析服務(wù).
情報(bào)分析是一個(gè)包含了知識(shí)獲取、分析和利用等活動(dòng)的過程[1?4].由于技術(shù)條件的改善、研究方法的發(fā)展以及用戶需求的變化,目前情報(bào)分析研究正日益由“情報(bào)”工作向“研究”工作方面偏移,也就是對(duì)深加工的研究和分析性工作要求越來越多、越來越深入,不僅要求情報(bào)分析研究成果具有綜述性,還要具有研究性和預(yù)測(cè)性.這要求情報(bào)分析不僅完成一般性的統(tǒng)計(jì)功能,還應(yīng)該在知識(shí)層面揭示情報(bào)之間的相互關(guān)系,進(jìn)一步實(shí)現(xiàn)“知識(shí)發(fā)現(xiàn)”.可以說,情報(bào)分析的本質(zhì)就是要最大限度地輔助情報(bào)分析人員揭示、提升軍事情報(bào)的價(jià)值,滿足軍事斗爭(zhēng)的需要.隨著多源情報(bào)獲取手段極大豐富,現(xiàn)有情報(bào)分析與預(yù)測(cè)技術(shù)手段存在的問題和不足也逐漸暴露出來,主要體現(xiàn)在以下幾個(gè)方面:
1)現(xiàn)有情報(bào)管理偏重資料管理,情報(bào)間跨媒體關(guān)聯(lián)性較差
各系統(tǒng)對(duì)情報(bào)資料的管理重心放在收集和整理原始資料上,通常提供簡(jiǎn)單的編目、分組、存儲(chǔ)和查詢,但缺乏內(nèi)容層面的關(guān)聯(lián)建模,特別是針對(duì)海量跨媒體信息,很多資料表面上看起來似乎與情報(bào)分析無(wú)關(guān),但往往是情報(bào)綜合必不可少的基礎(chǔ)資料[5].
2)跨媒體信息處理過程自動(dòng)化程度低
情報(bào)內(nèi)容分析工作大多依賴對(duì)內(nèi)容的人工手動(dòng)標(biāo)注,分析人員處理海量跨媒體數(shù)據(jù)資料費(fèi)時(shí)費(fèi)力,工作壓力巨大,不僅影響工作效率,還容易造成分析錯(cuò)誤.此外,情報(bào)處理與生產(chǎn)過程缺乏統(tǒng)一指揮控制與協(xié)同計(jì)劃,難以進(jìn)行情報(bào)分析的全生命周期管理.
3)情報(bào)分析智能化程度低,缺乏語(yǔ)義層面的情報(bào)內(nèi)容分析
現(xiàn)有系統(tǒng)主要依賴關(guān)系數(shù)據(jù)庫(kù),針對(duì)海量的跨媒體信息,分析和檢索方法手段有限,主要基于關(guān)鍵字進(jìn)行全文檢索,雖然匹配精度高,但由于缺少語(yǔ)義信息,往往難以準(zhǔn)確獲得用戶所關(guān)心的準(zhǔn)確內(nèi)容.同時(shí),在傳感器廣泛應(yīng)用,數(shù)據(jù)獲取手段不斷進(jìn)步的情況下,跨媒體情報(bào)數(shù)據(jù)的積累爆炸性增長(zhǎng),分析人員需要花費(fèi)大量的時(shí)間完成對(duì)資料的查找、分析,從資料中獲取有價(jià)值的情報(bào)更加困難,這不僅為平時(shí)分析工作帶來了不便,更難以適應(yīng)瞬息萬(wàn)變的戰(zhàn)場(chǎng)環(huán)境.
4)情報(bào)綜合利用率低,缺乏對(duì)情報(bào)服務(wù)機(jī)制的統(tǒng)一描述
現(xiàn)有情報(bào)分析系統(tǒng)是為滿足不同作戰(zhàn)部門作戰(zhàn)需求而建立[6?7],都是針對(duì)特定部門的特定應(yīng)用,形成一個(gè)個(gè)“煙囪”式的孤立應(yīng)用系統(tǒng),各系統(tǒng)之間以約定的文件格式進(jìn)行數(shù)據(jù)交換或者根本沒有數(shù)據(jù)接口,數(shù)據(jù)共享程度差,情報(bào)的綜合利用率不高.
因此,如何迅速地分析、過濾和綜合多源跨媒體情報(bào)大數(shù)據(jù),高效發(fā)現(xiàn)與挖掘其中蘊(yùn)含的高價(jià)值情報(bào)知識(shí),不斷提升多源跨媒體情報(bào)數(shù)據(jù)自動(dòng)化和智能化分析與檢索的能力,提供“從數(shù)據(jù)到?jīng)Q策”的各種智能服務(wù),最終為作戰(zhàn)指揮決策提供精確、動(dòng)態(tài)、持續(xù)的情報(bào)支持,成為保障國(guó)家情報(bào)安全的重大軍事需求.而隨著大數(shù)據(jù)、深度學(xué)習(xí)理論框架的提出,研究網(wǎng)絡(luò)空間中基于深度認(rèn)知神經(jīng)網(wǎng)絡(luò)的跨媒體信息智能處理技術(shù)已成為必然.本文在上述深入分析網(wǎng)絡(luò)空間中跨媒體數(shù)據(jù)特點(diǎn)及其應(yīng)用需求的基礎(chǔ)上,提出一種新的深度認(rèn)知神經(jīng)網(wǎng)絡(luò)方法,通過交叉關(guān)聯(lián)信息加強(qiáng)被檢索特征的表示.在此基礎(chǔ)上構(gòu)建基于深度認(rèn)知神經(jīng)網(wǎng)絡(luò)的跨媒體信息處理框架,并歸納總結(jié)其中涉及的關(guān)鍵技術(shù),提出解決方案.
自2006年深度置信網(wǎng)絡(luò)提出以來[8?11],深度神經(jīng)網(wǎng)絡(luò)的相關(guān)工作重新引起了大家的重視,并在計(jì)算機(jī)視覺、語(yǔ)音識(shí)別和自然語(yǔ)言理解等方面的研究取得了巨大的進(jìn)展[12?15],很多研究案例已經(jīng)證明深度學(xué)習(xí)方法能夠有效從大數(shù)據(jù)中發(fā)現(xiàn)其具有的特征表示,這也正是情報(bào)分析的重要目的.情報(bào)分析的過程就是對(duì)大量數(shù)據(jù)的“認(rèn)知過程”,如何讓計(jì)算機(jī)能夠有效學(xué)習(xí)并掌握這一認(rèn)知過程,是需要解決的關(guān)鍵問題.
現(xiàn)有神經(jīng)網(wǎng)絡(luò)一般把注意建模成強(qiáng)化學(xué)習(xí)問題,以及近期提出記憶神經(jīng)網(wǎng)絡(luò)、存儲(chǔ)結(jié)構(gòu)、神經(jīng)圖靈機(jī)等研究成果忽略認(rèn)知過程中的聯(lián)想記憶特性、層級(jí)記憶與注意的相互作用的缺點(diǎn).本文從人類視覺認(rèn)知機(jī)理出發(fā).提出一種融合注意與記憶機(jī)制的深度認(rèn)知神經(jīng)網(wǎng)絡(luò),如圖1所示.
機(jī)理層:主要是歸納總結(jié)注意機(jī)制和記憶機(jī)制等關(guān)鍵認(rèn)知過程的人體機(jī)理,并將其總結(jié)歸納為可解釋、有依據(jù)、能實(shí)現(xiàn)的計(jì)算機(jī)制,為提出深度神經(jīng)網(wǎng)絡(luò)提供支撐.
模型算法層:融合視覺注意和記憶機(jī)制提取任務(wù)導(dǎo)向的特征.對(duì)于輸入圖像,通過卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到低層特征,然后利用視覺注意機(jī)制為每部分特征設(shè)置權(quán)重得到全局特征,最后利用記憶模塊對(duì)特征進(jìn)行更新,并同時(shí)添加或更新記憶.最終得到的特征可以作為下一步的輸入使用,而下一步的操作可以根據(jù)具體任務(wù)來決定.
圖2 網(wǎng)絡(luò)空間中基于深度認(rèn)知神經(jīng)網(wǎng)絡(luò)的跨媒體信息處理框架
大數(shù)據(jù)背景下跨媒體信息智能處理技術(shù),針對(duì)海量跨媒體情報(bào)數(shù)據(jù)智能化處理的迫切軍事需求,將海量龐雜、異質(zhì)多源、大時(shí)空尺度關(guān)聯(lián)的多源跨媒體情報(bào)大數(shù)據(jù)化繁為簡(jiǎn),通過區(qū)別式或生成式,監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)等方法(例如:深度學(xué)習(xí)),識(shí)別出數(shù)據(jù)集中蘊(yùn)含的關(guān)鍵目標(biāo)對(duì)象、熱點(diǎn)事件等語(yǔ)義,挖掘發(fā)現(xiàn)海量多源情報(bào)數(shù)據(jù)內(nèi)在的、有價(jià)值的關(guān)聯(lián)或相關(guān)關(guān)系,準(zhǔn)確快速檢索提取滿足情報(bào)需求的、人可理解并利用的情報(bào)信息和知識(shí)資源,并進(jìn)一步對(duì)目標(biāo)的行為規(guī)律進(jìn)行挖掘,對(duì)其意圖進(jìn)行預(yù)測(cè),形成對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)的深入洞察和準(zhǔn)確認(rèn)知.從而有效服務(wù)于情報(bào)數(shù)據(jù)分析處理、目標(biāo)檢測(cè)與識(shí)別、情報(bào)信息查詢檢索、情報(bào)安全態(tài)勢(shì)的實(shí)時(shí)監(jiān)控和預(yù)警預(yù)報(bào).本文提出的網(wǎng)絡(luò)空間中基于深度認(rèn)知神經(jīng)網(wǎng)絡(luò)的跨媒體信息處理框架如圖2所示.
從數(shù)據(jù)獲取的角度看,本文研究的多源情報(bào)主要是通過戰(zhàn)場(chǎng)網(wǎng)絡(luò)聚合各類傳感器形成的多源跨媒體情報(bào)大數(shù)據(jù).首先,本框架采用基于視覺認(rèn)知計(jì)算的深度神經(jīng)網(wǎng)絡(luò)方法,并采用GPU加速方法提高其學(xué)習(xí)效率與速度,以高效準(zhǔn)確地從中發(fā)現(xiàn)有價(jià)值的情報(bào)信息.其次,通過采用深度學(xué)習(xí)框架中的模型訓(xùn)練、自主學(xué)習(xí)等大數(shù)據(jù)處理技術(shù)機(jī)制,對(duì)圖像、文本、視頻等各類數(shù)據(jù)進(jìn)行數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)挖掘、自動(dòng)融合匹配與關(guān)聯(lián)等智能分析處理,獲取多源情報(bào)隱含的關(guān)聯(lián)分析.最后,通過目標(biāo)檢測(cè)與識(shí)別、關(guān)聯(lián)分析等方法和技術(shù),能夠準(zhǔn)確快速地檢索提取滿足情報(bào)需求的、人可理解并利用的情報(bào)信息和知識(shí)資源.在此基礎(chǔ)上,結(jié)合目標(biāo)時(shí)空特征數(shù)據(jù)、時(shí)序過程數(shù)據(jù)等,采用機(jī)器學(xué)習(xí)方法,進(jìn)一步對(duì)目標(biāo)的行為規(guī)律進(jìn)行挖掘,并采用可視化的技術(shù)手段和工具對(duì)情報(bào)分析結(jié)果進(jìn)行直觀形象的描述和展現(xiàn),輔助軍事人員形成對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)的深入洞察和準(zhǔn)確認(rèn)知,提升情報(bào)分析工作的有效性和實(shí)用性.
本節(jié)將歸納總結(jié)跨媒體情報(bào)大數(shù)據(jù)智能處理的關(guān)鍵技術(shù),并提出需要研究的內(nèi)容及解決思路.
1)視覺對(duì)象檢測(cè)識(shí)別
視覺對(duì)象分類與檢測(cè)是認(rèn)識(shí)和理解圖像視頻內(nèi)容的兩個(gè)重要方面.傳統(tǒng)的方法割裂了對(duì)象整體和局部的聯(lián)系,很難得到關(guān)于對(duì)象的全面表達(dá),因而對(duì)視覺對(duì)象的分類與檢測(cè)研究通常也是獨(dú)立進(jìn)行的.因此,需同時(shí)考慮整體和局部的作用,并將它們整合到同一個(gè)深度學(xué)習(xí)框架中進(jìn)行類別判別和位置計(jì)算,重點(diǎn)研究突破對(duì)象深度表達(dá)建模、基于深度認(rèn)知神經(jīng)網(wǎng)絡(luò)的對(duì)象檢測(cè)識(shí)別等關(guān)鍵問題.同時(shí),針對(duì)在軍事情報(bào)分析領(lǐng)域軍事目標(biāo)對(duì)象的數(shù)據(jù)難以搜集,往往只有少量的標(biāo)記樣本的問題,小樣本條件下基于深度認(rèn)知神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)識(shí)別是其中的關(guān)鍵問題.主要采用大樣本標(biāo)記數(shù)據(jù)學(xué)習(xí)的知識(shí)對(duì)小樣本目標(biāo)檢測(cè)模型訓(xùn)練指導(dǎo)的思路,通過遷移學(xué)習(xí),利用小樣本數(shù)據(jù)對(duì)深度認(rèn)知神經(jīng)網(wǎng)絡(luò)基本模型進(jìn)行調(diào)整優(yōu)化,進(jìn)而研究增量學(xué)習(xí)框架,實(shí)現(xiàn)檢測(cè)模型的迭代更新,從而不斷提高檢測(cè)精度.
2)視覺場(chǎng)景分類
視覺場(chǎng)景(例如:爆炸、集會(huì)游行等)是更高層次的語(yǔ)義內(nèi)容,提高對(duì)視覺場(chǎng)景的分析理解和認(rèn)知能力,是視覺信息理解和計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要問題,也是跨媒體情報(bào)數(shù)據(jù)智能分析的關(guān)鍵環(huán)節(jié).與對(duì)象類別不同,場(chǎng)景類別本身具有語(yǔ)義模糊性和不確定性,同一場(chǎng)景類別具有很大的類內(nèi)差異,使得場(chǎng)景分類問題極具挑戰(zhàn).研究突破新的融合視覺注意機(jī)制和深度卷積神經(jīng)網(wǎng)絡(luò)的場(chǎng)景分類框架是解決這一問題的關(guān)鍵,需深入分析基于空間變換模型的顯性視覺注意機(jī)制,研究突破具體計(jì)算方法和視覺注意的感興趣區(qū)域自動(dòng)提取技術(shù),同時(shí)利用全局特征和局部特征具有的特征互補(bǔ)性,將兩者進(jìn)行有效融合,采用全局模型與局部視覺注意模型相結(jié)合的場(chǎng)景分類技術(shù),提升場(chǎng)景分類準(zhǔn)確性.
3)基于多模態(tài)數(shù)據(jù)的對(duì)象分類識(shí)別
情報(bào)的價(jià)值往往體現(xiàn)于細(xì)節(jié),目標(biāo)的信息越全面對(duì)情報(bào)的貢獻(xiàn)度就越高.單純利用視覺信息進(jìn)行檢測(cè)識(shí)別,往往只能得到關(guān)注目標(biāo)的部分信息,而關(guān)注目標(biāo)的更多細(xì)節(jié)如發(fā)生時(shí)間、背景往往包含在伴隨文本或場(chǎng)景文字中.需研究突破多模態(tài)數(shù)據(jù)下對(duì)象分類識(shí)別方法,基于視覺對(duì)象檢測(cè)識(shí)別、場(chǎng)景文字識(shí)別后的文本,以及圖像或視頻的伴隨文本,采用多模態(tài)深度特征學(xué)習(xí)方法,獲得視覺對(duì)象和關(guān)鍵文本的深度特征,計(jì)算得到視覺目標(biāo)和關(guān)鍵文本的相關(guān)關(guān)系,實(shí)現(xiàn)基于多模態(tài)數(shù)據(jù)的對(duì)象分類識(shí)別.
海量多源情報(bào)關(guān)聯(lián)分析主要是通過采用深度學(xué)習(xí)框架中的模型訓(xùn)練、自主學(xué)習(xí)、知識(shí)維護(hù)、信息反饋等大數(shù)據(jù)處理技術(shù)機(jī)制,對(duì)圖像、文本、視頻、流媒體等各類數(shù)據(jù)進(jìn)行數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)挖掘、自動(dòng)融合匹配與關(guān)聯(lián)等智能分析處理,獲取多源情報(bào)隱含的關(guān)聯(lián)分析.
1)視頻內(nèi)容重復(fù)檢測(cè)與關(guān)聯(lián)分析
視頻內(nèi)容重復(fù)檢測(cè)與關(guān)聯(lián)分析技術(shù)完成對(duì)重復(fù)視頻內(nèi)容的檢測(cè)與過濾,并在此基礎(chǔ)上融合多種模態(tài)的特征信息對(duì)其內(nèi)容進(jìn)行關(guān)聯(lián),重點(diǎn)研究相似關(guān)鍵幀的檢測(cè)技術(shù)、相似視頻檢測(cè)技術(shù)、基于聚類的視頻內(nèi)容關(guān)聯(lián)、融合上下文信息的視頻內(nèi)容關(guān)聯(lián)、基于時(shí)間序列信息的視頻內(nèi)容關(guān)聯(lián)等技術(shù).
2)海量跨媒體數(shù)據(jù)語(yǔ)義內(nèi)容分析與理解
跨媒體數(shù)據(jù)蘊(yùn)含的語(yǔ)義內(nèi)容是信息分析基礎(chǔ),賦予機(jī)器類似人類認(rèn)知系統(tǒng)的跨媒體語(yǔ)義統(tǒng)一感知能力是智能信息處理的一個(gè)核心和熱點(diǎn)科學(xué)問題,也是跨媒體信息分析的關(guān)鍵.重點(diǎn)需要研究解決兩個(gè)方面:一是如何利用跨媒體數(shù)據(jù)語(yǔ)義關(guān)聯(lián)特性,處理大規(guī)??缑襟w高維特征,通過分析數(shù)據(jù)在高維空間中的幾何拓?fù)浣Y(jié)構(gòu)優(yōu)化數(shù)據(jù)之間相似性計(jì)算,降低計(jì)算復(fù)雜度是需要研究的關(guān)鍵問題.二是如何構(gòu)建更好的機(jī)器學(xué)習(xí)方法提高語(yǔ)義概念探測(cè)與識(shí)別的性能,重點(diǎn)需要解決通過多示例描述單一樣本以增強(qiáng)樣本歧義性表達(dá)能力問題.
3)跨媒體語(yǔ)義關(guān)聯(lián)分析
對(duì)海量跨媒體進(jìn)行關(guān)聯(lián)挖掘的前提是能夠建立不同媒體之間的語(yǔ)義關(guān)聯(lián).其關(guān)鍵問題是如何將不同類型媒體表達(dá)在同一特征空間中進(jìn)行關(guān)聯(lián)性分析度量.一方面,需要構(gòu)建準(zhǔn)確的數(shù)學(xué)映射將不同媒體的特征映射到同一個(gè)隱空間中;另一方面,要重點(diǎn)解決隱空間中特征模式相似性度量問題,傳統(tǒng)方法通常采用兩種訓(xùn)練樣例:一種是同一語(yǔ)義的不同媒體數(shù)據(jù),另一種是用單向排序的樣本.如何有效利用雙向排序樣本的優(yōu)勢(shì)來增強(qiáng)語(yǔ)義關(guān)聯(lián)是研究的重點(diǎn).
4)基于網(wǎng)絡(luò)模型的跨媒體數(shù)據(jù)關(guān)聯(lián)挖掘方法
海量的跨媒體數(shù)據(jù)是數(shù)據(jù)生產(chǎn)者、制作者、消費(fèi)者的偏好、意圖、情感、行為的信息載體,其背后隱藏著極其龐大、復(fù)雜的社會(huì)群體與行為模式,如何從中分析挖掘出有價(jià)值的知識(shí)是跨媒體信息分析需要解決的關(guān)鍵問題.如何通過跨媒體語(yǔ)義關(guān)聯(lián)的結(jié)果構(gòu)建跨媒體數(shù)據(jù)語(yǔ)義聯(lián)系,并且在此基礎(chǔ)上,引入網(wǎng)絡(luò)模型有效融合跨媒體用戶“社會(huì)性”信息,進(jìn)一步構(gòu)建用戶社會(huì)網(wǎng)絡(luò)是需要解決的重點(diǎn)問題.
基于高層特征的情報(bào)數(shù)據(jù)挖掘與預(yù)測(cè)研究如何基于高層特征對(duì)目標(biāo)的行為規(guī)律進(jìn)行挖掘,對(duì)其意圖進(jìn)行預(yù)測(cè),并通過態(tài)勢(shì)可視化的方式來加以輔助.
1)情報(bào)數(shù)據(jù)時(shí)間序列挖掘
戰(zhàn)場(chǎng)情報(bào)監(jiān)視數(shù)據(jù)的采集通常與時(shí)間相關(guān),數(shù)據(jù)具有時(shí)間上的關(guān)聯(lián)性.利用時(shí)間序列數(shù)據(jù)挖掘方法,可以得到數(shù)據(jù)中蘊(yùn)含的與時(shí)間相關(guān)的有用信息,實(shí)現(xiàn)知識(shí)的提取.
時(shí)間序列數(shù)據(jù)是數(shù)據(jù)挖掘中一類復(fù)雜的數(shù)據(jù)對(duì)象,其復(fù)雜性表現(xiàn)在:一般維數(shù)比較高,往往含有噪聲;在幅度方面存在拉伸和平移,在時(shí)間軸上存在伸縮;另外還有線性漂移和不連續(xù)點(diǎn).時(shí)間序列數(shù)據(jù)挖掘與一般的數(shù)據(jù)挖掘最大的區(qū)別在于其數(shù)據(jù)的有序性,是一個(gè)演化分析過程.
因此,需要針對(duì)實(shí)際的大量序列數(shù)據(jù),根據(jù)應(yīng)用目的,選取相應(yīng)的挖掘工具,從序列數(shù)據(jù)中發(fā)現(xiàn)隱含的規(guī)則(或稱為模式、知識(shí)),再以這些規(guī)律對(duì)序列未來的變化進(jìn)行預(yù)測(cè)或描述.
2)情報(bào)熱點(diǎn)傳播演化分析
情報(bào)熱點(diǎn)傳播分析研究如何基于情報(bào)熱點(diǎn)演化關(guān)系、信息語(yǔ)義內(nèi)容和網(wǎng)絡(luò)成員聯(lián)系建立情報(bào)熱點(diǎn)通過多源跨媒體數(shù)據(jù)及其成員傳播的路徑,追溯信息的起源,跟蹤情報(bào)熱點(diǎn)的傳播過程及范圍.如何基于情報(bào)熱點(diǎn)演化關(guān)系和信息語(yǔ)義內(nèi)容建立貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)是需要解決的關(guān)鍵技術(shù)之一;在模型推理中,綜合考慮計(jì)算速度和計(jì)算精度,重點(diǎn)研究高效的推理算法方法,提出估計(jì)情報(bào)熱點(diǎn)傳播路徑方法,分析計(jì)算情報(bào)熱點(diǎn)在信息間傳播關(guān)系的強(qiáng)弱.
3)情報(bào)態(tài)勢(shì)可視化
為了讓用戶更好地理解情報(bào)態(tài)勢(shì),降低態(tài)勢(shì)認(rèn)知門檻,針對(duì)多源情報(bào)海量、異構(gòu)、跨媒體、大時(shí)空尺度等特點(diǎn),需要設(shè)計(jì)適合的可視化隱喻,以最適合的方式展現(xiàn)各種情報(bào)態(tài)勢(shì)要素的時(shí)空特性和其他屬性、態(tài)勢(shì)要素間的關(guān)聯(lián)關(guān)系以及情報(bào)態(tài)勢(shì)的發(fā)展變化歷程與發(fā)展趨勢(shì)也是需要解決的關(guān)鍵技術(shù).
網(wǎng)絡(luò)空間中跨媒體數(shù)據(jù)爆炸式涌現(xiàn),如何對(duì)海量、復(fù)雜的跨媒體數(shù)據(jù)進(jìn)行有效的分析、處理與挖掘,成為亟待解決的難題,深度學(xué)習(xí)理論的出現(xiàn)為處理跨媒體大數(shù)據(jù)提供有效的解決思路,總的來說:一是要注重大數(shù)據(jù)與深度神經(jīng)網(wǎng)絡(luò)的結(jié)合,深度神經(jīng)網(wǎng)絡(luò)是解決大數(shù)據(jù)分析的有力工具,同時(shí)大數(shù)據(jù)也為深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用提供了數(shù)據(jù)支撐;二是要注重人類認(rèn)知機(jī)制與深度學(xué)習(xí)方法的結(jié)合,人腦在進(jìn)行復(fù)雜思維、關(guān)聯(lián)分析方面具有極大的優(yōu)勢(shì),如何將人腦的認(rèn)知機(jī)制轉(zhuǎn)化為計(jì)算模型,進(jìn)一步與計(jì)算機(jī)強(qiáng)大計(jì)算能力有機(jī)結(jié)合,是大數(shù)據(jù)分析的關(guān)鍵;三是要注重跨媒體關(guān)聯(lián),大數(shù)據(jù)的一個(gè)重要特點(diǎn)就是“數(shù)據(jù)關(guān)聯(lián)性”,有價(jià)值的信息往往隱藏在紛雜繁蕪、千絲萬(wàn)縷的“關(guān)聯(lián)”之中,特別是不同模態(tài)數(shù)據(jù)之間的關(guān)聯(lián)更是跨媒體大數(shù)據(jù)時(shí)代的重要挑戰(zhàn)和巨大機(jī)遇.
本文深入分析網(wǎng)絡(luò)空間中跨媒體數(shù)據(jù)特點(diǎn)及其應(yīng)用需求,提出一種新的深度認(rèn)知神經(jīng)網(wǎng)絡(luò)方法.在此基礎(chǔ)上構(gòu)建基于深度認(rèn)知神經(jīng)網(wǎng)絡(luò)的跨媒體信息處理框架,并歸納總結(jié)其中涉及的關(guān)鍵技術(shù),提出解決方案.實(shí)現(xiàn)網(wǎng)絡(luò)空間中跨媒體情報(bào)大數(shù)據(jù)的綜合、歸納和過濾,輔助從海量數(shù)據(jù)中搜索發(fā)現(xiàn)有價(jià)值的情報(bào)信息,進(jìn)而提供“從數(shù)據(jù)到?jīng)Q策”的各種智能信息服務(wù).