亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多源多維數(shù)據(jù)融合研究態(tài)勢(shì):理論、方法與應(yīng)用*

        2022-05-12 12:58:10于佳會(huì)劉佳靜鄭建明
        情報(bào)雜志 2022年5期
        關(guān)鍵詞:卡爾曼濾波神經(jīng)網(wǎng)絡(luò)融合

        于佳會(huì) 劉佳靜 鄭建明

        (南京大學(xué)信息管理學(xué)院 南京 210023)

        大數(shù)據(jù)時(shí)代,信息爆炸式增長(zhǎng),數(shù)據(jù)的來(lái)源也越來(lái)越廣泛,總的來(lái)說(shuō),可以把數(shù)據(jù)來(lái)源歸納為兩大類,一類是“以物為中心”的各種傳統(tǒng)傳感器獲取的“硬數(shù)據(jù)”,另一類是“以人為中心”產(chǎn)生的“軟數(shù)據(jù)”,如社交網(wǎng)絡(luò)數(shù)據(jù)、web數(shù)據(jù)、多媒體數(shù)據(jù)等。此外,數(shù)據(jù)除來(lái)源廣外,還具有多維性特征,多維主要體現(xiàn)在數(shù)據(jù)屬性的多樣性上,即對(duì)同一對(duì)象從不同視角提取的數(shù)據(jù),如內(nèi)容主題維度、類型維度、結(jié)構(gòu)維度、時(shí)間維度、空間維度等。

        面對(duì)海量、復(fù)雜的數(shù)據(jù),一方面難以充分挖掘出有價(jià)值的信息,另一方面單來(lái)源單維度數(shù)據(jù)難以滿足輔助科學(xué)決策的需要,多源多維數(shù)據(jù)融合發(fā)展的需求越來(lái)越迫切。與此同時(shí),物聯(lián)網(wǎng)、云計(jì)算、人工智能等新興技術(shù)的發(fā)展,不僅提高了數(shù)據(jù)獲取與數(shù)據(jù)分析處理的能力、促進(jìn)了數(shù)據(jù)融合的發(fā)展,也增加了數(shù)據(jù)融合的研究熱度。因此,本文對(duì)多源多維數(shù)據(jù)融合的研究現(xiàn)狀進(jìn)行梳理與分析,以期為數(shù)據(jù)融合領(lǐng)域后續(xù)的理論與實(shí)踐研究提供參考。

        1 概念界定

        一般來(lái)說(shuō),數(shù)據(jù)融合和信息融合通常被視為相同的概念,只是在某些情況下,數(shù)據(jù)融合用來(lái)表示處理直接從傳感器獲得的原始數(shù)據(jù),信息融合則用來(lái)定義處理在原始數(shù)據(jù)基礎(chǔ)上形成的信息[1]。在研究文獻(xiàn)中,與數(shù)據(jù)融合相關(guān)的術(shù)語(yǔ)通常還包括傳感器融合、多傳感器融合、知識(shí)融合、數(shù)據(jù)聚合、數(shù)據(jù)集成、數(shù)據(jù)組合等。本文在處理過(guò)程中,將數(shù)據(jù)融合和信息融合視為了相同的概念。數(shù)據(jù)融合這一概念最早是在20世紀(jì)70年代美國(guó)軍事領(lǐng)域內(nèi)提出的,之后被廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、交通、醫(yī)療等領(lǐng)域。不同領(lǐng)域?qū)?shù)據(jù)融合的理解和運(yùn)用不同,因此數(shù)據(jù)融合至今依然沒(méi)有統(tǒng)一的定義。目前,被普遍采納的定義是由美國(guó)三軍組織實(shí)驗(yàn)室理事聯(lián)合會(huì)(JDL)提出的,他們認(rèn)為數(shù)據(jù)融合是一種對(duì)多源數(shù)據(jù)進(jìn)行檢測(cè)、相關(guān)、組合和估計(jì)的多層次、多方面處理過(guò)程[2]。Hall等認(rèn)為數(shù)據(jù)融合是將多種來(lái)源的數(shù)據(jù)結(jié)合起來(lái),利用計(jì)算機(jī)進(jìn)行數(shù)據(jù)處理,得到單個(gè)或單類信息源無(wú)法獲得的有價(jià)值的綜合信息[3]。結(jié)合前人觀點(diǎn),筆者認(rèn)為,多源多維數(shù)據(jù)融合是根據(jù)數(shù)據(jù)融合的目的和所處層次,選擇恰當(dāng)?shù)臄?shù)據(jù)融合結(jié)構(gòu)和算法,通過(guò)對(duì)描述對(duì)象不同來(lái)源不同維度的數(shù)據(jù)進(jìn)行抽取、清洗、分選等預(yù)處理,提取出數(shù)據(jù)特征并進(jìn)行關(guān)聯(lián)組合,從而得到更加準(zhǔn)確完整信息的過(guò)程。數(shù)據(jù)融合的具體流程如圖1所示。

        圖1 多源多維數(shù)據(jù)融合流程

        2 數(shù)據(jù)來(lái)源

        依據(jù)論題解讀,筆者以中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)為數(shù)據(jù)統(tǒng)計(jì)源,以“數(shù)據(jù)融合”“信息融合”“多源數(shù)據(jù)”“多維數(shù)據(jù)”“多源信息”“多維信息”為檢索詞,進(jìn)行“篇名”檢索,限定期刊來(lái)源為北大核心、CSSCI以及CSCD,檢索時(shí)間為2021年6月10日,檢索結(jié)果為5 511篇相關(guān)文獻(xiàn)。筆者對(duì)其年發(fā)文量進(jìn)行統(tǒng)計(jì),得到年發(fā)文量曲線圖,如圖2所示(注:2021年數(shù)據(jù)不完整,截至檢索日期共計(jì)162篇)。通過(guò)圖2可以看出,1992年以前,我國(guó)并不十分重視數(shù)據(jù)融合的研究;1992-1998年,數(shù)據(jù)融合相關(guān)文獻(xiàn)開(kāi)始出現(xiàn)且年發(fā)文量逐漸增加,表明數(shù)據(jù)融合在我國(guó)開(kāi)始受到關(guān)注,相關(guān)研究開(kāi)始起步;1999-2009年,年發(fā)文量快速增長(zhǎng),并且在2009年達(dá)到階段性峰值,表明數(shù)據(jù)融合相關(guān)研究進(jìn)入高速發(fā)展階段;2009年至今,數(shù)據(jù)融合相關(guān)文獻(xiàn)年發(fā)文量有所回落,但總體呈平穩(wěn)上升趨勢(shì),并且年發(fā)文量數(shù)值較高,表明國(guó)內(nèi)學(xué)者對(duì)數(shù)據(jù)融合研究一直保持著較高的關(guān)注度,數(shù)據(jù)融合相關(guān)研究進(jìn)入平穩(wěn)發(fā)展階段。

        圖2 我國(guó)數(shù)據(jù)融合相關(guān)論文年發(fā)文量曲線

        為了解國(guó)內(nèi)多源多維數(shù)據(jù)融合的最新研究進(jìn)展,筆者對(duì)近5年的期刊文獻(xiàn)進(jìn)行了分析,把檢索時(shí)間限定為2016年1月1日至2021年6月10日,共得到1 611篇文獻(xiàn),對(duì)檢索結(jié)果進(jìn)行預(yù)處理(去重及去除不相關(guān)等)后得到緊密相關(guān)的文獻(xiàn)1 565篇。本次研究運(yùn)用了文獻(xiàn)計(jì)量學(xué)方法,借助可視化應(yīng)用軟件VOSviewer,對(duì)研究樣本進(jìn)行分析。

        3 多源多維數(shù)據(jù)融合相關(guān)研究

        多源數(shù)據(jù)和多維數(shù)據(jù)都是數(shù)據(jù)融合的處理對(duì)象,根據(jù)不同的分類標(biāo)準(zhǔn)可以把數(shù)據(jù)劃分為多源數(shù)據(jù)和多維數(shù)據(jù),多源數(shù)據(jù)是按照數(shù)據(jù)的來(lái)源進(jìn)行劃分,多維數(shù)據(jù)的劃分標(biāo)準(zhǔn)是數(shù)據(jù)的屬性,多來(lái)源也可以看作是多維度的一種維度,從這個(gè)意義上說(shuō),多維數(shù)據(jù)的含義高于多源數(shù)據(jù)。一般來(lái)說(shuō),多源數(shù)據(jù)和多維數(shù)據(jù)之間沒(méi)有絕對(duì)的關(guān)系,單來(lái)源的數(shù)據(jù)按照不同的性質(zhì)可以劃分出多個(gè)維度,同一性質(zhì)的數(shù)據(jù)按照不同的來(lái)源也可以劃分為多個(gè)來(lái)源,且各種來(lái)源的數(shù)據(jù)大多涉及多維度處理問(wèn)題,所以在處理數(shù)據(jù)時(shí),對(duì)數(shù)據(jù)是多源還是多維的判斷通常不是絕對(duì)的。同時(shí)分析整理文獻(xiàn)發(fā)現(xiàn),大多數(shù)多源多維數(shù)據(jù)融合研究主要針對(duì)多來(lái)源數(shù)據(jù)進(jìn)行分析,集中于理論研究、方法研究以及應(yīng)用研究,且不少文獻(xiàn)把多源數(shù)據(jù)融合簡(jiǎn)稱為數(shù)據(jù)融合,所以筆者主要從數(shù)據(jù)融合的理論、方法與應(yīng)用三個(gè)層面展開(kāi)分析。

        3.1數(shù)據(jù)融合理論研究大數(shù)據(jù)時(shí)代,大規(guī)模的多源多維數(shù)據(jù)關(guān)聯(lián)交叉,融合處理難度大,不少學(xué)者提出數(shù)據(jù)融合面臨著諸多困境。整體來(lái)看,融合過(guò)程在融合方式變革、融合規(guī)模控制與數(shù)據(jù)存儲(chǔ)維護(hù)方面,融合結(jié)果在用戶隱私保護(hù)與實(shí)際應(yīng)用對(duì)接方面,融合技術(shù)在跨領(lǐng)域、跨學(xué)科、跨語(yǔ)言以及跨媒體融合方面存在著挑戰(zhàn)與問(wèn)題[4]。從具體領(lǐng)域來(lái)看,圖書館大數(shù)據(jù)融合面臨著多源異構(gòu)數(shù)據(jù)關(guān)聯(lián)難度大、實(shí)時(shí)大數(shù)據(jù)和歷史大數(shù)據(jù)融合復(fù)雜性大、對(duì)傳感器系統(tǒng)功能性需求大、大數(shù)據(jù)安全與開(kāi)放的矛盾大等挑戰(zhàn);高等教育發(fā)展也存在大數(shù)據(jù)融合利用效率低、利用力度不足、浪費(fèi)嚴(yán)重、數(shù)據(jù)化水平低等困境。部分學(xué)者針對(duì)各領(lǐng)域不同的發(fā)展目的提出了數(shù)據(jù)融合的途徑,同時(shí)還有學(xué)者進(jìn)一步對(duì)數(shù)據(jù)融合的體系建設(shè)提出了構(gòu)想,如張文萍等探討了包括數(shù)據(jù)描述模型、數(shù)據(jù)服務(wù)模型、數(shù)據(jù)管理計(jì)劃等科學(xué)數(shù)據(jù)融合體系架構(gòu)[5];翟運(yùn)開(kāi)等從層次維、時(shí)間維和種類維三個(gè)角度構(gòu)建了包括精準(zhǔn)醫(yī)療多源異構(gòu)數(shù)據(jù)融合標(biāo)準(zhǔn)體系框架[6]。

        總體來(lái)說(shuō),近幾年數(shù)據(jù)融合理論相關(guān)文獻(xiàn)數(shù)量不多,研究主要集中在面臨問(wèn)題、融合途徑以及體系建設(shè)等方面。關(guān)于數(shù)據(jù)融合困境的研究比較片面和泛化,未來(lái)還需根據(jù)發(fā)展需求與實(shí)際情況不斷剖析數(shù)據(jù)融合面臨的問(wèn)題與挑戰(zhàn);對(duì)于數(shù)據(jù)融合途徑的研究比較薄弱,無(wú)論是從整體視角還是具體應(yīng)用領(lǐng)域來(lái)看都有很大的研究空間;許多領(lǐng)域?qū)?shù)據(jù)融合體系建設(shè)的重視度不夠,且沒(méi)有形成廣義的數(shù)據(jù)融合體系。總之,多源多維數(shù)據(jù)融合理論不夠完善,還需在理論層面進(jìn)一步展開(kāi)探討,構(gòu)建完整的系統(tǒng)理論體系。

        3.2數(shù)據(jù)融合方法研究受外界環(huán)境或傳感器性能等的影響,各系統(tǒng)獲得的數(shù)據(jù)存在冗余或不準(zhǔn)確的問(wèn)題,數(shù)據(jù)融合方法通過(guò)對(duì)不同形式的數(shù)據(jù)進(jìn)行處理,可有效獲得準(zhǔn)確信息。為更直觀全面地反映數(shù)據(jù)融合方法的發(fā)展現(xiàn)狀,筆者抽取與數(shù)據(jù)融合方法研究相關(guān)的文獻(xiàn),運(yùn)用可視化應(yīng)用軟件VOSviewer構(gòu)建關(guān)鍵詞可視化圖譜(圖3)。分析圖3可知,運(yùn)用較多的方法是神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí))、D-S證據(jù)理論、卡爾曼(Kalman)濾波、支持向量機(jī)(SVM)、遺傳算法、信息熵、自適應(yīng)加權(quán)、層次分析法、小波變換、粒子群算法、聚類、蟻群算法等。

        3.2.1 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)融合 心理學(xué)家Mcculloch和數(shù)學(xué)家Pitts于1943年提出神經(jīng)網(wǎng)絡(luò)概念和M-P模型,自此拉開(kāi)神經(jīng)網(wǎng)絡(luò)研究的序幕[7]。神經(jīng)網(wǎng)絡(luò)是模仿人腦進(jìn)行信息處理的算法,具有強(qiáng)大的自學(xué)習(xí)、自適應(yīng)、非線性匹配和信息處理能力,并且隨著算法的改進(jìn),在淺層神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,深度神經(jīng)網(wǎng)絡(luò)被提出并不斷發(fā)展。

        圖3 數(shù)據(jù)融合方法相關(guān)文獻(xiàn)的關(guān)鍵詞知識(shí)圖譜

        a.BP神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)即反向傳播神經(jīng)網(wǎng)絡(luò),屬于淺層神經(jīng)網(wǎng)絡(luò)的一種,通常由一個(gè)輸入層、一個(gè)隱藏層和一個(gè)輸出層組成,多層的網(wǎng)絡(luò)體系結(jié)構(gòu)使得信息的輸出更加準(zhǔn)確。如有學(xué)者設(shè)計(jì)了一款?;穫}(cāng)庫(kù)巡邏機(jī)器人,在對(duì)收集的泄露?;窛舛?、倉(cāng)庫(kù)內(nèi)環(huán)境溫度和濕度數(shù)據(jù)進(jìn)行拉依達(dá)去噪、歸一化后利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行融合輸出,大幅度提高了機(jī)器人報(bào)警的準(zhǔn)確性和可靠性[8]。由于外界環(huán)境的復(fù)雜性以及BP神經(jīng)網(wǎng)絡(luò)自身的缺陷,越來(lái)越多的學(xué)者借助優(yōu)化算法,如改進(jìn)蟻群算法、改進(jìn)粒子群算法、啟發(fā)螢火蟲算法、改進(jìn)煙花算法等設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)融合算法,優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、權(quán)值和閾值,有效地減少了冗余數(shù)據(jù)傳輸,提高了融合的精度和收斂速度,改善了數(shù)據(jù)融合算法的性能。

        b.深度學(xué)習(xí)。深度學(xué)習(xí)由淺層神經(jīng)網(wǎng)絡(luò)發(fā)展而來(lái),是深度神經(jīng)網(wǎng)絡(luò)的統(tǒng)稱,卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中重要的算法結(jié)構(gòu)。不同于淺層神經(jīng)網(wǎng)絡(luò),深度神經(jīng)網(wǎng)絡(luò)擁有多個(gè)隱藏層,且較低層的隱藏層輸出可以作為較高層隱藏層的輸入[9]。深度學(xué)習(xí)具有更強(qiáng)的特征表示能力,不少學(xué)者將其運(yùn)用到了數(shù)據(jù)融合算法中。如馬永軍等提出了以卷積神經(jīng)網(wǎng)絡(luò)模型為核心的無(wú)線傳感器網(wǎng)絡(luò)數(shù)據(jù)融合算法,有效地提高了數(shù)據(jù)采集精度[10];張輝等提出了一種基于深度神經(jīng)決策森林(DNDF)的數(shù)據(jù)融合方法,有效提取了多維數(shù)據(jù)的關(guān)鍵特征,解決了體域網(wǎng)中多傳感器數(shù)據(jù)采集過(guò)程中數(shù)據(jù)冗余大、特征信息模糊的問(wèn)題[11]??偟膩?lái)說(shuō),與傳統(tǒng)數(shù)據(jù)融合算法相比,深度學(xué)習(xí)可以有效地改善高噪聲、多維度、大規(guī)模、結(jié)構(gòu)復(fù)雜數(shù)據(jù)的融合效果。

        3.2.2 基于統(tǒng)計(jì)推理的數(shù)據(jù)融合

        a.D-S證據(jù)理論。D-S證據(jù)理論于1967年被Dempster提出[12],后又經(jīng)Shafer完善推廣[13],是一種不確定性推理的方法,能夠高效的處理復(fù)雜和不確定信息,在數(shù)據(jù)融合領(lǐng)域發(fā)揮著重要的作用。有學(xué)者從維修性數(shù)據(jù)源中挖掘樣本量和分布特征等信息構(gòu)建證據(jù),采用D-S理論合成證據(jù)作為權(quán)重,建立了維修性多源數(shù)據(jù)融合模型[14];還有學(xué)者針對(duì)海量數(shù)據(jù)節(jié)點(diǎn)產(chǎn)生和傳輸中的不確定性,提出在物聯(lián)網(wǎng)節(jié)點(diǎn)加權(quán)的基礎(chǔ)上用D-S證據(jù)理論對(duì)數(shù)據(jù)進(jìn)行融合[15]。D-S證據(jù)理論可以很好地表達(dá)和處理不確定信息,然而在挖掘多源數(shù)據(jù)特征合成證據(jù)構(gòu)建數(shù)據(jù)融合模型時(shí),需要特別注意沖突數(shù)據(jù)的融合問(wèn)題,注重考慮合成規(guī)則的適用性、運(yùn)算量的適中性以及融合結(jié)果的正確性等。

        b.支持向量機(jī)理論。支持向量機(jī)是Vapnik于20世紀(jì)90年代提出的一種算法[16],以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),從線性可分的情況下尋找最優(yōu)分類面發(fā)展而來(lái),主要用來(lái)進(jìn)行分類和回歸分析,在數(shù)據(jù)融合中有著一定的運(yùn)用。如蔡世清等以支持向量機(jī)為學(xué)習(xí)機(jī)來(lái)預(yù)測(cè)多傳感器信任度,使得提出的多傳感器數(shù)據(jù)融合算法具有更高的預(yù)測(cè)精度和收斂速度[17];鄭毅等提出基于多任務(wù)支持向量機(jī)的多源健康數(shù)據(jù)融合方法,有效地融合了具有不同數(shù)據(jù)源個(gè)數(shù)的多源數(shù)據(jù),且該方法具有較好的分類性能與結(jié)構(gòu)稀疏性[18]??傊?,支持向量機(jī)分類和回歸分析的精確度較高,提高了數(shù)據(jù)融合算法的性能。

        3.2.3 基于估計(jì)理論的數(shù)據(jù)融合 估計(jì)理論方法可以分為線性估計(jì)技術(shù)與非線性估計(jì)技術(shù),為復(fù)雜的數(shù)據(jù)融合過(guò)程提供了強(qiáng)大的方法支撐。其中,線性估計(jì)技術(shù)包括卡爾曼濾波、小波變換、最小二乘等,經(jīng)典的非線性估計(jì)技術(shù)有擴(kuò)展卡爾曼濾波(EKF)和無(wú)跡卡爾曼濾波(UKF)等。

        a.線性估計(jì)技術(shù)??柭鼮V波方法是Kalman在1960 年提出的[19],是一種對(duì)信息系統(tǒng)當(dāng)前的狀態(tài)進(jìn)行最優(yōu)估計(jì)的算法,一些學(xué)者用其幫助解決數(shù)據(jù)融合系統(tǒng)中信息誤差的估計(jì)問(wèn)題。如段杰等利用卡爾曼濾波算法對(duì)農(nóng)業(yè)大棚環(huán)境參數(shù)進(jìn)行數(shù)據(jù)級(jí)的融合處理,去除了數(shù)據(jù)采集中噪聲的影響,使得測(cè)量的結(jié)果更加穩(wěn)定、融合精度更高[20];楊丹等采用卡爾曼濾波算法,設(shè)計(jì)了融合陀螺儀、加速度計(jì)和磁強(qiáng)計(jì)多種傳感器信息的機(jī)器人姿態(tài)測(cè)量系統(tǒng),實(shí)現(xiàn)了對(duì)機(jī)器人實(shí)時(shí)姿態(tài)的精確測(cè)量[21]??柭鼮V波算法具有較強(qiáng)的容錯(cuò)能力,但也存在著系統(tǒng)參數(shù)數(shù)量影響計(jì)算效率、不能處理非線性問(wèn)題、對(duì)狀態(tài)空間模型的精準(zhǔn)度依賴較高的不足,要想進(jìn)一步提高融合精度,需不斷優(yōu)化和改進(jìn)卡爾曼濾波算法。

        b.非線性估計(jì)技術(shù)??柭鼮V波算法無(wú)法對(duì)非線性系統(tǒng)的狀態(tài)進(jìn)行估計(jì),為解決這一問(wèn)題,有學(xué)者提出了擴(kuò)展卡爾曼濾波算法[22],該算法一經(jīng)提出便得到了廣泛應(yīng)用。如為獲取準(zhǔn)確、可靠的航向和姿態(tài)信息實(shí)現(xiàn)非線性系統(tǒng)的自主導(dǎo)航,盧艷軍等采用擴(kuò)展卡爾曼濾波算法進(jìn)行姿態(tài)角和航偏角估計(jì)[23]。然而,對(duì)非線性強(qiáng)度高的系統(tǒng)狀態(tài)估計(jì)時(shí),擴(kuò)展卡爾曼濾波算法存在較大的誤差,于是精度更高、收斂性更好的無(wú)跡卡爾曼濾波算法被提出,并被一些學(xué)者應(yīng)用于數(shù)據(jù)融合中,如孟陽(yáng)等設(shè)計(jì)了基于無(wú)跡卡爾曼濾波的多傳感器最優(yōu)數(shù)據(jù)融合方法,用于處理非線性特征明顯的組合導(dǎo)航系統(tǒng)的數(shù)據(jù)融合問(wèn)題[24]??偟膩?lái)說(shuō),擴(kuò)展卡爾曼濾波和無(wú)跡卡爾曼濾波是適用于非線性系統(tǒng)狀態(tài)估計(jì)的近似估計(jì)方法,近年來(lái)在數(shù)據(jù)融合領(lǐng)域得到了學(xué)者的大量關(guān)注與研究。

        3.2.4 基于綜合方法的數(shù)據(jù)融合 為了提高數(shù)據(jù)融合方法的性能,增強(qiáng)其適用性,數(shù)據(jù)融合方法呈現(xiàn)出不斷改進(jìn)且朝著綜合方向發(fā)展的特點(diǎn),具體表現(xiàn)為將幾種常見(jiàn)的融合方法結(jié)合起來(lái)。如為提高數(shù)據(jù)融合結(jié)果的速度和精確度,有學(xué)者將長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)和模糊推理與卡爾曼濾波相結(jié)合[25];或?qū)⒋植诩碚撆c支持向量機(jī)相結(jié)合[26]。此外,為提高數(shù)據(jù)融合可信度,還有學(xué)者將卡爾曼濾波原理和基于多層感知機(jī)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法應(yīng)用到誤差協(xié)方差估計(jì)中[27]。可見(jiàn),各種數(shù)據(jù)融合方法取長(zhǎng)補(bǔ)短,發(fā)揮各自的特點(diǎn)與優(yōu)勢(shì),得到了優(yōu)于單一方法的融合結(jié)果。

        3.3數(shù)據(jù)融合應(yīng)用研究分析文獻(xiàn)發(fā)現(xiàn),數(shù)據(jù)融合應(yīng)用研究是當(dāng)前的重點(diǎn)與熱點(diǎn),筆者通過(guò)整理數(shù)據(jù)融合應(yīng)用相關(guān)研究,運(yùn)用VOSviewer軟件構(gòu)建了關(guān)鍵詞知識(shí)圖譜(見(jiàn)圖4)。根據(jù)圖4可知,數(shù)據(jù)融合應(yīng)用范圍十分廣泛,主要用于故障診斷、遙感、目標(biāo)跟蹤、導(dǎo)航、目標(biāo)檢測(cè)、交通工程、目標(biāo)識(shí)別、智慧城市、狀態(tài)評(píng)估、圖像處理、機(jī)器人、產(chǎn)地鑒別、定位、三維建模等。總的來(lái)說(shuō),針對(duì)傳統(tǒng)物理傳感器的數(shù)據(jù)融合應(yīng)用研究偏多,“以人為中心”的數(shù)據(jù)融合應(yīng)用研究較為缺乏。不同領(lǐng)域的數(shù)據(jù)融合應(yīng)用不近相同、各有側(cè)重,筆者對(duì)數(shù)據(jù)融合在圖情領(lǐng)域的具體應(yīng)用進(jìn)行了分析。

        3.3.1 驅(qū)動(dòng)智慧服務(wù)深入發(fā)展 大數(shù)據(jù)時(shí)代,智慧服務(wù)的發(fā)展離不開(kāi)多來(lái)源多維度數(shù)據(jù)的支撐,數(shù)據(jù)融合技術(shù)為分析處理這些數(shù)據(jù)提供了有效途徑,受到了不少專家學(xué)者的關(guān)注,如蒲泓宇等通過(guò)對(duì)政務(wù)多源信息篩選整合,構(gòu)建了政務(wù)協(xié)同網(wǎng)絡(luò),助力政務(wù)服務(wù)智慧化發(fā)展[28]。還有學(xué)者構(gòu)建了產(chǎn)業(yè)競(jìng)爭(zhēng)情報(bào)多源數(shù)據(jù)融合框架,推動(dòng)了競(jìng)爭(zhēng)情報(bào)智慧檢索、個(gè)性化推薦、專項(xiàng)定制以及智慧預(yù)測(cè)四種產(chǎn)業(yè)競(jìng)爭(zhēng)情報(bào)智慧服務(wù)方式的發(fā)展[29]。智慧化發(fā)展是當(dāng)今時(shí)代發(fā)展的趨勢(shì),多源多維數(shù)據(jù)融合在智慧服務(wù)方面的應(yīng)用依然有很大的潛力,未來(lái)可以從各領(lǐng)域智慧服務(wù)的具體問(wèn)題切入,不斷增強(qiáng)數(shù)據(jù)融合應(yīng)用的廣度與深度。

        圖4 數(shù)據(jù)融合應(yīng)用研究關(guān)鍵詞知識(shí)圖譜

        3.3.2 促進(jìn)用戶行為綜合分析 數(shù)據(jù)融合在用戶行為方面的應(yīng)用主要是通過(guò)構(gòu)建用戶行為特征提取模型,預(yù)測(cè)用戶潛在需求,為用戶提供個(gè)性化、精準(zhǔn)化服務(wù)。如孟凡會(huì)等利用深度學(xué)習(xí)算法將多源用戶痛點(diǎn)信息進(jìn)行融合,建立了用戶痛點(diǎn)信息核心詞庫(kù)和指標(biāo)詞庫(kù),以達(dá)到預(yù)測(cè)用戶需求發(fā)展動(dòng)向的目的[30];張繼東等在移動(dòng)社交網(wǎng)絡(luò)用戶行為感知中加入了多源融合數(shù)據(jù),使得對(duì)用戶行為習(xí)慣的分析更加準(zhǔn)確[31]。融合多源多維數(shù)據(jù)可以提高用戶行為感知的精準(zhǔn)性,但是用戶類型不應(yīng)該局限于移動(dòng)社交網(wǎng)絡(luò)人員。

        3.3.3 助力信息資源創(chuàng)新建設(shè) 大數(shù)據(jù)時(shí)代各個(gè)機(jī)構(gòu)或者系統(tǒng)中存在著許多豐富且高質(zhì)量的數(shù)據(jù),如何對(duì)這些多來(lái)源多維度數(shù)據(jù)進(jìn)行挖掘與使用成為資源建設(shè)的重點(diǎn)與難點(diǎn),基于此,不少學(xué)者關(guān)注到了數(shù)據(jù)融合方法。如有學(xué)者通過(guò)判定和總結(jié)公共文化服務(wù)機(jī)構(gòu)年報(bào)文檔的格式、文本結(jié)構(gòu)和特定數(shù)據(jù)項(xiàng)的上下文特征,對(duì)各類年報(bào)數(shù)據(jù)建立了模板進(jìn)行匹配并抽取[32];還有學(xué)者在人物專題數(shù)據(jù)庫(kù)的建設(shè)與實(shí)現(xiàn)過(guò)程中注重?cái)?shù)據(jù)關(guān)聯(lián),融入了多源數(shù)據(jù)和自建數(shù)據(jù),推動(dòng)了數(shù)據(jù)庫(kù)建設(shè)由數(shù)字化向數(shù)據(jù)化方向發(fā)展[33]??偟膩?lái)說(shuō),數(shù)據(jù)融合方法擁有著強(qiáng)大的數(shù)據(jù)分析與治理能力,為文化等信息資源的建設(shè)開(kāi)辟了良好的路徑。

        3.3.4 推動(dòng)科學(xué)前沿精準(zhǔn)識(shí)別 及時(shí)探測(cè)、識(shí)別科學(xué)研究主題的最新前沿有利于科研管理者進(jìn)行科學(xué)決策,但目前相關(guān)研究主要是依據(jù)期刊論文展開(kāi)分析,單一的數(shù)據(jù)分析結(jié)果不能全面科學(xué)的反映研究領(lǐng)域的整體狀況。因此,有學(xué)者結(jié)合傳統(tǒng)LDA算法和Word2vec詞聚類算法的優(yōu)點(diǎn),提出了LDA2vec模型,注重多源文本,將論文與專利結(jié)合起來(lái)進(jìn)行主題熱點(diǎn)分析[34];還有學(xué)者在專利、論文信息的基礎(chǔ)上,又融入輿情信息,借助情感分析法、熵值法、CRITIC法、LDA模型法綜合識(shí)別新興技術(shù)主題[35]。此外,張維沖等還增加了圖書、基金項(xiàng)目、行業(yè)報(bào)告、政策等多種數(shù)據(jù)源,分析多源數(shù)據(jù)的時(shí)序性、主題內(nèi)容和主題關(guān)聯(lián),以區(qū)塊鏈技術(shù)為例進(jìn)行發(fā)展趨勢(shì)識(shí)別[36]。從現(xiàn)有研究來(lái)看,運(yùn)用數(shù)據(jù)融合技術(shù)從多源文本中識(shí)別科學(xué)前沿,結(jié)果更加高速、全面和準(zhǔn)確。

        3.3.5 提高突發(fā)事件響應(yīng)效率 為提高突發(fā)事件快速響應(yīng)效率,降低突發(fā)事件導(dǎo)致的損失,不少學(xué)者運(yùn)用數(shù)據(jù)融合方法從不同角度對(duì)突發(fā)事件進(jìn)行了研究。如朱鵬等從信息瀑布溯源角度出發(fā),設(shè)計(jì)了基于時(shí)間序列與信息融合的信息瀑布溯源模型,探究突發(fā)事件信息瀑布發(fā)生發(fā)展的演進(jìn)過(guò)程[37];徐緒堪等對(duì)大量異構(gòu)復(fù)雜的突發(fā)事件多源數(shù)據(jù)構(gòu)建信任函數(shù),量化多源數(shù)據(jù)的可信度和關(guān)聯(lián)度,幫助獲取明晰和精準(zhǔn)的突發(fā)事件決策需求[38]??傊?,突發(fā)事件多源數(shù)據(jù)具有動(dòng)態(tài)性、異構(gòu)性以及不確定性等特點(diǎn),借助數(shù)據(jù)融合方法可以更好地抓取和分析數(shù)據(jù),探究多源數(shù)據(jù)的可信度,為突發(fā)事件信息瀑布源頭尋找以及科學(xué)決策等提供有價(jià)值的信息。

        3.3.6 助推科學(xué)評(píng)價(jià)全面優(yōu)化 隨著大數(shù)據(jù)、人工智能等新技術(shù)的發(fā)展,科學(xué)評(píng)價(jià)越來(lái)越朝著全面化、智能化方向發(fā)展,數(shù)據(jù)融合技術(shù)也不斷地被應(yīng)用到多源、多維綜合指標(biāo)的建設(shè)過(guò)程中。如宋新平等綜合財(cái)務(wù)數(shù)據(jù)和消費(fèi)者評(píng)論數(shù)據(jù),建立了基于財(cái)務(wù)特征和綜合特征的競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)模型,用于解決傳統(tǒng)企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)研究中數(shù)據(jù)源單一和評(píng)價(jià)指標(biāo)片面的問(wèn)題[39]。單一的數(shù)據(jù)源已經(jīng)不能準(zhǔn)確反映作者影響力、企業(yè)競(jìng)爭(zhēng)對(duì)手等的全貌,也不利于評(píng)價(jià)指標(biāo)的合理建立。科學(xué)評(píng)價(jià)越來(lái)越需要多來(lái)源的綜合信息,基于數(shù)據(jù)融合方法建立評(píng)價(jià)模型具有現(xiàn)實(shí)意義與應(yīng)用價(jià)值。

        4 總結(jié)與討論

        通過(guò)文獻(xiàn)梳理可知,目前我國(guó)多源多維數(shù)據(jù)融合已經(jīng)具有一定的研究規(guī)模,研究?jī)?nèi)容包括理論、方法與應(yīng)用三個(gè)方面。就理論研究來(lái)說(shuō),部分學(xué)者對(duì)數(shù)據(jù)融合的問(wèn)題、思路與體系等給出了自己的見(jiàn)解;就方法研究來(lái)說(shuō),不同專業(yè)的學(xué)者對(duì)各自領(lǐng)域的數(shù)據(jù)融合方法進(jìn)行了優(yōu)化與完善;就應(yīng)用研究來(lái)說(shuō),各領(lǐng)域根據(jù)具體問(wèn)題通過(guò)建設(shè)平臺(tái)、設(shè)計(jì)系統(tǒng)和構(gòu)建模型等方式對(duì)數(shù)據(jù)融合技術(shù)有了不同程度的運(yùn)用。其中,圖情領(lǐng)域?qū)?shù)據(jù)融合方法的使用更多體現(xiàn)在智慧服務(wù)發(fā)展、用戶行為分析、信息資源建設(shè)、科學(xué)前沿識(shí)別、突發(fā)事件響應(yīng)、科學(xué)評(píng)價(jià)優(yōu)化等方面。

        當(dāng)前研究依然存在以下幾點(diǎn)不足:a.理論基礎(chǔ)研究相對(duì)薄弱,對(duì)相關(guān)概念缺少統(tǒng)一的定義與認(rèn)識(shí),缺乏系統(tǒng)的理論基礎(chǔ),沒(méi)有形成完整的理論體系。b.數(shù)據(jù)融合技術(shù)的發(fā)展面臨著數(shù)據(jù)異構(gòu)、數(shù)據(jù)不確定、數(shù)據(jù)異常和虛假、數(shù)據(jù)關(guān)聯(lián)等多個(gè)方面的問(wèn)題,但是大多數(shù)技術(shù)研究只是集中在解決這些問(wèn)題中的部分,缺少對(duì)解決所有問(wèn)題數(shù)據(jù)融合算法的整體研究。c.應(yīng)用研究主要集中在“以物為中心”的數(shù)據(jù)融合上,缺少對(duì)“以人為中心”的數(shù)據(jù)融合的研究,即對(duì)物理傳感器等設(shè)備獲得的“硬數(shù)據(jù)”的融合研究較多,對(duì)來(lái)自社會(huì)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)等信息系統(tǒng)的“軟數(shù)據(jù)”或“軟硬數(shù)據(jù)”融合的研究相對(duì)較少。同時(shí),數(shù)據(jù)融合方法在圖情領(lǐng)域的應(yīng)用研究還處于起步階段,發(fā)展不成熟,未來(lái)還有很大的研究空間。

        針對(duì)上述不足,未來(lái)研究可以考慮從以下幾個(gè)方面取得進(jìn)展:a.發(fā)展和完善數(shù)據(jù)融合的基礎(chǔ)理論研究,既要有針對(duì)特定應(yīng)用領(lǐng)域數(shù)據(jù)融合的特征、準(zhǔn)則和方案等的理論架構(gòu),也要注重發(fā)展數(shù)據(jù)融合作為獨(dú)立學(xué)科廣義的融合模型與算法等系統(tǒng)理論體系。b.技術(shù)發(fā)展上注重改進(jìn)和完善現(xiàn)有數(shù)據(jù)融合算法,發(fā)展多種數(shù)據(jù)融合方法結(jié)合的綜合數(shù)據(jù)融合算法,增強(qiáng)異構(gòu)數(shù)據(jù)融合算法的魯棒性和準(zhǔn)確度,提高數(shù)據(jù)融合的性能。c.人可以提供物理傳感器無(wú)法獲得的有價(jià)值的信源,要加強(qiáng)對(duì)“以人為中心”的“軟數(shù)據(jù)”或“軟硬數(shù)據(jù)”融合的應(yīng)用研究,進(jìn)一步擴(kuò)展數(shù)據(jù)融合技術(shù)在圖情領(lǐng)域的應(yīng)用。d.構(gòu)建數(shù)據(jù)融合評(píng)估方法,對(duì)數(shù)據(jù)融合系統(tǒng)進(jìn)行多維度分析與評(píng)價(jià)。

        猜你喜歡
        卡爾曼濾波神經(jīng)網(wǎng)絡(luò)融合
        村企黨建聯(lián)建融合共贏
        融合菜
        從創(chuàng)新出發(fā),與高考數(shù)列相遇、融合
        《融合》
        神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        基于遞推更新卡爾曼濾波的磁偶極子目標(biāo)跟蹤
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        基于模糊卡爾曼濾波算法的動(dòng)力電池SOC估計(jì)
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于擴(kuò)展卡爾曼濾波的PMSM無(wú)位置傳感器控制
        亚洲第一幕一区二区三区在线观看| 午夜三级网| 欧洲人体一区二区三区| 精品国产免费一区二区久久| 国产香港明星裸体xxxx视频| 日本亚洲色大成网站www久久| 国产精品自产拍在线观看免费| 美腿丝袜中文字幕在线观看| 成人女同av在线观看网站| 国产精品毛片完整版视频| 久久伊人影院| 日本一区二区三区在线观看免费 | 午夜射精日本三级| 亚洲av熟妇高潮30p| 亚洲日本精品一区久久精品| av中文字幕少妇人妻| av免费在线播放一区二区| 欧美性受xxxx黑人猛交| 无码粉嫩虎白一线天在线观看| 极品诱惑一区二区三区| 国产三级av在线精品| 成人国产精品一区二区八戒网| 我把护士日出水了视频90分钟| 五月天久久国产你懂的| 一本色道久久综合亚州精品| 不卡的av网站在线观看| 夫妇交换性三中文字幕 | 狠狠色噜噜狠狠狠777米奇小说| 久久久久亚洲av无码尤物| 日本a在线播放| 国产又大大紧一区二区三区| 国产卡一卡二卡3卡4乱码| 国产精品爽爽va在线观看无码| 亚洲一区二区成人在线视频| 久久一区二区三区久久久| 开心五月激情综合婷婷色| 国产成人8x视频网站入口| 久久亚洲精品一区二区三区| 日韩av无码久久一区二区| 日韩欧美亚洲综合久久影院d3| 精品亚洲视频免费观看网站|