姜長(zhǎng)三,曾 楨,萬(wàn) 靜
(貴州財(cái)經(jīng)大學(xué)信息學(xué)院,貴陽(yáng) 550025)
隨著大數(shù)據(jù)時(shí)代的到來(lái),我們面臨著越來(lái)越多種類、規(guī)模龐大的數(shù)據(jù)[1]。以往,由于技術(shù)和數(shù)據(jù)收集手段的限制,我們只能依靠單一信息源獲取所需信息。隨著現(xiàn)代科學(xué)技術(shù)的不斷創(chuàng)新和信息采集手段的不斷完善,我們能夠從多個(gè)來(lái)源和不同類型的信息源中獲取信息,這使得多源信息融合在實(shí)際應(yīng)用中變得越來(lái)越重要。
多 源 信 息 融 合[2](multi-source information fusion),又稱為多傳感器信息融合,是指將來(lái)自不同來(lái)源、不同類型、不同空間分辨率的多個(gè)信息源進(jìn)行集成和處理,以獲得更全面、更準(zhǔn)確的信息。這些信息源可以是遙感數(shù)據(jù)、社交媒體數(shù)據(jù)、傳感器數(shù)據(jù)等。
多源信息融合提供了比單一信息源更豐富的信息,從而提高對(duì)目標(biāo)的認(rèn)知能力和決策水平,并為科學(xué)研究提供更多的參考。研究多源信息融合不僅可以提高信息的準(zhǔn)確性和可靠性,還可以增強(qiáng)數(shù)據(jù)的利用價(jià)值,提高決策的科學(xué)性和精準(zhǔn)性,并促進(jìn)技術(shù)的創(chuàng)新和發(fā)展。
多源信息融合的功能模型主要關(guān)注信息融合的過(guò)程,包括哪些主要功能和數(shù)據(jù)庫(kù),并說(shuō)明系統(tǒng)各組成部分之間的相互作用過(guò)程。在歷史上,人們提出過(guò)許多種多源信息的融合模型,但其中最受歡迎、也最權(quán)威的是美國(guó)JDL 模型的改進(jìn)版本[3],其模型如圖1 所示。其他的功能模型還包括I/O功能模型[4]、Omnibus模型[5]等。
圖1 JDL多源信息融合功能模型
在信息融合系統(tǒng)中,預(yù)處理是指對(duì)原始數(shù)據(jù)進(jìn)行過(guò)濾和處理,以提高數(shù)據(jù)質(zhì)量并減少噪聲和冗余。目標(biāo)評(píng)估則利用特征提取和目標(biāo)識(shí)別技術(shù),將原始數(shù)據(jù)中的對(duì)象進(jìn)行分類和標(biāo)注,生成已知目標(biāo)庫(kù)。態(tài)勢(shì)評(píng)估將已知目標(biāo)庫(kù)與其他情報(bào)信息相結(jié)合,形成全局視圖,幫助用戶理解當(dāng)前態(tài)勢(shì)和趨勢(shì)。威脅評(píng)估則綜合多源情報(bào)信息,包括敵方意圖、能力、行動(dòng)等信息,對(duì)潛在威脅進(jìn)行評(píng)估和預(yù)測(cè)。過(guò)程優(yōu)化包括自適應(yīng)算法和決策支持系統(tǒng),用以提高信息融合過(guò)程的效率和準(zhǔn)確性。最后,數(shù)據(jù)庫(kù)系統(tǒng)存儲(chǔ)和管理信息融合所需的各種數(shù)據(jù),包括傳感器數(shù)據(jù)、情報(bào)信息、分析結(jié)果等,為信息共享和查詢提供基礎(chǔ)。
多源信息融合通常涉及多個(gè)層次的處理和分析,每個(gè)層次都具有不同的技術(shù)和方法,并且每個(gè)層次的輸出結(jié)果又會(huì)成為下一層次的輸入。通過(guò)逐層分析和處理,可以得到更綜合、全面的情報(bào)圖像,以支持更好地理解和應(yīng)對(duì)現(xiàn)實(shí)世界中的復(fù)雜問(wèn)題。
1.2.1 數(shù)據(jù)層融合
數(shù)據(jù)層融合是多源信息融合中至關(guān)重要的一個(gè)過(guò)程。它涉及將來(lái)自不同源的原始數(shù)據(jù)進(jìn)行整合和轉(zhuǎn)換,以使它們可以在相同的坐標(biāo)系下進(jìn)行比較和集成。其融合過(guò)程如圖2所示。在數(shù)據(jù)層融合的過(guò)程中,需要考慮數(shù)據(jù)的精度、完整性、可靠性等多種因素。這個(gè)過(guò)程的特點(diǎn)包括多樣性、大規(guī)模、時(shí)效性、去冗余性。
圖2 數(shù)據(jù)層融合
數(shù)據(jù)層融合具有許多優(yōu)點(diǎn)。首先,通過(guò)去冗余、去噪、對(duì)齊等技術(shù),它可以提高數(shù)據(jù)質(zhì)量,并更好地反映真實(shí)情況;其次,將多源數(shù)據(jù)進(jìn)行整合和統(tǒng)一格式的轉(zhuǎn)換,以便進(jìn)一步分析和決策,可以提高數(shù)據(jù)價(jià)值;此外,減少數(shù)據(jù)冗余可以提高數(shù)據(jù)可用性和處理效率。
然而,數(shù)據(jù)層融合也存在一些缺點(diǎn)。由于各種原因可能會(huì)出現(xiàn)數(shù)據(jù)缺失的情況,這會(huì)影響到融合結(jié)果的完整性和精度。由于需要處理大量數(shù)據(jù)和復(fù)雜的計(jì)算任務(wù),數(shù)據(jù)層融合需要大量的計(jì)算和存儲(chǔ)資源,處理困難。
1.2.2 特征層融合
特征層融合是一種多源數(shù)據(jù)信息處理方法,通過(guò)提取各種數(shù)據(jù)源的特征信息,并對(duì)其進(jìn)行分析和處理,從而保留足夠的重要信息以期為后期決策分析提供支持。特征層融合有以下優(yōu)點(diǎn):①減少待處理數(shù)據(jù)量:通過(guò)提取原始數(shù)據(jù)信息的特征,特征層融合可以減少待處理的數(shù)據(jù)量,從而大大提高數(shù)據(jù)處理效率和實(shí)時(shí)性;②提高數(shù)據(jù)處理精度:將來(lái)自不同數(shù)據(jù)源的特征信息進(jìn)行融合,可以得到更加全面、豐富的數(shù)據(jù)表示,從而提高數(shù)據(jù)處理精度和準(zhǔn)確性;③支持多樣化數(shù)據(jù)處理需求:特征層融合可以根據(jù)不同的數(shù)據(jù)處理需求,選擇不同的特征提取算法和融合策略,從而滿足各種不同場(chǎng)景下的數(shù)據(jù)處理需求。融合過(guò)程如圖3所示。
圖3 特征層融合
1.2.3 決策層融合
決策層融合是多源信息融合中的一種高層次融合,其目的是將來(lái)自多個(gè)決策器的判決結(jié)果進(jìn)行整合,從而得到更加準(zhǔn)確、可靠的決策結(jié)果。通過(guò)綜合考慮多個(gè)決策器的判決結(jié)果,決策層融合可以降低單個(gè)決策器的誤判率,提高決策的可靠性以及模型的魯棒性。但決策層融合需要將來(lái)自多個(gè)決策器的判決結(jié)果進(jìn)行整合,增加了計(jì)算時(shí)間和存儲(chǔ)空間的需求。融合過(guò)程如圖4所示。
圖4 決策層融合
1.3.1 集中式結(jié)構(gòu)
集中式結(jié)構(gòu)是最簡(jiǎn)單的多源信息融合結(jié)構(gòu)之一,它由一個(gè)中心節(jié)點(diǎn)控制所有傳感器、采集設(shè)備和計(jì)算機(jī)。這個(gè)中心節(jié)點(diǎn)負(fù)責(zé)收集所有原始數(shù)據(jù),并在其上進(jìn)行處理、融合和分析,如圖5所示。集中式結(jié)構(gòu)具有以下特點(diǎn):①系統(tǒng)管理簡(jiǎn)單,易于維護(hù);②數(shù)據(jù)處理效率高,可以對(duì)所有數(shù)據(jù)進(jìn)行實(shí)時(shí)處理;③由于所有數(shù)據(jù)都經(jīng)過(guò)中心節(jié)點(diǎn),因此可以保證數(shù)據(jù)的一致性和完整性。其也存在一些缺點(diǎn):①如中心節(jié)點(diǎn)成為了系統(tǒng)的瓶頸,一旦中心節(jié)點(diǎn)出現(xiàn)故障,整個(gè)系統(tǒng)就會(huì)癱瘓;②由于所有數(shù)據(jù)都要經(jīng)過(guò)中心節(jié)點(diǎn),因此需要大量的帶寬和計(jì)算資源。
圖5 集中式融合結(jié)構(gòu)圖
1.3.2 分布式結(jié)構(gòu)
分布式結(jié)構(gòu)是將多個(gè)節(jié)點(diǎn)分布在不同的地方,每個(gè)節(jié)點(diǎn)都有自己的傳感器和計(jì)算資源,并且可以通過(guò)網(wǎng)絡(luò)進(jìn)行通信和數(shù)據(jù)交換,如圖6所示。分布式結(jié)構(gòu)具有的特點(diǎn)為:①系統(tǒng)具有很高的可靠性,當(dāng)某個(gè)節(jié)點(diǎn)出現(xiàn)故障時(shí),其他節(jié)點(diǎn)可以繼續(xù)工作;②數(shù)據(jù)處理效率高,每個(gè)節(jié)點(diǎn)都可以對(duì)其本地?cái)?shù)據(jù)進(jìn)行實(shí)時(shí)處理;③分布式結(jié)構(gòu)可以根據(jù)需要進(jìn)行擴(kuò)展,可以添加更多的節(jié)點(diǎn)。而分布式結(jié)構(gòu)存在的一些缺點(diǎn)是:①系統(tǒng)的管理比較復(fù)雜,需要對(duì)每個(gè)節(jié)點(diǎn)進(jìn)行單獨(dú)管理和維護(hù);②節(jié)點(diǎn)之間的通信可能會(huì)受到網(wǎng)絡(luò)帶寬和延遲的影響。
圖6 分布式融合結(jié)構(gòu)圖
1.3.3 混合式結(jié)構(gòu)
混合式結(jié)構(gòu)是將集中式結(jié)構(gòu)和分布式結(jié)構(gòu)相結(jié)合,既有中心節(jié)點(diǎn),也有多個(gè)分布式節(jié)點(diǎn)。中心節(jié)點(diǎn)負(fù)責(zé)整個(gè)系統(tǒng)的控制和管理,而分布式節(jié)點(diǎn)則負(fù)責(zé)采集數(shù)據(jù)和進(jìn)行實(shí)時(shí)處理,如圖7所示。混合式結(jié)構(gòu)具有以下特點(diǎn):①同時(shí)具備集中式結(jié)構(gòu)和分布式結(jié)構(gòu)的優(yōu)點(diǎn);②可以靈活配置,根據(jù)不同的需求選擇不同的結(jié)構(gòu);③可以根據(jù)需要對(duì)系統(tǒng)進(jìn)行擴(kuò)展和升級(jí)。但是,混合式結(jié)構(gòu)也存在一些缺點(diǎn):①如系統(tǒng)的管理比較復(fù)雜,需要同時(shí)管理中心節(jié)點(diǎn)和分布式節(jié)點(diǎn);②不同節(jié)點(diǎn)之間的通信可能會(huì)受到網(wǎng)絡(luò)帶寬和延遲的影響。
圖7 混合式融合結(jié)構(gòu)圖
2.1.1 卡爾曼濾波
卡爾曼濾波是一種用于估計(jì)系統(tǒng)狀態(tài)的數(shù)學(xué)方法,其一般應(yīng)用在控制理論、信號(hào)處理和導(dǎo)航等領(lǐng)域[6],而在信息融合領(lǐng)域有著十分重要的應(yīng)用[7]??柭鼮V波器會(huì)綜合利用傳感器測(cè)量值和系統(tǒng)模型來(lái)估計(jì)系統(tǒng)的狀態(tài),并且通過(guò)動(dòng)態(tài)地調(diào)整預(yù)測(cè)和觀測(cè)之間的權(quán)重,能夠有效地抑制噪聲和誤差的影響??柭鼮V波器的核心思想是將系統(tǒng)建模為一個(gè)隨機(jī)過(guò)程,并且在每一次觀測(cè)時(shí)使用貝葉斯定理來(lái)更新對(duì)系統(tǒng)狀態(tài)的估計(jì)。具體來(lái)說(shuō),卡爾曼濾波器包括兩個(gè)步驟:預(yù)測(cè)和更新。
在預(yù)測(cè)步驟中,卡爾曼濾波器會(huì)基于上一時(shí)刻的狀態(tài)估計(jì)和系統(tǒng)模型來(lái)預(yù)測(cè)當(dāng)前時(shí)刻的狀態(tài),并且同時(shí)估計(jì)預(yù)測(cè)的誤差。在更新步驟中,卡爾曼濾波器會(huì)將系統(tǒng)的觀測(cè)值與預(yù)測(cè)值進(jìn)行比較,并且根據(jù)它們之間的差異來(lái)調(diào)整狀態(tài)估計(jì)和誤差估計(jì)。這個(gè)過(guò)程被稱為卡爾曼增益??柭鼮V波器的公式可以表示如下:
預(yù)測(cè)步驟中預(yù)測(cè)狀態(tài)公式為
預(yù)測(cè)誤差協(xié)方差矩陣公式為
在更新步驟中計(jì)算卡爾曼增益公式為
計(jì)算更新?tīng)顟B(tài)公式為
計(jì)算更新誤差協(xié)方差矩陣公式為
其中:A是狀態(tài)轉(zhuǎn)移矩陣,B是外部輸入的控制系數(shù)矩陣,u是外部輸入向量,Q是過(guò)程噪聲的協(xié)方差矩陣,H是觀測(cè)矩陣,R是觀測(cè)噪聲的協(xié)方差矩陣。
卡爾曼濾波器通過(guò)對(duì)觀測(cè)數(shù)據(jù)與系統(tǒng)模型之間的關(guān)系進(jìn)行建模,將多個(gè)來(lái)源的信息進(jìn)行融合,其過(guò)程主要包括以下幾個(gè)步驟:定義系統(tǒng)模型、更新觀測(cè)數(shù)據(jù)、預(yù)測(cè)狀態(tài)、計(jì)算卡爾曼增益和更新?tīng)顟B(tài)。通過(guò)以上步驟,卡爾曼濾波器可以將多個(gè)來(lái)源的信息進(jìn)行融合,得到更準(zhǔn)確的狀態(tài)估計(jì)結(jié)果。
2.1.2 最大似然估計(jì)
最大似然估計(jì)(maximum likelihood estimation,MLE)是一種常用的參數(shù)估計(jì)方法[8],它通過(guò)觀測(cè)到的數(shù)據(jù)來(lái)推斷模型的參數(shù)值,使得在給定模型下這些數(shù)據(jù)出現(xiàn)的概率最大。具體來(lái)說(shuō),最大似然估計(jì)是基于以下假設(shè)進(jìn)行的:觀測(cè)到的數(shù)據(jù)是從一個(gè)已知的分布中獨(dú)立地生成的。在這個(gè)假設(shè)下,最大似然估計(jì)的目標(biāo)是找到使得給定數(shù)據(jù)集出現(xiàn)的概率最大的模型參數(shù)。
在多源信息融合中,我們通常需要將來(lái)自不同傳感器或數(shù)據(jù)源的信息組合起來(lái),以提高整體的準(zhǔn)確性和可信度。最大似然估計(jì)可以幫助我們確定一個(gè)模型參數(shù)的最優(yōu)值,從而使得這個(gè)模型對(duì)多源信息的預(yù)測(cè)更加準(zhǔn)確。例如,在目標(biāo)跟蹤任務(wù)中,我們通常會(huì)使用多個(gè)傳感器同時(shí)觀測(cè)一個(gè)目標(biāo),每個(gè)傳感器都提供了一些關(guān)于目標(biāo)位置、速度等信息的觀測(cè)值。在這種情況下,最大似然估計(jì)可以被用來(lái)確定目標(biāo)的真實(shí)狀態(tài),即位置和速度。我們可以將所有傳感器提供的觀測(cè)值作為輸入,構(gòu)建一個(gè)概率模型,然后通過(guò)最大化這個(gè)模型的似然函數(shù)來(lái)確定目標(biāo)狀態(tài)的最優(yōu)值。
2.1.3 最小二乘法
最小二乘法是一種數(shù)學(xué)優(yōu)化算法,用于尋找一組數(shù)據(jù)的最佳擬合曲線[9]。其基本思想是找到一條直線或曲線,使得該直線或曲線與所有數(shù)據(jù)點(diǎn)的誤差平方和最小。具體而言,假設(shè)有n個(gè)數(shù)據(jù)點(diǎn){ }(x1,y1),(x2,y2),…,(xn,yn) ,要求一個(gè)函數(shù)f(x),使得f(xi)≈yi,并且所有數(shù)據(jù)點(diǎn)的誤差平方和最小。則可以通過(guò)最小二乘法得到:
其中:a0,a1,a2,…,ak為待求參數(shù)。然后可以利用這些參數(shù)來(lái)計(jì)算每個(gè)數(shù)據(jù)點(diǎn)與擬合曲線的差距,即誤差。最小二乘法的目標(biāo)就是找到一組參數(shù),使得所有數(shù)據(jù)點(diǎn)的誤差平方和最小。
在多源信息融合中,最小二乘法可以用于數(shù)據(jù)模型的擬合與參數(shù)估計(jì)。首先,不同傳感器采集到的數(shù)據(jù)可能具有不同的噪聲水平、采樣率和分辨率等特征。因此需要對(duì)這些數(shù)據(jù)進(jìn)行預(yù)處理和歸一化。然后,針對(duì)不同的數(shù)據(jù)模型,可以使用最小二乘法進(jìn)行擬合。例如,在目標(biāo)追蹤任務(wù)中,可以利用多個(gè)傳感器獲取的目標(biāo)位置信息,擬合出目標(biāo)的運(yùn)動(dòng)軌跡。在該問(wèn)題中,最小二乘法可以用來(lái)求解目標(biāo)運(yùn)動(dòng)方程的系數(shù)。
2.2.1 貝葉斯推理
貝葉斯推理起源于18 世紀(jì)英國(guó)數(shù)學(xué)家貝葉斯的研究工作。它是一種基于貝葉斯定理的推理方法,它可以通過(guò)觀察到的數(shù)據(jù)來(lái)更新我們對(duì)未知參數(shù)的信念。在貝葉斯推理中,我們首先假設(shè)一個(gè)先驗(yàn)概率分布來(lái)表示我們對(duì)未知參數(shù)的初始信念,然后根據(jù)觀測(cè)到的數(shù)據(jù)來(lái)計(jì)算出后驗(yàn)概率分布,表示在考慮了數(shù)據(jù)之后對(duì)未知參數(shù)的新的信念。
在信息融合中,貝葉斯推理可以用來(lái)處理不同來(lái)源、不同類型、不同精度的信息,并將不確定性考慮在內(nèi)。具體來(lái)說(shuō),貝葉斯推理將先驗(yàn)概率和觀測(cè)數(shù)據(jù)相結(jié)合計(jì)算后驗(yàn)概率,從而得到更加全面和可靠的結(jié)果。貝葉斯推理在信息融合中的應(yīng)用也十分廣泛,具體如下:
Massignan 等[10]基于貝葉斯推理的方法,研究在配電系統(tǒng)狀態(tài)估計(jì)中信息融合的問(wèn)題。文中提出了一種基于貝葉斯推理的信息融合框架,用于聯(lián)合處理來(lái)自不同傳感器的數(shù)據(jù)。該框架將不同傳感器的觀測(cè)數(shù)據(jù)轉(zhuǎn)化為概率密度函數(shù),并利用貝葉斯推理方法進(jìn)行聯(lián)合估計(jì),從而獲得更準(zhǔn)確可靠的狀態(tài)估計(jì)結(jié)果。這種方法可以將不確定性和誤差納入考慮范圍,并能夠提高對(duì)分布式估計(jì)的可信度。Zhang 等[11]使用貝葉斯推斷來(lái)建立傳感器獲得信息之間的聯(lián)系,并根據(jù)不同傳感器獲得信息的可靠性進(jìn)行權(quán)值分配,提高了船舶目標(biāo)識(shí)別的準(zhǔn)確性。Cam?es 等[12]提出了一種基于貝葉斯公式的狀態(tài)估計(jì)框架,該框架可以集成來(lái)自不同來(lái)源的信息,并生成關(guān)于當(dāng)前狀態(tài)的最優(yōu)估計(jì)。Chen 等[13]提出了一種基于貝葉斯框架的多模態(tài)測(cè)量信息融合方法,它將來(lái)自不同非破壞性檢測(cè)(NDT)技術(shù)的測(cè)量結(jié)果視為條件隨機(jī)變量,并利用貝葉斯公式根據(jù)這些條件隨機(jī)變量計(jì)算待估計(jì)機(jī)械性能的后驗(yàn)概率分布。實(shí)驗(yàn)表明該方法顯著提高機(jī)械性能概率估計(jì)的準(zhǔn)確度和可靠性,從而為NDT 領(lǐng)域的機(jī)械性能評(píng)估提供了一種新的思路和方法。
2.2.2 D-S證據(jù)理論
D-S 證據(jù)理論是一種用于處理不確定性信息的數(shù)學(xué)理論,它可以幫助我們?cè)诿鎸?duì)不完整、模糊或不可靠的數(shù)據(jù)時(shí)做出決策。D-S 證據(jù)理論由Dempster 和Shafer 在上世紀(jì)60 年代提出,是一種廣泛應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、決策分析等領(lǐng)域的理論[14]。在D-S 證據(jù)理論中,我們將信息表示為“證據(jù)”,每個(gè)證據(jù)都有一個(gè)信任度,表示這個(gè)證據(jù)被認(rèn)為是可靠的程度。通過(guò)組合不同的證據(jù),我們可以得到更精確的結(jié)論,這種組合方式使用的是Dempster-Shafer 合成規(guī)則,它允許我們將不同的證據(jù)進(jìn)行組合,從而得到一個(gè)綜合的結(jié)論。在多源信息融合中,不同來(lái)源的信息往往存在一定程度的不確定性和矛盾性。使用D-S 證據(jù)理論,我們可以將這些不同來(lái)源的證據(jù)轉(zhuǎn)化為可信度函數(shù),然后利用Dempster-Shafer 合成規(guī)則將它們進(jìn)行組合,得到一個(gè)更為準(zhǔn)確的結(jié)論,一些相關(guān)應(yīng)用如下:Li 等[15]使用D-S 證據(jù)理論和多源信息融合來(lái)分析主機(jī)安全的方法。該方法使用多個(gè)傳感器收集的來(lái)自不同數(shù)據(jù)源的安全信息,將其進(jìn)行融合并基于D-S 證據(jù)理論進(jìn)行分析,提高了主機(jī)安全性的識(shí)別和響應(yīng)能力。Liu 等[16]利用改進(jìn)的證據(jù)理論結(jié)合不確定性因素來(lái)進(jìn)行證據(jù)融合,在故障診斷上表現(xiàn)出更高的準(zhǔn)確性和魯棒性。Zeng 等[17]針對(duì)傳統(tǒng)的D-S 證據(jù)理論存在易受到信任度沖突和證據(jù)互斥現(xiàn)象的影響的問(wèn)題,提出了一種新的改進(jìn)D-S證據(jù)理論,通過(guò)引入BJS散度來(lái)處理這些問(wèn)題。在該方法中,首先對(duì)從多個(gè)來(lái)源收集到的信息進(jìn)行處理,計(jì)算每個(gè)來(lái)源的可信度和證據(jù)的權(quán)重。然后,利用BJS散度將不同來(lái)源的信息進(jìn)行融合,得到最終的決策或推斷結(jié)果。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效地處理信任度沖突和證據(jù)互斥問(wèn)題,在多源信息融合中具有更好的性能。Lin 等[18]考慮到不同傳感器之間的相關(guān)性和權(quán)重,引入了改進(jìn)的證據(jù)權(quán)重算法,通過(guò)證據(jù)融合的方式將多個(gè)傳感器的證據(jù)進(jìn)行整合,計(jì)算出最終的置信度值。該方法能有效地處理多傳感器信息融合過(guò)程中的不確定性問(wèn)題,并且能夠提高診斷的精確度和可靠性。
2.2.3 模糊集理論
模糊集理論是一種用于處理不確定性信息的數(shù)學(xué)理論,它可以幫助我們?cè)诿鎸?duì)模糊、不完整或不準(zhǔn)確的數(shù)據(jù)時(shí)做出決策。模糊集理論由Zadeh[19]于上世紀(jì)60 年代提出,是一種廣泛應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、控制系統(tǒng)等領(lǐng)域的理論。
在模糊集理論中,我們將信息表示為“元素”,每個(gè)元素都有一個(gè)隸屬度,表示這個(gè)元素屬于這個(gè)集合的程度。通過(guò)定義隸屬度函數(shù),我們可以將不同程度的不確定性信息表示為一個(gè)模糊集合,從而得到更精確的結(jié)論。與傳統(tǒng)的集合不同,每個(gè)元素可以同時(shí)屬于多個(gè)模糊集合,從而更好地反映現(xiàn)實(shí)世界中的復(fù)雜性和不確定性。在多源信息融合中,不同來(lái)源的信息往往存在一定程度的模糊性和不確定性。使用模糊集理論,我們可以將這些不同來(lái)源的信息轉(zhuǎn)化為模糊集合,然后通過(guò)模糊邏輯運(yùn)算將它們進(jìn)行組合,得到一個(gè)更為準(zhǔn)確的結(jié)論,有關(guān)應(yīng)用如下:
Yang 等[20]提出了一種基于模糊推理的感知信息融合方法。這種方法利用模糊邏輯來(lái)表示不確定和不精確的傳感器數(shù)據(jù),并將它們組合起來(lái),生成更準(zhǔn)確、可靠和全面的情境或現(xiàn)象評(píng)估結(jié)果。Zhou 等[21]基于模糊系統(tǒng)理論,提出多傳感器模糊信息融合算法在工業(yè)安全監(jiān)控系統(tǒng)中的應(yīng)用。該算法可以將來(lái)自多個(gè)傳感器的信息進(jìn)行模糊化和優(yōu)化,從而提高工業(yè)生產(chǎn)過(guò)程中的安全性和可靠性。Yuan 等[22]針對(duì)在管理領(lǐng)域的實(shí)際應(yīng)用中存在的主觀傾向性、決策依賴性和知識(shí)源偏差等問(wèn)題,提出了一種基于模糊集理論的知識(shí)融合方法,利用證據(jù)合成和決策規(guī)則獲得知識(shí)融合結(jié)果,彌補(bǔ)了知識(shí)融合過(guò)程中的缺陷并解決知識(shí)推理中的不確定性問(wèn)題。Miao 等[23]在變電站火災(zāi)預(yù)警中,將模糊集合理論應(yīng)用于融合預(yù)測(cè)的火災(zāi)概率,以得到最佳的火災(zāi)預(yù)防和控制決策。
2.3.1 支持向量機(jī)
支持向量機(jī)(support vector machine,SVM)[24]是一種機(jī)器學(xué)習(xí)算法,可以用于分類、回歸和異常檢測(cè)等任務(wù)。它的核心思想是找到一個(gè)最優(yōu)的超平面,將不同類別的數(shù)據(jù)分開(kāi),并且使得這個(gè)超平面離數(shù)據(jù)點(diǎn)的距離最大化。在信息融合中,SVM 可以用于多源數(shù)據(jù)的分類和特征融合等方面,具體應(yīng)用如下:
張劍飛等[25]在不同類別的樣本數(shù)量存在嚴(yán)重不平衡的情況下,提出了一種基于SVM 的不平衡數(shù)據(jù)分類方法。該方法相比于其他的不平衡數(shù)據(jù)分類方法,在處理不平衡數(shù)據(jù)的情況下具有較好的分類效果和較高的準(zhǔn)確率。周偉芳[26]提出了一種基于SVM的生物特征融合技術(shù),該技術(shù)能夠有效提高身份識(shí)別準(zhǔn)確率和魯棒性。Wang等[27]通過(guò)將多個(gè)SVM 分類器的輸出結(jié)果進(jìn)行加權(quán)融合來(lái)實(shí)現(xiàn)泄漏檢測(cè),獲得了更好的性能和準(zhǔn)確度。Pan等[28]開(kāi)發(fā)了一種新穎的多分類器信息融合方法,將概率支持向量機(jī)(SVM)和改進(jìn)的Dempster-Shafer(D-S)證據(jù)理論相結(jié)合,以支持不確定性下的風(fēng)險(xiǎn)分析。Peng 等[29]提出了一個(gè)帶有概率輸出的多分類支持向量機(jī)(SVM)模型,提高故障診斷準(zhǔn)確性。
2.3.2 遺傳算法
遺傳算法(genetic algorithm)[30]是一種基于生物進(jìn)化原理的隨機(jī)搜索和優(yōu)化方法。它模擬了自然界中的遺傳和進(jìn)化過(guò)程,通過(guò)對(duì)群體中個(gè)體的優(yōu)勝劣汰和交叉、變異等操作來(lái)產(chǎn)生新的個(gè)體,并不斷迭代尋找最優(yōu)解。遺傳算法在多源信息融合中的應(yīng)用主要是通過(guò)結(jié)合多種信息源來(lái)提高決策系統(tǒng)的精度和魯棒性。
Thakkar 等[31]在股票價(jià)格和趨勢(shì)預(yù)測(cè)中使用遺傳算法對(duì)不同的特征進(jìn)行優(yōu)化選擇,提高了特征的相關(guān)性和減少冗余信息。Kande等[32]提出了一種基于遺傳算法的優(yōu)化框架,并結(jié)合系統(tǒng)動(dòng)力學(xué)建模、機(jī)器學(xué)習(xí)和群智能優(yōu)化算法等技術(shù)手段,實(shí)現(xiàn)了對(duì)異構(gòu)多資產(chǎn)集合的智能調(diào)度管理。Liang 等[33]提出了一種基于遺傳算法的最優(yōu)數(shù)據(jù)融合方法,有效地處理給定來(lái)源高度沖突的概率融合問(wèn)題。Guo 等[34]提出了一種基于遺傳算法的多源交通信息采集組合優(yōu)化模式,在實(shí)現(xiàn)多源交通信息采集和組合的優(yōu)化過(guò)程中更加準(zhǔn)確,并具有更好的信息融合程度。Sun等[35]提出了一種改進(jìn)遺傳算法的多傳感器數(shù)據(jù)融合算法,顯著提高數(shù)據(jù)融合的精度和穩(wěn)定性,且具有更短的執(zhí)行時(shí)間。
2.3.3 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是一種被設(shè)計(jì)來(lái)模擬人類神經(jīng)系統(tǒng)中信息處理方式的計(jì)算機(jī)程序。它由許多稱為“神經(jīng)元”的單元組成,這些神經(jīng)元通過(guò)連接形成了復(fù)雜的網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)可以通過(guò)學(xué)習(xí)來(lái)識(shí)別模式和關(guān)系,并用于分類、回歸、聚類等任務(wù)。神經(jīng)網(wǎng)絡(luò)在多源信息融合中有廣泛的應(yīng)用,可以通過(guò)將不同類型的數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)來(lái)獲得更準(zhǔn)確、更全面的信息。
神經(jīng)網(wǎng)絡(luò)可以將多個(gè)傳感器捕捉到的數(shù)據(jù)進(jìn)行融合,從而實(shí)現(xiàn)更準(zhǔn)確、更全面的環(huán)境感知和預(yù)測(cè)。例如,在智能交通領(lǐng)域中,可以將車(chē)輛傳感器、路況傳感器和天氣傳感器捕捉到的數(shù)據(jù)進(jìn)行融合,從而預(yù)測(cè)交通狀況和制定優(yōu)化路徑。神經(jīng)網(wǎng)絡(luò)可以將來(lái)自不同模態(tài)的數(shù)據(jù)進(jìn)行融合,如圖像、聲音和運(yùn)動(dòng)等,從而實(shí)現(xiàn)更準(zhǔn)確、更全面的識(shí)別和分類。例如,在人機(jī)交互系統(tǒng)中,可以將語(yǔ)音指令、手勢(shì)控制和眼部追蹤等多種輸入方式進(jìn)行融合,從而實(shí)現(xiàn)更自然、更智能的交互體驗(yàn)。神經(jīng)網(wǎng)絡(luò)可以將來(lái)自多個(gè)數(shù)據(jù)庫(kù)的信息進(jìn)行融合,從而實(shí)現(xiàn)更全面、更準(zhǔn)確的數(shù)據(jù)分析和挖掘。例如,在企業(yè)管理中,可以將不同部門(mén)的數(shù)據(jù)進(jìn)行融合,從而幫助企業(yè)制定更科學(xué)、更精準(zhǔn)的營(yíng)銷策略。其相關(guān)研究進(jìn)展如下。
Guo 等[36]為了提高GNSS-R 風(fēng)速檢測(cè)的精度,提出了一種基于統(tǒng)計(jì)修正卷積神經(jīng)網(wǎng)絡(luò)(statistically modified convolutional neural network,SMCNN)的信息融合方法,通過(guò)將不同極化方向、不同衛(wèi)星信號(hào)的反射信號(hào)進(jìn)行融合,并采用統(tǒng)計(jì)修正策略,進(jìn)一步提高了風(fēng)速檢測(cè)的準(zhǔn)確性和魯棒性。Passos 等[37]提出了一種基于規(guī)范相關(guān)圖神經(jīng)網(wǎng)絡(luò)的多模態(tài)音視頻信息融合方法,用于實(shí)現(xiàn)能源高效的語(yǔ)音增強(qiáng)。它利用了多個(gè)傳感器捕捉的音頻和視頻數(shù)據(jù),并使用圖神經(jīng)網(wǎng)絡(luò)將它們?nèi)诤显谝黄饋?lái)進(jìn)行語(yǔ)音增強(qiáng)。通過(guò)這種方式,可以顯著降低計(jì)算資源和能源的消耗,并提高增強(qiáng)效果。Gao等[38]提出了一種基于自適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的信息融合方法,用于面部表情識(shí)別,在全連接層獲取不同的特征信息進(jìn)行信息融合,在面部表情識(shí)別方面具有更高的識(shí)別精度。
2.3.4 粗糙集理論
粗糙集理論是一種基于不確定性和近似推理的數(shù)學(xué)方法,旨在處理具有模糊或不完整信息的問(wèn)題。它最初由波蘭科學(xué)家Pawlak[39]在1982 年提出,并且在計(jì)算機(jī)科學(xué)、人工智能、模式識(shí)別等領(lǐng)域得到廣泛應(yīng)用。
粗糙集理論的核心思想是利用粗糙集來(lái)刻畫(huà)近似概念和近似關(guān)系。其中,一個(gè)粗糙集是指包含了所有具有相同屬性值的對(duì)象的集合。這些對(duì)象可能由于某些未知原因而無(wú)法歸入嚴(yán)格意義上的某個(gè)類別中,但它們之間仍然存在著某些共性的特征。通過(guò)比較不同屬性值之間的差異,可以找到相似的對(duì)象,并將它們分為同一組。粗糙集理論的優(yōu)點(diǎn)在于它可以處理多源信息的融合問(wèn)題,同時(shí)也可以保留信息的不確定性和模糊性。它已經(jīng)被成功地應(yīng)用于數(shù)據(jù)挖掘、決策分析、模式識(shí)別等領(lǐng)域。其相關(guān)應(yīng)用研究如下。
Cao等[40]提出了一種利用粗糙集理論和改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的信息聚合算法,以在保持?jǐn)?shù)據(jù)保真度和機(jī)密性的同時(shí),緩解無(wú)線傳感器網(wǎng)絡(luò)(WSN)中的能量消耗問(wèn)題。Li 等[41]提出了一種將粗糙集理論(RST)與改進(jìn)的Dempster-Shafer(D-S)證據(jù)理論相結(jié)合的信息融合方法,用于識(shí)別不同的系統(tǒng)操作狀態(tài)。在智能故障診斷中,Yang 等[42]通過(guò)將粗糙集理論與證據(jù)理論相結(jié)合,提高了故障診斷的準(zhǔn)確性。Gang等[43]提出了一種基于粗糙集理論和BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)融合方法。通過(guò)采用粗糙集理論對(duì)輸入信息進(jìn)行簡(jiǎn)化和消除冗余信息,從而減小了BP 神經(jīng)網(wǎng)絡(luò)的規(guī)模,提高了融合系統(tǒng)的識(shí)別率,進(jìn)而提高了整個(gè)融合系統(tǒng)的效率。
多源信息融合作為一個(gè)重要的領(lǐng)域,正在快速發(fā)展和壯大。在過(guò)去幾十年中,多源信息融合已經(jīng)得到了廣泛的研究和應(yīng)用,涉及到很多不同的領(lǐng)域,如軍事、情報(bào)、醫(yī)療、安全等。然而,這一領(lǐng)域還存在著很多挑戰(zhàn)和問(wèn)題,如數(shù)據(jù)質(zhì)量不穩(wěn)定、信息處理效率低下、隱私和安全保護(hù)等。
未來(lái)的多源信息融合技術(shù)需要繼續(xù)深入研究和探索,以提高信息融合的精度、效率和可靠性。其發(fā)展趨勢(shì)可以包括以下幾個(gè)方面:
(1)多模態(tài)數(shù)據(jù)融合:隨著傳感器技術(shù)、圖像識(shí)別技術(shù)和語(yǔ)音識(shí)別技術(shù)的發(fā)展,多種類型的數(shù)據(jù)和信息被廣泛采集和應(yīng)用。因此,將多種類型的數(shù)據(jù)進(jìn)行整合和分析,可以提高信息處理效率和精度。
(2)多層次信息融合:多源信息往往存在于不同的層次之中,如底層數(shù)據(jù)、中間知識(shí)、高層推理等。因此,將這些不同層次的信息進(jìn)行整合和分析,可以更好地發(fā)掘數(shù)據(jù)的潛在價(jià)值。
(3)實(shí)時(shí)信息融合:傳統(tǒng)的信息融合方法往往需要大量的計(jì)算資源和時(shí)間,難以滿足實(shí)時(shí)應(yīng)用的需求。而新興的實(shí)時(shí)信息融合技術(shù)則能夠快速響應(yīng)實(shí)時(shí)信息需求,并及時(shí)更新和傳遞數(shù)據(jù)。
(4)人工智能應(yīng)用:隨著人工智能技術(shù)的發(fā)展,人工智能在多源信息融合中的應(yīng)用也越來(lái)越廣泛。通過(guò)人工智能算法和模型,可以自動(dòng)化地對(duì)多源信息進(jìn)行分析和演繹,提高信息處理效率和精度。
(5)安全與隱私保護(hù):多源信息融合涉及到大量的個(gè)人和機(jī)密信息,因此在信息融合過(guò)程中需要注重安全和隱私保護(hù)。未來(lái)的多源信息融合技術(shù)應(yīng)該具備更加完善的安全和隱私保護(hù)措施,以確保數(shù)據(jù)的安全和合法性。