,
隨著數(shù)據(jù)采集、處理、存儲(chǔ)技術(shù)的發(fā)展,收集數(shù)據(jù)已經(jīng)成為一種自動(dòng)化的行為。數(shù)據(jù)的采集沒(méi)有明確目的,并且數(shù)據(jù)體量巨大、類(lèi)型繁雜,經(jīng)過(guò)長(zhǎng)期積累就形成了“大數(shù)據(jù)”。這些大數(shù)據(jù)通常都是隨著事物運(yùn)行自動(dòng)采集和存儲(chǔ)的,其中隱藏的有用信息并非顯而易見(jiàn),需要研究人員去挖掘和分析數(shù)據(jù)特征和內(nèi)涵,發(fā)現(xiàn)事物運(yùn)行的規(guī)律,為準(zhǔn)確判斷和預(yù)測(cè)事物發(fā)展趨勢(shì)提供依據(jù)。因此,大數(shù)據(jù)及數(shù)據(jù)挖掘技術(shù)能夠幫助我們?cè)诓灰着迨挛镞\(yùn)行原理的場(chǎng)景下,從大量的歷史數(shù)據(jù)中總結(jié)出規(guī)律和經(jīng)驗(yàn),讓計(jì)算機(jī)或裝備能夠基于此進(jìn)行自主判斷,從而獲得智能。
“大數(shù)據(jù)”是1980年由托夫勒在其所著的《第三次浪潮》中首先提出的。經(jīng)過(guò)30多年的發(fā)展,它已經(jīng)在生物學(xué)、物理學(xué)、金融學(xué)、軍事學(xué)等學(xué)科中得到廣泛應(yīng)用。近年來(lái),人工智能技術(shù)發(fā)展迅猛,大數(shù)據(jù)作為其底層技術(shù),再一次迎來(lái)了發(fā)展高潮[1]。2011年,麥肯錫全球研究給出的“大數(shù)據(jù)”的定義:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,主要具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類(lèi)型和價(jià)值密度低等特征[2]。
起初的數(shù)據(jù)都是針對(duì)特定的目的采集的,但隨著數(shù)據(jù)的加速積累,有效信息經(jīng)常會(huì)淹沒(méi)在浩如煙海的數(shù)據(jù)中。由于數(shù)據(jù)的低價(jià)值密度屬性和對(duì)信息存儲(chǔ)空間的要求越來(lái)越大,大數(shù)據(jù)一度為我們帶來(lái)了很大的困擾。近年來(lái)興起的機(jī)器學(xué)習(xí)技術(shù)為人們挖掘大數(shù)據(jù)信息提供了有效的手段,使發(fā)現(xiàn)數(shù)據(jù)相關(guān)性、規(guī)律性成為可能,在此基礎(chǔ)上發(fā)展出的預(yù)測(cè)能力是大數(shù)據(jù)的真正價(jià)值之所在。
大數(shù)據(jù)中包含的信息類(lèi)型多樣、來(lái)源廣泛。如對(duì)一種裝備的使用,我們通過(guò)裝備管理、油料保障、裝備維修等部門(mén)都可能獲得其信息。這些信息相互聯(lián)系、互為佐證,能夠完善我們對(duì)事物的多方面認(rèn)知,是我們做決策時(shí)的重要依據(jù)。將這些數(shù)據(jù)結(jié)構(gòu)化、代碼化,讓機(jī)器去學(xué)習(xí)、去發(fā)現(xiàn)事物之間的相關(guān)關(guān)系,從而達(dá)到預(yù)測(cè)的目的,便形成了當(dāng)前的熱門(mén)技術(shù)——人工智能。可以說(shuō),基于大數(shù)據(jù)的人工智能是目前為止大數(shù)據(jù)最有前途的應(yīng)用之一,它必將為科技發(fā)展、社會(huì)進(jìn)步帶來(lái)更加深刻的變革。
以往,我們一直試圖模擬人腦的思考模式實(shí)現(xiàn)人工智能,以期基于對(duì)事物本質(zhì)的了解進(jìn)行預(yù)測(cè),然而這方面的理論很難突破。進(jìn)入大數(shù)據(jù)時(shí)代,我們可以通過(guò)對(duì)呈現(xiàn)出的數(shù)據(jù)進(jìn)行分析,去發(fā)現(xiàn)各種現(xiàn)象的相關(guān)關(guān)系,并據(jù)此建立模型進(jìn)行預(yù)測(cè),其核心就是變智能問(wèn)題為數(shù)據(jù)問(wèn)題?;诖髷?shù)據(jù)的人工智能的實(shí)現(xiàn)過(guò)程如圖1所示。
圖1 基于大數(shù)據(jù)的人工智能的實(shí)現(xiàn)過(guò)程
統(tǒng)計(jì)學(xué)又稱(chēng)為數(shù)理統(tǒng)計(jì),是在概率論基礎(chǔ)上,收集、處理和分析數(shù)據(jù),找到數(shù)據(jù)內(nèi)在的關(guān)聯(lián)性和規(guī)律性。根據(jù)契比雪夫不等式:
我們知道,n(也就是樣本量)越大,則預(yù)測(cè)得越準(zhǔn)確;當(dāng)n趨于無(wú)窮大,即覆蓋全部樣本的時(shí)候,預(yù)測(cè)結(jié)果完全準(zhǔn)確。
當(dāng)今的大數(shù)據(jù)潮流使我們能夠輕易獲得海量的數(shù)據(jù),雖然全面但會(huì)有很多冗余,呈現(xiàn)“一方面數(shù)據(jù)很豐富,另一方面有用信息又很匱乏”的現(xiàn)象。統(tǒng)計(jì)學(xué)的意義體現(xiàn)在對(duì)于具有價(jià)值的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化的處理,即在樣本幾乎等于總體的情況下,選取具有代表性的數(shù)據(jù),去冗分類(lèi),去粗取精,科學(xué)總結(jié)并發(fā)現(xiàn)其中蘊(yùn)藏的規(guī)律和模式,并結(jié)合源源不斷的動(dòng)態(tài)數(shù)據(jù)去預(yù)測(cè)事物未來(lái)的發(fā)展趨勢(shì)。但是對(duì)于復(fù)雜系統(tǒng)的運(yùn)行預(yù)測(cè),是非常困難的。因?yàn)槊總€(gè)現(xiàn)象的影響因素極多,假如出現(xiàn)一個(gè)故障,需在成百上千的因素中找到主要原因。因此,發(fā)展出許多基于高維、大數(shù)據(jù)的統(tǒng)計(jì)方法,如包括CURE算法、ROCK算法、CHAMELEON算法等的層次聚類(lèi)算法;包括DBSCAN算法、DENCLUE算法等的分割聚類(lèi)算法;包括概率聚類(lèi)算法、K-Means算法、SVM算法、主成分分析算法等的基于平方誤差的迭代重分配聚類(lèi)算法[3],都為從大數(shù)據(jù)中去粗取精提供了手段。
數(shù)據(jù)的作用自古有之,而到近年來(lái)才發(fā)揮出巨大作用。其原因首先是積累數(shù)據(jù)所需時(shí)間太長(zhǎng),其次是有效信息與數(shù)據(jù)之間通常是間接關(guān)系,需要通過(guò)不同數(shù)據(jù)之間的相關(guān)性才能體現(xiàn)出來(lái)。之前要想了解事物運(yùn)行的規(guī)律一直依賴(lài)其內(nèi)在的因果關(guān)系,如果找不出確定的因果關(guān)系,則無(wú)法進(jìn)行推測(cè)。并且,事物內(nèi)部運(yùn)行往往錯(cuò)綜復(fù)雜,造成一個(gè)事件的原因通常不是顯而易見(jiàn),尤其是復(fù)雜系統(tǒng)的運(yùn)行機(jī)制就像一個(gè)黑箱,我們很難把握其原理,只能通過(guò)觀(guān)察到的現(xiàn)象進(jìn)行猜測(cè)。進(jìn)入大數(shù)據(jù)時(shí)代,我們可以采用機(jī)器學(xué)習(xí)的方法通過(guò)分析數(shù)據(jù)的相關(guān)性,從以往的數(shù)據(jù)中找出各種現(xiàn)象的相關(guān)關(guān)系,這對(duì)于我們?cè)跓o(wú)法摸清事物運(yùn)行原理的情況下,了解事物的運(yùn)行具有很強(qiáng)的現(xiàn)實(shí)意義。將這些相關(guān)關(guān)系進(jìn)行總結(jié)歸納,就可以形成事物的運(yùn)行規(guī)律,這將作為先驗(yàn)經(jīng)驗(yàn)存儲(chǔ)起來(lái)用于構(gòu)建預(yù)測(cè)模型。
目前的機(jī)器學(xué)習(xí)算法主要分為監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)、深度學(xué)習(xí)、寬度學(xué)習(xí)等等,都是在有限的數(shù)據(jù)樣本上發(fā)掘盡可能多的數(shù)據(jù)相關(guān)性,找到人們直觀(guān)上不易發(fā)現(xiàn)的潛在規(guī)律[2-3]。
經(jīng)過(guò)以上對(duì)大數(shù)據(jù)的處理,已經(jīng)在龐雜的數(shù)據(jù)中提取了許多有用、可靠的先驗(yàn)數(shù)據(jù),這為擬合數(shù)學(xué)模型提供了條件?;诖髷?shù)據(jù)去擬合數(shù)學(xué)模型和模型參數(shù)的方法得益于計(jì)算機(jī)技術(shù)的進(jìn)步。盡管在一開(kāi)始數(shù)據(jù)量不足、計(jì)算能力不夠時(shí),顯得有點(diǎn)粗糙,但是隨著時(shí)間推移計(jì)算機(jī)的計(jì)算能力、對(duì)數(shù)據(jù)的存儲(chǔ)和處理能力呈指數(shù)增長(zhǎng),如摩爾定律所顯示,當(dāng)價(jià)格不變時(shí),集成電路上可容納的元器件的數(shù)目,約每隔18~24個(gè)月便會(huì)增加一倍,性能也將提升一倍。因此,這種由數(shù)據(jù)驅(qū)動(dòng)模型的方法將越來(lái)越準(zhǔn)確。
目前,各行各業(yè)都在爭(zhēng)相發(fā)展人工智能技術(shù),并取得了很大的經(jīng)濟(jì)利益和社會(huì)價(jià)值。我們?cè)谲娛聭?yīng)用中也應(yīng)借助先進(jìn)技術(shù),提高軍事理論、軍事裝備、管理體制的現(xiàn)代化、智能化水平。
大數(shù)據(jù)、人工智能技術(shù)的進(jìn)步和應(yīng)用必將催生出新的作戰(zhàn)理論、智能化的裝備,并對(duì)現(xiàn)代戰(zhàn)爭(zhēng)形式、戰(zhàn)場(chǎng)環(huán)境產(chǎn)生深刻的影響。在可以預(yù)見(jiàn)的未來(lái),隨著人工智能技術(shù)進(jìn)入軍事領(lǐng)域,裝備的自動(dòng)化水平和軍事決策效率將顯著提高,人類(lèi)在戰(zhàn)爭(zhēng)中將由前臺(tái)轉(zhuǎn)向幕后,戰(zhàn)爭(zhēng)形態(tài)可能發(fā)展為人類(lèi)設(shè)計(jì)戰(zhàn)爭(zhēng),智能裝備執(zhí)行作戰(zhàn)任務(wù),人與智能裝備互相輔助完成任務(wù)。智能化是當(dāng)前人工智能技術(shù)發(fā)展的大勢(shì)所趨,將為國(guó)防事業(yè)帶來(lái)極大的經(jīng)濟(jì)和軍事效益[4]。
裝備管理工作直接關(guān)系到裝備的完好率和作戰(zhàn)效能,涉及裝備的采購(gòu)、入庫(kù)、領(lǐng)用、使用、維修、報(bào)廢等多個(gè)環(huán)節(jié),加上未來(lái)裝備日趨復(fù)雜,對(duì)裝備進(jìn)行精益管理是非常困難的,且耗時(shí)費(fèi)力。大數(shù)據(jù)和人工智能技術(shù)能夠?yàn)楦纳蒲b備管理水平、降低管理成本提供有效的解決方案。未來(lái)隨著智能裝備投入使用,其自動(dòng)化的信息采集技術(shù)能夠采集其自身方面的信息和其他非智能裝備的信息,從而實(shí)現(xiàn)對(duì)裝備的動(dòng)態(tài)監(jiān)控,使管理人員能夠及時(shí)、準(zhǔn)確地掌握所有裝備的使用情況和狀態(tài)[5]。其具體應(yīng)用有以下3方面。
一是裝備的全壽命智能化管理。每個(gè)智能裝備在全壽命周期中會(huì)產(chǎn)生大量的數(shù)據(jù),再綜合其他智能裝備產(chǎn)生的數(shù)據(jù),應(yīng)用機(jī)器學(xué)習(xí)算法分析這些數(shù)據(jù)挖掘出裝備管理和使用中的各種潛在規(guī)律,可用于指導(dǎo)其他裝備的全壽命管理。二是實(shí)時(shí)動(dòng)態(tài)監(jiān)管。智能裝備的信息采集技術(shù)可以實(shí)時(shí)監(jiān)控查詢(xún)裝備數(shù)量、使用情況等,便于維護(hù)補(bǔ)充,使裝備時(shí)刻保持最佳作戰(zhàn)狀態(tài)。三是精細(xì)化維護(hù)保養(yǎng)。裝備可實(shí)現(xiàn)智能化的日常檢查,根據(jù)大數(shù)據(jù)分析結(jié)果制定保養(yǎng)計(jì)劃并監(jiān)督實(shí)施,降低裝備在使用過(guò)程中的故障率。此外,智能裝備還可以從大數(shù)據(jù)中學(xué)習(xí)其他裝備的使用經(jīng)驗(yàn),進(jìn)行預(yù)防性維修提示,可最大限度延長(zhǎng)各種裝備的使用年限,降低裝備的購(gòu)置、維護(hù)、使用和管理費(fèi)用。
以往的故障診斷主要基于機(jī)械的運(yùn)行過(guò)程,基于出現(xiàn)的故障反向找出具體原因。這非常依賴(lài)維修人員的經(jīng)驗(yàn),對(duì)單一過(guò)程、單一故障和漸發(fā)性故障有較好的診斷效果,而對(duì)于復(fù)雜系統(tǒng)、多過(guò)程、突發(fā)性故障的診斷則效率低下,甚至無(wú)法找出故障原因[6]。此時(shí),基于大數(shù)據(jù)的人工智能為快速準(zhǔn)確的故障診斷提供了解決方案。首先,積累故障類(lèi)型,分析故障特征,建立故障示例集合;其次,根據(jù)裝備系統(tǒng)中各傳感器收集到的裝備各個(gè)組成部分的狀態(tài)信息,與故障類(lèi)型和特征進(jìn)行相關(guān)性分析;第三,經(jīng)過(guò)機(jī)器學(xué)習(xí)歸納形成故障規(guī)則,并結(jié)合維修人員的經(jīng)驗(yàn)制定故障維修策略;最后,形成裝備的智能化故障診斷模型,用于對(duì)其他裝備進(jìn)行故障診斷(圖2)。
圖2 基于人工智能的故障診斷模型
基于人工智能技術(shù)的故障診斷可以將各類(lèi)信息采集技術(shù)、信號(hào)處理技術(shù)和故障診斷方法有效融合,而不需要我們完全掌握故障形成的具體過(guò)程,只需要在相關(guān)性分析中得到形成故障的最可能原因。此外,我們可以根據(jù)需要,隨意擴(kuò)大數(shù)據(jù)相關(guān)性分析的范圍。這不僅有利于找出故障的直接原因,還可以得到故障的潛在影響因素,以便于及時(shí)采取維修策略,進(jìn)行預(yù)防性維修[5-6]。
基于目前的裝備和作戰(zhàn)樣式,作戰(zhàn)人員一方面需要熟練掌握裝備操作技能,另一方面需要接收、處理大量戰(zhàn)場(chǎng)信息,快速分析判斷并迅速做出決策。面對(duì)復(fù)雜的裝備和瞬息萬(wàn)變的戰(zhàn)場(chǎng)環(huán)境,作戰(zhàn)人員很難兼顧,因此存在決策失誤的風(fēng)險(xiǎn)。進(jìn)入大數(shù)據(jù)時(shí)代,各種傳感器實(shí)時(shí)收集大量戰(zhàn)場(chǎng)和裝備信息,再利用人工智能技術(shù)對(duì)大數(shù)據(jù)進(jìn)行分析利用,將極大地提高作戰(zhàn)效能。其優(yōu)勢(shì)表現(xiàn)在以下3 個(gè)方面。
一是作戰(zhàn)人員能夠充分借鑒以往的經(jīng)驗(yàn)。通過(guò)對(duì)以往大數(shù)據(jù)的相關(guān)性分析,作戰(zhàn)人員能夠充分發(fā)掘決策成功或失敗的影響因素和不容易直接觀(guān)察到的潛在影響因素,并歸納出規(guī)律。對(duì)于多方案決策能夠通過(guò)數(shù)學(xué)運(yùn)算,很快選取出最優(yōu)方案,從而有利于快速做出科學(xué)、可行、成功率高的決策。
二是提高裝備自主作戰(zhàn)效能。隨著大數(shù)據(jù)、人工智能技術(shù)在裝備中的應(yīng)用,未來(lái)裝備勢(shì)必能夠像人一樣相互協(xié)作完成任務(wù)。其模式識(shí)別、容錯(cuò)控制、協(xié)同作業(yè)、智能偽裝、識(shí)別雷達(dá)、戰(zhàn)場(chǎng)數(shù)據(jù)挖掘等功能使裝備具有了自主決策、智能毀傷的能力,極大地?cái)U(kuò)展了裝備的作戰(zhàn)效能。
三是突破作戰(zhàn)人員生理、心理極限?;谌斯ぶ悄艿臎Q策系統(tǒng)和裝備可以創(chuàng)造一個(gè)避免敵我作戰(zhàn)人員直接接觸的作戰(zhàn)環(huán)境,從而降低作戰(zhàn)人員生理和心理限制的影響,減少由于作戰(zhàn)人員體力不濟(jì)、精神疲倦、情緒波動(dòng)、判斷失誤等造成的致命性影響。
目前我軍已配備了智能決策支持系統(tǒng),充分發(fā)揮了專(zhuān)家系統(tǒng)以知識(shí)推理形式定性分析問(wèn)題的優(yōu)勢(shì),以及計(jì)算機(jī)系統(tǒng)以作戰(zhàn)模擬形式定量分析問(wèn)題的優(yōu)勢(shì),使解決問(wèn)題的能力得到了較大的提高。但是隨著作戰(zhàn)數(shù)據(jù)、訓(xùn)練數(shù)據(jù)、戰(zhàn)場(chǎng)環(huán)境數(shù)據(jù)的積累,需利用更多的信息去做出更全面、客觀(guān)、科學(xué)的決策。通過(guò)對(duì)多種來(lái)源數(shù)據(jù)的挖掘和分析,我們的決策不再僅依賴(lài)于經(jīng)驗(yàn)和模擬,在現(xiàn)實(shí)中真實(shí)發(fā)生的事物之間的強(qiáng)相關(guān)關(guān)系也被充分發(fā)掘,加之各個(gè)渠道數(shù)據(jù)的互相印證,有利于去偽存真,將最有價(jià)值的信息篩選出來(lái),將這些關(guān)鍵信息加入決策,必將使決策更加客觀(guān)全面、更加符合戰(zhàn)場(chǎng)實(shí)際情況。
從人工智能的優(yōu)勢(shì)和軍事需求來(lái)看,將日益成熟的人工智能技術(shù)應(yīng)用于軍事領(lǐng)域是大勢(shì)所趨。裝備和決策的智能化、自主化水平的提高必將影響甚至主導(dǎo)未來(lái)陸、海、空各個(gè)戰(zhàn)場(chǎng)的作戰(zhàn)方式和作戰(zhàn)效能。由于大數(shù)據(jù)技術(shù)是現(xiàn)階段人工智能技術(shù)的基礎(chǔ),因此它是軍事裝備和軍事決策走向智能的必經(jīng)之路。我們應(yīng)該從頂層謀劃大數(shù)據(jù)的采集、存儲(chǔ),形成全面的、可讀性強(qiáng)的數(shù)據(jù)庫(kù);借助先進(jìn)的數(shù)據(jù)挖掘技術(shù),深入挖掘數(shù)據(jù)中蘊(yùn)含的大量信息,形成知識(shí)庫(kù);針對(duì)各種應(yīng)用建立相應(yīng)的數(shù)學(xué)模型,利用從數(shù)據(jù)中發(fā)現(xiàn)的規(guī)律指導(dǎo)我們的決策。