李睿
阿爾法狗(AlphaGo)讓很多人驚呼“留給人類的時間不多了”
提到人工智能就有人想到深度學(xué)習(xí),仿佛深度學(xué)習(xí)就是人工智能,實際上,深度學(xué)習(xí)只是人工智能領(lǐng)域里的一個分支算法,遠不能代表人工智能本身,但由于傳統(tǒng)人工智能方法早已被運用到軍事活動的各個領(lǐng)域,并不屬于新生事物,因而本文所討論的人工智能在軍事上的應(yīng)用只限于深度學(xué)習(xí),不討論傳統(tǒng)的人工智能方法。
人工智能起源于1950年代,一開始就朝著利用計算機模擬人腦的方向發(fā)展,根據(jù)科學(xué)家對人腦機制理解的不斷發(fā)展,人工智能迄今為止也經(jīng)過三次高潮,相應(yīng)地發(fā)展出了三類方法。
1980年代以前,科學(xué)家普遍認為人類的思維是一系列邏輯表達的集合體,因而將主要研究精力放在了啟發(fā)式搜索和邏輯推理方面,進而引發(fā)了人工智能革命的第一次浪潮。日本和美國科學(xué)家一馬當(dāng)先大搞專家系統(tǒng),希望能夠用邏輯窮盡表達各行各業(yè)知識,造出一臺萬能的通用機器人,美國國防部國防高級研究計劃局(DARPA)更是受到“深藍”(“深藍”是美國IBM公司生產(chǎn)的一臺超級國際象棋電腦,質(zhì)量達1279kg,有52個大腦,也即微處理器,每秒鐘可以計算2億步——編者注)戰(zhàn)勝卡斯帕羅夫事件刺激,試圖搞出所謂的戰(zhàn)爭全能輔助決策系統(tǒng)“深綠”,作為部隊?wèi)?zhàn)力“倍增器”。但現(xiàn)實世界存在不確定性,不可能利用窮舉法和邏輯定式來表示,因而第一波人工智能高潮失敗了,美日等國也承受了探索損失,但也留下了啟發(fā)式搜索和邏輯推理的成果,迄今為止,仍然作為各類武器裝備和軍事系統(tǒng)的核心算法。
1980年代開始,人工智能發(fā)展跌入低谷,但一部分科學(xué)家堅持了下來,并逐漸發(fā)現(xiàn),統(tǒng)計和概率數(shù)學(xué)方法是處理不確定性問題的強力工具。從這個思路出發(fā),人工智能逐漸開辟出以有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)等統(tǒng)計學(xué)習(xí)方法為主要手段的人工智能新技術(shù),發(fā)展出有監(jiān)督學(xué)習(xí)方法(如感知器、logistics回歸、隨機森林等),無監(jiān)督學(xué)習(xí)方法(EM聚類、支持向量機等)、半監(jiān)督學(xué)習(xí)方法(強化學(xué)習(xí)、增強學(xué)習(xí)等)等統(tǒng)計學(xué)習(xí)方法理論,進而誕生了人工智能的第二次熱潮。這些方法時至今日仍然是深度學(xué)習(xí)的理論基礎(chǔ),但第二次人工智能熱潮仍然跌入低谷,原因在于當(dāng)數(shù)據(jù)量極為龐大時,計算機硬件難以支撐其龐大的計算量,極易產(chǎn)生所謂的“維度災(zāi)難”,直到GPU和云計算技術(shù)發(fā)展起來,讓數(shù)據(jù)并行處理成為可能,才真正推動了統(tǒng)計學(xué)習(xí)方法的進一步提升,進而引發(fā)了以深度學(xué)習(xí)技術(shù)為代表的第三次,也就是本次人工智能高潮的再次爆發(fā)。
“深藍”擊敗卡斯帕羅夫事件讓DARPA(美國國防部國防高級研究計劃局)深受刺激,試圖搞出所謂的戰(zhàn)爭全能輔助決策系統(tǒng)“深綠”。雖然最終未成功,但也留下了寶貴的成果
深度學(xué)習(xí)算法的發(fā)明時間是2006年,提出者是加拿大教授杰弗里·辛頓(Geoffrey Hinton),但在2010年后GPU和云計算技術(shù)取得突飛猛進的進步后,這種算法在工程上才得到廣泛運用。深度學(xué)習(xí)的基本框架是一種叫作感知器的統(tǒng)計學(xué)習(xí)方法結(jié)構(gòu),通過大量感知器組網(wǎng)連接,形成一個可以利用簡單函數(shù)模擬任何復(fù)雜函數(shù)的網(wǎng)絡(luò),每一個感知器被稱為神經(jīng)元,若干感知器組成一個神經(jīng)元層,若干神經(jīng)元層組成一個神經(jīng)網(wǎng)絡(luò)。之所以如此稱呼,是因為這種結(jié)構(gòu)與人類的大腦神經(jīng)元是類似的,感知器的工作原理和神經(jīng)沖動傳遞過程也是一致的。當(dāng)層數(shù)較多時就被稱為深度神經(jīng)網(wǎng)絡(luò),而訓(xùn)練和使用深度神經(jīng)網(wǎng)絡(luò)的過程就被稱為深度學(xué)習(xí)。
由于深度學(xué)習(xí)都是基于統(tǒng)計學(xué)習(xí)方法的,因而其內(nèi)在原理和貝葉斯推斷理論是一致的。即人類搜集大量帶標(biāo)簽的歷史數(shù)據(jù)組,將數(shù)據(jù)組輸入深度神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)利用相應(yīng)算法得到該數(shù)據(jù)組的聯(lián)合分布規(guī)律,這樣,深度神經(jīng)網(wǎng)絡(luò)在被輸入沒有標(biāo)簽的新數(shù)據(jù)時,就可以預(yù)判到其輸出。例如,利用人類射手統(tǒng)計到某一手槍在前100次射擊時每次射擊前的狀態(tài)數(shù)據(jù)和射擊環(huán)數(shù),讓系統(tǒng)學(xué)到聯(lián)合分布規(guī)律,那么在第101次射擊時,僅需知道射擊前的狀態(tài),就可以預(yù)測本次射擊會有什么樣的結(jié)果,相應(yīng)改變射擊前的狀態(tài),就能達到最佳射擊效果,提高射擊準確率。
必須注意的是,在這個過程中,由于機器是自動學(xué)習(xí)數(shù)據(jù)的聯(lián)合分布規(guī)律的,該分布只能用一堆參數(shù)來表示,人類很可能無法理解,因而就形成了人工智能的“黑箱效應(yīng)”,即人類無法解釋系統(tǒng)是如何做到的,但系統(tǒng)就是能做到,人類可以理解為,這個系統(tǒng)有了“經(jīng)驗”,但這種“經(jīng)驗”并不是真正的理解,只是按照既定算法達到的一種狀態(tài),不能認為該系統(tǒng)具有了人類的智能。這種數(shù)據(jù)學(xué)習(xí)能力也就引出了人工智能在軍事領(lǐng)域的第一個潛在應(yīng)用價值——作戰(zhàn)數(shù)據(jù)分類與預(yù)測。
上文舉例手槍射擊可以看出,以統(tǒng)計學(xué)習(xí)方法為核心的人工智能對數(shù)據(jù)分類和預(yù)測具有神奇的效果,這種依靠帶標(biāo)簽的歷史數(shù)據(jù)得到的結(jié)果往往比解析法得到的計算結(jié)果精確得多。因為利用解析法計算時往往難以將所有不確定性因素窮盡,而統(tǒng)計學(xué)習(xí)方法則可以將所有不確定因素(如導(dǎo)彈飛行過程中的擾動)直接歸類到某種分布律,進而得到更精確的結(jié)果。作戰(zhàn)活動中往往會產(chǎn)生大量數(shù)據(jù),例如敵軍作戰(zhàn)單元活動的軌跡、武器的毀傷范圍、通信系統(tǒng)覆蓋范圍等等,由于自然環(huán)境的影響,這些數(shù)據(jù)和理論計算數(shù)據(jù)差距往往較大,此時利用解析法計算出來的理論值就比較粗糙,對指導(dǎo)作戰(zhàn)往往不利,但利用人工智能系統(tǒng)的數(shù)據(jù)分類和預(yù)測功能,則可以非常接近真實值,從而讓數(shù)據(jù)催生出戰(zhàn)斗力,大大增強己方武器的命中概率,使武器精確度更高,成倍增加部隊和武器的作戰(zhàn)效能。
以彈道導(dǎo)彈為例,在融入人工智能系統(tǒng)的作戰(zhàn)數(shù)據(jù)分類和預(yù)測后,可以最大限度地從訓(xùn)練、演習(xí)發(fā)射數(shù)據(jù)中學(xué)習(xí)到導(dǎo)彈發(fā)射諸元和命中精度的聯(lián)合分布規(guī)律,進而在實戰(zhàn)中使普通彈道導(dǎo)彈達到先進彈道導(dǎo)彈水平。而在反導(dǎo)彈攔截作戰(zhàn)中,則可以根據(jù)X波段對敵軍日常彈道導(dǎo)彈發(fā)射、試驗的偵測數(shù)據(jù),讓系統(tǒng)學(xué)習(xí)到雷達回波特征和彈頭類型的聯(lián)合分布規(guī)律,在實戰(zhàn)攔截中,大大增加系統(tǒng)對導(dǎo)彈軌跡與落點預(yù)測的準確率,進而增加對彈道導(dǎo)彈攔截的成功率。
雖然幾乎所有的統(tǒng)計學(xué)習(xí)方法都有數(shù)據(jù)分類和預(yù)測功能,但當(dāng)數(shù)據(jù)量較多時,深度學(xué)習(xí)方法的性能表現(xiàn)最好,就數(shù)據(jù)分類而言,可以達到95%以上的準確率,這一水平比傳統(tǒng)算法的75%左右的準確率提高了不少,但當(dāng)數(shù)據(jù)量小時,工作效率反而比不上傳統(tǒng)模型。
信息化技術(shù)讓作戰(zhàn)活動的OODA(觀察-判斷-決策-攻擊)速度不斷增加,但由于信息系統(tǒng)本身不具備智能,因而在目標(biāo)識別上一直效率不高。海灣戰(zhàn)爭期間,美軍誤傷造成的地面部隊損失巨大,時至今日,這一問題仍然無法得到有效解決。而以圖像識別為代表的敵我目標(biāo)識別技術(shù)能為這一問題提供解決方案。
基于深度學(xué)習(xí)的圖像識別技術(shù)是將圖像按照像素分為3個通道(RGB)的數(shù)字矩陣,將其輸入卷積神經(jīng)網(wǎng)絡(luò),而后實現(xiàn)類型識別。所謂的卷積神經(jīng)網(wǎng)絡(luò)即利用卷積窗口對圖像的固定大小區(qū)域進行加權(quán)求和,以捕捉圖像特征。在世界各類圖片分類大賽中,經(jīng)過良好設(shè)計的卷積神經(jīng)網(wǎng)絡(luò)的識別準確率高達98%以上,遠超傳統(tǒng)方法。
該技術(shù)在軍事上的用途十分廣泛。例如在反暴恐行動中,可以利用安裝在城市各處的攝像頭,根據(jù)犯罪分子的臉部特征、體態(tài)特征識別想要抓捕的恐怖分子。而在地面和空中武器平臺上,一旦雷達、攝像頭等傳感器使用該算法,即可快速識別敵人的飛機、艦船、坦克等作戰(zhàn)單元類型,特別是對于具有一定偽裝能力的敵作戰(zhàn)單元,可以一舉解決敵我識別難題。據(jù)美國媒體報道,美軍使用該技術(shù)判讀衛(wèi)星圖像,幾十分鐘就尋找到了多處隱藏地空導(dǎo)彈陣地,而這項工作如果由圖像判讀員來完成,耗費的時間以及準確率根本無法與前者相比。
圖像識別可以大大提高敵我識別概率
著名人工智能學(xué)者、前百度首席科學(xué)家吳恩達正在演講
在軍事裝備制造維修方面,目標(biāo)識別技術(shù)也有很大的用處,著名人工智能學(xué)者、前百度首席科學(xué)家吳恩達于2017年12月14日宣布成立新公司Landing.ai,并與富士康公司合作,利用圖像識別算法做電路板的合格率檢測,效率和速度遠遠超過人工,該技術(shù)當(dāng)然也可以用于軍事裝備,如軍事裝備戰(zhàn)后的快速定損等。
智能作戰(zhàn)決策是最令人心動的人工智能應(yīng)用領(lǐng)域,許多人都曾設(shè)想制造出如阿爾法狗一般強大的無人坦克、無人機橫行戰(zhàn)場。但這種想法在最近10年內(nèi)實現(xiàn)的可能性并不大。阿爾法狗之所以能擊敗人類最頂尖的圍棋選手,在于圍棋是一個確定性的博弈模型,對弈雙方的每步走法和效果都十分明確,每一步和每一步之間都有停頓,而真實世界的復(fù)雜性遠超圍棋,單純利用圖像識別技術(shù)識別出戰(zhàn)場中敵軍飛行員的身份和動作意圖需要的計算量都絕對超過阿爾法狗,更不要說還有復(fù)雜自然戰(zhàn)場環(huán)境和戰(zhàn)術(shù)背景了。
在制造智能機器人方面,日本走在世界前列,但在福島核泄漏時,日本機器人前往沾染區(qū)處理時效果并不好,原因就是出現(xiàn)了“機器人電線被纏住了”之類的問題
特別是機器人本身沒有“常識”,往往會遇到難以預(yù)料的“意外”。在制造智能機器人方面,日本走在世界前列,但在福島核泄漏時,日本機器人前往沾染區(qū)處理時效果并不好,原因就是出現(xiàn)了“機器人電線被纏住了”之類的問題,這些問題很難被設(shè)計者事先預(yù)料到,機器人也無法處理。深度學(xué)習(xí)技術(shù)設(shè)計者們也多次強調(diào),該技術(shù)只能處理特定任務(wù),并非是理想中的通用AI。
但是面對智能決策話題,深度學(xué)習(xí)也并非一籌莫展,阿里巴巴曾經(jīng)在2017年發(fā)表過一篇論文,其中提到阿里巴巴AI試驗室利用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)讓星際爭霸里的作戰(zhàn)單元學(xué)會了人類選手的攔截、圍殺等各種戰(zhàn)術(shù),其內(nèi)在算法就是將深度學(xué)習(xí)和強化學(xué)習(xí)結(jié)合起來,設(shè)置出了一個巧妙的價值函數(shù),通過和人類選手的反復(fù)搏殺,讓AI始終求取價值函數(shù)最大值,實現(xiàn)學(xué)習(xí)戰(zhàn)術(shù)的目的。但游戲和真實世界的區(qū)別在于,游戲作戰(zhàn)單元都有“血條”這種簡單的收益、戰(zhàn)損衡量方法,而真實交戰(zhàn)世界中的戰(zhàn)術(shù)效能、毀傷效果評估十分復(fù)雜,遠非一個簡單的價值函數(shù)能夠解決。但這樣的方法至少讓人看到了深度學(xué)習(xí)+強化學(xué)習(xí)結(jié)合起來的深度強化學(xué)習(xí)在智能決策上的巨大潛力,該技術(shù)可能是未來作戰(zhàn)武器智能決策系統(tǒng)的主要發(fā)展方向。
數(shù)據(jù)生成模擬指的是人工智能系統(tǒng)(例如深度神經(jīng)網(wǎng)絡(luò))利用歷史數(shù)據(jù)、既定規(guī)則生成與真實數(shù)據(jù)一致的大量模擬數(shù)據(jù)的技術(shù),這種模擬數(shù)據(jù)的真實性甚至可以達到令人工智能系統(tǒng)自身都難以分辨的水平。該技術(shù)最典型的運用就是模擬語音系統(tǒng),在收集到某人的語音錄音后,系統(tǒng)可以根據(jù)該語音特征,模擬出本人說出的任何一句話,這一技術(shù)可以使我方電臺模擬對方指揮員指揮其部隊。除語音外,基于作戰(zhàn)數(shù)據(jù)生成模擬技術(shù)的智能系統(tǒng)還可以模擬出敵軍的雷達回波、通信聯(lián)絡(luò)等各類數(shù)據(jù),達到以假亂真的效果。
特別是2014年,出現(xiàn)了一種叫作生成式對抗網(wǎng)絡(luò)(GAN)的新神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)具有兩個網(wǎng)絡(luò),一個造假,一個鑒真,在互相對抗中,可以讓造假網(wǎng)絡(luò)和鑒真網(wǎng)絡(luò)達到最佳性能,現(xiàn)存的任何數(shù)據(jù)造假器和數(shù)據(jù)鑒別器都無法與其相比。
作戰(zhàn)數(shù)據(jù)生成模擬技術(shù)在軍事上的第一個用處就是欺騙系統(tǒng),如將GAN運用到制造新的電子干擾機時,該電子干擾機將能夠根據(jù)對手的雷達信號制造出令其雷達接收機根本無法識別的假信號,達到干擾功率最小、干擾效果最大的目的,到那時,世界各國以雷達為基礎(chǔ)的空防系統(tǒng)就變得形同虛設(shè)。這種欺騙系統(tǒng)的軍事意義之大,不言而喻。
作戰(zhàn)數(shù)據(jù)生成模擬技術(shù)在軍事上的第二個用處就是制造虛擬態(tài)勢。該技術(shù)可以根據(jù)真實數(shù)據(jù)的分布規(guī)律或戰(zhàn)場規(guī)則,對其稍加修改,不斷生成不同的作戰(zhàn)態(tài)勢,直接用于訓(xùn)練指揮員、戰(zhàn)斗員的作戰(zhàn)技巧和指揮藝術(shù)。阿爾法狗的進化版阿爾法零就是在沒有輸入人類棋譜的情況下,僅依靠棋盤規(guī)則自己生成數(shù)據(jù),進行左右互搏,在72小時內(nèi)就超越了阿爾法狗,可見數(shù)據(jù)生成模擬技術(shù)威力之強。未來,很可能在智能決策過程中,為了讓系統(tǒng)適應(yīng)復(fù)雜的真實世界,先利用數(shù)據(jù)生成模擬技術(shù)生成數(shù)千萬模擬數(shù)據(jù)來考驗智能決策系統(tǒng),再將其投入戰(zhàn)場,最大限度減少意外狀況的發(fā)生。
無人駕駛指讓一個智能體(機器人、汽車、飛行器等)擁有自主決策、自主尋路和自主檢測目標(biāo)的能力,谷歌、百度等公司判斷,未來10~15年內(nèi),無人駕駛汽車必然取代有人駕駛汽車成為交通主力,而應(yīng)用到軍事領(lǐng)域中,無人作戰(zhàn)車輛、無人坦克、無人潛航器、無人機等作戰(zhàn)裝備也將在戰(zhàn)場上扮演愈加重要的角色。無人駕駛技術(shù)涉及的主要領(lǐng)域為無人定位、圖像識別、自動控制、路徑規(guī)劃等。
以無人作戰(zhàn)車輛為例,通過安裝在車體上的照相機、GPS、激光雷達和毫米波雷達作為傳感器不斷對周圍進行掃描,建立三維影像,不斷對自身實施精確定位、識別周邊各類物體,實施作戰(zhàn)系統(tǒng)控制,形成一個集檢測、定位、作戰(zhàn)為一體的閉環(huán)系統(tǒng),實現(xiàn)無人駕駛平臺上戰(zhàn)場,但這種無人駕駛平臺不能處理所有的“意外”問題,因而還不能完全脫離人的操控,“無人+有人”協(xié)同作戰(zhàn)體系是無人作戰(zhàn)平臺走向戰(zhàn)場的現(xiàn)有作戰(zhàn)模式,未來向何種方向發(fā)展,仍需拭目以待。
人工智能遠未達到理想程度,機器人取代人類作戰(zhàn)為時過早
無人作戰(zhàn)平臺將在戰(zhàn)場上扮演愈加童要的角色
總的來說,目前以深度學(xué)習(xí)為代表的人工智能技術(shù)將會讓軍隊對于軍事數(shù)據(jù)的價值挖掘利用能力越來越高,展望未來,效能更好的深度學(xué)習(xí)結(jié)構(gòu)和并行處理硬件會不斷取得突破,這將使現(xiàn)有的武器和軍事系統(tǒng),發(fā)現(xiàn)目標(biāo)速度更快、識別準確率更高、決策速度更快、決策質(zhì)量更優(yōu),攻擊精度明顯提升,面對沒有經(jīng)過智能化技術(shù)改造的軍事體系,形成壓倒性優(yōu)勢。但同時,我們也要理性地看到,以現(xiàn)有人工智能技術(shù)造出通用AI機器人尚待時間,機器人取代人類作戰(zhàn)為時過早。
編輯/劉蘭芳