池衛(wèi)紅 韓曉樂 / 中國人民解放軍95894部隊(duì),北京市 昌平區(qū) 100085
為應(yīng)對海量偵察數(shù)據(jù),美國積極推進(jìn)人工智能技術(shù)在偵察影像識別判讀領(lǐng)域的開發(fā)。本文以識別衛(wèi)星影像為例介紹了美國正在開發(fā)的人工智能輔助判讀技術(shù)以及為推進(jìn)該技術(shù)所需解決的問題。
美軍偵察平臺多,收集能力強(qiáng),衛(wèi)星、無人機(jī)和其他偵察監(jiān)視平臺收集的數(shù)據(jù)遠(yuǎn)超出人類可以分析的能力。以美軍無人機(jī)為例,美軍現(xiàn)有11000多架,每年收集數(shù)十萬小時(shí)的視頻數(shù)據(jù)。情報(bào)部門每天用一個(gè)傳感器在一個(gè)戰(zhàn)區(qū)內(nèi)捕捉到的數(shù)據(jù)超過美國國家橄欖球三個(gè)賽季的高清圖像數(shù)據(jù)。例如,一個(gè)廣域運(yùn)動(dòng)圖像傳感器,它可以觀察整座城市,但是20多位分析人員夜以繼日地工作也只能分析其中的6%~12%。為應(yīng)對海量數(shù)據(jù),減輕影像判讀人員的工作量,美國積極推進(jìn)人工智能技術(shù)在影像識別判讀領(lǐng)域的開發(fā)。
美國情報(bào)預(yù)研局從2017年7月到2018年2月啟動(dòng)了“世界功能地圖挑戰(zhàn)賽”,旨在通過利用人工智能技術(shù),對衛(wèi)星影像自動(dòng)化分析方面實(shí)現(xiàn)突破。美國情報(bào)預(yù)研局成立于2006年,參照國防預(yù)研局設(shè)立,受美國家情報(bào)局長領(lǐng)導(dǎo)。它共有500個(gè)合作機(jī)構(gòu),為美國政府17個(gè)情報(bào)機(jī)構(gòu)服務(wù)。
“世界功能地圖挑戰(zhàn)賽”邀請了工業(yè)界和學(xué)術(shù)界研發(fā)人員開發(fā)能夠掃描和識別衛(wèi)星圖像中不同類別物體的深度學(xué)習(xí)算法。情報(bào)預(yù)研局提供了100萬張做好標(biāo)注的高分辨率衛(wèi)星圖像,供參研人員和機(jī)構(gòu)使用自動(dòng)算法和大量圖像訓(xùn)練算法,使其將對象分為63類,如機(jī)場、學(xué)校、油井、造船廠或港口。
研究人員通過將稱為卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks)的大型神經(jīng)網(wǎng)絡(luò)和具有大量處理能力的計(jì)算機(jī)結(jié)合起來,為深層學(xué)習(xí)算法提供動(dòng)力。在提供給大量訓(xùn)練數(shù)據(jù)后,可以學(xué)習(xí)識別和分類衛(wèi)星圖像上不同的物體。通過將一些這樣的網(wǎng)絡(luò)組合成整體,該算法可以判斷每個(gè)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)果,最終產(chǎn)生一個(gè)比單個(gè)卷積神經(jīng)網(wǎng)絡(luò)更強(qiáng)更優(yōu)的結(jié)果。上述是美洛克希德·馬丁小組的設(shè)計(jì)方案,該小組使用機(jī)器學(xué)習(xí)軟件和從在線開源軟件庫(如Tensor Flow)獲取的框架開發(fā)了其卷積神經(jīng)網(wǎng)絡(luò)。該算法在識別速度上獲得了前五名,算法總精度達(dá)到83%,并能夠?qū)崿F(xiàn)每秒對100個(gè)對象進(jìn)行分類,如果使用完全有效的算法,該軟件可將人類1h完成的圖像識別任務(wù),縮減至到幾秒鐘。該小組的算法擅長識別具有鮮明特征的物體,以高于95%的精度成功識別了核電站、隧道口、跑道和風(fēng)力發(fā)電場等,但是識別特征相似的物體存在困難,如船廠、港口、醫(yī)院、辦公樓和警察局等。開發(fā)人員指出,從衛(wèi)星圖像來看,這些物體根本沒有任何區(qū)別性特征。
若要這些新類型算法產(chǎn)生作用,所需添加的最重要成分是數(shù)據(jù)集,因?yàn)檫@些算法需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練,這是一種類似于人類童年時(shí)期學(xué)習(xí)如何識別事物的方式。需要“這些物體是什么”的大量例子,然后開始概括,逐漸做出自己的判斷。但是,即使有大量正確標(biāo)記的訓(xùn)練數(shù)據(jù),今天的深度學(xué)習(xí)技術(shù)可能也不能達(dá)到更高層次的智力水平,識別細(xì)微差別。例如,洛克希德·馬丁公司小組的算法將船廠和港口混淆的次數(shù)達(dá)56%。小組開發(fā)人員稱,人類看到一個(gè)圖像時(shí),通常觀察事物的細(xì)微處,如干船塢內(nèi)是否有船只,是否存在某種類型的起重機(jī),從而可以區(qū)分出港口或造船廠,而人工智能算法目前還做不到。開發(fā)小組正在尋找圖像中這些深度學(xué)習(xí)算法目前無法計(jì)算的更高層次或更復(fù)雜的細(xì)節(jié)。目前,情報(bào)預(yù)研局人員正在更新和維護(hù)數(shù)據(jù)集,以確保算法可以獲得最新的數(shù)據(jù)信息進(jìn)行訓(xùn)練,最終使基于卷積神經(jīng)網(wǎng)絡(luò)的算法更受信任。例如,某一區(qū)域中細(xì)小的變化將使系統(tǒng)大腦混亂,系統(tǒng)會給出完全錯(cuò)誤的答案,因此,情報(bào)預(yù)研局人員計(jì)劃不斷地研究這個(gè)地區(qū),確保其正在開發(fā)和為政府重新評估的算法繼續(xù)得到測試和使用,最終在應(yīng)用中變得更加強(qiáng)壯。
美國大學(xué)也正在開展算法研究工作。波士頓大學(xué)的一個(gè)研究小組正在使用“世界功能地圖”數(shù)據(jù)集和經(jīng)過測試的算法創(chuàng)建熱圖(heat maps),這些熱圖可以顯示出算法所使用的那部分圖像。他們發(fā)現(xiàn),有時(shí)不是物體本身,而是圍繞在物體周圍的線索在分類識別中提供了最多的幫助。例如,風(fēng)車顯示的陰影可以很好的幫助識別出風(fēng)車這一物體。陰影為識別物體提供了更好的視圖。波士頓大學(xué)熱映射算法實(shí)際上指出了陰影的重要性,它是識別出風(fēng)車的關(guān)鍵特征。這一算法利用了影像判讀識別特征之一—陰影。
美軍和地方技術(shù)工業(yè)部門指出,實(shí)現(xiàn)人工智能技術(shù)輔助解譯判讀面臨數(shù)個(gè)挑戰(zhàn),需要解決好一些問題。
利用某一地區(qū)數(shù)據(jù)訓(xùn)練的算法應(yīng)用到另一個(gè)新地區(qū),最初可能會出現(xiàn)一些低級錯(cuò)誤。為解決這一問題,研究人員目前在用戶界面中加入了一個(gè)名為“訓(xùn)練AI”的按鈕。如果發(fā)現(xiàn)算法誤將棕櫚樹識別為人或出現(xiàn)類似錯(cuò)誤時(shí),分析員可點(diǎn)擊“訓(xùn)練AI”按鈕對算法進(jìn)行訓(xùn)練,將該幀視頻從戰(zhàn)區(qū)環(huán)境中分離出,單獨(dú)進(jìn)行數(shù)據(jù)標(biāo)記,并迅速發(fā)送給算法開發(fā)人員,由開發(fā)人員對算法重新訓(xùn)練并進(jìn)行優(yōu)化。
為構(gòu)建算法,需要大量的訓(xùn)練數(shù)據(jù)和標(biāo)記數(shù)據(jù)。對于計(jì)算機(jī)視覺,需要為成千上萬的圖像貼上標(biāo)簽,即常說的結(jié)構(gòu)化數(shù)據(jù),而不是原始數(shù)據(jù)或非結(jié)構(gòu)化數(shù)據(jù),這樣系統(tǒng)才能識別出它們所看到的東西。若不經(jīng)過標(biāo)記,算法很難完成其工作。目前美軍正在構(gòu)建一個(gè)國防部數(shù)據(jù)標(biāo)簽體系。政府、學(xué)術(shù)界和工業(yè)界正在尋找更好的方法,促成機(jī)器能夠理解新的數(shù)據(jù),并利用大量的未標(biāo)記數(shù)據(jù)。約翰·霍普金斯大學(xué)應(yīng)用物理實(shí)驗(yàn)室致力于將遷移學(xué)習(xí)技術(shù)應(yīng)用于圖像分類、檢測和分割。通過使用卷積神經(jīng)網(wǎng)絡(luò),機(jī)器學(xué)習(xí)可以從先前面向一個(gè)問題的數(shù)據(jù)集應(yīng)用到面向另一個(gè)問題的數(shù)據(jù)集。利用遷移學(xué)習(xí)和無監(jiān)督機(jī)器學(xué)習(xí)可以提高算法。
圖1 利用人工智能識別標(biāo)注出的三個(gè)機(jī)場,三個(gè)機(jī)場位于美國佛羅里達(dá)州中部。
圖2 北京首都機(jī)場局部衛(wèi)星影像圖
為算法操作人員和分析人員提供的用戶界面必須是可定制和自適應(yīng)的。用戶界面應(yīng)該使操作人員能夠根據(jù)正在執(zhí)行的任務(wù)選擇相應(yīng)的算法,為某個(gè)區(qū)域定制的算法并不會完全適合另一個(gè)區(qū)域。用戶界面還應(yīng)提供可調(diào)節(jié)置信度的工具。部分操作人員可能希望算法識別置信度達(dá)到80%及以上,另一些操作人員可能會將置信度降至20%,這有可能識別人類通常無法發(fā)現(xiàn)的結(jié)果。
計(jì)算能力是算法開發(fā)的一個(gè)重要依賴。如果沒有云計(jì)算,算法戰(zhàn)是達(dá)不到效果的,但是今天的云計(jì)算技術(shù)并不是針對人工智能和機(jī)器學(xué)習(xí)優(yōu)化的,需要進(jìn)一步的開發(fā)。未來的量子計(jì)算和量子計(jì)算機(jī)將是這一方面最具有發(fā)展希望的解決方案。
需要指出的是,這些算法并不能在不久將來替代圖像判讀分析人員,人工智能不會奪走判讀人員的工作并取代人類,重要的判斷和高層次思考仍舊需要人類,人類需要做的是找出如何有效使用人工智能技術(shù),了解人工智能的優(yōu)勢和弱勢,使其充分發(fā)揮效能?!?/p>