+ 賀鵬梓
讓人工智能來熬夜讀圖
——航天星圖的圖像智能處理技術
+ 賀鵬梓
用計算機和人工智能來替代讀圖員,把浩如煙海的遙感原始數據變成有用的知識,同時把遙感應用引向普及和深入,甚至走進普通民眾的生活,這是業(yè)界幾十年來的夢想。人們?yōu)榇藝L試了很多算法和方法,但是要把它變成產業(yè),變成行業(yè)和個人能夠使用的工具。卻是一項知易行難的工程。
從遙感圖像里提取信息,是遙感應用和遙感產業(yè)的基本生產方式。在衛(wèi)星遙感發(fā)明出來以前,航空遙感是人們俯瞰地球的主要手段。那時的航空遙感相機都是用膠片作為記錄手段的。圖像判讀員們要對著這些照片做人工目標判讀工作。衛(wèi)星遙感技術發(fā)明和應用,特別是傳輸性對地觀測衛(wèi)星的出現,讓這些傳統(tǒng)的判讀員們有了新的任務。但是越來越豐富的圖像資源帶來了新的問題:判讀員不夠用。按照美國軍方的標準,一名合格的判讀員培養(yǎng)周期長達八年之久。即使在技術人才最為充裕的美國軍隊和美國情報部門,也長期面臨著判讀員嚴重匱乏的問題。所以大部分衛(wèi)星圖像——不管是數字的還是膠片的——從來沒有人看過。
同樣的問題也出現在民用領域,自從傳輸型遙感衛(wèi)星投入使用,衛(wèi)星遙感圖像的數量再也不受膠片攜帶量的限制。高分辨率衛(wèi)星的商業(yè)化和商業(yè)星座的普及,更是讓數字遙感圖像成了要多少有多少的海量資源。僅僅從國內而言,目前在軌運行的就有國有制的資源、高分系列衛(wèi)星,以及商業(yè)機制的吉林一號星座和高景星座,更多商業(yè)星座正在籌劃和部署之中。判讀員不夠的問題,比以前更加突出了。
這形成了遙感應用產業(yè)中最為薄弱的一個環(huán)節(jié),龐大的資源和龐大的需求之間,靠極為有限的人力判讀環(huán)節(jié)維持著。產能不足必然會抑制需求,這也是遙感應用市場一直沒有像位置服務及廣播電視那樣發(fā)展壯大的原因。
國外遙感應用界最近才把這個問題推向前臺。2017年9月,在歐洲咨詢公司主辦的“世界衛(wèi)星商業(yè)周”上,人們熱議的話題正是“對地觀測行業(yè)從銷售數據轉向銷售答案”。要從數據中取得答案,就不可能像傳統(tǒng)上那樣靠人力來分析數據,只能依靠人工智能和深度機器學習技術。在遙感產業(yè)界規(guī)模最大、名氣最大的數字地球公司,則把自己的業(yè)務全面轉向了亞馬遜網絡服務公司(AWS),利用AWS所掌握的機器學習技術來實現深度分析,服務于防務、情報、公共安全、測繪、環(huán)境保護、油氣勘探和導航等領域。這一連串的事件得到了國際航天媒體的廣泛報道。但是國外航天媒體所沒有報道的是,中國的商業(yè)航天創(chuàng)業(yè)者們不但很早就意識到了這個問題,而且表現出了更高的行動力。
早在2006年,一家叫做航天星圖科技(北京)有限公司(以下簡稱航天星圖)的創(chuàng)業(yè)企業(yè),就啟動了向遙感圖像智能處理進軍的進程。迄今為止,他們已經開發(fā)出了五代產品,從GEOVIS 1到GEOVIS 5,智能化程度越來越高。在曙光超級計算機和智能計算基數的支撐下,這種產品平臺正在發(fā)揮著日益顯著的效能。不但如此,航天星圖還打算融合用戶的知識與力量,共同建立產業(yè)生態(tài)圈,開發(fā)GEOVIS平臺的應用,共同把遙感數據中的信息變成對社會運行有用的知識。
航天星圖并不是因為突發(fā)奇想才選擇了遙感圖像智能處理這個研究方向。早在21世紀初,國內就開始采購國外高分辨率商業(yè)遙感衛(wèi)星圖像。當時這類衛(wèi)星圖像數量較少,而且應用非常有限,用人力處理圖像還是可以接受的方式。
隨著圖像數量的增加和用戶任務的頻繁,人力處理的弊端越來越突出。航天星圖的幾位創(chuàng)業(yè)者當時供職于中國科學院電子學研究所。這是中國第一個綜合型電子信息科學研究所,也是國內航天遙感技術的領先單位。有關科研人員經常為用戶進行遙感衛(wèi)星圖像的處理工作。在遇到應急任務的時候,就需要增加人手或者徹夜加班。創(chuàng)業(yè)者們逐漸萌發(fā)了用計算機來自動處理圖像,提取目標的想法。后來發(fā)生的一件事情堅定了他們的認識。當時,用戶要求從海洋遙感圖像當中找到一條船的位置,而留給他們的時間只有一個晚上。項目團隊為此組織了二三十人進行圖像判讀,忙了一晚上之后,總算順利完成了客戶交付的任務。但這僅僅是一個用戶要找一條船而已,如果用戶需要找十條船、一百條船怎么辦?如果是一百個、一千個用戶同時下單怎么辦?很顯然,靠堆人力是不可能應對爆發(fā)式需求的。
實際上,幾乎每個領域的遙感科研人員都遇到了這種問題。人們紛紛嘗試著計算機自動處理,進行了大量的理論研究和算法編制,發(fā)表了大量論文。航天星圖的創(chuàng)業(yè)者們也不例外。為了提高生產效率,他們嘗試著利用計算機圖形圖像處理技術來對遙感圖像進行粗略篩查。本著“寧可選錯不可放過”的原則,先把所有疑似目標都挑選出來,然后再由人力進行精細的識別和選取。這種方式提高了生產效率,也降低了工作人員的負荷,取得了初步的成效。但是這種粗略篩查,有著很高的虛警率。計算機經常把小塊的云團當作海上目標提取出來,也經常把那些被云層遮蓋了一半的船只漏過。能不能更進一步,消除計算機自動識別的虛警率呢?
這個時候,人工智能和深度機器學習技術已經進入實用化階段。國際上這兩項技術的研究和應用取得了很大的成效,一次次的人機對弈都會登上新聞頭條。創(chuàng)業(yè)者們敏銳地意識到了深度機器學習技術對遙感產業(yè)的意義。經過艱苦的努力,團隊將人工智能和深度學習技術應用在計算機圖形圖像處理當中,成功實現了高準確率的圖像自動識別和目標提取,虛警率已經降低到了人工分析的水平。而且,計算機可以不眠不休地日夜工作,不會疲勞、不會厭倦,更不會像人類那樣為瑣事所困擾,這是人力永遠無法相提并論的。遙感圖像智能處理技術終于取得了決定性的突破。
技術成熟之后,就面臨著產品化和業(yè)務化的問題,然而中國科學院電子研究所是一家以科研為主要工作模式的學術型單位。對于這家研究所的科研人員來說,取得成果、發(fā)表論文是主要的考核模式,這與商業(yè)企業(yè)的運行模式是不同的。
為了把計算機圖像自動處理技術推向市場、廣泛服務于用戶,在中科院成果產業(yè)轉化的大背景下,中科院電子所和中科曙光共同組建了航天星圖。電子所有圖像智能處理的技術積累,中科曙光有超級計算機和商業(yè)化經驗。強強聯合,彼此促進。經過十余年積累,公司已經在國防、交通、國土、農業(yè)、林業(yè)、城市管理等多個領域實現了業(yè)務化運行。這對于中國遙感乃至世界衛(wèi)星遙感產業(yè)來說,都是較為前沿的嘗試。
它的意義不僅僅在于將先進技術投入商業(yè)化運營,而且在于通過商業(yè)運行獲得的投資和利潤,反哺技術開發(fā)、反哺基礎理論突破,創(chuàng)建一種有示范價值的科研成果應用和轉化機制。這對于遙感應用和衛(wèi)星產業(yè)的所有領域,都有著推動作用。
原始影像
提取結果(道路、建筑物、水體、植被)