■采訪/仁太 受訪/華先勝
“城市大腦”已經(jīng)遠遠超越了大家通常談論的“智慧城市”概念,它是對城市的全量、實時認知和搜索。
2016年的杭州云棲大會上,城市大腦首次對外公布。彼時阿里巴巴集團技術委員會主席王堅在介紹城市大腦時表示:“城市大腦的內核采用阿里云人工智能ETa技術,可以對城市進行全局實時分析,自動調配公共資源,修正城市運行中的缺陷,成為治理城市的超級人工智能?!?/p>
一年后的今天,城市大腦對外界來說依舊是一個似曾相識但又神秘的項目,如果用一個通俗而又古老的詞來定義,可以稱之為“智慧城市”,但事實上,“城市大腦”已經(jīng)遠遠超越了大家通常談論的“智慧城市”概念。用華先勝的話說,城市大腦的核心是利用大數(shù)據(jù)和大計算來挖掘大量城市異構數(shù)據(jù)的價值。
城市異構數(shù)據(jù)是什么?它有兩個特點。首先,城市數(shù)據(jù)是視覺數(shù)據(jù)、公交數(shù)據(jù)、GPS數(shù)據(jù)以及人口數(shù)據(jù)等異構數(shù)據(jù)的聚合體。在這些數(shù)據(jù)中,視覺數(shù)據(jù)是體量最大也是最核心的部分。其次,城市的數(shù)據(jù)量很大,例如,一座城市擁有十幾萬個攝像頭,每天24小時產(chǎn)生的數(shù)據(jù)量是非常大的。因此,擁有海量數(shù)據(jù)是城市載體的天然優(yōu)勢,但如何挖掘數(shù)據(jù)的價值則是城市大腦的使命。
“過去,這些數(shù)據(jù)的價值并沒有被充分挖掘出來,大量設備的部署和運維成本很高,但它的價值遠遠不只是傳統(tǒng)的車牌識別和交通處罰。”華先勝如是說。城市大腦打造的是一個具有數(shù)據(jù)智能的城市,它可以通過對城市的全面、實時和全量感知來識別車的形狀、型號、路徑、速度,或者感知行人和騎行人等的信息。在此基礎之上,再進行決策優(yōu)化、預測以及干預,城市數(shù)據(jù)的價值也就逐漸顯現(xiàn)出來了。
華先勝用交通狀況舉了個例子,一旦遇到突發(fā)情況,城市大腦就可以立即找出相關的數(shù)據(jù),比如查找肇事車、嫌疑人,然后可以基于分析后的數(shù)據(jù)對整個城市進行交通的優(yōu)化。更進一步,城市大腦還可以對即將發(fā)生的事情進行預測。例如,10分鐘或者更長時間以后哪里會出現(xiàn)交通擁堵,根據(jù)預測的結果,就可以提前進行警力和醫(yī)療等相關資源的部署,甚至提前采取交通管制、限流等措施,避免事故發(fā)生。
華先勝還表示,對城市數(shù)據(jù)的全面感知主要得益于兩個方面。一方面是計算能力的提升,云計算、圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)等讓我們可以實現(xiàn)海量數(shù)據(jù)的計算,同時實時處理千路、萬路,甚至更多路的視頻。另一方面,深度學習算法推動了計算機視覺的發(fā)展。
在城市大腦的項目中,計算機視覺無疑是最重要也是最具挑戰(zhàn)的部分。華先勝表示,視覺數(shù)據(jù)是城市異構數(shù)據(jù)的核心,它比其他數(shù)據(jù)更加全面。因此,城市大腦項目在視覺方向投入的人力是最多的?!耙曈X數(shù)據(jù)在覆蓋面上沒有GPS數(shù)據(jù)好,因為它是斷面數(shù)據(jù),但視覺數(shù)據(jù)可以知道整個路口的詳盡情況。”華先勝說。
除了視覺感知、識別的基本問題外,城市大腦還涉及基于視覺的結構化數(shù)據(jù)之上的問題,例如搜索。和淘寶拍立淘的電商產(chǎn)品搜索一樣,城市大腦同樣需要對圖像進行實時索引。通過攝像頭的視覺數(shù)據(jù)進行城市的索引和搜索,這是該項目的突破之一。華先勝表示,從技術角度看,城市圖搜技術的整體路線和拍立淘是類似的。首先要知道目標在哪里,也就是目標檢測;然后需要識別車或人等移動目標,以及這些目標的屬性;最后要抽一個特征,一個高維向量,代表這個目標的本質特征。
然而,城市圖搜遠比商品搜索更復雜。同一商品的不同實例對于電商搜索而言是一樣的,但是相同型號、不同車主的車對于城市圖搜卻不相同。另外,人的特征描述和搜索也是一大挑戰(zhàn),在人臉看不清楚的情況下問題就變得非常棘手,這是實際應用場景中需要克服的難題。對于iDST視覺團隊而言,他們已經(jīng)走在了行業(yè)前列,目前在公開測試集上,該團隊的成績已經(jīng)超越了公開發(fā)布的最好結果。
人工智能的發(fā)展方興未艾,最近幾年國內外涌現(xiàn)了大批人工智能創(chuàng)業(yè)公司,能否商業(yè)化便是檢驗企業(yè)實力最好的標準。華先勝認為,人工智能商業(yè)化要滿足5個條件:第一個是算法,好的算法是基礎;第二個是數(shù)據(jù);第三個是用戶;第四個是平臺,要有強大的計算能力和一套體系架構(云計算已經(jīng)幫很多創(chuàng)業(yè)公司降低了門檻);第五個就是好的商業(yè)模式。
目前,人工智能企業(yè)大部分都專注于視覺應用,毫不夸張地說,計算機視覺領域已經(jīng)是紅海一片。不可否認,計算機視覺是人工智能落地最快的技術之一。華先勝認為,未來在視覺方向有五大應用趨勢。第一是交通安防,也就是城市大腦專注的方向;第二是富媒體,就是通過視覺的方法去挖掘大量的視頻、圖像數(shù)據(jù)的價值;第三是醫(yī)療圖像,雖然醫(yī)療領域的落地時間可能會稍微晚一點,但未來這是一大熱門;第四是工業(yè)視覺,未來可以通過攝像頭來代替過去絕大多數(shù)需要人眼來檢查、判斷的場景,這是一個尚待進一步開墾的領域;此外,用戶端上的視覺智能也是很好的方向,包括芯片和一些基于視覺的應用。
不難發(fā)現(xiàn),上述領域正是阿里云城市大腦、醫(yī)療大腦、工業(yè)大腦研發(fā)的方向,但不同領域存在的差異也是顯而易見的。在采訪的過程中,華先勝多次強調深入行業(yè)的重要性。人工智能正在逐漸滲透到各行各業(yè),但人工智能技術要發(fā)揮真正的作用,除了基礎的數(shù)據(jù)和算法之外,對場景的深入研究也尤為重要,否則人工智能描繪的藍圖再美好也只是黃粱一夢罷了。