王家耀
(河南大學,河南 鄭州 475001)
自大衛(wèi)·希爾伯特1900年宣布與人工智能(Artificial Intelligence,AI)有關(guān)的2個世界性難題以來已經(jīng)過百年,經(jīng)歷了夢想期、推理期、知識期和學習期,特別是近十余年來腦科學與智能感知技術(shù)和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,AI正在催生新的產(chǎn)業(yè),“智能+”正在快速跨界發(fā)展,“智慧大腦”在智慧城市、智慧交通、智能物流、智慧農(nóng)業(yè)、智慧醫(yī)療和智能電網(wǎng)等許多領(lǐng)域都得到了應(yīng)用。
英國維克托·邁爾·舍恩伯格和肯尼思·庫克耶所著的《大數(shù)據(jù)時代》開國外大數(shù)據(jù)研究之先河,大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型,即思維變革、商業(yè)變革和管理變革。
時空大數(shù)據(jù)是基礎(chǔ)地理數(shù)據(jù)與部門業(yè)務(wù)專題數(shù)據(jù)的融合,它的提出具有深刻的哲學依據(jù)和實踐需求,是大數(shù)據(jù)的深化研究,是人類面臨的問題的變化、人類需求的變化和技術(shù)發(fā)展變化的產(chǎn)物。
時空大數(shù)據(jù)平臺是“智慧大腦”三要素(智能感知系統(tǒng)、智能存儲管理系統(tǒng)和智能操作系統(tǒng))之一,AI賦能時空大數(shù)據(jù)平臺是新的發(fā)展趨勢。
AI是研究開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學,是計算機科學的一個分支。它試圖了解智能的實質(zhì),并生產(chǎn)出一種新的能與人類智能相似的方式做出反應(yīng)的智能機器。AI領(lǐng)域的研究包括機器人、語音識別、圖像識別、自然語言處理和專家系統(tǒng)等??偟膩碚f,AI研究的一個主要目標是使機器能夠勝任一些通常需要人類智能才能完成的復雜工作。
AI技術(shù)從提出至今已整整一百年,其間經(jīng)歷了夢想期、推理期、知識期和學習期這4個階段[1-2],這是AI逐步深化發(fā)展的過程。
(1) 夢想期(夢想探索)。最早由大衛(wèi)·希爾伯特在1900年宣布了23個世界性難題,其中第2和第10這2個問題與AI密切相關(guān),最終促成了計算機的發(fā)明;庫爾特·哥德爾于1931年提出了“哥德爾不完備性定理(AI不可能超過人類)”,被美國《時代周刊》評為20世紀最具影響力的數(shù)學原理;接著,艾倫·圖靈針對大衛(wèi)·希爾伯特提出的第10個問題中“機械化運算過程”(今天稱之為“算法”)設(shè)想出了一個機器——圖靈機,圓滿地刻畫出了“機械化運算過程”的含義,最終為計算機的發(fā)明做了鋪墊,并于1950年發(fā)表了《機器能思考嗎?》一文,提出了“圖靈測試”標準;馮·諾依曼于1945年提出了“馮·諾依曼體系結(jié)構(gòu)”,最終推動人類歷史進入了信息社會,使AI之夢成為可能;諾伯特·維納于1948年提出了“控制論”,揭示了用機器模擬人的可能性,為AI的提出奠定了重要基礎(chǔ)。
(2) 推理期(1956年AI元年)。約翰·麥卡錫、馬文·閔斯基(人工智能與認知學家)、克勞德·香農(nóng)(信息創(chuàng)始人)、艾倫·紐厄爾(計算機科學家)和赫伯特·西蒙(諾貝爾經(jīng)濟學獎得主)等于1956年8月聚集在美國達特茅斯學院開了2個月的會,主題是“用機器來模仿人類學習及其他方面的智能”。會議雖然未取得共識,但為討論的內(nèi)容取了一個名字——AI。因此,1956年成為AI元年。達特茅斯會議促使AI獲得了井噴式發(fā)展,概括起來主要有四大成果:① “機器定理證明”,以紐厄爾和西蒙等為代表,是最先取得重大突破的領(lǐng)域之一;② “四色定理”,由凱尼斯·阿佩爾和沃夫?qū)す系忍岢?,對于任意地圖,最少僅用4種顏色就可以染色該地圖,并使任意2個相鄰的國家(或行政區(qū)域)不會重色;③ “機器學習”,阿瑟·薩繆爾設(shè)計的跳棋程序具有自學習功能;④ “模式識別”,奧利弗·薩爾夫瑞德(1956年)、紐厄爾和西蒙(1957年)以及詹姆斯·斯拉格(1963年)等研制開辟了模式識別這一新領(lǐng)域。但是好景不長,自然語言理解成了AI的“硬骨頭”,AI研究遇到了挫折,項目研究經(jīng)費被削減。
(3) 知識期(專家系統(tǒng))。面對短暫的挫折,愛德華·費根鮑姆通過分析提出了傳統(tǒng)AI之所以會陷入僵局,是因為過于強調(diào)使用通用求解方法,而忽視了具體知識的運用,認為AI必須引入知識,于是一個新的研究領(lǐng)域——專家系統(tǒng)誕生了。第一個專家系統(tǒng)于1968年問世,隨后不斷涌現(xiàn)出各式各樣的專家系統(tǒng)。在1977年“第五屆人工智能大會”上提出了“知識工程”這個全新領(lǐng)域,在其刺激下,日本、英國、西歐、美國和中國等陸續(xù)推出有關(guān)計劃,致使20世紀60—90年代國內(nèi)外都出現(xiàn)了專家系統(tǒng)研究熱潮。但是,知識獲取這個新的棘手問題又擺在了面前。
(4) 學習期(自下而上的啟發(fā)式)。面對知識獲取的“知識工程”瓶頸問題,傳統(tǒng)的AI研究主張讓專家們自上而下地設(shè)計,被統(tǒng)稱為“符號學派”;而另外一些研究AI的人則主張通過自下而上的學習獲取知識,分別被稱為“連接學派”和“行為學派”。自20世紀80—90年代,三大學派形成了三足鼎立的局面?!胺枌W派”,以約翰·麥卡錫、紐厄爾和西蒙等為代表,集專家、知識、規(guī)則和推理于一體,多次人機大戰(zhàn)取勝;“連接學派”,即早先神經(jīng)網(wǎng)絡(luò)法(以沃倫·麥卡洛克和沃爾特·匹茲等為代表)、多層神經(jīng)網(wǎng)絡(luò)即BP算法(以杰夫·辛頓、阿瑟·布賴森等為代表)及統(tǒng)計學習理論(以弗拉基米爾·萬普尼克和亞歷克塞·澤范蘭杰斯為代表);“行為學派”與“符號學派”和“連接學派”不同,它是從簡單的昆蟲入手來理解智能是怎樣產(chǎn)生的,先后研制了機器昆蟲(羅德尼·布魯克斯)、遺傳算法(約翰·霍蘭)、蟻群算法以及模擬群體行為的免疫算法(克雷格·雷諾茲、肯尼迪等)。三大學派總的目標一致,但它們分別是從高、中、低3個層次來模擬AI,其理論基礎(chǔ)和計算機模型都存在很大差異,而現(xiàn)實中的AI系統(tǒng)卻是一個整體,三大學派正是在這樣的“分裂與統(tǒng)一”中使AI進入了新世紀。
20世紀60—90年代,國內(nèi)外先后曾出現(xiàn)專家系統(tǒng)研究熱潮,處于“知識期”,可是后來熱潮卻不在了。原因是什么呢?錢學森先生早在1984年就指出過,“我以為外國人工智能工作,似乎急于求成,而基礎(chǔ)理論工作不扎實。我們當然最后要取得應(yīng)用成果,但不能沒有理論指導,理論與實踐相結(jié)合?!盵3]時隔17年后,李娜在2011年的《科技導報》發(fā)表文章《被批20年無進展,人工智能需要重啟》指出,為什么沒有機器人能夠修復日本的核反應(yīng)堆?原因是AI研究在20世紀60年代和70年代取得了很大進步,但隨后走上了錯誤道路。作者引用AI和認知科學領(lǐng)域的奠基人馬文·閔斯基和帕特里克·溫斯頓的話:“過去20年中AI本來是應(yīng)該取得更大進展的,問題發(fā)生在20世紀80年代,AI研究資金開始枯竭,研究人員嘗試探索商業(yè)化AI,由此產(chǎn)生的最大問題是AI研究的狹窄和專業(yè)化,而基礎(chǔ)問題研究無人問津,沒有進展。因此主張回歸早期的研究模式,讓狹窄的應(yīng)用驅(qū)動研究回歸到好奇心驅(qū)動研究。沒有理論指導,研究工作就不可能持久[4]”。
后來的事實證明,AI“回歸基礎(chǔ)”后出現(xiàn)了好的轉(zhuǎn)機。進入21世紀以來,由于重視了AI基礎(chǔ)理論研究,取得了一大批理論與應(yīng)用成果[2,5-14]。
因此,我們要從AI百年發(fā)展的“曲折道路”中吸取經(jīng)驗教訓。應(yīng)該像在這個領(lǐng)域做出杰出貢獻的科學家們那樣,不斷前行,挑戰(zhàn)極限,克服當前“急功近利”的做法;應(yīng)該學習當年(1956年8月)麥卡錫等科學家們齊聚達特茅斯學院,用2個月時間圍繞一個主題進行交流討論的精神,克服當前科技界的“浮躁之風”“趕集之風”;要像老一代科學家那樣,對待科學問題要提倡爭論,如果沒有當年關(guān)于AI“三大學派”的分裂與統(tǒng)一,怎么可能有今天的AI蓬勃發(fā)展的大好局面呢?
大數(shù)據(jù),是社會大眾普遍的提法,為什么提出“時空大數(shù)據(jù)”?時空大數(shù)據(jù)與大數(shù)據(jù)各自的內(nèi)涵和特征是什么?這是首先要搞清楚的。
(1) 時空大數(shù)據(jù)的哲學依據(jù)和實踐需求,核心是大數(shù)據(jù)的時空統(tǒng)一觀
從哲學角度看,世界是物質(zhì)的,物質(zhì)是運動的,包括人類活動在內(nèi)的萬事萬物的運動變化都是在一定的時間和空間進行的,而所有大數(shù)據(jù)都是包括人類活動在內(nèi)的萬事萬物的運動變化的產(chǎn)物,空間參照和時間參照是大數(shù)據(jù)的2個基本特征,這就是哲學時空觀。
從作戰(zhàn)指揮和軍事行動的實踐需求看,“戰(zhàn)略是時間和空間的使用藝術(shù)”,任何軍事行動都是在一定的時間和空間進行的,過去、現(xiàn)在、未來都是如此。時空統(tǒng)一至關(guān)重要,這就是作戰(zhàn)指揮和軍事行動的時空觀。
從社會管理治理的實踐需求看,當今社會的一個重要特點,是社會管理治理對時間和空間的依賴程度越來越高,時空大數(shù)據(jù)正日益成為社會治理體系和治理能力現(xiàn)代化的核心驅(qū)動力,這就是社會管理治理的時空觀。
從復雜地理世界表達的實踐需求來看,非線性復雜地理世界,必須用時間軸(Ti)、空間軸(Si—XiYiZi)和屬性軸(Di)(i=1,2,…,n)的n維空間來表達才是科學的,這就是復雜地理世界表達的時空觀。
從大數(shù)據(jù)的本質(zhì)來看,所有大數(shù)據(jù)都是包括人類活動在內(nèi)的萬事萬物在一定時間和空間運動變化產(chǎn)生的,空間參照和時間參照是自然與社會現(xiàn)象的基本參照系統(tǒng),任何事物和現(xiàn)象都離不開這2個基本參照,這就是大數(shù)據(jù)的時空觀。
(2) 時空大數(shù)據(jù)內(nèi)涵
基于上述時空大數(shù)據(jù)的哲學依據(jù)和實踐需求,時空大數(shù)據(jù)是指基于統(tǒng)一的時空基準(空間參照系統(tǒng)、時間參照系統(tǒng)),存在于空間與時間中,與位置直接(定位)或間接(時空分布)相關(guān)聯(lián)的大規(guī)模海量數(shù)據(jù)集。由“基礎(chǔ)地理時空數(shù)據(jù)”和“部門行業(yè)專題數(shù)據(jù)”融合而成?;A(chǔ)地理時空數(shù)據(jù),包括時空基準數(shù)據(jù)、GNSS與CORS數(shù)據(jù)、空間大地測量與物理測量數(shù)據(jù)、海洋測繪和海圖數(shù)據(jù)、攝影測量數(shù)據(jù)、遙感影像數(shù)據(jù)、“4D”數(shù)據(jù)和地名數(shù)據(jù)等;部門行業(yè)專題數(shù)據(jù),包括政府部門/企業(yè)/研究院所業(yè)務(wù)數(shù)據(jù)和科學數(shù)據(jù)、視頻觀測數(shù)據(jù)、搜索引擎數(shù)據(jù)、網(wǎng)絡(luò)空間數(shù)據(jù)、社交網(wǎng)絡(luò)數(shù)據(jù)、變化檢測數(shù)據(jù)、與位置相關(guān)的空間媒體數(shù)據(jù)和人文地理數(shù)據(jù)等。
(3) 時空大數(shù)據(jù)的基本特征
不同于大數(shù)據(jù)的4V(Volume,Variety,Velocity,Value)特征,時空大數(shù)據(jù)的基本特征主要包括:
① 位置特征。點、線、面的三維空間位置(Si—XiYiZi),點、線、面的空間關(guān)系(拓撲、方向、變量);由點構(gòu)成線,由點、線構(gòu)成面,由點、線、面構(gòu)成體。
② 屬性特征。每個點、線、面、體都有自身的數(shù)量、質(zhì)量特征。
③ 時間特征。物體(現(xiàn)象)的位置、屬性等隨時間變化而變化。
④ 尺度特征??臻g尺度或比例尺隨應(yīng)用需求而不同,大比例尺為小尺度,小比例尺為大尺度。
⑤ 分辨率特征(針對影像)。包括空間分辨率、光譜分辨率和時間分辨率(重訪周期)。
⑥ 異構(gòu)性特征。包括時空基準、時間、尺度和語義等的不一致性和不完整。
⑦ 多樣性特征。數(shù)據(jù)類型多樣(圖像、文本、視頻和音頻)、數(shù)據(jù)結(jié)構(gòu)多樣(結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化)。
⑧ 巨量性特征。指數(shù)據(jù)量巨大,達到TB,PB,EB甚至ZB級,需要科學先進的存儲管理技術(shù)。
⑨ 多維特征。空間維(Si—XiYiZi)、屬性維(Di)和時間維(Ti)構(gòu)成多維數(shù)據(jù)。
⑩ 價值隱含性特征。指大量不相關(guān)的信息,需要關(guān)聯(lián);數(shù)據(jù)隱含價值,需要進行數(shù)據(jù)挖掘以發(fā)現(xiàn)知識。
把各種分散的(點數(shù)據(jù))和分割的(條數(shù)據(jù))時空大數(shù)據(jù)匯聚到一個特定的自主可控的平臺(GIS)上,并使之發(fā)生持續(xù)的聚合效應(yīng)。這種聚合效應(yīng)就是通過數(shù)據(jù)多維融合和關(guān)聯(lián)分析與數(shù)據(jù)挖掘,揭示事物的本質(zhì)規(guī)律,對事物做出更加快捷、更加全面、更加精準和更加有效的研判和預(yù)測。從這個意義上講,時空大數(shù)據(jù)平臺是大數(shù)據(jù)的核心價值,是大數(shù)據(jù)發(fā)展的高級形態(tài),是大數(shù)據(jù)時代的解決方案。
(1) “智慧大腦”的三要素。類比人類智能的人腦具有感知、存儲管理、分析判斷決策功能,AI的“智慧大腦”也應(yīng)由智能感知系統(tǒng)、智能存儲管理系統(tǒng)和智能操作系統(tǒng)(分析判斷決策)組成。
智能感知系統(tǒng)——天地一體智能感知網(wǎng)(傳感器網(wǎng))。建設(shè)天地一體智能感知系統(tǒng),綜合統(tǒng)籌利用國內(nèi)外各類衛(wèi)星遙感影像數(shù)據(jù),特別是商業(yè)衛(wèi)星數(shù)據(jù),并進行快速處理。充分利用無人機多角度傾斜攝影數(shù)據(jù),并進行自動三維建模,為構(gòu)建“數(shù)字地表模型(DSM)+局部實景三維+重點建筑信息模型(BIM)”的三維模型奠定基礎(chǔ)。充分發(fā)揮融合體制的作用,加強基礎(chǔ)地理時空數(shù)據(jù)的生產(chǎn)和更新,最大限度地縮短生產(chǎn)、更新周期。充分利用“時空大數(shù)據(jù)+衛(wèi)星遙感影像+開源情報信息”模式,通過分析獲得敏感地區(qū)、敏感領(lǐng)域、敏感設(shè)施和敏感對象的信息。
智能存儲管理系統(tǒng)——資源池。指云計算數(shù)據(jù)中心所涉及的各種硬件、軟件、數(shù)據(jù)和知識等的集合。按其類型可分為:信息基礎(chǔ)設(shè)施資源池,包括計算資源、存儲資源和網(wǎng)絡(luò)資源;數(shù)據(jù)資源池,包括基礎(chǔ)地理時空數(shù)據(jù)、政府各部門行業(yè)的專題數(shù)據(jù)及其他專題數(shù)據(jù);功能資源池,包括軟件資源、模型算法資源、知識資源和專家資源。云計算是將計算任務(wù)分布式部署在由大量計算機(計算、存儲)構(gòu)成的“資源池”上,使用戶能按需獲取計算能力、存儲能力和提供應(yīng)用的能力。這種“資源池”稱為“云”,云計算的核心是“資源池”。采用中心、分中心技術(shù)體制,建設(shè)一體化國家、省、市時空大數(shù)據(jù)中心。一體化時空大數(shù)據(jù)中心主要功能有:傳感器網(wǎng)絡(luò)(簡稱“傳感網(wǎng)”)接入功能、時空大數(shù)據(jù)分布式存儲、管理和動態(tài)更新功能、已建分布式地理信息系統(tǒng)(GIS)、數(shù)據(jù)庫的網(wǎng)格化(第三代互聯(lián)網(wǎng)/新一代Web)集成應(yīng)用功能以及網(wǎng)絡(luò)空間數(shù)據(jù)安全態(tài)勢監(jiān)控與防范功能。
智能操作系統(tǒng)——時空大數(shù)據(jù)平臺?!爸腔鄞竽X”通過“天空地?!币惑w的智能感知傳感器網(wǎng)絡(luò)獲取海量信息;資源池存儲管理信息基礎(chǔ)設(shè)施資源(計算、存儲和網(wǎng)絡(luò))、時空大數(shù)據(jù)資源(基礎(chǔ)地理時空數(shù)據(jù)、各部門行業(yè)數(shù)據(jù)、科技咨詢信息數(shù)據(jù))和功能資源(軟件、模型、算法、知識和專家)?!爸腔鄞竽X”怎樣進行分析、判斷、預(yù)警和輔助決策呢?這就需要有一個“操作系統(tǒng)”——“時空大數(shù)據(jù)平臺”。時空大數(shù)據(jù)平臺的功能包括一體化時空大數(shù)據(jù)中心數(shù)據(jù)接入功能,多源異構(gòu)時空大數(shù)據(jù)融合功能,時空大數(shù)據(jù)分析、數(shù)據(jù)挖掘與知識發(fā)現(xiàn)功能,目標分析識別功能,時空大數(shù)據(jù)可視化及可視化設(shè)計功能,分析、判斷、預(yù)警和輔助決策功能,時空大數(shù)據(jù)平臺應(yīng)用接口功能,網(wǎng)絡(luò)空間安全態(tài)勢監(jiān)控和防范功能等。
(2) “智慧大腦”三要素之間的關(guān)系:相互聯(lián)系、相互依賴、相互制約、相互作用的統(tǒng)一整體。智能感知系統(tǒng)獲取的大規(guī)模海量數(shù)據(jù),需要存儲在資源池中,若沒有資源池,感知系統(tǒng)獲得的大規(guī)模海量數(shù)據(jù)就無法匯聚在一起,更無法共享;反之,若沒有感知系統(tǒng)獲得的大規(guī)模海量數(shù)據(jù),資源池就成了一個“空池”;同樣,若僅有感知系統(tǒng)和存儲管理系統(tǒng),而沒有操作系統(tǒng)——時空大數(shù)據(jù)平臺,那么大規(guī)模海量數(shù)據(jù)和各類資源就無法發(fā)揮其服務(wù)社會的作用。所以,“智慧大腦”三要素是一個整體,缺一不可。
(3) “智慧大腦”三要素中的任何一個要素內(nèi)部的各組成部分也是一個統(tǒng)一整體。以存儲管理系統(tǒng)為例,包括數(shù)據(jù)資源(基礎(chǔ)地理時空數(shù)據(jù)、各部門行業(yè)專題數(shù)據(jù))、功能資源(模型、算法)和計算資源(計算能力或算力)。形象地講,若把資源池比作一個“發(fā)電廠”,那么,計算存儲資源就相當于“發(fā)電機”,數(shù)據(jù)資源就相當于“發(fā)電動力”,模型算法等功能就相當于“引擎”,三者缺一不可,是一個整體或系統(tǒng)。所以,一定要用整體或系統(tǒng)工程的思想來建設(shè)“智慧大腦”。
這主要表現(xiàn)在3個方面:
(1) 北斗全球?qū)Ш较到y(tǒng)為全球?qū)崟r高精度定位提供了強大支撐,衛(wèi)星對地觀測系統(tǒng)為環(huán)境信息獲取奠定了堅實基礎(chǔ)。采用“統(tǒng)一時空基準+北斗全球?qū)Ш较到y(tǒng)+天地一體對地觀測網(wǎng)”的模式,解決時空信息獲取的全球化、實時/準實時動態(tài)化和精準化問題。
(2) 分布異構(gòu)地理信息系統(tǒng)的網(wǎng)格化集成與智能服務(wù)技術(shù)使已建GIS數(shù)據(jù)和數(shù)據(jù)庫數(shù)據(jù)繼續(xù)發(fā)揮作用。對于已建遺留系統(tǒng),由于系非面向服務(wù)的體系架構(gòu)(SOA),通過開發(fā)數(shù)據(jù)中間件、協(xié)同中間件和事務(wù)中間件,以解決系統(tǒng)間的數(shù)據(jù)交互、消息傳遞、協(xié)同工作及事務(wù)處理等問題;對于新建SOA系統(tǒng),通過進行標準化服務(wù)封裝,主要解決各類地理空間信息服務(wù)的標準化問題。
(3) 時空信息獲取、處理(生產(chǎn))、應(yīng)用(服務(wù))一體化技術(shù)可行,關(guān)鍵是新型技術(shù)體制建設(shè)。主要通過基于網(wǎng)格(Grid)的深度聯(lián)網(wǎng)計算和服務(wù)環(huán)境,實現(xiàn)邏輯上的信息探測網(wǎng)、信息處理網(wǎng)和應(yīng)用服務(wù)網(wǎng)的3類網(wǎng)絡(luò)的優(yōu)化集成,以提高時空信息獲取、處理(生產(chǎn))、應(yīng)用(服務(wù))的一體化水平,盡最大可能地縮短從地理信息獲取到提供地理信息服務(wù)的周期。
(1) 機器學習由淺層神經(jīng)網(wǎng)絡(luò)到深層神經(jīng)網(wǎng)絡(luò)(深度學習)的發(fā)展為解決時空大數(shù)據(jù)平臺的“知識工程”瓶頸問題開辟了一條新的途徑。
這就是用大數(shù)據(jù)教會計算機自己不斷學習以獲取知識。機器學習是AI的一個分支,它是通過算法使機器能從大量歷史數(shù)據(jù)中學習規(guī)律,從而對新的樣本做出智能識別或?qū)ξ磥碜龀鲱A(yù)測。神經(jīng)網(wǎng)絡(luò)的前世是基于統(tǒng)計方法的淺層機器學習模型,經(jīng)歷了人工神經(jīng)網(wǎng)絡(luò)BP算法、支持向量機(SVM)和最大熵算法等;神經(jīng)網(wǎng)絡(luò)的今生是基于大數(shù)據(jù)方法的深度學習(2006年),特征提取和表示是關(guān)鍵,主要包括卷積神經(jīng)網(wǎng)絡(luò)(1998年)、基于自編碼器的深層學習、受限玻爾茲曼機和深度網(wǎng)絡(luò)等,主要用于語言識別、圖像識別和自然語言處理,其優(yōu)勢是用大數(shù)據(jù)教會計算機自己學習。
(2) 類腦智能研究將為“智慧大腦”的智能化打開一扇大門。
類腦智能是AI領(lǐng)域的一個研究方向,是AI發(fā)展的另一條路徑,將成為AI發(fā)展的最佳方向。AI領(lǐng)域的專家認為,基于機器學習的AI技術(shù)已深入到許多領(lǐng)域,但是機器學習往往需要大量的數(shù)據(jù),而且還面臨無法進行推理的困境。正是在這種情況下,科學家們開始轉(zhuǎn)向?qū)Υ竽X的借鑒與研究。
類腦(Brain-inspired Intelligence)——模擬人腦,類腦智能——模擬人腦的類腦計算機,是AI發(fā)展的重要途徑,通過發(fā)展類腦智能可以揭示人腦信息處理的途徑,有利于完善AI研究。
為什么要研究類腦和類腦智能?一是,機器學習不靈活,需要大規(guī)模人工標注的高質(zhì)量樣本數(shù)據(jù);二是,訓練模型要很大的計算開銷;三是,AI仍然缺乏高級認知能力和舉一反三的能力。
目前,類腦智能的研究已經(jīng)有了良好的開端,取得了一些研究成果,但仍面臨三大瓶頸:腦機理認知不清楚、類腦計算模型和算法不精確以及計算架構(gòu)和能力受制約。
(3) AI“三駕馬車”或“三要素”,即算法、時空大數(shù)據(jù)和計算能力,已成為時空大數(shù)據(jù)平臺的核心驅(qū)動力。
算法,指某個領(lǐng)域某個問題的有窮地機械地判定(計算)。它只用有窮多條指令描述,計算機便按指令執(zhí)行有窮步的計算過程,從而得出問題解的結(jié)果。從本質(zhì)上講,算法本身就是一種知識。算法是機器學習的核心(是引擎)。以算法為核心的AI與人腦相比較至少有四大優(yōu)勢:速度更快、效率更高、結(jié)果更好、耐力更強。
時空大數(shù)據(jù),是AI(機器學習)的動力(類比發(fā)電廠的水動力、煤動力和核動力),沒有時空大數(shù)據(jù),算法就不起作用,數(shù)據(jù)質(zhì)量不好,就會算不準。
計算能力(算力)。云計算是一種新的計算模式,它通過“池化”和“云化”把數(shù)千臺甚至上萬臺機器都放在一個“池子”里面。用戶需要多少CPU、內(nèi)存和硬盤的“虛擬電腦”,只要通過一種叫做“調(diào)度(Scheduler)”的算法的調(diào)度中心,就可以在“池子”里面找到并使用自己所需要的信息資源,這就是基礎(chǔ)設(shè)施即服務(wù)(IaaS),具有時間彈性和空間彈性。云計算為信息資源管理構(gòu)建一個龐大的“資源池”,實現(xiàn)信息資源的彈性。云計算在資源彈性IaaS之上加了一層應(yīng)用彈性,以解決時空大數(shù)據(jù)所需的應(yīng)用彈性平臺即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)。
上述AI“三要素”中的算法、時空大數(shù)據(jù)和計算能力三者缺一不可,但當前要把可控的智能算法研究放在更重要位置。
時空大數(shù)據(jù)平臺必須采用不同于目前已有商業(yè)化GIS軟件的技術(shù)體制,針對現(xiàn)有GIS軟件應(yīng)用存在的問題提出了更科學和更符合社會需求的應(yīng)用模式。為此,必須首先對現(xiàn)有的地理信息服務(wù)模式進行分析。
目前,地理信息服務(wù)有3種模式:① 基于網(wǎng)絡(luò)服務(wù)(Web Service)的空間信息共享和空間數(shù)據(jù)互操作技術(shù)模式;② 基于網(wǎng)格服務(wù)(Grid Service)的信息資源共享與協(xié)同工作(解決問題)技術(shù)模式;③ 基于云計算的時空信息服務(wù)技術(shù)模式。
對上述3種服務(wù)模式,從其內(nèi)涵、功能、關(guān)鍵技術(shù)、采用標準、技術(shù)架構(gòu)、服務(wù)共享特點和發(fā)展趨勢等7個方面進行了全面分析,得出了如下綜合分析結(jié)論:
第一,4種模式都采用SOA。
第二,都是解決“共享”與“服務(wù)”的問題,只不過“共享”的“程度”與“服務(wù)”的范圍、方式不完全相同。
第三,網(wǎng)絡(luò)服務(wù)與網(wǎng)格服務(wù)的技術(shù)標準有相同的,也有不同的,網(wǎng)絡(luò)服務(wù)與網(wǎng)格服務(wù)的大趨勢是兼容或“融合”,但標準是統(tǒng)一的國際或國家標準,服務(wù)提供方、請求方都必須清楚;而云服務(wù)標準可以是內(nèi)部統(tǒng)一的,用戶不必清楚。
第四,網(wǎng)格服務(wù)是網(wǎng)絡(luò)服務(wù)的發(fā)展,云服務(wù)(Cloud Service)是網(wǎng)格服務(wù)的簡化版或商業(yè)化實現(xiàn)。
基于前述對現(xiàn)有時空信息服務(wù)的3種技術(shù)模式的綜合分析及所得出的結(jié)論,提出了時空大數(shù)據(jù)平臺采用基于“網(wǎng)格集成”與“彈性云”的混合式技術(shù)模式。這是因為,網(wǎng)格服務(wù)是網(wǎng)絡(luò)服務(wù)的發(fā)展,可以解決廣義的信息資源共享,推進技術(shù)融合、業(yè)務(wù)融合和數(shù)據(jù)融合,實現(xiàn)跨層級、跨地域、跨系統(tǒng)、跨部門和跨業(yè)務(wù)的協(xié)同管理和服務(wù);而云服務(wù)是網(wǎng)格服務(wù)的簡化版或商業(yè)化實現(xiàn),相對于網(wǎng)格服務(wù)而言其門檻要低,而且云計算具有“空間彈性”和“時間彈性”。所以,時空大數(shù)據(jù)平臺的技術(shù)體制兼顧了網(wǎng)格服務(wù)與云服務(wù)的優(yōu)點,即通過網(wǎng)格集成匯聚各類信息資源,通過彈性云向各類用戶提供所需服務(wù)。
為實現(xiàn)時空大數(shù)據(jù)平臺的技術(shù)體制,提出如下6項關(guān)鍵技術(shù):
(1) 一個“SOA”:構(gòu)建一個開放的體系架構(gòu),強化共用,整合通用,開放應(yīng)用。SOA由3個角色和4個基本操作構(gòu)成。3個角色包括服務(wù)提供者、服務(wù)請求者和服務(wù)注冊中心;4個基本操作是服務(wù)注冊(描述/發(fā)布)、服務(wù)查找(訪問/定位)、綁定服務(wù)和調(diào)用服務(wù)。
(2) 一張“網(wǎng)”:建設(shè)一張“天地”一體的信息服務(wù)網(wǎng),為實現(xiàn)信息資源共享和跨層次、跨地域、跨系統(tǒng)、跨部門、跨業(yè)務(wù)的多節(jié)點協(xié)同工作提供嶄新的運行環(huán)境。其一,城市時空信息獲取、處理、服務(wù)的一體化運行環(huán)境和時空信息處理的實時化、處理的智能化、應(yīng)用服務(wù)的網(wǎng)絡(luò)/網(wǎng)格化環(huán)境;其二,信息整合,實現(xiàn)多源、異構(gòu)時空數(shù)據(jù)集成、融合與同化的環(huán)境,提供全球一致、陸海一體、無縫連續(xù)的一致性時空信息服務(wù);其三,資源共享環(huán)境,實現(xiàn)SaaS,KaaS,PaaS,DaaS,IaaS等;其四,協(xié)同工作(協(xié)同解決問題)環(huán)境;其五,分布異構(gòu)地理信息系統(tǒng)集成應(yīng)用環(huán)境。
(3) 一個“一體化”數(shù)據(jù)體系:建設(shè)一個科學實用的全球一致、無縫連續(xù)的時空大數(shù)據(jù)體系。對傳感器網(wǎng)接入數(shù)據(jù),各部門行業(yè)及其他來源的信息資源數(shù)據(jù),進行數(shù)據(jù)分類、數(shù)據(jù)編目,編制元數(shù)據(jù),進行數(shù)據(jù)編碼,為時空大數(shù)據(jù)平臺提供了一致性的數(shù)據(jù)集支持。
(4) 一個“通用功能模塊集”:將各類“服務(wù)”按標準封裝為網(wǎng)絡(luò)服務(wù),實現(xiàn)基于工作流服務(wù)鏈的各類信息資源的高效調(diào)用,支撐信息服務(wù)的智能化。這里,最關(guān)鍵的是構(gòu)建工作流服務(wù)鏈,而且應(yīng)是自適應(yīng)的。具體實施時,首先將系統(tǒng)功能按照標準封裝為網(wǎng)絡(luò)/網(wǎng)格服務(wù),而用戶則基于自適應(yīng)工作流服務(wù)鏈接需組合服務(wù)形成面向各類應(yīng)用的服務(wù)能力。
(5) 一個科學實用的“組織管理體系”:采用虛擬化技術(shù)構(gòu)建虛擬組織(V0),實現(xiàn)信息資源的匯聚共享和跨層級、跨地域、跨系統(tǒng)、跨部門、跨業(yè)務(wù)的協(xié)調(diào)聯(lián)動,為平臺安全可靠運行提供支撐。采用虛擬化技術(shù)構(gòu)建的虛擬組織(V0),必須與國家、省(自治區(qū)、直轄市)、地級市、縣(區(qū))及各自下屬政府部門的社會組織體系結(jié)構(gòu)一致,它們都在虛擬組織的網(wǎng)絡(luò)節(jié)點上。虛擬組織分為2類,一類是靜態(tài)V0,以資源為中心,固定存在,執(zhí)行信息資源發(fā)布功能;另一類是動態(tài)V0,以任務(wù)為中心,隨建隨銷,執(zhí)行信息資源共享和服務(wù)。二者互相配合,構(gòu)成了資源共享生命周期管理的主體。
(6) 一套“標準體系”:建立一套標準體系,保證時空大數(shù)據(jù)平臺規(guī)范、有序、健康、安全且可持續(xù)運行,這是目前急需研究解決的問題。國外,地理信息標準和網(wǎng)絡(luò)/網(wǎng)格(柵格網(wǎng))服務(wù)的標準基本已成體系,例如服務(wù)分類標準、服務(wù)描述標準、服務(wù)注冊標準,以及服務(wù)提供者、請求者與服務(wù)代理之間的通信標準、網(wǎng)絡(luò)/網(wǎng)格化服務(wù)標準。國內(nèi),地理信息標準已基本成體系,網(wǎng)絡(luò)/網(wǎng)格服務(wù)標準已取得一些研究成果,但尚未形成自主可控的統(tǒng)一的標準體系。
采用什么樣的應(yīng)用模式,才能使時空大數(shù)據(jù)平臺最大限度地發(fā)揮作用,這個問題至關(guān)重要。這里提出“共用時空大數(shù)據(jù)平臺+”的應(yīng)用模式。
共用時空大數(shù)據(jù)平臺,指按照“時空大數(shù)據(jù)平臺”內(nèi)涵和技術(shù)體制構(gòu)建的“基礎(chǔ)地理時空數(shù)據(jù)平臺”,是各種不同層級部門共用的?!肮灿脮r空大數(shù)據(jù)平臺+”中的“+”,指跨界,這樣就可以解決目前各所屬部門所建各種“平臺”或“系統(tǒng)”的“基礎(chǔ)地理時空數(shù)據(jù)”不一致的“老大難”問題。這里就“共用時空大數(shù)據(jù)平臺+民用”而言,以服務(wù)黃河流域生態(tài)保護與高質(zhì)量發(fā)展為例,可以構(gòu)建:
“共用時空大數(shù)據(jù)平臺+沿河兩岸分布的湖泊、濕地、生態(tài)廊道數(shù)據(jù)”,構(gòu)建智慧沿河兩岸湖泊、濕地、生態(tài)廊道監(jiān)測、評估、預(yù)警平臺;
“共用時空大數(shù)據(jù)平臺+河口三角洲濕地及生物多樣性數(shù)據(jù)”,構(gòu)建智慧河口三角洲濕地及生物多樣性監(jiān)測、評估、預(yù)警平臺;
“共用時空大數(shù)據(jù)平臺+流域礦藏資源數(shù)據(jù)”,構(gòu)建智慧流域礦藏資源動態(tài)監(jiān)測、評估與預(yù)警平臺;
“共用時空大數(shù)據(jù)平臺+流域社會經(jīng)濟人文統(tǒng)計數(shù)據(jù)”,構(gòu)建智慧流域經(jīng)濟發(fā)展趨勢監(jiān)測、分析、評估平臺;
“共用時空大數(shù)據(jù)平臺+農(nóng)作物主產(chǎn)區(qū)數(shù)據(jù)”,構(gòu)建智慧農(nóng)業(yè)平臺;
“共用時空大數(shù)據(jù)平臺+黃土高原水土流失數(shù)據(jù)”,構(gòu)建智慧黃土高原水土流失和生態(tài)修復監(jiān)測、分析與評估平臺;
“共用時空大數(shù)據(jù)平臺+城市(鎮(zhèn))群或城市(鎮(zhèn))帶”,構(gòu)建智慧城市時空大數(shù)據(jù)平臺等等。
AI時代正在到來是時代之大勢,“AI+”也是時代之大勢,AI賦能時空大數(shù)據(jù)平臺是“AI+”的一個重要研究領(lǐng)域。
“智慧大腦”三要素(智能感知系統(tǒng)、智能存儲管理系統(tǒng)、智能操作系統(tǒng))無一不與AI技術(shù)有關(guān),三要素中的任何一個要素的各組成部分也無一不與AI技術(shù)有關(guān),可以說AI技術(shù)已經(jīng)或正在滲透(融合)到“智慧大腦”的方方面面。智能感知系統(tǒng)、智能存儲管理系統(tǒng)是支撐智能時空大數(shù)據(jù)平臺的,而智能時空大數(shù)據(jù)平臺是面向社會、面向服務(wù)和面向工作的。
目前,AI技術(shù)應(yīng)用于“智慧大腦”建設(shè)已取得了很大進展。但是,要建成真正的“智慧大腦”,實現(xiàn)“智慧大腦”三要素的智能化,特別是建成真正的智能時空大數(shù)據(jù)平臺,還有許多問題需要進一步地深入研究。我們堅信,這個目標是一定能夠?qū)崿F(xiàn)的。