莊越挺,蔡銘,李學龍,羅先剛,楊強,吳飛
a College of Computer Science and Technology, Zhejiang University, Hangzhou 310027, China
b School of Computer Science, Northwestern Polytechnical University, Xi'an 710129, China
c Institute of Optics and Electronics, Chinese Academy of Sciences, Chengdu 610209, China
d Department of Computer Science and Engineering, Hong Kong University of Science and Technology, Hong Kong 999077, China
人工智能(AI)是以機器為載體實現(xiàn)的人類智能。支撐AI發(fā)展的相關(guān)技術(shù)在過去20多年取得了較大發(fā)展,推動了AI在語言理解、視覺識別和智能數(shù)字助理等領(lǐng)域的成功應(yīng)用。雖然當代AI系統(tǒng)在特定的預定義任務(wù)方面表現(xiàn)甚優(yōu),但它仍然無法從數(shù)據(jù)或經(jīng)驗、直覺推理和功能適應(yīng)性等方面進行獨立學習。為了克服這些不足,我們需要從學科交叉角度來推動AI的發(fā)展。因此,AI的下一個突破需要我們在學科交叉方面進行努力,這就要求我們要利用神經(jīng)科學、物理學、數(shù)學、電子工程學、生物學、語言學和心理學等來實現(xiàn)AI的重大理論、技術(shù)和應(yīng)用創(chuàng)新,以及解決復雜的社會問題和重塑國家工業(yè)體系等。
AI業(yè)已成為人類探索宇宙的重要使能技術(shù)。從第一張黑洞圖片合成、太陽耀斑預測、月球表面地圖繪制、宇宙中外星智慧生命的搜尋,再到暗物質(zhì)研究,都離不開AI對海量數(shù)據(jù)的深度挖掘與分析能力[1]。與此同時,AI也正在為各類在軌飛行任務(wù)賦能助力。
AI使空間探測器變得更獨立、更可靠、更自主。例如,美國國家航空航天局(NASA)的“洞察”號(InSight)火星探測器在從穿越火星大氣層到降落至火星表面的過程中,由于測控信號微弱、通信延遲,使得地面無法對其進行遠程控制,所以為了成功著陸,InSight必須自主地執(zhí)行數(shù)十項操作,并且要完美地完成這些操作。在NASA的下一個火星探測計劃中,AI將被用于進行軌道和有效載荷優(yōu)化[2]。
AI有助于加快衛(wèi)星的“智能化”演變。Lockheed Martin研發(fā)了“SmartSat”,它是一種采用軟件定義的衛(wèi)星架構(gòu),該架構(gòu)允許用戶通過軟件更新來改變在軌衛(wèi)星的任務(wù)。這種軟件定義的解決方案不僅提高了衛(wèi)星的靈活性和智能性,而且其可重復使用性也降低了衛(wèi)星的運行成本,然而,這是傳統(tǒng)的硬件定義的衛(wèi)星所無法實現(xiàn)的。另外,一系列編隊飛行的智能衛(wèi)星可以建立一個分布式AI平臺,這些衛(wèi)星可同時進行在軌學習訓練、快速部署、在線推理和智能計算,使得更多的工作被直接在太空完成,而不需要被傳回地面進行處理,這極大地提高了太空任務(wù)的運作效率,減少了通信成本。
太空探索之旅充滿了未知和不確定性。當前在軌運行飛行器的控制邏輯主要依賴于針對所有潛在場景的預編程系統(tǒng),而該系統(tǒng)無法靈活應(yīng)對新的、不可預見的情況。通過引入新型的機器學習(ML)機制[3],這些系統(tǒng)在在軌運行期間有望能夠持續(xù)自主學習、不斷適應(yīng)新的任務(wù)和環(huán)境,并將已有的學習能力應(yīng)用于新的場景,從而更好地完成自主任務(wù)規(guī)劃、自主健康管理以及在軌載荷數(shù)據(jù)處理等任務(wù)。此外,通過故障智能自修復技術(shù)[4],這些系統(tǒng)也有望降低故障與異常處理的人工干預次數(shù),從而實現(xiàn)全任務(wù)過程中故障識別、隔離、處理和效果評估的自動閉環(huán)流程。
“忽如一夜春風來,千樹萬樹梨花開”,AI似乎在各個領(lǐng)域突然產(chǎn)生了強烈的“綻放”(blooming)效果。ML作為AI的核心,其在理解和利用海量數(shù)據(jù)方面取得了長足進步。最近,AI領(lǐng)域在計算能力及大量數(shù)據(jù)處理方面也取得了一定進展。由于醫(yī)療保健和醫(yī)學領(lǐng)域所產(chǎn)生的巨大的數(shù)據(jù)量,以及醫(yī)療設(shè)備和數(shù)字記錄系統(tǒng)的不斷涌現(xiàn),AI在醫(yī)療保健和醫(yī)學領(lǐng)域[5]更是得到了有效的發(fā)展。目前整個醫(yī)療系統(tǒng)越來越多地采用了大數(shù)據(jù)處理方法,相關(guān)數(shù)據(jù)經(jīng)處理后可形成不同的表現(xiàn)形式,進而形成更多基于證據(jù)的健康決策。
AI除了對人類健康有積極影響,其在基因組學領(lǐng)域也起到了推進作用。AI系統(tǒng)使基因測序和分析變得更高效、更準確[6]。此外,AI已從根本上改變了分子生物學和遺傳學領(lǐng)域的預測功能[7]。因此,研究人員可以預測未來某個生物體可能會遭遇哪些風險、哪些基因突變可能會導致不同的疾病,以及如何為未來做好準備。通過了解構(gòu)成該生物體所有活動的特定遺傳框架,并借助AI的支持,我們可預見AI在農(nóng)業(yè)、畜牧業(yè)和遺傳疾病診斷等領(lǐng)域的作用將是開創(chuàng)性的。
在第四次工業(yè)革命的浪潮中,我們更無法忽視AI和區(qū)塊鏈[8]在醫(yī)療保健方面的作用,即AI融入了第四次工業(yè)革命的基因中,而區(qū)塊鏈將會改變整個經(jīng)濟體系的基礎(chǔ)架構(gòu)。由于這兩種技術(shù)的共同作用可以決定工業(yè)革命的深度和廣度,因此AI與區(qū)塊鏈的協(xié)同作用表明AI可以更有效地實施區(qū)塊鏈相關(guān)技術(shù)。基于AI對各個領(lǐng)域所產(chǎn)生的影響,它注定要為我們的時代注入一種自我更新的能力與磅礴的生命力。
利用AI輔助新材料設(shè)計對未來人類社會的發(fā)展也具有重要意義。歷史上,新材料的發(fā)現(xiàn)及應(yīng)用通常需要漫長的時間。2011年,美國奧巴馬政府開始實施“材料基因組計劃”(Materials Genome Initiative, MGI),其目標是將先進材料的發(fā)現(xiàn)、開發(fā)、生產(chǎn)和應(yīng)用周期縮短至原來的一半以上。近年來,隨著MGI和大數(shù)據(jù)的融合,數(shù)據(jù)驅(qū)動的研究模式被認為是最有前景的材料研究范式,其中AI是處理材料大數(shù)據(jù)并獲得“成分-結(jié)構(gòu)-工藝-性能”關(guān)系的關(guān)鍵技術(shù)。
近年來,由于ML不斷展現(xiàn)出的應(yīng)用潛力,其已被學術(shù)界視為是可以革新材料科學的技術(shù)。例如,歷史上化學元素周期表的完成花費了許多杰出科學家一個世紀的時間,而現(xiàn)在借助AI技術(shù),人們可能只需幾個小時就可以從數(shù)據(jù)中重構(gòu)周期表?;诖罅恳阎幕衔锖筒牧蠑?shù)據(jù)庫,無監(jiān)督的Atom2Vec機器可以自主學習原子的基本特性,并結(jié)合神經(jīng)網(wǎng)絡(luò)可以高精度地預測新材料的詳細特性[9]。在藥物合成方面,Segler等[10]通過引入AI符號來尋找逆合成分析的路線。同傳統(tǒng)的計算機輔助搜索方法相比,該方法的搜索速度是原來的30倍,而由其產(chǎn)生的分子數(shù)量是原來的兩倍。值得一提的是,該神經(jīng)網(wǎng)絡(luò)的訓練數(shù)據(jù)集既包含了有效數(shù)據(jù)也包含了無效數(shù)據(jù),這與傳統(tǒng)的基于有效數(shù)據(jù)的數(shù)據(jù)集明顯不同。
除了用于合成新材料,AI也促進了人工結(jié)構(gòu)材料(即超材料)的發(fā)展,人工合成材料的等效材料參數(shù)由其結(jié)構(gòu)尺寸和組成成分決定[11]。由于人工結(jié)構(gòu)材料中結(jié)構(gòu)幾何形狀和基本材料的變化范圍遠遠超過傳統(tǒng)試錯法的能力,所以,我們必須借助大數(shù)據(jù)技術(shù)去優(yōu)化設(shè)計。另外,由于光子速度遠大于電子速度,且無源光學元件不需要電源,基于結(jié)構(gòu)材料的新型光學計算技術(shù)有望顯著提升深度學習的數(shù)據(jù)處理速度并降低其功耗[12]。
AI在海洋資源的開發(fā)中也起到了越來越重要的作用。在大航海時代的驅(qū)動下,發(fā)達國家在此方面擁有強大的戰(zhàn)略優(yōu)勢。地球上海洋面積約占地球表面積的71%,AI將對海洋資源的深度開發(fā)起到至關(guān)重要的作用,但目前我們在海洋開發(fā)方面做得還不夠,如利用AI去高效探測和開發(fā)海洋中的礦產(chǎn)資源。此外,任何一個擁有較長海岸線的國家都不希望看到“水下國門洞開”(underwater country gates open)。換言之,海防安全無疑是國家最重要的安全之一。
傳統(tǒng)的海洋科技主要是從聲學、磁學等層面來探測海洋資源,而AI對于海洋數(shù)據(jù)的深度挖掘和分析能力可以使傳統(tǒng)的海洋科技變得更有生命力,從而實現(xiàn)對海洋資源的更高效的利用和保護。
光學作為獲取信息的一種重要渠道,其在AI領(lǐng)域具有廣泛的應(yīng)用。然而。由于海水對光具有強吸收和散射作用,所以水下的光學世界一片混沌。如何提升水下遠距離成像、水下光譜探測、水下多參數(shù)傳感、水下激光通信等多個水下光學應(yīng)用領(lǐng)域的數(shù)據(jù)質(zhì)量成為了世界級難題。對于中國這樣一個擁有面積廣闊的內(nèi)海和領(lǐng)海的國家而言,利用水下光學技術(shù)來觀測水下的地貌、特征以及海水流動過程等信息,是關(guān)乎國防安全、資源管理和經(jīng)濟發(fā)展的一個重要課題。所以智能光學與AI對于海洋光學的發(fā)展是不可或缺的。
當前我們在實施AI時遇到兩大主要挑戰(zhàn):其一是大多數(shù)行業(yè)存在數(shù)據(jù)孤島現(xiàn)象;其二是對隱私保護型AI的需求在日益增長。然而傳統(tǒng)的使用集中數(shù)據(jù)的AI方法無法解決這些問題,聯(lián)邦學習(federated learning, FL)是一種新的解決方案,它不僅可以解決數(shù)據(jù)孤島問題,還可以實現(xiàn)跨數(shù)據(jù)、跨領(lǐng)域和跨企業(yè)的隱私保護型AI的應(yīng)用[13,14]。
FL可以看作是一種基于分布式數(shù)據(jù)的具有隱私保護功能的協(xié)作式ML。它是一種具有以下特征的算法框架:
· 多個參與方共同構(gòu)建ML模型。每個參與方都擁有一些訓練數(shù)據(jù),這些數(shù)據(jù)可以被用來在本地進行模型訓練。
· 每個參與方所擁有的數(shù)據(jù)都不會脫離該參與方;只有模型參數(shù)或者梯度信息可以被分享。
· 根據(jù)安全方案,可以將模型(部分地)從一方轉(zhuǎn)移到另一方[15,16],從而保證任何一方都不能通過逆向工程來獲得其他方的數(shù)據(jù)。
· 經(jīng)FL訓練獲得的ML模型的性能與使用集中數(shù)據(jù)構(gòu)建的ML模型的性能非常接近。
依據(jù)各參與方數(shù)據(jù)的分布方式不同,我們將FL分為橫向聯(lián)邦學習(horizontal federated learning, HFL)、縱向聯(lián)邦學習(vertical federated learning, VFL)和聯(lián)邦遷移學習(federated transfer learning, FTL)。HFL適用于參與方有相同的數(shù)據(jù)特征而數(shù)據(jù)樣本重疊較少的情況 [13,14]。它類似于數(shù)據(jù)表格視圖中數(shù)據(jù)被橫向切分的情況。VFL適用于參與方有較多重疊的數(shù)據(jù)樣本而數(shù)據(jù)特征不同的情況[13]。它類似于數(shù)據(jù)表格視圖中數(shù)據(jù)被垂直切分的情況。FTL適用于參與方的數(shù)據(jù)樣本和特征都有較少重疊的情況,包括基于樣本遷移的FTL、基于特征遷移的FTL和基于模型遷移的FTL [13,15]。
為了促進FL的發(fā)展,微眾銀行(WeBank)的AI研究人員開發(fā)了聯(lián)邦AI技術(shù)使能者(Federated AI Technolo -gy Enabler, FATE)框架。FATE是一個開源項目,它是一個支持HFL、VFL和FTL的工業(yè)級FL平臺。在滿足數(shù)據(jù)保護前提下,我們可以使用FL來構(gòu)建ML模型。FL在金融、醫(yī)療、教育、智慧城市和邊緣計算等領(lǐng)域有潛在的應(yīng)用前景[13,17]。例如,我們可以使用FL在銀行、社交網(wǎng)絡(luò)公司和電子商務(wù)公司內(nèi)部進行本地模型訓練,而無需共享三方的數(shù)據(jù),然后我們可以通過安全聚合技術(shù)將三方本地訓練的模型進行聚合,從而獲得聯(lián)邦模型以實現(xiàn)更好的推薦系統(tǒng)。
AI是一個多學科交叉的領(lǐng)域,其在科學、工業(yè)和社會等領(lǐng)域都有潛在的應(yīng)用價值[18-21]。我們相信,AI的下一步突破應(yīng)該頗具多學科交叉內(nèi)稟。