專題策劃人
虞紅芳
電子科技大學教授、博士生導師、英才學院副院長,擔任《IEEE Internet of Things Journal》《IEEE Network Magazine》等刊物的編委;主要從事下一代網絡與分布式系統(tǒng)的研究工作;作為項目負責人和核心成員,承擔多項國家“973”項目、“863”項目、國防預研項目、國家自然科學基金項目等;獲教育部自然科學二等獎1項;發(fā)表學術論文 200 余篇,谷歌學術引用 2 600 余次;撰寫專著 3 本,獲授權專利 40 余項。
近年來,網絡在可編程、軟件化方面取得了很多進展,為網絡智能化提供了很好的基礎。同時,新的人工智能模型、算法和技術層出不窮,分布式人工智能成為主流。網絡和人工智能越來越需要對方的支撐,兩者的結合將帶來新的機遇和挑戰(zhàn)。網絡和人工智能結合分為兩個場景,一個是考慮網絡如何支撐AI,即Networking for AI;另一個是如何把AI用在網絡設計上,即AI for Networking。本期專題及專家論壇的欄目的文章從這兩個方面展開討論。
在Networking for AI方面,隨著人工智能技術的飛速發(fā)展,以分布式機器學習為主的分布式人工智能應用實現(xiàn)了爆炸式增長,正在成為互聯(lián)網支撐的又一類重要應用。同時,計算能力的快速突破,使得網絡成為分布式機器學習的主要系統(tǒng)瓶頸。因此,對規(guī)模分布式人工智能應用的網絡架構及技術進行創(chuàng)新,優(yōu)化分布式機器學習訓練性能,對中國的人工智能發(fā)展有重大的意義?!斗植际缴疃葘W習系統(tǒng)網絡通信優(yōu)化技術》一文概述了業(yè)界在大規(guī)模分布式深度學習的通信網絡優(yōu)化方面的基本技術途徑,并展望其未來發(fā)展的機遇和挑戰(zhàn)?!缎滦屯負涓兄膮到粨Q方案》和《地理分布式機器學習:超越局域的框架與技術》這兩篇文章分別探討了數據中心和跨廣域網的分布式AI場景所面臨的性能瓶頸和對應的性能加速技術?!睹嫦蚍植际紸I的智能網卡低延遲Fabric技術》一文結合中興通訊智能網卡的研究工作,介紹了基于遠程直接內存訪問(RDMA)的低延遲通信網絡以及對應的抽象化的通信原語庫設計思路和面臨的挑戰(zhàn)。算力網絡作為新型的分布式人工智能基礎設施,是由運營商主導并提出的概念,目的是把分散的計算資源整合,將網絡與算力融合后作為基礎資源向用戶提供服務?!峨娦胚\營商泛在智聯(lián)網絡的構建》一文介紹了如何用算力網絡以及AI能力分發(fā)平臺等核心要素,構建新一代泛在智聯(lián)網絡,應對“應用本地化”“內容分布化”和“計算邊緣化”的態(tài)勢?!端懔W絡中面向業(yè)務體驗的算力建模》一文研究了算力網絡中算力建模和算力資源調度問題。
在AI for Networking方面,網絡連接數的爆炸性增長以及多種網絡接入方式并存,使得網絡高度復雜。同時,現(xiàn)有網絡運維自動化程度不高,很大程度上依賴于人的經驗和技能,運營成本(OPEX)逐年遞增。因此,迫切需要將人工智能技術應用到網絡中,實現(xiàn)網絡智能化。《基于AI的運營級IDC節(jié)能研究》一文探索了將AI算法應用于互聯(lián)網數據中心(IDC)節(jié)能中的研究工作。通過采集IDC機房數據,利用AI對運營商IDC機房進行畫像。同時,借助深度學習和控制算法,把人工調節(jié)經驗和數據分析結果通過預設規(guī)則下發(fā)到機房的控制系統(tǒng)中。《超密集蜂窩網絡智能干擾協(xié)調算法》一文將超密集蜂窩網絡中動態(tài)干擾環(huán)境下,小基站發(fā)送功率的動態(tài)調整問題建模為馬爾科夫決策過程,并設計了一種基于Actor-Critic方法的小基站功率智能控制算法。這兩篇文章為人工智能應用于網絡運維提供了很好的參考。
本期專題論文來自高校、電信運營商、科研院所、設備制造商等中國網絡人工智能研究優(yōu)勢單位的專家學者,凝聚了他們多年的研究成果和工作經驗,希望能給讀者提供有益的啟示和參考。在此,對各位作者的大力支持表示衷心感謝。
虞紅芳
2020年9月20日