楊 帆,宋聞萱,許方敏*,張恒升,趙成林
(1.北京郵電大學(xué) 信息與通信工程學(xué)院,北京 100876;2.中國信息通信研究院,北京 100191)
隨著工業(yè)互聯(lián)網(wǎng)的不斷發(fā)展,工業(yè)智能應(yīng)用對計算機存儲能力和算力的要求不斷提高,業(yè)界相繼提出了以分布式技術(shù)為基礎(chǔ)的集中部署的云計算和以低時延、低能耗為特點的邊緣計算。云計算在一定程度上滿足了需要龐大計算量的密集型業(yè)務(wù)[1],但是傳統(tǒng)的云計算不足以提供低時延、高算力的服務(wù)。而移動邊緣計算距離移動終端更近,且能夠提供更低時延、更高效率的計算能力[2]。云計算和邊緣計算為工業(yè)互聯(lián)網(wǎng)提供了匹配不同應(yīng)用的算力和時延需求。
由于邊緣計算服務(wù)器算力有限,為滿足分布式工業(yè)智能應(yīng)用的高效處理,越來越多的邊緣服務(wù)器部署在工廠和園區(qū)中,因此數(shù)據(jù)的計算和存儲逐漸從中心擴散到邊緣和終端的趨勢形成算力泛在部署,但是邊緣計算單點的算力資源有限,且邊緣節(jié)點之間不互相感知。為協(xié)同海量資源受限的邊緣算力以提高算力利用率,業(yè)界提出算力感知網(wǎng)絡(luò)(Computing-aware Networking,CAN)的思想[3],將計算與連接相結(jié)合利用算力協(xié)同形成算力組網(wǎng)。算力感知網(wǎng)絡(luò)的提出標(biāo)志著人類正在邁向萬物感知、萬物互聯(lián)、萬物智能的“算力時代”[4]。
雖然為滿足海量工業(yè)應(yīng)用的算力需求,算力在工業(yè)互聯(lián)網(wǎng)中已呈現(xiàn)泛在部署形式,但是并未根據(jù)不同應(yīng)用的不同需求優(yōu)化算力的部署和分配利用方案。作為網(wǎng)絡(luò)基礎(chǔ)設(shè)施的一種,如何將算力網(wǎng)絡(luò)引入工業(yè)互聯(lián)網(wǎng)網(wǎng)絡(luò)體系中,并探究算力網(wǎng)絡(luò)在工業(yè)互聯(lián)網(wǎng)中的部署和應(yīng)用,是亟須研究解決的問題。
由于在工業(yè)互聯(lián)網(wǎng)中不同任務(wù)對時延和算力的要求不同,一些輕量級、高延遲需求的任務(wù)可以在靠近現(xiàn)場級的內(nèi)網(wǎng)計算設(shè)施進行計算,而部分大算力需求對延遲容忍程度高的任務(wù)更適合在外部超算中心進行處理,因此本文提出了以工業(yè)互聯(lián)網(wǎng)為基礎(chǔ)的內(nèi)網(wǎng)+外網(wǎng)的算力部署架構(gòu)和應(yīng)用部署方案,以滿足不同需求任務(wù)不同方面的需求,同時深入分析了算力網(wǎng)絡(luò)在工廠內(nèi)外網(wǎng)實現(xiàn)落地部署存在的算力度量和表征、標(biāo)識、感知、路由和調(diào)度,以及安全等方面挑戰(zhàn)。
云計算和邊緣計算都是信息技術(shù)資源(計算資源、存儲資源等)的載體[5],類比于電力系統(tǒng)中的電廠與電網(wǎng),而算力網(wǎng)絡(luò)做為算力的“網(wǎng)”將孤立的云計算和邊緣計算的IT資源變成有效的IT資源,實現(xiàn)高效協(xié)同的利用云計算、邊緣計算和智能終端的異構(gòu)泛在計算資源[6]。
近6年來,隨著人工智能(AI)技術(shù)的發(fā)展,數(shù)據(jù)分析與處理對算力的需求增長已超過30萬倍[7],由于我國經(jīng)濟發(fā)展和應(yīng)用需求“東密西疏”,但是自然資源“東貧西富”,這種應(yīng)用和資源不匹配的情況影響了我國信息化進程[8]。因此,2022年3月第十三屆全國人大提出“東數(shù)西算”工程戰(zhàn)略,算力網(wǎng)絡(luò)的實現(xiàn)將會更高效地利用西部的算力資源為東部的數(shù)據(jù)和應(yīng)用需求服務(wù),同時提供高保障性和高可靠性,實現(xiàn)東西部協(xié)同發(fā)展,提升國家總體算力資源的利用率,最終實現(xiàn)“網(wǎng)絡(luò)無所不達,算力無所不在,智能無所不及”[9]。
目前產(chǎn)業(yè)化、標(biāo)準(zhǔn)化、學(xué)術(shù)界各方都在積極推進算力網(wǎng)絡(luò)技術(shù)的發(fā)展和落地,業(yè)界對算力網(wǎng)絡(luò)的標(biāo)準(zhǔn)化也逐步趨于完善。
國內(nèi)運營商和華為在IETF開展了算力網(wǎng)絡(luò)系列研究; ETSI啟動了“NFV Support for Network Function Connectivity Extensions (NFV-EVE020)”項目,寬帶論壇(BBF)啟動了“Metro Computing Network(SD-466)”項目,各項研究都旨在解決算力網(wǎng)絡(luò)在不同領(lǐng)域中的實際發(fā)展應(yīng)用和功能擴展。
2019年2月,IETF成立了網(wǎng)內(nèi)計算研究組(Computing in the Network Research Group,COINRG)。中國移動聯(lián)合華為組織了計算優(yōu)先網(wǎng)絡(luò)(Computing First Network, CFN)技術(shù)研討會,分別針對CFN場景和需求、CFN的架構(gòu)以及CFN的實驗部署提出了三項草案[10-12]。
2021年7月5日—16日,ITU-T SG13(國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門第13研究組)發(fā)布了中國電信研究院第一個算力網(wǎng)絡(luò)技術(shù)的國際標(biāo)準(zhǔn)“算力網(wǎng)絡(luò)框架與架構(gòu)標(biāo)準(zhǔn)Computing Power Network-framework and Architecture”(Y.2501)。ITU-T Y.2501標(biāo)準(zhǔn)提出了一種算力網(wǎng)絡(luò)的新型架構(gòu)體系;ITU-TSG13建議開啟Y.2500系列編號,以Y.2501[13]為首個標(biāo)準(zhǔn),形成算力網(wǎng)絡(luò)系列標(biāo)準(zhǔn)。
同時三大運營商和華為等企業(yè)還分別牽頭啟動推進了Q.CPN(算力網(wǎng)絡(luò)的信令要求)[14]、Y.ASA-CPN、Q.BNG-INC(算力網(wǎng)絡(luò)邊界網(wǎng)關(guān)的信令要求)與Y.CAN、Y.CPN-arch[15]等SG11和SG13組的相關(guān)標(biāo)準(zhǔn)制定。同期,中國電信研究院成功立項“Y.NGNe-O-CPN-reqts”標(biāo)準(zhǔn);中國聯(lián)通、中國電信成功立項Y.ASA-CPN標(biāo)準(zhǔn),研究算力網(wǎng)絡(luò)認證調(diào)度架構(gòu)。
1.1.2 國內(nèi)標(biāo)準(zhǔn)化發(fā)展現(xiàn)狀
2019年9月,邊緣計算產(chǎn)業(yè)聯(lián)盟(Edge Computing Consortium,ECC)與網(wǎng)絡(luò)5.0產(chǎn)業(yè)和技術(shù)創(chuàng)新聯(lián)盟(Network 5.0 Industry and Technology Innovation Alliance,N5A)聯(lián)合成立邊緣計算網(wǎng)絡(luò)基礎(chǔ)設(shè)施聯(lián)合工作組ECNI,致力于網(wǎng)絡(luò)5.0的研究推動和標(biāo)準(zhǔn)化過程,其中算力網(wǎng)絡(luò)被視為未來網(wǎng)絡(luò)發(fā)展重要方向之一。2020年6月產(chǎn)業(yè)對算力網(wǎng)絡(luò)的研究進入了一個新的階段,中國通信網(wǎng)絡(luò)技術(shù)標(biāo)準(zhǔn)委員會CCSA TC614正式成立了算力網(wǎng)絡(luò)特別任務(wù)組。CCSA目前在TC1-WG5、TC3-WG1和TC1-WG2工作組分別對“泛在計算的需求與架構(gòu)”“算力網(wǎng)絡(luò)的需求與架構(gòu)”“面向業(yè)務(wù)體驗的算力需求量化與建模研究”進行了規(guī)范。2022年CCSA已經(jīng)通過了行業(yè)標(biāo)準(zhǔn)《算力網(wǎng)絡(luò)總體技術(shù)要求》,提出了算力網(wǎng)絡(luò)的標(biāo)準(zhǔn)定義和發(fā)展目標(biāo),并制定了算力網(wǎng)絡(luò)的總體技術(shù)架構(gòu)和關(guān)鍵技術(shù)要求。同年CCSA算網(wǎng)融合產(chǎn)業(yè)及標(biāo)準(zhǔn)推進委員會(CCSA TC621)和多樣性算力產(chǎn)業(yè)及標(biāo)準(zhǔn)推進委員會(CCSA TC622)分別圍繞“計算網(wǎng)絡(luò)化”“網(wǎng)絡(luò)計算化”兩個方向協(xié)同開展標(biāo)準(zhǔn)化工作。
在產(chǎn)業(yè)層面,國內(nèi)各大運營商牽頭制定了一系列的標(biāo)準(zhǔn),同時發(fā)布產(chǎn)業(yè)白皮書,主導(dǎo)業(yè)界在算力網(wǎng)絡(luò)研究上的推進。2019年11月中國聯(lián)通在業(yè)界率先發(fā)布了《中國聯(lián)通算力網(wǎng)絡(luò)白皮書》[16],首次提倡推動算力網(wǎng)絡(luò)概念的發(fā)展,表明算力網(wǎng)絡(luò)將是云網(wǎng)融合未來發(fā)展的新階段。在2020年11月,中國聯(lián)通聯(lián)合多方成立了算力網(wǎng)絡(luò)產(chǎn)業(yè)技術(shù)聯(lián)盟,進一步完善算力網(wǎng)絡(luò)生態(tài),在“聯(lián)接+計算”領(lǐng)域推動算力網(wǎng)絡(luò)的落地和轉(zhuǎn)型。
中國移動在2019年11月和華為在邊緣計算產(chǎn)業(yè)峰會(ECIS2019)上聯(lián)合發(fā)布了《算力感知網(wǎng)絡(luò)技術(shù)白皮書》[17],2021年更新了《算力感知網(wǎng)絡(luò)(CAN)技術(shù)白皮書(2021年版)》[3],提出算力感知網(wǎng)絡(luò)(Computing-aware Networking, CAN)五層功能架構(gòu)和算力網(wǎng)絡(luò)的新架構(gòu)、新協(xié)議、新度量。2021年11月和2022年2月中國移動分別發(fā)布了《中國移動算力網(wǎng)絡(luò)白皮書》《算力網(wǎng)絡(luò)安全白皮書》[9,18],以算力為中心、網(wǎng)絡(luò)為根基全面揭示了算力網(wǎng)絡(luò)的發(fā)展路徑,掀開了布局算力網(wǎng)絡(luò)的序幕。
作為國內(nèi)數(shù)量最多、最大的數(shù)據(jù)中心服務(wù)提供商,中國電信率先提出“網(wǎng)是基礎(chǔ)、云為核心、網(wǎng)隨云動、云網(wǎng)一體”的云網(wǎng)融合方向,融合網(wǎng)絡(luò)、算力和存儲三大資源,規(guī)劃了“核心+省+邊緣+端”四級架構(gòu)AI算力網(wǎng)絡(luò),超前部署AI算力,結(jié)合業(yè)務(wù)場景進行靈活部署,提供算網(wǎng)數(shù)智等多要素融合的AI服務(wù)。
華為、浪潮等廠商也先后發(fā)布了產(chǎn)業(yè)白皮書;華為在貴州貴安即將建成全球最大的云數(shù)據(jù)中心;阿里、華為在內(nèi)蒙古烏蘭察市建設(shè)了數(shù)據(jù)中心,為華北地區(qū)的算力、存儲等業(yè)務(wù)提供服務(wù),共同推進算力網(wǎng)絡(luò)的發(fā)展;中國移動在第七屆機器人峰會上展示了網(wǎng)絡(luò)+計算雙流跨省確定性同步方案,通過網(wǎng)絡(luò)的靈活調(diào)整來適應(yīng)差異化算力。2022年,我國開始布局建設(shè)八大算力網(wǎng)絡(luò)國家樞紐節(jié)點:粵港澳大灣區(qū)、成渝地區(qū)、長三角地區(qū)、京津冀地區(qū)、寧夏、內(nèi)蒙古、貴州、甘肅。
雖然學(xué)術(shù)界對云計算和邊緣計算的研究比較充分,但是目前算力網(wǎng)絡(luò)發(fā)展仍處于初步階段,學(xué)術(shù)界對算力網(wǎng)絡(luò)尤其是工業(yè)互聯(lián)網(wǎng)中的算力網(wǎng)絡(luò)技術(shù)的研究內(nèi)容較少。目前算力網(wǎng)絡(luò)研究型論文和理論性論文聚焦于算力網(wǎng)絡(luò)的架構(gòu)和關(guān)鍵技術(shù),相關(guān)學(xué)者研究了包括算力路由和算力資源分配在內(nèi)的諸多算力功能。文獻[19]研究了工業(yè)互聯(lián)網(wǎng)-邊緣-云模型的多跳計算卸載問題,文中利用博弈論提出了兩種QoS感知分布式算法,并證明了算法的收斂性;模擬結(jié)果驗證該算法不僅可以隨著工業(yè)互聯(lián)網(wǎng)設(shè)備群規(guī)模的增加而很好地擴展,而且在各種參數(shù)設(shè)置下比現(xiàn)有算法更穩(wěn)定且性能更好。文獻[20]利用Floyd算法提出算力感知路由分配策略,針對算力網(wǎng)絡(luò)中的算力路由和算力資源進行協(xié)同調(diào)度,在任務(wù)處理時延和用戶滿意數(shù)上有比就近調(diào)度策略更優(yōu)的性能。文獻[21]提出了一種新型的算力網(wǎng)絡(luò)架構(gòu),為算力網(wǎng)絡(luò)中的用戶提供了適應(yīng)性,為組網(wǎng)算力資源調(diào)度提供了靈活性,為算力供應(yīng)商提供了價值激勵,并且通過使用案例清晰地描述了該新型算力網(wǎng)絡(luò)架構(gòu)。文獻[22]首次提出了一種CFN-Watchdog的集中式故障檢測協(xié)議,可以很好地滿足根據(jù)計算負載和網(wǎng)絡(luò)狀態(tài)為邊緣計算智能分配計算資源的算力網(wǎng)絡(luò)要求,并及時回收故障占用的資源。
在工業(yè)互聯(lián)網(wǎng)中,大部分工業(yè)智能任務(wù)例如控制類業(yè)務(wù)對時延要求極高,但是對算力要求不高;而一些工業(yè)智能任務(wù)對時延的要求不高,但是對算力的要求很高。因此,對不同業(yè)務(wù)有著不同的算力網(wǎng)絡(luò)匹配部署方案,不同的業(yè)務(wù)可以根據(jù)自己的特點來選擇部署在不同位置的算力網(wǎng)絡(luò)來進行服務(wù)和計算,本文重點調(diào)研了工業(yè)智能應(yīng)用對算網(wǎng)的需求,以優(yōu)化應(yīng)用和算力的匹配部署方案。
本文針對工業(yè)互聯(lián)網(wǎng)中的應(yīng)用場景將工業(yè)智能應(yīng)用分為生產(chǎn)過程控制、設(shè)備實時監(jiān)測與預(yù)測性維護、智能巡檢、環(huán)境監(jiān)測與安全防護、產(chǎn)品質(zhì)量監(jiān)控、遠程操作與運維、生產(chǎn)輔助、自動引導(dǎo)運輸車(Automated Guided Vehicle,AGV)導(dǎo)航和生產(chǎn)設(shè)計與方案檢測九大類。
2.1.1 過程自動化
過程自動化收集傳感器反饋的數(shù)據(jù),在分析處理這些數(shù)據(jù)后,調(diào)節(jié)優(yōu)化及控制各種設(shè)備,以提高生產(chǎn)效率。雙向、計算時延要求:≤1 s,典型的應(yīng)用包括:溫度檢測、壓力檢測、時間不敏感的設(shè)備控制(如水泵、壓縮機、攪拌機等)[23]。
2.1.2 工廠自動化
工廠自動化其本質(zhì)是控制電機,實現(xiàn)其對角位移、轉(zhuǎn)矩、轉(zhuǎn)速等物理量。雙向、計算時延要求:1~100 ms,典型的應(yīng)用包括:金屬材料抓取、灌裝、打包、蓋章、剪裁、產(chǎn)品分類等[23]。
2.1.3 運動控制
運動控制是對機械運動部件的位置、速度等進行實時的控制管理,使其按照預(yù)期的軌跡和規(guī)定的參數(shù)進行運動,因此運動控制對延遲要求極高。雙向、計算時延要求:250 μs~1 ms,典型的應(yīng)用場景包括:多軸同步、印刷、印制電路板、電子器件的抓取與放置等[23]。
設(shè)備實時性預(yù)測、預(yù)測性維護不僅可以對設(shè)備實時監(jiān)測,進行大數(shù)據(jù)分析,提前感知設(shè)備故障,而且可以遠程服務(wù)和提前排查故障隱患,使維護變得更加智能,運營更加可靠,成本也更低。
智能巡檢是指利用AI技術(shù),對產(chǎn)品生產(chǎn)、制造過程中進行定期隨機流動性的檢驗巡視。具體包括數(shù)據(jù)采集、隱患處理與分析等。智能巡檢任務(wù)對時延要求:<20 ms。
環(huán)境監(jiān)測與安全防護包括智能安防、視頻監(jiān)控。在環(huán)境檢測過程中,要進行物理監(jiān)測、生物監(jiān)測、化學(xué)檢測。時延要求:20~50 ms[24];存儲需求:TByte級別;網(wǎng)絡(luò)需求:50~100 Mbit/s。
產(chǎn)品質(zhì)量檢測利用卷積神經(jīng)網(wǎng)絡(luò)等圖像和視頻處理技術(shù)對產(chǎn)品的質(zhì)量進行檢測,例如對產(chǎn)品表面劃痕的長度、深度、劃痕位置進行識別,以此分類良品和次品。閉環(huán)時延不超過10~100 ms;可靠性需求1×10-5;速率:單用戶感知速率>100 Mbit/s。
2.6.1 遠程操作與運維
計算機遠程運維技術(shù)將分散在工業(yè)互聯(lián)網(wǎng)中的設(shè)備終端進行集中化管理,實現(xiàn)計算機終端的遠程控制。時延要求:空口時延<10 ms;可靠性需求1×10-5;高傳輸率:體驗速率Gbit/s。
2.6.2 虛擬現(xiàn)實/增強現(xiàn)實(AR/VR)
AR遠程協(xié)助可以支持員工學(xué)習(xí)、培訓(xùn)、交流,提供操作示范、導(dǎo)引,提醒生產(chǎn)過程注意事項及操作細節(jié);將工人看到的場景直接傳遞給工藝人員,工藝人員通過視頻、語音、標(biāo)記等交互手段對工人進行直觀指導(dǎo)[24]。5G+AR/VR技術(shù),構(gòu)建產(chǎn)品展示、售后服務(wù)、技能培訓(xùn)等虛擬演示和體驗環(huán)境,優(yōu)化客戶體驗,提升服務(wù)品質(zhì)和效率。
VR、AR的渲染,不同語言之間的實時和非實時翻譯等,這種場合對算力要求極高[5]。時延:工業(yè)現(xiàn)場毫秒級的確定時延10 ms[16];存儲需求:TByte級;算力分類:基于圖像分析的AI推理能力、圖像渲染需要的計算能力屬于P級算力;網(wǎng)絡(luò)速率需求:50~100 Mbit/s。
生產(chǎn)輔助是指不直接從事商品生產(chǎn),而是直接或間接地為基本生產(chǎn)車間、廠部管理部門提供服務(wù),而進行輔助性生產(chǎn)和勞務(wù)供應(yīng),如機械制造企業(yè)中的動力生產(chǎn)、工具制造、設(shè)備維修等??煽啃孕枨螅?×10-5;數(shù)據(jù)率需求:Mbit/s~Gbit/s;包大?。?200 Byte。
AGV是一種裝備有電磁或光學(xué)等自動引導(dǎo)裝置,能夠沿規(guī)定的導(dǎo)引路徑行駛,具有安全保護以及各種移載功能的運輸車。雙向、計算時延要求:50~100 ms之間[24];發(fā)包周期:40~500 ms,數(shù)據(jù)包大小<1 500 Byte[25]。
工業(yè)互聯(lián)網(wǎng)中的生產(chǎn)設(shè)計包含設(shè)計規(guī)格、模型、過程和工程數(shù)據(jù)等,將工業(yè)模塊設(shè)計成符合用戶需求的過程。生產(chǎn)設(shè)計是解決制造產(chǎn)品工藝流程的過程,根據(jù)施工工藝與生產(chǎn)管理一體化的要求和生產(chǎn)條件進行產(chǎn)品方案設(shè)計。方案檢測例如汽車碰撞破壞試驗,碰撞一次需要180多萬個數(shù)據(jù),數(shù)據(jù)量和算力需求較大。
根據(jù)工業(yè)互聯(lián)網(wǎng)中業(yè)務(wù)需求和數(shù)據(jù)流向[25]以及算力網(wǎng)絡(luò)的配給,工業(yè)互聯(lián)網(wǎng)內(nèi)網(wǎng)和外網(wǎng)中的算力網(wǎng)絡(luò)部署如圖1所示。其中算力配給網(wǎng)絡(luò)與超算中心構(gòu)成工廠外網(wǎng),生產(chǎn)現(xiàn)場網(wǎng)絡(luò)、生產(chǎn)辦公網(wǎng)絡(luò)和園區(qū)網(wǎng)絡(luò)構(gòu)成工廠內(nèi)網(wǎng)。內(nèi)外網(wǎng)均部署有連網(wǎng)的算力資源,工業(yè)智能任務(wù)可以根據(jù)對算力的需求和任務(wù)時延限制決策任務(wù)的處理位置。具體來說,任務(wù)時延限制指任務(wù)處理所能容忍的最大雙向時延,包括任務(wù)數(shù)據(jù)上行傳輸時延、任務(wù)數(shù)據(jù)計算時延以及結(jié)果回傳時延。由于工業(yè)外網(wǎng)算力網(wǎng)絡(luò)由遠距離超算中心組成,長距離數(shù)據(jù)傳輸導(dǎo)致延遲較大。據(jù)中國信通院估算,將數(shù)據(jù)任務(wù)卸載至遠程的超算中心進行分析與處理,并將計算結(jié)果回傳的雙向延遲最低設(shè)置約為50 ms。因此,任務(wù)處理雙向時延限制在50 ms以內(nèi)的可在工廠內(nèi)部進行處理,高于50 ms的應(yīng)用可在工廠外網(wǎng)的超算中心處理。
圖1 工業(yè)互聯(lián)網(wǎng)中的算力網(wǎng)絡(luò)部署視圖
工廠內(nèi)網(wǎng)是指在工廠或者園區(qū)內(nèi)部,滿足工廠內(nèi)部生產(chǎn)、辦公、管理、安防等連接需求,用于生產(chǎn)要素互聯(lián)以及企業(yè)IT管理系統(tǒng)之間連接的網(wǎng)絡(luò)[25]。工廠內(nèi)網(wǎng)分為生產(chǎn)現(xiàn)場網(wǎng)絡(luò)、生產(chǎn)辦公網(wǎng)絡(luò)和園區(qū)網(wǎng)絡(luò),其中算力網(wǎng)絡(luò)分別部署在生產(chǎn)現(xiàn)場網(wǎng)和園區(qū)網(wǎng)中。
3.1.1 生產(chǎn)現(xiàn)場網(wǎng)絡(luò)
生產(chǎn)現(xiàn)場網(wǎng)主要負責(zé)連接現(xiàn)場的生產(chǎn)設(shè)備,為現(xiàn)場生產(chǎn)提供實時的智能服務(wù),可支持電機等控制類業(yè)務(wù)、傳感器等采集類業(yè)務(wù)、AGV導(dǎo)航等連接類業(yè)務(wù)等多種業(yè)務(wù)類型。生產(chǎn)現(xiàn)場網(wǎng)絡(luò)包括工業(yè)總線/工業(yè)以太網(wǎng)、工業(yè)無線、時間敏感網(wǎng)絡(luò)(Time Sensitive Networking, TSN)/工業(yè)光網(wǎng)、5G/WiFi/低功耗廣域( Low Power Wide Area,LPWA)網(wǎng)以及現(xiàn)場級算力網(wǎng)絡(luò)。采用現(xiàn)場總線、工業(yè)以太網(wǎng)等有線方式和5G/WiFi等無線方式將自動光學(xué)檢測(Automated Optical Inspection,AOI)、機器人、AGV、傳感器、監(jiān)控裝置、電機和智能終端等生產(chǎn)要素接入工廠內(nèi)網(wǎng)。由于生產(chǎn)現(xiàn)場不斷產(chǎn)生海量的生產(chǎn)數(shù)據(jù),而對數(shù)據(jù)的處理和分析需要大量算力,因此現(xiàn)場級網(wǎng)絡(luò)泛在部署大量的計算資源,需將大量的算力資源組網(wǎng)形成算力網(wǎng)絡(luò),負責(zé)為現(xiàn)場級應(yīng)用的運行提供算力和網(wǎng)絡(luò)資源,現(xiàn)場級算力網(wǎng)絡(luò)通過安全網(wǎng)關(guān)連接至生產(chǎn)辦公網(wǎng)。
3.1.2 園區(qū)網(wǎng)絡(luò)
企業(yè)生產(chǎn)辦公網(wǎng)絡(luò)是工廠內(nèi)網(wǎng)中面向人與人、人與機器之間連接層級的網(wǎng)絡(luò)[25]。生產(chǎn)辦公網(wǎng)包括辦公網(wǎng)、企業(yè)私有云數(shù)據(jù)中心,對外連接園區(qū)網(wǎng)絡(luò),對內(nèi)通過工業(yè)以太網(wǎng)和光網(wǎng)絡(luò)連接生產(chǎn)現(xiàn)場網(wǎng)絡(luò)。企業(yè)私有云數(shù)據(jù)中心主要承載企業(yè)生產(chǎn)和日常辦公所產(chǎn)生的各類生產(chǎn)相關(guān)數(shù)據(jù),以及制造執(zhí)行系統(tǒng)MES、企業(yè)資源計劃系統(tǒng)ERP、客戶關(guān)系管理系統(tǒng)CRM等企業(yè)正常運行所必須的各類管理和信息系統(tǒng)。生產(chǎn)辦公網(wǎng)對算力需求較小,因此僅部署少量邊緣計算服務(wù)器。
3.1.3 生產(chǎn)辦公網(wǎng)絡(luò)
園區(qū)網(wǎng)絡(luò)是部署在工業(yè)互聯(lián)網(wǎng)內(nèi)網(wǎng)以實現(xiàn)園區(qū)企業(yè)設(shè)備互聯(lián)和信息互通的網(wǎng)絡(luò)基礎(chǔ)設(shè)施[27]。園區(qū)網(wǎng)絡(luò)配備有核心交換機,連接出口路由器和安全網(wǎng)關(guān)到工廠外網(wǎng),連接集中式的內(nèi)網(wǎng)編排控制器,通過園區(qū)網(wǎng)連接園區(qū)的小型云數(shù)據(jù)中心,通過網(wǎng)關(guān)連接園區(qū)公共服務(wù)算力網(wǎng)絡(luò),通過安全網(wǎng)關(guān)連接至生產(chǎn)辦公網(wǎng)絡(luò)。由于園區(qū)內(nèi)存在大量監(jiān)控、傳感器、車輛等物聯(lián)網(wǎng)設(shè)備,因此實時產(chǎn)生大量的數(shù)據(jù),為實現(xiàn)大量園區(qū)數(shù)據(jù)的高效處理,園區(qū)網(wǎng)內(nèi)部署大量的邊緣計算服務(wù)器,并組網(wǎng)形成園區(qū)公共服務(wù)算力網(wǎng)絡(luò)。內(nèi)網(wǎng)編排控制器部署在園區(qū)網(wǎng)絡(luò)中,對內(nèi)網(wǎng)算網(wǎng)資源包括園區(qū)網(wǎng)、生產(chǎn)辦公網(wǎng)以及生產(chǎn)現(xiàn)場網(wǎng)絡(luò)資源進行統(tǒng)一管控。內(nèi)網(wǎng)編排控制器具有算力服務(wù)、算力建模、算力通告、算力OAM和算力路由等算力關(guān)鍵能力,算力在內(nèi)網(wǎng)由編排控制器分配。
工廠外網(wǎng)是指支撐工業(yè)全周期各項活動,滿足工廠數(shù)據(jù)、應(yīng)用、業(yè)務(wù)需要或者其他網(wǎng)絡(luò)連接需求的網(wǎng)絡(luò)[25]。工廠外算力網(wǎng)絡(luò)部署包括算力配給網(wǎng)絡(luò)和超算中心。為保證工廠內(nèi)網(wǎng)和工廠外網(wǎng)之間的無縫銜接和融合,二者之間配備有出口路由器和安全網(wǎng)關(guān),目的是在數(shù)據(jù)順利流通的同時進行有效的安全隔離,實現(xiàn)敏感數(shù)據(jù)不出工廠,避免受到互聯(lián)網(wǎng)中的惡意攻擊。
3.2.1 算力配給網(wǎng)絡(luò)
算力配給網(wǎng)連接多個超算中心,通過動態(tài)實時感知算力資源狀態(tài),將用戶業(yè)務(wù)調(diào)度到最優(yōu)的超算中心,實現(xiàn)算力的自由流動[26]。算力配給網(wǎng)負責(zé)東西部之間的數(shù)據(jù)傳輸,是東數(shù)西算的網(wǎng)絡(luò)動脈。算力配給網(wǎng)通過一系列路由器連接外網(wǎng)編排控制器至西部的超算中心,同時通過出口路由器和安全網(wǎng)關(guān)與工廠內(nèi)網(wǎng)進行連接。外網(wǎng)編排控制器對算力配給網(wǎng)的網(wǎng)絡(luò)資源、超算中心的算力資源進行高效調(diào)度與分配。由于外網(wǎng)規(guī)模大,網(wǎng)絡(luò)異構(gòu)性強,因此外網(wǎng)編配控制器采用分布式部署,具有算力服務(wù)、算力建模、算力通告、算力OAM以及算力路由等算力關(guān)鍵能力。
3.2.2 超算中心
超算中心是部署在西部,例如烏蘭察布市、甘肅慶陽市和山西陽泉市的算力生產(chǎn)網(wǎng),具有強大的計算和存儲能力,可以為延遲要求低、算力需求高的工業(yè)應(yīng)用提供強大計算能力。超算中心通過優(yōu)化異構(gòu)算力之間的連接結(jié)構(gòu)、增加內(nèi)存容量、擴展存儲容量、增加網(wǎng)絡(luò)帶寬、優(yōu)化任務(wù)卸載策略以及計算資源分配來最大化提升超算資源的算力產(chǎn)出[26]。
3.2.3 內(nèi)外網(wǎng)任務(wù)分配
根據(jù)上文中工業(yè)互聯(lián)網(wǎng)智能應(yīng)用對算力網(wǎng)絡(luò)的需求,將上述智能應(yīng)用分別分配到工廠內(nèi)外網(wǎng)中計算,如表1所示。要求雙向時延在50 ms以內(nèi)的放在工廠內(nèi)網(wǎng),高于50 ms可以放在工廠外網(wǎng)。
表1 工業(yè)互聯(lián)網(wǎng)智能應(yīng)用對算力網(wǎng)絡(luò)的需求
算力度量是對計算資源能力和計算任務(wù)需求進行統(tǒng)一的抽象描述的技術(shù),而對工業(yè)算力網(wǎng)絡(luò)中異構(gòu)的邏輯算力、并行算力和神經(jīng)網(wǎng)絡(luò)算力進行一體化度量中存在以下挑戰(zhàn):
① 傳統(tǒng)網(wǎng)絡(luò)度量僅需對網(wǎng)元的能力進行度量,而工業(yè)算力網(wǎng)絡(luò)中需要一體化對網(wǎng)元、算力、存儲能力進行一體化度量和建模;
② 考慮到工業(yè)異構(gòu)算力中包括CPU、GPU、FPGA、ASIC、NPU以及TPU等不同類型的芯片,需要對不同類型的芯片算力進行統(tǒng)一的衡量;
③ 需結(jié)合算力路由、算力設(shè)備管理以及算力計費等需求對異構(gòu)算力進行一體化表征。
異構(gòu)算力需要進行統(tǒng)一的標(biāo)識,并結(jié)合網(wǎng)絡(luò)標(biāo)識和業(yè)務(wù)標(biāo)識來建立對應(yīng)的映射關(guān)系,而在海量異構(gòu)的算力網(wǎng)絡(luò)中如何進行標(biāo)識依然存在以下問題:
① 工業(yè)外網(wǎng)算力資源由不同的算力服務(wù)商提供,標(biāo)識符和標(biāo)識體系可能存在差異,需對不同的標(biāo)識體系進行對等解析;
② 新型工業(yè)內(nèi)外網(wǎng)算力標(biāo)識解析系統(tǒng)需與現(xiàn)有網(wǎng)絡(luò)標(biāo)識解析系統(tǒng)互聯(lián)互通;
③ 算力標(biāo)識不僅需要對算力資源提供標(biāo)識服務(wù),還需對算力服務(wù),包括算法、智能模型提供標(biāo)識服務(wù)。
④ 由于工業(yè)網(wǎng)絡(luò)具有極高隱私性和安全性要求,海量的工業(yè)內(nèi)網(wǎng)算力需要對身份及權(quán)限進行細粒度管理,在技術(shù)實施上存在較大困難。
算力感知是網(wǎng)絡(luò)對算力資源和算力服務(wù)的部署位置、實時狀態(tài)、負載信息、業(yè)務(wù)需求的全面感知。在算網(wǎng)統(tǒng)一度量的基礎(chǔ)上,構(gòu)建融合用戶需求、應(yīng)用需求、網(wǎng)絡(luò)資源和算力資源的多維度感知技術(shù),目前工業(yè)算力資源感知依然面臨以下問題:
① 工業(yè)互聯(lián)網(wǎng)中海量業(yè)務(wù)的處理導(dǎo)致內(nèi)外網(wǎng)算力是高動態(tài)變化的,現(xiàn)有算力感知技術(shù)很難實現(xiàn)大規(guī)模、高動態(tài)性算力資源的實時感知。
② 需針對大規(guī)模、泛在、異構(gòu)的算力資源提供主動和被動的算力感知機制,包括算力通告技術(shù)和基于時空表征學(xué)習(xí)的算力發(fā)現(xiàn)技術(shù)。
隨著工業(yè)智能的發(fā)展,工業(yè)算力中越來越多地部署智能應(yīng)用。然而智能應(yīng)用在算力網(wǎng)絡(luò)中訓(xùn)練、部署和推理的過程中都存在著以下挑戰(zhàn):
① 算力網(wǎng)絡(luò)中邊緣計算服務(wù)器算力受限,傳統(tǒng)AI模型的訓(xùn)練和推理對算力需求高,因此如何實現(xiàn)輕量化的模型訓(xùn)練和推理是亟待解決的問題。
② 工業(yè)場景需要基于實時數(shù)據(jù)對模型不斷進行訓(xùn)練和改進以提高模型的精確度,為保障訓(xùn)練過程的數(shù)據(jù)隱私性,提高訓(xùn)練過程的效率,可采用聯(lián)邦學(xué)習(xí)技術(shù)進行模型訓(xùn)練。因此,異構(gòu)且分布式部署的邊緣計算服務(wù)器需協(xié)同訓(xùn)練以實現(xiàn)高效、可靠的模型訓(xùn)練。
算力路由和資源調(diào)度是基于對網(wǎng)絡(luò)、計算、存儲等多維資源以及服務(wù)的感知,通過對算力和網(wǎng)絡(luò)等多方面資源進行協(xié)同優(yōu)化,按需生成任務(wù)調(diào)度方案及任務(wù)卸載路徑的技術(shù),目前在實際應(yīng)用中還存在以下問題:
① 工業(yè)算力網(wǎng)絡(luò)包括內(nèi)網(wǎng)和外網(wǎng)多層算力資源,因此如何進行多層路由,包括多層域內(nèi)路由和域間路由是亟待解決的問題;
② 工業(yè)任務(wù)的處理需要聯(lián)合調(diào)度異構(gòu)的算力資源,如何針對多元業(yè)務(wù)的不同需求對異構(gòu)算網(wǎng)資源進行一體式路由和調(diào)度存在困難;
③ 工業(yè)任務(wù)對處理時延要求極低,對可靠性要求極高,因此算力路由節(jié)點需要維護算力資源和網(wǎng)絡(luò)的資源實時狀態(tài)信息,同時根據(jù)業(yè)務(wù)需求生成高效可靠的路由和資源調(diào)度策略。
工業(yè)互聯(lián)網(wǎng)對生產(chǎn)過程和數(shù)據(jù)的安全性和隱私性要求極高。而利用算力網(wǎng)絡(luò)中泛在、異構(gòu)、海量的計算資源來為高可靠性要求的工業(yè)智能任務(wù)提供服務(wù)的過程中可能存在以下安全問題:
① 工業(yè)內(nèi)網(wǎng)及外網(wǎng)的算力資源被惡意攻擊導(dǎo)致計算錯誤、計算結(jié)果在回傳過程中被惡意篡改導(dǎo)致生產(chǎn)事故;
② 工業(yè)數(shù)據(jù)在傳輸和計算過程中容易泄露和被篡改,尤其是將工業(yè)數(shù)據(jù)傳輸至外網(wǎng)算力網(wǎng)絡(luò)時被竊取和篡改的可能性高;
③ 工業(yè)外網(wǎng)算力網(wǎng)絡(luò)中,在多云供應(yīng)商情況下,對分布式計算服務(wù)器的算力分配和算力交易進行審計和監(jiān)管困難,算力資源在開放、管理與交易方面依然存在挑戰(zhàn)。
隨著工業(yè)互聯(lián)網(wǎng)的智能化發(fā)展,業(yè)務(wù)應(yīng)該在云端還是邊端計算是需要考慮的問題;算力網(wǎng)絡(luò)旨在更高效地利用西部的算力資源,實現(xiàn)東西部協(xié)同發(fā)展,共同創(chuàng)造產(chǎn)業(yè)數(shù)字化和數(shù)字產(chǎn)業(yè)化新局面。算力網(wǎng)絡(luò)是將網(wǎng)絡(luò)與計算有效連接的一體化方案,它的發(fā)展是順時勢而為,如何構(gòu)建工業(yè)互聯(lián)網(wǎng)中的算力網(wǎng)絡(luò)平臺是工業(yè)互聯(lián)網(wǎng)智能應(yīng)用發(fā)展的必然要求。目前,工業(yè)互聯(lián)網(wǎng)中算力網(wǎng)絡(luò)的研究仍處于初步階段,存在許多待解決的問題。本文在調(diào)研算力網(wǎng)絡(luò)發(fā)展現(xiàn)狀和工業(yè)互聯(lián)網(wǎng)中智能應(yīng)用對算力網(wǎng)絡(luò)的需求基礎(chǔ)上,以工業(yè)內(nèi)外網(wǎng)為基礎(chǔ)構(gòu)建工業(yè)互聯(lián)網(wǎng)中算力網(wǎng)絡(luò)的內(nèi)外網(wǎng)部署模型,將智能業(yè)務(wù)按照算力和時延等需求安排在內(nèi)外網(wǎng)進行計算,同時總結(jié)了工業(yè)互聯(lián)網(wǎng)中算力網(wǎng)絡(luò)面臨的技術(shù)挑戰(zhàn),為相關(guān)領(lǐng)域的研究人員提供參考和幫助。