田雨萌,劉志波,張 凱,李忠博+,謝永強
1.軍事科學院 系統(tǒng)工程研究院,北京 100141
2.軍委裝備發(fā)展部 裝備項目管理中心,北京 100009
近年來,電子支付、元宇宙、云視頻會議等智能應用技術(shù)快速發(fā)展,各類應用對算力和資源的需求愈發(fā)迫切,據(jù)國際數(shù)據(jù)公司(International Data Corporation,IDC)的預測估計,到2025 年預計將有416 億臺物聯(lián)網(wǎng)設備聯(lián)網(wǎng),產(chǎn)生79.4 十萬億億字節(jié)(ZB)待處理數(shù)據(jù),同時,高德納公司(Gartner)曾預測,到2025年,大約超過75%的數(shù)據(jù)將實現(xiàn)邊緣側(cè)處理。而目前的計算資源遠不能滿足社會需求。因此,亟需提升計算基礎設施計算能力。
目前,主要通過云計算和邊緣計算技術(shù)來提升智能應用的服務能力。云計算是一種集中化的計算方式,通過構(gòu)建大規(guī)模數(shù)據(jù)中心,為各類應用服務提供“無限”的計算能力,是處理大規(guī)模數(shù)據(jù)的最佳選擇。但云計算集中化特性使其通常距離數(shù)據(jù)源及終端用戶較遠,產(chǎn)生顯著的通信延遲。隨著物聯(lián)網(wǎng)、人工智能、虛擬現(xiàn)實/增強現(xiàn)實(virtual reality/augmented reality,VR/AR)等技術(shù)的持續(xù)發(fā)展,相關應用對實時性的要求持續(xù)提升,云計算已無法滿足新興延遲敏感應用低時延的需求?;诖?,研究人員提出了邊緣計算的概念,該技術(shù)將計算向網(wǎng)絡末端延伸,在數(shù)據(jù)源近端實現(xiàn)數(shù)據(jù)的快速處理,以減小時延。邊緣計算的提出,滿足了用戶對低時延的需求。近年來,各國政府和組織機構(gòu)越來越重視邊緣計算的發(fā)展。2021 年,歐盟發(fā)布《2030 數(shù)字指南針:歐洲數(shù)字十年之路》[1],計劃到2030 年部署1 萬個能夠?qū)崿F(xiàn)氣候中和且高度安全的邊緣節(jié)點,另據(jù)戴爾公司發(fā)布的一份報告顯示,2026年3 170億美元的全球邊緣計算支出中,美國的占比最高可能達到40%[2]。此外,以國際霧計算產(chǎn)學研聯(lián)盟(OpenFog)、開放邊緣計算聯(lián)盟(Open Edge Computing)為代表的多家跨境域組織致力于推動邊緣計算技術(shù)的標準化和落地。但單個邊緣計算基礎設施和云中心相比資源受限,難以支撐大數(shù)據(jù)的計算和人工智能模型訓練等工作。在技術(shù)特征上,邊緣計算與云計算互為補充。因此,為充分利用云計算超大規(guī)模的計算能力和邊緣計算低時延的特性,研究云計算和邊緣計算的整合與協(xié)同技術(shù)至關重要,通過實現(xiàn)云計算與邊緣計算的整合,構(gòu)建層次化的云邊協(xié)同服務體系,為用戶提供低時延、高可靠的計算服務[3]。歐盟提出了一項推動云邊協(xié)同在物聯(lián)網(wǎng)領域應用的專業(yè)計劃(The European cloud,edge and IoT continuum initiative,EUCloudEdgeIoT.eu),旨在幫助企業(yè)、行業(yè)協(xié)會、科技供應商和開發(fā)商等從這種協(xié)同技術(shù)中獲益。2021年,《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》也提出要“協(xié)同發(fā)展云服務與邊緣計算服務”[4]。同年6 月,中國信息通信研究院牽頭制定的《云邊協(xié)同關鍵技術(shù)態(tài)勢研究報告》指出,未來構(gòu)建端到端的云邊協(xié)同架構(gòu)將是實現(xiàn)全域數(shù)據(jù)高速互聯(lián)、應用整合調(diào)度分發(fā)以及計算資源全覆蓋的重要途徑[5]。2022年6月28日,為進一步推動邊緣計算規(guī)模化落地部署,由中國信通院云計算與大數(shù)據(jù)研究所牽頭,聯(lián)合產(chǎn)學研用數(shù)十家單位編制的三項邊緣計算行業(yè)標準(《互聯(lián)網(wǎng)邊緣云服務信任能力要求》《基于云邊協(xié)同的邊緣節(jié)點管理解決方案能力要求》《分布式云全局管理框架》)正式發(fā)布和實施,引領產(chǎn)業(yè)規(guī)范化發(fā)展。自此之后,一些企業(yè)快速完成商業(yè)化初探,推動著整個云邊生態(tài)的豐富和繁榮。在2022年的云棲大會上(http://www.aliyun.com/yunqi-/2022/index),阿里公布了其基于云邊協(xié)同架構(gòu)的五種新型解決方案,這五種方案分別支撐音視頻、云游戲、云渲染、邊緣組網(wǎng)和云網(wǎng)融合場景。華為、浪潮等企業(yè)也陸續(xù)開始提供云邊協(xié)同相關的技術(shù)支持服務。在學術(shù)研究方面,一些團隊在電力物聯(lián)網(wǎng)[6-7]、工業(yè)物聯(lián)網(wǎng)[8-10]、車聯(lián)網(wǎng)[11-14]場景下開展云邊協(xié)同的相關研究工作。未來,云邊協(xié)同技術(shù)的持續(xù)優(yōu)化與發(fā)展,將為智慧醫(yī)療、智慧交通、軍事指揮等更多行業(yè)[5,15]發(fā)展提供有效支撐。
資源協(xié)同是云邊協(xié)同的基石[15-17],而任務卸載是云邊資源協(xié)同的關鍵技術(shù)之一。鑒于此,本文詳細闡述云邊資源協(xié)同中任務卸載技術(shù)的原理,深入探討面臨的瓶頸,提出未來可深化研究的若干方向。
隨著技術(shù)的不斷更迭以及5G/6G時代的到來,趨于成熟的云計算架構(gòu)逐漸顯露弊端。一方面,網(wǎng)絡視頻等應用的迅猛發(fā)展對數(shù)據(jù)處理能力提出了更高的要求,通常而言,云服務器100 Mbit/s帶寬支持300人同時在線點播400 Kbit/s 碼率視頻,但隨著人們生活品質(zhì)的提升,高清畫質(zhì)的視頻需求日益增加,實現(xiàn)可控成本下的高質(zhì)量數(shù)據(jù)處理為主干網(wǎng)帶寬與云中心資源帶來了挑戰(zhàn);另一方面,大量物聯(lián)網(wǎng)設備要求低延遲服務,終端數(shù)據(jù)量激增,云計算模式的響應時間在2 s左右,邊緣計算模式的響應時間可達0.5 ms[18],云中心難以為繼更無法保證數(shù)據(jù)隱私安全。面對這一系列問題和挑戰(zhàn),學術(shù)界和工業(yè)界的研究人員開始研究邊緣計算,希望借此解決應用與資源的供需矛盾。
2013 年,美國太平洋西北國家實驗室首次提出邊緣計算的概念,迅速引起了各國科技人員的廣泛關注。2019 年,我國科技企業(yè)開始把更多科研力量投入邊緣計算研究之中。相比云計算的集中化、規(guī)?;吘売嬎愕馁Y源部署更加靈活,對具有嚴格低延遲需求的場景,首要考慮縮短與終端設備的物理距離,部署在基站等處;對隱私保護要求高的場景,其部署則首要考慮合理的覆蓋范圍。
邊緣計算架構(gòu)包含眾多地理位置分散的邊緣計算節(jié)點,在該架構(gòu)下,待處理數(shù)據(jù)不再需要全部上傳到云中心,而是通過邊緣計算節(jié)點快速處理部分數(shù)據(jù)。相比較云中心,單個邊緣計算節(jié)點資源有限,難以實現(xiàn)全域通信和調(diào)度。云中心距離終端設備過遠,欠缺迅速實時的響應能力。因此,云、邊計算相輔相成,邊緣端靠近執(zhí)行單元,可以作為數(shù)據(jù)采集和初步處理單元,也可以作為云派發(fā)算法的執(zhí)行單元;云端具備全局視野,可以將經(jīng)過大數(shù)據(jù)技術(shù)優(yōu)化的模型或規(guī)則派發(fā)給邊緣節(jié)點,處理數(shù)據(jù)量大的非延遲敏感任務。
常見的云交付模型為基礎設施即服務(infrastructure as a service,IaaS)、平臺即服務(platform as a service,PaaS)、軟件即服務(software as a service,SaaS)。類似的在邊緣計算,有EC-IaaS(edge computinginfrastructure as a service)、EC-PaaS(edge computingplatform as a service)、EC-SaaS(edge computingsoftware as a service)。2018年,邊緣計算產(chǎn)業(yè)聯(lián)盟在云邊協(xié)同1.0 中將云邊協(xié)同的能力和內(nèi)涵劃分為六個層次:資源協(xié)同、數(shù)據(jù)協(xié)同、智能協(xié)同、應用管理協(xié)同、業(yè)務管理協(xié)同、服務協(xié)同[16]。為了優(yōu)化各協(xié)同之間的層次關系,在云邊協(xié)同白皮書2.0 中,六大協(xié)同整合為三大協(xié)同,應用管理協(xié)同與業(yè)務協(xié)同合并到新版本的應用協(xié)同中,數(shù)據(jù)協(xié)同和智能協(xié)同合并到新版本的服務協(xié)同中,資源協(xié)同保持不變,如圖1所示。
圖1 云邊協(xié)同能力與內(nèi)涵Fig.1 Capabilities and connotations of cloud-edge collaboration
2020年之后,云邊協(xié)同應用場景逐漸明晰,一些實際應用案例開始嶄露頭角[5]。如電網(wǎng)行業(yè)中,研究人員利用云邊協(xié)同框架優(yōu)化故障檢測系統(tǒng)(高阻抗故障檢測)。云中心是主要平臺,邊緣計算是云中心的擴展,云中心從多個分發(fā)網(wǎng)絡采集故障數(shù)據(jù)用于訓練基本模型,并將其發(fā)送到與各分發(fā)網(wǎng)絡相關聯(lián)的邊緣節(jié)點,每個邊緣節(jié)點基于基本模型,利用其局部數(shù)據(jù)生成特定模型。云中心負責基本計算并共享結(jié)果,云邊之間定期通信以更新模型。這種方式避免了重復計算,并且訓練數(shù)據(jù)的數(shù)量和類型都得到了擴充,能有效提升系統(tǒng)性能[19-21]。家裝行業(yè)中,研究人員將終端納入云邊協(xié)同框架,利用云-邊-端架構(gòu)設計全屋控制系統(tǒng)[22]。終端層由智能門禁、智能攝像頭等設備組成,邊緣層由網(wǎng)關、個人計算機等邊緣節(jié)點組成,云層由多個高性能服務器組成。終端設備收集用戶行為信息并生成數(shù)據(jù),將其上傳到邊緣層,邊緣層負責計算、存儲這些數(shù)據(jù)以及管理和調(diào)度終端設備,同時,邊緣節(jié)點還會將部分數(shù)據(jù)上傳到云中心。云中心負責接收、分析并存儲邊緣節(jié)點上傳的數(shù)據(jù)以及整個系統(tǒng)的管理和調(diào)度。另外,當邊緣節(jié)點遇到無法處理的任務時,云中心會接管并處理這些任務,以便為用戶提供更好的服務。采礦行業(yè)中,為提高災難預警速度,降低煤礦開采事故發(fā)生率,研究人員設計了基于云-邊-端架構(gòu)的環(huán)境監(jiān)測系統(tǒng)[23]。云中心負責智能算法的訓練以及歷史數(shù)據(jù)的存儲,它定期將訓練好的模型(例如地質(zhì)構(gòu)造分析模型)發(fā)送到邊緣設備,邊緣設備利用這些模型處理和分析終端傳感器上傳的礦井環(huán)境數(shù)據(jù),確保及時排除煤礦開采過程中存在的安全隱患。綜上,云計算與邊緣計算必須緊密合作,實現(xiàn)云邊協(xié)同,才能更好地滿足多樣化的場景需求,最大限度發(fā)揮云計算、邊緣計算的價值優(yōu)勢。
在云邊協(xié)同能力與內(nèi)涵變化的過程中,資源協(xié)同沒有發(fā)生變化,這表明,對云邊協(xié)同系統(tǒng)而言,無論承載的上層應用運行于何種場景,輸入何種類型的數(shù)據(jù),運行何種模式的處理,資源都是它首要考慮的因素。在探究如何最大限度發(fā)揮云邊協(xié)同優(yōu)勢時,實現(xiàn)資源協(xié)同是基本前提。
資源協(xié)同提供了全局視角的資源調(diào)度能力,旨在根據(jù)任務的需求和資源的可用性,合理地分配任務和管理云邊資源,提高資源利用率,以實現(xiàn)更高效的計算和降低網(wǎng)絡延遲。它要求邊緣節(jié)點提供計算、存儲、網(wǎng)絡、虛擬化等基礎設施資源,具有本地資源調(diào)度管理能力,也接收并執(zhí)行云端的資源調(diào)度管理策略;云端則提供資源調(diào)度管理策略,包括邊緣節(jié)點的設備管理、資源管理以及網(wǎng)絡連接管理[17],隨著認識的不斷深入,云-邊-端三層架構(gòu)(見圖2)是目前被普遍認可的一種云邊資源協(xié)同架構(gòu)[24-27]。
圖2 云邊資源協(xié)同架構(gòu)Fig.2 Architecture of cloud-edge resource collaboration
終端層,也可稱之為用戶層,通常由各種終端設備組成,比如智慧城市監(jiān)控攝像頭[28]、工業(yè)物聯(lián)網(wǎng)設備[29]、智能家居設備[30]等。這些設備用于采集各種待處理數(shù)據(jù)。
邊緣層位于云層和終端層之間,由多種網(wǎng)絡和計算設備組成,比如基站、網(wǎng)關、邊緣服務器等,研究人員常提到的邊緣節(jié)點是對邊緣層多種產(chǎn)品形態(tài)的基礎共性能力的邏輯抽象。邊緣層主要具備以下幾個功能和作用:
(1)數(shù)據(jù)緩存和處理。邊緣層可以緩存終端需要的部分數(shù)據(jù),提高數(shù)據(jù)訪問速度,也可以在邊緣設備上進行一些數(shù)據(jù)處理,比如格式轉(zhuǎn)換、數(shù)據(jù)脫敏等操作,以優(yōu)化傳輸?shù)皆浦行牡臄?shù)據(jù)質(zhì)量,縮短延遲。
(2)數(shù)據(jù)轉(zhuǎn)發(fā)。邊緣層可以根據(jù)終端應用的處理需求和網(wǎng)絡狀況,將待處理數(shù)據(jù)轉(zhuǎn)發(fā)到相鄰節(jié)點,以便更快地完成數(shù)據(jù)處理并降低網(wǎng)絡負載,提高資源利用率。
(3)安全性保障。在邊緣層進行數(shù)據(jù)處理和分析可以減少數(shù)據(jù)在互聯(lián)網(wǎng)上的傳輸,降低數(shù)據(jù)泄露和被攻擊的風險。
云層由云計算基礎設施組成,在三層架構(gòu)中,它具備最強的數(shù)據(jù)處理能力和存儲能力,負責處理全局信息以及一些計算復雜的任務。
云邊協(xié)同下的資源種類包括硬件資源和軟件資源兩種。在研究中常提到的計算資源、存儲資源、網(wǎng)絡資源屬于硬件資源,除此之外還有諸如虛擬網(wǎng)絡函數(shù)、推理模型等軟件資源。目前,端-邊-云框架已被應用于工業(yè)物聯(lián)網(wǎng)場景。文獻[31]解決了通信資源(帶寬)分配問題,將所有任務首先上傳到邊緣節(jié)點,邊緣節(jié)點根據(jù)節(jié)點負載狀態(tài)決定任務是否需要轉(zhuǎn)發(fā)到云中心,然后根據(jù)任務的數(shù)據(jù)長度和信道瞬時狀態(tài)為待上傳到云中心的任務分配帶寬。文獻[32]在三級框架下根據(jù)任務的算力需求分配計算資源(服務器主頻),根據(jù)每個任務的延遲需求制定個性化的卸載策略,延遲敏感型任務卸載到邊緣服務器處理,有效降低了傳輸成本。在網(wǎng)絡直播場景下,文獻[33]提出的三層框架包括一個部署在云中心的服務器、多個部署在移動基站的服務器以及兩種類型的終端用戶。該研究假設手機端用戶通過移動網(wǎng)絡連網(wǎng),電腦端用戶通過家庭寬帶連網(wǎng),手機端用戶的任務(視頻流)發(fā)送到移動基站的服務器處理,電腦端用戶的任務發(fā)送到云中心的服務器處理,針對兩種類型用戶各自任務的內(nèi)存、主頻等資源需求,為任務分配合適的處理位置。
以上研究重點突出了邊緣層數(shù)據(jù)處理和轉(zhuǎn)發(fā)的功能,可以看出,邊緣層的引入使部分計算資源距離用戶更近,云中心位于“后方”作為總管提供全局保障。因此,相比獨立的云計算和邊緣計算應用模式,云邊資源協(xié)同模式提供了更佳的解決方案。
任務卸載是云邊資源協(xié)同的關鍵技術(shù)之一,它的基本原理是根據(jù)任務的性質(zhì)和要求,制定合理的卸載策略,將計算密集型或延遲敏感的任務分配到邊緣節(jié)點處理,而將數(shù)據(jù)密集型或存儲密集型的任務分配到云中心處理,充分利用云邊資源,減少數(shù)據(jù)傳輸和響應時間,提高系統(tǒng)的性能和用戶體驗。
全部卸載也稱為二進制卸載或“0-1”卸載,指將全部任務保留在本地計算或全部卸載調(diào)度到云中心、邊緣節(jié)點執(zhí)行。僅在本地處理時,響應時間和成本由本地處理器的處理速率、存儲容量等條件決定。當被全部卸載到云中心或邊緣節(jié)點處理時,響應時間包括傳輸延遲和處理延遲,成本一般考慮傳輸成本,能耗考慮傳輸能耗和處理能耗,其中,處理能耗特指在無人機等邊緣節(jié)點可移動的通信場景下,邊緣節(jié)點處理任務產(chǎn)生的能耗。因為在這些場景下,邊緣節(jié)點具備可移動性,無法像云服務器一樣直接接通電源供電,所以此時需要考慮在邊緣節(jié)點處的能耗。
全部卸載基于部分終端設備(比如采樣傳感器)不具備處理能力的現(xiàn)狀,將全部任務卸載到邊緣節(jié)點或云中心處理。隨著技術(shù)的發(fā)展,很多智能終端也具備一定的算力,能夠滿足一些任務的需要,因此在任務卸載過程中,這部分任務可以保留在本地執(zhí)行,其他任務利用云中心、邊緣節(jié)點處理,這就是部分卸載。部分卸載主要基于智能手機、可穿戴設備等智能設備具備一定處理能力的現(xiàn)狀,充分利用終端算力資源。
在智能化應用不斷發(fā)展的背景下,云邊資源的協(xié)同調(diào)度正逐漸成為各行各業(yè)優(yōu)化系統(tǒng)性能和提高資源利用率的重要手段。
1.4.1 智慧交通
智慧交通系統(tǒng)是最受期待的智能城市服務[34],由于自動駕駛、高速公路無人感知收費等場景數(shù)據(jù)吞吐很高且對響應時間、網(wǎng)絡安全等都有很高的要求,在中心云計算和傳統(tǒng)網(wǎng)絡架構(gòu)下無法提供低延時的服務,因此借助云邊協(xié)同構(gòu)建一個低延時、安全、穩(wěn)定的運行環(huán)境,可以減少出現(xiàn)流量堵塞的機會。
在自動駕駛場景中,車輛和交通基礎設施(交通信號燈、公路攝像頭等)需配備支持邊緣計算的傳感器,采集和處理來自車輛、環(huán)境的數(shù)據(jù),這些位于系統(tǒng)邊緣的交通基礎設施之間相互連接,形成小型邊緣局域網(wǎng),當汽車在系統(tǒng)中行駛時,通過5G等通信技術(shù)與邊緣節(jié)點進行交互,獲得實時路況分析、時間估測等服務。與此同時,云中心從邊緣節(jié)點收集經(jīng)過整理后的數(shù)據(jù),利用深度學習等技術(shù)向邊緣節(jié)點反饋恰當?shù)闹噶钜员WC自動駕駛的安全穩(wěn)定。
1.4.2 智慧醫(yī)療
隨著科技的不斷發(fā)展和人口老齡化的加劇,智慧醫(yī)療正成為醫(yī)療行業(yè)的發(fā)展趨勢。智慧醫(yī)療不僅僅是簡單地將傳統(tǒng)醫(yī)療服務數(shù)字化,而是利用先進的信息技術(shù)和人工智能技術(shù)來實現(xiàn)醫(yī)療流程的數(shù)字化和智能化,進一步提高醫(yī)療服務的效率和質(zhì)量。云邊資源協(xié)同能夠有效提高資源利用率,降低成本,實現(xiàn)資源優(yōu)化配置,為智慧醫(yī)療的發(fā)展提供有力支撐[35]。
遠程醫(yī)療是實現(xiàn)智慧醫(yī)療的一種重要形式,即通過互聯(lián)網(wǎng)連接醫(yī)生和患者,實現(xiàn)遠程問診、遠程診斷和遠程治療?;谠七厖f(xié)同的遠程醫(yī)療體系架構(gòu)的終端層由各種與醫(yī)療保健相關的設備組成,比如智能手表等可穿戴設備或者醫(yī)療傳感器,這些設備將采集到的數(shù)據(jù)上傳到邊緣層。邊緣層由大量網(wǎng)絡邊緣節(jié)點組成,這些節(jié)點被部署在終端和云中心之間,比如醫(yī)院、社區(qū)保健站等,它們可以更快速地響應終端的請求,也可以有效避免遠程傳輸潛在的數(shù)據(jù)泄露問題。邊緣層定期將整理后的數(shù)據(jù)發(fā)送到云中心進行總結(jié)分析和永久存儲。
云邊資源協(xié)同還有助于推動醫(yī)療資源共享的發(fā)展。醫(yī)療機構(gòu)通過云邊資源協(xié)同技術(shù)共享醫(yī)療設備、醫(yī)療數(shù)據(jù)等資源,減少醫(yī)療資源的浪費和重復使用。
1.4.3 軍事指揮
云計算作為信息化建設的重要技術(shù),為軍事領域的發(fā)展增加了極大的動力,但隨著技術(shù)的發(fā)展,云計算架構(gòu)在軍事應用上顯露出以下不足:(1)通信帶寬供不應求。近年來,軍事作戰(zhàn)裝備性能不斷提升,其產(chǎn)生的數(shù)據(jù)體量呈指數(shù)增長,如果仍將所有裝備的全部數(shù)據(jù)上傳到云數(shù)據(jù)中心會占用巨大的通信帶寬,甚至會出現(xiàn)擁塞,部分數(shù)據(jù)不能得到及時處理,處理結(jié)果也無法及時回傳。(2)數(shù)據(jù)安全難以保證。在大量數(shù)據(jù)傳輸過程中,敵方若發(fā)動分布式拒絕服務(distributed denial of service,DDOS)攻擊,則我方重要情報數(shù)據(jù)會暴露。(3)集中化體系不可靠。云計算架構(gòu)最重要的一個特征就是集中化,但隨著多方對云計算技術(shù)的深入研究,在開展作戰(zhàn)時,云中心是首要被攻擊的目標。一旦云中心被擊潰或與云中心之間的通信線路被切斷,則無法快速恢復戰(zhàn)斗力。
邊緣計算在靠近接入網(wǎng)側(cè)部署計算和存儲資源,可以快速響應終端的請求。云邊資源協(xié)同在軍事領域的應用主要有兩個方向:目標識別和信息保障。
(1)目標識別
現(xiàn)代戰(zhàn)爭中,高效精確的戰(zhàn)場情報是制勝關鍵。無人機偵察是獲取情報的重要手段之一,采集到的圖像數(shù)據(jù)需要經(jīng)過判斷篩選、識別標注,以形成有用情報。過去的通常做法是人工操作,云計算技術(shù)普及后,改為上傳到云中心處理,但這種做法難以滿足快速作戰(zhàn)的時效性要求。云邊協(xié)同的計算模式可以較好地解決這個問題。通過在無人機上安裝計算芯片,可以實現(xiàn)對圖像數(shù)據(jù)的實時處理,只回傳具有目標信息的關鍵幀,當邊緣節(jié)點算力不足時,回傳到云中心處理。這種方式可以減輕通信負擔和后方中心處理的壓力。
(2)信息保障
在軍事信息保障領域,云中心與機動邊的協(xié)同服務模式有很大的應用前景。機動邊緣,是一種與固定集中相對應的場景,主要為戰(zhàn)時機動前出作戰(zhàn)提供信息服務和保障。通過構(gòu)建機動邊緣與云中心協(xié)同服務體系,為構(gòu)建快速打擊環(huán)路提供有效支撐,提升我軍機動作戰(zhàn)指揮能力和作戰(zhàn)單元靈活性。機動邊的作戰(zhàn)環(huán)境具備如下特點:(1)資源有限。考慮到機動邊的定位是體量輕便,靈活性較好,因此雖具有一定的計算存儲等資源,但相對固定云中心,資源整體有限。(2)網(wǎng)絡連接動態(tài)。機動環(huán)境下,受多方面因素影響,網(wǎng)絡連接是動態(tài)變化的。
在基于云-機動邊協(xié)同的信息系統(tǒng)建設及保障方面,國外相關機構(gòu)提出的戰(zhàn)場邊緣云概念是將每個作戰(zhàn)單元視為一個節(jié)點,既向云中心提供數(shù)據(jù)也從云中心獲取數(shù)據(jù),指揮員通過大數(shù)據(jù)分析系統(tǒng)做出決策實現(xiàn)跨域指揮調(diào)度。在此背景下,某研究機構(gòu)提出的分布式地面情報系統(tǒng)項目和內(nèi)容移動邊緣網(wǎng)絡項目都已經(jīng)在軍隊得到了廣泛應用。
云邊資源協(xié)同主要包括兩種思路[36]:(1)以服務質(zhì)量要求為輸入。根據(jù)用戶發(fā)布任務對服務質(zhì)量的要求,綜合考慮能耗、時延等代價,將任務卸載到邊、云服務器或者本地處理,例如,文獻[37]利用遺傳算法解決了無人機場景下,以響應時間和能耗為目標的獨立任務卸載問題,文獻[38]利用第三代非支配排序遺傳算法解決了以響應時間和能耗為優(yōu)化目標的工作流卸載問題。(2)以資源需求為輸入。由于邊緣資源有限,且用戶請求的負載動態(tài)變化,根據(jù)任務對資源類型和能力等方面的要求,綜合考慮云和邊緣的資源配置,合理卸載任務,以充分滿足用戶的服務質(zhì)量要求,例如,文獻[39]提出的基于區(qū)塊鏈的自適應資源分配框架,解決了移動邊緣計算頻譜資源的分配問題和任務卸載決策問題,文獻[40]提出的分層求解算法,解決了在非正交多址接入(non-orthogonal multiple access,NOMA)協(xié)議下頻譜資源和計算資源的分配問題以及任務卸載決策問題。因此,云邊資源協(xié)同研究的核心是最優(yōu)化任務卸載模型。在實際研究中,按照其運行模式,區(qū)分為獨立任務和工作流兩類,并分別從全部卸載和部分卸載兩個角度開展相關工作。其中,獨立任務是指可獨立執(zhí)行并滿足用戶需求的任務,工作流由多個具備一定依賴關系的子任務構(gòu)成,如圖3[41]所示。
圖3 導航應用任務拓撲關系圖Fig.3 Task topology diagram of navigation application
目前,以獨立任務為研究對象的工作較多。從卸載粒度(全部卸載、部分卸載)和優(yōu)化目標(響應時間、成本/能耗、多目標)兩個維度,對現(xiàn)有研究進行歸納總結(jié)。
2.1.1 全部卸載
目前,獨立任務全部卸載的主要研究內(nèi)容包括響應時間優(yōu)化、成本優(yōu)化及多目標優(yōu)化。
(1)響應時間優(yōu)化
Hao等人[42]以最小化響應時間為目標,針對獨立任務的卸載問題展開研究,研究人員分別將任務置于本地、邊緣服務器、云服務器處理,并計算任務處理耗時最短的方案。接著,該團隊開展了多個相對獨立任務的卸載問題的研究,該研究按照任務的重要性設置優(yōu)先級并賦予其不同的權(quán)重,將該場景下的響應時間優(yōu)化問題定義為最小化末位任務響應時間。該團隊提出了一種啟發(fā)式貪心算法,并結(jié)合領域搜索算法制定卸載方案求解響應時間的優(yōu)化問題。與將所有任務卸載到同一層和不考慮全局將每個任務分別卸載到其最佳計算位置相比,作者提出的方案明顯縮短了響應時間,并且體現(xiàn)了全局最優(yōu)的思想。
上述研究假定僅存在一個邊緣節(jié)點的場景,并且系統(tǒng)設計簡單,對此,Ren 等人[43]針對多邊緣節(jié)點場景設計了一種云邊協(xié)同任務卸載模型,該模型主要解決通信資源和計算資源的聯(lián)合分配問題,仿真結(jié)果顯示該模型能夠顯著縮短響應時間。其中,通信資源按照時隙進行分配。在分配計算資源之前,首先制定任務卸載策略,計算某任務在邊緣節(jié)點處理所需通信資源和邊緣節(jié)點計算能力的比率,以及在云中心完成所需算力和邊緣節(jié)點計算能力的比率,得到二者諧波平均值,將該平均值用于任務劃分。當邊緣計算資源不足時,將更多的任務數(shù)據(jù)卸載至云中心。相反,如果云計算資源非常稀缺,則在邊緣節(jié)點處理更多的任務數(shù)據(jù)。最后使用卡羅需-庫恩-塔克(Karush-Kuhn-Tucher,KKT)條件得到最佳計算資源分配策略。此類研究中,通常將云邊協(xié)同劃分為端邊協(xié)同和邊云協(xié)同兩部分,而目前對邊邊協(xié)同計算的研究還不夠深入,因此,還需要對邊緣節(jié)點間的協(xié)同進行統(tǒng)籌,以實現(xiàn)最優(yōu)化的全局資源調(diào)度和管理。針對上述問題,Wu 等人[44]設計的協(xié)同框架引入邊邊協(xié)同,結(jié)合遺傳算法和模擬退火算法,實現(xiàn)了對任務總響應時間的優(yōu)化。以遺傳算法為代表的啟發(fā)式算法是一種基于經(jīng)驗的算法,它通過一些規(guī)則或者啟發(fā)式函數(shù)來指導搜索過程,從而達到快速找到最優(yōu)解的目的,區(qū)別于此,強化學習是一種數(shù)據(jù)驅(qū)動的算法,它通過與環(huán)境交互來自適應地學習最優(yōu)策略,當任務卸載問題的特征不完全已知或者無法通過預定義的規(guī)則或策略來完全刻畫時,更適合用強化學習來求解問題。Wang等人[45]利用強化學習中的Q 學習(Q-learning)算法,在無人機場景下解決任務卸載的響應時間優(yōu)化問題。Wang等人[46]建立了利用NOMA 技術(shù)的響應時間優(yōu)化模型,按照強化學習算法基本思想和組成(狀態(tài)空間、動作空間、狀態(tài)轉(zhuǎn)移概率、獎勵值、折扣因子),定義了一種適用于他們所提出的目標函數(shù)的強化學習算法。但強化學習在處理高維度問題的時候仍存在不足,神經(jīng)網(wǎng)絡擅長學習更高層次的特征表示,結(jié)合了神經(jīng)網(wǎng)絡和強化學習的深度強化學習可以更好地處理高維狀態(tài)信息。Qi等人[47]利用深度強化學習算法,對任務卸載模型進行優(yōu)化,該研究證明了任務卸載響應時間優(yōu)化問題的目標函數(shù)難以在多項式時間內(nèi)進行數(shù)值求解??紤]到求解該類型問題的高復雜性以及邊緣資源的局限性,他們提出了基于異步優(yōu)勢動作評價算法的云邊協(xié)同任務卸載優(yōu)化(cloud-edge collaboration scheduling algorithm based on asynchronous advantage actor-critic,CECS-A3C)算法。與深度Q 網(wǎng)絡(deep Q-network,DQN)算法相比,該研究進一步縮短了任務處理時間。在任務卸載過程中網(wǎng)絡條件和服務器負載具有動態(tài)特性,而上述研究所提出的算法均是基于靜態(tài)場景,在動態(tài)場景下的應用效果卻不理想。Yuan等人[48]考慮到任務卸載過程中可用帶寬具有時變性,并且當面對大量待卸載任務的時候可能發(fā)生擁塞和饑餓現(xiàn)象,結(jié)合在線學習和深度強化學習算法提出了一種在線公平調(diào)度任務(online task dispatching and fair scheduling,OTDS)算法,與Qi 等人[47]提出的CECS-A3C 算法相比,兩種方法都考慮到了動態(tài)特性,但CECS-A3C算法只追求效率忽略了任務卸載的公平性,容易導致因任務等待時間過長,從而在任務截止前無法完成處理的問題。相比而言,OTDS在降低任務處理平均響應時間方面的效果更佳。
(2)成本優(yōu)化
除了響應時間,成本也是研究人員常關注的優(yōu)化指標。Chen等人[49]關注到任務的產(chǎn)生過程是高度動態(tài)的,如何在保證動態(tài)卸載性能和降低成本之間取得折中是一個值得思考的問題。他們將該問題建模為在邊緣層卸載隊列平均長度約束下的長期平均成本優(yōu)化問題,利用李雅普諾夫算法將復雜優(yōu)化問題分解為一系列子問題,并使用并行方式進行求解。Alam 等人[50]從供應商角度,提出了一種基于云邊協(xié)同的醫(yī)療保健服務供應通用物聯(lián)網(wǎng)框架,設計了基于交替方向乘子法的服務供應機制。與貪心算法相比,這篇文章提到的框架更好地控制住了將任務全部卸載到云中心和邊緣節(jié)點處理所耗費的成本,但對于醫(yī)療領域的應用探索,該研究缺乏對數(shù)據(jù)安全及隱私維護成本的考量。
(3)多目標優(yōu)化
Sardellitti 等人[51]提出了多任務邊緣計算場景下的任務卸載和資源管理策略,在滿足延遲要求的同時最大程度地減少總能耗。在單任務情況下,以封閉形式表示全局最優(yōu)解。在多任務情況下,提出了一種基于漸進凸逼近的迭代算法,收斂到原始非凸問題的局部最優(yōu)解。由于多個任務到達云、邊服務器的順序具有隨機性,當出現(xiàn)短時間內(nèi)大量到達的情況時,很容易引發(fā)擁塞。Gao等人[52]注意到這個問題,基于排隊理論,提出了一種適用于云服務器和邊緣服務器的任務緩存隊列模型,然后,基于李雅普諾夫穩(wěn)定性理論,提出了一種基于漂移加懲罰的求解策略,既降低了系統(tǒng)能耗又降低了服務器的擁塞程度。
Du等人[53]開展的聯(lián)合卸載決策優(yōu)化和計算通信資源分配的研究,以縮短響應時間和系統(tǒng)能耗為目標。該問題首先被建模為混合整數(shù)非線性規(guī)劃問題,由于該問題屬于NP 難(NP-hard)問題,作者退而求其次,將問題分為卸載決策和資源分配兩個子問題予以解決。通過變量替換并使用半正定松弛法將卸載決策優(yōu)化問題轉(zhuǎn)換為標準凸優(yōu)化問題解決;使用分式規(guī)劃和拉格朗日對偶分解解決資源分配問題。但類似前述工作所使用的傳統(tǒng)框架缺乏與環(huán)境交互的能力,對此,Wang等人[54]在框架中引入代理機制,利用其可感知性幫助用戶在云邊之間進行任務卸載的決策,避免了盲目請求資源造成資源浪費的情況,最終既縮短了響應時間又降低了能耗。該研究與文獻[42]存在相同的缺陷,即協(xié)同系統(tǒng)過于簡單,只包括一個邊緣節(jié)點。
為此,Mahmud等人[55]在多邊緣節(jié)點場景下設計了一個多目標優(yōu)化模型,用于提高卸載任務的利潤并降低服務交付延遲。具體而言,該模型是一個帶約束條件的整數(shù)線性規(guī)劃模型,為了在多項式時間內(nèi)解決問題,他們利用最佳擬合方法將任務多次迭代卸載到邊緣節(jié)點,最終實現(xiàn)約束條件下的利潤最大化和延遲最小化。不足之處在于,該研究在實驗參數(shù)的設置上,邊緣節(jié)點之間的計算能力沒有得到區(qū)分,忽略了邊緣節(jié)點的異構(gòu)復雜性。
2.1.2 部分卸載
與全部卸載的研究目標不同,關于部分卸載的主要研究內(nèi)容側(cè)重于響應時間優(yōu)化、能耗優(yōu)化及多目標優(yōu)化三方面。
(1)響應時間優(yōu)化
Guo 等人[56]研究如何為計算密集型任務制定卸載決策和分配通信帶寬以實現(xiàn)平均響應時間最小。他們將聯(lián)合優(yōu)化問題分解為多個凸優(yōu)化子問題,每個子問題都使用二進制搜索和牛頓迭代法求解。但為了簡單起見,作者設計的云邊資源協(xié)同系統(tǒng)只考慮一個邊緣節(jié)點。Kai等人[57]假設每個任務都可以按照任何比例一分為三,分別在本地、邊緣節(jié)點和云中心處理,據(jù)此以最小化任務處理時間為目標建立了一個凸優(yōu)化問題,并采用正余弦優(yōu)化方法求解。為了進一步提高任務的執(zhí)行效率,傳統(tǒng)方法需要優(yōu)化和更新。利用機器學習或深度學習算法來完成優(yōu)化響應時間的目標是一項很有意義的工作。
Miao 等人[58]使用長短期記憶網(wǎng)絡(long shortterm memory,LSTM)預測每個任務的數(shù)據(jù)量大小,基于預測值設計卸載策略,優(yōu)化每個任務的響應時間。此外,為了進一步縮短響應時間,他們開展了優(yōu)化研究,將已分配節(jié)點的任務劃分為兩個獨立子任務,為子任務繼續(xù)分配節(jié)點。通過引入LSTM算法預測數(shù)據(jù)量得到更細粒度的卸載策略,和本地計算及單邊緣節(jié)點計算策略相比,該方案提出的算法在響應時間優(yōu)化方面有明顯提升。但該研究沒有考慮多任務卸載過程中可能存在的資源請求沖突問題,并且和此前多數(shù)研究一樣,缺少將算法進行實際落地的環(huán)節(jié)。因此,在Meng等人[59]的研究中,不僅提出了一種在線感知調(diào)度算法(deadline-aware dispatching and scheduling algorithm,Dedas),還有意識地利用樹莓派和智能手機組建了一個簡易的云邊平臺,測試算法性能,這對未來相關研究方案的設計與改進具備指導意義。但作者將一個多核服務器視作多個單核服務器,這可能會導致服務器多個內(nèi)核之間的負載不均衡,導致資源利用率低下。
(2)能耗優(yōu)化
Pan 等人[60]利用NOMA 進行任務上傳和結(jié)果下載,使用連續(xù)凸逼近算法計算需要卸載的任務量以及時隙分配方案,通過優(yōu)化功率來降低能耗。Cheng等人[61]研究了數(shù)據(jù)共享下移動邊緣計算系統(tǒng)中的任務卸載問題。為了充分利用系統(tǒng)內(nèi)的算力資源,需要制定合理的卸載方案確定哪些數(shù)據(jù)需要卸載到移動邊緣計算(mobile edge computing,MEC)系統(tǒng)處理。對于不能再繼續(xù)分割的原子任務,它的卸載問題無法在多項式時間內(nèi)求解,作者提出一種基于線性規(guī)劃的近似求解算法;對于可以繼續(xù)劃分出相對獨立任務的可分割任務,需要關注的重點是根據(jù)數(shù)據(jù)分布合理編排子任務,作者首先提出兩種復雜度為O(n)的貪心算法,分別以負載均衡和能耗最小為目標分割任務,再使用基于線性規(guī)劃的近似求解算法制定卸載策略。為了方便計算,作者將本地計算、卸載到邊緣節(jié)點處理、卸載到云中心處理三種情況下的能耗視作相同,顯然這與實際不符,本地計算的能耗明顯低于另外兩種情況。
上述研究均以優(yōu)化總能耗為目標,但在一些應用場景,總能耗并非最合適的優(yōu)化目標。在5G移動計算場景下,網(wǎng)絡負載和計算負載可能會隨著時間和地理位置的變化而發(fā)生較大的波動。例如在高峰時段和高密度網(wǎng)絡區(qū)域,網(wǎng)絡和計算資源的需求可能會顯著增加,而在低負荷時段和低密度網(wǎng)絡區(qū)域,需求則可能較低。因此,優(yōu)化平均能耗可以幫助系統(tǒng)在不同時間和地點上調(diào)整能源使用,以滿足不同負荷需求,從而更好地適應動態(tài)變化場景。針對該問題,F(xiàn)an等人[62]對不同處理模式下的能耗做出區(qū)分,以降低平均能耗為目標,創(chuàng)新性地考慮邊緣服務器可能本來就有部分任務的緩存內(nèi)容。在他們提出的能耗最小化卸載算法中,以此為首要考慮因素,將這部分任務直接卸載到邊緣服務器處理,其他任務可以卸載到云中心或考慮邊緣服務器和本地的聯(lián)合處理。當決定使用邊緣服務器和本地聯(lián)合處理的方式時,利用線性規(guī)劃計算卸載到邊緣層的比例。與不考慮緩存因素的方法相比,這篇文章的方法將平均能耗降低了56%。Xia等人[63]同樣以降低平均能耗為目標,研究5G多蜂窩移動邊緣云中的任務離線和在線卸載問題。離線卸載即所有任務到達狀態(tài)已知,為靜態(tài)任務制定卸載方案。在求解過程中,考慮到整數(shù)線性規(guī)劃方法在處理大規(guī)模問題時靈活性差,作者結(jié)合濾波和取整思想提出了一種近似求解算法,去除能耗高的計算節(jié)點,迭代地將低能耗節(jié)點分配給任務。在線卸載即在當前時隙不知哪個任務即將到達,為動態(tài)任務制定卸載策略。作者利用強化學習和深度Q學習求解問題,輕量級強化學習算法用來決定當前時隙哪些任務需要卸載,深度Q學習算法用來制定任務在云邊之間的卸載決策。作者在本文做出的研究和一些基礎算法相比,顯著降低了能耗。美中不足的是,這篇文章假設一臺設備不能同時處理多個任務。
(3)多目標優(yōu)化
為了同時降低能耗和延遲,Sun 等人[64]提出了一個混合整數(shù)非線性規(guī)劃問題用于優(yōu)化端-邊-云協(xié)作系統(tǒng)中所有任務的總延遲和總能耗。這是一個很難在多項式時間內(nèi)進行求解的問題,包含兩個子問題的求解,一是卸載決策,二是資源分配。卸載決策問題被建模為0-1背包問題,作者提出了一種時間復雜度較低的分層啟發(fā)式算法求解。資源分配問題的最優(yōu)解則采用柯西-施瓦滋不等式求解。吳學文等人[65]在考慮時延和能耗的基礎上又增加了對成本的優(yōu)化,他們提出了一個云邊協(xié)同系統(tǒng)效用最大化問題,并將其分為三個子問題求解:計算資源分配、上行通信資源分配、任務卸載策略。首先利用KKT 條件求得計算資源分配的最優(yōu)解;接著提出了一種低復雜度的離散算法來快速分配用戶的發(fā)射功率;最后提出了一種基于博弈論的分布式任務卸載算法。作者提出的綜合解決方案在時延、能耗和成本的優(yōu)化方面都具有良好的效果。上述研究都忽略了網(wǎng)絡環(huán)境的時變性,Huang 等人[66]考慮到這一點,開展了初步研究。他們在車聯(lián)網(wǎng)場景下,將卸載決策問題建模為馬爾科夫決策過程,利用深度強化學習算法降低了延遲和成本。
2.1.3 小結(jié)
綜上,國內(nèi)外很多研究團隊對獨立任務的卸載問題進行了深入研究,并取得了較大的成果,但總體上還存在以下幾方面問題:一是忽略傳播時延,響應時間的計算模型比較簡單。云計算和邊緣計算的端到端傳輸距離相差懸殊,5G基站的覆蓋半徑為100~300 m,終端到國內(nèi)云中心的數(shù)據(jù)傳輸距離能達到500 km,且存在多跳轉(zhuǎn)發(fā),因此有必要考慮終端到云中心的傳播時延。二是以降低電能消耗為主,鮮少考慮能量轉(zhuǎn)換。從綠色節(jié)能的角度來看,能量收集技術(shù)能通過環(huán)境光、射頻等采集能量,盡管捕捉到的能量轉(zhuǎn)換成的電能不多,但對于一些超低能耗的節(jié)點完全足夠。三是評價指標缺乏創(chuàng)新,現(xiàn)有研究在確定優(yōu)化目標的時候,大多是對響應時間、能耗和成本進行排列組合,事實上還有別的評價指標需要考慮和優(yōu)化,比如資源利用率、單位時間完成任務數(shù)等。
相比以獨立任務為研究對象的工作,研究工作流卸載的工作較少。一個應用程序往往由多個具備依賴關系的任務組成,如圖4所示。這種工作流形式的研究對象更符合實際場景。圍繞工作流卸載的研究多以響應時間優(yōu)化、能耗優(yōu)化及多目標優(yōu)化作為優(yōu)化目標。因此,從卸載粒度(全部卸載、部分卸載)和優(yōu)化目標(響應時間、能耗、多目標)兩個維度對現(xiàn)有研究進行歸納總結(jié)。
2.2.1 全部卸載
(1)響應時間優(yōu)化
Du 等人[67]為了優(yōu)化響應時間,將所有任務分為兩組,分別卸載到邊緣節(jié)點和云中心進行處理,并提出了一種新式加權(quán)圖的處理方法,與傳統(tǒng)加權(quán)圖相比,在作者提出的加權(quán)圖中,節(jié)點表示任務或數(shù)據(jù)庫,依據(jù)在云中心、邊緣節(jié)點處理的計算延遲被賦予權(quán)重,邊表示兩個任務之間或任務與數(shù)據(jù)庫之間的通信,依據(jù)傳輸延遲給邊賦予權(quán)重,此時,經(jīng)典的最小分割算法不適用于作者提出的加權(quán)圖,作者通過將原始加權(quán)圖轉(zhuǎn)化為增廣圖,再使用最小分割法切割圖形的方法得到卸載結(jié)果。在這篇文章中,作者默認每臺邊緣服務器包含卸載任務所需的所有服務,但由于邊緣服務器存儲容量有限,只能緩存有限數(shù)量的服務。因此,Zhang等人[68]在云-邊-端框架下,規(guī)定每臺邊緣服務器只存儲部分任務的所需服務,云服務器存儲了所有服務。作為服務請求方,終端上有很多需要借助云邊資源協(xié)同架構(gòu)執(zhí)行的應用程序(比如人臉識別、虛擬現(xiàn)實應用),在卸載這些應用的子任務時,邊緣服務器是首選,當任何一臺邊緣服務器都無法處理該任務時,將任務卸載到云服務器處理。作者設計了一種基于貪心策略的卸載算法,降低了響應時間。
在上述研究的基礎上,一些研究人員提出分布式邊緣計算的概念,作為邊緣計算的擴展和演進,分布式邊緣計算通過在多個邊緣設備之間共享計算任務,形成一個分布式的計算網(wǎng)絡,來實現(xiàn)更高級別的計算協(xié)同和資源優(yōu)化。Lee等人[69]為了優(yōu)化云邊資源協(xié)同系統(tǒng)中工作流卸載的完成時間,設計了一種感知任務間依賴關系的低復雜度啟發(fā)式算法,與傳統(tǒng)忽略依賴關系的卸載方案相比,他們提出的算法將完成時間降低了18%。事實上,Lee等人沒有對多個邊緣節(jié)點之間的網(wǎng)絡拓撲結(jié)構(gòu)進行明確的設計和管理,多個邊緣節(jié)點之間的網(wǎng)絡拓撲結(jié)構(gòu)并不明確。Haja 等人[70]明確邊緣節(jié)點之間以及邊緣節(jié)點和云中心之間的網(wǎng)絡拓撲結(jié)構(gòu)是網(wǎng)狀的,基于此,研究大數(shù)據(jù)應用在分布式節(jié)點處理過程中性能下降的問題。作者提出一種快速感知分布式系統(tǒng)網(wǎng)絡拓撲的優(yōu)化算法,以降低端到端延遲和提高帶寬的有效分配率。
(2)能耗優(yōu)化
Gu 等人[71]研究在邊緣節(jié)點計算能力、無線信道狀態(tài)和響應時間的約束下,如何有效分配計算任務以降低能耗的問題。作者利用一對多的匹配理論進行建模分析,提出了一種啟發(fā)式交換匹配算法,該算法的性能優(yōu)于隨機分配算法。Liu等人[72]研究在響應時間和任務依賴關系約束下如何降低能耗。為此,作者提出了一種基于半正定松弛和隨機映射的節(jié)能任務卸載算法。實驗表明,云邊協(xié)同計算能很好地降低物聯(lián)網(wǎng)傳感器的能耗。但以上研究的假定條件都忽略了資源環(huán)境的動態(tài)性或用戶的移動性。
(3)多目標優(yōu)化
粒子群算法作為一種智能算法,參數(shù)少、收斂速度快、算法實現(xiàn)簡單,在工作流卸載中得到了廣泛的應用。但以粒子群算法為代表的傳統(tǒng)啟發(fā)式算法存在一些共同的問題,比如容易陷入局部最優(yōu),難以求得真正的最優(yōu)解。因此,Xie 等人[73]提出一種定向非局部收斂粒子群優(yōu)化算法,大大減少了響應時間和成本。為了減少響應時間和能耗,Shao等人[74]提出了一種基于遺傳算法和模擬退化算法的任務卸載算法。首先構(gòu)建云邊協(xié)作框架,其次建立以最小化響應時間和成本為目標的任務卸載策略求解問題,使用改進的遺傳模擬退火算法得到最優(yōu)策略。與傳統(tǒng)云中心處理模式相比,作者提出的方案將響應時間和能耗減少了25%。以上研究同樣是適用于靜態(tài)場景,沒有考慮用戶的移動性。
2.2.2 部分卸載
(1)響應時間優(yōu)化
Lakhan 和Li[75]提出了感知工作流內(nèi)容的任務調(diào)度(content-aware task scheduling algorithm,CATSA)框架。首先,根據(jù)任務數(shù)據(jù)量和任務間的依賴關系設置任務執(zhí)行的截止日期。然后,CATSA 對比現(xiàn)有任務排序方法:截止日期最短優(yōu)先、進程最小優(yōu)先、延遲最小優(yōu)先,選擇性能最好結(jié)果作為排序方案。最后,使用局部搜索算法并結(jié)合優(yōu)劣解距離(technique for order preference by similarity to an ideal solution,TOPSIS)法和層次分析(analytic hierarchy process,AHP)法制定卸載策略。實驗結(jié)果表明,作者提出的框架與現(xiàn)有任務卸載算法相比減少了處理工作流的響應時間。但作者是在用戶不具備移動性的場景下開展的普適研究,沒有考慮到邊緣節(jié)點之間的異構(gòu)性。
由于汽車具備移動性,在車聯(lián)網(wǎng)背景下開展的研究多基于動態(tài)用戶,且隨著車輛網(wǎng)技術(shù)不斷發(fā)展,很多汽車本身配備一些必要的計算、存儲資源。為了充分利用這些資源,Sun等人[76]設計了一種基于遺傳算法的任務卸載方法,將一些原本在云中心或邊緣節(jié)點處理的任務卸載到與之相連的車輛以提高平均響應時間。因為車輛具有移動性,他們首先利用超愛爾蘭(Hyper-Erlang)分布對每輛車在蜂窩網(wǎng)絡覆蓋范圍內(nèi)的停留時間建模,接著將任務卸載問題建模為優(yōu)化問題,對遺傳算法進行整數(shù)編碼并去除不可用子代,使用改進的遺傳算法求解問題。在這項工作中,對所有參數(shù),作者將其各自的平均值帶入問題求解,這可能導致其結(jié)果不是最優(yōu)的。
(2)能耗優(yōu)化
Abdullah 等人[77]提出了一種任務卸載策略來降低移動設備和虛擬機的能耗。該策略首先采用最小切割算法[78]將工作流劃分為本地執(zhí)行任務和非本地執(zhí)行任務,目的是最小化移動設備能耗。接著,為了優(yōu)化云邊系統(tǒng)中的虛擬機能耗,迭代地將任務卸載到功率最小的虛擬機并保證在任務截止前完成處理。但上述研究假定每臺虛擬機的功率和無線網(wǎng)絡的傳輸速率都是常數(shù),這與實際情況不符。
(3)多目標優(yōu)化
De和Kimovski[79]將云邊協(xié)同環(huán)境下的工作流卸載調(diào)度問題表述為NP 難的多目標優(yōu)化問題。該問題將響應時間、成本和可靠性作為目標,研究了優(yōu)化上述三個目標時的帕累托前沿,提出了一種基于第二代非支配排序遺傳算法的多目標工作流卸載優(yōu)化算法。在開展研究的過程中,作者假設每個任務都有各自的需求而不是考慮工作流的整體需求在每個子任務上的體現(xiàn),這與實際場景不符。此外,作者也沒有考慮可能存在的任務排隊時延。
區(qū)別于以上所有研究,Liao等人[80]研究從云到邊的任務卸載。在云-邊-端框架下,將云服務器上需要訓練的全局模型分級派發(fā)到邊緣服務器和終端設備(例如具備處理能力的光伏板和各種儲能單元)。首先,終端利用其采集到的數(shù)據(jù)訓練小規(guī)模的模型;其次,這些完成訓練的小模型被上傳到邊緣服務器進行聚合,形成局部模型;最后,云服務器將邊緣服務器上傳的模型聚合成全局模型。作者利用拉格朗日優(yōu)化求解卸載過程中的能耗和延遲優(yōu)化問題。
2.2.3 小結(jié)
總的來說,以工作流為研究對象的工作較少,目前主要存在以下問題:當工作流內(nèi)部的任務依賴關系表現(xiàn)為數(shù)據(jù)依賴時,下行鏈路的回傳時間也是構(gòu)成響應時間的一部分,但很多研究為了簡化計算都忽略了這一點;除此之外,現(xiàn)有研究多以人為生成的有向無環(huán)圖作為卸載對象。
通過前面對研究現(xiàn)狀的歸納和介紹,不難看出云邊資源協(xié)同是當前一個很熱門的研究領域,在過去的五年中,一些研究也取得了突破性進展,但仍存在一些問題,如表1所示。通過對云邊資源協(xié)同下任務卸載現(xiàn)狀的認識,總結(jié)出其存在的問題如下:
表1 云邊資源協(xié)同中的任務卸載技術(shù)研究現(xiàn)狀總結(jié)Table 1 Summary of research status of task offloading technology in cloud-edge resource collaboration
(1)場景設計問題。大量研究在靜態(tài)場景下開展,這與現(xiàn)實是相悖的,在制定卸載策略的時候都是基于靜態(tài)分析,在任務開始執(zhí)行前確定最佳的部分卸載決策,并按照決策將任務指派到云中心或者邊緣節(jié)點。但在實際應用中,任務的負載可能會動態(tài)地變化,例如,由于移動設備的位置變化、網(wǎng)絡帶寬的波動、用戶行為的變化等,導致任務的部分卸載決策需要重新調(diào)整。靜態(tài)分析策略無法及時適應這些變化,可能會導致任務的響應時間延遲或者任務執(zhí)行效率低下。
(2)卸載模型的建立問題。隨著研究的不斷深入,人們意識到任務卸載和資源分配的聯(lián)合優(yōu)化更具有現(xiàn)實意義。如何圍繞工作流卸載和計算、通信、存儲資源分配的聯(lián)合問題開展研究是一個具有挑戰(zhàn)的問題。此外,很多研究在優(yōu)化響應時間、能耗、成本等性能指標的時候忽略了系統(tǒng)安全問題,例如在軍事領域,會存在很多對抗事件,沒有研究人員建立網(wǎng)絡攻擊和干擾條件下的卸載模型。
(3)模型的落地實現(xiàn)問題?,F(xiàn)有研究大多人為生成任務數(shù)據(jù),在集成開發(fā)環(huán)境實現(xiàn)算法,缺少在工程實踐領域的落地以檢驗模型的完備性和算法的有效性。
結(jié)合現(xiàn)存問題,未來可以著重以工作流為研究對象,并在以下五方面展開更深入、更全面的研究。
(1)資源動態(tài)調(diào)度問題。隨著人工智能和機器學習技術(shù)的不斷發(fā)展,云邊資源協(xié)同模式下的資源調(diào)度有望變得更加智能化。通過使用大數(shù)據(jù)分析、機器學習算法等技術(shù),可以對邊緣節(jié)點的資源使用情況進行實時監(jiān)控和預測,從而做出更加智能和精準的資源調(diào)度決策,提高資源利用效率。未來,資源調(diào)度需要能支持更加靈活的策略,例如根據(jù)應用的實時需求和用戶位置等動態(tài)調(diào)整資源分配,實現(xiàn)更加精細化的資源管理。云邊協(xié)同場景下資源的狀態(tài)是時變的,強化學習技術(shù)強調(diào)與環(huán)境的交互,深度學習算法越來越先進,將這兩種技術(shù)融合進云邊場景是未來的趨勢之一。未來以工作流為研究對象的工作可以考慮結(jié)合新型深度強化學習算法(比如,DDQN(double DQN)、D3QN(dueling double DQN)等),增加對動態(tài)環(huán)境的感知與反饋,輔助做出最優(yōu)決策。同時,在資源調(diào)度的過程中,用戶可能離開邊緣節(jié)點的覆蓋范圍,未來也需要深入研究用戶移動性對資源調(diào)度的影響。
(2)突發(fā)請求處理問題。當有新的任務請求到達正在執(zhí)行任務的邊緣服務器時,相關研究通過評估任務執(zhí)行總時間,決定替換現(xiàn)有任務或排隊等待執(zhí)行。當面對突發(fā)請求時,需要制定全面的中斷請求機制,除了考慮任務執(zhí)行總時間,還需要考慮任務的重要性,以及任務間的既定順序以此判斷是將原任務調(diào)度到云中心或其他邊緣節(jié)點還是繼續(xù)在原位置處理。
(3)任務卸載與多種資源分配的聯(lián)合優(yōu)化。任務數(shù)據(jù)應由處理節(jié)點接收并緩存在數(shù)據(jù)隊列中等待處理,因此,盡管緩存和排隊過程比較復雜,但對于實時任務的處理,這兩個過程是很重要的。然而,在大多數(shù)現(xiàn)有工作中,響應時間被認為是本地處理時間、傳輸時間和邊-云處理時間的總和,忽略了緩存和排隊過程。此外,大多數(shù)有關緩存資源調(diào)度的研究更側(cè)重于在網(wǎng)絡邊緣緩存常用內(nèi)容以避免相同內(nèi)容的重復傳輸。目前已經(jīng)出現(xiàn)一些結(jié)合計算資源和通信資源分配的研究,未來的工作應該通過考慮緩存和排隊過程來進一步推進計算、通信、存儲資源分配的研究。
(4)資源調(diào)度的安全性問題。目前,一些研究主要使用區(qū)塊鏈技術(shù)和環(huán)簽名加密技術(shù),通過數(shù)字簽名驗證機制確保云邊資源協(xié)同調(diào)度的安全可靠性,但遠未取得令人滿意的成果。未來的研究需要填補現(xiàn)有研究的不足,排除潛在風險。①需要加強身份認證和訪問控制,在云邊資源協(xié)同模式下,涉及到多個邊緣節(jié)點的資源調(diào)度和協(xié)同合作,未來需要加強對用戶和設備的身份認證和訪問控制,確保只有授權(quán)的用戶和設備能夠訪問和操作資源,防止未經(jīng)授權(quán)的訪問和潛在的安全風險。②邊緣節(jié)點安全防護的強化也值得探索。邊緣節(jié)點通常分布在不同的地理位置,面臨更多的安全威脅。未來可以采用更加先進的安全技術(shù),例如邊緣防火墻、入侵檢測系統(tǒng)、安全監(jiān)控和反欺詐技術(shù)等,以加強邊緣節(jié)點的安全防護,抵御潛在的攻擊和威脅。③隨著云邊資源協(xié)同的復雜性增加,強化安全監(jiān)測和應急響應也是需要關注的重點,通過實時監(jiān)測邊緣節(jié)點的安全狀態(tài),發(fā)現(xiàn)和應對安全事件和威脅,提高對安全漏洞和威脅的應急響應能力。
(5)落地實踐性問題。大多數(shù)研究人員都通過仿真平臺模擬實驗,未來的研究可以設計實現(xiàn)用于性能評估的實際實驗平臺。同時,近年來很多互聯(lián)網(wǎng)公司也開發(fā)了云邊協(xié)同計算平臺,比如輕量級Kubernetes(K3s)、KubeEdge 等,這些平臺內(nèi)置了一些編排和管理方式供用戶使用。未來新研究的算法一方面也可以和平臺內(nèi)置的算法作對比,驗證所做工作和這些已經(jīng)投入實際應用的成型產(chǎn)品相比是否具有優(yōu)越性;另一方面可以和這些開源平臺結(jié)合,增強研究工作的落地性。此外,如何利用來自生產(chǎn)實踐的真實數(shù)據(jù)開展研究,將云邊資源協(xié)同應用于更多領域帶動產(chǎn)業(yè)發(fā)展也是一個需要思考的問題。
21世紀以來,云計算經(jīng)歷了多年發(fā)展,相關技術(shù)已趨于成熟,但隨著該技術(shù)的廣泛應用其弊端逐漸顯現(xiàn)。邊緣計算作為云計算的補充,近年來得到越來越多的關注,云邊協(xié)同模式也逐漸被人們看到和了解。本文首先介紹了云邊協(xié)同和此架構(gòu)下資源協(xié)同概念的發(fā)展過程及概念內(nèi)涵,闡述了任務卸載技術(shù)的含義和云邊資源協(xié)同在智慧交通、智慧醫(yī)療和軍事指揮領域的應用;其次,按照現(xiàn)有研究對象和優(yōu)化目標的差異,分類介紹研究現(xiàn)狀;最后,歸納總結(jié)存在的問題和未來的研究方向,以期對今后有關云邊資源協(xié)同和任務卸載技術(shù)的研究工作提供參考。隨著視頻分析等領域?qū)崟r響應、隱私保護等要求的提高,未來,圍繞云邊資源協(xié)同開展的研究將更有意義。