亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

面向Kubernetes 的容器混合伸縮方法?

2024-01-23 13:37:32柳雪妍蔡志成

計算機(jī)與數(shù)字工程 2023年10期

關(guān)鍵詞：資源模型

柳雪妍蔡志成徐建

（南京理工大學(xué)計算機(jī)科學(xué)與工程學(xué)院南京 210094）

1 引言

云計算的彈性伸縮能力，使得用戶可以按需地從云計算資源池中獲取或釋放計算資源［1］，并且僅需為所使用部分付費，大幅度降低了企業(yè)的成本，同時還滿足用戶快速部署微服務(wù)應(yīng)用的需求。因此，越來越多的互聯(lián)網(wǎng)企業(yè)將它們的微服務(wù)遷移到云數(shù)據(jù)中心中。然而，在實際應(yīng)用中，為了應(yīng)對實時波動的微服務(wù)請求負(fù)載，大多數(shù)用戶采用預(yù)先給應(yīng)用分配過量資源的方法，造成了大量的資源浪費和高昂的成本開銷［1］。針對微服務(wù)系統(tǒng)負(fù)載動態(tài)變化的特點，設(shè)計并實現(xiàn)高效的云計算資源調(diào)度算法，自動增加或減少分配給應(yīng)用的資源，從而在保證用戶服務(wù)水平協(xié)議（SLA）的前提下，最小化云計算資源的成本，一直是云計算領(lǐng)域的關(guān)鍵問題和嚴(yán)峻挑戰(zhàn)。

傳統(tǒng)的云計算架構(gòu)以虛擬機(jī)為基本單元進(jìn)行資源調(diào)度，這種大粒度的資源調(diào)度存在資源利用率低、虛擬機(jī)啟停緩慢等問題［4］。容器技術(shù)的出現(xiàn)，引發(fā)了云計算資源管理的新革命［1］。相較于虛擬機(jī)架構(gòu)，容器云采用輕量級虛擬化技術(shù)，可以快速創(chuàng)建容器和部署應(yīng)用［3］。以容器為單位進(jìn)行資源分配和調(diào)度，降低了由虛擬機(jī)啟動緩慢而導(dǎo)致的資源調(diào)度延遲，進(jìn)一步提高了云計算平臺的性能［2］。

目前，研究人員已提出大量基于虛擬機(jī)的動態(tài)資源調(diào)度算法。Chenhao Q對現(xiàn)有的云環(huán)境中虛擬機(jī)的動態(tài)調(diào)度算法進(jìn)行了較為全面的分析和總結(jié)［1］。其中，基于規(guī)則的自動伸縮方法被工業(yè)界廣泛采用，例如亞馬遜的Amazon Auto-Scaling Service［5］。但是這種基于規(guī)則的自動伸縮方法缺乏對資源性能的準(zhǔn)確估計，需要充分掌握應(yīng)用的特征及專家知識以確定適當(dāng)?shù)拈撝岛筒僮?。為了?zhǔn)確估計所需的資源能力，學(xué)術(shù)界基于排隊理論建立了各種性能模型，例如李磊提出一種基于李雅普諾夫隊列模型的任務(wù)和資源調(diào)度優(yōu)化策略［2］，Cai 采用具有到達(dá)率調(diào)節(jié)系數(shù)的排隊模型作為前饋控制器以預(yù)測所需資源量［6］。另一部分研究者利用機(jī)器學(xué)習(xí)技術(shù)，動態(tài)構(gòu)建特定負(fù)載下的資源消耗模型，例如Bitsakos C 使用深度強(qiáng)化學(xué)習(xí)來實現(xiàn)資源的自動伸縮［7］，徐建中等使用反向傳播神經(jīng)網(wǎng)絡(luò)建立一個基于需求預(yù)測的云計算彈性伸縮策略［8］。

然而，針對容器云的調(diào)度算法研究才剛剛起步。由于基于虛擬機(jī)的資源調(diào)度和基于容器的資源調(diào)度的核心需求是相似的，研究人員通常將基于虛擬機(jī)的彈性伸縮算法直接用于基于容器的系統(tǒng)。例如，楊茂等提出一種預(yù)測式與響應(yīng)式相結(jié)合的水平伸縮算法［9］，屠雪真等設(shè)計了一種基于Kubernetes的水平彈性擴(kuò)縮容系統(tǒng)［10］。這類方法雖然簡單快速，但未考慮到容器本身配置的調(diào)整，僅考慮了容器的水平擴(kuò)展，忽略了容器的垂直擴(kuò)展。這類方法難以設(shè)置恰當(dāng)?shù)娜萜髻Y源配額，導(dǎo)致集群資源的浪費［11］。

因此，針對已有研究存在的不足，本文針對基于Kubernetes 的真實異構(gòu)容器云環(huán)境，提出了一種基于排隊、深度性能模型和快速啟發(fā)式規(guī)則的容器資源混合伸縮算法MMHV。對比實驗表明，本算法能夠在保證微服務(wù)請求服務(wù)質(zhì)量的前提下，使得容器資源配額隨工作負(fù)載變化而動態(tài)調(diào)整，從而提高異構(gòu)集群的資源利用率、有效降低云計算資源的成本。

2 Kubernetes容器云

Kubernetes［11］是Google開源的一個大型容器集群管理系統(tǒng)。其作為容器云的核心基礎(chǔ)和事實標(biāo)準(zhǔn)，已經(jīng)成為當(dāng)今互聯(lián)網(wǎng)企業(yè)的云基礎(chǔ)設(shè)施核心要素。它可以為容器化的云原生應(yīng)用提供部署、運行、服務(wù)發(fā)現(xiàn)、資源調(diào)度、擴(kuò)縮容等功能。

如圖1 所示，Kubernetes 集群由一個Master 和多個Node 組成。Master 是集群的控制節(jié)點，其上運行著Kubernetes API Server 等集群管理相關(guān)的關(guān)鍵進(jìn)程。這些進(jìn)程實現(xiàn)了整個集群的資源管理、Pod 調(diào)度、系統(tǒng)監(jiān)控和糾錯等自動化管理功能［12］。Node 是集群中的工作節(jié)點，其上運行著多個Pod，每個Pod 中運行著一個應(yīng)用程序的一組（一個或多個）容器，一般場景中，每個Pod 只包含一個容器。Kubernetes 直接管理Pod 而非容器，Pod 是Kubernetes 中資源調(diào)度的基本單位。同一微服務(wù)的用戶請求被Nginx Ingress Controller 分發(fā)到并行容器中。資源控制中心可以通過Kubernetes 提供的客戶端接口采集集群的運行數(shù)據(jù)，實現(xiàn)應(yīng)用性能的實時監(jiān)控，并根據(jù)資源調(diào)度方法動態(tài)調(diào)整分配給應(yīng)用的資源。

圖1 Kubernetes中容器云的架構(gòu)圖

本文的目標(biāo)是針對基于Kubernetes 的真實容器云環(huán)境，設(shè)計容器數(shù)量和配置自動伸縮算法，在保證滿足用戶請求響應(yīng)時間上限約束（由SLA 指定）的同時，降低微服務(wù)的資源成本。

3 水平自動伸縮機(jī)制

Kubernetes 已有的水平自動伸縮控制器（HPA），可基于CPU 利用率實現(xiàn)Pod 數(shù)量的自動伸縮［13］。在使用HPA 時，用戶需事先設(shè)定CPU 利用率的目標(biāo)值。在每個控制周期，HPA 控制器根據(jù)Pod 的實時CPU 利用率與用戶設(shè)定目標(biāo)值的比例計算所需的目標(biāo)副本數(shù)量，具體計算公式如下：

其中，Cr和Cv分別是當(dāng)前副本數(shù)及當(dāng)前CPU 利用率，Dr和Dv分別是目標(biāo)副本數(shù)及目標(biāo)CPU 利用率。當(dāng)Pod 的目標(biāo)副本數(shù)與當(dāng)前副本數(shù)不同時，HPA 就向Pod 的副本控制器發(fā)起Scale 操作，調(diào)整Pod的副本數(shù)量，完成擴(kuò)縮容操作。

盡管HPA控制器簡單有效，但只是從Pod數(shù)量層面進(jìn)行調(diào)整（水平伸縮），在實際應(yīng)用中還需要對每個Pod 設(shè)置恰當(dāng)?shù)馁Y源配額（CPU 和內(nèi)存的大小），資源配額過大將導(dǎo)致集群資源的無謂浪費，過小則會導(dǎo)致應(yīng)用性能不佳。然而，用戶需要對應(yīng)用程序有足夠了解，并進(jìn)行大量配置和試驗，才能對Pod設(shè)置恰當(dāng)?shù)馁Y源配額。

4 容器云混合伸縮算法

針對HPA 按CPU 利用率比例調(diào)整方法的不足，本文提出的MMHV 采用排隊模型更加準(zhǔn)確地描述目標(biāo)響應(yīng)時間和所需總處理能力之間的關(guān)系；同時利用深度神經(jīng)網(wǎng)絡(luò)建立高精度的單個容器處理能力和不同配置的關(guān)系模型；基于排隊模型獲得所需的總能力和深度性能模型，MMHV根據(jù)啟發(fā)式規(guī)則能夠更加快速準(zhǔn)確地找到恰當(dāng)?shù)母北緮?shù)量和資源配額，具體包括：1）基于M/M/1 排隊模型和給定的服務(wù)響應(yīng)時間約束計算當(dāng)前負(fù)載下的目標(biāo)總處理率；2）以真實的異構(gòu)容器云的運行數(shù)據(jù)為基礎(chǔ)，使用深度神經(jīng)網(wǎng)絡(luò)建立容器資源配置（CPU 和內(nèi)存的大小）與請求處理率的關(guān)系模型；3）基于集群中異構(gòu)虛擬機(jī)上剩余CPU和內(nèi)存的大小，采用基于排序和二分搜索相結(jié)合的容器資源配置快速搜索方法，獲得使處理率不小于目標(biāo)值且成本最小的容器資源配置方案。

4.1 容器云排隊模型

如文獻(xiàn)［1］所述，對于單個微服務(wù)，可以將其用戶請求處理過程抽象為一個排隊模型。如圖2 所示，一個微服務(wù)有n 個并發(fā)Pod。隨機(jī)到達(dá)的用戶請求進(jìn)入Nginx負(fù)載均衡器維護(hù)的共享隊列，Nginx以輪詢的方式將請求轉(zhuǎn)發(fā)給Pod進(jìn)行處理。

圖2 用戶請求排隊模型

假設(shè)微服務(wù)的用戶請求到達(dá)率為λ且時間間隔服從負(fù)指數(shù)分布，同時所有Pod 的請求處理率之和為μ且請求處理時間也服從負(fù)指數(shù)分布，則可以使用單隊列等待制M/M/1排隊模型建模。根據(jù)Little公式，可得到請求的平均響應(yīng)時間［14］：

4.2 基于深度神經(jīng)網(wǎng)絡(luò)的性能模型

通過觀察采集的樣本數(shù)據(jù)，我們發(fā)現(xiàn)CPU、內(nèi)存的資源量與請求處理率之間是一種非線性關(guān)系，因此我們選擇了一種簡單高效的非線性回歸模型MLP（多層感知器）進(jìn)行建模。MLP［15］是一種監(jiān)督學(xué)習(xí)算法，它通過訓(xùn)練數(shù)據(jù)集學(xué)習(xí)一個函數(shù)f(?):Rm→Ro，其中m 是輸入的維數(shù)，o 是輸出的維數(shù)。給定一組特征X=x1,x2,…,xm和一個目標(biāo)y，它可以準(zhǔn)確高效地逼近非線性函數(shù)。具體步驟如下：1）將一個微服務(wù)以容器的形式部署在Kubernetes 集群中；2）對運行微服務(wù)的Pod 分配不同的CPU 和內(nèi)存(c,m)，使用壓力測試工具發(fā)送并發(fā)請求，并采集請求響應(yīng)時間數(shù)據(jù)，進(jìn)而得到當(dāng)前資源配置(c,m)對應(yīng)的請求處理率μ；3）使用深度神經(jīng)網(wǎng)絡(luò)構(gòu)建性能回歸模型，以CPU和內(nèi)存的資源配置(c,m)作為二維的輸入特征，以請求處理率μ作為目標(biāo)輸出，構(gòu)建一個具有兩層隱藏層、每層含有100 個神經(jīng)元的深度神經(jīng)網(wǎng)絡(luò)，并按照80%和20%的比例將樣本數(shù)據(jù)劃分為訓(xùn)練集和測試集。圖3 是我們實驗中訓(xùn)練得到的模型，其在測試集上取得了0.985 的分?jǐn)?shù)（分?jǐn)?shù)越接近1 說明模型的擬合精度越高）。將CPU 和內(nèi)存的資源配置(c,m)輸入訓(xùn)練好的網(wǎng)絡(luò)模型f(c,m)，即可獲得對應(yīng)的請求處理率μ。

圖3 訓(xùn)練得到的性能模型

4.3 異構(gòu)環(huán)境感知的混合伸縮算法

基于上述排隊模型和容器性能模型，本文提出一種異構(gòu)環(huán)境感知的容器資源混合伸縮方法MMHV，正式描述如算法1所示。

首先，在每個控制時刻t，通過采集集群的運行數(shù)據(jù)獲得集群中各個Node 節(jié)點i 上的可用資源量(ci,mi)、當(dāng)前時刻t的請求到達(dá)率λt，以及請求的平均響應(yīng)時間yt。如果yt>WSLA，說明資源配置不足需要增加資源；如果λt相較于上一次資源調(diào)整時的請求率λs下降超過10%，說明資源配置比較充足，可以減少資源。上述兩種情況均會觸發(fā)資源調(diào)整動作。

為了確定適當(dāng)?shù)馁Y源配置方案，首先基于公式（3）計算出t時刻的目標(biāo)處理率μo。接著將各節(jié)點i 的可用資源量(ci,mi)以CPU 的大小遞增排序。令Pod 副本數(shù)r 從1 開始遞增，且對于每一種情況，遍歷各節(jié)點的可用資源量(ci,mi)，將其輸入訓(xùn)練好的深度性能模型f(c,m)→μ得到該配置方案對應(yīng)的處理率μ，直到找到大于或等于目標(biāo)處理率μo的配置方案(c',m')。若μ恰好等于μo，計算該配置方案的成本，并將其與最小成本Costmin比較。若μ大于μo，此時雖然可以滿足SLA，但資源可能存在冗余，因此令l=(0,0)，?=(c',m')，m=(l+?)/2，以二分法搜索恰好使得μ大于μo的配置方案直到(?-l)小于資源的最小調(diào)整量d，此時的Pod 資源請求量組合(c*,m*)及Pod 副本數(shù)r*即為最佳配置方案。最后，利用Kubernetes 的客戶端接口調(diào)整Pod 的副本數(shù)及CPU 和內(nèi)存的大小，完成資源調(diào)度。

算法1：異構(gòu)環(huán)境感知的容器混合伸縮算法MMHV

5 實驗驗證

我們在真實的Kubernetes 集群上驗證所提出的容器混合伸縮方法的性能，并與已有算法進(jìn)行了對比。

5.1 實驗環(huán)境與參數(shù)設(shè)置

本實驗使用兩臺配置為Intel? Xeon? Silver 4210 40 核心CPU 和48GB 內(nèi)存的服務(wù)器搭建了一個Kubernetes 集群，集群由5 臺虛擬機(jī)組成：1 臺具有4 核CPU、4GB 內(nèi)存的Master 節(jié)點，2 臺具有4 核CPU、4GB 內(nèi)存的Node 節(jié)點，其余2 臺為具有8 核CPU、4GB內(nèi)存的Node節(jié)點。將一個計算序列累加值和集合查找的微服務(wù)應(yīng)用以容器的形式部署在集群上，并使用JMeter 作為壓力測試工具發(fā)送請求。

實驗通過重放WikiBench 提供的用戶訪問維基百科的歷史流量數(shù)據(jù)［16］進(jìn)行壓力測試。并設(shè)響應(yīng)時間上限為WSLA=0.1s。實驗參考阿里云通用型ecs.g6.large實例按量付費的定價，根據(jù)官方文檔可計算得出CPU 的單價為每小時0.14 元/核，內(nèi)存的單價為每小時0.0275 元/Gi。調(diào)度算法的控制時間間隔為300s。

5.2 實驗結(jié)果與分析

本文從請求響應(yīng)時間和資源成本兩方面將MMHV 算法與HPA 算法［13］以及同樣使用了M/M/1排隊模型的UCM算法［6］進(jìn)行了對比。

圖4、圖5、圖6 分別顯示了HPA 算法、UCM 算法和MMHV 算法的響應(yīng)時間分布情況。可以看出，三種算法的大多數(shù)響應(yīng)時間都小于WSLA，其中HPA 算法的響應(yīng)時間波動性最小，MMHV 算法次之，UCM 算法波動性最大。這是由于UCM 算法以虛擬機(jī)為基本單位進(jìn)行資源調(diào)度，在調(diào)度時刻虛擬機(jī)創(chuàng)建和啟動延遲導(dǎo)致請求響應(yīng)時間波動和SLA違反率變大，而HPA 算法和MMHV 算法以容器為單位進(jìn)行調(diào)度，可以快速地創(chuàng)建啟動容器完成資源調(diào)整動作，減少響應(yīng)時間的波動及SLA違反率。

圖4 HPA算法響應(yīng)時間分布

圖5 UCM算法響應(yīng)時間分布

圖7 顯示了三種算法的累計資源成本隨時間的變化曲線，可以看出在相同的負(fù)載下，MMHV 算法所需的資源成本最低。UCM 算法以虛擬機(jī)為單位進(jìn)行租賃，在某臺虛擬機(jī)的利用率較低但又不能直接關(guān)閉的情況下，仍然需要為它付費，這種大粒度的租用方式必然導(dǎo)致資源成本最高。而HPA 和MMHV按照資源的使用量計費，因此它們消耗的資源成本相對較低。與HPA 算法動態(tài)調(diào)整Pod 的數(shù)量相比，MMHA 由于可以更加細(xì)粒度地調(diào)整Pod 的資源配額，使得容器資源供應(yīng)量更加接近資源需求量，減少了不必要的資源開銷，因此資源消耗成本最低。

圖7 三種算法資源成本對比

6 結(jié)語

已有的容器調(diào)度算法大多只在容器數(shù)量上水平伸縮，這種方法沒有考慮底層物理資源的剩余情況，難以設(shè)置恰當(dāng)?shù)娜萜髻Y源配額，導(dǎo)致集群資源的浪費。針對上述問題，本文提出了一種面向Kubernetes 的容器混合伸縮方法，該方法采用排隊模型計算應(yīng)用所需的處理能力，以基于深度神經(jīng)網(wǎng)絡(luò)的容器性能模型為基礎(chǔ)，將處理能力映射為具體的容器混合伸縮配置方案。基于Kubernetes 集群上的實驗結(jié)果表明，在保證服務(wù)水平協(xié)議（SLA）的前提下，該方法相較于Kubernetes 自帶方法和其他方法資源消耗成本最低。