亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于組合預(yù)測模型的云計算資源負(fù)載預(yù)測研究*

        2020-07-27 10:41:44馮競凱郝章肖黃少群
        計算機工程與科學(xué) 2020年7期
        關(guān)鍵詞:模型

        林 濤,馮競凱,郝章肖,黃少群

        (1.河北工業(yè)大學(xué)人工智能與數(shù)據(jù)科學(xué)學(xué)院,天津 300401;2.哈爾濱商業(yè)大學(xué)管理學(xué)院,黑龍江 哈爾濱 150000)

        1 引言

        隨著云計算技術(shù)的發(fā)展,虛擬化技術(shù)已經(jīng)成為云計算領(lǐng)域不可或缺的一部分,將應(yīng)用部署到云端已經(jīng)成為業(yè)界越來越普遍的做法[1]。如何使云計算環(huán)境提供良好的服務(wù)質(zhì)量QoS(Quality of Service)已經(jīng)成為云服務(wù)提供者必須考慮的一個問題[2]。近幾年,越來越多的云應(yīng)用呈現(xiàn)出高并發(fā)、大流量的特征,并且對于服務(wù)器來說應(yīng)用程序請求數(shù)量會隨著時間變化而變化。針對這一問題,云計算調(diào)度系統(tǒng)采用負(fù)載預(yù)測的方式進行資源配置[3,4]。因此,負(fù)載預(yù)測技術(shù)在云計算資源彈性伸縮中至關(guān)重要。

        目前,針對云計算環(huán)境中的資源負(fù)載預(yù)測問題,國內(nèi)外一些學(xué)者提出了多種解決方案和負(fù)載預(yù)測模型。這些預(yù)測模型一般將云計算資源負(fù)載看作一種時間序列,然后通過一定的建模方法對其進行預(yù)估[5]。目前的負(fù)載預(yù)測模型可以分為2類:單一預(yù)測模型和基于集成學(xué)習(xí)的組合預(yù)測模型[6]。文獻(xiàn)[7]使用ARIMA(Auto-Regressive Integrated Moving Average)負(fù)載預(yù)測模型對虛擬機集群的負(fù)載進行收集及預(yù)測。隨著人工神經(jīng)網(wǎng)絡(luò)的發(fā)展,越來越多的人工神經(jīng)網(wǎng)絡(luò)方法被應(yīng)用到時間序列預(yù)測當(dāng)中。文獻(xiàn)[8]對LSTM(Long Short-Term Memory)負(fù)載預(yù)測模型與ARIMA預(yù)測模型進行了比較分析,從結(jié)果可以看出,LSTM負(fù)載預(yù)測模型優(yōu)于ARIMA負(fù)載預(yù)測模型。文獻(xiàn)[9]通過優(yōu)化支持向量機構(gòu)建負(fù)載預(yù)測模型,對單步與多步云計算資源負(fù)載進行預(yù)測分析。文獻(xiàn)[10]使用遞歸神經(jīng)網(wǎng)絡(luò)RNN(Recursive Neural Network)來實現(xiàn)對云工作負(fù)荷的預(yù)測,通過Google Cloud Trace數(shù)據(jù)集上的實驗驗證了該方法的準(zhǔn)確性。以上負(fù)載預(yù)測模型均使用的是單一方法的負(fù)載預(yù)測形式。文獻(xiàn)[11]首先使用ARMA模型(Auto-Regressive and Moving Average model)進行預(yù)測,再使用ENN模型(Elman Neural Network model)對ARMA誤差進行預(yù)測,最終得到修正后的預(yù)測值。該文獻(xiàn)提出的組合預(yù)測模型有效地提升了云環(huán)境中工作負(fù)載預(yù)測的精度。文獻(xiàn)[6]采用多模型融合的方式進行了云計算資源負(fù)載預(yù)測,將負(fù)載數(shù)據(jù)集分為訓(xùn)練集與測試集,利用ARIMA、指數(shù)平滑法、神經(jīng)網(wǎng)絡(luò)等預(yù)測模型根據(jù)訓(xùn)練集的平均均方誤差對測試集各預(yù)測結(jié)果進行權(quán)重劃分,最后得到組合預(yù)測值。文獻(xiàn)[12]采用了ARIMA-ANN的組合預(yù)測模型,分別對時間序列數(shù)據(jù)進行線性和非線性的預(yù)測,并將最終結(jié)果組合。實驗結(jié)果表明,混合模型均具有更高的預(yù)測精度。

        當(dāng)前在云計算節(jié)點中運行的服務(wù)多種多樣,對資源的需求各不相同,因此在運行過程中負(fù)載時間序列數(shù)據(jù)通常具有線性與非線性的復(fù)合特征?,F(xiàn)有的預(yù)測模型通常使用單一預(yù)測模型,或者使用不同預(yù)測模型的預(yù)測結(jié)果進行權(quán)重集成的方式得到最終預(yù)測值。雖然以上2種方式在預(yù)測精度上有所提升,但是并沒有從根本上解決較差模型對最終結(jié)果的影響。因此,本文將LSTM與ARIMA相結(jié)合提出一種新型預(yù)測模型LACL(LSTM-ARIMA-Critic-LSTM)。該模型首先分別通過LSTM預(yù)測模型與ARIMA預(yù)測模型對未來工作負(fù)載進行預(yù)測;其次運用客觀賦權(quán)法中的CRITIC(CRiteria Importance Through Intercrieria Correlation)方法[13,14]將2個預(yù)測模型的預(yù)測結(jié)果進行加權(quán)累加,得到組合預(yù)測結(jié)果,同時得到歷史負(fù)載數(shù)據(jù)預(yù)測誤差數(shù)據(jù)集;最后使用LSTM模型對組合預(yù)測模型的誤差進行預(yù)測,最終得到一個誤差修正后的預(yù)測值。

        2 問題描述

        本文主要解決的是云計算環(huán)境中主機負(fù)載預(yù)測問題。假設(shè)歷史負(fù)載數(shù)據(jù)L={l1,l2,…,lt},其中l(wèi)t為t時刻集群的負(fù)載情況。從L中選取m個時刻的數(shù)據(jù)作為預(yù)測模型的輸入向量M=(lt-m+1,…,lt-1,lt)。負(fù)載預(yù)測就是通過輸入向量M預(yù)測t+1時刻的集群負(fù)載。

        隨著在云計算環(huán)境中部署的服務(wù)越來越復(fù)雜,負(fù)載時序序列既不是純線性的也不是非線性的,一般包含了2種結(jié)構(gòu)的組合。并且單一預(yù)測模型在捕獲復(fù)雜負(fù)載時序序列模式方面具有一定的局限性,相比之下組合預(yù)測模型具有更穩(wěn)定的預(yù)測性能。同時,對于較差單一預(yù)測模型對最終結(jié)果的影響,本文在組合預(yù)測的基礎(chǔ)上提出了一種誤差修正的思想,進一步提升了負(fù)載預(yù)測的準(zhǔn)確性。

        3 負(fù)載預(yù)測模型

        3.1 負(fù)載模型

        負(fù)載是對服務(wù)器工作狀態(tài)的一種描述,反映當(dāng)前服務(wù)器任務(wù)處理的壓力。本文主要考慮內(nèi)存使用率與CPU使用率2個因素對集群負(fù)載的影響。采用動態(tài)負(fù)載模型,充分考慮在不同資源需求情況下這2個因素對負(fù)載的影響。在單個節(jié)點中負(fù)載計算如式(1)和式(2)所示:

        L=WmemLmem+WcpuLcpu

        (1)

        Wmem+Wcpu=1

        (2)

        其中,L指計算機集群中某臺虛擬主機的負(fù)載計算值,Lmem、Lcpu為內(nèi)存使用率與CPU使用率,Wmem、Wcpu分別為內(nèi)存使用率與CPU使用率的權(quán)重系數(shù)。

        3.2 ARIMA預(yù)測模型

        ARIMA可以用來對時間序列進行預(yù)測,常被用于需求預(yù)測中。ARIMA(p,d,q)模型是一種綜合模型,它將自回歸AR(Auto Regressive)模型和移動平均MA(Moving Average)模型都包含在時間序列組合模型中。其中,d是差分階數(shù),是為得到平穩(wěn)時間序列所做的差分次數(shù);p是自回歸項;q為相應(yīng)的移動平均項數(shù)。ARIMA基本公式如式(3)所示:

        (3)

        其中,Lt為t時刻集群負(fù)載值;φ、θ分別為自回歸(AR)參數(shù)與移動平均(MA)參數(shù);p為自回歸模型的階數(shù);q為移動平均模型階數(shù);ε為殘差序列。

        模型建立過程如圖1所示。

        Figure 1 Modeling flow chart of ARIMA圖1 ARIMA模型建模流程圖

        (1) 數(shù)據(jù)分析與平穩(wěn)性校驗。云計算負(fù)載在局部可能會呈現(xiàn)較大的波動或存在周期性規(guī)律,因此需要對原始數(shù)據(jù)進行平滑處理和周期性分解處理。經(jīng)處理后的數(shù)據(jù)可能還會存在較大的波動,在預(yù)測前還需要反復(fù)進行平穩(wěn)性處理。常使用差分的方式進行平穩(wěn)化處理。本文使用ADF(Augmented Dickey-Fuller)來檢測數(shù)據(jù)是否具有平穩(wěn)性。

        (2) 模型識別與參數(shù)估計。構(gòu)建自相關(guān)系數(shù)ACF(AutoCorrelation Function)與偏自相關(guān)系數(shù)PACF(Partial AutoCorrelation Function)圖形,根據(jù)自相關(guān)系數(shù)的拖尾特征、偏自相關(guān)系數(shù)的截尾特征確定ARIMA模型中的p與q值。若自相關(guān)系數(shù)曲線衰減的同時偏自相關(guān)系數(shù)曲線截斷,則使用AR模型;若自相關(guān)系數(shù)曲線截斷的同時偏自相關(guān)系數(shù)曲線衰減,則使用MA模型。

        (3) 有效性驗證與模型獲取。當(dāng)參數(shù)確定后,便可以進行ARIMA模型的構(gòu)建,此外,可以根據(jù)參數(shù)確定時得到的估計值,嘗試多種p,d,q參數(shù)的組合來改進模型。最后通過最低貝葉斯信息準(zhǔn)則BIC(Bayesian Information Criterion)和最小赤池信息量準(zhǔn)則AIC(Akaike Information Criterion)確定最佳預(yù)測模型。

        3.3 LSTM預(yù)測模型

        長短期記憶網(wǎng)絡(luò)(LSTM)是遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的變形。RNN存在梯度爆炸或消失問題,LSTM引入一個新的內(nèi)部狀態(tài)ct專門進行線性的循環(huán)信息傳遞,同時引入門機制來控制信息傳遞的路徑,分別為輸入門it、遺忘門ft和輸出門ot。3個門、細(xì)胞記憶狀態(tài)、隱藏層的計算方式為:

        it=σ(ωixt+uiht-1+bi)

        (4)

        ft=σ(ωfxt+ufht-1+bf)

        (5)

        ot=σ(ωoxt+uoht-1+bo)

        (6)

        ct=ft⊙ct-1+it⊙tanh(ωixt+ucht-1+bc)

        (7)

        ht=ot⊙tanh(ct)

        (8)

        其中,σ()為logistic函數(shù),其輸出區(qū)間為(0,1),⊙為向量元素乘積,tanh()為激活函數(shù),xt為當(dāng)前時刻的輸入,ht-1與ht分別為上一時刻與當(dāng)前時刻外部狀態(tài),ω*、u*和b*為學(xué)習(xí)的網(wǎng)絡(luò)參數(shù)。

        LSTM循環(huán)單元計算過程為:首先,利用上一時刻的外部狀態(tài)ht-1和當(dāng)前時刻的輸入xt,根據(jù)式(5)~式(8)計算出3個門狀態(tài)以及候選狀態(tài)。之后,結(jié)合遺忘門ft和輸入門it來更新記憶單元ct。最后,結(jié)合輸出門ot,將內(nèi)部狀態(tài)的信息傳遞給外部狀態(tài)ht。

        3.4 預(yù)測模型評價標(biāo)準(zhǔn)

        本文采用平均絕對誤差(MAE)、平均絕對值百分比誤差(MAPE)、平均均方誤差(MSE)、均方根誤差(RMASE)和決定系數(shù)(R2)來對預(yù)測結(jié)果進行評價,其計算方式如式(9)~式(13)所示:

        (9)

        (10)

        (11)

        (12)

        (13)

        3.5 基于集成學(xué)習(xí)的組合預(yù)測模型

        綜合考慮ARIMA預(yù)測模型對于非線性時間序列擬合不夠準(zhǔn)確,使用簡單神經(jīng)網(wǎng)絡(luò)對于線性與非線性的處理表現(xiàn)不夠充分等問題,本文提出一種基于ARIMA與LSTM的組合預(yù)測模型,具體模型如圖2所示。

        Figure 2 Combined forecasting model圖2 組合預(yù)測模型

        基于組合預(yù)測模型的預(yù)測步驟如下所示:

        (1) 時序負(fù)載數(shù)據(jù)獲取。根據(jù)式(1)~式(3)考慮實際生產(chǎn)中集群服務(wù)從創(chuàng)建到部署完成時間在3~5 min,因此采集時間間隔為5 min、長度為n的云計算集群負(fù)載時間序列數(shù)據(jù)集LT={l1,l2,…,ln}(本文中所有下標(biāo)“T”或上標(biāo)“T”都是Ture的縮寫,表示實際負(fù)載數(shù)據(jù))。

        4 實驗結(jié)果與分析

        4.1 實驗數(shù)據(jù)

        為了驗證本文提出的云計算資源負(fù)載預(yù)測模型的有效性,使用The Grid Workloads Archive[15]網(wǎng)站提供的公開數(shù)據(jù)集,對其進行實驗驗證。采用Materna提供的負(fù)載時序數(shù)據(jù),該數(shù)據(jù)集每隔5 min記錄一條網(wǎng)格工作負(fù)載。

        4.2 實驗環(huán)境

        本次仿真實驗的預(yù)測方法均采用Python編程,并在物理服務(wù)器下獨立運行,物理服務(wù)器相關(guān)配置信息如表1所示。

        Table 1 Physical server configuration information

        4.3 實驗結(jié)果與分析

        為了檢驗和評價本文提出的負(fù)載預(yù)測模型(LACL)的性能,本文將其與ARIMA、BP、SVM、LSTM單一模型進行了對比,同時還與文獻(xiàn)[12]提出的ARIMA-ANN(A-ANN)組合預(yù)測模型以及本文沒有經(jīng)過誤差修正的預(yù)測模型(LAC)進行了對比實驗。使用過去1小時的數(shù)據(jù)預(yù)測未來5分鐘的數(shù)據(jù)。結(jié)合經(jīng)驗與多次實驗對比設(shè)置的單步負(fù)載預(yù)測模型相關(guān)參數(shù)如表2所示。

        Table 2 Forecasting model parameters

        從數(shù)據(jù)集中選取2015年11月5日至2015年11月15日,10天的實測工作負(fù)載值,通過分析負(fù)載數(shù)據(jù)設(shè)置CPU利用率與內(nèi)存利用率的權(quán)重分別為0.4和0.6,每隔5 min獲取一條負(fù)載數(shù)據(jù),共計2 880條數(shù)據(jù)記錄。選取前70%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為單步測試集,剩余數(shù)據(jù)用于驗證模型的泛化能力。根據(jù)式(1)和式(2)計算的具體負(fù)載數(shù)據(jù)如圖3所示。

        Figure 3 History data of cloud computing recource load圖3 云計算資源負(fù)載歷史數(shù)據(jù)

        各模型負(fù)載預(yù)測結(jié)果如圖4所示,同時表3給出了各個預(yù)測模型的預(yù)測誤差指標(biāo)。

        Figure 4 Cloud computing resource forecasting results with different models圖4 各模型云計算負(fù)載預(yù)測結(jié)果對比

        表3 預(yù)測性能對比

        從圖3和圖4來看,所有模型和原始序列的趨勢基本一致,但是單一負(fù)載預(yù)測模型預(yù)測精度明顯不如組合預(yù)測模型。本文提出的負(fù)載預(yù)測模型相比于傳統(tǒng)的負(fù)載預(yù)測模型具有更高的準(zhǔn)確性。同時,從實驗結(jié)果可以看出,本文提出的LACL預(yù)測模型預(yù)測精度高于LAC預(yù)測模型的,說明在組合預(yù)測模型基礎(chǔ)上進行預(yù)測值的誤差修正可明顯提高負(fù)載預(yù)測數(shù)據(jù)的準(zhǔn)確性。

        云計算資源負(fù)載預(yù)測主要是對未來一段時間的云計算資源負(fù)載變化趨勢進行分析,單步預(yù)測結(jié)果只能描述下一時刻集群中的負(fù)載情況。為了進一步驗證所提模型的泛化能力,將原始資源負(fù)載序列每隔6個點求取平均構(gòu)造30 min間隔的云計算資源負(fù)載數(shù)據(jù),同理構(gòu)建60 min間隔的云計算負(fù)載數(shù)據(jù),并重新構(gòu)建相應(yīng)的LACL模型,預(yù)測曲線分別如圖5和圖6所示。其中,圖5中每條負(fù)載數(shù)據(jù)之間的時間間隔是30 min,圖6中每條負(fù)載數(shù)據(jù)之間的時間間隔是60 min。

        Figure 5 Workload forecasting with an interval of 30 minites圖5 30 min間隔負(fù)載預(yù)測

        Figure 6 Workload forecasting with an interval of 60 minites圖6 60 min間隔負(fù)載預(yù)測

        對于30 min與60 min間隔預(yù)測結(jié)果的詳細(xì)誤差結(jié)果如表4所示。

        Table 4 Forecasting performance at different time intervals

        通過預(yù)測結(jié)果可以看出,在不同時間間隔情況下,本文提出的模型均能較準(zhǔn)確地預(yù)測云計算資源負(fù)載值,可見所提預(yù)測模型具有一定的泛化能力。

        5 結(jié)束語

        針對復(fù)雜多變的云計算負(fù)載時序數(shù)據(jù),本文綜合考慮服務(wù)器CPU與內(nèi)存對負(fù)載的影響,提出了一種基于LSTM與ARIMA進行誤差修正的組合預(yù)測模型(LACL)。該模型首先分別利用ARIMA與LSTM預(yù)測模型進行負(fù)載預(yù)測。之后利用CRITIC客觀賦權(quán)法將兩模型的預(yù)測結(jié)果進行加權(quán)組合。同時根據(jù)真實誤差對未來誤差進行預(yù)測,通過對組合預(yù)測結(jié)果進行誤差修正得到最終的預(yù)測結(jié)果。通過使用公開數(shù)據(jù)集進行實驗的結(jié)果表明,本文所提的預(yù)測模型具有較好的預(yù)測精度,同時也具有一定的泛化能力,可以準(zhǔn)確預(yù)測云計算中心負(fù)載的變化趨勢,將所提模型運用到云計算中心負(fù)載預(yù)測與管理中可以有效提高云計算中心的網(wǎng)絡(luò)資源利用率。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        在线视频一区二区三区中文字幕 | 风韵饥渴少妇在线观看| 成人国产精品一区二区网站| 成人免费视频自偷自拍| 一区二区三区四区草逼福利视频| 久久天天躁狠狠躁夜夜avapp| 亚洲欧美国产双大乳头| 亚洲无码图| 国产在线视频网友自拍| 亚洲成av人片天堂网无码| 亚洲av无码片在线观看| 亚洲av午夜成人片精品| 91熟女av一区二区在线| 无码人妻丰满熟妇啪啪网站 | 国产一区二区视频在线看| 免费国产线观看免费观看| 国产suv精品一区二人妻| 亚洲男人天堂av在线| av一区二区三区综合网站| 亚洲午夜久久久久久久久电影网| 香蕉久久人人97超碰caoproen| 亚州五十路伊人网| 日本女优激情四射中文字幕| 少妇人妻精品一区二区三区| 午夜国产在线| 国产麻豆一区二区三区在线播放| 一区二区三区美女免费视频 | 无码专区亚洲综合另类| 欧洲-级毛片内射| 日本一区二区亚洲三区| 国产亚洲精品色婷婷97久久久| 香港三级精品三级在线专区| 日韩AV有码无码一区二区三区| 日本一区二区三区免费| 人妻少妇精品久久久久久| 无码人妻一区二区三区免费| 久久久诱惑一区二区三区| 黄片视频免费观看蜜桃| 久久久久久久岛国免费观看| 国产亚洲AV天天夜夜无码| 成人性生交大片免费看l|