靳雯婷(北京市中關村中學)
云計算是一種便利的、按需訪問資源的使能能力[1],是當前信息化建設中的熱點,世界主要國家、知名IT廠商和服務商紛紛投入巨資建設云計算中心,期望在云計算發(fā)展熱潮中引領風尚。公有云[2]通常指第三方服務商為眾多租戶提供云服務。云計算供需雙方(即云服務商和租戶)的價值實現和收益保障是云計算運營與管理的根本問題之一,為此,應深入研究如下問題:
(1)供需雙方的價值目標;
(2)云服務的計價問題;
(3)服務商的資源調度問題。
云計算資源調度基準包括最優(yōu)跨度、服務質量、性能、經濟收益四種,調度算法是基于調度基準的尋優(yōu)算法,目前調度算法以考慮云服務商收益為主,側重于尋優(yōu)調度算法(如各種智能算法)的數學細節(jié),對供需雙方的關系考慮不足,調度基準和調度尋優(yōu)方法參見參考文獻[3]~[10]。
服務是在組織和顧客之間需要完成至少一項活動的組織的輸出,服務具備無形、購買與消費同步、需要顧客體驗等特性。Dorothy建立的經濟模型中,服務處于經濟活動的中心[11],云服務也應具備這些特點,租戶、云服務、云計算資源之間的對應關系見圖1。
圖1 租戶、云服務和資源對應關系
在付出購買成本的情況下,租戶主要關注業(yè)務流程的運作情況以及相應運營績效,期望價值高的業(yè)務活動優(yōu)先占用云服務;服務商將資源分配給級別高的租戶,在同等資源成本的條件下,期望提高資源利用率,且優(yōu)先分配給級別高的租戶,以獲得更多的收益,供需雙方的聯(lián)系紐帶是云服務及服務級別協(xié)議(SLA)。然而,租戶的業(yè)務活動級別與云服務商的租戶級別很可能不一致,因此,需要兼顧租戶業(yè)務優(yōu)先級和云服務商收益優(yōu)先級,建立均衡供需雙方收益的調度算法。SLA是雙方靜態(tài)關系的體現,而雙方的動態(tài)關系則通過資源調度來體現和協(xié)調。
企業(yè)運作于流程之上,研究企業(yè)運營績效就必須深入業(yè)務流程,流程[12]是利用輸入實現預期結果的相互關聯(lián)或相互作用的一組活動。業(yè)務流程運營最基本的績效指標包括流轉率V、庫存S、流轉時間或流轉周期T,其他綜合指標包括產能、產能利用率、關鍵路徑、流-時效率、最小庫存、安全庫存等[13]。以這些指標為基礎,可以擴展到成本、收入、客戶滿意度等指標。
租戶的期望是增加收入,降低成本,針對所購買的云服務,在不優(yōu)化業(yè)務流程和業(yè)務模式的情況下,有如下要求:
(1)期望云服務中斷時間越大越好,當出現各種情況導致的中斷,應快速通過資源調度獲取資源,恢復運行,降低因中斷導致的業(yè)務損失;
(2)在等待獲取資源時,租戶優(yōu)先級越高越好,以降低資源等待時間,盡快讓業(yè)務進入運營狀態(tài),提高正常運營時間;
(3)在滿足業(yè)務運營績效的情況下,云服務成本越多越好,這與云服務計價模式及購買規(guī)模相關。
云服務商的收益由其投入成本和租費之差決定,在人員和管理成本一定的情況下,資源成本構成和服務產出構成的關鍵因素見圖2。
圖2 資源成本構成和服務產出構成的對應關系
服務產出計算中,資源有效利用率是重要的評價因素,在租費相同的情況下,資源有效利用率低的表明云計算資源的產能未得到有效利用,還可進一步挖掘租戶,提高利用率,增加收入。
對資源有效利用率,期望通過調度管理,確保同一資源,在安全、可用的前提下:
(1)有效利用率盡可能高;
(2)盡可能被高級別的租戶占用。
綜合供需雙方的價值目標,在資源調度中,應兼顧雙方的價值視角見圖3。
在實際運營中,服務商需要針對租戶的租用和費用情況,建立租戶級別、確定需求優(yōu)先級,盡量讓高級別租戶優(yōu)先占用資源,實現預期的收益目標。租戶的經營決定了其業(yè)務級別,租戶需要將業(yè)務級別高的關鍵業(yè)務活動優(yōu)先占用云服務商提供的資源,并及時度量業(yè)務績效,確定服務SLA是否滿足業(yè)務績效要求。
目前云計算的計價模式[14]包括如下三種:
(1)分級計價:按服務實例不同級別配置(如CPU)的單位時間費率與時長計費;
(2)單位計價:按用戶實際資源使用量及單位使用費率計價;
(3)訂閱式計價:按用戶數、使用時長及單個用戶時間費率計價。
Amazon EC2、微軟Azure computer VM是典型的分級計價,云存儲和數據傳輸服務通常是單位計價,微軟Azure Commitment計費方案,cloudEX-彈性計算云服務的包時計費等均為預定式計價。
三種計費模式所包含的計費決定性因素包括:
(1)運行示例類型:指計算資源、存儲資源、網絡資源等被租戶占用的資源實例;
(2)數據傳輸帶寬;
(3)存儲量;
(4)存儲操作量:指對存儲的讀寫等操作數量和頻率;
(5)對實例的使用時間長度;
(6)單位資源費率,如1M帶寬的費用。
為使租戶專注于業(yè)務運營,本文考慮SaaS模式的公有云資源調度問題。為簡化問題,假設網絡和存儲資源的調度可以隨時滿足業(yè)務需求,僅針對服務器VM討論資源調度問題。當出現租戶業(yè)務運營管理異常、業(yè)務操作故障、云服務故障,以及新租戶進入搶占資源等情況下,云服務商需要資源調度,滿足各方需求。
云計算資源調度問題描述:
(1)一個云服務商具備M個虛擬機資源;
(2)云服務商服務于N個租戶,每個租戶可能具備K個任務,M<N·K;
(3)實際運行中,租戶的每個任務可能會分解為若干個子任務;
(4)考慮云服務商和租戶的利益,建立調度基準,包括:
a)建立云服務商的調度基準(可能是多個目標指標的組合);
b)針對每個租戶選擇合適的調度基準;
(5)結合每個租戶的調度基準,考慮服務商的調度基準,形成互為約束條件的最優(yōu)目標和優(yōu)化方程;
(6)選擇求取最優(yōu)值的算法,結合最優(yōu)目標,持續(xù)執(zhí)行資源調度計算和資源分配。
(1)假設:
a)某租戶復雜業(yè)務(如ERP)租用公有云的SaaS;
b)業(yè)務績效指標是某一個工作周期內(通常為1天)的業(yè)務處理單據數量SM;
c)業(yè)務活動Ai因中斷需要等待分配資源。
(2)租戶最優(yōu)資源需求
式中:
TPLN——該工作周期內規(guī)劃可用時間,如8小時;
Δt——由于各種原因導致的業(yè)務中斷時間;
VM——一個工作周期內的平均流轉率。
在相對穩(wěn)定的運營階段,TPLN、VM是固定值,因此,式(1)的最大值取決于中斷時間的最小值,即需求取:minΔt
式中:
DTAi——業(yè)務活動Ai在通過調度獲取資源的等待時間;
WTAi——業(yè)務活動Ai獲取資源后在就緒隊列中的等待時間;
RTAi——業(yè)務活動Ai使用資源運行后恢復到中斷前狀態(tài)的時間。
WTAi由租戶業(yè)務流程算法決定,RTAi由中斷后數據備份水平決定,二者與資源調度并無深入的關聯(lián),因此:
式中:
LM——租戶級別;
ΔAvaM——該工作周期內租戶可容忍的最大可用性偏差;
n——該租戶中斷的業(yè)務活動進入資源等待隊列中的次序編號。
利用層次分析方法、神經網絡等方法可以建立DTAi與式(4)中各要素間的對應關系,隨之可求取獲取資源的最小時間。該時間等價于獲取資源的最終次序編號m所對應的等待時間,通常應該小于n。次序編號m確定后,調度資源的等待時間等于前m-1個資源釋放進入資源隊列的時間,即其他前m-1個活動資源調度的等待時間。
在中斷時間確定的情況下,SLA中的可用性偏差見式(5):
式中:
AvaM——SLA中期望的可用性目標指標,通常用百分比表示,如99.9%。
(3)服務商收益
考慮服務商的收益最優(yōu),調度算法變得更為復雜。假設在某工作周期內,共N個租戶使用SaaS服務,服務商總收益是這N個租戶費用之和:
式中:
RoM——某工作周期內,云服務商總租費;
URi——第i個租戶的費用;
Rei, j, q——第i個租戶占用q類資源,在j級計價方式下的單位費用;
UTj, q——使用q類資源,j級計價方式上的持續(xù)時間。
服務商總收益最大,需要將計費級別較高的資源優(yōu)先分配于優(yōu)先級高的租戶,當然,前提是資源滿足業(yè)務需求,且費用在租戶期望范圍內。
考慮服務商總收益最優(yōu),調度算法變?yōu)椋?/p>
在實際情況下,云服務商總收益需要落實如下內容:
a)監(jiān)視所有資源運行狀態(tài);
b)獲取所有租戶業(yè)務級別、業(yè)務運行所需的資源需求、業(yè)務活動運行時長;
c)將費用較高的資源與租戶級別高的業(yè)務活動匹配,并保證其運行時間;
d)若不能確保匹配關系和運行時間,可能需要等待或調度低級別租戶所占用資源來滿足高級別租戶需要。
全局優(yōu)化調度算法具體落實可以使用各種智能算法,如神經網絡算法、遺傳算法、蟻群算法等。
實際公有云調度中,調度算法還需增加云服務商資源約束和租戶容量(即業(yè)務)約束。
本文調度算法考慮了租戶的收益,期望兼顧供需的利益,與側重云服務商利益的調度方法相比,本文算法貼近租戶業(yè)務運營,更能體現云平臺集中利用資源對租戶專注業(yè)務的促進作用,資源調度結果有助于均衡相關方利益。在實際情況中,存在租戶數可能極大、租戶的業(yè)務類型和運營績效相差較大、租戶業(yè)務的時間敏感性強等問題,這些都將增加計算復雜性,降低調度效率,需要繼續(xù)深入研究。