何懷文,傅 瑜
(1. 電子科技大學(xué)中山學(xué)院計(jì)算機(jī)學(xué)院 廣東 中山 528402; 2. 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 廣州 510275)
批量到達(dá)下的IaaS云計(jì)算中心服務(wù)性能評(píng)價(jià)
何懷文1,2,傅 瑜1
(1. 電子科技大學(xué)中山學(xué)院計(jì)算機(jī)學(xué)院 廣東 中山 528402; 2. 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 廣州 510275)
針對(duì)請(qǐng)求批量到達(dá)下基礎(chǔ)設(shè)施即服務(wù)(IaaS)云計(jì)算中心性能分析問題,提出基于排隊(duì)系統(tǒng)的云計(jì)算中心分析模型,并獲得平穩(wěn)狀態(tài)時(shí)重要的服務(wù)性能參數(shù):阻塞概率、立即服務(wù)概率、響應(yīng)時(shí)間百分比、平均隊(duì)長(zhǎng)等。通過數(shù)值仿真實(shí)驗(yàn)分析了緩沖區(qū)和批量大小變化對(duì)系統(tǒng)性能的影響。數(shù)值仿真結(jié)果表明:同等排隊(duì)強(qiáng)度下,緩沖區(qū)的增加對(duì)批量到達(dá)系統(tǒng)性能的改善優(yōu)于單個(gè)到達(dá)系統(tǒng);每批到達(dá)請(qǐng)求數(shù)的突發(fā)度越大,系統(tǒng)性能越差。
批量到達(dá); 云計(jì)算中心; 性能評(píng)價(jià); 響應(yīng)時(shí)間
云計(jì)算通過Internet為用戶提供各種彈性計(jì)算資源,主要包括基礎(chǔ)設(shè)施即服務(wù)(infrastructure as a service, IaaS)、平臺(tái)即服務(wù)(platform as a service, PaaS)和軟件即服務(wù)(software as a service, SasS)等不同層次的服務(wù)[1]。其中IaaS提供在云計(jì)算中心虛擬機(jī)(virtual machine, VM)實(shí)例化部署的服務(wù),如Amazon EC2[2]、IBM Cloud[3]、GoGrid[4]等。云計(jì)算中心需要評(píng)估系統(tǒng)的性能和用戶的需求,以期以最小的資源成本來保證用戶的服務(wù)質(zhì)量(quality of service, QoS)[5]。但是由于云計(jì)算服務(wù)環(huán)境的動(dòng)態(tài)性、用戶需求的多樣性,給精確評(píng)價(jià)云計(jì)算中心的性能帶來了較大的困難[6]。
由于云計(jì)算中心的擴(kuò)展性和可變性,基于仿真和測(cè)量的傳統(tǒng)性能評(píng)價(jià)方法并不適用于大規(guī)模的云計(jì)算中心[7]。文獻(xiàn)[8]提出基于隨機(jī)回報(bào)網(wǎng)(stochastic reward nets, SRNs)的IaaS云計(jì)算中心分析模型,分析了云計(jì)算中心的利用率、可用性、等待時(shí)間和響應(yīng)度等性能指標(biāo);文獻(xiàn)[9]在考慮節(jié)點(diǎn)和鏈路故障恢復(fù)情況下分析了云計(jì)算的服務(wù)響應(yīng)時(shí)間;文獻(xiàn)[10]則提出了基于M/G/m/m+r排隊(duì)系統(tǒng)的云計(jì)算中心性能分析模型;文獻(xiàn)[7]針對(duì)IaaS端到端性能分析,提出一種交互式的隨機(jī)模型分析方法,分析了服務(wù)的可用性和響應(yīng)延時(shí)等關(guān)鍵的QoS參數(shù)。但是大部分研究都假設(shè)用戶請(qǐng)求為單個(gè)到達(dá)的泊松流,而在IaaS云計(jì)算中,請(qǐng)求往往是批量到達(dá)(如用戶需要部署多個(gè)VM實(shí)例)。文獻(xiàn)[11-12]基于M(x)/G/m/m+r模型進(jìn)一步分析了批量到達(dá)和完全拒絕策略下云計(jì)算服務(wù)響應(yīng)時(shí)間、阻塞概率和理解服務(wù)概率和批量大小之間的關(guān)系,但是M(x)/G/m模型只能獲取性能參數(shù)的近似解,無法獲得精確數(shù)學(xué)表示式。
本文從IaaS用戶請(qǐng)求的特性和流量特征出發(fā),提出基于M(x)/M/n/n+r模型的云計(jì)算中心分析模型,首次分析了IaaS云計(jì)算中心常見性能參數(shù)的精確表達(dá)式,同時(shí)分析了云計(jì)算中心中重要QoS參數(shù)——響應(yīng)時(shí)間百分比和服務(wù)臺(tái)數(shù)量以及服務(wù)速率之間的關(guān)系。本文從阻塞概率、立即服務(wù)概率、等待隊(duì)長(zhǎng)、響應(yīng)時(shí)間等多個(gè)角度討論了批量到達(dá)IaaS云計(jì)算中心的性能,通過大量數(shù)值仿真實(shí)驗(yàn),同時(shí)比較了不同緩沖區(qū)大小以及批量到達(dá)數(shù)在不同分布下系統(tǒng)性能的變化,并分析批量到達(dá)大小對(duì)系統(tǒng)性能的影響。研究數(shù)據(jù)可以為云計(jì)算中心進(jìn)行合理的資源配置提供理論依據(jù)和參考數(shù)據(jù)。
1.1 模型描述
批量到達(dá)下IaaS云計(jì)算中心模型為M(x)/M/n/n+r排隊(duì)模型,符合以下假設(shè)條件:1) 請(qǐng)求批量到達(dá),每批到達(dá)請(qǐng)求數(shù)X可以服從任意概率分布,P(X=i)=ai,E(X)=a;2) 每批到達(dá)的時(shí)間間隔符合參數(shù)為λ的負(fù)指數(shù)分布;3) 服務(wù)臺(tái)數(shù)量為n,請(qǐng)求所需服務(wù)時(shí)間服從參數(shù)為μ的負(fù)指數(shù)分布,系統(tǒng)采用先到先服務(wù)排隊(duì)規(guī)則(first come first server, FCFS);4) 系統(tǒng)緩沖區(qū)大小為r。同批次到達(dá)的請(qǐng)求是可分割的,當(dāng)前批次請(qǐng)求無法全部進(jìn)入緩沖區(qū)時(shí),則允許部分請(qǐng)求進(jìn)入緩沖區(qū),直至緩沖區(qū)占滿,剩余請(qǐng)求被阻塞。
1.2 模型分析
M(x)/M/n/n+r排隊(duì)模型屬于馬爾科夫過程,假設(shè)隊(duì)長(zhǎng)為k的概率為πk,系統(tǒng)容量N=n+r,流量強(qiáng)度ρ=λa/nμ 。已知當(dāng)ρ<1時(shí),系統(tǒng)存在平穩(wěn)狀態(tài)[13],平穩(wěn)狀時(shí)概率轉(zhuǎn)移如圖1所示。
根據(jù)Chapman-Kolmogorov方程,可以得到:
由式(1)可知,πi+1可以由πi遞推得到,即可獲得π1,π2,…,πN和π0之間的關(guān)系,由可獲得所有隊(duì)長(zhǎng)的分布概率。例如在M(4)/M/3/3+2模型中,每批到達(dá)請(qǐng)求數(shù)為4,流量強(qiáng)度ρ=0.9,由式(1)可得隊(duì)長(zhǎng)分布概率為:0π=0.256 8,1π=0.173 4,2π=0.145 2,3π=0.129 5,4π=0.158 6,5π=0.136 5。
2.1 阻塞概率
阻塞概率指請(qǐng)求無法進(jìn)入緩沖區(qū)的概率,是衡量系統(tǒng)可用性的重要指標(biāo)。由于系統(tǒng)采用部分接收策略,當(dāng)該批次的請(qǐng)求無法全部進(jìn)入系統(tǒng)時(shí),可能存在兩種不同結(jié)果:進(jìn)入緩沖區(qū)排隊(duì)或者被拒絕。考慮某個(gè)單個(gè)請(qǐng)求R,假設(shè)請(qǐng)求R在該批次中的位置符合均勻分布,則R屬于大小為j批次的概率為[14]:
假設(shè)系統(tǒng)當(dāng)前隊(duì)長(zhǎng)為i,批量到達(dá)請(qǐng)求數(shù)為j。當(dāng)j>N?i時(shí),則該批次中位于N?i之后的請(qǐng)求將無法進(jìn)入緩沖區(qū),即該批次中將有個(gè)請(qǐng)求被阻塞。因此,阻塞概率為:
2.2 立即服務(wù)概率
如果請(qǐng)求到達(dá)時(shí)存在空閑的服務(wù)器,則請(qǐng)求可能無須等待,立即獲得服務(wù)。假設(shè)系統(tǒng)隊(duì)長(zhǎng)為i(i
2.3 響應(yīng)時(shí)間分布函數(shù)和響應(yīng)時(shí)間百分比
平均響應(yīng)時(shí)間是傳統(tǒng)系統(tǒng)性能重要參數(shù)之一。但在云計(jì)算服務(wù)中,用戶更多的是關(guān)注響應(yīng)時(shí)間百分比。響應(yīng)時(shí)間百分比是指響應(yīng)時(shí)間在指定時(shí)間段中的概率分布百分比,是云計(jì)算中用戶關(guān)注的一個(gè)重要QoS指標(biāo)[5]。響應(yīng)時(shí)間比的定義如下:
式中,f(t)是響應(yīng)時(shí)間t的概率密度函數(shù);ΔT表示用戶使用服務(wù)的時(shí)間段;γ%為響應(yīng)時(shí)間百分比。式(4)表示在響應(yīng)時(shí)間小于ΔT時(shí)間段的概率不能小于γ%。
響應(yīng)時(shí)間由等待時(shí)間和服務(wù)時(shí)間兩部分組成。假設(shè)請(qǐng)求到達(dá)時(shí)系統(tǒng)隊(duì)長(zhǎng)為i,請(qǐng)求數(shù)量為j,Wq(t)為等待時(shí)間t的概率分布函數(shù),則等待時(shí)間為0的概率為:
假設(shè)請(qǐng)求R在同批次中的位置為k,k∈[1,j]。如果R進(jìn)入系統(tǒng)時(shí)無法獲得立即服務(wù),則需要排隊(duì)等待前面的請(qǐng)求完成離開后才能獲得服務(wù)。記R需要等待離開的請(qǐng)求數(shù)為l,因?yàn)槊總€(gè)請(qǐng)求所需的服務(wù)時(shí)間為參數(shù)為μ的負(fù)指數(shù)分布,服務(wù)臺(tái)數(shù)量為n,l個(gè)請(qǐng)求的離去流則符合nμ的l階的Erlang分布。離開請(qǐng)求數(shù)l可以分為下面兩種情況。
1) 當(dāng)i 2) 當(dāng)i≥n,即請(qǐng)求到達(dá)時(shí)不存在空閑的服務(wù)臺(tái)。當(dāng)j∈[1,N?i]時(shí),而k∈[1,j]時(shí),請(qǐng)求會(huì)排隊(duì)等待。當(dāng)j∈(N?i,∞]時(shí),而k∈[1,N?i]時(shí)亦會(huì)等待。有l(wèi)=k+i?n,等待時(shí)間的分布函數(shù) 因此,等待時(shí)間Wq(t)為: 響應(yīng)時(shí)間W=Wq+χ,其中χ為請(qǐng)求所需的服務(wù)時(shí)間。而Wq和χ相互獨(dú)立。根據(jù)卷積公式可以得到響應(yīng)時(shí)間的分布函數(shù)為: 時(shí)間段ΔT的響應(yīng)時(shí)間百分比可以通過W(t≤ΔT)≥γ%計(jì)算得到,通過式(9)可以獲得響應(yīng)時(shí)間百分比和服務(wù)臺(tái)數(shù)量以及服務(wù)速率之間的關(guān)系。 2.4 其他指標(biāo) 本文使用離散事件仿真軟件Arena[15]對(duì)批量到達(dá)的云計(jì)算中心模型在進(jìn)行模擬仿真,分別對(duì)緩沖區(qū)大小和到達(dá)批量大小的變化對(duì)系統(tǒng)性能的影響進(jìn)行了實(shí)驗(yàn)分析。 1) 緩沖區(qū)大小對(duì)性能的影響 通過改變緩沖區(qū)的大小可以在一定程度上改善系統(tǒng)性能。本文實(shí)驗(yàn)假設(shè)云計(jì)算中心服務(wù)臺(tái)n=200,流量強(qiáng)度ρ=0.85,服務(wù)速率μ=0.2,緩存大小r從0每次增加10遞增到100。分別考察以下不同情形系統(tǒng)性能的變化:① 單個(gè)到達(dá);② 批量大小X服從幾何分布③ 批量大小X服從泊松分布結(jié)果如圖2所示。 從圖2可見,隨著緩沖區(qū)的增加,單個(gè)到達(dá)系統(tǒng)的阻塞概率、立即服務(wù)概率、平均響應(yīng)時(shí)間和平均排隊(duì)長(zhǎng)度變化非常平緩,而批量到達(dá)系統(tǒng)的各項(xiàng)性能參數(shù)均有明顯變化,說明在相同的排隊(duì)強(qiáng)度下,緩沖區(qū)的增加對(duì)批量到達(dá)系統(tǒng)性能的改善明顯優(yōu)于單個(gè)到達(dá)系統(tǒng)。隨著緩沖區(qū)的增大,批量到達(dá)系統(tǒng)的阻塞概率下降較快,但是由于進(jìn)入系統(tǒng)的請(qǐng)求數(shù)增加,立即服務(wù)概率、平均響應(yīng)時(shí)間和平均排隊(duì)長(zhǎng)度均隨之增高,意味著系統(tǒng)吞吐量提高。而當(dāng)批量大小符合泊松分布時(shí),系統(tǒng)的各項(xiàng)性能指標(biāo)要優(yōu)于批量大小符合幾何分布的情況。由上述分析可知,在批量到達(dá)系統(tǒng)中,通過增加緩沖區(qū)將能帶來更好的性能提升。 2) 批量到達(dá)數(shù)對(duì)性能的影響 本文在兩種不同規(guī)模的云計(jì)算中心環(huán)境考察批量到達(dá)數(shù)對(duì)系統(tǒng)的影響。云計(jì)算中心1的服務(wù)臺(tái)n=200;云計(jì)算中心2的服務(wù)臺(tái)n=250。緩沖區(qū)的大小r=100,流量強(qiáng)度ρ=0.85,服務(wù)速率μ=0.2,批量到達(dá)請(qǐng)求數(shù)假設(shè)符合最常見的幾何分布,從0遞增到25,實(shí)驗(yàn)結(jié)果如圖3所示。 論文利用排隊(duì)模型對(duì)批量到達(dá)下云計(jì)算中心IaaS服務(wù)性能進(jìn)行了分析,獲取了云計(jì)算中心重要的QoS參數(shù)如阻塞概率、立即服務(wù)概率和響應(yīng)時(shí)間百分比的表達(dá)式,并通過數(shù)值仿真實(shí)驗(yàn)對(duì)結(jié)果進(jìn)行了驗(yàn)證,獲取了各項(xiàng)性能參數(shù)和批量到達(dá)數(shù)之間的關(guān)系。結(jié)果表明緩沖區(qū)容量的增加,對(duì)批量到達(dá)系統(tǒng)下性能的改進(jìn)要優(yōu)于單個(gè)到達(dá)系統(tǒng);同時(shí),隨著批量到達(dá)數(shù)的增加,系統(tǒng)各項(xiàng)性能會(huì)急劇下降,需要通過增加系統(tǒng)資源配置才能保證云計(jì)算QoS服務(wù)質(zhì)量。實(shí)驗(yàn)數(shù)據(jù)和結(jié)論將對(duì)云計(jì)算中心運(yùn)營(yíng)商為了保證QoS,優(yōu)化資源配置和避免配置過載提供有用的參考依據(jù)。 [1] ARMBRUST M, FOX A, GRIFFITH R, et al. A view of cloud computing[J]. Communications of the ACM, 2010, 53(4): 50-58. [2] Amazon Web Services. Amazon EC2[EB/OL]. [2013-12-03]. http://aws.amazon.com/ec2. [3] KOCHUT A, DENG Y, HEAD M R, et al. Evolution of the IBM cloud: Enabling an enterprise cloud services ecosystem[J]. IBM Journal of Research and Development, 2011, 55(6): 1-7. [4] LI Xin-fu, GONDI C. Cloud Computing hosting[C]// 2010 3rd IEEE International Conference on Computer Science and Information Technology (ICCSIT). [S.l.]: IEEE: 2010: 194-198. [5] XIONG K, PERROS H. Service performance and analysis in cloud computing[C]//2009 World Conference on Services-I. [S.l.]: IEEE: 2009: 693-700. [6] XIONG K, PERROS H. SLA-based resource allocation in cluster computing systems[C]//IEEE International Symposium on Parallel and Distributed Processing. [S.l.]: IEEE: 2008: 1-12. [7] GHOSH R, TRIVEDI K S, NAIK V K, et al. End-to-end performability analysis for infrastructure-as-a-service cloud: an interactingstochastic models approach[C]//2010 IEEE 16th Pacific Rim International Symposium on Dependable Computing (PRDC). [S.l.]: IEEE, 2010: 125-132. [8] BRUNEO D. A stochastic model to investigate data center performance and QoS in IaaS cloud computing systems[J]. IEEE Transactions on Parallel and Distributed Systems, 2014, 25(3): 560-569. [9] YANG B,TAN F, DAI Y-S. Performance evaluation of cloud service considering fault recovery[J]. The Journal of Supercomputing, 2013, 65(1): 426-444. [10] KHAZAEI H, MISIC J, MISIC V B. Performance analysis of cloud computing centers using M/G/m/m+r queuing systems[J]. IEEE Transactions on Parallel and Distributed Systems, 2012, 23(5): 936-943. [11] KHAZAEI H, MISIC J, MISIC V B. Performance analysis of cloud centers under burst arrivals and total rejection policy[C]//Global Telecommunications Conference. [S.l.]: IEEE, 2011: 1-6. [12] KHAZAEI H, MISIC J, MISIC V B. Performance of cloud centers with high degree of virtualization under batch task arrivals[J]. IEEE Transactions on Parallel and Distributed Systems, 2013, 24(12): 2429-2438. [13] 唐應(yīng)輝, 唐小我. 排隊(duì)論——基礎(chǔ)與分析技術(shù)[M]. 北京:科學(xué)出版社, 2006. TANG Ying-hui, TANG Xiao-wo. Queuing theory: Basic and analysis[M]. Beijing: Science Press, 2006. [14] BURKE P. Technical note: Delays in single-server queues with batch input[J]. Operations Research, 1975, 23(4): 830-833. [15] ALTIOK T, MELAMED B. Simulation modeling and analysis with Arena[M]. [S.l.]: Academic Press, 2010. 編 輯 蔣 曉 Service Performance Evaluation of IaaS Cloud Computing Center Under Batch Arrivals HE Huai-wen1,2and FU Yu1 An analytical model based on queue system is proposed to deal with performance analysis of cloud center under batch arrivals. Some important performance indicators are acquired at steady status; these indicators include blocking probability, instance service probability, percentile response time, average queue length, and so on. The system performance influenced by changing buffer size and batch arrivals size is analyzed through numerical simulation. The numerical simulation results indicate that when buffer size is increased, the system performance with batch arrivals is better than single arrival under the same queuing intensity, and the system performance decreases as the burstiness of the number of every batch arrivals increase. batch arrivals; cloud computing center; performance evaluation; response time TP393.02 A 10.3969/j.issn.1001-0548.2015.03.022 2013 ? 09 ? 17; 2014 ? 03 ? 20 國(guó)家自然科學(xué)基金(61300095);廣東省自然科學(xué)基金(S2012010010508);中山市科技計(jì)劃項(xiàng)目(2014A2FC396, 2013A3FC0285) 何懷文(1980 ? ),男,博士生,主要從事云計(jì)算、資源分配調(diào)度及綠色計(jì)算方面的研究.3 數(shù)值仿真與結(jié)果分析
4 結(jié) 束 語
(1.School of Computer, Zhongshan Institute, University of Electronic Science and Technology of China Zhongshan Guangdong 528402;
2. School of Information Science and Technology, Sun Yat-sen University Guangzhou 510275)