賀敬偉,戚林成,杜元翰,張世杰,劉繼東
(1.江蘇電力信息技術(shù)有限公司,江蘇 南京 210000;2.國網(wǎng)江蘇省電力有限公司信息通信分公司,江蘇南京 210000)
混合模型是集中不同應(yīng)用模型的組合體表現(xiàn)形式,其允許所研究項目向著最有效的路徑發(fā)展。除隨機誤差條件外,也可定義為固定效應(yīng)、隨機效應(yīng)兩類基本的統(tǒng)計分析原則。在統(tǒng)計學(xué)范疇中,混合模型代表了原始大群體中存在子群體的數(shù)學(xué)概率,一般來說,與混合模型匹配的數(shù)據(jù)集合空間越大,子群體被應(yīng)用主機直接采納的可能性也就越大[1-2]。若將統(tǒng)計推斷條件考慮在內(nèi),則可認(rèn)為隨著子群體數(shù)量值水平的增大,混合模型的原始包含空間也會不斷擴大,但由于隨機誤差量的存在,子空間對于原始空間的數(shù)值影響條件也會隨之不斷改變。
在云平臺環(huán)境中,為了從根本上保障云服務(wù)的質(zhì)量水平,應(yīng)對資源數(shù)據(jù)存儲條件進(jìn)行及時適量的匹配。傳統(tǒng)高斯負(fù)載型數(shù)據(jù)伸縮方法通過計算正向超量時延系數(shù)的方式,確定云平臺資源數(shù)據(jù)的實時存儲條件,再根據(jù)既定的殘差值分析標(biāo)準(zhǔn),實現(xiàn)對數(shù)據(jù)信息的拉伸與收縮處理。然而此方法的最小壓縮與最大拉伸能力有限,并不能實現(xiàn)對云資源數(shù)據(jù)傳輸體積的及時調(diào)整。
為解決此問題,提出基于混合模型的云平臺資源彈性伸縮方法,根據(jù)資源數(shù)據(jù)的初始定位條件,確定云平臺主機需求的實際變化趨勢,再通過資源數(shù)據(jù)采集與融合的處理方式,完善已定義的彈性擴容與伸縮擴容條件。
基于混合模型的云數(shù)據(jù)定位由聚類混合系數(shù)計算、初始定位條件確定、云數(shù)據(jù)優(yōu)選殘差加權(quán)量分析三個處理環(huán)節(jié)共同組成,具體研究方法如下。
聚類是將已知云數(shù)據(jù)特征矢量全部劃分至不同模型類別中,再將所得模型集合體按照一定標(biāo)準(zhǔn)混合,以便于后續(xù)協(xié)方差計算。協(xié)方差指標(biāo)能夠約束云平臺資源在單位時間內(nèi)的傳輸能力,一般情況下,混合模型的初始數(shù)值空間越大,已存儲資源信息之間的協(xié)方差指標(biāo)數(shù)值水平越高[3-4]。
設(shè)i0代表最小的云數(shù)據(jù)存儲系數(shù),in代表最大的云數(shù)據(jù)存儲系數(shù)。其中,n表示聚類處理的實際執(zhí)行次數(shù)。在由i0、in決定的云數(shù)據(jù)存儲空間中,混合模型所涉及的云數(shù)據(jù)信息總量值越大,最終計算所得的聚類混合系數(shù)值也就越精準(zhǔn)。聯(lián)立上述物理量,可將聚類混合系數(shù)表達(dá)式定義為:
其中,w1代表第一個應(yīng)用模型聚類條件,wn代表第n個應(yīng)用模型聚類條件,代表待存儲云平臺資源數(shù)據(jù)特征值,代表聚類模型的混合特征均值。
初始定位條件是混合模型建立的關(guān)鍵,可在已知聚類混合系數(shù)結(jié)果基礎(chǔ)上,限定云平臺資源數(shù)據(jù)所能達(dá)到的傳輸與存儲位置[5]。由于混合模型存在相對復(fù)雜的數(shù)據(jù)信息存儲限定條件,在考慮聚類作用的情況下,隨著云平臺資源數(shù)據(jù)傳輸速率的加快,相關(guān)信息參量的存儲位置也會逐漸發(fā)生改變。為更好適應(yīng)上述資源信息變化情況,應(yīng)選取多個不同云平臺數(shù)據(jù)作為聚類參考條件。一方面,借助混合模型對相關(guān)信息參量進(jìn)行整合,另一方面也可較好控制模型主體在單位時間內(nèi)的具體變化情況[6-7]。設(shè)m1、m2、…、mn分別代表n個不同云平臺資源數(shù)據(jù)信息,λ表示混合模型的單位聚類條件,聯(lián)立式(1),可將混合模型的初始定位條件表示為:
其中,u0代表最小的資源數(shù)據(jù)傳輸速率值,un代表最大的資源數(shù)據(jù)傳輸速率值,R代表標(biāo)準(zhǔn)的平臺資源數(shù)據(jù)聚類系數(shù)項。
云數(shù)據(jù)的優(yōu)選殘差加權(quán)量從隨機解角度出發(fā),通過尋優(yōu)迭代處理的方式,確定混合模型的最優(yōu)解數(shù)值,再借助適應(yīng)度函數(shù),評價云平臺資源的存儲與應(yīng)用價值,從而實現(xiàn)對混合模型執(zhí)行環(huán)境的有效完善。在已知初始定位條件的前提下,通過聚類處理等方式所獲得的優(yōu)選殘差加權(quán)量計算結(jié)果,能夠從強弱度、分離度等多個角度分析云平臺存儲環(huán)境的穩(wěn)定性水平[8-9]。云數(shù)據(jù)優(yōu)選殘差加權(quán)量作為一種正值誤差特征量,在參量選取與計算過程中,只能將其視為一種估算值應(yīng)用結(jié)果。
設(shè)表示云平臺環(huán)境中資源數(shù)據(jù)信息的殘差優(yōu)選系數(shù),代表與混合模型匹配的強弱度參量值,β代表與混合模型匹配的分離度參量值,聯(lián)立式(2),可將云數(shù)據(jù)的優(yōu)選殘差加權(quán)量計算結(jié)果表示為:
其中,An代表云數(shù)據(jù)信息的殘差量最大值,Aˉ代表云數(shù)據(jù)信息的殘差量均值,ΔY代表單位時間內(nèi)的云平臺資源數(shù)據(jù)傳輸變化量。
在混合模型支持下,按照平臺主機需求變化趨勢分析、資源數(shù)據(jù)采集與融合、彈性擴容與伸縮擴容條件計算的處理流程,完成云平臺資源彈性伸縮方法的設(shè)計與應(yīng)用。
針對云平臺所有特定資源數(shù)據(jù)的彈性伸縮變化策略,需要根據(jù)平臺主機的需求制定條件,且由于混合模型的存在,數(shù)據(jù)信息參量在實際存儲過程中,始終保持較強的感應(yīng)性傳輸能力[10-11]。不同存儲時刻,云平臺資源數(shù)據(jù)具備的彈性伸縮適應(yīng)能力也有所不同,在已知優(yōu)選殘差加權(quán)量計算結(jié)果的情況下,待存儲的資源數(shù)據(jù)量越大,云平臺主機所具備的信息傳輸能力也就越強。在單位傳輸時間內(nèi),云平臺資源數(shù)據(jù)始終保持連續(xù)轉(zhuǎn)存的物理變化形式,即隨著平臺運行時間的延長,資源數(shù)據(jù)的轉(zhuǎn)存量水平也會不斷增大,反之則不斷減小[12]。
設(shè)θ1、θ2分別代表兩個不同的云平臺感應(yīng)需求條件,在資源數(shù)據(jù)查找量等于β的情況下,聯(lián)立式(3),可將云平臺主機的需求變化趨勢定義為:
其中,f代表云平臺環(huán)境中的資源數(shù)據(jù)轉(zhuǎn)存系數(shù),代表單位時間內(nèi)的云平臺資源查找均值量,η代表資源數(shù)據(jù)的傳輸效率,k0代表數(shù)據(jù)信息的初始存儲量數(shù)值。
云平臺資源數(shù)據(jù)采集與融合是信息參量處理的關(guān)鍵環(huán)節(jié),其可在已知混合模型的基礎(chǔ)上,安排彈性伸縮控制指令的執(zhí)行強度,實現(xiàn)對彈性擴容與伸縮擴容條件的準(zhǔn)確計算。從宏觀角度來看,資源數(shù)據(jù)采集與資源數(shù)據(jù)融合是兩個相互獨立的執(zhí)行流程,前者負(fù)責(zé)在云平臺環(huán)境中分析資源數(shù)據(jù)所處的實時位置,并結(jié)合混合模型對主機中暫存的信息參量進(jìn)行按需提??;后者則主要負(fù)責(zé)將散亂分布的資源數(shù)據(jù)整合成包狀傳輸形式,從而實現(xiàn)對彈性收縮控制指令的有效分配與調(diào)節(jié)[13-14]。采集與融合流程如圖1所示。
圖1 云平臺資源數(shù)據(jù)的采集與融合流程
彈性擴容條件決定了云平臺資源數(shù)據(jù)的最大存儲能力,一般來說,資源數(shù)據(jù)的采集與融合情況越完整,彈性擴容條件的計算結(jié)果也就越精確[15]。設(shè)ξ表示既定的云平臺資源數(shù)據(jù)采集系數(shù),j表示單位時間內(nèi)的資源數(shù)據(jù)融合處理系數(shù),聯(lián)立式(4),可將彈性擴容條件表示為:
其中,h代表單位時間內(nèi)云平臺資源數(shù)據(jù)的最大采集量。
伸縮擴容條件決定云平臺資源數(shù)據(jù)的最小存儲能力,該項物理條件與彈性擴容條件之間的差值水平越大,云平臺空間的實際穩(wěn)定性能力也就越強[16]。設(shè)d代表云平臺資源數(shù)據(jù)的實時容量系數(shù)值,μ代表數(shù)據(jù)信息的彈性伸縮目標(biāo)向量,聯(lián)合上述所有已知條件,可將伸縮擴容條件表示為:
至此,完成各項物理系數(shù)值的計算與處理,實現(xiàn)云平臺資源彈性伸縮方法的研究。
在云平臺環(huán)境中,最大拉伸值、最小壓縮值都能反映主機設(shè)備所具備的資源數(shù)據(jù)處理能力。理想情況下,云平臺資源最大拉伸值的理想變化區(qū)間為5~13 bit(如圖2 所示),且數(shù)值結(jié)果越大,達(dá)標(biāo)拉伸處理行為越明顯,其理想情況如圖2 所示。
圖2 最大拉伸值的理想變化情況
將與理想拉伸值結(jié)果對應(yīng)的時間節(jié)點作為時間取樣點,繪制實驗組、對照組最大拉伸數(shù)值的實際變化曲線。其中,實驗組采用基于混合模型的云平臺資源彈性伸縮方法,對照組采用高斯負(fù)載型數(shù)據(jù)伸縮方法[17-19]。
對比圖2、圖3 可知,實驗組、對照組的最大拉伸值曲線始終與理想曲線保持相同的變化趨勢,但實驗組均值水平明顯更高,變化區(qū)間范圍由5~13 bit 擴大為8~16 bit;對照組均值水平則顯著降低,變化區(qū)間范圍由5~13 bit縮小至3.5~11.5 bit。
圖3 最大拉伸值的實驗記錄結(jié)果
綜上可知,在混合模型作用下,云平臺資源的最大拉伸數(shù)值會明顯增大,對于擴大云主機的數(shù)據(jù)信息存儲能力具有較強促進(jìn)作用。
表1 記錄了實驗組、對照組云平臺資源最小壓縮值及理想數(shù)值的實際變化情況。
分析表1 可知,實驗組最小壓縮值、對照組最小壓縮值、理想數(shù)值均保持相同的物理變化趨勢。從平均量角度來看,實驗組的變化區(qū)間為[0.200 bit,0.317 bit],對照組的變化區(qū)間為[0.5 bit,0.8 bit],理想數(shù)值的變化區(qū)間為[0.31 bit,0.45 bit],其變化區(qū)間大小順序為實驗組<理想組<對照組。
表1 最小壓縮值的實驗記錄結(jié)果
綜上可知,在混合模型作用下,云平臺資源的最小壓縮值會出現(xiàn)持續(xù)縮小的變化形式,這在一定程度上,可實現(xiàn)對云主機數(shù)據(jù)信息下限存儲能力的有效促進(jìn)。
與高斯負(fù)載型數(shù)據(jù)伸縮方法相比,新型彈性伸縮方法可在混合模型的作用下,通過定義初始定位條件,計算得到云數(shù)據(jù)優(yōu)選殘差加權(quán)量,且由于平臺主機始終處于相對變化的發(fā)展趨勢,資源數(shù)據(jù)的采集與融合結(jié)果可對彈性擴容與伸縮擴容條件提供有效的保障。從實用性角度來看,混合模型支持下,云平臺主機的最大拉伸值結(jié)果更大,最小壓縮值結(jié)果更小,可在實現(xiàn)云資源數(shù)據(jù)與平臺主機存儲條件最大化匹配的同時,確保云服務(wù)質(zhì)量水平的可行性,具備較強的實際應(yīng)用價值。