高林娥
(運(yùn)城師范高等??茖W(xué)校, 山西 運(yùn)城044000)
科技的迅猛發(fā)展為智能化管理奠定了基礎(chǔ)。 研究表明,將人工智能技術(shù)與深度學(xué)習(xí)相結(jié)合,既能使數(shù)據(jù)中心所具有的智能化水平得到提升,又能對(duì)數(shù)據(jù)中心運(yùn)維效率產(chǎn)生的積極影響,基于智能預(yù)警開展設(shè)計(jì)工作成為研究的重點(diǎn)。 涉及機(jī)房故障診斷所開展的研究相關(guān)研究工作,已經(jīng)取得了良好的成果。但是,基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)中心故障預(yù)測(cè)方法研究仍舊有待深入。
數(shù)據(jù)中心機(jī)房(下文簡(jiǎn)稱“機(jī)房”)往往擁有大量類型不同的設(shè)備,導(dǎo)致故障出現(xiàn)的原因較多,本文根據(jù)機(jī)房常見故障,圍繞故障預(yù)測(cè)的內(nèi)容展開研究。利用神經(jīng)網(wǎng)絡(luò)良好的預(yù)測(cè)性能,基于TensorFlow 對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行搭建,對(duì)經(jīng)過(guò)歸一化處理的機(jī)房日志數(shù)據(jù)的特點(diǎn)進(jìn)行提取,向訓(xùn)練模型進(jìn)行傳輸,使“基于設(shè)備運(yùn)行數(shù)據(jù),對(duì)后續(xù)狀態(tài)進(jìn)行預(yù)測(cè)”的設(shè)想成為現(xiàn)實(shí)。
機(jī)房的基礎(chǔ)設(shè)施主要有路由器、服務(wù)器和交換機(jī)等,基礎(chǔ)設(shè)施所表現(xiàn)出的性能,往往會(huì)給網(wǎng)絡(luò)運(yùn)行效率帶來(lái)直接影響。 可以根據(jù)描述網(wǎng)絡(luò)設(shè)備性能的參數(shù)組指標(biāo),包括CPU 的利用率,設(shè)備的響應(yīng)時(shí)間,報(bào)文的接收速率,內(nèi)存的利用率,對(duì)設(shè)備的狀態(tài)進(jìn)行綜合評(píng)價(jià)。 但現(xiàn)有技術(shù)無(wú)法保證所采集日志數(shù)據(jù),不存在冗余數(shù)據(jù)和無(wú)效數(shù)據(jù)。 因此有必要處理、加工原始數(shù)據(jù)。 在完成數(shù)據(jù)采集工作后,應(yīng)該以設(shè)備狀態(tài)為依據(jù),將樣本數(shù)據(jù)分為正常和故障兩類,再將由此而獲得的測(cè)試集數(shù)據(jù)、訓(xùn)練集數(shù)據(jù),用csv 的格式進(jìn)行保存[1]。
本文以山西省某市自然資源廳的機(jī)房為研究對(duì)象,通過(guò)測(cè)試、驗(yàn)證機(jī)房數(shù)據(jù)的方式,獲得最終結(jié)論。在此過(guò)程中,所采用方法以主動(dòng)輪詢?yōu)橹?就是以所選取性能指標(biāo)為依據(jù),對(duì)表示設(shè)備性能的數(shù)據(jù)進(jìn)行采集。 機(jī)房擁有大量類型不同的設(shè)備,設(shè)備性能出現(xiàn)故障的原因,也并不局限于某種或某幾種,本文只選取了具有代表性的故障類型,例如:CPU 或內(nèi)存的利用率過(guò)高,致使設(shè)備有故障出現(xiàn);報(bào)文傳輸速率過(guò)低;設(shè)備長(zhǎng)時(shí)間未響應(yīng)等等,如表1 所示。 由于不同特征所對(duì)應(yīng)量綱、量綱單位有所不同,數(shù)據(jù)分析結(jié)果也會(huì)受到影響。 為了消除量綱的影響,有必要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,各項(xiàng)指標(biāo)均處于相同的數(shù)量級(jí),再對(duì)指標(biāo)進(jìn)行對(duì)比和評(píng)價(jià),可以獲得更加準(zhǔn)確的結(jié)論。 本文利用均方差法,對(duì)數(shù)據(jù)進(jìn)行歸一化處理,見公式(1):
其中, xi表示樣本數(shù)據(jù),用來(lái)μ 表示總體平均值,δ 表示總體標(biāo)準(zhǔn)差。 經(jīng)過(guò)歸一化處理的數(shù)據(jù),滿足正態(tài)分布曲線的特點(diǎn),即:方差是1,均值是0。 這也為后續(xù)對(duì)比、評(píng)價(jià)等工作的開展,奠定了基礎(chǔ)。
表1 樣本數(shù)據(jù)Tab. 1 Sample data
神經(jīng)網(wǎng)絡(luò)所指代內(nèi)容,集中在生物領(lǐng)域和人工領(lǐng)域。 其中,生物神經(jīng)網(wǎng)絡(luò),主要是指由觸點(diǎn)、細(xì)胞和大腦神經(jīng)元所組成的,用來(lái)對(duì)生物意識(shí)進(jìn)行產(chǎn)生的網(wǎng)絡(luò)。 人工神經(jīng)網(wǎng)絡(luò),主要是指對(duì)動(dòng)物神經(jīng)網(wǎng)絡(luò)所表現(xiàn)出的行為特征進(jìn)行模仿,用來(lái)處理并行信息的數(shù)學(xué)模型,該網(wǎng)絡(luò)主要通過(guò)對(duì)節(jié)點(diǎn)關(guān)系進(jìn)行調(diào)整的方式,完成信息處理的任務(wù)。 本文所討論的神經(jīng)網(wǎng)絡(luò),即為人工神經(jīng)網(wǎng)絡(luò)。 在分類預(yù)測(cè)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)表現(xiàn)出良好的性能。 基于神經(jīng)網(wǎng)絡(luò)所設(shè)計(jì)的模型,主要由三層結(jié)構(gòu)組成,輸入層,隱藏層,輸出層。需要選擇相應(yīng)的連接方式,對(duì)隱藏層進(jìn)行連接,使模型深度得到擴(kuò)充,提高模型所能解決問(wèn)題的難度。數(shù)據(jù)中心機(jī)房?jī)?nèi)部設(shè)備眾多,不同設(shè)備均有相應(yīng)的性能,數(shù)據(jù)關(guān)系復(fù)雜,設(shè)備性能所呈現(xiàn)出的關(guān)系,以非線性關(guān)系為主,故可用于故障預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò),通常為多層神經(jīng)網(wǎng)絡(luò)。
基于神經(jīng)網(wǎng)絡(luò)所展開研究涉及諸多領(lǐng)域,最具代表性的工作,體現(xiàn)在以下方面:(1)生物原型。 從心理學(xué)、生理學(xué)等角度出發(fā),對(duì)神經(jīng)系統(tǒng)、網(wǎng)絡(luò)核細(xì)胞所對(duì)應(yīng)生物結(jié)構(gòu)、功能機(jī)理進(jìn)行研究。 (2)建立模型。 基于生物原型研究所取得成果,對(duì)理論模型進(jìn)行建立,所建立的模型以數(shù)學(xué)模型、概念模型和知識(shí)模型為主。 (3)算法。 基于理論模型研究,對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行構(gòu)建,用來(lái)模擬計(jì)算機(jī)或?qū)τ布M(jìn)行制作;與網(wǎng)絡(luò)學(xué)習(xí)算法相關(guān)的內(nèi)容,也可以納入算法范圍。
選擇利用TensorFlow 框架,對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行搭建,為故障預(yù)測(cè)、訓(xùn)練等工作的開展提供幫助。TensorFlow 既可以作為算法學(xué)習(xí)接口,也可以作為基本框架,用來(lái)執(zhí)行機(jī)器學(xué)習(xí)算法。 在實(shí)際計(jì)算過(guò)程中,可將數(shù)據(jù)中心視為有向圖,將計(jì)算操作視為節(jié)點(diǎn),將連接節(jié)點(diǎn)的位置視為邊。 以矩陣乘法、向量加法為代表的計(jì)算對(duì)故障進(jìn)行預(yù)算的效果,往往十分準(zhǔn)確。 結(jié)構(gòu)模型由輸入層、隱藏層和輸出層組成。輸入層對(duì)數(shù)據(jù)進(jìn)行輸入,隱藏層對(duì)數(shù)據(jù)進(jìn)行處理,輸出層對(duì)分類結(jié)果進(jìn)行輸出[2]。 輸入層所輸入內(nèi)容,以CPU 的利用率,設(shè)備的響應(yīng)時(shí)間,報(bào)文的接收速率,內(nèi)存的利用率為主。 隱藏層的操作,主要是矩陣相乘、激活函數(shù),產(chǎn)生非線性特征。 輸出層所輸出的狀態(tài),僅有正常和故障兩種,用0 表示正常,用1 表示故障。 另外,隱藏層的計(jì)算利用公式(2):
其中,z、x 表示輸出特征向量與輸入特征向量,f表示激活函數(shù),W 表示權(quán)重矩陣,b 表示偏置。 實(shí)驗(yàn)設(shè)置神經(jīng)網(wǎng)絡(luò)的層數(shù)為2 層,第1 層維度為62,第2層維度為124。
將SoftMax 函數(shù)視為對(duì)設(shè)備狀態(tài)進(jìn)行判斷的主要概率計(jì)算,此函數(shù)的損失函數(shù),多為交叉熵。 在對(duì)模型進(jìn)行訓(xùn)練的過(guò)程中,視情況對(duì)正則化項(xiàng)加以應(yīng)用,避免出現(xiàn)過(guò)擬合的情況,提高預(yù)測(cè)的準(zhǔn)確性。
以預(yù)測(cè)機(jī)房故障為主,分類判斷設(shè)備狀態(tài),屬于典型的二分問(wèn)題,可將分類的準(zhǔn)確性、損失變化視為評(píng)測(cè)的主要指標(biāo),應(yīng)用梯度下降法,使實(shí)驗(yàn)損失達(dá)到最小化。
模型的計(jì)算流程如下:首先,構(gòu)建計(jì)算圖,例如,常量、初始化節(jié)點(diǎn);其次,執(zhí)行指點(diǎn)操作,檢測(cè)常量、變量;最后,獲得相應(yīng)數(shù)據(jù),完成故障的預(yù)測(cè)。 將學(xué)習(xí)率設(shè)置成0.01,利用梯度下降,將損失降到最低。訓(xùn)練次數(shù)為500 輪。 根據(jù)運(yùn)行后準(zhǔn)確率和損失率的具體數(shù)值,不斷增加迭代次數(shù),使模型損失曲線的趨勢(shì)逐漸向收斂靠攏,最終趨于穩(wěn)定[3]。 準(zhǔn)確率和迭代次數(shù)的關(guān)系為正相關(guān),也就是說(shuō),如果迭代次數(shù)增加,模型準(zhǔn)確率也會(huì)有所增加,待準(zhǔn)確率穩(wěn)定后,將測(cè)試數(shù)據(jù)輸入其中,能夠?qū)?shù)據(jù)和設(shè)備狀態(tài)的關(guān)系,進(jìn)行相對(duì)準(zhǔn)確的預(yù)測(cè)和呈現(xiàn)。
基于TensorFlow 搭建模型,在經(jīng)過(guò)系統(tǒng)訓(xùn)練后,具有以設(shè)備數(shù)據(jù)信息為依據(jù),對(duì)設(shè)備狀態(tài)進(jìn)行預(yù)測(cè)的能力。 如果設(shè)備呈現(xiàn)出的狀態(tài)欠佳,可及時(shí)提醒工作人員,通過(guò)維護(hù)設(shè)備,減少發(fā)生故障的可能性。另外,實(shí)現(xiàn)智能預(yù)警、解決故障等方面,設(shè)備預(yù)測(cè)的價(jià)值也得以體現(xiàn)。