圖1 IBM 黃衛(wèi)
在數(shù)字化和云化轉(zhuǎn)型時代,云數(shù)據(jù)中心的IT運維面臨著挑戰(zhàn)。IBM 認知IT運維能夠基于洞察以提升效率、提前預(yù)判,基于Watson認知決策。IBM混合云顧問工程師黃衛(wèi)告訴記者,IBM認知IT運維有三個指導(dǎo)原則,分別是持續(xù)學(xué)習(xí)、預(yù)測修正、推薦決策。持續(xù)學(xué)習(xí)以揭示海量數(shù)據(jù)內(nèi)在特征和變化規(guī)律,認知分析以在重大故障之前揭示異常征兆, 跨混合云端到端的可視化、可控化、自動化和敏捷性,雙模態(tài)深度集成、一致統(tǒng)一的IT運維平臺, NLP輔助問題診斷和修復(fù)。并且機器自學(xué)習(xí)策略可設(shè)定強、中、弱關(guān)系學(xué)習(xí),并且,機器學(xué)習(xí)自動識別事件間相關(guān)性可以顯著提升IT運維甚至運營效率。
IBM認知IT運維由Netcool提供創(chuàng)新的大數(shù)據(jù)智能分析,提高運維價值并在整個IT環(huán)境降低成本。能夠進行事件日志上下文歷史挖掘和規(guī)律分析,事件日志周期性規(guī)律分析,事件日志成對成組出現(xiàn)分析和事件日志相關(guān)與因果分析。
圖2 IBM 認知IT運維結(jié)構(gòu)化數(shù)據(jù)認知學(xué)習(xí)和預(yù)測
而結(jié)構(gòu)化數(shù)據(jù)認知學(xué)習(xí)和預(yù)測,能夠使用統(tǒng)計學(xué)工具,和行為學(xué)知算法,揭示指標(biāo)間的數(shù)學(xué)關(guān)系。
多KPI相關(guān)性認知學(xué)習(xí)和預(yù)警功能中,PI學(xué)習(xí)到“業(yè)務(wù)響應(yīng)時間”與“用戶請求”有正相關(guān)因果關(guān)系,且隨著用戶負載增加而變慢。如果這一正常歷史規(guī)律被破壞,比如說由于內(nèi)存泄漏,造成即便用戶請求數(shù)下降了,業(yè)務(wù)響應(yīng)時間還很高,異常預(yù)警信號將立即發(fā)出。盡管這時業(yè)務(wù)服務(wù)質(zhì)量仍處于“好”的區(qū)間,問題已被發(fā)現(xiàn)。
同時,該功能具有強大的實時分析能力和伸縮性,普通刀片服務(wù)器上每一分析引擎支持多達500,000個指標(biāo)每5分鐘粒度的數(shù)據(jù)。一個全裝備的關(guān)鍵業(yè)務(wù)應(yīng)用可產(chǎn)生多達50,000個指標(biāo)數(shù)據(jù)。
黃衛(wèi)最后表示,IBM認知IT運維實現(xiàn)了敏捷運維與知識共享,提升了運維的自動化能力:日常操作自動化,交流與知識共享,以加速解決日常運維常見問題。