當前運維已由監(jiān)控告警的初級形式向著自動化、智能化方向演進。進入運維4.0時代后,通過引入網(wǎng)絡(luò)流量分析數(shù)據(jù)來實現(xiàn)針對大量應(yīng)用、業(yè)務(wù)日志的集中式高效分析。
成都科來軟件有限公司技術(shù)經(jīng)理齊宇飛(如圖1)解釋了運維新時代的實現(xiàn)途徑,即以大數(shù)據(jù)和機器學(xué)習(xí)為手段,整合現(xiàn)有多種監(jiān)控數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)、事件,結(jié)合原有的人工運維操作等,實現(xiàn)復(fù)雜能力的工具化,進而實現(xiàn)運維操作的自動化,或稱之為“AIOps”,如圖2。
科來以網(wǎng)絡(luò)全流量分析作為切入點,努力實現(xiàn)以上目標,但要實現(xiàn)全流量的分析并不簡單, 對于數(shù)據(jù)中心而言,傳統(tǒng)數(shù)據(jù)中心與云數(shù)據(jù)中心的運維也有所不同,齊宇飛認為,第一,如何獲取流量,比如有些數(shù)據(jù)中心是通過SDN的流量,它并不是那種傳統(tǒng)上可以做鏡像的,而科來是可以通過一定手段去實現(xiàn)的;第二是整體處理性能,當萬兆口流量出現(xiàn)了,整機處理能力能不能跟上;第三,是否支持數(shù)據(jù)中心級的部署模式,因為一個數(shù)據(jù)中心有無數(shù)多的點要去采集,所以構(gòu)架一定是分布式的,多點采集,到統(tǒng)一的分析中心匯總;第四,在海量數(shù)據(jù)中如何找出問題點。
圖1 科來 齊宇飛
圖2 AIOps框架圖
現(xiàn)代化的數(shù)據(jù)中心是全流量分析的重要應(yīng)用場景,在數(shù)據(jù)中心側(cè),要能夠?qū)崿F(xiàn)應(yīng)用的全局監(jiān)控,快速準確的展現(xiàn)應(yīng)用和業(yè)務(wù)運行狀態(tài),同時對于應(yīng)用路徑的各個環(huán)節(jié)也必須實現(xiàn)全路徑監(jiān)控。不僅如此,還要考慮云計算虛擬化環(huán)境、SDN、移動互聯(lián)網(wǎng)等場景,并能在應(yīng)用交易路徑的所有環(huán)節(jié)都要部署流量采集點,并加以統(tǒng)一視圖的分析。
在IT團隊建設(shè)上,新一代的智能運維平臺不能僅面向某一個團隊,網(wǎng)絡(luò)、應(yīng)用、研發(fā)、安全等各部門的配合也是業(yè)務(wù)穩(wěn)定運行的關(guān)鍵,智能運維平臺應(yīng)具備多層次的監(jiān)控運維能力,既針對特定部門的特定需求提供精準的監(jiān)控和操作工具,也可以針對部門間配合協(xié)調(diào)需求,提供集成化監(jiān)控分析和操作手段。
在未來,智能運維是運維發(fā)展的重要方向,而基于全流量分析技術(shù)則是實現(xiàn)智能運維的重要手段之一,在此次“2018中國數(shù)據(jù)中心建設(shè)論壇”上,科來榮獲“2018企業(yè)級數(shù)據(jù)中心建設(shè)十大用戶信賴品牌”獎。