亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于微服務(wù)的電網(wǎng)云平臺運(yùn)維技術(shù)研究綜述

        2023-04-26 08:20:58樵永鋒
        計(jì)算機(jī)測量與控制 2023年4期
        關(guān)鍵詞:運(yùn)維架構(gòu)監(jiān)控

        陳 碩,喬 林,李 釗,袁 野,樵永鋒,程 旭

        (1.國網(wǎng)遼寧省電力有限公司 信息通信分公司,沈陽 110001;2.國網(wǎng)遼寧省電力有限公司,沈陽 110001;3.東北大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,沈陽 110819;4.丹東東方測控技術(shù)股份有限公司,遼寧 丹東 118002;5.沈陽農(nóng)業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院,沈陽 110866)

        0 引言

        近年來,由于云計(jì)算技術(shù)的大力發(fā)展,其被廣泛應(yīng)用于各行業(yè)。與傳統(tǒng)的信息化系統(tǒng)相比,云計(jì)算具有更復(fù)雜的技術(shù)架構(gòu),并且具有的資源池化、彈性供給等特征,使得企業(yè)信息化更節(jié)約、更便捷和更易操控,提高了企業(yè)面對外部環(huán)境變化的應(yīng)對能力,從而提升了企業(yè)的業(yè)務(wù)敏捷性[1]。

        隨著信息化建設(shè)的迅速發(fā)展,國家電網(wǎng)有限公司(以下簡稱公司)信息化建設(shè)覆蓋生產(chǎn)經(jīng)營各個環(huán)節(jié)。傳統(tǒng)的以物理服務(wù)器和網(wǎng)絡(luò)為主體構(gòu)建的架構(gòu)存在擴(kuò)展性不高、穩(wěn)定性不強(qiáng)、維護(hù)成本較高等問題,已經(jīng)難以滿足企業(yè)的業(yè)務(wù)需求。微服務(wù)架構(gòu)的出現(xiàn),使得公司的信息化系統(tǒng)有了新的發(fā)展方向,微服務(wù)應(yīng)用體系架構(gòu)如圖1所示。

        圖1 微服務(wù)應(yīng)用體系架構(gòu)

        微服務(wù)架構(gòu)的應(yīng)用滿足了公司業(yè)務(wù)的不斷開拓,通過容器化技術(shù)實(shí)現(xiàn)業(yè)務(wù)功能的分拆,實(shí)現(xiàn)軟件資產(chǎn)復(fù)用和數(shù)據(jù)共享。微服務(wù)架構(gòu)具有高擴(kuò)展性、高穩(wěn)定性以及低運(yùn)營成本等優(yōu)點(diǎn)。然而隨著微服務(wù)應(yīng)用數(shù)量幾何式增長發(fā)展,部署于云平臺上的微服務(wù)運(yùn)維面臨新的困難和挑戰(zhàn),即大規(guī)模微服務(wù)錯綜復(fù)雜關(guān)系環(huán)境下的感知監(jiān)控、資源保障以及故障分析問題。

        本文首先從基于微服務(wù)電網(wǎng)云平臺運(yùn)維面臨的工作變化以及問題展開,對目前現(xiàn)有的微服務(wù)感知監(jiān)控、資源調(diào)配以及故障分析3個主要運(yùn)維技術(shù)算法進(jìn)行總結(jié)綜述。此外,對每種運(yùn)維技術(shù)方法進(jìn)行了優(yōu)缺點(diǎn)分析。最后,根據(jù)目前運(yùn)維技術(shù)的研究現(xiàn)狀以及企業(yè)的實(shí)際需求做出進(jìn)一步展望。

        1 基于微服務(wù)云平臺的運(yùn)維技術(shù)

        微服務(wù)通過容器、微服務(wù)框架等方式支撐應(yīng)用在云上部署和運(yùn)行,主要針對新建業(yè)務(wù)應(yīng)用或新建模塊,將存在眾多復(fù)雜業(yè)務(wù)子模塊、且子模塊間緊密耦合的傳統(tǒng)單體應(yīng)用,以合理的業(yè)務(wù)層面維度,拆分為多個模塊化微服務(wù)[2]。微服務(wù)的訪問統(tǒng)一由云上的API網(wǎng)關(guān)進(jìn)行負(fù)載、匯總、轉(zhuǎn)發(fā),微服務(wù)的注冊、發(fā)現(xiàn)和服務(wù)治理通過云上的分布式服務(wù)總線實(shí)現(xiàn)。針對大規(guī)模微服務(wù)的云平臺應(yīng)用了云計(jì)算、虛擬化、微服務(wù)等相關(guān)技術(shù),電網(wǎng)云平臺中心基于微服務(wù)架構(gòu)的運(yùn)維工作發(fā)生了變化,并且對應(yīng)面臨同樣的問題,主要包括3個運(yùn)維技術(shù):

        1)云平臺上的微服務(wù)具有漂移特點(diǎn),對微服務(wù)云平臺監(jiān)控要求更高。

        傳統(tǒng)架構(gòu)下,業(yè)務(wù)應(yīng)用固化運(yùn)行在特定的機(jī)器資源之上,可以構(gòu)建資源和業(yè)務(wù)應(yīng)用的對應(yīng)關(guān)系。此外,業(yè)務(wù)的運(yùn)行方式相對簡單,變化不多,監(jiān)控運(yùn)維任務(wù)相較容易。然而在微服務(wù)架構(gòu)下,微服務(wù)應(yīng)用和資源環(huán)境不再存在固化的依賴關(guān)系,并且為了保證微服務(wù)應(yīng)用的運(yùn)行穩(wěn)定,需要根據(jù)資源特性和空閑情況進(jìn)行合適的資源調(diào)配,這就極大地增加了監(jiān)控的運(yùn)維成本以及復(fù)雜度。

        傳統(tǒng)監(jiān)控感知技術(shù)利用CMDB(配置管理數(shù)據(jù)庫)的構(gòu)建、資源和應(yīng)用側(cè)的指標(biāo)采集分析等手段[3-5],識別并管理業(yè)務(wù)應(yīng)用與資源環(huán)境之間的依賴關(guān)系,通過資源與應(yīng)用的監(jiān)控指標(biāo)也基本能及時發(fā)現(xiàn)業(yè)務(wù)異常。然而,傳統(tǒng)監(jiān)控方式需要對每一個微服務(wù)添加多個監(jiān)控模塊以收集不同監(jiān)控指標(biāo)數(shù)據(jù),造成了額外的運(yùn)營成本;并且傳統(tǒng)依靠資源設(shè)備指標(biāo)采集分析的單一監(jiān)控手段,既對云平臺有侵入式性能降低,也無法滿足微服務(wù)架構(gòu)業(yè)務(wù)的監(jiān)控需求;此外,無法探測并識別不斷動態(tài)變化的微服務(wù)運(yùn)行情況,對業(yè)務(wù)日志的關(guān)聯(lián)關(guān)系分析也缺少有效手段。

        2)微服務(wù)基于云平臺彈性資源特點(diǎn),對云資源保障要求更高。

        云資源是寶貴資源,為微服務(wù)提供資源的方式是“需多少用多少”。因此,云平臺必須根據(jù)微服務(wù)和業(yè)務(wù)應(yīng)用的資源使用情況,及時供給差額資源,回收閑置資源。

        傳統(tǒng)架構(gòu)下,由物理服務(wù)器等為業(yè)務(wù)應(yīng)用提供運(yùn)行資源,資源供給相對固定,當(dāng)業(yè)務(wù)應(yīng)用資源欠缺時,由信息調(diào)度統(tǒng)籌資源調(diào)度安排,資源調(diào)度不僅受運(yùn)維人員經(jīng)驗(yàn)影響,且耗時較長。

        在云平臺環(huán)境下,大量的業(yè)務(wù)應(yīng)用以分布式的方式分派給由底層云平臺計(jì)算資源組成的資源池中,需要云資源調(diào)度進(jìn)行橫向伸縮和縱向伸縮。橫向伸縮由云平臺自帶功能能夠?qū)崿F(xiàn)自動伸縮。但縱向伸縮涉及部署在云平臺資源上的微服務(wù)和應(yīng)用,當(dāng)縱向伸縮時,云主機(jī)需要啟停,從而導(dǎo)致微服務(wù)和應(yīng)用也需同步啟停。因此,對資源的精準(zhǔn)識別和智能資源調(diào)度策略要求更高。

        3)云平臺上的大規(guī)模微服務(wù)的調(diào)用復(fù)雜,微服務(wù)的故障分析難度更大。

        在傳統(tǒng)架構(gòu)下,業(yè)務(wù)應(yīng)用與服務(wù)之間的調(diào)用關(guān)系相對比較固化,一般按照展示層、應(yīng)用層、數(shù)據(jù)層、數(shù)據(jù)庫分層實(shí)現(xiàn),應(yīng)用服務(wù)與日志文件、數(shù)據(jù)架構(gòu)集中存儲管理,通過在資源和應(yīng)用側(cè)獲取業(yè)務(wù)運(yùn)行指標(biāo)數(shù)據(jù),有經(jīng)驗(yàn)的運(yùn)維人員也能快速完成故障定位。

        在云環(huán)境下,微服務(wù)架構(gòu)帶來了更優(yōu)的可擴(kuò)展性、獨(dú)立升級性、易維護(hù)性、業(yè)務(wù)健壯性等能力,大的業(yè)務(wù)按照功能職責(zé)拆分成獨(dú)立的服務(wù)應(yīng)用模塊,但隨著電網(wǎng)業(yè)務(wù)規(guī)模的不斷發(fā)展,相應(yīng)的業(yè)務(wù)服務(wù)數(shù)量也不斷增加,服務(wù)間的調(diào)用關(guān)系越來越錯綜復(fù)雜,給故障發(fā)現(xiàn)和快速定位帶來更大的挑戰(zhàn)。

        云平臺運(yùn)維工作的各項(xiàng)工作都是相互關(guān)聯(lián),監(jiān)控運(yùn)維為資源調(diào)度以及故障分析提供多方位監(jiān)控指標(biāo)數(shù)據(jù)支撐;故障分析工作不僅需要應(yīng)用側(cè)監(jiān)控?cái)?shù)據(jù),還需云資源的各項(xiàng)指標(biāo);資源調(diào)度同樣需要根據(jù)故障分析反饋的分析報(bào)告以及監(jiān)控?cái)?shù)據(jù)進(jìn)行精準(zhǔn)的資源調(diào)度?;谖⒎?wù)架構(gòu)的運(yùn)維工作之間的關(guān)系如圖2所示。

        圖2 各運(yùn)維工作之間的關(guān)系圖

        2 云平臺運(yùn)維的國內(nèi)外研究現(xiàn)狀

        隨著云計(jì)算的不斷深入應(yīng)用,企業(yè)核心業(yè)務(wù)向云端遷移帶來整個IT架構(gòu)變化,虛擬化技術(shù)在提升資源利用率的同時,也加大了運(yùn)維技術(shù)的復(fù)雜度。尤其是作為云服務(wù)的一個新興的分支,包含微服務(wù)業(yè)務(wù)的的云平臺運(yùn)維技術(shù)得到國內(nèi)外研究機(jī)構(gòu)的廣泛關(guān)注。

        2.1 國外研究現(xiàn)狀

        隨著越來越多的企業(yè)組織由傳統(tǒng)的C/S架構(gòu)向云計(jì)算、大數(shù)據(jù)、移動互聯(lián)網(wǎng)驅(qū)動下的動態(tài)靈活的云架構(gòu)轉(zhuǎn)型,對云管理平臺、云環(huán)境運(yùn)維的需求也出現(xiàn)了爆發(fā)性增長。為了應(yīng)對云環(huán)境的復(fù)雜性,簡化虛擬化環(huán)境的控制與管理,加速云資源的部署和擴(kuò)展,國外的相關(guān)研究機(jī)構(gòu)對云運(yùn)維管理技術(shù)已開展了深入研究。

        IBM公司在Tivoli[6]產(chǎn)品的基礎(chǔ)上推出適用于云環(huán)境的運(yùn)維管理解決方案,簡化云管理并實(shí)現(xiàn)數(shù)據(jù)中心自動化,向云運(yùn)維轉(zhuǎn)型。該解決方案是一套能夠幫助運(yùn)營團(tuán)隊(duì)有效管理混合環(huán)境并加速云服務(wù)交付的ITSM[7]解決方案,涉及了服務(wù)臺、應(yīng)用性能管理、系統(tǒng)和工作負(fù)載自動化、云管理、IT運(yùn)維和網(wǎng)絡(luò)管理、IT運(yùn)營分析等多個維度。

        BMC公司也在云運(yùn)維領(lǐng)域大力布局,研發(fā)的BMC Cloud Lifecycle Management[8]系統(tǒng)能夠幫助企業(yè)實(shí)現(xiàn)云服務(wù)的高速可靠交付,同時利用智能分析工具,提早預(yù)測并解決性能問題,監(jiān)控并預(yù)測資源消耗情況,以更加直觀的方式進(jìn)行運(yùn)維管理,提高資源利用率,幫助企業(yè)降低云服務(wù)成本。此外,BMC還推出TrueSight Pulse系統(tǒng)[9],是一個基于SaaS的實(shí)時的基礎(chǔ)設(shè)施監(jiān)控解決方案,能夠優(yōu)監(jiān)控并化所有的環(huán)境,包括移動網(wǎng)頁應(yīng)用、主機(jī)操作系統(tǒng)和云平臺。

        惠普公司采用SaaS模式研發(fā)運(yùn)維產(chǎn)品[10],其APM(應(yīng)用程序性能管理)解決方案提供靈活的交付模式,用戶可以選擇內(nèi)部、SaaS或混合環(huán)境的任意組合,以符合現(xiàn)有平臺和業(yè)務(wù)模式的需要。主要包括SaaS綜合Web應(yīng)用性能監(jiān)控服務(wù)HP AppPulse Active和針對移動應(yīng)用的性能監(jiān)管SaaS軟件HP AppPulse Mobile.

        除了云計(jì)算公司在自有運(yùn)維產(chǎn)品的研發(fā)布局以外,還有一部分開源的運(yùn)維工具,如Zabbix、Nagios、Ganglia和Zenoss Core等。作為一個企業(yè)級開源運(yùn)維平臺,Zabbix[11]擁有精致的WEB界面,不僅能夠采集多種監(jiān)控?cái)?shù)據(jù),例如分布式系統(tǒng)監(jiān)控?cái)?shù)據(jù)以及網(wǎng)絡(luò)監(jiān)控?cái)?shù)據(jù),還具有部署簡單的優(yōu)點(diǎn),提高運(yùn)維人員的工作效率,降低工業(yè)部署成本。同樣地,Nagios[12]作為一款開源的企業(yè)級監(jiān)控系統(tǒng),不僅能夠?qū)ο到y(tǒng)各項(xiàng)參數(shù)進(jìn)行監(jiān)控,同時可以對多種基本服務(wù)類型進(jìn)行監(jiān)控。此外由加州大學(xué)伯克利分校發(fā)起的非企業(yè)級開源工具,目的為了監(jiān)控網(wǎng)絡(luò)節(jié)點(diǎn)的Ganglia[13]也已被廣泛應(yīng)用到各種操作系統(tǒng)和處理器架構(gòu)上。

        國外研究機(jī)構(gòu)對云運(yùn)維技術(shù)的研發(fā)主要有兩種技術(shù)路線:一是將IT運(yùn)維軟件和服務(wù)的適用范圍擴(kuò)展到云環(huán)境、云平臺甚至混合云環(huán)境,二是將已有的IT運(yùn)維軟件結(jié)合云技術(shù)、云平臺以SaaS的形式提供給客戶。前者要求運(yùn)維廠商針對云計(jì)算環(huán)境、云基礎(chǔ)設(shè)施的特征,提升軟件對底層環(huán)境的兼容性,添加面向云環(huán)境的特性,克服虛擬環(huán)境、混合環(huán)境的復(fù)雜性給運(yùn)維軟件帶來的全新挑戰(zhàn)。后者則要求運(yùn)維廠商利用自有的數(shù)據(jù)中心或與公有云IaaS或PaaS提供商合作,基于互聯(lián)網(wǎng)為客戶交付運(yùn)維軟件的使用權(quán)。另外,目前流行的開源運(yùn)維工具等大部分來自國外,雖然這些開源產(chǎn)品功能非常強(qiáng)大,但對技術(shù)要求很高,且動態(tài)開發(fā)困難,對于應(yīng)用系統(tǒng)、微服務(wù)等業(yè)務(wù)監(jiān)控的難度較大。

        2.2 國內(nèi)研究現(xiàn)狀

        隨著云計(jì)算技術(shù)在國內(nèi)的引入和廣泛普及,云平臺的運(yùn)維技術(shù)也得到快速發(fā)展。包括傳統(tǒng)的云計(jì)算服務(wù)企業(yè)和小規(guī)模創(chuàng)新企業(yè),為國內(nèi)的云運(yùn)維轉(zhuǎn)型提供了更有益的實(shí)踐、更豐富的技術(shù)發(fā)展路徑。

        阿里巴巴在DevOps實(shí)踐中,提出智能化、自動化運(yùn)維[14],實(shí)現(xiàn)了故障智能預(yù)測以及自動化業(yè)務(wù)調(diào)度,提高了運(yùn)維效率。此外,還提供了無人值守發(fā)布、無人介入運(yùn)維等解決方案,實(shí)現(xiàn)了全天候發(fā)布、自動化周發(fā)布過千次、無人值守、小于半小時自動化上線驗(yàn)證、日常運(yùn)維工作無人介入式處理等目標(biāo)。

        華勝天成自主研發(fā)的天成云IaaS資源管理平臺從客戶建設(shè)IaaS云的業(yè)務(wù)需求出發(fā),提供全面的解決方案[15]。該管理平臺能對多樣的虛擬化資源池進(jìn)行統(tǒng)一管理,幫助客戶實(shí)現(xiàn)數(shù)據(jù)中心的資源可見、能力可控、服務(wù)實(shí)時和質(zhì)量可知。作為支撐數(shù)據(jù)中心云計(jì)算業(yè)務(wù)的核心系統(tǒng),天成云IaaS資源管理平臺具備資產(chǎn)管理、資源管理、服務(wù)管理、交付管理、監(jiān)控管理、計(jì)費(fèi)管理、報(bào)表管理以及系統(tǒng)管理能力,能實(shí)現(xiàn)針對云平臺的一站式運(yùn)維。

        廣通軟件公司的Broadview NCC[16]云虛擬化控制中心幫助大型企事業(yè)單位構(gòu)建私有云IaaS,為企業(yè)數(shù)據(jù)中心的云計(jì)算基礎(chǔ)架構(gòu)提供市場領(lǐng)先的IaaS私有云運(yùn)維管理解決方案,從而提高企業(yè)的業(yè)務(wù)服務(wù)質(zhì)量、降低業(yè)務(wù)運(yùn)行成本。

        此外,還有一些適用于中小企業(yè)的運(yùn)維管理云服務(wù)平臺。北塔軟件推出的“代維寶”運(yùn)維管理云服務(wù)平臺,采用創(chuàng)新的SaaS云服務(wù)模式,使中小企業(yè)的運(yùn)維成本更低、效率更高、管理更容易。銀信科技推出的中小企業(yè)云運(yùn)維平臺也是一個運(yùn)維管理云服務(wù)平臺,有助于實(shí)現(xiàn)基礎(chǔ)設(shè)施自動化,利用SaaS模式為中小企業(yè)提供低成本、高效率的IT基礎(chǔ)設(shè)施標(biāo)準(zhǔn)化、自動化運(yùn)維。

        總體上,國內(nèi)的云平臺運(yùn)維技術(shù)也與國外技術(shù)的兩條技術(shù)路徑類似。一部分運(yùn)維企業(yè)將運(yùn)維軟件和服務(wù)的適用范圍擴(kuò)展到云環(huán)境、混合云環(huán)境,提供綜合的云管理/運(yùn)維平臺,一部分運(yùn)維企業(yè)將已有的IT運(yùn)維軟件與云技術(shù)、云平臺相結(jié)合,最終以SaaS的服務(wù)模式交付給客戶。

        3 微服務(wù)云平臺運(yùn)維技術(shù)主要研究內(nèi)容

        3.1 微服務(wù)云平臺的監(jiān)控運(yùn)維

        云計(jì)算是需要按需分配計(jì)算資源,以提高應(yīng)用程序的可用性和可擴(kuò)展性,同時降低運(yùn)營成本的一種技術(shù)[17]。在這種情況下,需要進(jìn)行云資源管理以改善云,因此,對云資源的運(yùn)行狀態(tài)進(jìn)行監(jiān)控運(yùn)維顯得尤為重要[18]。

        在構(gòu)建大規(guī)模微服務(wù)的云平臺智能運(yùn)維過程中,為了清楚、完整、詳細(xì)地收集整理表達(dá)運(yùn)維知識,同時也為后續(xù)的云資源的動態(tài)調(diào)配以及故障分析等運(yùn)維工作,需要獲取微服務(wù)業(yè)務(wù)運(yùn)行的全方位數(shù)據(jù),識別并構(gòu)建業(yè)務(wù)與資源、業(yè)務(wù)與日志的關(guān)聯(lián)關(guān)系,及時掌握微服務(wù)業(yè)務(wù)的動態(tài)運(yùn)行情況。

        一個名為DARGOS[19]的分布式云監(jiān)控架構(gòu)被提出,其能夠滿足多租戶云平臺對物理資源和虛擬資源的監(jiān)控。此外,一個基于微服務(wù)的物聯(lián)網(wǎng)中間件分布式監(jiān)控系統(tǒng)[20]也被設(shè)計(jì)并實(shí)現(xiàn),該監(jiān)控系統(tǒng)不僅可以從主機(jī)和容器中獲取性能數(shù)據(jù),還可以收集從前端到微服務(wù)的調(diào)用以及日志,并進(jìn)行映射或重現(xiàn)。

        除了重新開發(fā)云平臺監(jiān)控工具與系統(tǒng),還有一些研究在現(xiàn)有監(jiān)控運(yùn)維系統(tǒng)進(jìn)行改進(jìn)以提高監(jiān)控運(yùn)維效率。

        基于OpenStack的監(jiān)控子系統(tǒng)采集到的監(jiān)控?cái)?shù)據(jù)特征以及局限性,針對基于微服務(wù)架構(gòu)的復(fù)雜依賴關(guān)系以及細(xì)粒度監(jiān)控問題,文獻(xiàn)[21]提出了解決方案并對其進(jìn)行評估,使得監(jiān)測的數(shù)據(jù)量與未檢測到的異常發(fā)生率大大降低。

        黑匣子監(jiān)控方法被用來跟蹤大規(guī)模的微服務(wù)[22],能夠?qū)軜?gòu)指標(biāo)、應(yīng)用性能和網(wǎng)絡(luò)性能等進(jìn)行監(jiān)控,并且實(shí)現(xiàn)了透明性。此外,將微服務(wù)日志與黑匣子方法結(jié)合[23],以被動追蹤方式進(jìn)行監(jiān)控,實(shí)現(xiàn)了應(yīng)用透明和非侵入性,減少了收集的監(jiān)控?cái)?shù)據(jù)的大小。

        國內(nèi)也有一些研究人員和企業(yè)對微服務(wù)架構(gòu)的監(jiān)控進(jìn)行研究與嘗試。文獻(xiàn)[24]以可擴(kuò)展全鏈路應(yīng)用服務(wù)監(jiān)控為目標(biāo),設(shè)計(jì)并實(shí)現(xiàn)了一種柔性微服務(wù)監(jiān)控框架,可用于監(jiān)控微服務(wù)狀態(tài)和不斷變化的服務(wù)負(fù)載,并且為了避免單點(diǎn)故障,使用 Raft 算法增強(qiáng)了數(shù)據(jù)一致性。文獻(xiàn)[25]公開了一種微服務(wù)應(yīng)用全鏈路性能實(shí)時監(jiān)測系統(tǒng)及其檢測方法。該方法通過數(shù)據(jù)收集、數(shù)據(jù)存儲、彈性伸縮配置和集成調(diào)度等模塊的協(xié)調(diào)運(yùn)作,實(shí)現(xiàn)對微服務(wù)性能的實(shí)時監(jiān)控與分析。

        企業(yè)對微服務(wù)架構(gòu)的云平臺監(jiān)控也進(jìn)行了嘗試,并且進(jìn)行了工業(yè)部署。國網(wǎng)山東省電力公司應(yīng)用一種基于微服務(wù)開發(fā)模式的 APM 應(yīng)用性能監(jiān)控平臺[26],利用APM探針采集監(jiān)控?cái)?shù)據(jù),目前仍在建設(shè)中。應(yīng)用性能管理架構(gòu)工作流程如圖3所示。

        圖3 應(yīng)用性能管理架構(gòu)

        盡管APM 應(yīng)用性能監(jiān)控平臺已經(jīng)被應(yīng)用到企業(yè)中,然而其具有侵入性的數(shù)據(jù)采集方式使其難以被廣泛接受。除利用APM探針采集數(shù)據(jù)以進(jìn)行監(jiān)控外,還有基于微服務(wù)的調(diào)用信息獲取監(jiān)控?cái)?shù)據(jù)以實(shí)現(xiàn)監(jiān)控的方法。

        文獻(xiàn)[27]公開了一種全鏈路監(jiān)控方法。該方法在接收到用戶發(fā)送http請求后,生成一個調(diào)用鏈邏輯ID用于標(biāo)記調(diào)用鏈。同時,利用微服務(wù)調(diào)用標(biāo)記對微服務(wù)的調(diào)用順序以及嵌套關(guān)系進(jìn)行標(biāo)記。最后,利用上述的調(diào)用鏈邏輯ID和微服務(wù)調(diào)用標(biāo)識生成監(jiān)控信息,對微服務(wù)架構(gòu)進(jìn)行全鏈路監(jiān)控。文獻(xiàn)[28]則通過發(fā)送給對應(yīng)微服務(wù)生成的調(diào)用請求信息,并利用調(diào)用請求信息生成對應(yīng)的監(jiān)控?cái)?shù)據(jù)標(biāo)識,根據(jù)監(jiān)控?cái)?shù)據(jù)標(biāo)識獲取微服務(wù)的業(yè)務(wù)日志,以實(shí)現(xiàn)業(yè)務(wù)監(jiān)控。

        除上述利用對調(diào)用等信息進(jìn)行標(biāo)記的方法,還有嵌入額外的監(jiān)控模塊進(jìn)行采集數(shù)據(jù)的方式。文獻(xiàn)[29]提出了一種基于微服務(wù)架構(gòu)的應(yīng)用監(jiān)控系統(tǒng),并定義了響應(yīng)時間、并發(fā)數(shù)和調(diào)用鏈相關(guān)監(jiān)控指標(biāo)。該系統(tǒng)采用集中分布式結(jié)構(gòu),包含客戶端與服務(wù)器端,其中客戶端嵌入監(jiān)控對象收集監(jiān)控?cái)?shù)據(jù);服務(wù)器端則匯總并分析監(jiān)控?cái)?shù)據(jù),建立邏輯回歸模型,確定調(diào)用鏈路在正常情況下的安全置信區(qū)域,并對異常情況進(jìn)行報(bào)警。以及通過部署獨(dú)立運(yùn)行的采集模塊與微服務(wù)通信,收集微服務(wù)之間接口調(diào)用的信息,并根據(jù)收集到的信息進(jìn)行微服務(wù)運(yùn)行狀態(tài)的分析,可以將微服務(wù)的監(jiān)控粒度細(xì)化到接口[30]。通過埋點(diǎn),收集服務(wù)間的相互調(diào)用關(guān)系的數(shù)據(jù),作為服務(wù)調(diào)用信息,對所述服務(wù)調(diào)用信息進(jìn)串聯(lián)和存儲,建立服務(wù)調(diào)用鏈路,通過可視化界面,展示所述服務(wù)調(diào)用鏈路,以實(shí)現(xiàn)對服務(wù)鏈路的監(jiān)控[31]。雖然基于微服務(wù)調(diào)用信息的方法可以實(shí)現(xiàn)全鏈路監(jiān)控,但其額外嵌入的采集模塊增加了企業(yè)部署的成本,同時影響系統(tǒng)性能。

        3.2 微服務(wù)云平臺的資源調(diào)度

        微服務(wù)架構(gòu)下,業(yè)務(wù)應(yīng)用被分派到底層資源池中進(jìn)行計(jì)算,然而資源配置的差異使得分配難度大大提高;同時,由于大規(guī)模微服務(wù)的應(yīng)用,也對資源調(diào)配的實(shí)時性有更高的要求。因此,自動監(jiān)測微服務(wù)的資源使用情況,做出即時的資源調(diào)度決策,實(shí)時資源調(diào)度作業(yè),可以保障云平臺上的微服務(wù)資源需求。云資源調(diào)度的基本流程框架如圖4所示。

        圖4 資源調(diào)度基本框架流程圖

        一些研究對傳統(tǒng)算法進(jìn)行改進(jìn),計(jì)算云資源均衡狀態(tài),進(jìn)而調(diào)度資源,以實(shí)現(xiàn)負(fù)載均衡[32-34]。文獻(xiàn)[32]改進(jìn)了傳統(tǒng)的蟻群算法,該算法能夠根據(jù)用戶任務(wù),計(jì)算云資源均衡、時間成本均衡和負(fù)載均衡方案,仿真實(shí)驗(yàn)證明了該算法可以有效地保持整個云系統(tǒng)平臺的運(yùn)載均衡。文獻(xiàn)[33]則改進(jìn)了傳統(tǒng)的遺傳算法,提出一種基于多精英協(xié)同進(jìn)化的遺傳算法,該方法具有更快的收斂速度以及更高的求解效率。同樣地,文獻(xiàn)[34]改進(jìn)了珊瑚礁優(yōu)化算法,融合better-offspring和multicrossover策略以提高算法收斂速度,該算法降低了調(diào)度成本的同時,增強(qiáng)了資源負(fù)載均衡。

        雖然,針對云資源調(diào)度問題研究較為成熟,并且很多研究通過改進(jìn)傳統(tǒng)方法就可以實(shí)現(xiàn)較好的效果。然而,微服務(wù)之間的復(fù)雜調(diào)用關(guān)系以及云資源配置差異,使得這些方法難以直接應(yīng)用于微服務(wù)架構(gòu)上。

        張鼎超等人設(shè)計(jì)的一個高性能計(jì)算環(huán)境的微服務(wù)運(yùn)維平臺[35]包含了服務(wù)部署、服務(wù)監(jiān)控和服務(wù)伸縮等功能。其中服務(wù)伸縮功能通過監(jiān)控多種指標(biāo)數(shù)據(jù)以及指標(biāo)負(fù)載計(jì)算縮放比例,進(jìn)而部署資源。文獻(xiàn)[36]根據(jù)訪問流量和各微服務(wù)之間的業(yè)務(wù)關(guān)系,準(zhǔn)確且全面地確定目標(biāo)擴(kuò)容微服務(wù),隨后對需擴(kuò)容微服務(wù)對應(yīng)的容器鏡像實(shí)例進(jìn)行擴(kuò)容,實(shí)現(xiàn)資源調(diào)配。由于該方法是依據(jù)微服務(wù)的訪問流量進(jìn)行計(jì)算,具有一定的準(zhǔn)確定性。文獻(xiàn)[37]首先抓取微服務(wù)監(jiān)控平臺的實(shí)時監(jiān)控的多元數(shù)據(jù)指標(biāo),并進(jìn)行預(yù)處理,隨后對處理后的數(shù)據(jù)進(jìn)行線性回歸的彈性伸縮容預(yù)測,并對預(yù)測結(jié)果進(jìn)行服務(wù)資源彈性伸縮處理策略匹配。

        除基于流量、業(yè)務(wù)關(guān)系等監(jiān)控?cái)?shù)據(jù)進(jìn)行微服務(wù)縮擴(kuò)容,還有基于負(fù)載指標(biāo)進(jìn)行微服務(wù)伸縮計(jì)算的方法。

        文獻(xiàn)[38]以非線性回歸為核心,通過分析當(dāng)前負(fù)載、已建立模型等進(jìn)行提前資源調(diào)配,以提高實(shí)時性,降低響應(yīng)時間,實(shí)現(xiàn)資源彈性供給。文獻(xiàn)[39]根據(jù)微服務(wù)的實(shí)例運(yùn)行數(shù)據(jù),得到預(yù)定義負(fù)荷程度指標(biāo)值并與預(yù)期值進(jìn)行對比以計(jì)算擴(kuò)容系數(shù),根據(jù)計(jì)算的縮擴(kuò)容系數(shù)調(diào)整微服務(wù)實(shí)例數(shù)。

        文獻(xiàn)[40]提出基于負(fù)載關(guān)系圖的微服務(wù)自動伸縮方法。該方法定義了用于描述各微服務(wù)之間的負(fù)載強(qiáng)度關(guān)系的微服務(wù)負(fù)載關(guān)系圖,并基于此圖計(jì)算各微服務(wù)的伸縮需求。該方法在面對大規(guī)模微服務(wù)情況下,仍能保持高效的并行性。然而,該方法的觸發(fā)條件使用閾值法,使得伸縮操作存在一定滯后性。

        上述是根據(jù)流量、負(fù)載等指標(biāo),對微服務(wù)進(jìn)行縮擴(kuò)容處理的方法,以達(dá)到負(fù)載均衡。還有針對微服務(wù)任務(wù)、應(yīng)用以及資源調(diào)配的方法,同樣可以滿足云平臺上的微服務(wù)資源需求。

        郭駿等人針對大規(guī)模微服務(wù)資源調(diào)度設(shè)計(jì)了新的調(diào)度系統(tǒng)[41],該系統(tǒng)的調(diào)度算法采用的模糊PID算法能夠較好地兼容該系統(tǒng)。

        文獻(xiàn)[42]提出通過將各個微服務(wù)訪問資源請求進(jìn)行排序,對優(yōu)先訪問的資源進(jìn)行鎖定的方式進(jìn)行控制的方法,減少了微服務(wù)訪問的隨機(jī)性以及由此引起的資源不合理利用。與之類似的,文獻(xiàn)[43]根據(jù)微服務(wù)的預(yù)定狀態(tài)信息和調(diào)度微服務(wù)的業(yè)務(wù)的權(quán)重確定微服務(wù)的重要性以及容量調(diào)節(jié)的緊迫性,進(jìn)而合理的選擇優(yōu)先進(jìn)行資源調(diào)度的微服務(wù),從而能夠準(zhǔn)確定位業(yè)務(wù)的瓶頸微服務(wù),及時優(yōu)化業(yè)務(wù)執(zhí)行效率。

        針對微服務(wù)任務(wù)調(diào)度問題,文獻(xiàn)[44]提出了一種面向交叉微服務(wù)鏈的任務(wù)調(diào)度算法,該算法融合蟻群算法與模擬退火算法,緩解了微服務(wù)調(diào)用鏈間出現(xiàn)的交叉資源競爭問題。

        微服務(wù)容器調(diào)度系統(tǒng)[45]從臨時節(jié)點(diǎn)中獲取待轉(zhuǎn)移微服務(wù)容器對節(jié)點(diǎn)運(yùn)行參數(shù)的需求信息,將該需求信息與對個目標(biāo)節(jié)點(diǎn)的實(shí)際運(yùn)行情況進(jìn)行匹配,隨后系統(tǒng)可以自動地進(jìn)行容器轉(zhuǎn)移,提高調(diào)度效率。

        文獻(xiàn)[46]提出了一種云環(huán)境下拓?fù)涓兄奈⒎?wù)應(yīng)用調(diào)度方法。該方法能夠?qū)ξ⒎?wù)應(yīng)用整體執(zhí)行全局調(diào)度,在考慮單個微服務(wù)的資源需求的同時,也兼顧了微服務(wù)整體拓?fù)涮卣鳎U狭思赫w資源利用率,降低了微服務(wù)應(yīng)用之間的通信成本。

        隨著機(jī)器學(xué)習(xí)的發(fā)展,利用機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,可以實(shí)現(xiàn)提前進(jìn)行資源調(diào)度,進(jìn)而提高資源利用率,增強(qiáng)負(fù)載平衡。

        機(jī)器學(xué)習(xí)能夠從大量數(shù)據(jù)中快速、準(zhǔn)確地提取有效特征的優(yōu)點(diǎn),使其可以被應(yīng)用到大規(guī)模微服務(wù)資源調(diào)配任務(wù)上。文獻(xiàn)[47]提出基于機(jī)器學(xué)習(xí)技術(shù)的微服務(wù)任務(wù)調(diào)度技術(shù),通過將數(shù)據(jù)位置及特征和計(jì)算任務(wù)類型或特征輸入任務(wù)調(diào)度器,以機(jī)器學(xué)習(xí)預(yù)測的方式給出任務(wù)運(yùn)行節(jié)點(diǎn),有效判斷相對優(yōu)化的任務(wù)執(zhí)行位置。

        神經(jīng)網(wǎng)絡(luò)的非線性、并行性、高運(yùn)算速度、高復(fù)雜度等特點(diǎn),意味著面對大規(guī)模微服務(wù)資源調(diào)度問題上具有更高的適用性。文獻(xiàn)[48]通過預(yù)先訓(xùn)練的第一神經(jīng)網(wǎng)絡(luò)模型預(yù)測新增微服務(wù)的資源懸崖和最優(yōu)資源分配區(qū),從而通過最優(yōu)資源分配區(qū)為新增的微服務(wù)的資源分配提供更準(zhǔn)確的參考,進(jìn)而實(shí)現(xiàn)資源負(fù)載均衡。

        3.3 微服務(wù)云平臺的故障分析

        故障診斷技術(shù)是支撐云平臺實(shí)現(xiàn)智能運(yùn)維的核心,是利用多種手段與技術(shù),對故障信息進(jìn)行分析、推理的過程。一個完整的故障診斷過程首先通過感知技術(shù)獲取被診斷系統(tǒng)原始信息;隨后利用特征工程對原始信息集合進(jìn)行特征提取,得到有利于診斷故障的有效信息集合;對有效信息進(jìn)一步處理,計(jì)算出能夠反映故障模式的不變特征量;最后基于以上信息進(jìn)行故障定位、成因分析等工作,進(jìn)而確定被診斷系統(tǒng)狀態(tài),定位系統(tǒng)故障位置,反饋系統(tǒng)故障成因,提供系統(tǒng)故障解決策略。完整的故障診斷基本過程如圖5所示。其中檢測信息部分可以由監(jiān)控系統(tǒng)提供監(jiān)控?cái)?shù)據(jù),以及傳感器技術(shù)提供原始信息。故障診斷技術(shù)的重點(diǎn)則集中在診斷結(jié)論部分,即故障分析。

        圖5 故障診斷基本過程示意圖

        隨著大規(guī)模微服務(wù)應(yīng)用的上云運(yùn)行,系統(tǒng)軟硬件形態(tài)、運(yùn)行規(guī)模、系統(tǒng)結(jié)構(gòu)與運(yùn)行方式等日益多樣化和復(fù)雜化,業(yè)務(wù)產(chǎn)生的故障隱患多種多樣,業(yè)務(wù)系統(tǒng)節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間的關(guān)聯(lián)影響越來越多變。這使得運(yùn)維人員無法在大量監(jiān)控告警事件中快速、準(zhǔn)確地分析確定故障位置、故障原因,從而影響故障處理的實(shí)時性和準(zhǔn)確性。

        目前,微服務(wù)故障檢測主要包括基于軌跡或圖拓?fù)浞?、基于日志文件法和基于監(jiān)控?cái)?shù)據(jù)度量法,如圖6所示。其中執(zhí)行軌跡、關(guān)系依賴圖、故障傳播圖等等均屬于基于圖或拓?fù)浞椒?,其?yōu)勢在于能夠利用拓?fù)鋪砻枋鑫⒎?wù)之間的相關(guān)聯(lián)系,并且圖的拓?fù)浣Y(jié)構(gòu)適合大規(guī)模微服務(wù)應(yīng)用。

        圖6 故障檢測算法分類圖

        文獻(xiàn)[49-50]均基于執(zhí)行軌跡進(jìn)行微服務(wù)故障診斷。主要區(qū)別在于文獻(xiàn)[49]收集服務(wù)組件的請求處理流的執(zhí)行軌跡,而文獻(xiàn)[50]則采用向系統(tǒng)注入故障并收集故障執(zhí)行軌跡的方式;二者使用不同的編輯距離分別評估異常程度與相似程度,最終依據(jù)各自執(zhí)行軌跡與評估結(jié)果,進(jìn)行故障定位與故障成因分析。

        服務(wù)關(guān)系依賴圖可以很好地呈現(xiàn)各微服務(wù)之間的依賴關(guān)系,為運(yùn)維人員提供清晰的可視化效果,幫助運(yùn)維人員快速、準(zhǔn)確地發(fā)現(xiàn)異常、故障并進(jìn)行解決[51]。文獻(xiàn)[52]采用先判異常后定位的方式進(jìn)行故障根因定位。該方法首先獲取微服務(wù)的性能指標(biāo)數(shù)據(jù),并判斷是否出現(xiàn)異常;隨后構(gòu)建微服務(wù)依賴圖,并采用反向追蹤根因分析算法進(jìn)行異常評分并排序,實(shí)現(xiàn)故障根因定位。同樣地,文獻(xiàn)[53]基于服務(wù)依賴圖刻畫監(jiān)測到服務(wù)間的異常傳播,利用回歸分析建立異常服務(wù)集合;隨后利用圖中心度算法尋找故障服務(wù),并定位異常API。

        除此之外,基于故障傳播圖與基于圖譜進(jìn)行故障定位也有一些研究。基于故障傳播圖的微服務(wù)故障根因定位方法首先通過相關(guān)性分析構(gòu)建故障傳播圖,隨后利用改進(jìn)的隨機(jī)游走算法進(jìn)行搜索故障節(jié)點(diǎn),實(shí)現(xiàn)微服務(wù)故障定位[54]?;趫D譜分析的微服務(wù)故障定位方法在微服務(wù)運(yùn)行時實(shí)時更新維護(hù)圖譜,其中圖譜包括運(yùn)行架構(gòu)、服務(wù)部署、服務(wù)調(diào)用以及監(jiān)控?cái)?shù)據(jù)等等;在故障發(fā)生時,分析節(jié)點(diǎn)的監(jiān)控?cái)?shù)據(jù)并計(jì)算異常度,可以得到故障根因[55]。

        基于日志法主要是收集日志文件,從中提取大量的日志告警數(shù)據(jù)信息,建立日志信息分析模型,并分析故障原因。

        使用機(jī)器學(xué)習(xí)方法基于歷史日志訓(xùn)練故障分類模型,以進(jìn)行故障判斷可以提高運(yùn)維自動化能力。文獻(xiàn)[56]將微服務(wù)日志數(shù)據(jù)按照時間間隔劃分,隨后進(jìn)行特征提取,并選擇樸素貝葉斯、支持向量機(jī)與隨機(jī)森林3種分類算法訓(xùn)練,得到故障預(yù)測模型,證明了機(jī)器學(xué)習(xí)在故障分析任務(wù)上的可行性。為了避免對每一個微服務(wù)進(jìn)行故障分析判斷,提高資源利用率,降低故障分析成本;使用拓?fù)錂z測模型對微服務(wù)進(jìn)行故障可能性排序,利用機(jī)器學(xué)習(xí)方法基于可能發(fā)生故障的微服務(wù)的日志進(jìn)行訓(xùn)練,得到微服務(wù)異常判斷模型[57]。

        基于日志信息的方法與其他方法進(jìn)行結(jié)合同樣可以實(shí)現(xiàn)故障定位與分析。文獻(xiàn)[58]首先利用包含異常的日志信息生成故障項(xiàng)目庫,隨后依賴對微服務(wù)的權(quán)重以及故障項(xiàng)目庫得到頻繁故障項(xiàng)目集合,利用頻繁故障項(xiàng)目集構(gòu)建故障樹,實(shí)現(xiàn)快速故障定位。文獻(xiàn)[59]通過構(gòu)建完善的調(diào)用鏈跟蹤體系,收集含有業(yè)務(wù)請求調(diào)用鏈信息的日志信息,隨后基于調(diào)用鏈維度對日志信息進(jìn)行聚合分析,結(jié)合實(shí)際情形給出相應(yīng)分析策略,提高微服務(wù)系統(tǒng)的服務(wù)異常故障定位準(zhǔn)確度。

        基于監(jiān)控?cái)?shù)據(jù)度量法則是根據(jù)監(jiān)控系統(tǒng)給出的監(jiān)控?cái)?shù)據(jù)信息,通過特定的算法分析時段內(nèi)的系統(tǒng)性能,從而判斷故障。方法[60]通過對業(yè)務(wù)進(jìn)行異常檢測計(jì)算異常時間窗口,并基于異常窗口內(nèi)的調(diào)用鏈數(shù)據(jù)進(jìn)行故障定位分析,實(shí)現(xiàn)故障根因自動定位。將神經(jīng)網(wǎng)絡(luò)與監(jiān)控?cái)?shù)據(jù)度量相結(jié)合,可以充分利用神經(jīng)網(wǎng)絡(luò)高復(fù)雜度非線性映射能力,故障分析時使用訓(xùn)練好的故障診斷模型可以對得到的異常數(shù)據(jù)指標(biāo)圖進(jìn)行快速、準(zhǔn)確的診斷[61]。

        除上述方法外,隨著深度學(xué)習(xí)的發(fā)展,其針對大規(guī)模數(shù)據(jù)的強(qiáng)特征提取能力,非常適合大規(guī)模微服務(wù)應(yīng)用所產(chǎn)生多模態(tài)數(shù)據(jù)。文獻(xiàn)[62]首次將深度學(xué)習(xí)方法引進(jìn)微服務(wù)故障診斷中。該方法利用深度學(xué)習(xí)方法從已有的數(shù)據(jù)中進(jìn)行學(xué)習(xí)發(fā)生故障的特征信息并建立模型,仿真實(shí)驗(yàn)也證明了深度學(xué)習(xí)方法在微服務(wù)故障監(jiān)測中的可行性。

        4 微服務(wù)云平臺運(yùn)維工作與相關(guān)技術(shù)發(fā)展趨勢

        4.1 微服務(wù)云平臺運(yùn)維工作

        隨著云計(jì)算技術(shù)的普及,以及企業(yè)的大規(guī)模微服務(wù)業(yè)務(wù)的應(yīng)用,基于工業(yè)需求以及市場需要,微服務(wù)云平臺運(yùn)維工作的發(fā)展方向應(yīng)向著智能化、自動化、可視化等方向發(fā)展,結(jié)合國內(nèi)外研究現(xiàn)狀與主要研究內(nèi)容,可以將微服務(wù)云平臺運(yùn)維工作發(fā)展趨勢概括如下。

        1)運(yùn)維智能化:云計(jì)算的迅猛發(fā)展驅(qū)使IT架構(gòu)中云架構(gòu)和傳統(tǒng)架構(gòu)走向融合。傳統(tǒng)的運(yùn)維服務(wù)難以滿足新式架構(gòu),使得運(yùn)維服務(wù)需要從單純的人工模式發(fā)展為智能模式。此外隨著IT系統(tǒng)越來越復(fù)雜和IT設(shè)備的多樣化,傳統(tǒng)運(yùn)維“救火式”的被動故障處理能力已經(jīng)嚴(yán)重影響了企業(yè)業(yè)務(wù)的發(fā)展,只有智能化的運(yùn)維方式才能維持企業(yè)信息系統(tǒng)的安全、穩(wěn)定運(yùn)行。通過預(yù)測分析模型,自主定位問題、發(fā)現(xiàn)問題,綜合分析之后上報(bào)信息,形成高度智能化的運(yùn)維體系,可以極大地提高IT運(yùn)維效率,保障企業(yè)云平臺運(yùn)行穩(wěn)定。

        2)運(yùn)維自動化:為了能夠快速響應(yīng)業(yè)務(wù)用戶需求,并滿足云計(jì)算時代的大規(guī)模微服務(wù)業(yè)務(wù)變革需求,實(shí)現(xiàn)運(yùn)維自動化是必不可少的。自動化技術(shù)不但能幫助IT人員從固定、煩瑣的日常維護(hù)工作中解放出來,提高IT人員的工作效率;還可以使整個運(yùn)維流程變得規(guī)范、高效,提高IT系統(tǒng)的運(yùn)維效率,為企業(yè)的業(yè)務(wù)變革提供良好的技術(shù)手段和基礎(chǔ)。

        3)運(yùn)維可視化:云平臺運(yùn)維不論是從基礎(chǔ)環(huán)境監(jiān)控,還是業(yè)務(wù)優(yōu)化管理上來說都面臨著一系列新的挑戰(zhàn)。運(yùn)維可視化可以做到屏蔽運(yùn)維提供的服務(wù)背后的所有實(shí)現(xiàn)細(xì)節(jié),而向用戶提供一種高效、一致性、透明化、用戶友好的服務(wù)。運(yùn)維的自動化最終要實(shí)現(xiàn)可視化,復(fù)雜的運(yùn)維工作流必須通過可視化來表達(dá),可視化后的自動化才能讓所有人理解一致、執(zhí)行一致、結(jié)果一致。

        4)運(yùn)維多樣化:云平臺運(yùn)維工作需要結(jié)合多個運(yùn)維技術(shù),單一的運(yùn)維手段難以滿足企業(yè)需求。目前,工業(yè)界已有很多單一化的IT運(yùn)維產(chǎn)品,然而在復(fù)雜的云環(huán)境下無法滿足IT運(yùn)維的各類需求。因此,融合多種運(yùn)維手段,將各種運(yùn)維工作進(jìn)行聯(lián)動,構(gòu)成具有相互反饋的環(huán)狀結(jié)構(gòu),可以有效地提高云平臺運(yùn)維效率,保證系統(tǒng)健康。

        5)運(yùn)維標(biāo)準(zhǔn)化:隨著云平臺運(yùn)維系統(tǒng)的不斷推出,越來越多的運(yùn)維手段也不斷被提出,也就意味著越來越多樣的接口被應(yīng)用。在企業(yè)啟用運(yùn)維系統(tǒng)時,需要針對實(shí)際的云計(jì)算環(huán)境以及基礎(chǔ)設(shè)施特征對運(yùn)維系統(tǒng)進(jìn)行兼容性改進(jìn),當(dāng)?shù)讓迎h(huán)境發(fā)生改變,就需要對運(yùn)維系統(tǒng)進(jìn)行升級以兼容新的云環(huán)境,這就額外增加了運(yùn)維成本。因此,形成通用的運(yùn)維標(biāo)準(zhǔn),不僅可以降低運(yùn)維成本,還可以提高運(yùn)維手段的創(chuàng)新。

        4.2 微服務(wù)云平臺運(yùn)維技術(shù)

        結(jié)合微服務(wù)云平臺運(yùn)維工作的發(fā)展趨勢以及重點(diǎn)運(yùn)維技術(shù)的研究情況,分別針對微服務(wù)云上全鏈路監(jiān)控、微服務(wù)云資源保障以及微服務(wù)復(fù)雜故障分析3個重點(diǎn)運(yùn)維技術(shù)的發(fā)展趨勢進(jìn)行展望。

        1)全鏈路監(jiān)控不僅為了滿足本身對整個云平臺的監(jiān)控需求,還為資源調(diào)度、故障分析等運(yùn)維工作提供數(shù)據(jù)支撐,應(yīng)以多維度、多指標(biāo)、多角度進(jìn)行全鏈路監(jiān)控;此外,傳統(tǒng)監(jiān)控手段往往需要使用探針進(jìn)行侵入式監(jiān)控,不僅會降低性能,還提高落地成本。因此,監(jiān)控運(yùn)維可以以多維數(shù)據(jù)監(jiān)控、全鏈路感知動態(tài)監(jiān)控、非侵入式旁路監(jiān)控3個方面為目標(biāo)。

        2)資源調(diào)度的目的是將異構(gòu)多云的場景進(jìn)行統(tǒng)籌整合,未來可以將機(jī)器學(xué)習(xí)方法與傳統(tǒng)算法進(jìn)行融合,結(jié)合監(jiān)控指標(biāo)數(shù)據(jù)、用戶請求、資源配置等多因素,通過匹配資源需求與資源供給,實(shí)現(xiàn)微服務(wù)任務(wù)、實(shí)例數(shù)、計(jì)算資源動態(tài)調(diào)整,以達(dá)到負(fù)載均衡,降低響應(yīng)時間。

        3)故障分析是通過現(xiàn)有的信息進(jìn)行系統(tǒng)的故障診斷與定位,并對故障進(jìn)行清理保障云平臺運(yùn)行正常。傳統(tǒng)的人工故障分析,往往處于被動分析狀態(tài),并且大規(guī)模微服務(wù)應(yīng)用也使得定位更加困難。因此,主動式故障分析將是未來的發(fā)展趨勢,建立故障預(yù)測模型,利用已有信息進(jìn)行故障定位,判斷故障類型并提供故障解決方案,實(shí)現(xiàn)故障分析自動化、智能化,提高故障分析實(shí)時性與準(zhǔn)確性,保障云平臺運(yùn)維效率。

        5 結(jié)束語

        綜上所述,微服務(wù)云平臺運(yùn)維工作主要包括微服務(wù)監(jiān)控運(yùn)維技術(shù)、微服務(wù)云資源調(diào)配以及微服務(wù)故障分析。監(jiān)控運(yùn)維技術(shù)為后面二者提供高質(zhì)量,多維度的監(jiān)控?cái)?shù)據(jù)支撐;云資源調(diào)配則依據(jù)資源監(jiān)控?cái)?shù)據(jù)以及故障分析反饋決策進(jìn)行橫縱資源調(diào)整;故障分析依靠運(yùn)行監(jiān)控?cái)?shù)據(jù)以及資源調(diào)度情況,實(shí)現(xiàn)故障定位與處理。

        隨著人工智能、云計(jì)算技術(shù)、物聯(lián)網(wǎng)技術(shù)等多種技術(shù)的發(fā)展,以上3種重要的運(yùn)維手段融合多種技術(shù),并通過組成相互反饋的循環(huán)結(jié)構(gòu),形成完整的運(yùn)維系統(tǒng),實(shí)現(xiàn)運(yùn)維工作智能化、自動化、可視化、多樣化以及標(biāo)準(zhǔn)化。未來將極大地保障微服務(wù)架構(gòu)下云平臺的運(yùn)維能力,支撐服務(wù)應(yīng)用穩(wěn)定高效運(yùn)行,提高各企業(yè)的IT運(yùn)維效率。

        猜你喜歡
        運(yùn)維架構(gòu)監(jiān)控
        基于FPGA的RNN硬件加速架構(gòu)
        The Great Barrier Reef shows coral comeback
        功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實(shí)踐
        汽車工程(2021年12期)2021-03-08 02:34:30
        運(yùn)維技術(shù)研發(fā)決策中ITSS運(yùn)維成熟度模型應(yīng)用初探
        你被監(jiān)控了嗎?
        Zabbix在ATS系統(tǒng)集中監(jiān)控中的應(yīng)用
        風(fēng)電運(yùn)維困局
        能源(2018年8期)2018-09-21 07:57:24
        雜亂無章的光伏運(yùn)維 百億市場如何成長
        能源(2017年11期)2017-12-13 08:12:25
        看監(jiān)控?cái)z像機(jī)的4K之道
        LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實(shí)現(xiàn)
        青青草一级视频在线观看| 国产精品久久av高潮呻吟| 美女扒开腿露内裤免费看| 精品国产综合区久久久久久| 一本色道久久99一综合| 精品少妇大屁股白浆无码| 人妻尤物娇呻雪白丰挺| 国产精品三区四区亚洲av| 妇女bbbb插插插视频| 97超级碰碰人妻中文字幕| 无码欧亚熟妇人妻AV在线外遇 | 免费人成年激情视频在线观看| 亚洲av无码男人的天堂在线| 国产精品麻豆A啊在线观看| 久久精品国产亚洲av日韩一| 久久丝袜熟女av一区二区| 蜜臀性色av免费| 粗大的内捧猛烈进出在线视频| 天堂岛国精品在线观看一区二区 | 精品久久久久久亚洲综合网| 亚洲男人第一无码av网站| 三级国产女主播在线观看| 熟女系列丰满熟妇av| 久久综合国产精品一区二区| 小雪好紧好滑好湿好爽视频| 亚洲一本到无码av中文字幕| 中文字幕久久久久久久系列| 99久久精品人妻一区二区三区| 色综合久久久无码中文字幕| 欧美俄罗斯乱妇| 亚洲国产综合精品久久av| 穿着白丝啪啪的av网站| 国产办公室沙发系列高清| 亚洲红怡院| 最新中文字幕乱码在线| 久久久久久av无码免费网站下载| 69久久夜色精品国产69| 亚洲国产一区二区三区在观看| 国产自产二区三区精品| 无码吃奶揉捏奶头高潮视频| 一区二区三区不卡在线|