佚名
Gartner報(bào)告顯示,預(yù)計(jì)到2021年,APM(Application Performance Managment)的市場(chǎng)容量將達(dá)到50億美元。在中國(guó),雖然APM的市場(chǎng)份額并不高,但隨著互聯(lián)網(wǎng)及移動(dòng)應(yīng)用的快速增長(zhǎng),中國(guó)有望成為全球最大的應(yīng)用市場(chǎng)。毫無(wú)疑問(wèn),應(yīng)用性能對(duì)業(yè)績(jī)的影響越來(lái)越大。用戶(hù)依靠應(yīng)用接觸客戶(hù),構(gòu)建和銷(xiāo)售產(chǎn)品,提供服務(wù),自動(dòng)化業(yè)務(wù)流程,以及執(zhí)行幾乎其他所有關(guān)鍵業(yè)務(wù)任務(wù)。對(duì)于很多團(tuán)隊(duì)來(lái)說(shuō),應(yīng)用性能和可用性最能反映其成功與否。
應(yīng)用性能及體驗(yàn)差包含多種原因
在開(kāi)發(fā)和測(cè)試階段,開(kāi)發(fā)人員和測(cè)試人員可以在預(yù)生產(chǎn)環(huán)境中利用APM,來(lái)檢測(cè)和解決生命周期早期的代碼問(wèn)題,確保它們不會(huì)影響生產(chǎn)。一旦代碼進(jìn)入生產(chǎn)過(guò)程中,APM工具集對(duì)于跟蹤生產(chǎn)基礎(chǔ)設(shè)施的變更、監(jiān)控支持服務(wù)等級(jí)協(xié)議(SLA)的交付級(jí)別,以及評(píng)估新功能的成功,進(jìn)而進(jìn)行更明智的路線(xiàn)圖規(guī)劃都是非常寶貴的。
當(dāng)應(yīng)用出現(xiàn)問(wèn)題時(shí),IT團(tuán)隊(duì)必須快速檢測(cè)、隔離并修復(fù)問(wèn)題。但是,使用傳統(tǒng)的性能管理工具,要隔離和修復(fù)性能問(wèn)題需要幾天甚至幾周的時(shí)間,而通常是在終端用戶(hù)報(bào)告問(wèn)題后才發(fā)現(xiàn)。
當(dāng)一個(gè)關(guān)鍵業(yè)務(wù)應(yīng)用關(guān)閉或表現(xiàn)不佳時(shí),團(tuán)隊(duì)常常因指責(zé)其他團(tuán)隊(duì)(例如開(kāi)發(fā)、網(wǎng)絡(luò)和系統(tǒng))或第三方供應(yīng)商而失去寶貴的時(shí)間。實(shí)際上,它往往是基于一維度監(jiān)控工具的不完整信息的邏輯性演繹推理的結(jié)果。系統(tǒng)團(tuán)隊(duì)認(rèn)為所有服務(wù)器都是最新的并以最佳狀態(tài)運(yùn)行;網(wǎng)絡(luò)團(tuán)隊(duì)報(bào)告稱(chēng),帶寬利用率遠(yuǎn)沒(méi)有達(dá)到峰值,而延遲很低;開(kāi)發(fā)團(tuán)隊(duì)表示,自定義應(yīng)用昨天運(yùn)行良好,并沒(méi)有引入最近的代碼更改。一個(gè)全面的 APM 解決方案應(yīng)該為整個(gè)團(tuán)隊(duì)提供整個(gè)應(yīng)用和基礎(chǔ)架構(gòu)的端到端“全景”視圖,包括所有事務(wù)和組件。因?yàn)?,不完整的?shù)據(jù)會(huì)產(chǎn)生錯(cuò)誤的答案。
因此,APM 解決方案需要為每個(gè)用戶(hù)、每個(gè)事務(wù)、所有時(shí)間和細(xì)節(jié)收集關(guān)于應(yīng)用組件其性能的數(shù)據(jù)。若要了解全局,APM 解決方案需要監(jiān)控覆蓋所有應(yīng)用組件的性能指標(biāo),如 Java、.NET、Web 服務(wù)器、數(shù)據(jù)庫(kù)、操作系統(tǒng)和存儲(chǔ)等。
全面了解您的應(yīng)用性能
根據(jù) Gartner 的數(shù)據(jù),到2020年,70%的APM套件技術(shù)買(mǎi)家都不會(huì)是傳統(tǒng)IT運(yùn)營(yíng)組織。當(dāng)今復(fù)雜的應(yīng)用和基礎(chǔ)架構(gòu)需要一個(gè)可審視應(yīng)用交付鏈所有關(guān)鍵環(huán)節(jié)的APM解決方案。無(wú)論您在推出新的應(yīng)用、對(duì)應(yīng)用進(jìn)行容器化、合并或虛擬化數(shù)據(jù)中心,還是遷移到云環(huán)境,管理應(yīng)用性能都需要進(jìn)行全面了解,包括以下幾個(gè)方面。
數(shù)字體驗(yàn)監(jiān)控:數(shù)字代理(人類(lèi)或機(jī)器)與應(yīng)用交互時(shí)實(shí)際體驗(yàn)到的可用性和性能。無(wú)論是使用 Web 還是厚客戶(hù)端應(yīng)用,不管它們位于本地、遍布全球,還是用于移動(dòng)設(shè)備,您都必須能夠監(jiān)控應(yīng)用性能的最終度量標(biāo)準(zhǔn)并進(jìn)行故障排除:數(shù)字體驗(yàn)。
應(yīng)用發(fā)現(xiàn)、跟蹤和診斷:數(shù)字代理(人類(lèi)或機(jī)器)認(rèn)為的單個(gè)操作涉及許多不同應(yīng)用組件的許多不同子事務(wù),比如不同的應(yīng)用服務(wù)器或數(shù)據(jù)庫(kù)。您如何跟蹤、監(jiān)控這些關(guān)鍵事務(wù)的性能并進(jìn)行故障排除,將其相互關(guān)聯(lián),以及深入了解應(yīng)用的各個(gè)組件?
應(yīng)用分析:使用統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、模式識(shí)別或數(shù)學(xué)理論自動(dòng)檢測(cè)事務(wù)性能問(wèn)題的根源。這是在現(xiàn)代復(fù)雜環(huán)境中APM工具的核心所在,在這樣的環(huán)境下應(yīng)用頻繁地更改,使用微服務(wù)構(gòu)建,并且具有彈性、瞬態(tài)并高度虛擬化。
基礎(chǔ)架構(gòu)和網(wǎng)絡(luò)性能管理:底層 IT 基礎(chǔ)架構(gòu)和網(wǎng)絡(luò)的性能和可用性如何影響應(yīng)用的性能? IT 基礎(chǔ)架構(gòu)的存在是有理由的:交付應(yīng)用。若要真正理解整體應(yīng)用性能,必須通過(guò)應(yīng)用的視角來(lái)管理基礎(chǔ)架構(gòu)。尤其網(wǎng)絡(luò)還是一個(gè)重要的組成部分,它的重要性隨著云、移動(dòng)、SDN(軟件定義網(wǎng)絡(luò))和網(wǎng)絡(luò)虛擬化趨勢(shì)的發(fā)展而繼續(xù)增長(zhǎng)。
應(yīng)用大數(shù)據(jù)技術(shù)發(fā)揮APM潛力
看得出,APM 的全部潛力在于開(kāi)發(fā)大量關(guān)于所有事務(wù)的性能和行為的詳細(xì)數(shù)據(jù)。大數(shù)據(jù)功能遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)的統(tǒng)計(jì)性能總結(jié),它支持保留大量事務(wù)數(shù)據(jù)。這些功能還支持功能強(qiáng)大的非結(jié)構(gòu)化搜索,使 IT 能夠快速檢測(cè)模式,查找和分析特定事務(wù),最后解決問(wèn)題。憑借這些功能,IT團(tuán)隊(duì)可以快速查明性能問(wèn)題的根本原因,并將對(duì)終端用戶(hù)和業(yè)務(wù)的影響最小化。
全面管理應(yīng)用性能所需的數(shù)據(jù)量很快超出了傳統(tǒng)性能管理解決方案的承受能力。虛擬化、容器化、動(dòng)態(tài)的基礎(chǔ)架構(gòu)和高度分布式的應(yīng)用架構(gòu)加劇數(shù)據(jù)的爆炸式增長(zhǎng)。分析對(duì)于確定與某個(gè)問(wèn)題相關(guān)的特定數(shù)據(jù)或者指出一個(gè)正在出現(xiàn)的問(wèn)題非常重要。以前,性能管理解決方案通過(guò)采樣、平均或減少所收集數(shù)據(jù)的粒度來(lái)處理這些數(shù)據(jù)量。這些技術(shù)沒(méi)能為IT團(tuán)隊(duì)提供足夠的數(shù)據(jù)和洞察,無(wú)法為每個(gè)用戶(hù)、每個(gè)事務(wù)、所有時(shí)間跟蹤整個(gè)應(yīng)用性能情況。
相比之下,大數(shù)據(jù)技術(shù)使應(yīng)用的支持團(tuán)隊(duì)、開(kāi)發(fā)人員和操作人員能夠挖掘大量的高保真數(shù)據(jù),以提取有意義的信息。其結(jié)果是加快故障排除、延長(zhǎng)正常運(yùn)行時(shí)間,并有機(jī)會(huì)在業(yè)務(wù)受影響之前主動(dòng)識(shí)別應(yīng)用問(wèn)題。