“從‘被動(dòng)式’運(yùn)維的總是挨踢,到‘主動(dòng)式’運(yùn)維的少挨踢,再到現(xiàn)在已經(jīng)破繭而出的‘預(yù)見(jiàn)式’運(yùn)維不挨踢,我們IT 運(yùn)維人終于要熬出頭了!……”
真期待??!某單位資深運(yùn)維人老彭在這次全國(guó)IT 運(yùn)維大會(huì)上算是開(kāi)了眼,終于看到了希望。那么是什么內(nèi)容讓老彭如此激動(dòng)呢?
現(xiàn)在的運(yùn)維環(huán)境越來(lái)越復(fù)雜,對(duì)運(yùn)維人員的要求也越來(lái)越高。主要體現(xiàn)在這幾個(gè)方面:一是在架構(gòu)層面,從雙態(tài)架構(gòu)(傳統(tǒng)+私有云)到混態(tài)IT(傳統(tǒng)+私有云+公有云),再到異態(tài)IT(傳統(tǒng)1+傳統(tǒng)2+多私有云+多公有云);二是在工作層面,DevOps、AIOps、XOps 層出不窮;三是在組織層面,ITIL、ITSM、VERISM 等服務(wù)管理類新版本、新模式不斷更新;四是在業(yè)務(wù)層面,要求(資源)多、(響應(yīng))快、(體驗(yàn))好、(成本)省成為主流。這種因端到端SLA(南北向信息流)、資源池化(東西向信息流)、混合IT(東西南北向交叉信息流)而導(dǎo)致的“運(yùn)維黑盒”現(xiàn)象越發(fā)突顯。
而大家都知道傳統(tǒng)的被動(dòng)式運(yùn)維的弊端是總是客戶先發(fā)現(xiàn)出故障了,然后報(bào)障處理,客戶體驗(yàn)非常差。后來(lái)演進(jìn)到主動(dòng)式運(yùn)維,終于可以比客戶早發(fā)現(xiàn)故障了,但其局限性是故障還是發(fā)生了,依然會(huì)影響客戶的正常使用,客戶只是被主動(dòng)告知不能用了,算體驗(yàn)略有改善。因此迫切呼喚適應(yīng)新環(huán)境的新運(yùn)維模式。
令人欣喜的是,已經(jīng)有先導(dǎo)運(yùn)維人開(kāi)始嘗試?yán)酶鞣N智能工具,做到提前預(yù)見(jiàn)到隱患,并在隱患未轉(zhuǎn)化為實(shí)際故障時(shí)就進(jìn)行了處理,使得用戶都感覺(jué)不到曾經(jīng)發(fā)生過(guò)什么,只感覺(jué)一直可以正常使用。這種運(yùn)維方式尚沒(méi)有準(zhǔn)確的定義,有些暫叫做“智能運(yùn)維”,但這種叫法不嚴(yán)謹(jǐn),因?yàn)楣ぞ呓K究是工具,畢竟運(yùn)維是個(gè)系統(tǒng)工程,所以筆者首創(chuàng)地稱之為預(yù)見(jiàn)式運(yùn)維。
在此正式給預(yù)見(jiàn)式運(yùn)維下個(gè)定義:借助最新的技術(shù)手段,從運(yùn)維對(duì)象的維護(hù)歷史、運(yùn)行現(xiàn)狀、未來(lái)環(huán)境入手,通過(guò)趨勢(shì)模型和預(yù)測(cè)算法,提前預(yù)測(cè)未來(lái)可能遇到的隱患,并提前采取處置措施,以實(shí)現(xiàn)持續(xù)保障業(yè)務(wù)連續(xù)性的目的。
正如定義描述的那樣,預(yù)見(jiàn)式運(yùn)維最大的特點(diǎn)是具備“3+X”能力,其中的3 是指三個(gè)核心能力,既不二過(guò)、不背鍋、不懼怕的能力,“不二過(guò)”是指要具備對(duì)過(guò)往故障的追溯能力,找到引起故障的根源,并舉一反三,提取共性,采取完善措施,避免再次發(fā)生類似故障;“不背鍋”是指要具備對(duì)保障對(duì)象當(dāng)前運(yùn)行狀態(tài)的評(píng)估能力,知道哪里是瓶頸、哪里負(fù)載重、哪里是盲區(qū)等等,并形成狀態(tài)評(píng)估全景圖,一目了然,不用擔(dān)心被無(wú)端指責(zé);“不懼怕”是指要具備對(duì)未來(lái)故障隱患預(yù)判的能力,通過(guò)構(gòu)建數(shù)據(jù)模型和算法,搭建模擬環(huán)境,真實(shí)演練未來(lái)業(yè)務(wù)運(yùn)行,提前找到運(yùn)維盲區(qū)和隱患,并提前處置,從而防患于未然。
在此基礎(chǔ)上,再根據(jù)不同行業(yè)保障對(duì)象的特點(diǎn),以及具體業(yè)務(wù)需要,打造其它相關(guān)的個(gè)性化、定制化的能力,簡(jiǎn)稱為“X”。
工欲善其事,首先利其器。在傳統(tǒng)的人工、備件、工具、流程這運(yùn)維四件套基礎(chǔ)上,要做到預(yù)見(jiàn)式運(yùn)維,必須再新增四件套,那就是數(shù)字孿生、大數(shù)據(jù)、知識(shí)圖譜、機(jī)器學(xué)習(xí),統(tǒng)稱預(yù)見(jiàn)式運(yùn)維八件套。
其次,在運(yùn)維的職責(zé)上,要把以“業(yè)務(wù)”為中心,以“價(jià)值”為導(dǎo)向,以“確定”為目標(biāo),做為新的定位和努力方向。
再者,更要加強(qiáng)運(yùn)維人員綜合管理技能的提升,尤其是對(duì)“技術(shù)+業(yè)務(wù)+管理”三合一型的復(fù)合人員的培養(yǎng),專項(xiàng)領(lǐng)域高精尖的專業(yè)技術(shù)人才可以借助外部資源支持,內(nèi)部普遍需要的是這種復(fù)合型的通才,因?yàn)橛衅渌呒椎奈淦靼?,運(yùn)維人員的單兵能力將得到極大的提升,也只有這樣,才能在AI 時(shí)代,做運(yùn)維的真正主人。
IT 語(yǔ)錄:我預(yù)見(jiàn),我不挨踢!
“尊敬的業(yè)主,冬季供暖即將開(kāi)始,為了保證按期供暖,我們已提前對(duì)供暖設(shè)備及管道進(jìn)行了預(yù)先檢查,發(fā)現(xiàn)2 處故障5 處隱患,均已提前修復(fù),并將提前一周間歇式試供,可能出現(xiàn)忽冷忽熱的情況,這屬于正常現(xiàn)象,您不用擔(dān)心,但從已往年份的記錄來(lái)看,您家的屋內(nèi)管道曾出現(xiàn)過(guò)滴水故障,建議您在試供期間注意觀察,我們也會(huì)持續(xù)監(jiān)測(cè)分析系統(tǒng)運(yùn)行狀況,一有情況及時(shí)處理,確保按期順暢供暖,讓您渡過(guò)一個(gè)溫暖的冬天……”
雖然這兩天突然降溫,但收到物業(yè)公司發(fā)來(lái)的短信,老彭心里踏實(shí)了許多,這個(gè)小區(qū)的物業(yè)真是越來(lái)越貼心了,說(shuō)是上了個(gè)什么AI 系統(tǒng),這算不算‘預(yù)見(jiàn)式’運(yùn)維呢?
下期預(yù)告:呼哧呼哧,“二師兄”也有喜怒哀樂(lè)!