彭建新, 萬騰輝, 趙 熙
(1.廣東警官學院網(wǎng)絡信息中心, 廣東廣州 510230; 2.廣東省公安廳科技信息化處, 廣東廣州 510050;3.廣州越維信息科技有限公司, 廣東廣州 510660)
如今,將物聯(lián)網(wǎng)、智能機器人、大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)、智能專家系統(tǒng)等先進技術應用到機房運維中已經(jīng)是大勢所趨。IT信息系統(tǒng)的日漸復雜,也使得業(yè)務對信息系統(tǒng)產(chǎn)生高度依賴,這也就對系統(tǒng)的穩(wěn)定性和可靠性提出了更高的要求,使相對應的運維管理多年處于手工維護和被動的狀態(tài)[1]。
近些年來,不同類別的應用系統(tǒng)的推廣規(guī)模和建設速度顯得非常迅猛,因此系統(tǒng)維護所需人員亦隨之增多,技術水平的要求也逐漸提高,并對技術人員的綜合素質(zhì)也達到了另一個更高的層次,但一個人無法同時具備各類專業(yè)技能,需要構建一套基于智能機器人的智能專家系統(tǒng),為管理人員和技術人員提供故障的預測、故障輔助解決的計算機分類系統(tǒng)(通過智能知識庫和智能專家系統(tǒng)實現(xiàn)故障自助處理和專家引導處理)、專家咨詢等服務[2]。實現(xiàn)設備運行狀態(tài)的實時監(jiān)測、故障的提前預警和故障預判、智能專家服務、科學的設備和服務評價管理等,幫助用戶有效延長設備的使用周期,降低設備的故障率,加快故障處理速度,提升IT運維服務水平和設備使用人員對運維服務的滿意度。
圍繞知識在信息化設備全生命周期中的收集、運用和管理展開,以全面的設備和服務評價管理為驅(qū)動,在信息化設備維保過程中單位用戶、設備廠商、運維服務、個人專家四方互聯(lián)、協(xié)同工作,通過機器自動分類算法加人類專家在線服務技術,需要建立逐步覆蓋所有信息化設備,能持續(xù)完善、能快速查找使用的智能化的運維系統(tǒng)[3]。
具體來說,針對所研究的問題擬采用如下的技術路線和研究方法。
(1)知識的收集、運用和管理
按照普適的概念,知識的收集是通過前期錄入,在被動解決某事件或問題的后所總結出的針對該類情況的解決方案,以及運維人員在日常工作中根據(jù)個人知識積累主動總結的運維經(jīng)驗,這可以通過數(shù)據(jù)清洗和提取特征自來模擬。
通過信息化設備全生命周期管理,研究基于邏輯樹知識庫模型,使用物聯(lián)網(wǎng)IOT技術構建統(tǒng)一的信息化設備的接入應用,建立運維共贏生態(tài)圈管理模式收集、運用管理知識,使用大數(shù)據(jù)分析化被動為主動,能夠主動為用戶提供信息設備運維風險和故障自動識別、預測[4]。
(2)評價系統(tǒng)模型采用AHP(層次分析)模型
層次分析法(Analytic Hierarchy Process,簡稱AHP)是將與決策總是有關的元素分解成目標、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。
(3)人工智能技術
人工智能技術的研究包括語言識別、圖像識別、自然語言處理、模式分類和專家系統(tǒng)等,涉及到以計算機科學、心理學、哲學和語言學等學科為主的幾乎自然科學和社會科學的所有學科。人工智能技術試圖了解智能的實質(zhì),實現(xiàn)對人類的意識及思維過程的模擬,對機器人的學習、推理、思考、規(guī)劃和分類等智能行為和能力進行傳授,力圖使機器人在更高層次的應用方面獲得成功,勝任一些通常需要人類智能才能完成的復雜工作。
(4)PC后臺管理加移動APP前端應用方式的技術路線
PC后臺管理采用J2ee框架開發(fā)。移動APP框架包含了HTML5、HTML5 PLUS和MUI移動框架。HTML5具有多設備跨平臺,通過封裝技術可將它封裝成android平臺和蘋果平臺,兩種不同手機平臺的應用,具有自適應網(wǎng)頁設計能力。HTML5 PLUS是HTML5在調(diào)用手機硬件方面的拓展,它擴展了JavaScript對象plus,使得JS可以調(diào)用各種瀏覽器無法實現(xiàn)或?qū)崿F(xiàn)不佳的系統(tǒng)能力,設備能力如攝像頭、文件系統(tǒng)等,業(yè)務能力如二維碼、地圖、支付、語音輸入等。MUI(Mobile User Interface)是一個輕量級的HTML、CSS和JS框架,它以IOS為基礎,補充Android平臺特有的控件使得UI上更符合APP的體驗,即搭建一個框架便于開發(fā)更高性能的APP,這也成為當前最為接近原生APP的框架。
以上的技術都為數(shù)據(jù)機器自動收集、清洗、模式匹配和構建云端智能分類響應系提供了基礎。
(1)資產(chǎn)管理問題
隨著信息化程度的逐漸加深,信息化設備對用戶的影響將持續(xù)加大,如何做好已有投資建設設備的管理是擺在管理者面前的問題。需要在管理工作中使用更先進智能的管理系統(tǒng)進行輔助管理,實現(xiàn)申請維保預算的依據(jù)、申請報廢的依據(jù)、故障預判模型、設備全生命周期使用成本的管理、設備及其知識庫使用和維護評價、新設備采購依據(jù)的有效管理,實現(xiàn)信息化投資的最大化利用。
(2)信息化基礎設備數(shù)據(jù)統(tǒng)一采集,解決信息孤島問題
當前大多用戶現(xiàn)有的信息設備工況數(shù)據(jù)采集由各個系統(tǒng)獨立采集,暫未有統(tǒng)一的信息設備數(shù)據(jù)采集云系統(tǒng)為各系統(tǒng)提供業(yè)務及管理數(shù)據(jù)支撐,不能做到可預測性維護。通過提供完全開放的物聯(lián)網(wǎng)私有云接入模式,統(tǒng)一接入?yún)f(xié)議和對所有設備的采集器開放的接口,兼容采集現(xiàn)有所有的信息化設備數(shù)據(jù)上傳,實現(xiàn)現(xiàn)有投資最大化的保值和利用。為智能監(jiān)測平臺提供更好的信號接口。
(3)信息化高端設備,特定設備、專用設備維保難,高端技術人才匱乏
日益專業(yè)化、大型化、復雜化和自動化的設備在日常的生產(chǎn)的作用和影響逐漸擴大,這也就使得生產(chǎn)過程的依賴程度越來越高。設備的維護需要相應的專業(yè)技術人員。隨著信息化技術的不斷發(fā)展和設備迭代帶來的日益復雜化和智能化,信息化人員技術和管理人員也同樣存在知識更新問題。內(nèi)部人員變動、維保人員變動導致的技術交接、培訓、安全保障工作更為困難。
(4)現(xiàn)有評價體系薄弱,無法對信息化設備及服務提供科學的評價
經(jīng)過多年的運維服務外包和管理,收集了一些信息化設備的維護和使用數(shù)據(jù),已建立了針對運維服務工作和服務人員的考評體系,但是缺乏對整個信息化設備及服務提供全面、科學的評價。
基于以上基本情況,大多用戶現(xiàn)有信息化設備運維工作都是處于被動式的運維模式,運維人員都是充當消防員,四處忙于“救火”。隨著信息化程度的加深,人們對信息化系統(tǒng)的依賴程度逐漸增高,原有的運維模式,已經(jīng)無法滿足人民日益增長的服務需求,需要建立主動預防服務模式,提前對風險和故障進行預警和預判,減少風險和故障對信息系統(tǒng)帶來的影響。需要通過統(tǒng)一的系統(tǒng)對設備運行狀態(tài)信息進行收集、監(jiān)測和分析;利用大數(shù)據(jù)分析技術對設備運維服務數(shù)據(jù)進行挖掘和分析,提高運維風險和故障自動識別和預測能力;利用智能機器人和專家結合提供主動預警、風險識別、專家建議和咨詢等服務。
基于以上的需求分析,對于各個設備的系統(tǒng)函數(shù),和權限存在著緊密對應關系,查閱最新的主要網(wǎng)絡設備官方文檔,目前定義了物聯(lián)網(wǎng)設備和軟件可以捕捉到的權限有300多項,參考已有研究對于權限的分類和敏感權限的界定,整理出需要重點關注的運維基本知識。表1展示了主要的系統(tǒng)參數(shù)。
表1 主要設備參數(shù)列表
另外,硬件和軟件系統(tǒng)的行為參數(shù)可以分為兩類,即單一行為和行為組合。所謂的單一行為,就是指通過一個系統(tǒng)函數(shù)就可以描述的行為。所謂行為組合,就是指需要使用多 個系統(tǒng)函數(shù)的組合來描述行為。行為組合往往比單一行為能更全面的描述設備或者軟件的運行狀態(tài)。監(jiān)控的參數(shù)組合比單一參數(shù)可以獲取更多的設備信息或者運行環(huán)境信息,根 據(jù)以上類似原理,本文定義了需要監(jiān)測的一系列行為組合。本文最終定義需要監(jiān)測的設備參數(shù)和設備參數(shù)組合共計 17項作為智能運維分類系統(tǒng)的特征值,來構造特征向量,均在表2中列出。
表2 需要記錄的參數(shù)和參數(shù)組合
特征值尋優(yōu)一直是熱點關注的問題,它的主要內(nèi)容是從一個樣本存在的許多特征屬性中,選取其中的一部分對回歸結果和分類結果等影響最大的特征值。Fisher score algorithm(FS)是一種有效的、簡單地方法,可快速尋找特征值之間的特殊性,其思想是把高維空間的數(shù)據(jù)變換為另一個低維空間,因此方差盡量大的同時方差盡量縮小,且可根據(jù)標簽的不同投影到該特征值上的距離較遠,這就是一個好的特征值。Fisher score就是評價特征值對數(shù)據(jù)結構的保持能力,F(xiàn)isher score是有監(jiān)督的特征選擇。
本文經(jīng)過對原始數(shù)據(jù)的整理和特征值提取后的數(shù)據(jù)集共有5 000個樣本,17個特征屬性,按照從1逐漸遞增,形成序號為a到q的17種特征值組合。
根據(jù)國際上通用最優(yōu)特征值選取算法的研究,最后選擇了Fisher score算法對5 000×17的特征值矩陣進行排序,排序結果證明了對機房運維特別重要的特征值通常具有較高的得分。
表3 最優(yōu)特征值排序
機房設備和軟件運行狀態(tài)的可變性和模糊性是很多分類算法所不能很好處理的。綜合已有的這些實際問題,支持向量機(SVM)在針對小樣本、高維度的確定性分類問題上,表現(xiàn)出特別的優(yōu)勢,并且其分類算法有嚴格的統(tǒng)計學論據(jù),在編程邏輯上是透明的,這使得該算法更容易切入實際分類需求[5]。
機房設備和軟件運行狀態(tài)具有非線性、樣本分布不平坦、噪聲大等問題,支持向量機雖然在解決小樣本數(shù)據(jù)上表現(xiàn)出許多特有的優(yōu)勢,但對于機房設備和軟件運行狀態(tài)的模糊性等問題,仍存在如下缺陷:
(1)由于支持向量機在訓練時對所有訓練點是同等對待的,這就會產(chǎn)生一定的局限性,在處理實際應用時,應盡可能保持支持向量的作用,弱化非支持向量的作用。
基于此,我們采用Lin等提出的模糊支持向量機作為分類的基本方法,以減小非重要樣本對SVM分類器學習的干擾[6-7]。
(2)SVM在解決非線性分類或回歸問題過程中,核函數(shù)的選取非常重要。傳統(tǒng)的SVM或者模糊支持向量機都是基于單個核函數(shù)的。對于機房設備和軟件運行狀態(tài)分類問題,由于對象之間的差異,找到一個合適的核函數(shù)又是比較困難的,往往靠大量的經(jīng)驗所得來完成。這樣操作,對分類,顯然并不科學。
基于此,本文將在模糊化支持向量機的基礎上混合多個核函數(shù)映射,利用不同核函數(shù)之間的互補性特性來更加準確的適應機房設備和軟件運行狀態(tài)模糊、噪聲大、樣本差異不顯著的特點。我們提出一種基于多核的模糊化支持向量機算法用于機房設備和軟件運行狀態(tài)分類,來更有效的模擬機房設備和軟件運行狀態(tài)數(shù)據(jù)模糊性等實際問題,此算法決策樹中的模糊核權重主要借助于樣本無監(jiān)督自學習來確定,能根據(jù)實際機房設備和軟件運行狀態(tài)數(shù)據(jù)的模糊性,形成一種更合適的分類算法[6]。
支持向量機分類器的數(shù)學模型原理圖如下:
圖3 SVM分類器數(shù)學模型圖
定義1設X是一個非空集合,則稱
F={〈x,uF(xi)〉|x∈X,i=1,2,…,l}
(1)
為模糊集,uF(xi)為模糊隸屬度矩陣中,樣本x中第i個屬于模糊集F的隸屬度,uF(xi)取值范圍在[0,1]之間。
隸屬度uF(xi)是指訓練集{xl,yl,uF(x)}隸屬某一類的程度,而εi是對錯分程度的度量。由此得到目標函數(shù)的最優(yōu)結構[7]:
(2)
其中,ε=(ε1,ε2,…,εl)T,φ(xi)表示將xi從Rd映射到高維特征空間。最優(yōu)別函數(shù)式為[7]:
(3)
隸屬度函數(shù)的確定采用FCM算法ui矩陣的無監(jiān)督、不斷自學習的方法。算法樣本空間X,其中X包含N個l=17維的樣本xi,i為樣本序列號,F(xiàn)CM算法輸出隸屬度值uic。最小化以下目標函數(shù):
(4)
通過拉格朗日乘數(shù)法求解約束優(yōu)化問題[7],得:
(5)
由(5)式求偏導并設為0可導出以下式子[7]:
(6)
(7)
據(jù)此,通過無監(jiān)督的學習,得到uic。
組合多核函數(shù)的支持向量機算法,其決策樹如下:
(8)
多核函數(shù)支持向量機算法分類步驟如下:將特征矩陣里的數(shù)據(jù)進行歸一化處理;按照(7)式,建立分類數(shù)據(jù)的模糊集;根據(jù)(6)和(7)式確定樣本點模糊隸屬度;根據(jù)式(9)選擇不同的核函數(shù)進行組合;根據(jù)式(8)的決策樹,運用數(shù)據(jù)對混合核函數(shù)支持向量機算法進行訓練,然后進行樣本測試。
本實驗在真實網(wǎng)絡空間環(huán)境中,采集5 000個數(shù)據(jù)樣本,并分成5份,其中4份用于訓練分類器,剩下的1份用于測試分類器的效果,并采取了交叉驗證方法來驗證算法的穩(wěn)定性,混合核函數(shù)支持向量機算法的分類結果如表4所示。
表4 混合核函數(shù)支持向量機算法分類結果
在本次實驗中,實驗對數(shù)據(jù)特征值進行了標準化,得到5 000個樣本,17維度的特征向量作為分類器的輸入數(shù)據(jù)。進行交叉檢驗,數(shù)據(jù)集4/5為訓練樣本,1/5為測試樣本。表4詳細地給出了應用此分類器的結果。分類準確率從78.56%到87.65%不等,平均的分類準確率是81.49%,實驗結果表明,本文提出的分類器能達到比較理想的分類結果。最后得出平均的分類準確率為81.49%。實驗結果表明,本文實驗提出的混合核函數(shù)支持向量機分類算法準確率是比較穩(wěn)定的。
以上穩(wěn)定且效率高的計算機決策分析系統(tǒng)可以使實際的IT運維更加高效快捷,并已在實際生產(chǎn)環(huán)境中提升了如下效益:
(1)建立了基于資產(chǎn)全生命周期管理體系,通過系統(tǒng)可全面記錄設備在管理的過程中設備及財務的臺賬和管理及維修記錄。作為設備全生命周期的分析依據(jù),通過大數(shù)據(jù)分析對設備整體使用經(jīng)濟性、可靠性及其管理成本作出全面、科學的分析和評價,可以為用戶新設備采購和維保經(jīng)費審批提供決策數(shù)據(jù)支撐,從而建立設備全生命周期管理閉環(huán),實現(xiàn)資產(chǎn)的規(guī)范化管理。
(2)基于監(jiān)測分類系統(tǒng)可建立智能預警和預判機制,通過構建統(tǒng)一的物聯(lián)網(wǎng)支持所有信息化設備的接入應用,可實時采集所有信息化基礎設備信息,通過大數(shù)據(jù)技術可以對過往的設備運行數(shù)據(jù)和故障情況建立多維度的風險識別和故障預判模型,可以提前預測設備運行過程中未來可能出現(xiàn)的故障,提前做好預防工作,降低設備或業(yè)務系統(tǒng)維護的風險。
(3)最終系統(tǒng)全面提升了用戶運維管理水平。將用戶現(xiàn)有的資產(chǎn)管理系統(tǒng)、網(wǎng)管系統(tǒng)、安全監(jiān)控系統(tǒng)、運維管理系統(tǒng)、現(xiàn)有設備的數(shù)據(jù)采集系統(tǒng)等系統(tǒng)接入至智能運維管理平臺內(nèi),實現(xiàn)運維服務的監(jiān)、管、控于一體化,實現(xiàn)運維服務流程化、規(guī)范化、標準化和智能化,并可持續(xù)提升用戶的運維服務管理水平。
采用物聯(lián)網(wǎng)、智能機器人、大數(shù)據(jù)、移動互聯(lián)網(wǎng)、智能專家系統(tǒng)等先進技術,研究成果可以有效解決用戶資產(chǎn)管理弱、信息孤島多、高端人才匱乏、運維服務被動、設備和服務無評價等問題,幫助用戶建立資產(chǎn)全生命周期的管理、設備運行狀態(tài)的實時監(jiān)測、故障的提前預警和故障預判、智能專家服務、全面的設備和服務評價管理等服務和管理能力,還可以準確識別各類風險、降低設備的故障率、提高故障處理速度,有效延長設備的使用壽命,提升IT運維服務管理水平。
本文將現(xiàn)有的信息化設備運維服務管理帶入一個全新的時代。它使得用戶不再糾結于IT設備的使用風險、使用成本及維保過程中的問題解決,缺少專家問題上,而是真正讓設備的使用價值最大化,為信息系統(tǒng)提供整體運行保障,化被動管理為主動管理,為用戶信息系統(tǒng)的可靠運行保駕護航。以此研究和設計基于云環(huán)境的智能運維管理,形成智能運維服務和管理新模式,并在公安及其他行業(yè)推廣應用。