摘 要:由于數(shù)據(jù)挖掘技術(shù)能夠提供各種各樣的知識(shí),因而將其應(yīng)用到網(wǎng)絡(luò)故障的診斷和分析中可以幫助我們有效解決診斷故障時(shí)知識(shí)缺乏的現(xiàn)象。本文將從數(shù)據(jù)挖掘的具體內(nèi)容出發(fā),講述將數(shù)據(jù)挖掘技術(shù)應(yīng)用到網(wǎng)絡(luò)故障診斷中如何進(jìn)行數(shù)據(jù)的選擇和預(yù)處理,如何對(duì)關(guān)聯(lián)規(guī)則和聚類方法進(jìn)行運(yùn)用。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);網(wǎng)絡(luò)故障處理;診斷;分析
中圖分類號(hào):TP393.07
隨著計(jì)算機(jī)技術(shù)的發(fā)展,網(wǎng)絡(luò)在我們的生活和工作中發(fā)揮著越來越重要的作用,保持網(wǎng)絡(luò)技術(shù)的安全和高效運(yùn)轉(zhuǎn)也是計(jì)算機(jī)行業(yè)的重要發(fā)展任務(wù)。然而,將數(shù)據(jù)挖掘技術(shù)運(yùn)用到網(wǎng)絡(luò)故障的診斷中,對(duì)于提高診斷的效率,增強(qiáng)其正確性,有著重要的意義,也是當(dāng)前網(wǎng)絡(luò)技術(shù)研究的熱點(diǎn)。
1 數(shù)據(jù)挖掘技術(shù)
計(jì)算機(jī)技術(shù)在我們的社會(huì)生活中的應(yīng)用越來越廣泛,因而計(jì)算機(jī)衍生出的人工性智能技術(shù)與數(shù)據(jù)庫(kù)的技術(shù)也隨之逐步興起。同時(shí)隨之興起的還有數(shù)據(jù)挖掘技術(shù)。我們通常所講的數(shù)據(jù)挖掘技術(shù)是指在浩大而又繁雜的各種數(shù)據(jù)中挖掘出對(duì)于我們有利用價(jià)值的、有一定意義的數(shù)據(jù)。近年來,數(shù)據(jù)的挖掘技術(shù)被廣泛應(yīng)用于經(jīng)濟(jì)市場(chǎng)中各個(gè)領(lǐng)域,無(wú)論是市場(chǎng)營(yíng)銷、金融行業(yè)、電信行業(yè),還是醫(yī)藥行業(yè)、制造行業(yè)等等,都會(huì)看到數(shù)據(jù)挖掘技術(shù)的應(yīng)用。
1.1 數(shù)據(jù)挖掘技術(shù)的特點(diǎn)
對(duì)于數(shù)據(jù)挖掘技術(shù),其主要特點(diǎn)表現(xiàn)在以下幾個(gè)方面:第一,數(shù)據(jù)挖掘的主要對(duì)象是各種各樣,內(nèi)容龐大的數(shù)據(jù);第二,數(shù)據(jù)挖掘的結(jié)果是不可預(yù)知的,多樣化,多形式的;第三,數(shù)據(jù)挖掘的方法是多種多樣的,不確定的,對(duì)于挖掘過程中技術(shù)層面的方法沒有最好的,只應(yīng)挑選最適合的;第四,數(shù)據(jù)挖掘的技術(shù)是綜合型多樣化的,是技術(shù)與學(xué)科知識(shí)的融合,不僅包含有人工智能的技術(shù),數(shù)據(jù)庫(kù)的技術(shù)以及可視化的技術(shù)等各方面的技術(shù),還包括了哲學(xué)、數(shù)學(xué)以及邏輯學(xué)等學(xué)科的知識(shí)。
1.2 數(shù)據(jù)挖掘技術(shù)的功能
數(shù)據(jù)挖掘技術(shù)的過程對(duì)外來的行為和發(fā)展的趨勢(shì)進(jìn)行一定的分析,從而做出一定前瞻性的預(yù)測(cè),它的主要功能表現(xiàn)在以下三個(gè)方面:
(1)數(shù)據(jù)挖掘具有自動(dòng)進(jìn)行預(yù)測(cè)的行為和趨勢(shì)。數(shù)據(jù)挖掘技術(shù)主要表現(xiàn)在從浩瀚的數(shù)據(jù)庫(kù)中尋求有利用價(jià)值的信息,改變了以往需要對(duì)手頭數(shù)據(jù)和資料進(jìn)行大量的手工查找和分析的過程,可以在短時(shí)間內(nèi)迅速找到相關(guān)結(jié)果,得出一定結(jié)論。
(2)數(shù)據(jù)挖掘技術(shù)可進(jìn)行一定關(guān)聯(lián)分析。在數(shù)據(jù)庫(kù)中存在一種十分重要的知識(shí),即數(shù)據(jù)的關(guān)聯(lián)。關(guān)聯(lián)主要包括有因果、簡(jiǎn)單和時(shí)序三方面。我們進(jìn)行一定的關(guān)聯(lián)分析,其主要的目的便是找出隱藏于數(shù)據(jù)庫(kù)中的關(guān)聯(lián)網(wǎng)。有的時(shí)候我們并不知道或者并不確定存在于數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)之間是否存在關(guān)聯(lián)函數(shù),因此基于數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)分析,其生成規(guī)則和整個(gè)分析的過程是可信的。
(3)數(shù)據(jù)挖掘技術(shù)具有聚類的作用。存在于數(shù)據(jù)庫(kù)中的各數(shù)據(jù)信息是可以按照一定的方式被劃分成一系列存在一定意義的小子集,這些小子集即聚類。聚類的技術(shù)是對(duì)概念進(jìn)行描述核對(duì)偏差進(jìn)行分析的主要條件,它在一定程度上增加了人們認(rèn)識(shí)世界的客觀性。
1.3 數(shù)據(jù)挖掘技術(shù)的主要過程
(1)確定數(shù)據(jù)挖掘的主要挖掘?qū)ο螅唬?)準(zhǔn)備相關(guān)的數(shù)據(jù);(3)對(duì)轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行挖掘;(4)對(duì)挖掘的結(jié)果進(jìn)行分析和評(píng)估;(5)對(duì)知識(shí)進(jìn)行同化。
將由之前步驟得出的知識(shí)進(jìn)行綜合并集成到相關(guān)的信息系統(tǒng)結(jié)構(gòu)中。
2 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)故障診斷分析
2.1 數(shù)據(jù)挖掘技術(shù)在故障診斷的過程中對(duì)數(shù)據(jù)進(jìn)行選取以及預(yù)處理
(1)診斷工具對(duì)數(shù)據(jù)的提供。要想基于數(shù)據(jù)挖掘的基礎(chǔ)上對(duì)網(wǎng)絡(luò)的故障進(jìn)行診斷和分析,首先必須應(yīng)獲得在一定程度上對(duì)網(wǎng)絡(luò)的相關(guān)狀態(tài)進(jìn)行反映的信息,只有相關(guān)網(wǎng)絡(luò)狀態(tài)的信息越完整越全面,才能夠?qū)⒂嘘P(guān)故障的信息更多的包含在內(nèi),才更有利于故障的發(fā)現(xiàn)和解決。
如果要全面獲取相關(guān)網(wǎng)絡(luò)信息,我們需要對(duì)計(jì)算機(jī)的網(wǎng)絡(luò)管理以及網(wǎng)絡(luò)故障的相關(guān)診斷工具進(jìn)行參考,參考其是怎樣提供相關(guān)數(shù)據(jù)的。
目前情況下,在計(jì)算機(jī)的網(wǎng)絡(luò)管理方面,我們普遍采用簡(jiǎn)單進(jìn)行網(wǎng)絡(luò)管理的協(xié)議和管理信息的數(shù)據(jù)庫(kù),其中以管理信息的數(shù)據(jù)庫(kù)為網(wǎng)絡(luò)管理數(shù)據(jù)的主要標(biāo)準(zhǔn)。這項(xiàng)標(biāo)準(zhǔn)同樣也規(guī)定了進(jìn)行網(wǎng)絡(luò)的代理時(shí)必須對(duì)數(shù)據(jù)的項(xiàng)目和類型,以及允許操作進(jìn)行網(wǎng)絡(luò)的代理。對(duì)相關(guān)的數(shù)據(jù)項(xiàng)目進(jìn)行一定存取的訪問,就可得到網(wǎng)絡(luò)設(shè)備中的統(tǒng)計(jì)內(nèi)容。之后可以再對(duì)多個(gè)相關(guān)網(wǎng)絡(luò)設(shè)備統(tǒng)計(jì)內(nèi)容進(jìn)行綜合性分析就可以實(shí)現(xiàn)網(wǎng)絡(luò)的基本管理。因此,要想實(shí)現(xiàn)網(wǎng)絡(luò)管理,其關(guān)鍵便是管理信息的數(shù)據(jù)庫(kù)。最常用到的網(wǎng)絡(luò)故障的診斷工具為協(xié)議的分析儀。
(2)對(duì)數(shù)據(jù)進(jìn)行選擇和進(jìn)行預(yù)處理。由上文對(duì)故障診斷的輔助工具以及對(duì)網(wǎng)絡(luò)進(jìn)行管理的協(xié)議的數(shù)據(jù)選擇進(jìn)行參考,我們?cè)趯?duì)要進(jìn)行挖掘的數(shù)據(jù)定位于數(shù)據(jù)包的相關(guān)統(tǒng)計(jì)信息,信息管理數(shù)據(jù)庫(kù)的所有變量以及簡(jiǎn)單管理網(wǎng)絡(luò)協(xié)議中的告警信息。
對(duì)于利用關(guān)聯(lián)的規(guī)則進(jìn)行挖掘的數(shù)據(jù),我們采用的是將在同一個(gè)時(shí)刻下記錄的統(tǒng)計(jì)信息,管理信息的數(shù)據(jù)庫(kù)變量以及簡(jiǎn)單對(duì)網(wǎng)絡(luò)進(jìn)行管理的協(xié)議中的trap信息作為條目,也就是一條關(guān)于事物的數(shù)據(jù)。
分類的方法采用的是數(shù)據(jù)包的統(tǒng)計(jì)信息和簡(jiǎn)單對(duì)網(wǎng)絡(luò)進(jìn)行管理的協(xié)議中trap的信息為一條關(guān)于事物的數(shù)據(jù)。
聚類的數(shù)據(jù)采用數(shù)據(jù)包來進(jìn)行信息統(tǒng)計(jì),這樣子便于對(duì)距離的計(jì)算。
2.2 關(guān)聯(lián)規(guī)則運(yùn)用于網(wǎng)絡(luò)的故障診斷中
數(shù)據(jù)挖掘的技術(shù)中,關(guān)聯(lián)的規(guī)則反映了某些事物之間存在一定的依賴關(guān)系或者某種關(guān)聯(lián)的知識(shí),其中如果有兩項(xiàng)或者兩項(xiàng)以上存在著一定關(guān)聯(lián),其中的任何一項(xiàng)屬性便可根據(jù)其他屬性進(jìn)行一定的預(yù)測(cè),并且用置信度、支持度以及最小的置信度和最小的支持度這四個(gè)相關(guān)的參數(shù)來確定下一條規(guī)定,從而可以根據(jù)這項(xiàng)規(guī)定將還不知道的障礙數(shù)據(jù)進(jìn)行歸類。
然而對(duì)網(wǎng)絡(luò)故障進(jìn)行診斷時(shí),對(duì)一些關(guān)聯(lián)規(guī)則的挖掘是有一定困難的。首先,網(wǎng)絡(luò)故障方面的一些數(shù)據(jù)是不斷隨著時(shí)間增長(zhǎng)的,舊數(shù)據(jù)與新數(shù)據(jù)集中混合進(jìn)行挖掘,會(huì)出現(xiàn)工作重復(fù)的現(xiàn)象,我們需要在對(duì)舊的數(shù)據(jù)的結(jié)果進(jìn)行充分利用的基礎(chǔ)上將新的數(shù)據(jù)結(jié)果進(jìn)行一定的吸收;其次,網(wǎng)絡(luò)故障和特征事物彼此間的聯(lián)系一般情況下聯(lián)系時(shí)間較緊密。很明顯,手工對(duì)網(wǎng)絡(luò)故障進(jìn)行診斷的分析儀器和對(duì)網(wǎng)絡(luò)進(jìn)行管理的軟件提供的都是有時(shí)序性的信息,然而傳統(tǒng)情況下關(guān)聯(lián)的規(guī)則僅表示存在有先后的關(guān)系,并沒有對(duì)時(shí)間上的具體情況進(jìn)行描述。因此,我們需要挖掘網(wǎng)絡(luò)故障的診斷知識(shí)時(shí)描述時(shí)間上的量變。
2.3 聚類的方法運(yùn)用于網(wǎng)絡(luò)的故障診斷中
(1)聚類方法的主要內(nèi)容。顧名思義,聚類指的是通過查找事物之間的相似之處而對(duì)事物進(jìn)行一定的分類。對(duì)于聚類的方法和技術(shù)的運(yùn)用也是非常廣泛的,無(wú)論是在醫(yī)學(xué)方面,還是在模式的識(shí)別方面和圖像的處理方面。從某種程度上講,聚類的分析技術(shù)就是將一組數(shù)據(jù)進(jìn)行分類,使得每一類中數(shù)據(jù)的相似程度達(dá)到最高。
(2)聚類分析的作用。我們?cè)趯?duì)網(wǎng)絡(luò)中的故障進(jìn)行診斷時(shí),需要在故障發(fā)生的網(wǎng)絡(luò)相關(guān)狀態(tài)用幾條收集的數(shù)據(jù)表達(dá)描述,然后提交,有診斷的系統(tǒng)做出相關(guān)診斷。然而聚類是將某個(gè)數(shù)據(jù)的集合按照其特點(diǎn)劃分成幾個(gè)特定類別。我們用聚類的方法無(wú)法對(duì)如此小量的數(shù)據(jù)得出相關(guān)的知識(shí)和結(jié)論,因而聚類無(wú)法完全發(fā)揮出它的作用。
因此我們?cè)趯?duì)聚類的相關(guān)技術(shù)進(jìn)行使用來診斷故障時(shí)可以采用樣本植入的方法。即先整理一個(gè)正確的類聚所有有關(guān)樣本的故障樣本的集合,然后將此時(shí)出現(xiàn)故障的數(shù)據(jù)樣本全部植入到此集合中,在進(jìn)行聚類的操作,獲取結(jié)果。植入的相關(guān)樣本在哪一個(gè)類別中我們就認(rèn)為這些樣本出現(xiàn)的故障為哪一類。
3 結(jié)束語(yǔ)
相比與傳統(tǒng)的網(wǎng)絡(luò)故障分析方法,數(shù)據(jù)挖掘技術(shù)有利于問題更高效更全面的解決。然而就我國(guó)目前來講,數(shù)據(jù)挖掘的技術(shù)仍處于起步的階段,我們?nèi)匀恍枰龀龈嗟母纳坪吞骄?,才能使得?shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)故障診斷中發(fā)揮更大的作用。
參考文獻(xiàn):
[1]申冰.基于數(shù)據(jù)挖掘技術(shù)的故障診斷系統(tǒng)研究[J].科邯鄲職業(yè)技術(shù)學(xué)院報(bào),2008(12).
[2]周煥銀.基于故障診斷的數(shù)據(jù)挖掘算法研究[J].微計(jì)算機(jī)信息,2008(1).
作者單位:江西經(jīng)濟(jì)管理干部學(xué)院信息工程系,南昌 330088