劉夢蕎 王敬忠 夏明昕 房鵬 鄧潔
(中國移動通信集團設(shè)計院有限公司山東分公司 山東省濟南市 250000)
網(wǎng)絡(luò)運維是網(wǎng)絡(luò)通信穩(wěn)定和高效運營的基礎(chǔ),以及網(wǎng)絡(luò)安全的重要保障。隨著經(jīng)濟與科技的快速發(fā)展,我國的網(wǎng)絡(luò)工程的發(fā)展已經(jīng)進(jìn)入了成熟階段,而且當(dāng)下移動網(wǎng)絡(luò)的網(wǎng)速在不斷提升,5G 也已經(jīng)出現(xiàn)。隨著信息的快速發(fā)展,運營商獲取到的信息量也越來越大,我們正處在一個信息大爆炸的時代,信息處理的難度也逐漸增加,在未來發(fā)展過程中,不能僅僅依靠人工對數(shù)據(jù)進(jìn)行分析,如果僅僅依靠人工來挖掘信息,這會阻礙信息科技的發(fā)展。數(shù)據(jù)挖掘技術(shù)就是利用科技從大量繁雜的信息中挖掘出對人類發(fā)展有價值的信息,這是一種智能數(shù)據(jù)信息技術(shù)。
數(shù)據(jù)挖掘技術(shù)是通過科學(xué)技術(shù)在大量繁雜的數(shù)據(jù)庫中運用數(shù)據(jù)統(tǒng)計數(shù)據(jù)處理數(shù)據(jù)算法以及數(shù)據(jù)檢測等手段來獲取有價值的信息。數(shù)據(jù)挖掘技術(shù)也可以稱為數(shù)據(jù)勘探以及數(shù)據(jù)采礦,從大量繁雜無用的信息中挖掘出對人類發(fā)展有價值的信息。數(shù)據(jù)挖掘技術(shù)在開始前首先要對大量的數(shù)據(jù)進(jìn)行分類,然后雌激素在各個范圍之內(nèi)對數(shù)進(jìn)行勘測,然后再根據(jù)數(shù)據(jù)的關(guān)聯(lián)性對數(shù)據(jù)進(jìn)行整理,然后將同類的信息進(jìn)行歸類,在對有價值的信息進(jìn)行有效的提取。數(shù)據(jù)挖掘技術(shù)看似簡單,但其實是一個繁雜且具有難度的技術(shù)。
數(shù)據(jù)挖掘的一般概念是在沒有規(guī)律且數(shù)量龐大的信息之中運用一定的算法以及規(guī)則對信息進(jìn)行統(tǒng)計提取。其實具體的數(shù)據(jù)挖掘涉及到許多方面的知識,例如統(tǒng)計學(xué)、數(shù)據(jù)庫以及人工智能等你的知識,而且還要依賴于建立起的算法。數(shù)據(jù)挖掘技術(shù)還依賴于許多思想邏輯,其中主要有統(tǒng)計學(xué)中的假設(shè),估計與從昂檢查數(shù)學(xué)領(lǐng)域中的建模技術(shù)搜索方式,以及可視化信息的搜索等等。通過以上繁多的知識,才能有效建立起數(shù)據(jù)挖掘技術(shù),才能夠在大量數(shù)據(jù)中快速有效的采集到有效的信息。
數(shù)據(jù)挖掘的主要流程有:第一,對大量的數(shù)據(jù)進(jìn)行收集,將網(wǎng)絡(luò)上所有的數(shù)據(jù)信息進(jìn)行收集,然后整理分類,技術(shù)人員面臨著大量的數(shù)據(jù),要考慮到合適的方法,然后采用合適的方法將數(shù)據(jù)進(jìn)行存儲。第二,將收集到的大量數(shù)據(jù),按照類型以及其他方面進(jìn)行科學(xué)合理的分類存儲,這樣能減少數(shù)據(jù)在后期收集時的工作量。第三,將數(shù)據(jù)進(jìn)行分類收集之后,再選用合適的工具以及算法,有效提取出數(shù)據(jù)的信息價值。第四,將采集到的信息交由專業(yè)人士進(jìn)行檢驗,確保信息的科學(xué)性及合理性,然后再將有價值且正確的信息發(fā)送給客戶,確保信息得到有效的利用。
數(shù)據(jù)挖掘的功能有很多,例如可以對某一事件進(jìn)行全面的挖掘,通過對某一事件的信息挖掘,可以有效看到該事件發(fā)展以及它的影響能力,能夠有效為該事情未來的發(fā)展奠定有效的基礎(chǔ),除此之外,還可以在計算機上建立起相對應(yīng)的虛擬處理系統(tǒng),通過此系統(tǒng)對個人計算機的私人信息進(jìn)行有效的保護(hù),能夠有效防止病毒對計算機的入侵,確保用戶能夠安全上網(wǎng)。
圖1:償還能力分析
數(shù)據(jù)挖掘?qū)τ诰W(wǎng)絡(luò)運維數(shù)據(jù)具有重要的意義你用數(shù)據(jù)挖掘技術(shù)能夠有效對網(wǎng)絡(luò)進(jìn)行良好的維護(hù),是網(wǎng)絡(luò)的信息資源得到充分有利用于保護(hù),能夠提升網(wǎng)絡(luò)的體驗感。
目前是一個信息數(shù)據(jù)時代,各種信息大量涌入人們的生活。數(shù)據(jù)挖掘技術(shù)能夠?qū)@些大量的信息進(jìn)行有效的處理,然后通過共享功能,讓人們充分利用信息資源,為人們的生活創(chuàng)造更多的便利與經(jīng)濟效益。目前計算機網(wǎng)絡(luò)能夠?qū)崿F(xiàn)數(shù)據(jù)和應(yīng)用程序的共享,數(shù)據(jù)挖掘技術(shù)給人們帶來了極大的便利,而且數(shù)據(jù)挖掘技術(shù)應(yīng)用在其他程序上,能夠有實現(xiàn)對數(shù)據(jù)的轉(zhuǎn)換、備份、刪除、恢復(fù)和管理等提高了人們對信息資源的利用率。數(shù)據(jù)挖掘技術(shù)能夠有效解決傳統(tǒng)數(shù)據(jù)冗余的問題,通過對大量數(shù)據(jù)的整理,將有效的信息進(jìn)行統(tǒng)一的整合,有利于數(shù)據(jù)的集中管理和集中存儲,進(jìn)一步維護(hù)了計算機網(wǎng)絡(luò)的安全。而且對數(shù)據(jù)進(jìn)行存儲的目的就是能夠有效對信息文件進(jìn)行共享,使用此技術(shù)實現(xiàn)資源共享,提升用戶的使用感,而且還能夠確保用戶能夠?qū)π艛?shù)據(jù)進(jìn)行安全的訪問。目前網(wǎng)絡(luò)世界較為復(fù)雜許多信息資源中存在著許多風(fēng)險,為了確保信息資源能夠?qū)崿F(xiàn)安全的共享,必須提升數(shù)據(jù)挖掘技術(shù)的發(fā)展速度。
目前計算機在人們通常生活中所占比重越來越重,計算機的使用頻率越來越高,它為人們的生活帶來了極大的便利。在我國可以足不出戶享受到美食購物以及其他的娛樂活動,網(wǎng)絡(luò)有效提高了我們的生活品質(zhì)。除此之外,我們可以在家了解到國際國內(nèi)的大事,而且還可以利用網(wǎng)絡(luò)獲取足夠的經(jīng)濟。網(wǎng)絡(luò)信息技術(shù)的發(fā)展,提高信息服務(wù)的豐富性,以及滿足了人們的生活需求,所以在未來發(fā)展過程中,網(wǎng)絡(luò)信息技術(shù)的水平會越來越高。
從另一方來看,數(shù)據(jù)挖掘技術(shù)與數(shù)據(jù)網(wǎng)絡(luò)運營技術(shù)本質(zhì)上有一些相似,所以目前數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)運營技術(shù)中有所擴展,但是在發(fā)展的同時要注意對數(shù)據(jù)進(jìn)行變更,提升數(shù)據(jù)使用的靈活度與多樣性。數(shù)據(jù)挖掘技術(shù)中的算法種類很多,每種算法對應(yīng)著不同的數(shù)據(jù)類型,目前沒有統(tǒng)一的算法能夠應(yīng)用與數(shù)據(jù)挖掘之中。由于算法的多樣性與數(shù)據(jù)種類的繁雜性,我們在對數(shù)據(jù)進(jìn)行挖掘時,為了追求數(shù)據(jù)的精準(zhǔn)度,需要通過多次的運算才能夠得到高價值的數(shù)據(jù)。為了追求更高的效率,我們需要對現(xiàn)在已有的算法進(jìn)行改進(jìn),提升算法的運用水平,確保一個算法能夠用于不同的數(shù)據(jù)類型。在目前的網(wǎng)絡(luò)運維數(shù)據(jù)之中,通常用到的算法有:關(guān)聯(lián)規(guī)則算法和決策樹算法。以下將對兩種算法進(jìn)行一些簡單的分析。
決策樹轉(zhuǎn)發(fā)是一種數(shù)據(jù)模型,它主要是利用樹形結(jié)構(gòu)來表示一些決策的附加概率結(jié)果,它是通過直觀的展示統(tǒng)計概率的分析辦法,它能夠代表兩個對象之間的對應(yīng)關(guān)系。決策樹中有很多節(jié)點,每個節(jié)點都表示要計算的對象,而每個分支都表示潛在對象的價值,以及他的屬性值。每個節(jié)點都有其獨特的意義,他們代表著從根節(jié)點到葉節(jié)點中對象路徑的值。決策樹一般分有決策、機會和總結(jié)點,這三個就重要意義的節(jié)點。在具體操作中,首先要根據(jù)特征進(jìn)行選擇,從眾多數(shù)據(jù)中根據(jù)對象的特征,運用算法對對象象進(jìn)行確定以及選擇這個環(huán)節(jié)中就會產(chǎn)生一種算法。第二步就是形成決策樹,根據(jù)第一步的特征評估逐步形成子節(jié)點,各個節(jié)點之間相互連接,形成決策樹。第三步就是對于形成的決策樹進(jìn)行修剪,對于決策樹中多余無用的分支進(jìn)行刪除,這樣能夠有效精簡信息,提高信息的處理能力。決策樹能夠有效做出預(yù)判,判斷當(dāng)下事件的發(fā)展趨勢,以及最終的價值。通過決策樹得出預(yù)判,這樣各個部門就可以根據(jù)預(yù)判做好各方面的工作,尤其是風(fēng)險防范工作,這樣就能有效保證經(jīng)濟利益,減少經(jīng)濟損失。如圖1所示,通過決策樹的算法,可以直觀地看出房產(chǎn)、結(jié)婚、收入和償還能力的影響。
決策樹算法還具有以下的優(yōu)點,它適用于離散型的數(shù)據(jù),可以從此數(shù)據(jù)中提出一些有價值的規(guī)則和算法。決策樹的計算很簡單,而且使用效率較高,能夠有效處理數(shù)據(jù),但是決策樹算法也存在些缺點,再處理大量的數(shù)據(jù)是很容易忽視一些數(shù)據(jù)的屬性。
關(guān)聯(lián)規(guī)則算法的應(yīng)用,關(guān)聯(lián)規(guī)則算法主要應(yīng)用在多個數(shù)據(jù)庫之間,通過此算法發(fā)現(xiàn)一些潛在的規(guī)律,通過此規(guī)律將各個數(shù)據(jù)庫聯(lián)系起來。目前關(guān)聯(lián)規(guī)則算法多應(yīng)用在網(wǎng)絡(luò)故障分析之中,網(wǎng)絡(luò)故障發(fā)生的原因有很多,其中包含了眾多的計算機學(xué)科中的知識,數(shù)據(jù)挖掘中的關(guān)聯(lián)性就是要發(fā)現(xiàn)網(wǎng)絡(luò)故障中存在的普遍規(guī)律,通過對故障規(guī)律的挖掘,找到問題的根源,解決問題。在使用關(guān)聯(lián)規(guī)則算法可以有效對故障信息處理的數(shù)據(jù)庫進(jìn)行選擇,通過對數(shù)據(jù)庫的選擇,確定挖掘的對象,然后根據(jù)挖掘任務(wù)對對象進(jìn)行有規(guī)律的分析,這樣就有可能發(fā)現(xiàn)故障發(fā)生出現(xiàn)的數(shù)據(jù)網(wǎng)絡(luò)參數(shù),網(wǎng)絡(luò)設(shè)備的信號以及故障發(fā)生地點,時間等之間的規(guī)律。關(guān)聯(lián)規(guī)則算法還運用在故障預(yù)警機制之上,通過對故障的有效預(yù)警,可以預(yù)測故障發(fā)生的趨勢,這樣就能夠做出科學(xué)合理的預(yù)防,找到規(guī)律所在,提前遏制故障的發(fā)生,減少網(wǎng)絡(luò)危害,提高網(wǎng)絡(luò)安全。
數(shù)據(jù)挖掘技術(shù)的本質(zhì)就是將有效的信息傳遞出去。挖掘技術(shù)能夠有效整合大量的數(shù)據(jù)信息,提升信息的價值,讓人們能夠在大量的數(shù)據(jù)信息之中找到自己想要的信息。目前數(shù)據(jù)挖掘技術(shù)的應(yīng)用越來越廣泛,他的穩(wěn)定發(fā)展得以讓信息安全廣泛的傳遞,為人們提供更多的便利。
網(wǎng)絡(luò)世界既給人們生活帶來了極大的便利,但同時又存在著許多風(fēng)險。網(wǎng)絡(luò)上存在著許多信息,這些信息有真有假,有些錯誤的信息導(dǎo)致人們的個人信息安全以及個人財產(chǎn)遭受著巨大的威脅。數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)運維數(shù)據(jù)分析中的應(yīng)用不能單獨從一個面進(jìn)行分析,還要意識到網(wǎng)絡(luò)世界中的危險。網(wǎng)絡(luò)運維數(shù)據(jù)分析技術(shù)不能夠僅僅是為人們提供信息,還要確保數(shù)據(jù)挖掘技術(shù)提供信息的安全性和可靠性。雖然數(shù)據(jù)挖掘技術(shù)能夠快速在大量繁雜的信息之中挖掘到有價值的信息,但是在處理信息過程中,也很有可能存在著一些安全問題,有些網(wǎng)站沒有設(shè)置安全保障,其中存在著一些安全鳳險,所以在進(jìn)行信息處理過程中,還需要有數(shù)據(jù)挖掘防火墻技術(shù)有效規(guī)避外界的風(fēng)險,確保信息在一個安全健康的環(huán)境之中。在數(shù)據(jù)挖掘技術(shù)發(fā)展史還要結(jié)合其他的電子信息技術(shù),確保傳遞的信息能夠安全可靠。
數(shù)據(jù)挖掘技術(shù)主要是向外界輸出信息,很少能夠接受到外界的信息。在網(wǎng)絡(luò)運維數(shù)據(jù)分析是往往是被動的接受信息,為了提高信息傳輸?shù)男剩畔⒔邮占夹g(shù)也要進(jìn)行有效的發(fā)展。有輸出,有輸入,才能夠保證數(shù)據(jù)能夠快速的更新,安全的處理。
數(shù)據(jù)挖掘技術(shù)能夠讓大量的數(shù)據(jù)進(jìn)行傳輸和共享,滿足人們對于信息資源的需求?,F(xiàn)在是一個信息爆炸的時代,資源共享已經(jīng)達(dá)到了一定的水平,信息資源讓人們得到了大量的經(jīng)濟效益,促進(jìn)了人們生活水平的提高,但是在發(fā)展的同時,還要注意對個人信息的保護(hù)。不能在發(fā)展的過程中忽略了個人信息的安全。
由以上內(nèi)容可知,數(shù)據(jù)挖掘技術(shù)有效處理了大量的數(shù)據(jù),為人們提供了有價值的信息,促進(jìn)了網(wǎng)絡(luò)時代的發(fā)展。在當(dāng)下計算機技術(shù)不斷發(fā)展,這種數(shù)據(jù)挖掘技術(shù)在不斷成熟,網(wǎng)絡(luò)運維數(shù)據(jù)技術(shù)在數(shù)據(jù)挖掘技術(shù)的支持下得到了更好的發(fā)展,未來網(wǎng)絡(luò)將會朝著更加穩(wěn)定健康的方向。研究人員要根據(jù)當(dāng)下時代的發(fā)展方向,不斷對數(shù)據(jù)挖掘技術(shù)進(jìn)行深入研究,促進(jìn)時代的進(jìn)一步發(fā)展,為人們創(chuàng)造一個更好的生存空間。