【摘要】? ? 本文簡要介紹數(shù)據(jù)挖掘、云計(jì)算等技術(shù)概念,從通信、鐵路、電力等行業(yè)分析了現(xiàn)階段數(shù)據(jù)挖掘技術(shù)的使用情況,指出了數(shù)據(jù)挖掘程序現(xiàn)存問題,圍繞云計(jì)算技術(shù)進(jìn)行程序開發(fā),以Hadoop為運(yùn)行環(huán)境,增強(qiáng)數(shù)據(jù)挖掘程序的運(yùn)行能力,最大化發(fā)揮云計(jì)算技術(shù)功能,帶動(dòng)各行業(yè)量化分析工作有序進(jìn)行。
【關(guān)鍵詞】? ? 通信? ? 云計(jì)算? ? 市場預(yù)測? ? 數(shù)據(jù)挖掘
在物聯(lián)網(wǎng)環(huán)境中,人們使用多種電子設(shè)備,進(jìn)行網(wǎng)絡(luò)連接。結(jié)合視覺網(wǎng)絡(luò)數(shù)據(jù)統(tǒng)計(jì)可知:國內(nèi)移動(dòng)終端客戶數(shù)量處于穩(wěn)步增長狀態(tài),在[2016,2021]年間,移動(dòng)客戶數(shù)量增加了18倍。預(yù)計(jì)在2023年,移動(dòng)用戶數(shù)量將會(huì)是2016年用戶數(shù)的10倍,移動(dòng)終端總數(shù)將會(huì)達(dá)到120億。在此種較大基數(shù)的網(wǎng)絡(luò)數(shù)據(jù)資料環(huán)境下,積極使用云計(jì)算技術(shù),各行業(yè)開展數(shù)據(jù)挖掘工作,能夠有效獲取市場預(yù)測信息。
一、技術(shù)概述
1.1數(shù)據(jù)挖掘
數(shù)據(jù)智能分析是從大量的數(shù)據(jù)資料中提取有用信息的過程,表現(xiàn)為多級(jí)加工程序,含有多個(gè)運(yùn)行流程。在數(shù)據(jù)挖掘時(shí),按照一定法則進(jìn)行源數(shù)據(jù)的提煉、優(yōu)化,在前期處理完成時(shí),再使用數(shù)據(jù)挖掘、智能匹配等技術(shù),選擇適用算法開展資料分析,繼而有效獲取數(shù)據(jù)分析結(jié)果。
數(shù)據(jù)挖掘是數(shù)據(jù)智能分析的一個(gè)環(huán)節(jié),在較大數(shù)據(jù)量、完整性不足、規(guī)則性不強(qiáng)、含有噪聲、清晰度不高等各類數(shù)據(jù)資料中,借助特定算法捕獲數(shù)據(jù)中的特定規(guī)律,進(jìn)行有效信息挖掘。此技術(shù)的應(yīng)用,在一定程度上符合特定業(yè)務(wù)的數(shù)據(jù)資料分析需求,比如客戶消費(fèi)傾向、學(xué)生成績優(yōu)勢(shì)科目等。數(shù)據(jù)挖掘過程,融合了多個(gè)領(lǐng)域的專業(yè)內(nèi)容,比如數(shù)據(jù)統(tǒng)計(jì)、智能學(xué)習(xí)、規(guī)律識(shí)別等。數(shù)據(jù)挖掘技術(shù)能夠在大規(guī)模數(shù)據(jù)量中,有效捕獲價(jià)值信息,具有較強(qiáng)的市場預(yù)測功能[1]。在數(shù)據(jù)挖掘技術(shù)使用與推廣的各項(xiàng)工作中,能夠在短時(shí)間內(nèi)完成資料分析,給予人們決策、市場投資等多重參考依據(jù),以量化分析結(jié)果獲得合理公正的決策方案。
1.2云計(jì)算
其一,虛擬化技術(shù)。此技術(shù)的使用旨在有效解決硬件性能分配不均、老舊硬件運(yùn)行能力欠佳等問題。虛擬化技術(shù)的使用,有效改善了底層物理硬件,使其具有更為透明的特點(diǎn),對(duì)軟件、硬件兩個(gè)模塊未進(jìn)行融合處理。在單個(gè)性能硬件中,有效衍生出多組虛擬資源,有效整合虛擬資源,提升物理硬件利用效果。其二,大規(guī)模數(shù)據(jù)處理技術(shù)。在云計(jì)算技術(shù)中,是使用大規(guī)模數(shù)據(jù)處理程序,以并聯(lián)運(yùn)行模型為基礎(chǔ)形式。在此技術(shù)程序中,含有Map、Reduce兩種函數(shù)。在Map函數(shù)處理時(shí),采取逐行數(shù)據(jù)文件的提取與分析,對(duì)預(yù)處理完成數(shù)據(jù),將其劃分至新節(jié)點(diǎn)。在數(shù)據(jù)分配完成后,進(jìn)入Reduce函數(shù)處理環(huán)節(jié),完整讀取Map處理結(jié)果,對(duì)中間資料進(jìn)行合并分析。組合型數(shù)據(jù)處理技術(shù),對(duì)于較大數(shù)據(jù)量的資料,具有較強(qiáng)的處理能力。與此同時(shí),此技術(shù)表現(xiàn)出數(shù)據(jù)監(jiān)控能力,能夠自主排查數(shù)據(jù)處理異常位置,進(jìn)行數(shù)據(jù)處理任務(wù)重啟,確保數(shù)據(jù)處理質(zhì)量。
二、各行業(yè)數(shù)據(jù)挖掘的使用分析
2.1通信行業(yè)應(yīng)用
“云計(jì)算”強(qiáng)大的數(shù)據(jù)處理能力被廣為運(yùn)用在通信行業(yè)。在這個(gè)信息化時(shí)代下,人們?cè)谑褂秒娨暋⑹謾C(jī)、電腦等終端設(shè)備時(shí)所產(chǎn)生的上網(wǎng)行為數(shù)據(jù)如果能進(jìn)行處理和分析就可以挖掘出具有極高價(jià)值的信息,例如對(duì)用戶進(jìn)行清晰的定位,除了統(tǒng)計(jì)學(xué)意義上的基礎(chǔ)數(shù)據(jù)之外,還能洞察出他們的喜愛偏好、行為習(xí)慣、消費(fèi)水平等等。信息化程度越高,收集到的信息也越多,云計(jì)算能夠存儲(chǔ)海量的數(shù)據(jù),運(yùn)用分析處理技術(shù),從中為用戶得出更有價(jià)值的分析。運(yùn)營商可以運(yùn)用云計(jì)算,根據(jù)用戶的行業(yè)特性從而制定差異化的解決方案 [1]。
2.2鐵路行業(yè)應(yīng)用
以運(yùn)維系統(tǒng)為例,探索云計(jì)算技術(shù)為基礎(chǔ)的智能數(shù)據(jù)挖掘平臺(tái)運(yùn)行情況。
2.2.1智能感知網(wǎng)絡(luò)
在運(yùn)維系統(tǒng)中,添加了智能感知網(wǎng)絡(luò),有效集成了感知程序、信息處理等技術(shù),以較大數(shù)字量形式進(jìn)行信息傳輸,具有較強(qiáng)的故障診斷、信息校正、功能補(bǔ)償能力。系統(tǒng)中以列車感知為主,兼有站場、線路等感知模塊。各類感知網(wǎng)絡(luò)結(jié)構(gòu)中,擁有多個(gè)設(shè)備檢測模塊,能夠有效捕獲設(shè)備運(yùn)行資料,以數(shù)據(jù)化形式展示運(yùn)維資料,對(duì)于設(shè)備運(yùn)行資料給予量化分析。
2.2.2云計(jì)算融合的運(yùn)維系統(tǒng)
云計(jì)算以數(shù)據(jù)分析、數(shù)據(jù)處理為技術(shù)融合目標(biāo)。在互聯(lián)網(wǎng)平臺(tái)中,較大數(shù)量的硬件,依據(jù)特定規(guī)則進(jìn)行硬件連接。同時(shí)在需求改變的情況下,形成了低能耗、高效率的資源處理體系,在優(yōu)化基礎(chǔ)設(shè)施成本的基礎(chǔ)上,合理控制設(shè)備運(yùn)維支出。與此同時(shí),云計(jì)算表現(xiàn)出較強(qiáng)的計(jì)算能力,在存儲(chǔ)能力、數(shù)據(jù)安全等方面具有高性能,在特定硬盤發(fā)生質(zhì)量損壞時(shí),數(shù)據(jù)不會(huì)有丟失情況。在泛式通信體系中,便于用戶自由獲取數(shù)據(jù)資料[2]。智能運(yùn)維系統(tǒng)中,融合了智能感知系統(tǒng)架構(gòu)中的各類數(shù)據(jù),比如監(jiān)測、檢測等。在進(jìn)行數(shù)據(jù)整合分析、按類存儲(chǔ)時(shí),能夠有效處理動(dòng)態(tài)的、非動(dòng)態(tài)的各類數(shù)據(jù),確保數(shù)據(jù)查詢有效性,增強(qiáng)數(shù)據(jù)查詢便利性。與此同時(shí),結(jié)合各組設(shè)備各時(shí)段的運(yùn)行情況,積極使用智能算法,高效率、精準(zhǔn)獲取故障位置,有效解決系統(tǒng)之間聯(lián)通問題。
2.2.3運(yùn)維資料數(shù)據(jù)挖掘
數(shù)據(jù)挖掘技術(shù)在新型處理體系中,表現(xiàn)出更強(qiáng)的數(shù)據(jù)決策、數(shù)據(jù)分析、系統(tǒng)優(yōu)化各項(xiàng)能力,有效應(yīng)對(duì)數(shù)據(jù)量較大、增長能力較強(qiáng)、樣式多種的信息資源。數(shù)據(jù)挖掘技術(shù)的融合價(jià)值,集中體現(xiàn)在有效數(shù)據(jù)的整合分析方面,確保數(shù)據(jù)加工精準(zhǔn)性,有效提升數(shù)據(jù)挖掘?qū)哟巍T阼F路運(yùn)維體系中,采用人工智能算法,進(jìn)行數(shù)據(jù)分析,以往期設(shè)備運(yùn)行積存的大量數(shù)據(jù)為基礎(chǔ),高效運(yùn)行人工智能算法。
數(shù)據(jù)挖掘的運(yùn)行依賴于云計(jì)算技術(shù),以分布式架構(gòu)程序?yàn)榛A(chǔ),對(duì)數(shù)據(jù)資料進(jìn)行高效處理,確保初始資料、處理后數(shù)據(jù)存儲(chǔ)的完整性。在使用數(shù)據(jù)人工分析技術(shù)時(shí),應(yīng)對(duì)較大規(guī)模數(shù)據(jù)量,需要加強(qiáng)數(shù)據(jù)分析,減少數(shù)據(jù)判斷失誤問題。在使用數(shù)據(jù)挖掘技術(shù)時(shí),能夠高效獲取事件本質(zhì)與特征。
在鐵路行車安全視角下,加強(qiáng)運(yùn)維系統(tǒng)運(yùn)行,有效進(jìn)行車輛性能分析,積極制定預(yù)防整治措施,減少鐵路行車故障問題,緩解運(yùn)維人員數(shù)據(jù)處理、分類、分析的工作壓力。運(yùn)維系統(tǒng)的運(yùn)行,能夠?qū)I(yè)務(wù)文本、語音圖文、音頻各類資源進(jìn)行預(yù)測分析,具有較強(qiáng)的決策指導(dǎo)功能。
2.3電力行業(yè)應(yīng)用
以電網(wǎng)企業(yè)為視角,圍繞canopy-k-means算法進(jìn)行數(shù)據(jù)挖掘?qū)嵗治?。選擇某電網(wǎng)服務(wù)的企業(yè)用戶,調(diào)取其24小時(shí)時(shí)間范圍內(nèi)的用電資料,用作數(shù)據(jù)分析資料。數(shù)據(jù)采集頻率為15秒一次。數(shù)據(jù)采集完成時(shí),對(duì)數(shù)據(jù)資料進(jìn)行聚類分析,結(jié)合分析結(jié)果,掌握企業(yè)用電特點(diǎn)。
使用ETL對(duì)于采集獲取的數(shù)據(jù)進(jìn)行有效處理,使用canopy-k-means算法高效處理數(shù)據(jù),獲取兩個(gè)部分?jǐn)?shù)據(jù),開展數(shù)據(jù)有效分析,獲得兩種分析結(jié)果。其中A類分析的用電規(guī)律為:用電集中時(shí)段為晚上10點(diǎn)至次日五點(diǎn),白天用電量較少,電價(jià)政策對(duì)于A類分析結(jié)果而言,有助于企業(yè)減少電費(fèi)支出。B類分析結(jié)果為:用電集中時(shí)段為上午7點(diǎn)至晚上7點(diǎn),晚上用電量較少,結(jié)合電價(jià)與企業(yè)用電特點(diǎn),企業(yè)需要適當(dāng)改變集中用電時(shí)間,優(yōu)化用電成本。結(jié)合數(shù)據(jù)挖掘獲得的用電特點(diǎn)、用電規(guī)劃建議,能夠促使企業(yè)有效規(guī)劃用工時(shí)間,確保企業(yè)運(yùn)行順暢,優(yōu)化用電費(fèi)用。
2.4教育行業(yè)應(yīng)用
圍繞云計(jì)算技術(shù),進(jìn)行案例教學(xué)系統(tǒng)創(chuàng)建,同時(shí)在系統(tǒng)融合數(shù)據(jù)挖掘技術(shù),確保各項(xiàng)教學(xué)資源高效率使用。教學(xué)智能管理系統(tǒng)的構(gòu)建思路:系統(tǒng)創(chuàng)建時(shí),分別從教育規(guī)劃、案例資源庫、訓(xùn)練題庫為模塊開發(fā)視角,以教學(xué)應(yīng)用為主體,進(jìn)行系統(tǒng)開發(fā)。在系統(tǒng)開發(fā)時(shí),依據(jù)模型、平臺(tái)逐一完善系統(tǒng)功能。某高校進(jìn)行案例教學(xué)系統(tǒng)創(chuàng)建,旨在加強(qiáng)案例教學(xué)資源收集,為實(shí)踐教學(xué)提供發(fā)展平臺(tái)。教師群體作為案例資源庫的主要管理人員,教師在平臺(tái)中,可有效檢測學(xué)生學(xué)習(xí)情況,調(diào)取學(xué)生在線答題的資料,結(jié)合數(shù)據(jù)分析結(jié)果,進(jìn)行學(xué)生分組,開展針對(duì)性教學(xué)工作。同時(shí),此平臺(tái)可擴(kuò)展功能,以資源庫原有的案例項(xiàng)目為基礎(chǔ),進(jìn)行案例題型的標(biāo)模建設(shè),有效豐富新型案例,完善案例題庫,便于學(xué)生自主學(xué)習(xí)。
三、系統(tǒng)設(shè)計(jì)
3.1數(shù)據(jù)挖掘程序現(xiàn)存問題
在未融合云計(jì)算技術(shù)時(shí),數(shù)據(jù)挖掘系統(tǒng)的運(yùn)行,依賴于單機(jī)、服務(wù)器。因此系統(tǒng)結(jié)構(gòu)中,以二層機(jī)構(gòu)為主要類型。更為完善的系統(tǒng)是運(yùn)行在網(wǎng)絡(luò)終端的三層架構(gòu)。在系統(tǒng)運(yùn)行時(shí),會(huì)使用數(shù)據(jù)移向計(jì)算,具有信息前期存儲(chǔ)、數(shù)據(jù)后續(xù)集中處理等特點(diǎn)。系統(tǒng)此種運(yùn)行方式,產(chǎn)生較大時(shí)耗、通訊傳輸成本,甚至提升了數(shù)據(jù)空間的復(fù)雜性。
3.2云計(jì)算為視角的系統(tǒng)設(shè)計(jì)
在云計(jì)算技術(shù)支持下,能夠有效解決數(shù)據(jù)挖掘系統(tǒng)運(yùn)行存在的各類問題,兼容數(shù)據(jù)量計(jì)算、數(shù)據(jù)存儲(chǔ)等多項(xiàng)技術(shù),能夠?qū)Χ喾N數(shù)據(jù)進(jìn)行同步分析,表現(xiàn)出較強(qiáng)的數(shù)據(jù)分析、挖掘技術(shù)優(yōu)勢(shì)。在系統(tǒng)構(gòu)建時(shí),含有多種結(jié)構(gòu)層次。
其一,支撐平臺(tái)。此結(jié)構(gòu)層的運(yùn)行依賴于數(shù)據(jù)挖掘技術(shù),能夠確?;A(chǔ)信息資料存儲(chǔ)完整性。此程序中融合了數(shù)據(jù)分析、云計(jì)算等信息,組建成資源豐富的信息處理環(huán)境。其二,功能層。此結(jié)構(gòu)層的使用功能,是圍繞用戶需求開展多種數(shù)據(jù)分析與有效信息挖掘,結(jié)合用戶數(shù)據(jù)特點(diǎn),進(jìn)行市場預(yù)測。其三,服務(wù)層。在服務(wù)層體系中,以客戶端為視角,使用數(shù)據(jù)挖掘技術(shù),能夠有效連接客戶端、用戶,形成信息交互體系,以期從中挖掘較高價(jià)值的信息,以信息服務(wù)形式向用戶傳送分析結(jié)果。
3.3以Hadoop為運(yùn)行環(huán)境
以Hadoop為運(yùn)行平臺(tái),搭建數(shù)據(jù)挖掘系統(tǒng),能夠有效運(yùn)行數(shù)據(jù)挖掘系統(tǒng),掌握數(shù)據(jù)資料的處理過程[3]。
其一,數(shù)據(jù)預(yù)處理。數(shù)據(jù)挖掘技術(shù)在實(shí)踐應(yīng)用時(shí),是以大量數(shù)據(jù)資料為基礎(chǔ)。在數(shù)據(jù)預(yù)處理程序中,借助多種先進(jìn)性技術(shù),對(duì)數(shù)據(jù)進(jìn)行并行測算、數(shù)據(jù)更迭,確保數(shù)據(jù)共享效果。其二,數(shù)據(jù)存儲(chǔ)。數(shù)據(jù)挖掘技術(shù)獲得的數(shù)據(jù)資料,可對(duì)其進(jìn)行多種存儲(chǔ)處理,為后續(xù)中間數(shù)據(jù)調(diào)取與使用提供便利條件。在進(jìn)行數(shù)據(jù)存儲(chǔ)時(shí),可搭建不確定關(guān)系體系,確保數(shù)據(jù)存儲(chǔ)高效率。其三,數(shù)據(jù)分析。在挖掘技術(shù)中含有多種計(jì)算方法,能夠?qū)?shù)據(jù)信息進(jìn)行有效處理。在處理靜態(tài)數(shù)據(jù)時(shí),處理難度不高,對(duì)于數(shù)據(jù)挖掘技術(shù)未提出較高要求。在處理動(dòng)態(tài)變化、類型繁雜的數(shù)據(jù)時(shí),可使用數(shù)據(jù)挖掘技術(shù),確保分析質(zhì)量,提升算法優(yōu)化性。
四、結(jié)束語
綜上所述,在未融合云計(jì)算技術(shù)時(shí),初期的數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)量處理、數(shù)據(jù)分析方面表現(xiàn)出局限性,應(yīng)對(duì)數(shù)據(jù)量增加、數(shù)據(jù)類型復(fù)雜的情況下,需要進(jìn)行算法更新、技術(shù)升級(jí),以期發(fā)揮數(shù)據(jù)挖掘技術(shù)的應(yīng)用價(jià)值,準(zhǔn)確獲取市場預(yù)測信息,為各行業(yè)發(fā)展給出清晰方向。
參? 考? 文? 獻(xiàn)
[1]黃璐輝.云計(jì)算在通信行業(yè)的特點(diǎn)和應(yīng)用[J].中國新通信,2020,22(12):19.
[2]李長鵬,程濤.云計(jì)算與物聯(lián)網(wǎng)技術(shù)的數(shù)據(jù)挖掘分析[J].電子測試,2021(13):139-140+36.
[3]高曉川.云計(jì)算平臺(tái)下物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究[J].電子世界,2021(10):45-46.
[4]黃敏.基于云計(jì)算技術(shù)視角的大數(shù)據(jù)挖掘技術(shù)分析[J].數(shù)字技術(shù)與應(yīng)用,2019,37(11):96+98.
文新懿(1988.01),男,漢族,廣東潮州,電子與通信工程碩士學(xué)位,電子技術(shù)工程師,研究方向:工程技術(shù)(信息通信) 。