摘要:大數(shù)據(jù)智能分析和數(shù)據(jù)信息挖掘是指從大量的數(shù)據(jù)信息中提取出具有統(tǒng)計(jì)規(guī)律的更基礎(chǔ)、更實(shí)用的信息的一種關(guān)鍵方法。這也是挖掘有價(jià)值信息的重要途徑。本文采用文獻(xiàn)研究法和系統(tǒng)研究法,介紹了大數(shù)據(jù)智能分析和數(shù)據(jù)信息挖掘方法的實(shí)現(xiàn),提出了該方法所涉及的核心技術(shù),介紹了這些技術(shù)的實(shí)現(xiàn),給出了這些技術(shù)的類型,闡述了大數(shù)據(jù)信息挖掘技術(shù)的相關(guān)技術(shù),以期為大數(shù)據(jù)智能分析和數(shù)據(jù)挖掘提供參考。
關(guān)鍵詞:大數(shù)據(jù);智能;相關(guān)技術(shù);信息挖掘
0概述
大數(shù)據(jù)信息時(shí)代伴隨著5g移動(dòng)通信技術(shù)、在線教學(xué)、機(jī)器語言學(xué)習(xí)、云計(jì)算技術(shù)、移動(dòng)數(shù)據(jù)計(jì)算、分布式數(shù)據(jù)計(jì)算、并行數(shù)據(jù)計(jì)算、文件批處理等高新技術(shù)的不斷發(fā)展和涌現(xiàn)。邊緣數(shù)據(jù)計(jì)算、數(shù)據(jù)流計(jì)算、圖參數(shù)計(jì)算和區(qū)塊鏈技術(shù)在科研、醫(yī)療、通信、電子商務(wù)等諸多領(lǐng)域,信息和數(shù)據(jù)的增長(zhǎng)呈現(xiàn)幾何數(shù)量級(jí)的趨勢(shì)。大量增加的海量數(shù)據(jù)中包含著許多非常有價(jià)值的數(shù)據(jù)信息。如何使更聰明和高效的分析和研究,以便更好地利用相關(guān)數(shù)據(jù)信息,挖掘數(shù)據(jù)信息與實(shí)際應(yīng)用價(jià)值隱藏在大量數(shù)據(jù)信息是一個(gè)關(guān)鍵的問題在大數(shù)據(jù)領(lǐng)域的技術(shù)在這個(gè)階段。隨著數(shù)據(jù)量的增加,對(duì)大量信息數(shù)據(jù)的分析和挖掘變得越來越困難。如何挖掘和搜索大量相關(guān)信息的數(shù)據(jù)有效,尤其是如何總結(jié)和捕獲更根本和實(shí)際數(shù)據(jù)與統(tǒng)計(jì)法律這種信息數(shù)據(jù),在這個(gè)階段,它已成為一個(gè)熱點(diǎn)話題領(lǐng)域的科學(xué)研究大數(shù)據(jù)技術(shù)。
1大數(shù)據(jù)智能化分析技術(shù)
大數(shù)據(jù)智能是指利用自然語言進(jìn)行處理、信息數(shù)據(jù)搜索和機(jī)器語言學(xué)習(xí)提取有用知識(shí)并轉(zhuǎn)化為相應(yīng)決策和智慧的方式和過程。大數(shù)據(jù)技術(shù)智能的核心技術(shù)通常包括大數(shù)據(jù)技術(shù)、人工智能技術(shù)、自然語言解析技術(shù)等,中間的大數(shù)據(jù)技術(shù)是大數(shù)據(jù)智能的本質(zhì)和基礎(chǔ)部分。人工智能技術(shù)屬于大數(shù)據(jù)智能技術(shù)的關(guān)鍵組成部分,自然語言解析技術(shù)、大數(shù)據(jù)技術(shù)和人工智能技術(shù)是大數(shù)據(jù)智能技術(shù)的關(guān)鍵組成部分,在大數(shù)據(jù)智能技術(shù)的實(shí)現(xiàn)中發(fā)揮著重要作用。
2大數(shù)據(jù)技術(shù)
所謂大數(shù)據(jù),是指現(xiàn)階段的一項(xiàng)熱門研究技術(shù)。不同領(lǐng)域的學(xué)者和研究單位對(duì)大數(shù)據(jù)相關(guān)技術(shù)的描述有著不同的定義?,F(xiàn)階段比較權(quán)威的聲明主要有麥肯錫、IBM、維基百科高德納研究所、國際數(shù)據(jù)中心和美國國家標(biāo)準(zhǔn)與技術(shù)研究所,許多權(quán)威機(jī)構(gòu)基于大數(shù)據(jù)技術(shù)對(duì)數(shù)據(jù)信息量大、數(shù)據(jù)信息種類多、價(jià)值密度低、變化快等各種特點(diǎn)實(shí)施了不同的側(cè)重點(diǎn)。大數(shù)據(jù)通常被定義為:數(shù)據(jù)信息量相對(duì)巨大。如何從大量的信息數(shù)據(jù)中找到高價(jià)值、有效的信息數(shù)據(jù),是現(xiàn)階段大數(shù)據(jù)技術(shù)領(lǐng)域的主要研究方向和熱點(diǎn)問題。對(duì)于數(shù)據(jù)信息的不斷涌現(xiàn),相關(guān)技術(shù)人員在保證信息數(shù)據(jù)響應(yīng)的有效性的同時(shí),在對(duì)流數(shù)據(jù)信息進(jìn)行實(shí)時(shí)處理時(shí),也要注意一些防范措施。
3人工智能技術(shù)
一般來說,人工智能技術(shù)大致可以分為弱人工智能水平、強(qiáng)人工智能水平和超人工智能水平三個(gè)層次。人工智能水平較弱,需要處理數(shù)據(jù)計(jì)算方面的問題,數(shù)據(jù)計(jì)算是根據(jù)人工定義的規(guī)則來實(shí)現(xiàn)的,大部分的優(yōu)化方案都使用了與人工智能修剪理論相關(guān)的優(yōu)化方案,應(yīng)用云計(jì)算技術(shù)平臺(tái)存儲(chǔ)大數(shù)據(jù)信息,實(shí)現(xiàn)并行計(jì)算運(yùn)行;強(qiáng)人工智能水平需要應(yīng)對(duì)的主要是指在有限的環(huán)境中感知信息的能力,即感知環(huán)境信息、聽覺和視覺功能的實(shí)現(xiàn),包括以傳感器設(shè)備為核心的物聯(lián)網(wǎng)相關(guān)技術(shù)。超級(jí)人工智能需要解決的問題是在不受限制的環(huán)境中進(jìn)一步識(shí)別的能力。它的實(shí)際性能是能夠理解和交互。其核心技術(shù)是與自我認(rèn)知語言理解能力、知識(shí)體系譜的構(gòu)建和推理功能相關(guān)的技術(shù)。
4自然語言的處理功能
自然語言的處理功能屬于大數(shù)據(jù)智能技術(shù)的三大核心技術(shù)之一。其關(guān)鍵技術(shù)是稀疏數(shù)據(jù)和平滑數(shù)據(jù)。這些工具包括OpenNLP和復(fù)旦NLP,通常處于機(jī)器翻譯、數(shù)據(jù)提取、文本分析和自動(dòng)響應(yīng)的水平。
5大數(shù)據(jù)信息挖掘技術(shù)
數(shù)據(jù)信息挖掘是指在數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí)的一個(gè)環(huán)節(jié)。它是一種借助算法從海量信息中發(fā)現(xiàn)關(guān)鍵信息的活動(dòng)。數(shù)據(jù)信息挖掘是在數(shù)據(jù)庫中進(jìn)行知識(shí)發(fā)現(xiàn)的操作。在海量、完整性可能缺失、干擾或隨機(jī)的實(shí)際數(shù)據(jù)信息中,它捕獲了事先不知道但具有實(shí)用價(jià)值的信息和知識(shí)的操作過程。數(shù)據(jù)信息挖掘可以捕獲的知識(shí)類型包括模型、統(tǒng)計(jì)規(guī)律、應(yīng)用程序規(guī)則、使用模式、條件約束等。數(shù)據(jù)信息挖掘過程中使用的關(guān)鍵技術(shù)一般包括:統(tǒng)計(jì)知識(shí)、機(jī)器語言學(xué)習(xí)、數(shù)據(jù)庫和數(shù)據(jù)庫可視化。統(tǒng)計(jì)知識(shí)通常用于研究數(shù)據(jù)信息的捕獲、分析、解析和標(biāo)注功能。機(jī)器語言的學(xué)習(xí)一般是研究計(jì)算機(jī)系統(tǒng)如何根據(jù)數(shù)據(jù)信息進(jìn)行學(xué)習(xí),數(shù)據(jù)庫和數(shù)據(jù)信息倉庫一般是指一種可擴(kuò)展的數(shù)據(jù)庫技術(shù),它可以用于數(shù)據(jù)挖掘過程中,在大數(shù)據(jù)集中獲得高效的、可擴(kuò)展的功能。信息數(shù)據(jù)檢索是指對(duì)相關(guān)文檔和關(guān)鍵信息進(jìn)行檢索的一種技術(shù)。
結(jié)語
綜上所述,在大數(shù)據(jù)時(shí)代,只有經(jīng)過智能分析,才能從數(shù)據(jù)信息中獲取有價(jià)值的數(shù)據(jù)。大數(shù)據(jù)信息挖掘可以最大限度地減少對(duì)傳統(tǒng)數(shù)據(jù)信息挖掘模型和算法的依賴,減少因果關(guān)系對(duì)數(shù)據(jù)挖掘準(zhǔn)確性的不利影響。大數(shù)據(jù)的智能分析與挖掘,能夠從大量數(shù)據(jù)中用統(tǒng)計(jì)規(guī)則獲取更多的基礎(chǔ)性、實(shí)用性信息,具有良好的發(fā)展前景。
參考文獻(xiàn)
[1]呂慶,崔維久,于德湖,蓋彤彤.BIM融合信息技術(shù)在智慧工地中的應(yīng)用研究[J/OL].施工技術(shù)(中英文):1-7[2021-11-17].http://kns.cnki.net/kcms/detail/10.1768.TU.20211116.1613.020.html.
[2]馮曉,佟澤華,豐佰恒,孫曉彬,石江瀚.科研大數(shù)據(jù)休眠:類型劃分及消解機(jī)制研究[J/OL].情報(bào)理論與實(shí)踐:1-13[2021-11-17].http://kns.cnki.net/kcms/detail/11.1762.g3.20211115.1942.008.html.
[3]呂笑增,王鑫.旅館場(chǎng)所性侵未成年人犯罪的預(yù)防與治理——以大數(shù)據(jù)視域下特種行業(yè)的陣地控制為例[J/OL].預(yù)防青少年犯罪研究,2021(S4):21-30[2021-11-17].http://kns.cnki.net/kcms/detail/10.1048.D.20211116.1117.006.html.
[4]武永超.大數(shù)據(jù)技術(shù)如何支撐流動(dòng)人口精準(zhǔn)治理?——以東莞“智網(wǎng)工程”為例[J/OL].人口與社會(huì):1-12[2021-11-17].https://doi.org/10.14132/j.2095-7963.2021.06.000.
[5]李洪辰.大數(shù)據(jù)視域下大學(xué)生社會(huì)主義核心價(jià)值觀的培育研究[J].繼續(xù)教育研究,2021(12):104-106.
[6]鄭冬冬,張明煜.大數(shù)據(jù)背景下大學(xué)生社會(huì)主義核心價(jià)值觀培育路徑構(gòu)建研究[J].繼續(xù)教育研究,2021(12):107-109.
[7]張定祥.大數(shù)據(jù)背景下的農(nóng)村計(jì)算機(jī)網(wǎng)絡(luò)信息技術(shù)的發(fā)展研究[J].中國稻米,2021,27(06):149.
[8]王軍.在新的征程上譜寫稅收現(xiàn)代化建設(shè)新篇章[J].稅收征納,2021(11):4-7.
[9]郭良東.襄陽不動(dòng)產(chǎn)繳稅“一網(wǎng)聯(lián)辦”方便更有感[J].稅收征納,2021(11):18-19.
[10]王明吉,秦詠.大數(shù)據(jù)視角下企業(yè)財(cái)務(wù)決策的變革舉措研究[J].經(jīng)營與管理,2021(12):76-80.
個(gè)人簡(jiǎn)介:李溶,女,籍貫:廣西壯族自治區(qū)桂林市資源縣,學(xué)歷:本科,就讀于遼東學(xué)院信息工程學(xué)院B1805計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),學(xué)號(hào):0914418027,研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。