房庭棟
摘要:傳統(tǒng)意義上的知識獲取往往是知識工程師從專家的經驗和既有信息體系中進行進一步的分析、篩選、比較、綜合提取所需信息。然而,由于知識工程師所擁有知識儲備量的局限性,所獲得知識的可信度應該有所降低。目前,傳統(tǒng)的知識獲取技術對龐大的數(shù)據量無能為力,數(shù)據挖掘技術得以迅速興起并指導眾多實踐環(huán)節(jié)。
關鍵詞:數(shù)據挖掘技術;分類方法;應用
前言
近年來,隨著我國進入大數(shù)據時代,互聯(lián)網技術被廣泛應用到我國各個行業(yè)領域,對提高我國人民的工作效率及工作質量起到了較好的積極作用,能夠有效提高各種數(shù)據信息的利用率,為個人及組織的發(fā)展提供有利支持。通過對數(shù)據挖掘技術進行分析,探究大數(shù)據時代背景下數(shù)據挖掘技術的應用,有利于提出一些可靠的參考依據,使相關工作人員能夠更好地運用這一技術,在提高工作效率的同時,降低人力成本,為我國社會長遠發(fā)展提供可靠的技術支持。
1數(shù)據挖掘技術分析
1.1數(shù)據挖掘
作為一種現(xiàn)代化的技術,數(shù)據挖掘技術在各個行業(yè)領域體現(xiàn)出較高的應用價值,能夠在第一時間掌握相關產品的使用情況,對海量的數(shù)據信息進行優(yōu)化,以此提高數(shù)據信息的利用效率,為企業(yè)重要決策提供可靠的參考依據。根據以往數(shù)據挖掘技術的發(fā)展情況來看,這一技術已經發(fā)展到能夠從模糊、復雜的數(shù)據中找出有用信息,所以在技術方面提出的要求較高,想要發(fā)揮這一技術的作用,就必須要重視對互聯(lián)網技術的運用。
1.2聚類分析
就當前情況來看,聚類分析法在數(shù)據挖掘中的應用效果較好,可以對比較抽象、理解難度較高的事物進行形象化的分組,之后按照不同的性質對其進行分析。與傳統(tǒng)技術相比,這一方法可以快速完成海量數(shù)據的劃分處理,將其中有價值的信息找出來。同時,聚類分析包括了模糊聚類和硬聚類這兩種分類方式,其中模糊聚類可以對模糊數(shù)據進行劃分,實現(xiàn)對數(shù)據信息的有效分類;而硬聚類是一種比較貼合數(shù)據信息的分類方式。雖然以上兩種數(shù)據信息的分類方式存在一定區(qū)別,但是能夠起到同樣的效果,可以實現(xiàn)對數(shù)據信息的有效劃分。
1.3特征性數(shù)據分析
作為數(shù)據挖掘中比較常用的一種方式,特征性數(shù)據分析就是按照不同的特征對數(shù)據信息進行分析,將其中有價值的信息找出來。與其他技術相比,特征性數(shù)據分析法體現(xiàn)出較好的便捷性,在大部分數(shù)據分析中都有著較好的應用效果,是當前相關人員的重點研究內容之一。對于特征性數(shù)據分析法的應用,可以采用各種各樣的方法,比如選擇可視化技術來進行數(shù)據的挖掘和搜集,將數(shù)據挖掘技術的功能效用充分發(fā)揮出來;比如利用遺傳基因算法來進行數(shù)據分析,實現(xiàn)對海量數(shù)據的選擇和重組;比如利用人工神經網絡來進行數(shù)據收集,通過在數(shù)據終端完成神經網絡的建立,實現(xiàn)對有用信息的快速搜集。
2數(shù)據挖掘技術的實踐應用場景
數(shù)據挖掘技術已經應用于許多領域,如學校、銀行、電信、股票市場、保險、運輸、零售等領域得到了廣泛應用。
2.1在電信行業(yè)中的應用
在信息化時代背景下,電信行業(yè)的發(fā)展速度不斷加快,在帶來更多經濟效益的同時,也出現(xiàn)了各種各樣的問題,想要滿足用戶的實際需求,就必須要提高自身的服務水平,幫助用戶解決問題。一般在電信技術的服務過程中,對數(shù)據的需求量較大,整個技術服務過程很容易受到數(shù)據流的沖擊,以致電信技術的服務質量無法得到保障,難以解決技術服務中存在的問題。面對這種情況,需要借助數(shù)據挖掘技術來提高數(shù)據處理效率,實現(xiàn)對電信數(shù)據的有效分析,將其中的規(guī)律找出來,結合用戶提供的信息對技術服務進行改進,使電信技術的服務質量得以有效提升。
2.2在制造行業(yè)中的應用
隨著我國社會經濟的快速發(fā)展,我國人民的生活水平逐漸提升,在選購各種生活產品的時候,提出了更高的質量要求,這就需要制造行業(yè)對數(shù)據挖掘技術進行有效應用,以此保證產品質量,充分滿足我國人民的生活需求。具體來講,在應用數(shù)據挖掘技術進行制造活動的時候,能夠對整個生產過程進行實時監(jiān)管,便于及時找出產品生產中存在的問題,結合相關數(shù)據信息對其進行處理。通過對產品生產過程的數(shù)據信息進行收集和分析,能夠為往后的產品生產活動提供可靠的參考依據,幫助企業(yè)解決產品生產中存在的問題,在提高企業(yè)生產效率的同時,降低生產成本,為企業(yè)帶來更高的經濟效益。
2.3數(shù)據挖掘技術在高校中的應用
隨著招生規(guī)模的擴大,高校學生人數(shù)已經達到數(shù)萬,甚至數(shù)十萬的規(guī)模??荚嚦煽兊慕y(tǒng)計和分析已經達到數(shù)十萬的數(shù)據,除了學習成績還有很多數(shù)據需要進行分類。傳統(tǒng)的學習結果分析方法不能完全滿足需求。為此,引入數(shù)據挖掘技術,找出影響學生成績的真正原因,并制定相應的優(yōu)化方案和措施,提高教育教學質量。
2.4科研領域
在科研領域中有許多信息,比如中國知網數(shù)據庫中擁有很多有價值的信息,包括科研文章、期刊以及論文等,這既需要對其進行及時的分類,將同類文章放在一起。同時在數(shù)據挖掘技術應用中信息重復等也是需要考慮的問題,要保證獲取的信息不重復,還要保證信息的準確性。因此在在科研領域中數(shù)據挖掘技術占據著非常重要的地位,開展嚴謹科研實驗的時候,因為實驗涉及的數(shù)據比較多,且對實驗數(shù)據進行處理時會產生各種各樣的數(shù)據,此時要想確保數(shù)據處理的準確性和簡潔性,會選用數(shù)據挖掘技術對數(shù)據進行處理,從而就能很大程度提高實驗的精準度,保障實驗結果。
2.5數(shù)據挖掘技術在金融企業(yè)中的應用
(1)數(shù)據挖掘技術廣泛應用于證券業(yè)。數(shù)據挖掘技術作為一種分析和決策輔助工具,越來越受到國內證券公司的重視。
(2)數(shù)據挖掘技術也應用于銀行業(yè)。數(shù)據挖掘可以從大量的銀行交易歷史記錄中發(fā)現(xiàn)或挖掘出數(shù)據背后關聯(lián)更深、更詳細的方面。
(3)數(shù)據挖掘技術也應用于保險業(yè)。保險福利的確定:被保險人的分類有助于確定保險福利的適當金額。通過數(shù)據挖掘,保險賠付機構可以得到如何確定不同行業(yè)、年齡和社會水平的人的保險福利。它還可以同時進行風險相關性分析:如,進一步結合數(shù)據挖掘技術購買了一種保險的人是否同時購買了另一種保險,進而預測哪些客戶將可能再次購買新保險,為銷售行為提供依據。
2.6數(shù)據挖掘技術在零售企業(yè)中的應用
從超市銷售管理系統(tǒng)、客戶信息管理等操作數(shù)據中,我們可以收集商品銷售信息、客戶信息、庫存信息以及其他信息。大量數(shù)據從各種應用系統(tǒng)中收集,根據不同的條件分類,并存儲在數(shù)據倉庫中,允許經理、分析師、采購人員、市場人員和客戶訪問數(shù)據。數(shù)據挖掘工具用于分析數(shù)據,并為管理者提供高效的科學決策工具。
結束語
數(shù)據挖掘技術是一個發(fā)展非常迅速的領域。本文概述了數(shù)據挖掘的定義、目標、相關領域和一般方法。21世紀是信息時代的社會?!靶畔⒉粌H是一種資源,也是一種財富”。利用所提供的眾多公開數(shù)據信息,充分進行數(shù)據挖掘,將為數(shù)據庫的應用和人類文明的新時代開辟廣闊的前景。
參考文獻:
[1]吳琛.數(shù)據挖掘技術在互聯(lián)網領域的應用研究[J/OL].電腦知識與技術,2019(36)[2019-11-21].https://doi.org/10.14004/j.cnki.ckt.20191114.001.
[2]康力升,莫沂錦.基于決策樹的有機農產品消費偏好應用研究[J].中國市場,2019(32):127-128.
[3]李國杰,程學旗.大數(shù)據研究:未來科技及經濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據的研究現(xiàn)狀與科學思考[J].中國科學院院刊,2012,27(06):647-657.