姜大昌,李豐伊,甘 敏,黃 潔
云南省科學技術情報研究院
數(shù)據(jù)庫與數(shù)據(jù)挖掘技術探析
姜大昌,李豐伊,甘 敏,黃 潔
云南省科學技術情報研究院
在現(xiàn)代信息收集及信息儲存過程中,數(shù)據(jù)庫以及數(shù)據(jù)挖掘技術屬于十分重要的內容,在實際工作過程中發(fā)揮十分重要的作用,并且有著十分廣泛的應用。在當前數(shù)據(jù)存儲中,通過對數(shù)據(jù)挖掘技術進行合理有效應用,可對數(shù)據(jù)庫中所儲存數(shù)據(jù)進行更好應用,從而保證數(shù)據(jù)信息利用率能夠得以有效提升,使這些數(shù)據(jù)能夠發(fā)揮更好的作用。
數(shù)據(jù)庫;數(shù)據(jù)挖掘技術;應用
數(shù)據(jù)庫是當前儲存信息資源的一種主要系統(tǒng),可大量儲存相關信息資源,可為更好利用這些信息資源奠定理想基礎。而數(shù)據(jù)挖掘技術主要就是對數(shù)據(jù)進行尋找、轉化及分析的一種技術,能夠使一些比較雜亂的數(shù)據(jù)信息更加有序,可實現(xiàn)數(shù)據(jù)信息的更加有效利用。因此,在數(shù)據(jù)庫中有效運用數(shù)據(jù)挖掘技術可使兩者實現(xiàn)有效結合,使數(shù)據(jù)信息應用更加高效,提升其利用率及利用價值,保證數(shù)據(jù)信息資源作用能夠得以充分發(fā)揮。
1.1 Web數(shù)據(jù)庫技術
在當前網絡信息不斷建立及不斷發(fā)展過程中,Web技術具有十分廣泛的應用,通過對該技術進行應用可與數(shù)據(jù)庫內容實現(xiàn)有效結合,從而可使動態(tài)數(shù)據(jù)庫對實現(xiàn),并且Web數(shù)據(jù)庫系統(tǒng)當前已經成為特定性比較強的一種技術。在Web數(shù)據(jù)系統(tǒng)實際應用過程中,其能夠與數(shù)據(jù)庫之間實現(xiàn)記性連接,可使動態(tài)頁面得以實現(xiàn),可使用戶在不同領域內對有關實際內容進行操作,并且也能夠使遠程系統(tǒng)監(jiān)控得以實現(xiàn)。Web數(shù)據(jù)庫系統(tǒng)實現(xiàn)及應用可使數(shù)據(jù)存儲更加靈活,并且能夠使數(shù)據(jù)存儲更加安全,同時也能夠使數(shù)據(jù)應用更加方便。
1.2 數(shù)據(jù)庫挖掘
對于數(shù)據(jù)挖掘而言,其也被稱為數(shù)據(jù)庫中知識發(fā)現(xiàn),當前比較公認的定義即為在大量不完整,比較雜亂的一些隨機數(shù)據(jù)集合中,通過相關技術進行提取,從而獲得一些隱含的,并且具有較大利用價值的一些相關信息,對于所提取信息可通過規(guī)則、概念以及規(guī)律與模式等相關形式進行表示。對于數(shù)據(jù)挖掘而言,其屬于決策支持的一種過程,對各組織原有數(shù)據(jù)進行分析,并且對其實行歸納推理,在此基礎上對數(shù)據(jù)庫中潛在數(shù)據(jù)模式進行挖掘,從而可為管理人員更好進行決策提供一定理論依據(jù)及知識[1-2]。
2.1 分類法及預測法
在數(shù)據(jù)挖掘技術中,十分重要的一個環(huán)節(jié)就是對于無排列規(guī)律標號實行分類,這一點也屬于基礎環(huán)節(jié)。利用這種分類方式,才能夠正確地充分顯示出依據(jù)某些特定需求所挖掘出相關數(shù)據(jù)特點,在此基礎上依據(jù)各數(shù)據(jù)集所具備的不同特點對其進行劃分,使其在相同類別或者相似類別中。當前比較常見的就是決策樹、貝葉斯以及遺傳算法等。而對于預測法而言,其所指的就是在分析連續(xù)值函數(shù)模型基礎上,預測今后可能會出現(xiàn)的一些發(fā)展規(guī)律,并且對于這一過程而言,其相關數(shù)據(jù)集分類情況可提前預知。就當前實際情況而言,在數(shù)據(jù)預測方面所應用方法種類也比較多,主要包括回歸分析以及實踐序列等相關方法。
2.2 聚類分析法
在數(shù)據(jù)挖掘過程中,數(shù)據(jù)分析也是一個十分重要的環(huán)節(jié),選擇科學有效數(shù)據(jù)分析方法屬于數(shù)據(jù)挖掘能夠得以較好開展的基本保障。對于聚類分析法而言,其在數(shù)據(jù)挖掘技術中屬于進行數(shù)據(jù)分析的一種最常見方法,該方法所指的就是對于已經整合成為整體的物理對象及抽象對象,使其實行分類,并且對于相同或者比較相似的一些對象應當細化、深入分析,從而對相關數(shù)據(jù)能夠實現(xiàn)有效分類。在數(shù)據(jù)挖掘技術中,對于相關數(shù)據(jù)以聚類分析法實行分類及分析,其主要就是對事物間規(guī)律性進行充分認識,從而可使實現(xiàn)智能化深入學習不同領域內相關數(shù)據(jù)。對于聚類分析法而言,其主要可分為兩種不同方式,即模糊聚類與硬聚類,其中對于硬聚類而言,其所指的就是對數(shù)據(jù)對象實行精細劃分,使其能夠處于與其最相近類別中;對于模糊聚類而言,其所指的就是設置一定取值范圍,在此基礎上對數(shù)據(jù)對象實行劃分,所以可能會出現(xiàn)的現(xiàn)象就是一個對象具有多種不同類別。
2.3 關聯(lián)分析法
對于關聯(lián)分析法而言,其所利用的主要就是蝴蝶效應,該方法就是對事物之間關聯(lián)性及相互依賴性進行充分把握,在此基礎上有效預測其中規(guī)律。對于關聯(lián)分析法而言,在分析由數(shù)據(jù)挖掘技術而得到數(shù)據(jù)方面具有十分理想的效果,可對數(shù)據(jù)進行深入分析,對數(shù)據(jù)特點可充分把握,從而可為更高進行決策提供較好理論支持及依據(jù)[2-3]。
數(shù)據(jù)挖掘技術作為一種現(xiàn)代化數(shù)據(jù)獲取及分析處理技術,在社會上很多行業(yè)及領域內均具有十分廣泛的應用。其一,數(shù)據(jù)挖掘技術在現(xiàn)代科研領域內具有十分廣泛的應用,通過對該技術進行應用,可使大量實驗數(shù)據(jù)分析對較好實現(xiàn),可使數(shù)據(jù)分析實現(xiàn)智能化及自動化;其二,數(shù)據(jù)挖掘技術在市場營銷中具有十分廣泛的應用,在市場營造中通過對該技術進行應用,實現(xiàn)準確分析市場情況,在此基礎上可較好把握市場動態(tài)及消費者需求,從而也就能夠依據(jù)市場規(guī)律使決策人員制定更好決策,在預測市場發(fā)展方面具有不可替代的作用;其三,數(shù)據(jù)挖掘技術在互聯(lián)網中具有十分廣泛的應用,對于互聯(lián)網中數(shù)據(jù)挖掘技術的應用而言,其主要體現(xiàn)在兩個方面內容:利用數(shù)據(jù)挖掘技術可研制更優(yōu)秀搜索引擎;在當前搜索引擎系統(tǒng)的基礎上,可進一步開發(fā)更好層次系統(tǒng)及引擎[3]。
隨著現(xiàn)代社會信息時代快速發(fā)展,越來越多的現(xiàn)代化技術得以出現(xiàn),并且得到十分廣泛的應用,其中數(shù)據(jù)庫及數(shù)據(jù)挖掘技術就是比較常見的兩種。通過對數(shù)據(jù)庫及數(shù)據(jù)庫挖掘技術進行應用,可實現(xiàn)數(shù)據(jù)信息有效分析及處理,從而可更好實現(xiàn)信息利用。因此,相關工作人員應當對其充分了解及掌握,以便更好對其進行應用。
[1]梁琰.基于Web數(shù)據(jù)庫的數(shù)據(jù)挖掘技術及應用初探[J].科技展望,2015(32).
[2]李明江,唐穎,周力軍.數(shù)據(jù)挖掘技術及應用[J].中國新通信, 2012(22).
[3]唐明燈.基于數(shù)據(jù)庫技術的數(shù)據(jù)挖掘分析與研究[J].信息與電腦(理論版),2010(2).