亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺析關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關(guān)系

        2015-08-15 00:54:11馬麗君
        科技視界 2015年20期
        關(guān)鍵詞:決策分析關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫

        馬麗君

        (白城師范學(xué)院計算機科學(xué)學(xué)院,吉林 白城 137000)

        淺析關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關(guān)系

        馬麗君

        (白城師范學(xué)院計算機科學(xué)學(xué)院,吉林 白城 137000)

        關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘是作為三種獨立的信息技術(shù)出現(xiàn)的,是數(shù)據(jù)庫研究、開發(fā)和應(yīng)用最活躍的分支之一,通過對三種技術(shù)的內(nèi)在聯(lián)系性和互補性分析,從而更好的使用數(shù)據(jù)庫技術(shù)處理各種信息需求,建立更加完善的數(shù)據(jù)庫應(yīng)用系統(tǒng)或新的決策系統(tǒng)。

        關(guān)系數(shù)據(jù)庫;數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;關(guān)系

        0 引言

        關(guān)系數(shù)據(jù)庫是20世紀70年代初提出來,經(jīng)過數(shù)據(jù)庫專家?guī)资甑呐Γ碚摵蛯嵺`都取得了顯著成果,標志著數(shù)據(jù)庫技術(shù)的日益成熟。但它仍然難以實現(xiàn)對關(guān)系數(shù)據(jù)庫中數(shù)據(jù)的分析,不能很好地支持決策,因此在80年代,產(chǎn)生了數(shù)據(jù)倉庫的思想,90年代,數(shù)據(jù)倉庫的基本原理、架構(gòu)形式和使用原則都已確定。主要技術(shù)包括對數(shù)據(jù)庫中數(shù)據(jù)訪問、網(wǎng)絡(luò)、C/S結(jié)構(gòu)和圖形界面,一些大公司已經(jīng)開始構(gòu)建數(shù)據(jù)倉庫。針對數(shù)據(jù)倉庫中迅速增長的海量數(shù)據(jù)的收集、存放,用人力已經(jīng)不能解決,那么數(shù)據(jù)倉庫中有用的知識的提取就需要數(shù)據(jù)挖掘來實現(xiàn)。數(shù)據(jù)挖掘與統(tǒng)計學(xué)子領(lǐng)域“試探性數(shù)據(jù)分析”及人工智能子領(lǐng)域“知識發(fā)現(xiàn)”和機器學(xué)有關(guān),是一門綜合性的技術(shù)學(xué)科。了解關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘三者之間的區(qū)別與聯(lián)系,使之更好的使用這3種技術(shù),處理各種信息需求是非常必要和重要的。

        1 關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘之間的關(guān)系

        1.1 關(guān)系數(shù)據(jù)庫和數(shù)據(jù)倉庫之間的聯(lián)系與區(qū)別

        關(guān)系數(shù)據(jù)庫是面向事務(wù)的設(shè)計,數(shù)據(jù)倉庫是一個面向主題的設(shè)計;關(guān)系數(shù)據(jù)庫存儲在線事務(wù)數(shù)據(jù),數(shù)據(jù)倉庫通常存儲歷史數(shù)據(jù),關(guān)系數(shù)據(jù)庫的設(shè)計將盡量避免冗余,但數(shù)據(jù)倉庫是傾向于引入冗余;關(guān)系數(shù)據(jù)庫設(shè)計用于捕獲數(shù)據(jù),數(shù)據(jù)倉庫設(shè)計用于分析數(shù)據(jù)。傳統(tǒng)的關(guān)系數(shù)據(jù)庫面向以事務(wù)處理為主的系統(tǒng)應(yīng)用,所以它無法滿足決策支持系統(tǒng)的分析要求。事務(wù)處理和分析處理有非常不同的性質(zhì),他們有不同的需求數(shù)據(jù)。

        1.2 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘之間的聯(lián)系與區(qū)別

        數(shù)據(jù)挖掘是基于數(shù)據(jù)倉庫和多維數(shù)據(jù)庫中的數(shù)據(jù),找到數(shù)據(jù)的潛在模式進行預(yù)測,它可以對數(shù)據(jù)進行復(fù)雜處理。大多數(shù)情況下,數(shù)據(jù)挖掘是讓數(shù)據(jù)從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘數(shù)據(jù)庫中。從數(shù)據(jù)倉庫中直接得到進行數(shù)據(jù)挖掘的數(shù)據(jù)有許多優(yōu)點,因為數(shù)據(jù)倉庫中數(shù)據(jù)的清理和數(shù)據(jù)挖掘中幾乎是相同的,如果數(shù)據(jù)在數(shù)據(jù)倉庫中已被清除,數(shù)據(jù)挖掘中不再被清除,并且數(shù)據(jù)不一致也得到了解決。數(shù)據(jù)倉庫是數(shù)據(jù)挖掘的先期步驟,通過數(shù)據(jù)倉庫的構(gòu)建,提高了數(shù)據(jù)挖掘的效率和能力,保證了數(shù)據(jù)挖掘中的數(shù)據(jù)的寬廣性和完整性。

        1.3 關(guān)系數(shù)據(jù)庫與數(shù)據(jù)挖掘之間的聯(lián)系與區(qū)別

        數(shù)據(jù)挖掘的數(shù)據(jù)源不一定是數(shù)據(jù)倉庫。也可以是一個關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),但要事先進行數(shù)據(jù)預(yù)處理,才能用于數(shù)據(jù)挖掘。數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘的關(guān)鍵步驟,并且是數(shù)據(jù)挖掘過程中的主要工作部分。因此,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘沒有必然的聯(lián)系,有些人簡單地認為,數(shù)據(jù)倉庫是數(shù)據(jù)挖掘的準備,這種理解是不全面的,也可以使用關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)作為數(shù)據(jù)挖掘的數(shù)據(jù)源。

        2 三種技術(shù)的應(yīng)用

        2.1 應(yīng)用價值

        2.1.1 關(guān)系數(shù)據(jù)庫

        關(guān)系數(shù)據(jù)庫的主要價值體現(xiàn)在事務(wù)處理。關(guān)系數(shù)據(jù)庫已經(jīng)滲透到各行各業(yè)的日常事務(wù),該事務(wù)管理離不開關(guān)系數(shù)據(jù)庫的應(yīng)用系統(tǒng),這是對傳統(tǒng)事務(wù)管理的一個重大突破,是社會甚至家庭不可或缺的工具,它對社會的應(yīng)用價值是100%。

        2.1.2 數(shù)據(jù)倉庫

        數(shù)據(jù)倉庫的主要價值體現(xiàn)在為決策分析提供數(shù)據(jù)源。一方面,在一個事務(wù)中,用戶要求高效的訪問系統(tǒng)和數(shù)據(jù)庫,操作時間應(yīng)該短。在一個決策分析中,決策問題的一些請求可能會導(dǎo)致系統(tǒng)的操作,解決這一問題的決策分析需要遍歷大多數(shù)數(shù)據(jù)庫中的數(shù)據(jù),這對一般日常事務(wù)處理系統(tǒng)是困難的,所以操作數(shù)據(jù)和決策分析數(shù)據(jù)應(yīng)該分開。另一方面,決策數(shù)據(jù)需求問題。在決策分析時,由于不同的應(yīng)用系統(tǒng)中,實體、字段存在數(shù)據(jù)類型、名稱和格式的不符,需要在集成時進行轉(zhuǎn)換,這個轉(zhuǎn)換必須在決策之前完成;一些決策數(shù)據(jù)需要動態(tài)更新,需要經(jīng)常進行匯總和總結(jié),這些需求用事務(wù)處理系統(tǒng)解決比較繁瑣。三是數(shù)據(jù)的操作模式問題。決策分析人員要以專業(yè)用戶身份,使用各種工具以各種形式來操作數(shù)據(jù),對數(shù)據(jù)操作的結(jié)果以商業(yè)智能的方式表達出來。事務(wù)處理系統(tǒng)不能滿足這一要求,只有數(shù)據(jù)倉庫系統(tǒng)能夠滿足數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)環(huán)境的要求,所以使用數(shù)據(jù)倉庫中的數(shù)據(jù)省去了對數(shù)據(jù)預(yù)處理的步驟。

        2.1.3 數(shù)據(jù)挖掘

        面對日益激烈的市場競爭,客戶對迅速應(yīng)答各種業(yè)務(wù)問題的能力要求越來越高,對過量數(shù)據(jù)的及時處理要求越來越高,帶來的挑戰(zhàn)一方面大規(guī)模、復(fù)雜數(shù)據(jù)系統(tǒng)讓用戶感覺漫無頭緒,無法開始;另一方面,這些大量數(shù)據(jù)背后隱藏很多有意義的有價值的決策信息。如計算機界都熟知的“啤酒與尿布”的故事,就是零售業(yè)巨頭“沃爾瑪”從大量銷售數(shù)據(jù)中分析出來的規(guī)律:美國的男士在下班要去超市買嬰兒尿布,同時他們還會買啤酒?!拔譅柆敗本桶堰@兩種“毫不相干”的商品擺放在靠近的貨架上,并且還擺放一些下灑小菜,使這些商品銷量大增。所以應(yīng)用數(shù)據(jù)挖掘從大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,具有具體的指導(dǎo)意義。

        2.2 應(yīng)用領(lǐng)域

        2.2.1 關(guān)系數(shù)據(jù)庫

        關(guān)系數(shù)據(jù)庫應(yīng)用領(lǐng)域非常廣泛,如:證券行業(yè)、醫(yī)院、銀行、銷售部門、公司或企業(yè),以及政府、國防工業(yè),科學(xué)和技術(shù)發(fā)展領(lǐng)域等等,這些領(lǐng)域都需要使用數(shù)據(jù)庫來存儲數(shù)據(jù)。例如:人事管理系統(tǒng)、工資管理系統(tǒng),xxx部門信息管理系統(tǒng),手機話費管理系統(tǒng)等,都需要關(guān)系數(shù)據(jù)庫作為后臺提供數(shù)據(jù)源。

        2.2.2 數(shù)據(jù)倉庫

        數(shù)據(jù)倉庫應(yīng)用領(lǐng)域主要有兩個方面:一是全局應(yīng)用。因為數(shù)據(jù)倉庫獲得來自多方面的數(shù)據(jù),所以在把數(shù)據(jù)向數(shù)據(jù)倉庫輸入時,要進行轉(zhuǎn)換、計算和綜合等集成處理。通過處理把來自不同地方的數(shù)據(jù)源轉(zhuǎn)換成統(tǒng)一的格式,以促進全局應(yīng)用。二是復(fù)雜系統(tǒng)。信息處理的要求越來越復(fù)雜,除了數(shù)據(jù)處理操作,如添加、刪除、修改、和統(tǒng)計匯總,高級管理層也希望對歷史的和現(xiàn)在的數(shù)據(jù)進行各種復(fù)雜性分析,以支持決策。數(shù)據(jù)倉庫中就是存儲了舊的歷史數(shù)據(jù),方便復(fù)雜分析、應(yīng)用,為高層決策服務(wù)。

        2.2.3 數(shù)據(jù)挖掘

        數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域主要表現(xiàn)在特定應(yīng)用問題和應(yīng)用背景。數(shù)據(jù)挖掘技術(shù)已經(jīng)應(yīng)用于各行各業(yè),如電信,保險,交通,學(xué)校、銀行、超級市場等。例如:數(shù)據(jù)挖掘技術(shù)應(yīng)用在大學(xué)。高校擴招,學(xué)生增加到幾萬人,但是學(xué)生的學(xué)習積極性不高,成績不好,因此引入數(shù)據(jù)挖掘技術(shù)找出影響學(xué)生學(xué)習積極性和學(xué)習成績的原因,制定措施,提高教育和教學(xué)質(zhì)量。分析的數(shù)據(jù)源是考試成績和成績之外的影響因素,分析的方法是采用關(guān)聯(lián)規(guī)則、模型庫、去“噪”處理、粗糙集等進行數(shù)據(jù)挖掘,得出的結(jié)論是:傳統(tǒng)的學(xué)習方法不能完全滿足需要,改進教學(xué)方法和教學(xué)模式,從而調(diào)動學(xué)生學(xué)習的積極性,提高教學(xué)質(zhì)量。

        3 關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的融合

        日常事務(wù)處理需要關(guān)系數(shù)據(jù)庫,構(gòu)建分析處理環(huán)境需要數(shù)據(jù)倉庫,幫助決策者尋找數(shù)據(jù)之間的潛在的關(guān)聯(lián)需要數(shù)據(jù)挖掘。他們之間是相互聯(lián)系又有區(qū)別的,不能互相取代的,又需要相互融合。數(shù)據(jù)倉庫中的數(shù)據(jù)并不是最新的,專有的,而是來源于其他關(guān)系數(shù)據(jù)庫,它是建立在一個更全面和完善的信息應(yīng)用的基礎(chǔ)上,用于支持高層決策分析的數(shù)據(jù)基地。數(shù)據(jù)倉庫是數(shù)據(jù)庫新技術(shù),到目前為止,數(shù)據(jù)倉庫仍用關(guān)系數(shù)據(jù)庫管理系統(tǒng)管理數(shù)據(jù)。數(shù)據(jù)挖掘是從大量存儲在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫中發(fā)現(xiàn)有趣知識的過程。只有這三個數(shù)據(jù)庫技術(shù)互相融合,取長補短,各盡其責,才能更好的為廣大用戶所使用,為社會各個領(lǐng)域所應(yīng)用。

        [1]華冠萍.數(shù)據(jù)倉庫、數(shù)據(jù)挖掘及OLAP之兩兩關(guān)系[J].福建電腦,2007,8.

        [2]牛承珍.馬季蘭.淺談數(shù)據(jù)挖掘應(yīng)用[J].山西科,2008.5.20.

        [3]李軍紅,胡或.淺析數(shù)據(jù)倉庫、聯(lián)機分析處理和數(shù)據(jù)挖掘[J].科技信息,2007.

        馬麗君(1962—),女,白城師范學(xué)院計算機科學(xué)學(xué)院,副教授,研究方向為數(shù)據(jù)庫及應(yīng)用。

        曹明明]

        猜你喜歡
        決策分析關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫
        關(guān)系數(shù)據(jù)庫在高爐數(shù)據(jù)采集系統(tǒng)中的應(yīng)用
        山東冶金(2022年2期)2022-08-08 01:51:30
        基于大數(shù)據(jù)應(yīng)用的智能公交決策分析平臺
        基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
        當前軍事決策分析關(guān)注的幾個問題
        分布式存儲系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計
        電子制作(2016年15期)2017-01-15 13:39:15
        探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
        基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實踐
        基于索引結(jié)構(gòu)的關(guān)系數(shù)據(jù)庫關(guān)鍵詞檢索
        基于GIS的城市交通流模擬與決策分析
        河南科技(2014年19期)2014-02-27 14:15:46
        一種基于數(shù)據(jù)圖劃分的關(guān)系數(shù)據(jù)庫關(guān)鍵詞檢索方法
        9 9久热re在线精品视频| 国产2021精品视频免费播放| 国产成人亚洲精品电影| 免费看男女啪啪的视频网站| 美丽的小蜜桃在线观看| 强奷乱码中文字幕| 99久久人妻精品免费二区| 亚洲另类精品无码专区| 亚洲精品天堂av免费看| 亚洲av高清资源在线观看三区 | 99麻豆久久精品一区二区| 黄色国产一区二区99| 狠狠躁天天躁无码中文字幕图| 好紧好爽免费午夜视频| 日日碰狠狠丁香久燥| 亚洲欧洲精品成人久久曰不卡 | 国产三级国产精品国产专播| 国产黄大片在线观看画质优化| 亚洲一卡2卡3卡4卡5卡精品| 亚洲精品456| 日本黑人人妻一区二区水多多| 免费av日韩一区二区| 中文无码日韩欧| 熟妇无码AV| 国产理论亚洲天堂av| 精品久久久久久无码中文野结衣| 亚洲成a人v欧美综合天堂麻豆| 免费a级毛片无码a∨免费| 日本va中文字幕亚洲久伊人| 大地资源在线观看官网第三页| 2021久久最新国产精品| 一本色道久久综合亚州精品| 欧美xxxxx高潮喷水| 国产精品爽爽v在线观看无码| 免费观看国产精品| 亚洲一区二区三区国产精品| 一本到在线观看视频| 亚洲av无码国产剧情| 高跟丝袜一区二区三区| 亚洲中文字幕精品久久久| 人妻丰满av无码中文字幕|