數(shù)據(jù)挖掘和數(shù)據(jù)分析的區(qū)別是什么?數(shù)據(jù)挖掘挖掘出來的是人類未知的東西。數(shù)據(jù)分析的是我們已知的,天氣不好的時候交通可能會堵,這是分析出來的,不是數(shù)據(jù)挖掘的,因為我們知道天氣不好和交通不好有關(guān)系,這個知識我一開始就有了。數(shù)據(jù)挖掘是挖掘未知知識。
大數(shù)據(jù)的挑戰(zhàn)是什么?一個是實時的海量數(shù)據(jù)分析,數(shù)據(jù)量太大,但又要實時分析,時效性要求特別高。第二是高度可擴展的數(shù)據(jù)倉庫。數(shù)據(jù)倉庫是數(shù)據(jù)挖掘的基礎(chǔ)技術(shù),數(shù)據(jù)倉庫和現(xiàn)在的大數(shù)據(jù)概念也有一定的沖突,因為數(shù)據(jù)倉庫要求所有數(shù)據(jù)之間的關(guān)聯(lián)都被保留,不被切斷。我們希望數(shù)據(jù)倉庫能夠一天比一天分析更多的數(shù)據(jù),這是一個挑戰(zhàn)。解決這個問題,對于未來的數(shù)據(jù)挖掘,未來的高速聯(lián)機分析都有很大幫助。
數(shù)據(jù)是資產(chǎn)。當(dāng)你擁有了大量的歷史數(shù)據(jù),便可以在歷史數(shù)據(jù)上去做數(shù)據(jù)挖掘,做數(shù)據(jù)發(fā)現(xiàn)。如果有機會讓數(shù)據(jù)資產(chǎn)化,將是很大的價值。