大數(shù)據(jù)、數(shù)據(jù)分析和數(shù)據(jù)挖掘在處理數(shù)據(jù)的方式和目標(biāo)上存在明顯的區(qū)別。
1、大數(shù)據(jù)
大數(shù)據(jù)通常指的是在現(xiàn)有技術(shù)條件下無法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。它具有規(guī)模大、種類雜、快速化、價(jià)值密度低等特點(diǎn),需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力。大數(shù)據(jù)的“大”是一個(gè)相對(duì)概念,沒有具體標(biāo)準(zhǔn),如果一定要給一個(gè)標(biāo)準(zhǔn),那么10-100TB通常稱為大數(shù)據(jù)的門檻。
2、數(shù)據(jù)分析
數(shù)據(jù)分析是一個(gè)大的概念,指通過數(shù)學(xué)與計(jì)算機(jī)科學(xué)相結(jié)合的方法對(duì)數(shù)據(jù)進(jìn)行處理,以得出有意義的結(jié)論。數(shù)據(jù)分析可以包括數(shù)據(jù)統(tǒng)計(jì)、OLAP、數(shù)據(jù)挖掘等多種層次。
3、數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是從海量數(shù)據(jù)中找到人們未知的、可能有用的、隱藏的規(guī)則,可以通過關(guān)聯(lián)分析、聚類分析、時(shí)序分析等各種算法發(fā)現(xiàn)一些無法通過觀察圖表得出的深層次原因。
總之,大數(shù)據(jù)是一個(gè)比較寬泛的概念,它涵蓋了很多不同的技術(shù)和方法,包括數(shù)據(jù)分析、數(shù)據(jù)挖掘等。而數(shù)據(jù)分析和數(shù)據(jù)挖掘則是處理和分析大數(shù)據(jù)的兩種重要手段,它們?cè)谔幚頂?shù)據(jù)的方式和目標(biāo)上有所不同。