數(shù)據(jù)與大數(shù)據(jù)的區(qū)分
掃描二維碼
隨時(shí)隨地手機(jī)看文章
大數(shù)據(jù)(big data)是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。大數(shù)據(jù)本身是基于數(shù)據(jù)價(jià)值化而構(gòu)建出來(lái)的新概念,雖然概念比較新,但是數(shù)據(jù)卻一直都在,所以大數(shù)據(jù)的核心并不在“大”上,而是基于大數(shù)據(jù)所構(gòu)建出的一個(gè)新的價(jià)值空間。
在理解大數(shù)據(jù)概念的時(shí)候,通常都有幾個(gè)較為明顯的誤區(qū),其一是只有足夠大的數(shù)據(jù)才能算是大數(shù)據(jù)范疇;其二是大數(shù)據(jù)和互聯(lián)網(wǎng)是隔離的;其三是大數(shù)據(jù)就是統(tǒng)計(jì)學(xué);其四是大數(shù)據(jù)會(huì)“殺熟”,應(yīng)該盡量遠(yuǎn)離大數(shù)據(jù)等等。
在大數(shù)據(jù)時(shí)代,任何體量的數(shù)據(jù)都可以采用大數(shù)據(jù)技術(shù)進(jìn)行處理,傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)處理方式也已經(jīng)并入到了大數(shù)據(jù)的技術(shù)體系,所以大數(shù)據(jù)技術(shù)本身對(duì)于數(shù)據(jù)量的大小并沒有絕對(duì)的要求,并不是說(shuō)數(shù)據(jù)量小就不能采用大數(shù)據(jù)技術(shù)。
目前大數(shù)據(jù)人才的培養(yǎng)既包括研究生教育(培養(yǎng)創(chuàng)新型人才),也包括專科教育和本科教育,隨著大數(shù)據(jù)技術(shù)體系的逐漸成熟,學(xué)習(xí)大數(shù)據(jù)的過(guò)程也會(huì)更為順利。
大數(shù)據(jù)本身是互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和傳統(tǒng)信息系統(tǒng)共同發(fā)展所導(dǎo)致的結(jié)果,所以大數(shù)據(jù)與互聯(lián)網(wǎng)存在緊密的聯(lián)系,事實(shí)上目前互聯(lián)網(wǎng)領(lǐng)域是推動(dòng)大數(shù)據(jù)發(fā)展的重要力量,所以大數(shù)據(jù)與互聯(lián)網(wǎng)本身就密不可分。從互聯(lián)網(wǎng)發(fā)展的前景來(lái)看,大數(shù)據(jù)是互聯(lián)網(wǎng)價(jià)值的重要體現(xiàn),所以未來(lái)大數(shù)據(jù)的價(jià)值必然會(huì)不斷得到提升。目前大數(shù)據(jù)分析技術(shù)往往會(huì)采用統(tǒng)計(jì)學(xué)的方式,這導(dǎo)致不少人認(rèn)為大數(shù)據(jù)就是統(tǒng)計(jì)學(xué),實(shí)際上大數(shù)據(jù)在進(jìn)行數(shù)據(jù)分析的過(guò)程中,不僅需要統(tǒng)計(jì)學(xué)技術(shù),也需要機(jī)器學(xué)習(xí)相關(guān)技術(shù)。當(dāng)然,統(tǒng)計(jì)學(xué)作為大數(shù)據(jù)的三大基礎(chǔ)學(xué)科,在大數(shù)據(jù)技術(shù)體系中占有重要的地位。