這是小編對于大數(shù)據(jù)行業(yè)的一些思考!
掃描二維碼
隨時(shí)隨地手機(jī)看文章
在討論“大數(shù)據(jù)”時(shí)經(jīng)常出現(xiàn)的一個(gè)問題是,多大才算“大”。在很大程度上,這是一個(gè)語義問題。一般來說,“大數(shù)據(jù)”指的是數(shù)據(jù)集太大,無法在一臺計(jì)算機(jī)上操作或存儲。這些數(shù)據(jù)的數(shù)量通常遠(yuǎn)遠(yuǎn)超出任何一個(gè)人甚至一群人的分析能力。例如,一個(gè)人可能要花幾個(gè)星期的時(shí)間才能讀完《三體》(大約6000 kb)。然而,這個(gè)文件可能是存儲在消費(fèi)者外置硬盤上的數(shù)百萬個(gè)同樣大的文件之一,幾乎在任何電腦商店都可以買到(一個(gè)6TB的驅(qū)動器可以存儲1,000,000份《三體》),這代表了任何一個(gè)人一生都無法閱讀的文本量。從這個(gè)角度來看,牛津大學(xué)ARCUS-b系統(tǒng)是最新的“超級計(jì)算機(jī)”。
自2013年以來,認(rèn)知與進(jìn)化人類學(xué)研究所一直在使用該系統(tǒng)進(jìn)行高級數(shù)據(jù)分析和模擬。這個(gè)系統(tǒng),雖然令人印象深刻和有用,但并不能與許多現(xiàn)代云計(jì)算平臺競爭,目前大約有1500TB的空間。
目前,人類學(xué)領(lǐng)域有許多真正的“大數(shù)據(jù)”項(xiàng)目,如SESHAT數(shù)據(jù)檔案,在某種程度上還有eHRAF數(shù)據(jù)庫。這些數(shù)據(jù)庫是由少數(shù)人制作的作品的檔案,但盡管它們的規(guī)模和范圍令人印象深刻,但大多數(shù)數(shù)據(jù)分析師并不認(rèn)為它們是“大數(shù)據(jù)”。此外,這些聚合項(xiàng)目中的數(shù)據(jù)類型很少記錄個(gè)人級別的數(shù)據(jù)點(diǎn)。因此,它們代表了巨大的檔案資源,但并不一定涉及收集個(gè)人數(shù)據(jù)所面臨的道德困境。
然而,一些研究人員利用企業(yè)與學(xué)術(shù)的合作伙伴關(guān)系,或者找到了從Facebook、Twitter和其他在線社交網(wǎng)絡(luò)平臺等網(wǎng)站獲取數(shù)據(jù)的方法。其他研究人員利用智能手機(jī)和GPS跟蹤設(shè)備等電子設(shè)備被動產(chǎn)生的數(shù)據(jù)進(jìn)行研究。這可以通過訪問他們的數(shù)據(jù)服務(wù)器來實(shí)現(xiàn),但也可以通過“網(wǎng)絡(luò)抓取”或下載和重組信息(如用戶名、時(shí)間戳、帖子、回復(fù)、“贊”等)來實(shí)現(xiàn)。
我們希望熟是一種與平臺間的信任,是安全的個(gè)人信息保護(hù),是有效的關(guān)聯(lián)推薦。比如,不要像最近鬧得沸沸揚(yáng)揚(yáng)的蔚來一樣讓用戶信息被泄露這是最基礎(chǔ)的;比如,我喜歡諜戰(zhàn)片,你關(guān)聯(lián)推薦《叛逆者》《潛伏》《暗算》這是體貼的;我關(guān)注N95口罩,你推薦幾個(gè)優(yōu)選賣家也是合適的。作為消費(fèi)者,我們也并不是一味拒絕廣告,而是拒絕自己的時(shí)間被與自己無關(guān)的廣告占用。熟是了解,是信任,而不是被殺的理由。也許掌握好了這個(gè)度的平臺,才是掌握了真正的用戶密碼。
實(shí)際上,大屏一直比互聯(lián)網(wǎng)多一些管控,也多一些權(quán)威。而且大屏是面向家庭用戶的,對數(shù)據(jù)和算法的精準(zhǔn)度要求也沒那么苛刻,平臺的競爭壓力主要還在于內(nèi)容而非算法。當(dāng)然,未來是可以追求更加精準(zhǔn)的,畢竟一人戶家庭已經(jīng)超過四分之一,二人戶或者三人戶的收看規(guī)律也相對比較好跟蹤,基于這樣的大數(shù)據(jù)累積,基于自己的內(nèi)容庫進(jìn)行關(guān)聯(lián)推薦是第一步,既可以盤活內(nèi)容庫,又可以增加用戶活躍度和黏性,在此之上,不管是廣告關(guān)聯(lián)、產(chǎn)品推薦、還是更多業(yè)務(wù)開展,都是事半功倍、順理成章的。
奉賢區(qū)在全市率先成立“大數(shù)據(jù)沙龍”,同步啟用“賢數(shù)空間”,匯集十多家大數(shù)據(jù)相關(guān)的企業(yè)團(tuán)隊(duì)、基層園區(qū)社區(qū),共建數(shù)據(jù)治理、數(shù)據(jù)賦能孵化基地。旨在通過思想交匯、需求發(fā)掘、技術(shù)破題將需求導(dǎo)向、問題導(dǎo)向、效果導(dǎo)向有機(jī)結(jié)合,在基層社會治理中、在服務(wù)群眾生產(chǎn)生活中真正發(fā)揮數(shù)據(jù)價(jià)值。
下一步,區(qū)政務(wù)服務(wù)辦將持續(xù)深化數(shù)據(jù)服務(wù)體系建設(shè),加強(qiáng)公共數(shù)據(jù)管理,提升數(shù)據(jù)服務(wù)能級,拓展數(shù)據(jù)應(yīng)用場景,不斷賦能基層治理,助力數(shù)字政府建設(shè)。
除了“步數(shù)打榜”這些我們習(xí)以為常的功能以外,大數(shù)據(jù)深入應(yīng)用還默默支撐著基層治理智慧化管理。