當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 《物聯(lián)網(wǎng)技術(shù)》雜志
[導(dǎo)讀]摘 要:大數(shù)據(jù)是從各種各樣來源中搜集得到的海量數(shù)據(jù)信息的總稱。從大數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)看, 大約90%的數(shù)據(jù)是非結(jié)構(gòu)化的,同時(shí)也也面臨復(fù)雜,性、安全和隱私風(fēng)險(xiǎn)等新挑戰(zhàn)。文章分析了企 業(yè)的大數(shù)據(jù)應(yīng)用,也提出了國家和政府部門未來建設(shè)大數(shù)據(jù)戰(zhàn)略應(yīng)用項(xiàng)目的建議。

政府使用大數(shù)據(jù)是為了提升和改善公共服務(wù),這與企業(yè) 利用其追求利潤異曲同工。

大數(shù)據(jù)是從各種各樣來源中搜集得到的海量數(shù)據(jù)信息的 總稱。對于傳統(tǒng)的關(guān)系型數(shù)據(jù)分析技術(shù)來說,其數(shù)據(jù)量太大, 未經(jīng)處理,同時(shí)也是非結(jié)構(gòu)化的。據(jù)統(tǒng)計(jì),現(xiàn)在每天產(chǎn)生2.5 艾字節(jié)(quintillion bytes)的數(shù)據(jù)信息,全球?qū)⒔?0%的數(shù) 據(jù)是過去兩年創(chuàng)造出來的。

此外,從大數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)看,大約90%的數(shù)據(jù)是非結(jié) 構(gòu)化的。來源于網(wǎng)絡(luò)和云的海量數(shù)據(jù),為發(fā)現(xiàn)、創(chuàng)造價(jià)值,以 及豐富商業(yè)智能支撐機(jī)構(gòu)決策提供了新的機(jī)遇。不過,大數(shù) 據(jù)也面臨復(fù)雜性、安全和隱私風(fēng)險(xiǎn)等新挑戰(zhàn)。同時(shí),對于新 技術(shù)和人類技能的開發(fā)來說,大數(shù)據(jù)是一種需要。

大數(shù)據(jù)重新定義了數(shù)據(jù)管理的范圍,由數(shù)據(jù)提取、轉(zhuǎn)換、 加載,或稱為 ETL (Extraction-Transformation-Loading),演 變?yōu)樵诖髷?shù)據(jù)應(yīng)用中凈化和組織非結(jié)構(gòu)化數(shù)據(jù)的新技術(shù)(如分 布式架構(gòu)技術(shù))。

盡管企業(yè)部門正引導(dǎo)大數(shù)據(jù)應(yīng)用的發(fā)展,公共部門也開 始對迅速增長的大數(shù)據(jù)具有洞察力,為實(shí)時(shí)決策提供幫助和 支持。

大數(shù)據(jù)有多個(gè)來源,包括互聯(lián)網(wǎng)、生物和產(chǎn)業(yè)部門、視頻、 電子郵件和社交媒體。許多白皮書、期刊論文和商業(yè)報(bào)告已經(jīng) 提出了政府利用大數(shù)據(jù),幫助其服務(wù)公眾和應(yīng)對傳統(tǒng)挑戰(zhàn)(如 醫(yī)療成本上升、創(chuàng)造就業(yè)、自然災(zāi)害和恐怖主義等)的路徑。

也有一些觀點(diǎn),就大數(shù)據(jù)是否真能改進(jìn)政府運(yùn)作效率提 出質(zhì)疑,因?yàn)檎仨毎l(fā)展新的能力,并采用新技術(shù)(比如分 布式和非結(jié)構(gòu)化查詢語言),通過數(shù)據(jù)組織和分析,將大數(shù)據(jù) 轉(zhuǎn)變?yōu)橛杏玫男畔ⅰ?

本文就政府是否能與企業(yè)一樣,將大數(shù)據(jù)應(yīng)用于公共服 務(wù)部門進(jìn)行了研究。我們首先比較了政府和企業(yè)在目標(biāo)、任務(wù)、 決策制定過程、決策者、組織架構(gòu)和戰(zhàn)略的差異,接著考察 了部分技術(shù)領(lǐng)先的國家當(dāng)前大數(shù)據(jù)應(yīng)用的狀況,這些國家包 括澳大利亞、日本、新加坡、韓國、英國和美國等。

本文也分析了一些企業(yè)的大數(shù)據(jù)應(yīng)用,這些技術(shù)也能應(yīng) 用在政府事務(wù)中。最后,我們提出了國家和政府部門未來建 設(shè)大數(shù)據(jù)戰(zhàn)略應(yīng)用項(xiàng)目的建議。

1文章主要觀點(diǎn)

企業(yè)、政府和研究機(jī)構(gòu)都能夠從他們捜集的海量大數(shù)據(jù) 中獲取價(jià)值;

大數(shù)據(jù)應(yīng)用領(lǐng)先的國家已實(shí)施大數(shù)據(jù)應(yīng)用項(xiàng)目,以提高 國家運(yùn)行效率、透明度、民眾福利和公共事務(wù)參與度,確保 經(jīng)濟(jì)增長和國家安全;

分析政府部門采用的大數(shù)據(jù)應(yīng)用項(xiàng)目,為其他國家提供 未來大數(shù)據(jù)行動的引導(dǎo)。

2企業(yè)和政府的大數(shù)據(jù)應(yīng)用比較

雖然企業(yè)和政府的主要任務(wù)并不沖突,但各自的舉措具 有不同的目標(biāo)和價(jià)值。企業(yè)的主要目標(biāo)是通過提供產(chǎn)品和服務(wù) 獲取利潤,發(fā)展或維持自身的競爭優(yōu)勢,創(chuàng)造令消費(fèi)者和其 他利益相關(guān)者滿意的價(jià)值。政府的主要目標(biāo)則是維持國內(nèi)穩(wěn)定, 實(shí)現(xiàn)可持續(xù)發(fā)展,確保公民的基本權(quán)利,改善國民福利和促 進(jìn)經(jīng)濟(jì)增長。

在競爭的市場環(huán)境下,大部分企業(yè)著眼于制定短期決策, 并且執(zhí)行人員數(shù)量也很有限。而政府的決策制定過程通常需 要更長的時(shí)間,經(jīng)過不同群體(包括官員、利益集團(tuán)和普通民 眾)反復(fù)討論和磋商,在彼此間達(dá)成一致后才能有最終結(jié)果。 因此,政府制定決策要完成很多程序性步驟,以降低決策風(fēng)險(xiǎn), 提高決策效率和確保其效果。由此看來,大數(shù)據(jù)在政府部門 和私有部門的應(yīng)用具有很大不同。

2.1數(shù)據(jù)集屬性比較

大數(shù)據(jù)環(huán)境是以信息技術(shù)為基礎(chǔ)的決策支持系統(tǒng)的演進(jìn): 從上世紀(jì)60年代的數(shù)據(jù)處理,到70-80年代的信息應(yīng)用,再

到90年代的決策支持模型,進(jìn)入2000年后的數(shù)據(jù)存儲和挖掘, 再就是今天的大數(shù)據(jù)。大部分與大數(shù)據(jù)相關(guān)的技術(shù)和分析應(yīng) 用是從2010年左右開始出現(xiàn)的,故大數(shù)據(jù)時(shí)代正處于早期階 段/發(fā)展初期。

大數(shù)據(jù)的屬性和挑戰(zhàn)可用3V來描述:海量(volume)、 速度(velocity)和多樣性(variety)海量是大數(shù)據(jù)的基本屬性, 各類機(jī)構(gòu)和組織在業(yè)務(wù)活動過程中產(chǎn)生數(shù)以百萬億字節(jié)的數(shù) 據(jù),數(shù)據(jù)容量越來越大;速度是指數(shù)據(jù)量增長越來越快,對 處理速度和響應(yīng)速度提出更高要求,運(yùn)用傳統(tǒng)的信息技術(shù)手 段難以有效處理,以及從中提取有價(jià)值的信息;多樣性是指 數(shù)據(jù)以各種各樣類型的出現(xiàn),包括結(jié)構(gòu)化的(SQL等傳統(tǒng)的 數(shù)據(jù)庫);半結(jié)構(gòu)化的(具有關(guān)鍵字和規(guī)則,但數(shù)據(jù)結(jié)構(gòu)不規(guī) 則或不完整)和非結(jié)構(gòu)化的(非組織性的數(shù)據(jù),沒有商業(yè)智能))

大數(shù)據(jù)的概念已經(jīng)表明,大數(shù)據(jù)不僅僅是海量的數(shù)據(jù), 還包括通過處理大數(shù)據(jù)從中獲取價(jià)值。如今,大數(shù)據(jù)與商業(yè)智 能、商業(yè)分析和數(shù)據(jù)挖掘是同義詞,已經(jīng)使商業(yè)智能從報(bào)告 和決策支持轉(zhuǎn)移到預(yù)測和制定未來行動綱領(lǐng)。新的數(shù)據(jù)管理 系統(tǒng)旨在應(yīng)對大數(shù)據(jù)帶來的挑戰(zhàn),如分布式架構(gòu)技術(shù)是一個(gè) 開源平臺,目前是在管理存儲和接入,以及高速并行處理大 規(guī)模數(shù)據(jù)集等方面應(yīng)用最為廣泛的技術(shù)。然而,對于很多企 業(yè),特別是不少中小企業(yè)來說,分布式技術(shù)是一個(gè)挑戰(zhàn)。因 為這些中小企業(yè)往往不具備應(yīng)用大數(shù)據(jù)需要的專業(yè)人員和經(jīng) 驗(yàn),他們需要外部資源幫助。應(yīng)該看到,大數(shù)據(jù)應(yīng)用需要的不 是純粹基于技術(shù)的技能,找到正確的分析大數(shù)據(jù)的技能,或 許是企業(yè)應(yīng)用大數(shù)據(jù)面臨的最大難題。對于大部分企業(yè)來說, 發(fā)現(xiàn)和選擇勝任的數(shù)據(jù)專家(在數(shù)據(jù)挖掘、可視化、操作和發(fā) 現(xiàn)等方面)是困難而昂貴的。

其他商業(yè)大數(shù)據(jù)技術(shù)包括Casandra數(shù)據(jù)庫,它是一個(gè) 動態(tài)的數(shù)據(jù)庫工具,采用行存儲格式,每一行能存儲二百萬 個(gè)數(shù)據(jù)單元。對于企業(yè)的另一個(gè)挑戰(zhàn)是選擇最適合他們的大 數(shù)據(jù)技術(shù):開源技術(shù)(如分布式架構(gòu)技術(shù))或者商業(yè)技術(shù)(如 Casandra, Cloudera, Hortonworks, MapR)。

政府在應(yīng)用大數(shù)據(jù)時(shí),不僅要處理多個(gè)來源、不同格 式數(shù)據(jù)集成等一般問題,而且還面臨一些特殊挑戰(zhàn),最大的 挑戰(zhàn)就是數(shù)據(jù)搜集。因?yàn)檎鸭臄?shù)據(jù)不僅來自于多種渠 道(如社交網(wǎng)絡(luò)、互聯(lián)網(wǎng)、眾包),也來自于不同的來源(如國 家、機(jī)構(gòu)和部門),捜集難度可想而知;其次,在國家之間分 享數(shù)據(jù)和信息是一個(gè)特殊的挑戰(zhàn)。跨國分享信息,由于涉及到 語言轉(zhuǎn)換和不同的文化背景(內(nèi)容的表現(xiàn)形式),分享和傳遞 的信息有可能失真;第三個(gè)挑戰(zhàn)是在一個(gè)國家不同的政府部門 和機(jī)構(gòu)之間分享數(shù)據(jù)。政府?dāng)?shù)據(jù)與商業(yè)數(shù)據(jù)最重要的不同就 在范圍和區(qū)域,其差異近幾年都在平穩(wěn)增長。政府(包括地方 政府和中央政府)在實(shí)施法律和規(guī)章、提供公共服務(wù)和監(jiān)管 金融交易的過程中積累了大量數(shù)據(jù)。這些數(shù)據(jù)的屬性、價(jià)值 和帶來的挑戰(zhàn),都不同于公司運(yùn)營中產(chǎn)生的數(shù)據(jù)。政府的大 數(shù)據(jù)特征屬性可以表述為存儲、安全和多樣性。通常,每個(gè) 政府機(jī)構(gòu)或部門都有自己的存儲機(jī)構(gòu),用于存儲公共或機(jī)密信 息,而且并不愿意分享各自的專有信息。


每個(gè)系統(tǒng)都保存有與其他系統(tǒng)隔絕的信息,這使得政府機(jī)構(gòu)和部門之間的數(shù)據(jù)集成更加復(fù)雜。彼此溝通的失敗有時(shí)是影響數(shù)據(jù)集成的重要原因。例如,在英國,警察機(jī)構(gòu)和醫(yī)院之間曾經(jīng)打算在暴力犯罪方面分享信息,但這一項(xiàng)目最終失敗,原因就是兩者之間溝通不足。另一個(gè)分享政府信息的挑戰(zhàn)是建立統(tǒng)一的數(shù)據(jù)格式,能夠允許不同機(jī)構(gòu)進(jìn)行分析。盡管大部分政府?dāng)?shù)據(jù)是結(jié)構(gòu)化的,但是從多種渠道和來源去搜集數(shù)據(jù)仍然是一個(gè)更大的困難。缺乏標(biāo)準(zhǔn)化的數(shù)據(jù)格式和軟件,以及從多個(gè)政府機(jī)構(gòu)的離散數(shù)據(jù)庫中提取有用信息的跨機(jī)構(gòu)解決方法,也是政府推進(jìn)大數(shù)據(jù)應(yīng)用面臨的挑戰(zhàn)。但由于政府的緊縮措施,導(dǎo)致其缺乏相應(yīng)資金去發(fā)展和推進(jìn)解決上述問題。

在使用大數(shù)據(jù)時(shí),政府必須解決相關(guān)的法律、安全和許可要求等問題。在搜集和使用大數(shù)據(jù)用于預(yù)測分析與保障公民隱私權(quán)之間,應(yīng)該有一條清晰的界限。表1所列是企業(yè)與政府大數(shù)據(jù)項(xiàng)目的屬性比較。

1企業(yè)與政府大數(shù)據(jù)項(xiàng)目的屬性對比

在美國,美國愛國者法案允許合法監(jiān)控,有時(shí)還可以監(jiān)控公民;電子通訊隱私法案允許相關(guān)部門不經(jīng)授權(quán)便可進(jìn)入電子郵件系統(tǒng);要對網(wǎng)絡(luò)情報(bào)共享和保護(hù)法案(CISPA)加以注意,它將允許安全機(jī)構(gòu)和私人網(wǎng)絡(luò)公司之間的信息共享,這增加了人們對誤解信息不適當(dāng)應(yīng)用的關(guān)注。

數(shù)據(jù)安全是政府大數(shù)據(jù)最基本的屬性,因此,搜集、存儲和使用大數(shù)據(jù)都需要特別注意。然而,目前大部分大數(shù)據(jù)技術(shù),包括Casandra數(shù)據(jù)庫和分布式技術(shù),都缺乏足夠的安全保護(hù)工具。對政府而言,確保安全則是又一個(gè)挑戰(zhàn)。

對于政府的大數(shù)據(jù)項(xiàng)目而言,確保獲取高度管制行業(yè)(比如金融服務(wù)和醫(yī)療機(jī)構(gòu))信息的合規(guī)性,是捜集數(shù)據(jù)的另一個(gè)障礙。比如,當(dāng)從與醫(yī)療相關(guān)的大數(shù)據(jù)獲取有效信息的時(shí)候,必須解決美國醫(yī)療管制制度對數(shù)據(jù)保護(hù)的問題。針對醫(yī)療行業(yè)的大數(shù)據(jù)分析,美國與醫(yī)療相關(guān)的兩個(gè)法案健康保險(xiǎn)攜帶和責(zé)任法案(HIPAA)、經(jīng)濟(jì)和臨床健康醫(yī)療信息技術(shù)法案(HITECH)均設(shè)置了很大障礙。圖1所示是美國的企業(yè)和政府的大數(shù)據(jù)集屬性比較圖。

大數(shù)據(jù)在政府部門的應(yīng)用

HIPAA保護(hù)涉及個(gè)人隱私的健康信息,并提出了保護(hù)電子數(shù)據(jù)和病人檔案的國家標(biāo)準(zhǔn),而且制定了保護(hù)在分析病人安全事件中病人身份和信息的規(guī)則。2009年,HITECH延伸了HIPAA在保護(hù)醫(yī)療記錄和醫(yī)療信息被不同機(jī)構(gòu)以電子方式使用方面的規(guī)定。這些法律規(guī)定限制了醫(yī)療記錄數(shù)據(jù)信息用于大數(shù)據(jù)分析的數(shù)量和類型。因?yàn)榇髷?shù)據(jù)定義涉及到大范圍的數(shù)據(jù),而這些法規(guī)把捜集數(shù)據(jù)和進(jìn)行分析限定在一個(gè)狹小的范圍。目前在美國,能夠用于大數(shù)據(jù)分析的醫(yī)療信息只能來自于志愿者提供。

企業(yè)使用大數(shù)據(jù),目的是了解消費(fèi)者的需求和行為,發(fā)展獨(dú)有的核心競爭力,并創(chuàng)新產(chǎn)品和服務(wù);政府使用大數(shù)據(jù),是為了通過預(yù)測性分析,提高政策透明度,增加公民對公共事務(wù)的參與度和預(yù)防犯罪,改善國家安全,通過更好的教育和醫(yī)療提高居民福利。

開發(fā)從大數(shù)據(jù)中提取更多價(jià)值的技術(shù),對于政府和企業(yè)來說都是持久挑戰(zhàn)。然而,對于政府的挑戰(zhàn)來得更尖銳,因?yàn)槠浔仨毚蛩椴块T間的阻隔以推進(jìn)數(shù)據(jù)集成,實(shí)現(xiàn)各部門信息共享,并建立統(tǒng)一的數(shù)據(jù)調(diào)控中心(如美國聯(lián)邦數(shù)據(jù)中心)。

2.2美國的大數(shù)據(jù)應(yīng)用

目前,世界上有一些發(fā)達(dá)國家已經(jīng)在政府部門開始推廣大數(shù)據(jù)應(yīng)用。通過分析和比較這些先發(fā)國家的大數(shù)據(jù)應(yīng)用,我們能了解當(dāng)前和未來需要大數(shù)據(jù)應(yīng)用聚焦和服務(wù)的地方,并為其他國家開展大數(shù)據(jù)應(yīng)用提供借鑒。

(美國)

為了對海量數(shù)據(jù)流的實(shí)時(shí)分析管理,美國政府和IBM在2002年合作開發(fā)了一個(gè)容量巨大、聚集性強(qiáng)的大數(shù)據(jù)基礎(chǔ)架構(gòu)。

IBM基于Hadoop、流計(jì)算、數(shù)據(jù)倉庫等開發(fā)的InfoSphereStream和BigData,被政府機(jī)構(gòu)和商業(yè)組織廣泛應(yīng)用于海量實(shí)時(shí)數(shù)據(jù)源的分析和可視化、二次應(yīng)用程序開發(fā)和系統(tǒng)管理等。

2009年,美國政府“一站式數(shù)據(jù)下載”網(wǎng)站data.gov正式上線,并作為向政府透明化和問責(zé)制邁進(jìn)的一個(gè)步驟。該網(wǎng)站包括了420894個(gè)數(shù)據(jù)集截至2012年8月),囊括了交通、經(jīng)濟(jì)、醫(yī)療、教育和人口服務(wù)等方面的數(shù)據(jù)。數(shù)據(jù)來源于多個(gè)方面,其中1279個(gè)由政府提供,236個(gè)由居民提供,103個(gè)由移動設(shè)備提供。

2010年,美國總統(tǒng)科學(xué)技術(shù)顧問委員會(聯(lián)邦政府協(xié)調(diào)非分類網(wǎng)絡(luò)和信息技術(shù)投資的主要機(jī)構(gòu))在《規(guī)劃數(shù)字化的未來》中建議,“聯(lián)邦政府的每一個(gè)機(jī)構(gòu)和部門,都需要制定一個(gè)應(yīng)對'大數(shù)據(jù)'的戰(zhàn)略”,標(biāo)志著大數(shù)據(jù)時(shí)代已經(jīng)正式來臨。

2012年,奧巴馬政府頒布了《大數(shù)據(jù)的研究和發(fā)展計(jì)劃》,通過提高從大型復(fù)雜的數(shù)字?jǐn)?shù)據(jù)集中提取知識和觀點(diǎn)的能力,進(jìn)而加快美國在科學(xué)與工程中的步伐,加強(qiáng)國家安全,并改變教學(xué)研究。這是一個(gè)數(shù)額高達(dá)2億美元的投資計(jì)劃,涉及多個(gè)聯(lián)邦部門和機(jī)構(gòu),包括白宮科學(xué)技術(shù)政策辦公室、美國國家自然基金會、美國國立衛(wèi)生研究院、美國國防部、美國能源部、美國衛(wèi)生與公眾服務(wù)部、美國地質(zhì)調(diào)查局等機(jī)構(gòu)。這個(gè)投資項(xiàng)目的主要目的是提高大數(shù)據(jù)核心技術(shù)的發(fā)展水平,加速科學(xué)和工程開發(fā),加強(qiáng)國家安全,轉(zhuǎn)換大數(shù)據(jù)教育和學(xué)習(xí)方式,擴(kuò)展開發(fā)和使用大數(shù)據(jù)技術(shù)的工作力量。

截至2014年2月,美國國立衛(wèi)生研究院(NIH)在亞馬遜網(wǎng)絡(luò)服務(wù)中心已經(jīng)積累了數(shù)以百萬億字節(jié)的人類遺傳變異數(shù)據(jù),研究人員因此能獲得和分析巨量數(shù)據(jù),而不用再去發(fā)展自身的超級計(jì)算能力。在2012年,美國國家科學(xué)基金會聯(lián)合美國國立衛(wèi)生研究院(NIH)實(shí)施了提高大數(shù)據(jù)科學(xué)與工程核心技術(shù)規(guī)劃,目的在于推進(jìn)從大量、多樣化、分布式、異質(zhì)性的數(shù)據(jù)集合中管理、分析、可視化和提取有用信息的核心科學(xué)技術(shù)。

美國其他政府機(jī)構(gòu)也開始進(jìn)行大數(shù)據(jù)分析。美國國家稅務(wù)局已經(jīng)在它的返回審查程序中集成了大數(shù)據(jù)分析能力。通過分析大量的數(shù)據(jù),美國國家稅務(wù)局能夠檢查、預(yù)防和處理避稅和案。美國國防部也在大數(shù)據(jù)相關(guān)項(xiàng)目花費(fèi)了數(shù)百萬美元,其目標(biāo)之一就是利用大數(shù)據(jù)發(fā)展自主機(jī)器人系統(tǒng)(學(xué)習(xí)機(jī)器)。

美國地方政府也開發(fā)了大數(shù)據(jù)項(xiàng)目。例如,在2011年,美國紐約州錫拉丘茲市政府與IBM合作開展了一個(gè)智慧城市項(xiàng)目,使用大數(shù)據(jù)幫助預(yù)測并阻止住宅空置。密歇根州政府信息技術(shù)部構(gòu)建了一個(gè)數(shù)據(jù)庫,提供密歇根州居民的相關(guān)信息,以便政府機(jī)構(gòu)提供更好的服務(wù)。

(2) 歐盟

2010年,歐盟正式發(fā)布“歐洲數(shù)字化議程”,旨在建立一個(gè)統(tǒng)一的“數(shù)字市場”,推動歐盟內(nèi)部高速和極速互聯(lián)網(wǎng)互聯(lián)互通和應(yīng)用共享,進(jìn)而促進(jìn)歐盟經(jīng)濟(jì)社會可持續(xù)發(fā)展,造福歐盟人民。2012年,歐盟委員會在“歐洲數(shù)字化議程及其挑戰(zhàn)”中制訂了大數(shù)據(jù)戰(zhàn)略,并強(qiáng)調(diào)了公共數(shù)據(jù)安全及挖掘公共機(jī)構(gòu)數(shù)據(jù)的價(jià)值潛力,同時(shí)滿足日益強(qiáng)烈的對個(gè)人數(shù)據(jù)安全保護(hù)的訴求;發(fā)展物聯(lián)網(wǎng),確保網(wǎng)絡(luò)安全及在線交易的數(shù)據(jù)處理安全。

(3) 英國

英國政府是最早推進(jìn)大數(shù)據(jù)規(guī)劃的歐洲國家。2004年,英國設(shè)立了水平掃描中心(HSC)項(xiàng)目,以提升政府處理跨部門和多學(xué)科挑戰(zhàn)的能力。2011年,水平掃描中心(HSC)啟動氣候變化的未來國際影響計(jì)劃,通過對多數(shù)據(jù)源進(jìn)行深度分析,研究解決氣候變化對食品和水的可獲得性,以及對地區(qū)或國際形勢的影響等問題。英國政府發(fā)起的另外一個(gè)項(xiàng)目是,2009年建立了http://data.gov.uk公共網(wǎng)站,來自七個(gè)政府部門的1000多個(gè)既有數(shù)據(jù)集對外開放,后來增到8633個(gè)數(shù)據(jù)集。

荷蘭、瑞士、英國和其他17個(gè)國家與IBM合作開發(fā)了一個(gè)名為DOME的超級計(jì)算系統(tǒng)項(xiàng)目。該系統(tǒng)每天能處理超過1EB的數(shù)據(jù),數(shù)據(jù)來源于射電望遠(yuǎn)鏡平方公里陣列(SKA),旨在通過探索百億億次的計(jì)算、數(shù)據(jù)傳輸和存儲等新興技術(shù),以及對每日采集的數(shù)據(jù)流進(jìn)行讀取、存儲和分析,解決一系列宇宙科學(xué)問題。這個(gè)大數(shù)據(jù)項(xiàng)目的總部位于英國曼徹斯特的JodrellBank天文臺。

(4) 韓國

2011年,韓國總統(tǒng)國家ICT戰(zhàn)略委員會發(fā)布了“大數(shù)據(jù)倡議”該委員會是最高層次的政府信息通信技術(shù)協(xié)同機(jī)構(gòu),其使命是在建立必要的基礎(chǔ)設(shè)施過程中發(fā)揮領(lǐng)導(dǎo)作用。“大數(shù)據(jù)倡議”旨在建立泛政府大數(shù)據(jù)網(wǎng)絡(luò)和分析系統(tǒng),推進(jìn)政府與私有部門之間的數(shù)據(jù)共享融合,建立公共數(shù)據(jù)診斷系統(tǒng),培養(yǎng)和培訓(xùn)合格的大數(shù)據(jù)專業(yè)人員;保障個(gè)人信息安全,以及改善相關(guān)法律,發(fā)展大數(shù)據(jù)基礎(chǔ)設(shè)施和技術(shù),發(fā)展大數(shù)據(jù)管理和分析技術(shù)。

很多韓國政府機(jī)構(gòu)已經(jīng)提出了相關(guān)的行動計(jì)劃。例如,韓國衛(wèi)生部建立了社會福利綜合管理網(wǎng)絡(luò),分析來源于35個(gè)機(jī)構(gòu)的385個(gè)不同類型的公共數(shù)據(jù),綜合管理中央政府和地方政府提供的福利和服務(wù)。食品、農(nóng)業(yè)、森林與漁業(yè)部、公共行政與安全部(MOPAS)計(jì)劃推出預(yù)防手足口病的綜合系統(tǒng),該系統(tǒng)依托于分析動物疾病相關(guān)的海外大數(shù)據(jù)、海關(guān)出入境記錄、養(yǎng)殖場的跟蹤調(diào)查、牲畜遷移和養(yǎng)殖工人活動等相關(guān)的大數(shù)據(jù),實(shí)現(xiàn)預(yù)防目的。MOPAS的另一計(jì)劃是推出災(zāi)害預(yù)報(bào)系統(tǒng),該系統(tǒng)基于過去的災(zāi)害記錄和自動實(shí)時(shí)的天氣和地震預(yù)報(bào)進(jìn)行預(yù)測。此外,韓國生物信息中心計(jì)劃開發(fā)和運(yùn)營國家DNA管理系統(tǒng),該系統(tǒng)集成大量的DNA和病人醫(yī)療信息,為個(gè)人提供個(gè)性定制化的診斷和治療。

(5) 新加坡

2004年,針對國家安全、傳染病和其他國家層面關(guān)心的問題,新加坡政府與國家安全協(xié)作中心合作發(fā)布了風(fēng)險(xiǎn)評估和水平掃描計(jì)劃(RAHS)。通過對大數(shù)據(jù)的采集和分析,積極把控威脅國家安全的相關(guān)問題,包括恐怖襲擊、傳染病傳播和金融危機(jī)等。風(fēng)險(xiǎn)評估和水平掃描計(jì)劃實(shí)驗(yàn)中心(REC)于2007年開放,它聚焦于風(fēng)險(xiǎn)評估和水平掃描計(jì)劃相關(guān)政策制定的新技術(shù)工具,并通過大數(shù)據(jù)基礎(chǔ)設(shè)施系統(tǒng)升級來維持和強(qiáng)化這一能力。為通過大數(shù)據(jù)研究、分析和應(yīng)用創(chuàng)造價(jià)值,新加坡政府還推出了門戶網(wǎng)站http://data.gov.sg/,50多個(gè)政府部門的5000多個(gè)數(shù)據(jù)集通過此網(wǎng)站向公眾開放。

(6) 日本

日本政府已啟動多個(gè)利用既有大數(shù)據(jù)的計(jì)劃。從2005到2011年,文部科學(xué)省與相關(guān)的大學(xué)和研究機(jī)構(gòu)合作,設(shè)立了信息爆炸時(shí)代的新IT基礎(chǔ)設(shè)施項(xiàng)目。從2011年起,政府優(yōu)先解決地震、核電站災(zāi)難和受污染區(qū)域的重建和災(zāi)民安置,以及相關(guān)的社會和經(jīng)濟(jì)救濟(jì)。文部科學(xué)省與國家科學(xué)基金會合作提高研究和利用大數(shù)據(jù)的技術(shù),以預(yù)防、減輕和管理自然災(zāi)害。作為內(nèi)務(wù)省的兩個(gè)分支機(jī)構(gòu),信息和通信委員會和ICT戰(zhàn)略委員會,把“大數(shù)據(jù)應(yīng)用”作為日本面向2020年的關(guān)鍵使命。日本已經(jīng)成立了一個(gè)大數(shù)據(jù)專家組。

(7) 澳大利亞

澳大利亞政府信息管理辦公室(AGIMO)實(shí)施政府2.0計(jì)劃,為公眾獲取政府?dāng)?shù)據(jù)提供了渠道,政府2.0計(jì)劃推出了http://data.gov.au/網(wǎng)站,通過這一網(wǎng)站,讓公眾便捷、高效檢索和獲取政府?dāng)?shù)據(jù)。

2.3政府大數(shù)據(jù)項(xiàng)目實(shí)施情況比較

回顧大數(shù)據(jù)應(yīng)用領(lǐng)先國家的大數(shù)據(jù)項(xiàng)目情況,有三個(gè)顯著特點(diǎn):首先,現(xiàn)有的大多數(shù)大數(shù)據(jù)項(xiàng)目充其量只是數(shù)據(jù)量較大的應(yīng)用。這些國家的政府大數(shù)據(jù)應(yīng)用項(xiàng)目,大部分是基于共享存儲的結(jié)構(gòu)化數(shù)據(jù)庫,并不使用實(shí)時(shí)、動態(tài)和非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù);第二,公共部門致力于規(guī)范大型而復(fù)雜的數(shù)據(jù)集,政府期望大數(shù)據(jù)應(yīng)用來提升政府服務(wù)民眾的能力,以及解決國家面臨的重大挑戰(zhàn)問題,包括經(jīng)濟(jì)、醫(yī)療、就業(yè)、自然災(zāi)害和等。然而,大部分大數(shù)據(jù)應(yīng)用于居民(參與到公共事務(wù))和商業(yè)部門,而不是政府部門;第三,政府設(shè)立的大部分大數(shù)據(jù)項(xiàng)目剛剛開始或計(jì)劃未來實(shí)施,美國國家科學(xué)基金會和國家衛(wèi)生機(jī)構(gòu)的大數(shù)據(jù)計(jì)劃就是如此。這意味著,大數(shù)據(jù)在政府部門的應(yīng)用仍然處于發(fā)展的初級階段,只有少數(shù)項(xiàng)目在運(yùn)營(比如美國的RRP、新加坡的RAHS和英國的HSC)。

3結(jié)語

對不同來源和不同格式(結(jié)構(gòu)化/存儲的,半結(jié)構(gòu)化的/滯后的,非結(jié)構(gòu)化的/即時(shí)更新的)的數(shù)據(jù)進(jìn)行分析和管理并創(chuàng)造價(jià)值,是一種新的差異競爭形式。大部分政府運(yùn)行或計(jì)劃的大數(shù)據(jù)項(xiàng)目需要循序漸進(jìn),設(shè)定正確的目標(biāo)。項(xiàng)目的成功,取決于他們整合和分析信息的能力(譬如利用Hadoop),開發(fā)支持系統(tǒng)(如大數(shù)據(jù)控制系統(tǒng))和分析支持決策制定的能力。

本文討論了政府在大數(shù)據(jù)應(yīng)用中面臨的挑戰(zhàn)和機(jī)遇,將為其他國家政府開發(fā)和利用大數(shù)據(jù)提供幫助。通過仔細(xì)分析先行國家已有項(xiàng)目的經(jīng)驗(yàn)和教訓(xùn),特別是利用移動服務(wù)、移動互聯(lián)等,將有利于這些國家的政府更好地利用大數(shù)據(jù)。

未應(yīng)用大數(shù)據(jù)的政府,應(yīng)重視和認(rèn)識公共部門應(yīng)用大數(shù)據(jù)的幾個(gè)問題:

1)國家優(yōu)先發(fā)展戰(zhàn)略。大數(shù)據(jù)應(yīng)用領(lǐng)先國家的所有大數(shù)據(jù)項(xiàng)目,都具有國家優(yōu)先發(fā)展的相關(guān)目標(biāo)(比如數(shù)據(jù)的開放和已獲得,公民更好參與公共事務(wù))。對大數(shù)據(jù)應(yīng)用的主要關(guān)注點(diǎn)集中于安全、速度、交互性、分析能力,和缺少勝任的專業(yè)人員。然而,每個(gè)國家的政府基于其獨(dú)有的環(huán)境,有自身的優(yōu)勢、機(jī)會和威脅。

2) 分析機(jī)構(gòu)。對于跨部門的數(shù)據(jù),管理和綜合數(shù)據(jù)需要一個(gè)自上而下的統(tǒng)籌。政府應(yīng)建立一個(gè)大數(shù)據(jù)控制中心以綜合各部門既有數(shù)據(jù)的數(shù)據(jù)庫,包括結(jié)構(gòu)化和非結(jié)構(gòu)化的。此外,政府還需要建立一個(gè)先進(jìn)的分析機(jī)構(gòu)負(fù)責(zé)開發(fā)戰(zhàn)略,處理大數(shù)據(jù)如何通過新技術(shù)平臺進(jìn)行管理和分析,如何招募到熟練的從業(yè)人員。

3) 實(shí)時(shí)分析。政府需要管理即時(shí)更新的大數(shù)據(jù),并進(jìn)行實(shí)時(shí)分析,同時(shí)保護(hù)個(gè)人信息安全,還需要探索的新技術(shù)平臺(比如云計(jì)算,先進(jìn)分析和安全技術(shù))。相當(dāng)多的政府?dāng)?shù)據(jù)在性質(zhì)上是全球化的,而且能夠被用于預(yù)防和解決全球事務(wù),因此必須開展全球合作。

4) 國際化。各國政府間努力集成和共享地球觀測數(shù)據(jù)。全球地球觀測系統(tǒng),是一個(gè)全球性的公共基礎(chǔ)設(shè)施,產(chǎn)生了綜合的、接近實(shí)時(shí)性的環(huán)境數(shù)據(jù),目的是為全球使用者和決策制定者提供信息以供分析。政府也需要共享與安全威脅、和非法活動相關(guān)的數(shù)據(jù)。這種大數(shù)據(jù)需求不僅需要轉(zhuǎn)換技術(shù),還需要國際化的協(xié)作去共享和綜合數(shù)據(jù)。


20211121_619a150c1a3e0__大數(shù)據(jù)在政府部門的應(yīng)用

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉