云計算和大數(shù)據(jù)導演社會變革大戲
如今,我們站在了IT產(chǎn)業(yè)變革的節(jié)點上,感受著巨浪的侵襲:云計算和大數(shù)據(jù)的發(fā)展促使IT產(chǎn)業(yè)生產(chǎn)力發(fā)生重大變革;生產(chǎn)力的變化讓許多技術和模式擁有了新的血液;同時,互聯(lián)網(wǎng)和社會也面臨著重構……此時此刻,誰能看清變化趨勢,誰能抓住變革先機,誰便能擁有更大的籌碼。
生產(chǎn)力之變革:系統(tǒng)架構+數(shù)據(jù)+人
IT產(chǎn)業(yè)生產(chǎn)力變化,在百度大數(shù)據(jù)首席架構師林仕鼎看來,可以從四個時間段來分析大型機時代、PC時代、互聯(lián)網(wǎng)時代、云計算時代。
“在大型機時代,硬件是主要的生產(chǎn)力。”林仕鼎道出了他的觀察與思考,“到了PC時代,軟件則成為主要生產(chǎn)力。” 而進入互聯(lián)網(wǎng)時代后,IT產(chǎn)業(yè)生產(chǎn)力變?yōu)榱塑浖?人。“一個軟件開發(fā)出來后,很多工程師會去不斷地升級、完善這個軟件”。
那么,云計算和大數(shù)據(jù)讓生產(chǎn)力發(fā)生了什么樣的改變?林仕鼎直言:“在云時代,IT產(chǎn)業(yè)生產(chǎn)力變革成了系統(tǒng)架構+數(shù)據(jù)+人。”
云計算帶來的計算、存儲資源集中化效應,以及數(shù)據(jù)量的激增,都使得系統(tǒng)架構在IT產(chǎn)業(yè)發(fā)展中發(fā)揮越來越關鍵的作用因為支持云計算和大數(shù)據(jù)的基礎就是系統(tǒng)架構。大數(shù)據(jù)時代的到來,也使得數(shù)據(jù)更多地參與到了系統(tǒng)和各種服務的構建中。
“在這個新的時代,軟件和系統(tǒng)架構可被看成一整個系統(tǒng),更多的人參與進來修改、維護、升級這套系統(tǒng),同時,依靠海量數(shù)據(jù)來完善這個系統(tǒng),提升系統(tǒng)性能。”林仕鼎點出了新生產(chǎn)力三個要素間的關系。
以百度搜索為例,林仕鼎介紹說:“用戶輸入一個搜索請求,有時一開始我們很難確定在搜索結(jié)果頁面,以什么樣的排序呈現(xiàn)給用戶合適。那么,我們就會分別依照一定的算法,制定兩個排序方法,并在用戶中,隨機選5%的用戶使用排序方式A,5%用戶使用方式B。之后,將海量的對比結(jié)果和數(shù)據(jù)反饋回機器學習平臺,去分析、挖掘相關算法的優(yōu)勢,進而制定出更優(yōu)的排序方式,完善百度搜索系統(tǒng)。這樣,會使用戶在百度搜索中更好地獲得想要的結(jié)果。”
計算范式之變革:數(shù)據(jù)中心計算
實際上,IT產(chǎn)業(yè)生產(chǎn)力變革也就意味著計算范式的變化。
如前文所述,計算、存儲資源集中化效應,以及海量數(shù)據(jù)的存儲與處理需求,使得系統(tǒng)架構發(fā)揮越來越重要的地位,而這一現(xiàn)象也代表著計算范式的變化。“計算范式正逐步從桌面系統(tǒng)(即單機計算)向數(shù)據(jù)中心計算發(fā)展。”林仕鼎表示。
范式的變化同時引發(fā)了軟硬件設計原則、思路的改變整個IT產(chǎn)業(yè)的技術根基都在發(fā)生著劇烈變革。
根據(jù)林仕鼎介紹,數(shù)據(jù)中心計算與單機計算相比,在系統(tǒng)設計理念上的一大改變就是對容錯的處理思路。“在單機設計理念中,系統(tǒng)一定是越可靠越好,原因很簡單,你只有一臺機器,壞掉就沒了。所以,在設計時,要在系統(tǒng)里面加很多冗余信息和校驗邏輯,這樣在出現(xiàn)錯誤后還可恢復。在數(shù)據(jù)中心計算中,主要是分布式系統(tǒng)。分布式系統(tǒng)假設所有的設備最終都會發(fā)生故障,所以它可以容忍任意一臺設備出現(xiàn)問題。這使得兩者在系統(tǒng)設計上擁有很多差異”。
12另外,單機計算和數(shù)據(jù)中心計算的應用場景也不同,前者是單用戶多任務,而后者則是多用戶單任務,因此系統(tǒng)設計要更多地考慮并行性問題。百度自主研發(fā)的SSD就是這種理念下的產(chǎn)物。
在傳統(tǒng)的SSD架構中,是由一個總的SSD控制器來控制下面的Flash存儲單元,這樣的優(yōu)勢是黑箱化、層次化,不利之處是SSD往往讀取較快,寫入較慢,容易形成瓶頸。而百度根據(jù)應用需求,取消了SSD架構中的寫緩沖、擦寫平衡等復雜邏輯,大幅簡化SSD控制器的設計。通過將一個大的SSD劃分為N個單元,每個單元都有獨立的控制器和存儲單元,這些信息和控制接口暴露給上層存儲系統(tǒng)后,形成了多個管道,并行讀取、存儲效率可以大幅提升。
這種設計上的創(chuàng)新,使得百度自研SSD相對SATA SSD性能提升6倍成本降低10%,相對PCIE Flash性能提升2倍成本降低40%。
社會之變革:重構互聯(lián)網(wǎng)
云計算和大數(shù)據(jù)已經(jīng)帶來了像IT生產(chǎn)力、計算范式、開發(fā)方式這樣偏架構和技術的變革,但在林仕鼎看來,它們最大的價值在于讓社會得以革新與升級。“技術只有當真正能夠去改變?nèi)说纳顣r才會更有意義。”林仕鼎堅持著這一信條。
而要讓社會變革,就需要依靠云計算和大數(shù)據(jù)重構互聯(lián)網(wǎng)。
想像一下這樣一個場景:當你在公司系統(tǒng)里確認完出差事宜,你手機上的某個訂飛機航班的APP就推送給你幾個符合你喜好的航班,供你選擇。當你在手機上一鍵選擇完后,相關租車APP就跳出來讓你直接預約出租車,提供往返機場或異地開會時的接送服務;并且在你預定完機票后,你的手機會自動進入航空公司選座系統(tǒng)……
要實現(xiàn)這一切,需以云計算為基礎,并融合、聯(lián)通來自各種渠道的海量數(shù)據(jù)。但目前的情況是,數(shù)據(jù)和資源都是分散的。“現(xiàn)在的互聯(lián)網(wǎng)有很多問題,比如每個用戶的數(shù)據(jù)是分散的,這些數(shù)據(jù)被割裂在不同的設備上、不同的應用間,同時,計算資源也很分散。”林仕鼎表示。
所以,互聯(lián)網(wǎng)需要重構。
林仕鼎描述了重構互聯(lián)網(wǎng)的關鍵:搭建統(tǒng)一的云操作系統(tǒng)。“真正的云平臺實際上是一個人人共享的統(tǒng)一操作系統(tǒng),所有數(shù)據(jù)、服務、用戶的ID、業(yè)務系統(tǒng)本身都聚合在一個平臺上,形成一個大規(guī)模、合作創(chuàng)新的平臺。由于有了全局的數(shù)據(jù),大數(shù)據(jù)算法可以發(fā)揮作用,這個平臺在工程師和用戶以及大數(shù)據(jù)的推動下不斷進化,最終會變成一個超大的、囊括性的統(tǒng)一智能系統(tǒng)。這本質(zhì)上就是對互聯(lián)網(wǎng)的一次重構”。
人與機器合一組成的這個“生命體”,實際上是把最終的結(jié)果和產(chǎn)生這個結(jié)果的原因連接在一起了,在林仕鼎看來,這個“生命體”將會快速進化,最終重構整個社會。
據(jù)悉,百度也在努力地促進各種數(shù)據(jù)融合、串聯(lián)起來,以推動百姓生活乃至整個社會的變革與發(fā)展。
12