我們一直稱英特爾為硬件公司,恐怕要換一種說法了?!懊慨斚挛缗R近下班,我都會收到很多郵件,幾乎都來自歐洲,他們通過開源社區(qū)與我們深度交流和合作。”換做三年前,我一定不敢相信這句話是出自英特爾高級首席工程師、大數據技術全球CTO戴金權之口,不是不相信這位大咖的頭銜和姓名,而是我似乎要重新審視英特爾軟件方面的實力。
維基百科對英特爾的描寫還是芯片、網卡、閃存、嵌入式處理器等產品,哪怕從歷史來看,英特爾也是經歷過從存儲器到處理器為核心的純硬件公司。軟件這件事該從何說起?
不管是本月的“英特爾以數據為中心產品技術媒體分享會”,還是英特爾主辦的開源技術峰會(OSTS2019)上,英特爾都提到自己有15000名軟件工程師,從數量上來看似乎可以與互聯網公司媲美。這龐大的團體,到底在搞什么?
英特爾高級首席工程師、大數據技術全球CTO戴金權
TechSugar記者從最近的英特爾發(fā)言人的演講中發(fā)現了他們的目的——構建統(tǒng)一平臺。
為什么要統(tǒng)一?
在5月25日南京舉辦的“2019全球人工智能技術大會”上,戴金權的主題是“Analytics ZOO統(tǒng)一的大數據分析+AI平臺”。這主題給人的直觀感受就是,Analytics ZOO玩的就是串聯整合工作,而戴金權稱之為流水線工作。
“通過開源Analytics Zoo可以實現的是:1,能夠將不同的框架無縫的集成到流水線里面去,通過在軟件層上面各種新的支持或者功能,能夠將TensorFlow、Spark能夠非常無縫的集成在一個程序里面。2,開發(fā)過程運行在Spark引擎,可以嵌入各種深度學習功能,目的是讓其運行在一個單機環(huán)境?!贝鹘饳嗳绱私忉?。
在其PPT中可以看出(如下),Analytics Zoo解決的是深度學習和大數據分析之間的斷層。正如戴金權所說:“Analytics Zoo目前要解決的就是兩個問題,一個是要構建一個端到端的應用場景,另一個是用戶在開發(fā)時,需要經歷從筆記本到大規(guī)模分布式環(huán)境,兩個生產環(huán)境的切換較為麻煩?!?
顯然這兩段話上下呈現了果因關系,充分介紹了英特爾做Analytics ZOO的初衷。
如果理解起來有點模糊,不妨看點應用案例:
Analytics Zoo 平臺可以協(xié)助韻達通過圖像識別獲得準確大小件測量數據,通過深度學習優(yōu)化件量測量(防止爆倉),通過AI強化訓練檢測異常。從而達到提升效率,降低成本的作用。
韻達案例示意圖
寶信軟件利用該平臺開發(fā)了設備故障自動預測的驗證模型,該模型基于業(yè)界公開的設備全生命周期數據,利用循環(huán)神經網絡(RNN)特別是長短期記憶模型(LSTM),實現了時間序列的異常檢測(Time series anomaly detection),并可以在數據上進行無監(jiān)督深度學習和預測。
美的工業(yè)視覺檢測云平臺把前端設備收集的圖像數據通過4G 或Wi-Fi 傳輸到云端,通過深度學習框架,經由訓練獲得非標準化視覺檢測特征,最終打造出通用化、智能化的瑕疵檢測能力。而這一過程實現的關鍵,是英特爾Analytics Zoo 大數據分析+AI 平臺。
要不是筆者擔心過多舉例導致篇幅累贅和困意襲擊,其實還是有許多案例值得一說。據介紹,該平臺的客戶包括OEM廠商、軟件提供商和一些公有云服務商。
為什么要“軟”?
軟件對于英特爾這樣的硬件公司到底意味著什么?
戴金權在為英特爾平臺舉例時很少用到效果類數據,唯一一句還是“京東最后做過測試,當他把整個原來的方案遷移到Spark BigDL這樣一個完整的流水線上 (基于CPU),他把整個端到端的運行效率也提高了3、4倍。”
可見,軟件對于英特爾來說,就是給客戶更高效的方案。
此前英特爾推出了“One API”項目,以簡化跨CPU、GPU、FPGA、人工智能和其它加速器的各種計算引擎的編程。該項目包括一個全面、統(tǒng)一的開發(fā)工具組合,以將軟件匹配到能最大程度加速軟件代碼的硬件上。
此舉又是針對客戶需求,一切為了簡化、便捷和統(tǒng)一。
難道軟件之于英特爾僅僅是滿足客戶需求,來賺取美元嗎?
在此前的開源技術峰會上,英特爾公司副總裁兼系統(tǒng)軟件產品部門總經理蘇義德(Imad Sousou)在會上強調:“軟件是英特爾的一項重要戰(zhàn)略資產,將幫助我們挖掘商業(yè)價值,真正釋放公司的整體增長潛力?!?
這話不假,正如英特爾架構日上提出的“六大技術支柱”,其中有一環(huán)就是軟件,重要性可見一斑。
其實筆者發(fā)現,不管英特爾怎么去宣傳自己的軟件和非軟件實力,大部分時候逃不開一張圖和一組數據。
“2018年,中國約產生7.6ZB的數據,而且還將保持每年30%的增長,到2025年的數據量將達到48.6ZB;從2015年到2025年,IDC估計全球數據量的增長平均在25%的年復合增長率?!?
這也不難理解英特爾此前要說的從PC為中心轉移到數據為中心,強大算力的進步顯然是離不開軟件的優(yōu)化和激發(fā)潛能的。英特爾戰(zhàn)略性地服“軟”,這龐大的數據洪流正席卷而來。