當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 2018年7月4日,北京國家會議中心,這是百度轉(zhuǎn)型AI戰(zhàn)略以來舉辦的第二次百度AI開發(fā)者大會,相比第一屆,技術配方和味道愈發(fā)純正,而且今年的重點不再是樹旗造勢,更多的是技術成果解讀和商業(yè)化探討。

2018年7月4日,北京國家會議中心,這是百度轉(zhuǎn)型AI戰(zhàn)略以來舉辦的第二次百度AI開發(fā)者大會,相比第一屆,技術配方和味道愈發(fā)純正,而且今年的重點不再是樹旗造勢,更多的是技術成果解讀和商業(yè)化探討。

在過去的一段時間內(nèi),很多人有這樣的質(zhì)疑?第一,陸奇親自操刀幫百度理順了AI航道后淡然離場,對百度的影響大不大?之前大刀闊斧設定好的目標路線還能否被繼續(xù)保持?第二,百度總是說自己是AI公司,AI主要業(yè)務的真實情況怎么樣?如何去做商業(yè)轉(zhuǎn)化和技術變現(xiàn)?

因此,李彥宏特意用一場AI開發(fā)者大會交了一份長長的答卷,用答卷去證明陸奇離開,百度并無大礙,并且自己能夠帶領一眾技術高管把AI戰(zhàn)略進行的有聲有色,無人駕駛車量產(chǎn)、AI開放平臺和芯片、智能小程序上線······一步一個亮點,步步為營形成技術體系和商業(yè)生態(tài)的閉環(huán)。

AI全棧技術布局:多模態(tài)深度語義理解+“昆侖”芯片

百度高級副總裁、AI技術平臺體系(AIG)總負責人王海峰詳解了百度大腦3.0,從芯片到深度學習框架,百度大腦形成了技術、平臺和生態(tài)的AI全棧技術布局。

發(fā)布會上,李彥宏播放了一段電話錄音,一位即將參加開發(fā)者大會的嘉賓與百度智能客服進行了幾輪對話,一問一答非常自然,隨后揭曉,錄音中的這位客服并不是人,而是AI,它背后便是百度大腦的自然語言理解、語音識別與合成技術。

王海峰指出,百度AI能力的核心是百度大腦,而百度大腦3.0是百度AI能力的集大成者。8年前,基于多年的搜索技術積累,百度開始布局AI,2016年9月正式發(fā)布“百度大腦”,如今,百度大腦的能力從1.0進階到3.0。百度大腦1.0完成基礎能力搭建和核心技術初步開放,2.0形成了完整的技術體系,開放60多項AI核心能力,3.0的核心是“多模態(tài)深度語義理解”,同時開放110多項AI能力,覆蓋算法層、感知層、認知層、平臺層。

百度大腦3.0提出了“多模態(tài)深度語義理解”,“多模態(tài)深度語義理解”是指對文字、聲音、圖片、視頻等多模態(tài)的數(shù)據(jù)和信息進行深層次多維度的語義理解,包括數(shù)據(jù)語義、知識語義、視覺語義、語音語義一體化和自然語言語義等多方面的語義理解技術。王海峰表示,“多模態(tài)深度語義理解不僅能讓機器聽清、看清,更能理解它背后的含義,深度地理解真實世界,進而更好地支撐各種應用。”

數(shù)據(jù)語義化技術可以將大千世界中多元、異構和多模態(tài)的三元空間大數(shù)據(jù),形成包含千億節(jié)點、萬億關系的龐大數(shù)據(jù)語義網(wǎng)絡,從中總結規(guī)律、提煉知識、發(fā)現(xiàn)價值,助力經(jīng)濟和社會發(fā)展。比如在新能源充電樁智能運維中,結合百度的大數(shù)據(jù)、深度學習等技術進行設備監(jiān)測、故障診斷等,可以顯著提升效率,節(jié)約成本。而多元語義知識方面,百度已經(jīng)構建了包含數(shù)億實體、數(shù)千億級事實的龐大知識圖譜。除了基礎的由實體、屬性、關系構成的實體圖譜,我們還針對不同的應用場景和知識形態(tài),構建了關注點圖譜、事件圖譜、多媒體圖譜、行業(yè)知識圖譜等多種圖譜。所有這些知識,構成了百度大腦的基礎。

視覺語義化可以讓機器從看清到看懂視頻,并提煉出結構化語義知識。視覺語義化技術應用于世界杯視頻解析,能夠全面識別視頻中的球員、裁判、球、以及球門、球場線等人、物和場景,可以捕捉射門、進球、角球、任意球、換人等事件?;谶@些語義化知識,既可以完成機器人自動解說,也可以進行精彩片段集錦、以及各種數(shù)據(jù)統(tǒng)計分析等。而在實際生活的超市購物場景中,百度的視覺語義化技術通過識別人物、動作、物品并關聯(lián)時間序列,將數(shù)字化的視頻轉(zhuǎn)化為結構化的語義知識,既能實現(xiàn)顧客在無人超市購物的完整體驗,還可以幫助商店經(jīng)營者分析和優(yōu)化商店經(jīng)營。

語音語義一體化和自然語言理解技術能讓機器準確識別并理解人說的話,實現(xiàn)更自然的人機對話。王海峰現(xiàn)場對著百度地圖說出了一長串繞口令般的導航需求,百度地圖語音智能助手完美識別并給出最佳路線,李彥宏開場播放的智能客服給參會者打電話的片段,其背后也是這些領先的AI技術在支撐。王海峰介紹,百度高噪聲環(huán)境Hand-free語音識別準確率已提升了10個百分點,語音語義一體化技術使得遠場語音識別準確率提升了10個百分點;在語音合成方面,WaveNet+拼接的情感語音合成技術,使得流暢度和自然度也大幅提升。

王海峰以對話理解和閱讀理解為例,為大家介紹了領先的百度自然語言理解技術。百度的對話理解技術已經(jīng)積累多年,通過研發(fā)最新的深層注意力匹配模型,比已知的最好結果又提升了4.1%。在閱讀理解技術上,百度大腦已經(jīng)閱讀了千億量級的文章,相當于6萬個中國國家圖書館的藏書,并由此積累了億級實體、千億事實的知識。“通過持續(xù)獲取和積累知識,百度大腦的理解能力不斷升級,智能水平顯著提升,進而能夠更好地服務用戶。”王海峰說到。

百度大腦3.0提出“多模態(tài)深度語義理解”,背后有一套百度自主研發(fā)的深度學習框架PaddlePaddle,目前也迭代到3.0版本,包括完整的核心框架以及AIStudio、AutoDL、EasyDL等可以讓開發(fā)者便捷獲取百度AI能力的平臺。

PaddlePaddle3.0核心框架對服務器版本以及移動端版本進行了全面優(yōu)化,可以靈活適用于廣泛的開發(fā)需求。AutoDL能更高效自動搜索神經(jīng)網(wǎng)絡結構,開發(fā)者無需特殊硬件設備可以快速得到高質(zhì)量模型;EasyDL可以幫助開發(fā)者零算法基礎訓練業(yè)務定制模型,操作可視化,無需懂深度學習;AI studio具有云端集成、簡單易用、運行高效和資源免費的特點,是集成“數(shù)據(jù)、算法、算力”的PaddlePaddle實訓平臺,一站式滿足使用者學習、技術進階、學術研究需求。

百度大腦3.0首次將芯片納入技術體系,它使百度大腦具備了軟硬一體化能力,旨在帶動百度大腦算力實現(xiàn)倍級增長。百度自主研發(fā)了一款云端全功能AI芯片“昆侖”在會上首次公開亮相。“AI芯片將與百度自主研發(fā)的PaddlePaddle深度學習框架深度結合,推動AI技術生態(tài)快速發(fā)展。”王海峰表示。

“昆侖”定位是云端全功能AI芯片,采用了14nm三星工藝,具備260Tops性能,512GB/s內(nèi)存帶寬,100+瓦特功耗設計,針對語音、NLP、圖像等進行了專門優(yōu)化,同等性能下成本降低10倍,支持多個深度學習框架。

與谷歌做TPU的選擇一樣,百度自己做AI芯片有一定必然性,從2011年起,為了深度學習運算的需要,百度開始基于FPGA研發(fā)AI加速器,同期開始使用GPU,在過去幾年中,百度對FPGA和GPU都進行了大規(guī)模部署。AI應用的爆發(fā),對算力的要求越來越高,基于傳統(tǒng)芯片的AI運算加速,已經(jīng)不能滿足需求。在大規(guī)模AI運算的實踐探索中,百度研發(fā)出了一款專門用于AI大規(guī)模運算的芯片“昆侖”,據(jù)說它的運算能力比最新基于FPGA的AI加速器,性能提升了近30倍。

王海峰表示,百度大腦每天調(diào)用次數(shù)超過4千億次,調(diào)用的人中既有AI工程師,也有零“AI”基礎的初入門者,還有來自各行各業(yè)希望用AI創(chuàng)新業(yè)務、為業(yè)務轉(zhuǎn)型升級的企業(yè)。這些開發(fā)者和合作伙伴雖然身份不同、目標不同,但都能從百度找到了最適合的AI接入方式。

百度AI智能小程序,深耕移動端掘金

百度副總裁、百度APP&信息流業(yè)務體系總負責人沈抖發(fā)布百度智能小程序,一邊是日益成熟的AI產(chǎn)業(yè),一邊是逐漸火爆的小程序熱潮,智能小程序是百度AI在移動端深挖潛能的關鍵紐帶,與搜索+信息流進一步串聯(lián)起來。

據(jù)介紹,百度智能小程序?qū)⒃诮衲?2月全面開源,不僅可以全面接入百度大腦的AI能力,還要為用戶和開發(fā)者打造一個開放、智能化的移動生態(tài),目前包括攜程、蘇寧易購、唯品會、同程、春雨醫(yī)生、愛奇藝、優(yōu)信二手車、查違章等在內(nèi)的近百家企業(yè)成為首批加入智能小程序生態(tài)的合作伙伴,并將陸續(xù)推出各自的智能小程序。

百度智能小程序的開放性體現(xiàn)在兩個層面。首先,開發(fā)者只要簡單修改幾行代碼,就可以將自己在其他平臺開發(fā)的小程序接入百度智能小程序,百度智能小程序無縫運行在百度系App(百度App、百度貼吧、百度網(wǎng)盤等)以及外部合作App(嗶哩嗶哩、58同城等)上,實現(xiàn)一端開發(fā),多端可運行。其次,百度還將開放全域千億流量扶持開發(fā)者,幫助他們快速沉淀精準用戶。值得注意的是,百度流量與其他平臺不同的是,百度流量中天然存在大量與資訊、服務、工具等相關的需求,尤其是在百度信息流中,用戶看到的內(nèi)容都是根據(jù)興趣匹配推薦的,這些內(nèi)容可以激發(fā)用戶各類需求,非常適合開發(fā)者去挖掘。

沈抖強調(diào):“如今,AI已不再是‘錦上添花’,而是必備的技能。百度將開放AI能力,讓開發(fā)者重回業(yè)務理解與創(chuàng)意的賽道,專注于自己的業(yè)務邏輯。”據(jù)悉,來自百度大腦3.0的AI能力將全部開放給智能小程序開發(fā)者,這些能力包括語音、視覺、自然語言處理、知識圖譜、增強現(xiàn)實以及情景感知等類別,其中部分能力甚至已經(jīng)封裝好,開發(fā)者直接調(diào)用即可。

同時,得益于百度的AI技術,百度智能小程序可以基于大數(shù)據(jù)、意圖識別、興趣識別等技術精準匹配各類智能小程序用戶,從而縮短用戶轉(zhuǎn)化途徑,為開發(fā)者和合作伙伴進一步提升商業(yè)效益。官方舉了幾個案例,接入百度智能小程序后,“查違章智能小程序”全網(wǎng)的DAU在50天內(nèi)增長了370%,火車票智能小程序訂單轉(zhuǎn)化率在20天內(nèi)提升了44%,同時百度貼吧小程序上線以來,用戶人均使用時長增加了30%以上。

DuerOS人機交互操作系統(tǒng)形成閉環(huán),探索變現(xiàn)方式

百度智能生活事業(yè)群組(SLG)總經(jīng)理景鯤發(fā)布DuerOS 3.0,一直想坐上新一代人機交互操作系統(tǒng)的寶座。

“操作系統(tǒng)核心三要素是什么?第一是交互的變革;第二是全新的應用生態(tài);第三率先打通商業(yè)模式的閉環(huán)。”景鯤提出了操作系統(tǒng)三要素,DuerOS3.0正在完成這三要素的閉環(huán)。

DuerOS3.0的更新主要包括兩大方面:核心技術能力的提升,場景與解決方案的拓展。核心能力方面,DuerOS3.0帶來自然語言交互技術的全面升級,提供情感語音播報、聲紋識別、兒童模式、極客模式、智能引導與糾錯、視覺搜索能力、視頻理解能力,完全向業(yè)界進行開放。

場景和解決方案方面,DuerOS3.0可以提供超過20個跨場景、跨設備的解決方案,包括有屏設備解決方案、藍牙設備解決方案和行業(yè)解決方案等。景鯤現(xiàn)場展示了一塊只有名片大小的模組方案,通過這個模組方案就可以將合作伙伴的屏幕設備打造成一個可以對話的有屏設備。同時DuerOS還聯(lián)合創(chuàng)新設計集團洛可可,以及洛客共享設計平臺為行業(yè)、場景提供一整套從技術到設計的有屏設備產(chǎn)品方案,每個合作伙伴基于此就能打造屬于自己的“小度在家”,目前,在DuerOS上面有超過16000人的智能語音開發(fā)者在為DuerOS打造各種技能。

藍牙設備解決方案可以植入到藍牙耳機、藍牙音箱里,就可以讓數(shù)以千萬的藍牙設備瞬間變成可以對話的人工智能設備。行業(yè)解決方案正在逐步覆蓋酒店和養(yǎng)老場所等場景,在現(xiàn)場展示的洲際酒店及度假村的智能酒店體驗案例中,賓客可以通過語音控制客房設備、播放音樂、詢問天氣等,提升酒店行業(yè)常規(guī)的賓客下榻體驗。

DuerOS3.0迭代的最大亮點是開始打通商業(yè)模式閉環(huán)生態(tài),這意味著為DuerOS增添新技能的開發(fā)者,可以通過技能開發(fā)賺錢,DuerOS正在成為讓開發(fā)者有收益的對話式AI平臺。開發(fā)者可通過四種方式從DuerOS獲取收益:技能內(nèi)付費、付費技能、億元開發(fā)者支持計劃、DuerOS對話技能大賽。DuerOS還正式啟動了商業(yè)分成模式,景鯤宣布在前6個月將會把技能收入100%回饋開發(fā)者。DuerOS億元開發(fā)者支持計劃和DuerOS對話技能大賽也在當天啟動,鼓勵開發(fā)者去打造更優(yōu)質(zhì)的技能。

景鯤在大會現(xiàn)場還公布了DuerOS的最新數(shù)據(jù),截止2018年6月,DuerOS智能設備激活量已經(jīng)超過9000萬,月活躍設備超過2500萬。DuerOS平臺生態(tài)合作伙伴超過200家,搭載DuerOS落地的主控設備超過110多款,在DuerOS平臺上的開發(fā)者群體已經(jīng)超過16000人,平臺能力和商業(yè)化落地得到了市場驗證。

Apollo搞好車企關系,主打量產(chǎn)方案

Apollo開放平臺邁入量產(chǎn)階段,在去年11月份的百度世界大會上,李彥宏當時說過要在2018年7月份實現(xiàn)L4級自動駕駛汽車“阿波龍”的量產(chǎn),為了證明自己所言非虛,大會上還遠程連線了廈門的金龍客車生產(chǎn)車間,直播了第100輛自動駕駛巴士“阿波龍”在車間下線生產(chǎn)的場景,金龍客車董事長謝思瑜全程站臺背書。

“阿波龍”的內(nèi)部設計比較超前,全車沒有方向盤,沒有油門和剎車踏板,搭載了Apollo L4級自動駕駛解決方案的系統(tǒng)。李彥宏介紹說,這批“阿波龍”即將發(fā)往北京、雄安、深圳、福建平潭、湖北武漢等地開展商業(yè)化運營,并將聯(lián)合金龍客車、軟銀集團旗下自動駕駛公司SB Drive將“阿波龍”銷往日本,實現(xiàn)我國自動駕駛電動車的首次“出海”。

此外,李彥宏還補充發(fā)布一個量產(chǎn)“驚喜”——Apollo賦能新石器科技打造的無人作業(yè)車也已量產(chǎn)下線了。李彥宏表示:“自動駕駛汽車將從一發(fā)展到百、千、萬,這樣激動人心的未來,需要開發(fā)者們一起去創(chuàng)作、去定義。”開發(fā)者能借助Apollo在物流、工程、環(huán)衛(wèi)、農(nóng)業(yè)、公共交通、共享出行等9大作業(yè)場景中開發(fā)應用。

百度副總裁、智能駕駛事業(yè)群組(IDG)總經(jīng)理李震宇在發(fā)布Apollo3.0的同時,百度與比亞迪宣布將共同打造開放車輛認證平臺,實現(xiàn)Apollo智能駕駛軟件平臺和比亞迪汽車硬件開放平臺的結合。為此,百度總裁張亞勤還與比亞迪董事長兼總裁王傳福在大會上進行了探討對話。

“Apollo3.0是Apollo開放的新起點。讓每一位開發(fā)者平等便捷地獲取智能駕駛能力,是Apollo從一而終的使命。”李震宇說到,目前Apollo已經(jīng)開放了超過22萬行代碼,超過1萬名開發(fā)者推薦使用Apollo的開放代碼,生態(tài)合作伙伴規(guī)模達到116家。

面向量產(chǎn),Apollo3.0發(fā)布了自主泊車(Valet Parking)、無人作業(yè)小車(MicroCar)、自動接駁巴士(MiniBus)三套自動駕駛解決方案,幫助開發(fā)者及合作伙伴三個月內(nèi)打造出屬于自己的“阿波龍”?;贏pollo自主泊車解決方案,百度已聯(lián)合盼達用車實現(xiàn)了中國首次自動駕駛共享汽車示范運營,并聯(lián)合現(xiàn)代汽車展開定點接駁的落地應用。此外,無人作業(yè)小車新石器AX1也已實現(xiàn)量產(chǎn),在雄安、常州兩地實地運營。自動接駁巴士“阿波龍”在四個城市、五大場景啟動常態(tài)化運營,并獲得國家客車質(zhì)檢中心重慶測試場安全認證。此外,Apollo3.0還帶來了量產(chǎn)車聯(lián)網(wǎng)系統(tǒng)解決方案——小度車載OS,并發(fā)布了車載語義開放平臺。

安全性是對自動駕駛量產(chǎn)的真正考驗。當天,百度Apollo還與國際知名自動駕駛公司Mobileye合作,融合了其核心的自動駕駛安全模型RSS。Apollo3.0帶來了升級版的智能仿真系統(tǒng):真實環(huán)境AR仿真,能提供虛擬交通流結合實景渲染的全棧式閉環(huán)仿真解決方案,幫助開發(fā)者進行“日行百萬公里”的仿真測試。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉