當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 對于AI而言,即將過去的2019年是一個碩果累累的年份。一方面,它正在以可見的速度走到我們的身邊、滲透到各行各業(yè)中;另一方面,AI技術(shù)本身也一直處于高速更迭換代的過程中,支撐著各種落地應(yīng)用成為現(xiàn)

對于AI而言,即將過去的2019年是一個碩果累累的年份。一方面,它正在以可見的速度走到我們的身邊、滲透到各行各業(yè)中;另一方面,AI技術(shù)本身也一直處于高速更迭換代的過程中,支撐著各種落地應(yīng)用成為現(xiàn)實(shí)。技術(shù)的進(jìn)化與多元的應(yīng)用場景相得益彰、相互促進(jìn),“智能時代”幾乎已經(jīng)觸手可及。

作為國內(nèi)人工智能領(lǐng)域的領(lǐng)頭者,百度一直在積極同步推動AI技術(shù)創(chuàng)新和產(chǎn)業(yè)智能化。2019年,百度AI技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成——百度大腦,在算法突破和計算架構(gòu)升級的基礎(chǔ)上,實(shí)現(xiàn)AI算法、計算架構(gòu)與應(yīng)用場景的融合創(chuàng)新,成為“軟硬一體的AI大生產(chǎn)平臺”,打通了人工智能產(chǎn)業(yè)化應(yīng)用落地相關(guān)的全部流程,實(shí)現(xiàn)了AI技術(shù)的標(biāo)準(zhǔn)化、自動化、模塊化。由此,企業(yè)和開發(fā)者不用重復(fù)“造輪子”,能直接將AI應(yīng)用在各個產(chǎn)業(yè)場景中,促進(jìn)產(chǎn)業(yè)智能化。百度也率先在業(yè)內(nèi)提出“人工智能進(jìn)入工業(yè)化大生產(chǎn)階段”。

做行業(yè)的引領(lǐng)者,需要銳意創(chuàng)新的勇氣。對百度而言,還有二十年如一日推動技術(shù)進(jìn)步所積淀的實(shí)力與底氣。那么,在這個大跨步向“智能時代”邁步的一年中,百度在推動AI技術(shù)進(jìn)步方面又給我們帶來了哪些驚喜?讓我們走近看一看。

1、競逐人工智能皇冠上的明珠:知識增強(qiáng)的語義理解框架ERNIE超越谷歌BERT

自然語言處理關(guān)乎智能體如何理解人類的語言與文字、并在理解的基礎(chǔ)上進(jìn)行人機(jī)智能交互,被稱為“人工智能皇冠上的明珠”,其重要性顯而易見。今年,在自然語言處理技術(shù)方面,百度打造了可持續(xù)學(xué)習(xí)的知識增強(qiáng)語義理解框架ERNIE,通過建模海量數(shù)據(jù)中的實(shí)體概念等先驗(yàn)知識,學(xué)習(xí)真實(shí)世界的語義關(guān)系。這種融合知識的語義建模大幅增強(qiáng)了模型的語義表示能力,在共計16個中英文自然語言處理任務(wù)上效果超越了谷歌BERT和XLNet。近日,ERNIE更是在自然語言處理領(lǐng)域權(quán)威數(shù)據(jù)集GLUE中榮登榜首,并刷新該榜單歷史,超越了微軟MT-DNN-SMART, 谷歌T5、ALBERT等一眾國際頂級預(yù)訓(xùn)練模型。在全球各國探尋AI關(guān)鍵技術(shù)的道路上,百度ERNIE代表中國AI科技占據(jù)了舉足輕重的一席之地。

2、方言、中英混合,通通不是問題:SMLTA加持,語音識別準(zhǔn)確率提升15%-20%

語音識別方面,百度提出流式多級的截斷注意力模型 SMLTA,這是國際上首次實(shí)現(xiàn)局部注意力建模超越整句的注意力模型,也是國際上首次實(shí)現(xiàn)在線語音大規(guī)模使用注意力模型。SMLTA在大幅提升識別速度的同時,也提高了識別準(zhǔn)確率。在輸入法有效產(chǎn)品相對準(zhǔn)確率提升15%,音箱有效產(chǎn)品相對準(zhǔn)確率提升20%。借助SMLTA,百度輸入法實(shí)現(xiàn)了業(yè)界普遍認(rèn)為較難實(shí)現(xiàn)的中英文混說識別,在完全不影響中文語音輸入準(zhǔn)確率的情況下,能進(jìn)行高精準(zhǔn)的中英文混合語音識輸入。除此之外,方言與方言、方言與普通話的混合語音輸入也完全不在話下。

3、僅需20句話就能錄制你的專屬聲音:語音合成Meitron讓AI體驗(yàn)個性化起來

你可能已經(jīng)習(xí)慣了“前方路口左轉(zhuǎn)”這樣的地圖語音由一個標(biāo)準(zhǔn)的女聲發(fā)出,然而百度地圖推出的“語音定制”功能,則可以讓你用自己的聲音、或者是自己想要的其他人的聲音來幫你指揮方向。這背后是百度語音合成技術(shù)Meitron的功勞。針對現(xiàn)階段語音合成方面面臨的風(fēng)格遷移、音色模擬和情感擬人三大挑戰(zhàn),百度的語音合成技術(shù) Meitron ,可以把聲音中的音色、風(fēng)格、情感等不同元素解耦分離,獨(dú)立組合,靈活控制合成的聲音,只需錄制20句話,就可以制作一個人的專屬聲音?;诖思夹g(shù),百度上線了全球首個地圖語音定制功能,為用戶帶來了前所未有的個性化體驗(yàn)。

4、向著“巴別塔”之巔前進(jìn):更高準(zhǔn)確、更低時延的機(jī)器同傳

翻譯為人類重新建立交流的巴別塔,機(jī)器翻譯則讓無障礙溝通的門檻降得更低。在機(jī)器同傳領(lǐng)域,百度綜合聯(lián)合詞向量解碼、語篇翻譯模型等新技術(shù),實(shí)現(xiàn)高準(zhǔn)確、低時延的機(jī)器同傳,并發(fā)布了語音到語音的機(jī)器同傳系統(tǒng):DuTongChuan(度同傳),以及全球首個中文-英文演講場景語音翻譯數(shù)據(jù)集(BSTC)。經(jīng)過真實(shí)測試,機(jī)器同傳效果媲美人類譯員。可以說,隨時隨地自由溝通的夢想離我們越來越近。

5、換個“姿勢”看視頻:基于知識圖譜的視頻語義理解能力

在今年的“Baidu Create 2019”百度AI開發(fā)者大會上,百度CTO王海峰為大家展示了一段基于知識圖譜理解音樂紀(jì)錄片《大河唱》的內(nèi)容。影片中的角色、人物關(guān)系、音樂種類、取景地、影片主題等信息,都得到了精準(zhǔn)解析,在屏幕上一一呈現(xiàn)給觀眾。這是融合了百度知識圖譜技術(shù)的視頻語義理解能力,通過結(jié)合視覺、語音和自然語言處理技術(shù)解析多模態(tài)信息,并與知識圖譜的相關(guān)實(shí)體建立關(guān)聯(lián),通過計算和推理,得到電影內(nèi)容的結(jié)構(gòu)化語義表示,從而理解電影中出現(xiàn)的角色、音樂和民間藝術(shù)等。還在因?yàn)橛洸蛔∧巢侩娪袄锛姺睆?fù)雜的的人物關(guān)系而頭疼?有知識的AI來幫你梳理梳理唄。該技術(shù)目前已在百度視頻搜索、推薦、內(nèi)容生成等多個產(chǎn)品上線。

6、有溫度的AI,從真人形象虛擬主播開始:實(shí)時合成真人虛擬形象在多個場景應(yīng)用

百度的實(shí)時合成虛擬形象技術(shù),結(jié)合多模態(tài)嘴型生成、GAN、TTS等技術(shù),實(shí)現(xiàn)了業(yè)界首個可以量產(chǎn)視頻的真人形象虛擬主播,同時具備自動化、平臺化、實(shí)時計算、大規(guī)模應(yīng)用和效果逼真等技術(shù)特點(diǎn),可以解決以往虛擬主播形象生硬、響應(yīng)速度滯后、播報內(nèi)容刻板等問題。該技術(shù)已經(jīng)成功應(yīng)用于多個場景。例如,央視與百度合作打造AI虛擬主持人小靈,亮相央視2019五四晚會;澎湃新聞與百度合作打造了第一個真人形象的虛擬主播早晚新聞欄目;浦發(fā)銀行與百度合作打造了業(yè)內(nèi)首個“金融數(shù)字人”,有顏值、有情感、還有專業(yè)的銀行知識,將升級銀行客服體驗(yàn)。

7、讓中國最好的AI跑在中國自主可控的芯片上:百度鴻鵠芯片發(fā)布,百度昆侖云服務(wù)器上線

AI的發(fā)展需要算力的支撐,當(dāng)下AI領(lǐng)域精彩紛呈,算力的需求更是大規(guī)模上漲。而在算力層面,芯片始終是受到關(guān)注的焦點(diǎn)。特別是在中國,開發(fā)者和企業(yè)能否用上自主可控的芯片,又讓這一關(guān)注多了一層意義。今年,百度發(fā)布了專為遠(yuǎn)場語音交互打造的百度鴻鵠芯片,其設(shè)計變革了傳統(tǒng)芯片設(shè)計方法,遵循“軟件定義芯片”的全新設(shè)計思路。同時,它采用雙核 HiFi4 架構(gòu),40nm 工藝,2.8M 大內(nèi)存,在此硬件規(guī)格上,僅僅100mW 左右平均工作功耗,即可支持遠(yuǎn)場語音交互核心的陣列信號處理和語音喚醒能力,將為車載語音交互、智能家居等場景帶來更大想象力。而在12月,基于百度自主研發(fā)的AI加速芯片-KUNLUN1的百度昆侖云服務(wù)器也正式在百度智能云上線。百度昆侖云服務(wù)器與百度自主研發(fā)的產(chǎn)業(yè)級深度學(xué)習(xí)開源平臺飛槳深度適配,支持知識增強(qiáng)語義理解框架ERNIE等完全自主可控的領(lǐng)先算法模型,讓中國最好的AI跑在中國自己自主可控的芯片之上。

8、打造自動駕駛的智慧之眼:國內(nèi)唯一的城市道路L4級純視覺感知解決方案Apollo Lite

作為車輛與周圍環(huán)境交互的紐帶,感知系統(tǒng)是實(shí)現(xiàn)自動駕駛的關(guān)鍵環(huán)節(jié),可謂是自動駕駛系統(tǒng)的一雙“眼睛”。在今年的CVPR 2019召開期間,百度公開了國內(nèi)唯一的 L4 級自動駕駛純視覺城市道路閉環(huán)解決方案——百度 Apollo Lite。相比旋轉(zhuǎn)式激光雷達(dá)感知方案,視覺感知方案價格低且便于獲得,為企業(yè)、開發(fā)者們提供了一個低價、優(yōu)質(zhì)的自動駕駛解決方案。

9、為自動駕駛提供仿真測試保障:增強(qiáng)現(xiàn)實(shí)的自動駕駛仿真系統(tǒng)登上《科學(xué)》子刊

安全性也是自動駕駛至關(guān)重要的一環(huán)。業(yè)界一般認(rèn)為,一個可靠的、安全的自動駕駛系統(tǒng)必須能保證在苛刻的測試環(huán)境下安全行駛數(shù)億公里。按照這一指標(biāo),若完全使用真實(shí)道路測試,可能需要長達(dá)數(shù)十年。基于計算機(jī)視覺和AR技術(shù),百度開發(fā)了一種增強(qiáng)現(xiàn)實(shí)的自動駕駛仿真系統(tǒng)(AADS),為自動駕駛車輛提供更為可靠且廉價的仿真模擬方法,兼顧自動駕駛系統(tǒng)測試的安全性的同時,提升測試效果并極大地縮短測試時間。該系統(tǒng)相較于現(xiàn)有仿真系統(tǒng),在真實(shí)感、擴(kuò)展性等方面都實(shí)現(xiàn)了突破性的技術(shù)進(jìn)展,并發(fā)表于《科學(xué)》雜志《機(jī)器人學(xué)》子刊。

10、邁向未來計算新世界:“量脈”實(shí)現(xiàn)量子軟硬件連接

最后一項關(guān)乎未來。量子計算被認(rèn)為是未來計算技術(shù)的心臟。2019年,百度研發(fā)出國際領(lǐng)先、國內(nèi)第一的云上量子脈沖系統(tǒng)“量脈”,可將量子計算軟件指令(邏輯門)轉(zhuǎn)換成控制量子硬件的脈沖序列,算法性能較同類工具實(shí)現(xiàn)成倍級別的提升,是實(shí)現(xiàn)量子軟硬件連接的關(guān)鍵橋梁。

以上的十大技術(shù)創(chuàng)新,只是百度諸多技術(shù)成果的冰山一角。時代在繼續(xù)向前發(fā)展,百度推動技術(shù)創(chuàng)新的步履從不曾停歇。通過不斷推動技術(shù)進(jìn)步,百度還將為人工智能產(chǎn)業(yè)和社會的發(fā)展貢獻(xiàn)更大的力量。未來還會有哪些精彩?讓我們拭目以待。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉