當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 柳友娟 制圖 一個人獨處時,感覺有點孤單,怎么辦?微軟亞洲研究院推出的“微軟小冰”,或許可以像閨蜜一樣地跟你聊天解悶。3.0版本的“小冰&r

柳友娟 制圖

一個人獨處時,感覺有點孤單,怎么辦?微軟亞洲研究院推出的“微軟小冰”,或許可以像閨蜜一樣地跟你聊天解悶。3.0版本的“小冰”除了具有“評顏值”“選搭配”等功能外,還基于深度學習技術(shù)具備強大的視覺識別能力。它在看到一張圖片后,可以基于情感給出人性化回復,且秒回速度縮短到250毫秒。

不僅僅是“微軟小冰”和圍棋高手“阿爾法狗”,從互聯(lián)網(wǎng)搜索到語言翻譯,乃至識別患有自閉癥風險的基因……凡是需要從大量數(shù)據(jù)中預測未知信息的領(lǐng)域,都是深度學習可以一展拳腳的地方。那么,什么是深度學習技術(shù)?它將怎樣改變?nèi)祟惖纳睿?/p> 萬張圖片中發(fā)現(xiàn)重復的貓

2011年,谷歌一家實驗室的研究人員從視頻網(wǎng)站中,抽取了1000萬張靜態(tài)圖片,把它“喂”給谷歌大腦,目標是從中尋找重復出現(xiàn)的圖案。3天后,谷歌大腦在沒有人類幫助的情況下,從這些圖片中發(fā)現(xiàn)了“貓”。

這個谷歌大腦就是一個采用深度學習技術(shù)的大型神經(jīng)網(wǎng)絡模型,由1000臺電腦組成。這件事當時在科技界引起了轟動,被認為深度學習復興的里程碑。

所謂深度學習,就是用多層神經(jīng)元構(gòu)成的神經(jīng)網(wǎng)絡,以達到機器學習的功能。這些多層的電腦網(wǎng)絡像人類大腦一樣,可以收集信息,并基于收集到的信息產(chǎn)生相應的行為。

傳統(tǒng)的機器學習方法一般只能挖掘簡單的線性關(guān)系,如1+1等于2。然而,大千世界并不是這種簡單關(guān)系所能描述的,如收入與年齡、性別、職業(yè)、學歷的關(guān)系。深度學習的出現(xiàn)改變了這種現(xiàn)狀,它的靈感來源于模仿人類大腦神經(jīng)網(wǎng)絡。

科學家發(fā)現(xiàn),人類大腦皮質(zhì)不是直接對視網(wǎng)膜傳遞過來的數(shù)據(jù)進行特征提取處理,而是讓接收到的刺激信號通過一個復雜的網(wǎng)絡模型進行篩眩這種層級結(jié)構(gòu)大大降低了視覺系統(tǒng)處理的數(shù)據(jù)量,并最終保留了有用的信息。

上世紀60年代,生物學家在研究貓的腦皮層時,發(fā)現(xiàn)其獨特的網(wǎng)絡結(jié)構(gòu)能有效降低反饋神經(jīng)網(wǎng)絡的復雜性,繼而提出“卷積神經(jīng)網(wǎng)絡”。利用這種網(wǎng)絡結(jié)構(gòu)編寫的深度學習程序,適應性很強,成為人工智能的突破口。

語音識別改變?nèi)藱C交互

簡單地講,深度學習技術(shù)是對人腦的一種模擬,因而可以完成很多人腦所具有的功能。

最為人所熟知的是視覺功能。我們的相機可以像眼睛一樣看到這個世界,卻不能像大腦一樣看懂這個世界,深度學習恰恰補上了這個短板。有了深度學習,百度識圖可以準確識別照片中的物體類別,并對照片進行自動歸類或搜索。有了深度學習,我們可以很方便地刷臉付款。有了深度學習,特制機器可以檢測一定空間內(nèi)所有人員、車輛的行蹤,并對可疑和危險事件及時報警。

同時,深度學習技術(shù)在語音識別方面,也有廣泛的應用。在深度學習的幫助下,計算機擁有越來越強大的語音識別能力,這可能改變目前仍以鍵盤為主的人機交互模式。

深度學習還和增強學習相結(jié)合,正深刻改變著機器人領(lǐng)域。所謂增強學習,指的是機器人通過與環(huán)境交互中得到的獎賞和懲罰,自主學習更優(yōu)的策略。前段時間引人關(guān)注的“阿爾法狗”就是增強學習的產(chǎn)物,它通過跟棋手下棋或跟自己對弈的輸贏情況,摸索出更好的下棋策略。

什么讓深度學習實現(xiàn)超越

不過,創(chuàng)造一個強大的神經(jīng)網(wǎng)絡需更多處理層。而由于硬件限制,早期僅能制造2至3個神經(jīng)層。那么,是什么讓深度學習實現(xiàn)超越呢?

顯然,高性能計算能力的提升是一大助力。這些年GPU(圖形處理器)、超級計算機和云計算的迅猛發(fā)展,讓深度學習脫穎而出。2011年谷歌大腦用了1000臺機器、16000個CPU處理的深度學習模型大概有10億個神經(jīng)元。而現(xiàn)在,我們已經(jīng)可以在幾個GPU上完成同樣的計算了。

“深度學習還得到大數(shù)據(jù)的助力,就像火箭有了燃料。”格靈深瞳計算機視覺工程師、清華大學自動化系博士潘爭介紹,深度學習技術(shù)建立在大量實例基礎(chǔ)上,就像小孩收集現(xiàn)實世界的信息一樣。而且,“喂”的數(shù)據(jù)越多,它就越聰明,并且不會“消化不良”。因為大數(shù)據(jù)的不可或缺,所以目前深度學習做得最好的基本是擁有大量數(shù)據(jù)的IT巨頭,如谷歌、微軟、百度等。

現(xiàn)在,深度學習技術(shù)在語音識別、計算機視覺、語言翻譯等領(lǐng)域,均戰(zhàn)勝傳統(tǒng)的機器學習方法,甚至在人臉驗證、圖像分類上還超過人類的識別能力。專家預計,再過些年,我們口袋里的手機也可以運行像人腦一樣復雜的神經(jīng)網(wǎng)絡。

不過,就目前的趨勢來看,深度學習技術(shù)仍然無法代替“坐在后臺監(jiān)控室的人”。舉個例子,如果你和朋友在一家飯店里用餐后搶著結(jié)賬,這種推搡過程,智能攝像頭尚難以判斷是在打架還是怎么了。可見,邏輯判斷和情感選擇,是深度學習尚難以逾越的障礙。

◇案例◇

一眼就能識別壞人的系統(tǒng)

專注于計算機視覺及人工智能的科技公司格靈深瞳,將基于深度學習技術(shù)研發(fā)的智能識別系統(tǒng),運用到銀行安防監(jiān)控領(lǐng)域。

考慮到傳統(tǒng)光學鏡頭在識別圖像時會丟失“深度”維度,格靈深瞳專門為銀行安監(jiān)開發(fā)了一套三維傳感器。在它的背后,一套獎懲機制訓練成的算法模型能夠主動識別異常。“看見有人走近了一個有人的自動柜員機,而不是旁邊那個空著的,此時要識別他的軌跡、判斷其行為是否正常,就牽涉到深度學習。”格靈深瞳CEO何搏飛介紹,如果系統(tǒng)識別出異常,它就會推送給后臺監(jiān)督者。而為了教會機器判斷準確,背后需要提供幾十萬量級的圖片數(shù)據(jù)。

何搏飛指出,給這個智能識別系統(tǒng)一張側(cè)臉或者是沒有臉的全身照,它也能以超過99%的精度迅速鎖定目標。前提是建一個6000到1.5萬的樣本庫,“一旦樣本達到百萬級,可能精度要下降20%或更多。”

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉