當(dāng)前位置:首頁 > 智能硬件 > 智能硬件
[導(dǎo)讀] 比爾蓋茨說過,人們總是高估一項新技術(shù)在一兩年內(nèi)能夠做到的,卻低估語音在五到十年能做到的,語音就是曾經(jīng)被低估的技術(shù),其潛力正在被激發(fā)出來。年底,所有互聯(lián)網(wǎng)行業(yè)大會都會有智能硬件的位置,大佬們都在說,IOT

 比爾蓋茨說過,人們總是高估一項新技術(shù)在一兩年內(nèi)能夠做到的,卻低估語音在五到十年能做到的,語音就是曾經(jīng)被低估的技術(shù),其潛力正在被激發(fā)出來。

年底,所有互聯(lián)網(wǎng)行業(yè)大會都會有智能硬件的位置,大佬們都在說,IOT(Internet of Things)時代來了?;ヂ?lián)網(wǎng)巨頭、傳統(tǒng)硬件公司、各色創(chuàng)業(yè)團(tuán)隊,都擠在這個風(fēng)口等著被吹起來。除了做產(chǎn)品的,還有一類玩家十分興奮地等著智能硬件火起來:語音技術(shù)團(tuán)隊。

2014年底,語音行業(yè)新聞不斷:云知聲完成5000萬美元A輪融資主攻智能家居,科大訊飛推出自己的語音智能音響硬件,百度語音涉足智能硬件領(lǐng)域……智能硬件正在成就語音,語音也在成就智能硬件。

一、語音交互正在爆發(fā),尤其是智能硬件

智能硬件最熱的門類是可穿戴設(shè)備、智能家居、車聯(lián)網(wǎng)以及智能影音配件。所有這些設(shè)備的共同特點(diǎn)都是沒有鍵盤鼠標(biāo)、絕大部分沒有自己的屏幕、幾乎都是與手機(jī)App協(xié)同工作。還有許多智能硬件的使用場景中,雙手并不方便,比如在駕駛過程中,再比如看電視離屏幕太遠(yuǎn),這時候必須要有脫離雙手的新型交互模式。正是因為這些原因,語音成為智能硬件最理想的交互方式之一。

具體來說,語音識別可以解決輸入部分,比如通過語音讓智能手表完成某個動作,發(fā)起一次搜索,再比如通過語音讓智能音響播放下一首歌曲,讓智能電視播放特定節(jié)目;語音合成可以實(shí)現(xiàn)交互反饋,比如語音播報搜索結(jié)果,語音播報導(dǎo)航指令;語義理解則可以解讀聲音背后的需求做出反饋,用戶可以很自然地對電飯鍋說,“明天早晨8點(diǎn)幫我煮一碗八寶粥”,智能電飯鍋解讀指令并準(zhǔn)備行動;聲紋識別則可以實(shí)現(xiàn)個人ID鑒權(quán),實(shí)現(xiàn)智能家居的開門、智能購物的支付等等。

反過來,語音技術(shù)雖然已發(fā)展多年卻一直未能走向大眾化。雖然在教育、交通等領(lǐng)域有諸多非常試用的行業(yè)應(yīng)用,但在大眾消費(fèi)市場,智能語音交互上卻顯得有些高冷。Siri推出之后,Google Now跟進(jìn)。而在國內(nèi),百度語音助手等應(yīng)用也先后推出,但它們都未成為一個高頻、剛需和普及應(yīng)用,更多是用戶打發(fā)無聊時間的玩具。智能硬件則有助于語音交互的普及,讓語音成為真正的剛需應(yīng)用。

智能硬件需要語音來解決所存在的交互短板,最終實(shí)現(xiàn)人與人對話一樣的自然、簡單和智能化的交互模式。語音市場也想要抓住正在爆發(fā)的智能硬件市場,抓住被用戶大量高頻使用的機(jī)會。

二、百度切入語音交互:互聯(lián)網(wǎng)巨頭的新玩法

語音市場并不是全新的。美國有Nuance這類老牌巨頭,中國有科大訊飛這樣的百億元市值公司以及云知聲、思必馳等后來者,除了專業(yè)公司之外,Apple、 Google、微軟、百度、搜狗、微信在語音技術(shù)上均有所投入。中國最近動作最大的玩家則是百度。在科大訊飛等語音巨頭深耕10多年的背景之下,百度打算如何玩?

1、完全不同的技術(shù)原理。

傳統(tǒng)語音識別技術(shù)基于概率論和統(tǒng)計學(xué),需要人工監(jiān)督。百度語音則是基于深度學(xué)習(xí),以百度大腦為基礎(chǔ),百度大腦是百度在人工智能時代的核心智能平臺,圖像識別、自然語言處理,均會基于百度大腦。百度語音由GPU深度學(xué)習(xí)基礎(chǔ)設(shè)施支撐,不僅更準(zhǔn)確,識別所需的運(yùn)算更加快速和經(jīng)濟(jì)。除了識別之外,在語義理解上一直專攻自然語言搜索的百度優(yōu)勢更是不言而喻。

而百度語音開放平臺負(fù)責(zé)人張克寧則透露,傳統(tǒng)語音平臺基于已有技術(shù)已經(jīng)很難再有大的改進(jìn),百度語音基于全新的技術(shù)原理更有機(jī)會取得突破性進(jìn)展,比如抗噪技術(shù)、響應(yīng)時間等都有突出表現(xiàn)。今年8月,科大訊飛在百度大腦問世之后,對外正式宣布要推出“超腦計劃”,以應(yīng)對以百度大腦為代表的新一波語音技術(shù)浪潮,這個計劃要實(shí)現(xiàn)基于類人神經(jīng)網(wǎng)絡(luò)的認(rèn)知智能引擎,而它的推出也在一定程度上驗證了傳統(tǒng)語音玩法已慢慢過時,未來幾年語音技術(shù)會有爆發(fā)式的突破。

2、完全不同的平臺玩法。

任何語音平臺最終都要比拼合作伙伴數(shù)量,這決定用戶數(shù)量和使用情況。更多人使用語音將能貢獻(xiàn)更多的語料等數(shù)據(jù),幫助語音效果不斷提升。目前,科大訊飛擁有的合作伙伴數(shù)量可能在行業(yè)里位居前列,開發(fā)者也達(dá)到數(shù)萬級別。百度語音平臺此次正式開放則有著完全不同的思路。

百度語音平臺與百度的內(nèi)容深度融合,比如百科知識、地圖路線、問答結(jié)果、天氣等中間頁服務(wù),面向智能硬件還有百度Inside等平臺,百度可以提供多種不同的模板便于開發(fā)者整合,GoogleNow比Siri表現(xiàn)更好正是因為內(nèi)容更強(qiáng)。百度語音開放平臺基于API和離線包,支持混合模式,針對不同行業(yè)提供不同的模板,而不是為每家企業(yè)量身打造,也不是基于License的軟件包形式,是更加“互聯(lián)網(wǎng)”的開放平臺。

3、與行業(yè)玩家完全不同的目的。

百度要做智能生態(tài),語音只是開放的一部分,百度還有大數(shù)據(jù)引擎、百度云、百度地圖、百度圖像識別等多維度API開放出來。百度語音開放,為的是用戶、流量和數(shù)據(jù),通過在不同設(shè)備和不同APP中滲透進(jìn)百度語音,夯實(shí)入口。傳統(tǒng)語音玩家就算免費(fèi)提供語音能力,最終還是要通過增值服務(wù)賺錢。百度語音為的是服務(wù),被百度視作連接服務(wù)的一種方式和必備的能力,傳統(tǒng)語音玩家則是把語音作為自己的看家本領(lǐng)想辦法基于語音衍伸一個新的生態(tài)實(shí)現(xiàn)盈利。

三、語音未來走向何方?突破技術(shù)瓶頸成為必備交互手段

盡管智能硬件給語音帶來新一波機(jī)會,但語音技術(shù)依然存在著不少瓶頸,其中典型的有移動網(wǎng)絡(luò)、識別能力、抗噪能力、遠(yuǎn)場交互、方言識別還有語義理解。不過這些瓶頸正在一個又一個被攻克,比如4G網(wǎng)絡(luò)普及和離線語音技術(shù)就可以很大程度解決網(wǎng)絡(luò)問題,再比如深度語音識別可以提升語義理解、語音識別和抗噪能力。在傳統(tǒng)語音巨頭和互聯(lián)網(wǎng)語音玩家的合力之下,這些瓶頸最終都會消失。

未來,語音交互與人工智能、深度學(xué)習(xí)、云端內(nèi)容深度耦合,語音識別能力并不是孤立存在的,將語音轉(zhuǎn)化為文字之后,能夠提供什么、能夠做什么,才是關(guān)鍵所在。這就需要與云端內(nèi)容和服務(wù)、與人工智能深度結(jié)合起來。這樣看來,搜索引擎在做語音上有著得天獨(dú)厚的條件。語音正在成為新的搜索入口,IOT時代,語音即搜索。

還有一個趨勢是,語音會與不同行業(yè)深度結(jié)合。比如教育行業(yè)的口語評測、兒童歌曲、兒童互動教育,再比如呼叫中心的語音客服。這都需要對行業(yè)深厚的理解和足夠定制化的解決方案。科大訊飛這類傳統(tǒng)語音巨頭已經(jīng)在某些行業(yè)深耕,其他的行業(yè)機(jī)會則留給了開發(fā)者,基于百度、訊飛等公司的語音開放能力,與行業(yè)結(jié)合實(shí)現(xiàn)行業(yè)定制化的語音方案。

值得一提的是,語音并不是萬能的,未來的交互一定是多元化的,文字、圖像、視頻、體感、觸感都不會消失,不同產(chǎn)品、不同場景,會有不同的交互訴求。語音雖然很重要,但也只是其中一種。比爾蓋茨說過,人們總是高估一項新技術(shù)在一兩年內(nèi)能夠做到的,卻低估語音在五到十年能做到的,語音就是曾經(jīng)被低估的技術(shù),其潛力正在被激發(fā)出來。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉