Google和亞馬遜相繼開放了語音API
(文章來源:雷鋒網(wǎng))
亞馬遜表示,其數(shù)字助理Alexa背后的人工智能和語音識(shí)別軟件現(xiàn)在向所有云計(jì)算客戶開放。這項(xiàng)服務(wù)被亞馬遜稱為L(zhǎng)ex,已經(jīng)在去年12月份的云計(jì)算會(huì)議上公布過,但尚未廣泛投入應(yīng)用。Lex使用了與Alexa相同的機(jī)器學(xué)習(xí)技術(shù),它的算法讓應(yīng)用程序能夠進(jìn)行對(duì)話和處理語音和文本。
亞馬遜的Lex服務(wù)允許開發(fā)者依靠語音識(shí)別和深度學(xué)習(xí)技術(shù),開發(fā)對(duì)話應(yīng)用。開發(fā)者可以不用重新造輪子,直接調(diào)用接口就行。這也表明,亞馬遜計(jì)劃在向Alexa平臺(tái)做了大量投入后,想獲得回報(bào)。曾有分析顯示,在三年內(nèi)Alexa可能會(huì)帶來高達(dá)100億美元的收入。其他創(chuàng)收方法還包括出售Echo產(chǎn)品線設(shè)備,或者通過Alexa讓用戶在亞馬遜上購(gòu)物。
對(duì)AWS來說,將Lex開放給更多客戶可以使其規(guī)模化。很多公司沒法輕松且大規(guī)模地開發(fā)具有語音識(shí)別和自然語言理解能力的應(yīng)用程序。如果AWS與Lex能成功,會(huì)有越來越多的應(yīng)用把AI嵌入其中。Google,微軟和Facebook都在兜售他們的人工智能平臺(tái)。像大多數(shù)技術(shù)一樣,能接觸到最多的開發(fā)者和應(yīng)用,AI平臺(tái)獲勝的幾率就越大。
無獨(dú)有偶,,并且新版本的語音軟件在準(zhǔn)備性上有所提升,可以完成轉(zhuǎn)錄和語音命令等任務(wù)。Google之前已經(jīng)發(fā)布了一個(gè)測(cè)試版本,但有一定的限制,只能在限定的產(chǎn)品中使用。就在前一天Google云也向所有用戶開放語音接口Cloud Speech API
根據(jù)Google的說法,新版本的軟件也更快,可以使用更多的文件格式,能更準(zhǔn)確地轉(zhuǎn)錄音頻。除了轉(zhuǎn)錄外,該軟件還用于語音命令,用語音來控制其它設(shè)備和服務(wù)。
Google大部分資金來自廣告和搜索,并將企業(yè)產(chǎn)品(如云服務(wù))視為未來收入增長(zhǎng)的主要推動(dòng)力,但這方面仍落后于亞馬遜和微軟。新版Google語音軟件是嘗試成為更有競(jìng)爭(zhēng)力的云服務(wù)商的一個(gè)例子。這也是在與亞馬遜,F(xiàn)acebook和蘋果的技術(shù)競(jìng)賽中,炫耀自己AI能力的方法。
除了語音API,Google還有其他預(yù)先訓(xùn)練的機(jī)器學(xué)習(xí)模型,可用于視頻分析,圖像分析,文本分析和動(dòng)態(tài)翻譯。
在價(jià)格方面,亞馬遜會(huì)根據(jù)為開發(fā)者處理的文本和語音的量進(jìn)行收費(fèi)。Google暫時(shí)未知,但應(yīng)該會(huì)采用同樣的方式。另外,根據(jù)Google的說法,現(xiàn)在語音的主要使用場(chǎng)景是語音控制(如車載導(dǎo)航)以及語音分析(多用于呼叫中心)。