全球最牛語音識別技術(shù)的公司有哪些
任何時候提到語音識別,都不能避過Nuance這家公司,這家公司曾經(jīng)在語音領(lǐng)域一統(tǒng)江湖,世界上有超過80%的語音識別都用過Nuance識別引擎技術(shù),其語音產(chǎn)品可以支持超過50種語言,在全球擁有超過20億用戶,幾乎壟斷了金融和電信行業(yè)。就算現(xiàn)在,仍舊是瘦死的駱駝比馬大,Nuance依舊是全球最大的語音技術(shù)公司,掌握著全球最多的語音技術(shù)專利。
國外Google、Apple、 MSRA語音識別的基礎(chǔ)研究做得比較久,技術(shù)上比較好。國內(nèi)專門做語音識別的有“科大訊飛”和“云知聲”,前者是上市公司,發(fā)展時間比較長。后者是新成立的公司,但技術(shù)上有獨(dú)到的地方。云知聲目前發(fā)展很強(qiáng)勁,技術(shù)很厲害。好像搜狗語音輸入法、易信、樂視TV、小米等產(chǎn)品都采用了云知聲的語音識別技術(shù)。
1、NuanceNuance公司(Nuance Communications, Inc. (NASDAQ: NUAN)) 是最大的專門從事語音識別軟件、圖像處理軟件及輸入法軟件研發(fā)、銷售的公司。目前世界上最先進(jìn)的電腦語音識別軟件Naturally Speaking就出自于Nuance公司。用戶對著麥克風(fēng)說話,屏幕上就會顯示出說話的內(nèi)容。T9智能文字輸入法作為旗艦產(chǎn)品,最大優(yōu)勢支持超過70種語言,超過30億部移動設(shè)備內(nèi)置T9輸入法。已成為業(yè)內(nèi)認(rèn)同的標(biāo)準(zhǔn)輸入法,被眾多OEM廠商內(nèi)置,包括諾基亞、索愛、三星、LG、夏普、海爾、華為等等。T9全球市場占有率超70%,中國超50%。
自電腦問世以來,科學(xué)家們就一直致力于讓電腦能夠理解人們的講話。幾年前,除了實(shí)驗(yàn)室內(nèi)的演示之外,這方面還沒有什么進(jìn)展。不過2010年來電腦的語音識別功能已經(jīng)有了質(zhì)的飛躍,隨著語音識別技術(shù)慢慢走向成熟,駕駛員可以“告訴”全球定位系統(tǒng)(GPS)他們的目的地;手機(jī)用戶不必按鍵,只需要對著手機(jī)發(fā)布命令即可;醫(yī)生可以口述患者的病歷,而旁邊的設(shè)備就能自動記錄下來,這一切通過口頭指令來控制操作的應(yīng)用已經(jīng)不僅僅出現(xiàn)在科幻小說中了,而是真正成為了現(xiàn)實(shí)。
2、Google
谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和謝爾蓋·布林共同創(chuàng)建,被公認(rèn)為全球最大的搜索引擎。
谷歌是一家位于美國的跨國科技企業(yè),業(yè)務(wù)包括互聯(lián)網(wǎng)搜索、云計(jì)算、廣告技術(shù)等,同時開發(fā)并提供大量基于互聯(lián)網(wǎng)的產(chǎn)品與服務(wù),其主要利潤來自于AdWords等廣告服務(wù)。
3、Apple
Siri成立于2007年,2010年被蘋果以2億美金收購,最初是以文字聊天服務(wù)為主,隨后通過與全球最大的語音識別廠商N(yùn)uance合作,Siri實(shí)現(xiàn)了語音識別功能。
Siri可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、日程安排、搜索資料等應(yīng)用,還能夠不斷學(xué)習(xí)新的聲音和語調(diào),提供對話式的應(yīng)答。