當(dāng)下語音識別技術(shù)的市場發(fā)展突飛猛進(jìn)
(文章來源:AI語音新技術(shù))
近年來,語音識別技術(shù)取得了重大進(jìn)展,并已開始從實(shí)驗(yàn)室走向人們的生活。 預(yù)計(jì)在未來10年內(nèi),語音識別技術(shù)將進(jìn)入各個領(lǐng)域,如工業(yè)、家用電子產(chǎn)品、通信、汽車電子。今天小編就語音識別的公司來分析。
大致來看,語音識別可以分為以下三個梯隊(duì):第一梯隊(duì):科大訊飛、騰訊、百度第二梯隊(duì):思必馳、捷通華聲、聲智科技、云之聲等,第三梯隊(duì):客知音等創(chuàng)業(yè)公司或者背靠其他學(xué)術(shù)或技術(shù)團(tuán)隊(duì)。
科大訊飛是語音識別領(lǐng)域的老大,無論是市場占有還是技術(shù)創(chuàng)新;騰訊和百度團(tuán)隊(duì)實(shí)力毋容置疑,潛力很大。不管怎么說,第一梯隊(duì)的語音識別率和團(tuán)隊(duì)的技術(shù)實(shí)力都是最強(qiáng)的。訊飛輸入法首發(fā)方言識別引擎,支持方言已達(dá)15種,用戶超過2.5億。百度在語音識別、語音測試等方面有十幾年的數(shù)據(jù)積累,實(shí)力雄厚。
思必馳在技術(shù)上也很不錯,整體通用識別率屬第二梯隊(duì),對于生僻字識別也有其優(yōu)勢,主要服務(wù)于智能硬件的三個垂直領(lǐng)域:智能機(jī)器人、智能車載和智能家居,提供自然語言交互解決方案。捷通華聲在語音合成和語義理解上有獨(dú)特建樹。聲智科技提供從端到云的智能語音交互技術(shù)和服務(wù)方案,以及從芯片、模組、開發(fā)板到白牌產(chǎn)品的智能語音應(yīng)用方案。
第三梯隊(duì)是客知音等創(chuàng)業(yè)公司依靠國外的語音技術(shù),在單個領(lǐng)域的語音識別比業(yè)界通用的語音識別引擎要高,垂直聚焦于聚焦于壽險行業(yè)和政府熱線的服務(wù)。其他技術(shù)團(tuán)隊(duì)有中科院聲學(xué)所和自動化所。
在未來的語音識別市場中,越來越多的公司有望參與其中。 在未來,語音識別的表現(xiàn)可能更多地體現(xiàn)在前端技術(shù)和語義理解上。如果機(jī)器想要自然地與人溝通,當(dāng)然,它不能重復(fù)這套手機(jī)的語音對話規(guī)則。它必須考慮許多因素,例如用戶說話的環(huán)境,周圍環(huán)境中的噪音,用戶不準(zhǔn)確的發(fā)音或方言。這需要前端技術(shù)更準(zhǔn)確地模擬人體結(jié)構(gòu)并模擬機(jī)器人的聽覺系統(tǒng),以達(dá)到解放雙手之間自由對話的目的。