語(yǔ)音識(shí)別技術(shù)在數(shù)字化生活中的應(yīng)用及發(fā)展
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:捷思奇)
? ? ?? 語(yǔ)音識(shí)別領(lǐng)域已經(jīng)開(kāi)始從研發(fā)轉(zhuǎn)為應(yīng)用,研發(fā)比的是標(biāo)準(zhǔn)環(huán)境下純粹的算法誰(shuí)更有優(yōu)勢(shì),而應(yīng)用比較的是在真實(shí)場(chǎng)景下誰(shuí)的技術(shù)更能產(chǎn)生優(yōu)異的用戶體驗(yàn),而一旦在真實(shí)場(chǎng)景下的體驗(yàn),語(yǔ)音識(shí)別便失去獨(dú)立存在的價(jià)值,更多作為產(chǎn)品體驗(yàn)的一個(gè)環(huán)節(jié)而存在。
智能音箱,以一種井噴式的發(fā)展出現(xiàn)在大眾面前,市場(chǎng)銷量以及智能音箱的 AI 屬性,促使 2016 年下半年,國(guó)內(nèi)各大巨頭幾乎是同時(shí)轉(zhuǎn)變態(tài)度,積極打造自己的智能音箱 。但在 2019 年之后則開(kāi)始進(jìn)入市場(chǎng)萎縮的階段,人們關(guān)注的焦點(diǎn)也不再是單純的技術(shù)指標(biāo),而是回歸到體驗(yàn),更為一般的、純粹的商業(yè)視角。然而卻因?yàn)榧夹g(shù)瓶頸的限制,客戶的體驗(yàn)感覺(jué)并未如預(yù)期,智能音箱在遠(yuǎn)場(chǎng)環(huán)境中使用的效果也沒(méi)達(dá)到消費(fèi)者的期待。
智能音箱淪為網(wǎng)路聽(tīng)歌、聽(tīng)書(shū)的平臺(tái),更有眾里換他千百度,只收到請(qǐng)?jiān)僬f(shuō)一次的回應(yīng);這與開(kāi)發(fā)智能音箱的初衷出現(xiàn)非常大的差距,而讓智能音箱淪為玩具,確實(shí)也讓市場(chǎng)對(duì)于智能音箱的發(fā)展產(chǎn)生很大的質(zhì)疑。目前發(fā)展較為成功的應(yīng)用大多局限于語(yǔ)音翻譯機(jī),而智能家居上利用語(yǔ)音作為控制上的應(yīng)用僅止于產(chǎn)品演示,離真正的實(shí)用化還有萬(wàn)里之遙;畢竟環(huán)境因素與遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別技術(shù),不管硬體還是軟體都還尚未到達(dá)成熟可以商業(yè)化的程度,這更阻礙市場(chǎng)的發(fā)展。
當(dāng)語(yǔ)音產(chǎn)業(yè)尋求下一個(gè)發(fā)展契機(jī)的同時(shí),行業(yè)的發(fā)展速度反過(guò)來(lái)會(huì)受限于平臺(tái)服務(wù)商的供給能力而導(dǎo)致整體發(fā)展速度變緩。從整體市場(chǎng)發(fā)展來(lái)看,行業(yè)下一步發(fā)展的本質(zhì)思維是:在具體每個(gè)語(yǔ)音識(shí)別產(chǎn)品的投入產(chǎn)出是否達(dá)到一個(gè)普遍接受的應(yīng)用,離這個(gè)越近,行業(yè)就越會(huì)接近蓬勃發(fā)展,否則整體增速就會(huì)相對(duì)平緩。然而不管是智能家居、酒店、金融、教育或者其他場(chǎng)景,如果解決問(wèn)題的投入資金與時(shí)間過(guò)于漫長(zhǎng),那對(duì)投資方的考量就會(huì)增加更多猶豫。如果投入后,沒(méi)有可感知的新體驗(yàn)或者銷量促進(jìn),那對(duì)此投資方也會(huì)興趣缺缺,這會(huì)直接影響值不值投資的判斷。
從核心技術(shù)來(lái)看,整個(gè)語(yǔ)音技術(shù)有五點(diǎn)技術(shù):?jiǎn)拘?、麥克風(fēng)陣列、語(yǔ)音識(shí)別、自然語(yǔ)言處理、語(yǔ)音合成;這些AI芯片與軟件算法相對(duì)來(lái)說(shuō)復(fù)雜程度非常的高,但從商業(yè)角度來(lái)看我們就會(huì)發(fā)現(xiàn),想要找到這些技術(shù)的不足點(diǎn)打造一款體驗(yàn)良好的產(chǎn)品,仍然存在著非常大的技術(shù)門檻 。所有語(yǔ)音交互產(chǎn)品都是端點(diǎn)對(duì)端點(diǎn)應(yīng)用的產(chǎn)品,如果每家廠商都從這些基礎(chǔ)技術(shù)來(lái)打造產(chǎn)品,那就每家都要建立自己云服務(wù)系統(tǒng),確保響應(yīng)速度,調(diào)試自己所選擇的硬件平臺(tái),逐項(xiàng)整合具體的內(nèi)容。
國(guó)內(nèi)則缺乏系統(tǒng)整合的平臺(tái)提供商,當(dāng)前的平臺(tái)提供商分為兩種:一種是傳統(tǒng)互聯(lián)網(wǎng)或者上市公司;一類是以語(yǔ)音識(shí)別技術(shù)為主的新興人工智能公司。新興的人工智能公司相比傳統(tǒng)公司產(chǎn)品和服務(wù)上的歷史包袱更輕,因此在平臺(tái)服務(wù)上反倒是可以主推一些更為面向未來(lái)、有特色的基礎(chǔ)服務(wù),比如兼容性方面新興公司做的會(huì)更加徹底,這種兼容性對(duì)于一套產(chǎn)品同時(shí)覆蓋全球市場(chǎng)是相對(duì)更加有利的。
人與數(shù)字世界的接口,在現(xiàn)在越來(lái)越統(tǒng)一于具體的產(chǎn)品形態(tài)(比如手機(jī)),但隨著智能型系統(tǒng)的出現(xiàn),這種統(tǒng)一則會(huì)越來(lái)越統(tǒng)一于系統(tǒng)本身,而相對(duì)的周邊傳感器與執(zhí)行器的開(kāi)發(fā),可將整個(gè)系統(tǒng)更加完善、更接近人內(nèi)的言行與思考模式,這樣的結(jié)果會(huì)帶來(lái)數(shù)字化程度更高,越來(lái)越接近數(shù)字化的生活。
? ? ?