當(dāng)前位置:首頁 > 消費電子 > 音頻技術(shù)
[導(dǎo)讀]   語音識別被業(yè)內(nèi)認(rèn)為是搜索引擎的下一個爆發(fā)點,但由于實際應(yīng)用中的識別準(zhǔn)確率還有待完善,語音技術(shù)的商業(yè)化道路并不好走。   上周成立僅一年多的云知聲正式宣布獲得一億人民幣A輪融資。云知聲

  語音識別被業(yè)內(nèi)認(rèn)為是搜索引擎的下一個爆發(fā)點,但由于實際應(yīng)用中的識別準(zhǔn)確率還有待完善,語音技術(shù)的商業(yè)化道路并不好走。

  上周成立僅一年多的云知聲正式宣布獲得一億人民幣A輪融資。云知聲聯(lián)合創(chuàng)始人、CEO梁家恩告訴南都記者,相比傳統(tǒng)做2B的語音識別公司,云知聲的基因更偏向于互聯(lián)網(wǎng),通過免費的公有云語音平臺帶動私有云服務(wù)的定制,還為日后進(jìn)一步商業(yè)化埋下伏筆。

  數(shù)據(jù)雖少勝在執(zhí)行快速

  中科院出身的梁家恩從事過十幾年的語音識別研究,而他的創(chuàng)業(yè)團(tuán)隊同樣有著深厚的技術(shù)背景,在語音識別、語義理解等方面的專業(yè)積累均超過十年。在他看來,語音交互的需求正變得越來越迫切:隨著移動互聯(lián)網(wǎng)壯大,智能手機(jī)、智能電視、可穿戴設(shè)備等都需要良好的交互體驗,而語音作為最直接的交互方式大有可為;對于用戶而言,也更樂于選擇簡潔、自然的語音交互。“這是行業(yè)趨勢,智能交互手段日后會成為主流。”梁家恩說。

  以目前的技術(shù),語音識別在實驗室條件下能達(dá)到非常高的準(zhǔn)確率,但實際應(yīng)用中往往遇到環(huán)境噪音、方言口音、話題專業(yè)性等問題,最終影響用戶體驗,因此,技術(shù)的穩(wěn)定和成熟程度是語音識別的創(chuàng)業(yè)門檻。梁家恩認(rèn)為,要想把語音識別系統(tǒng)做好,除了有強(qiáng)大的算法以外,還要有大量的數(shù)據(jù)。他坦言,與行業(yè)老大科大訊飛相比,云知聲的數(shù)據(jù)量要少得多,不過,通過建立公有云平臺,可以不斷積累數(shù)據(jù),從而優(yōu)化系統(tǒng)。

  具體而言,公有云平臺提供大詞匯量連續(xù)語音在線識別,開發(fā)者不論大小,都可以通過A PI直接調(diào)用公有云服務(wù)。事實上,云知聲的客戶里80%以上都是中小企業(yè)和個人開發(fā)者,這恰好與深耕大客戶服務(wù)的科大訊飛形成了一種差異和互補(bǔ)。不過,這并不影響大企業(yè)對云知聲的青睞。梁家恩坦言,包括樂視、錘子RO M,其實一開始找的都是科大訊飛,云知聲之所以最終能吸引到他們,除了技術(shù)達(dá)到一定水準(zhǔn)以外,快速的執(zhí)行力是最大的優(yōu)勢。“以跟搜狗的合作為例,從第一次接觸,到搜狗語音助手的發(fā)布只花了兩周時間,而一般來說要洽談幾個月。”這些大企業(yè)本身的用戶量很大,一下子給公有云平臺帶來了大量數(shù)據(jù)。

  發(fā)力私有云定制

  有了公有云作為基礎(chǔ),云知聲進(jìn)一步探索私有云的路徑。

  所謂私有云,就是為企業(yè)提供定制的智能交互解決方案,包括語音識別、語義理解、語音合成等方面。梁家恩解釋,公有云平臺提供的只是基礎(chǔ)的語音技術(shù)服務(wù),而事實上,語音交互跟企業(yè)業(yè)務(wù)的關(guān)聯(lián)性很強(qiáng),對于那些對語音有剛需的企業(yè)來說,公有云并不足以完全滿足需求,還要根據(jù)企業(yè)特有的應(yīng)用環(huán)境優(yōu)化識別模型。比如云知聲與樂視的合作,就是將語音助手根據(jù)電視領(lǐng)域進(jìn)行了深度定制和融合,使得效果更貼合智能電視的實際使用。“真正愿意付費的也只能是這部分剛需用戶,云知聲的公有云平臺是免費的,2B的私有云平臺才是主要的營收來源。”梁家恩說。

  不過,相比公有云平臺積累的上千家開發(fā)者,定制私有云服務(wù)的只有十來家企業(yè),如何提高私有云的定制業(yè)務(wù),從而提高營收呢?梁家恩指出,事實上,把公有云平臺做大以后,其用戶也會轉(zhuǎn)化成私有云用戶,這就是前者免費的原因——— 免費能吸引大量的開發(fā)者接入他們的平臺,了解并體驗語音識別。如果由此為開發(fā)者的應(yīng)用帶來用戶活躍度的提升以及用戶粘性的增強(qiáng),他們就會認(rèn)可語音所帶來的價值,甚至愿意通過付費獲得更好的服務(wù)。因此,公有云是品牌宣傳,更是培養(yǎng)用戶。

  在定制領(lǐng)域的選擇上,梁家恩表示,目前不會框定自己,手機(jī)、電視、車載、智能手表、呼叫中心等各方面都會涉足。“盡量了解不同行業(yè),才會知道哪些市場足夠大,不過,我們最后一定會專注于兩三個領(lǐng)域,然后做大。”

  不與自身平臺開發(fā)者競爭

  只靠技術(shù)服務(wù)收費未必具備持續(xù)性,云知聲在盈利模式上還有更長線的規(guī)劃。

  梁家恩預(yù)計,公有云平臺未來可能會有上萬家的開發(fā)者,而當(dāng)用戶聚集到足夠多的時候,就有可能做后端的變現(xiàn)。他設(shè)想,這是一條由廣告商、平臺和前段開發(fā)者構(gòu)成的鏈條:單個開發(fā)者的A PP用戶量也許只有幾十到幾百萬,廣告價值不大;而通過云知聲平臺能聚集上萬個開發(fā)者、上萬個應(yīng)用,所積累的用戶量很大,這就具有了廣告價值和推薦價值;從廣告主得到的收入,平臺和開發(fā)者分成。不過,要把這條鏈條真正打通,梁家恩認(rèn)為,平臺至少要達(dá)到上億的用戶,以云知聲現(xiàn)在的體量,還有很長的路要走。

  此外,梁家恩表示,只專注做平臺化發(fā)展,不打算發(fā)展自己的語音A PP。他認(rèn)為,如果云知聲也做C端推A PP,那么跟開發(fā)者多少存在競爭關(guān)系,用他們的平臺就不踏實。“通過開發(fā)者把平臺價值做大,讓開發(fā)者不但能免費用我們的平臺,還能分享利益,在中國的互聯(lián)網(wǎng)環(huán)境下,這樣的商業(yè)模式才走得遠(yuǎn)。”

  云知聲通過語音云平臺聚集開發(fā)者、未來進(jìn)一步挖掘商業(yè)價值,這種想法在互聯(lián)網(wǎng)時代是正確的“大循環(huán)思路”。專注于平臺而不是簡單賺語音的錢,調(diào)動開發(fā)者的力量才能打造整個生態(tài)系統(tǒng)。

  作為技術(shù)云平臺,一開始就模式清晰、營銷有力是好的加分項,但長期來說,還要看技術(shù)是否具有競爭力。除了云知聲,科大訊飛、思必馳等幾個有技術(shù)背景的工程公司都已經(jīng)推出了語音云,給開發(fā)者帶來了更多選擇。市場很大,也都有機(jī)會,關(guān)鍵是能否做到比別的平臺在識別和理解能力上更有優(yōu)勢。

  就語言行業(yè)而言,現(xiàn)在的重點已經(jīng)逐漸轉(zhuǎn)移到能在自然環(huán)境下,聽懂自然語言的人機(jī)對話技術(shù),包括如何在環(huán)境嘈雜的車載電視中,在識別率不高的情況下,通過多輪次對話了解用戶意圖;如何通過對話完成復(fù)雜的信息搜索,預(yù)訂交易等需求,這方面還有很大的發(fā)展空間。對于傳統(tǒng)的語音公司,特別是原來采取語音識別到文本、文本再去做語義識別的將面臨挑戰(zhàn),而云知聲等少數(shù)幾家有平臺技術(shù)潛力的公司則很有價值。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉