語音合成技術(shù)將推向大眾供普通用戶使用
(文章來源:AiChinaTech)
近日,百度地圖推出了定制化語音導(dǎo)航功能,簡(jiǎn)單說就是用戶根據(jù)提示采集原聲,十幾分鐘后你將獲得屬于自己定制化的語音導(dǎo)航音頻包。所以說用戶除了郭德綱、林志玲、羅振宇這一票人之外還有更多選擇。其實(shí)我們?cè)谑褂妹餍菍?dǎo)航音頻包時(shí)會(huì)發(fā)現(xiàn),除了很多“左轉(zhuǎn)”“紅綠燈路口”這類常規(guī)交通詞匯外,很多涉及地名的、地標(biāo)的詞是可以聽的出是合成的。而現(xiàn)在“語音合成”技術(shù)推向普通用戶,就有了這些AI定制化合成服務(wù)。
單從使用AI合成的相關(guān)App來看,不禁聯(lián)想到那個(gè)“一夜而紅”的ZAO,還有國(guó)外的Deepfake,AI脫衣軟件DeepNude等等。而國(guó)內(nèi)專注于人工智能領(lǐng)域的企業(yè)越來越多,例如:商湯科技、曠視科技這兩艘“AI巨輪”的業(yè)務(wù)主要是對(duì)政府及企業(yè)的;而科大訊飛、大疆、華為、小米、優(yōu)必選科技的部分硬件類業(yè)務(wù)是to C類的;極鏈科技是專注于視頻領(lǐng)域的人工智能企業(yè),業(yè)務(wù)面向品牌主及流量方,也就是to B類的。
對(duì)于廣大 C端 用戶來說,AI合成技術(shù)正在通過各種智能設(shè)備實(shí)現(xiàn)并應(yīng)用。比如地圖AR增強(qiáng),定制化音頻服務(wù)、定制化視頻服務(wù)、專屬智能客服等。
其實(shí)剛才提到過的曾經(jīng)爆火的這些App應(yīng)用,“ZAO”、“Deepfake”、“DeepNude”技術(shù)上有些共同之處,但是娛樂的點(diǎn)不同。“DeepNude”涉及色情內(nèi)容,并上升到人身攻擊最終被禁止。網(wǎng)友用“Deepfake”在網(wǎng)上大量惡搞政府首腦,比如特朗普的惡搞視頻眾多。
而離我們最近的“ZAO”,在有了前車之鑒后,看的出在盡可能規(guī)避可能產(chǎn)生的負(fù)面效果,視頻素材內(nèi)容由平臺(tái)方把控。但不可避免的是在用戶對(duì)照片進(jìn)行授權(quán)所涉及的隱私問題,因?yàn)椴粏渭兪巧蟼髡掌纯?,而是需要用戶多角度的認(rèn)證,有些“恐慌”確實(shí)不可避免,因?yàn)閽吣樦Ц?、掃臉登陸等功能已?jīng)被廣泛應(yīng)用,這是用戶最直接的對(duì)“ZAO”開發(fā)者的質(zhì)疑。隨后不久背后的公司陌陌科技被有關(guān)部門談話并要求整改,目前來看在ios的熱度及下載量仍然穩(wěn)定在前三名。
不再處于風(fēng)口浪尖,“ZAO”進(jìn)入了平穩(wěn)期,而大家對(duì)其盈利模式以及產(chǎn)品定位仍有疑問,似乎并沒看到一個(gè)清晰的變現(xiàn)方式。雖說當(dāng)前“視頻社交”火爆,但是僅憑陌陌的用戶帶動(dòng)還是比較乏力的。App自身沒有社交屬性,只是單純的內(nèi)容產(chǎn)出,和其他的分發(fā)渠道聯(lián)合顯得很必要。而問題又來了,這些內(nèi)容只適合小范圍內(nèi)私域傳播,用戶不愿意擴(kuò)散是關(guān)鍵。沒有爆炸傳播的潛質(zhì),所以營(yíng)銷能力也被削弱?;蛟S只是曇花一現(xiàn),但是對(duì)于用戶來說,拍照合成視頻的趣味性還是非常強(qiáng)的,但關(guān)于變現(xiàn)場(chǎng)景仍需要一段較長(zhǎng)的摸索期。
工具類軟件更能被大家接受認(rèn)可,微信中音頻轉(zhuǎn)文字功能用起來很方便,并且通過計(jì)算機(jī)的學(xué)習(xí),準(zhǔn)確度也在不斷提高。而科大訊飛推出的「訊飛聽見」是目前將音頻轉(zhuǎn)文字業(yè)務(wù)做的較為成熟的平臺(tái)。業(yè)務(wù)細(xì)分為機(jī)器快轉(zhuǎn)和中文人工精轉(zhuǎn)兩種服務(wù),可直接收費(fèi)變現(xiàn)。和百度地圖的定制版語音導(dǎo)航類似,屬于上傳后的AI處理,非在線轉(zhuǎn)化。
地圖app,作為一個(gè)相對(duì)高頻使用的工具類應(yīng)用,除了在滿足常規(guī)通行服務(wù)外,正在發(fā)現(xiàn)更多的To C服務(wù)場(chǎng)景。比如google地圖推出的AR導(dǎo)航功能,已經(jīng)開始測(cè)試應(yīng)用,用于幫助用戶以在線實(shí)景增強(qiáng)的方式判斷方向及路線。華為也正在布局地圖服務(wù),在Cyberverse數(shù)據(jù)平臺(tái)上發(fā)了Map Kit,而相關(guān)AR技術(shù)的應(yīng)用是在景區(qū)、博物館之類的場(chǎng)景做實(shí)景增強(qiáng)標(biāo)注和講解服務(wù)。在2017年高德地圖就推出了景區(qū)語音導(dǎo)游服務(wù),發(fā)展至今已經(jīng)比較成熟。