AI技術(shù)使得文字時(shí)代加速轉(zhuǎn)向聲音時(shí)代
2018年2月,中讀的會(huì)員卡分銷一夜之間在朋友圈刷屏,一日之內(nèi)售賣5.4萬(wàn)份,也讓這個(gè)《三聯(lián)生活周刊》(以下簡(jiǎn)稱《三聯(lián)》)推出的知識(shí)平臺(tái)第一次為大眾所熟知。然而,當(dāng)知識(shí)分銷后來(lái)被微信緊急叫停,一次性打包售賣10年雜志電子版的“大甩賣”,注定要回歸到細(xì)水長(zhǎng)流的知識(shí)付費(fèi)。
雖然中讀也曾經(jīng)找過(guò)朗郎這樣的明星IP來(lái)合作頭部?jī)?nèi)容,但并不順利。因?yàn)榕c得到、喜馬拉雅這樣的頭部?jī)?nèi)容平臺(tái)相比,20多年下來(lái)積累的優(yōu)質(zhì)內(nèi)容及讀者群體,才是中讀相比其他平臺(tái)最大的優(yōu)勢(shì)。然而,把這些文字內(nèi)容專為化知識(shí)付費(fèi)產(chǎn)品,卻注定要經(jīng)歷一個(gè)“內(nèi)容產(chǎn)品化”的過(guò)程。10年電子版會(huì)員卡這種簡(jiǎn)單粗暴的方式,也要讓位于更精細(xì)、更原生、更智能的產(chǎn)品設(shè)計(jì)。
古登堡發(fā)明印刷機(jī)的時(shí)間是1439年,有個(gè)統(tǒng)計(jì)是,此后的1453到1503年,歐洲的印刷文本共800萬(wàn)冊(cè),等于之前歐洲全部手抄本的文字量。而如今,隨著信息進(jìn)入互聯(lián)網(wǎng)深度傳播時(shí)代,全球每年創(chuàng)造的信息量更是不計(jì)其數(shù)?!度?lián)》的執(zhí)行主編每日至少要通過(guò)pad或手機(jī)、電腦讀5萬(wàn)字的文本,這些容易產(chǎn)生視覺(jué)疲勞和“視覺(jué)超載”。
鑒于此,《三聯(lián)》開始考慮擴(kuò)大此前于2017年開始試水的音頻課程,將宋朝故事發(fā)展成了音頻內(nèi)容《我們?yōu)槭裁磹?ài)宋朝——宋朝美學(xué)十講》。繼按專欄集結(jié)成書之后,存量?jī)?nèi)容又有了更易消費(fèi)和傳播的呈現(xiàn)方式。只是接下來(lái),在大規(guī)?!拔淖忠纛l化”的過(guò)程中,原作者的時(shí)間成本與專業(yè)聲優(yōu)的制作成本,成為了其盤活億級(jí)內(nèi)容資源的瓶頸。
隨著AI語(yǔ)音技術(shù)的持續(xù)發(fā)展,中讀終于找到了音頻內(nèi)容常態(tài)化生產(chǎn)的“最優(yōu)解”。為此,《三聯(lián)》采用的新方式,是攜手微軟,將個(gè)性化語(yǔ)音定制技術(shù)運(yùn)用到有聲內(nèi)容生產(chǎn)中,AI音頻在經(jīng)過(guò)訓(xùn)練后被賦予文章原作者的聲音,讓聽眾感覺(jué)到“如聞其聲”。
傳統(tǒng)的有聲內(nèi)容主要依靠名人、主講人或者聲優(yōu)親自上陣錄制,往往需要耗時(shí)幾個(gè)月,成本巨大。聲音錄制也受限于人員、時(shí)間、環(huán)境等因素,無(wú)法實(shí)現(xiàn)產(chǎn)能最大化,求知者接收優(yōu)質(zhì)內(nèi)容的時(shí)間也會(huì)隨之延遲。而個(gè)性化語(yǔ)音定制系統(tǒng)則徹底突破了生產(chǎn)瓶頸,只需少量訓(xùn)練數(shù)據(jù)量就可以訓(xùn)練出一個(gè)逼真自然的人工智能聲音,大幅度提高了存量?jī)?nèi)容的轉(zhuǎn)化效率,有利于優(yōu)質(zhì)內(nèi)容的高效生產(chǎn)、再生產(chǎn)以及聲音知識(shí)的優(yōu)化和傳播。
文字內(nèi)容的音頻化也不僅是一個(gè)文字轉(zhuǎn)換為聲音的過(guò)程,更是與用戶關(guān)系的進(jìn)一步拉近,畢竟性格各異的聲音比千字一面的文字更有親切感,更容易打造作者的獨(dú)特人設(shè)。
不僅如此,相比于文字內(nèi)容結(jié)集出版,音頻課程的規(guī)模化生產(chǎn)可以更自由、靈活地對(duì)文字內(nèi)容進(jìn)行結(jié)構(gòu)化梳理,無(wú)論是大課、小課都可以靈活定制。除了億級(jí)的存量?jī)?nèi)容,《三聯(lián)》每期15—20萬(wàn)字的內(nèi)容將成為源源不斷的內(nèi)容庫(kù)。文字內(nèi)容與音頻課程的同步、互動(dòng),也將激發(fā)出更大的想象空間,可以稱得上是內(nèi)容領(lǐng)域的O2O。
AI技術(shù)也使“生產(chǎn)出形式多樣的衍生內(nèi)容產(chǎn)品”成為可能。“讓課程主講人開口說(shuō)他不會(huì)說(shuō)的語(yǔ)言,從英語(yǔ)、法語(yǔ)甚至是當(dāng)?shù)胤窖?,?shí)現(xiàn)多語(yǔ)種及多種說(shuō)話風(fēng)格的輸出”是中讀進(jìn)行的另一項(xiàng)大膽嘗試。本次大會(huì)上,中讀除了展示首個(gè)AI音頻產(chǎn)品《土摩托·生命八卦》外,還展示了最新推出的《宋朝美學(xué)十講》的英文版本。
當(dāng)《三聯(lián)》與中讀的高知用戶走向海外,常常會(huì)遇到向外國(guó)人傳遞中國(guó)傳統(tǒng)文化的反向需求。此時(shí),AI技術(shù)便可生成有一定語(yǔ)調(diào)和節(jié)奏感的他國(guó)語(yǔ)言版中國(guó)故事,便于擁有對(duì)外漢語(yǔ)傳播交流需求的人群向外輸出。不僅如此,這種中英文內(nèi)容的切換,對(duì)在國(guó)內(nèi)生活的海外留學(xué)生和專家學(xué)者來(lái)說(shuō),也拓展了學(xué)習(xí)漢語(yǔ)和漢文化的途徑和內(nèi)容。
在“中讀”《土摩托·生命八卦》知識(shí)音頻欄目下,鈦媒體發(fā)現(xiàn),有受眾指出了音頻仍像“機(jī)讀”、斷句和讀音錯(cuò)誤等技術(shù)bug。誠(chéng)然,當(dāng)AI音頻初推之際,技術(shù)的不足會(huì)影響用戶體驗(yàn);不過(guò),技術(shù)會(huì)隨著發(fā)展而進(jìn)步,AI音頻普及之后可能帶來(lái)的知識(shí)產(chǎn)業(yè)變革,卻是不容忽視的行業(yè)新風(fēng)向。
在AI語(yǔ)音技術(shù)的加持之下,能夠轉(zhuǎn)換語(yǔ)種的合成音頻產(chǎn)品,對(duì)于《三聯(lián)》來(lái)說(shuō),不但盤活了存量?jī)?nèi)容資源、拓展了用戶的碎片化使用場(chǎng)景,還破壁了語(yǔ)言限制、將用戶肖像擴(kuò)大到了截然不同的新群體中。同時(shí),AI音頻的普及,還使原本生產(chǎn)一次性內(nèi)容的文字工作者變成了IP供應(yīng)商,極速提升了產(chǎn)品二次變現(xiàn)的效率,可以很大程度地改善傳統(tǒng)寫作者的生存狀態(tài)。