在媒體和娛樂行業(yè)中用人工智能解決的十大領(lǐng)域

時(shí)間：2020-07-15 14:00:01

關(guān)鍵字：人工智能數(shù)據(jù) 深度學(xué)習(xí)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 在這個(gè)數(shù)據(jù)爆炸的時(shí)代，收集數(shù)據(jù)本身是不夠的。它需要被加工，切片和切割，以獲得經(jīng)營(yíng)和發(fā)展業(yè)務(wù)的洞察力。不幸的是，當(dāng)今世界上大多數(shù)可用的數(shù)據(jù)是非結(jié)構(gòu)化的和隱藏的，使得在沒有顯著的人類參與的情況下難以

在這個(gè)數(shù)據(jù)爆炸的時(shí)代，收集數(shù)據(jù)本身是不夠的。它需要被加工，切片和切割，以獲得經(jīng)營(yíng)和發(fā)展業(yè)務(wù)的洞察力。不幸的是，當(dāng)今世界上大多數(shù)可用的數(shù)據(jù)是非結(jié)構(gòu)化的和隱藏的，使得在沒有顯著的人類參與的情況下難以處理。媒體行業(yè)的大部分?jǐn)?shù)據(jù)都屬于這一類，但已經(jīng)開始改變。

任何視頻文件，并將大量的非結(jié)構(gòu)化數(shù)據(jù)交織在其結(jié)構(gòu)中這需要密切的人類參與才能理解和解碼。它需要人力來完成內(nèi)容管理，處理，解釋，質(zhì)量檢查等最基本的工作，然后才能標(biāo)記為可供分發(fā)。有趣的是，人工智能和ML算法，特別是深度學(xué)習(xí)，現(xiàn)在達(dá)到了與人類精確度相當(dāng)?shù)乃?，以大?guī)模地執(zhí)行大部分這些任務(wù)。人工智能處于有利位置，既可以自動(dòng)執(zhí)行工作流程活動(dòng)，也可以從隱藏資產(chǎn)“數(shù)據(jù)”中獲得巨大的洞察力。因此，媒體行業(yè)目睹了自然語言處理（NLP），面部識(shí)別，異常檢測(cè)等領(lǐng)域的幾位獲獎(jiǎng)?wù)?，其中人工智能以其無與倫比的效率實(shí)現(xiàn)大規(guī)模自動(dòng)化。2107標(biāo)志著人工智能在廣播中開始收獲豐厚紅利的重要一年，內(nèi)容管理，后期制作，廣告和更多垂直行業(yè)。他們說，這只是AI之旅的開始！

預(yù)測(cè)分析和深度學(xué)習(xí)

預(yù)測(cè)分析使用了一個(gè)重要的假設(shè)，即未來的行為可能受過去趨勢(shì)的影響，并且在大多數(shù)情況下，它在一段時(shí)間內(nèi)保持良好。在這些預(yù)測(cè)模型的基礎(chǔ)上，一組假設(shè)將多個(gè)獨(dú)立變量結(jié)合在一起（例如，對(duì)于內(nèi)容個(gè)性化的變量——如年齡、性別、財(cái)務(wù)狀況、教育、內(nèi)容興趣），以建立統(tǒng)計(jì)相關(guān)性。正是這些相關(guān)性的集體強(qiáng)度和程度，可以預(yù)測(cè)未來的行為。在這里閱讀更多關(guān)于預(yù)測(cè)分析的知識(shí)。最近，利用神經(jīng)網(wǎng)絡(luò)來產(chǎn)生人類大腦般的分析能力的深度學(xué)習(xí)正在使機(jī)器學(xué)習(xí)到更高的認(rèn)知水平。通過模擬人腦對(duì)情境的反應(yīng)，深度學(xué)習(xí)帶來了從舊學(xué)校暴力決策樹到更真實(shí)的事物的顯著轉(zhuǎn)變。

媒體和娛樂行業(yè)的機(jī)器學(xué)習(xí)重點(diǎn)領(lǐng)域

過去幾十年來，AI和ML一直在學(xué)術(shù)和研發(fā)領(lǐng)域，直到最近幾年，真正的產(chǎn)業(yè)整合才開始取而代之。人工智能帶來的技術(shù)可以自動(dòng)執(zhí)行大部分人力密集的任務(wù)，并且具有可擴(kuò)展性，計(jì)算速度和可重復(fù)性等優(yōu)點(diǎn)。通過自動(dòng)化內(nèi)容管理，媒體操作中的現(xiàn)有任務(wù)以及改善客戶參與度和體驗(yàn)，它有很大的潛力來實(shí)現(xiàn)嚴(yán)重的成本節(jié)約。例如，AI可以自動(dòng)執(zhí)行復(fù)雜的音頻/視頻同步工作，從而節(jié)省大量的人工人力，并減少人為錯(cuò)誤。以下是媒體和娛樂行業(yè)進(jìn)入前十大AI轉(zhuǎn)型領(lǐng)域。

1、深入的視頻分析，翻譯，轉(zhuǎn)錄和標(biāo)記

AI花了幾年的時(shí)間來完善手寫識(shí)別并迅速轉(zhuǎn)向自然語言理解（NLU）。現(xiàn)在它已經(jīng)加速超越自然語言和元數(shù)據(jù)處理，深入深入分析內(nèi)容。機(jī)器主導(dǎo)的自動(dòng)化將口述音頻轉(zhuǎn)換成可讀文本，轉(zhuǎn)錄變得近乎實(shí)時(shí)。我們都看到了Alexa，Cortana和Google語音的早期到來。神經(jīng)網(wǎng)絡(luò)訓(xùn)練系統(tǒng)正在取代傳統(tǒng)的單詞轉(zhuǎn)換，通過增加新的情境和意圖相關(guān)維度。預(yù)計(jì)未來3年，AI將完全接管轉(zhuǎn)錄和翻譯活動(dòng)，并將駐留在日常使用的音頻設(shè)備上。

深度視頻分析是另一個(gè)有趣的領(lǐng)域，通過學(xué)習(xí)場(chǎng)景變化，位置參考，語音，面部和物體識(shí)別，導(dǎo)致視頻見解的多方面擴(kuò)展。這種智能在豐富內(nèi)容分類和適當(dāng)標(biāo)記內(nèi)容方面有很長(zhǎng)的路要走，這提高了內(nèi)容鏈接，搜索和關(guān)聯(lián)的準(zhǔn)確性。在這里，人工智能通過機(jī)器驅(qū)動(dòng)索引，元數(shù)據(jù)標(biāo)記，編目等方式顯著改變整個(gè)內(nèi)容管理環(huán)境，將手動(dòng)流程轉(zhuǎn)變?yōu)楦叨茸詣?dòng)化的工作流程。視頻翻譯為多種語言和方言以及多語言字幕，有助于將內(nèi)容的可尋址市場(chǎng)擴(kuò)大到比以往更多的受眾。

2、基于語音的虛擬助理

在過去的兩年中，像Alexa，Google家庭和語音遙控器（如Siri和Roku）的語音助理已經(jīng)開始通過完善基本的菜單導(dǎo)航功能來消除笨重的電視遙控器。接下來是在用戶跟進(jìn)命令的幫助下進(jìn)行內(nèi)容搜索和發(fā)現(xiàn)的情報(bào)。使用監(jiān)督式學(xué)習(xí)算法的人工智能現(xiàn)在可以為虛擬助手提供動(dòng)力，將消費(fèi)者的知識(shí)圖，地理坐標(biāo)，語音輸入和豐富的內(nèi)容元數(shù)據(jù)（演員表，摘要，報(bào)價(jià)，位置等）結(jié)合起來提供個(gè)性化推薦。虛擬助手了解語言特征，情感和用戶意圖的能力使他們更智能，直觀和成熟的對(duì)話系統(tǒng)增加了更好的客戶體驗(yàn)。隨著個(gè)人數(shù)字關(guān)系變得更加深刻，

3、優(yōu)化的視頻編碼和傳輸

引入自適應(yīng)比特率（ABR）流后，視頻流有一個(gè)主要的優(yōu)點(diǎn)。ABR編碼將原始文件的小塊創(chuàng)建為不同的比特率，以基于可用帶寬為客戶端提供服務(wù)（請(qǐng)閱讀此處以了解更多關(guān)于流媒體）。通過引入技術(shù)來提高固定比特率分塊到基于場(chǎng)景的編碼，人工智能正在付出更多的努力。人工智能通過學(xué)習(xí)多個(gè)質(zhì)量度量的場(chǎng)景復(fù)雜度，可以確定所需的壓縮級(jí)別并給出編碼視頻，系統(tǒng)可以確定幀級(jí)復(fù)雜度和最佳壓縮參數(shù)，同時(shí)保持質(zhì)量跟蹤。Netflix掌握了這項(xiàng)技術(shù)，即使在比特率較低的情況下，也可以生成精確的編碼流。這種新的編碼方式正在徹底改變?yōu)椴粩嘣鲩L(zhǎng)的新興經(jīng)濟(jì)體觀眾提供不間斷視頻的方式，在這些新興經(jīng)濟(jì)體中，手機(jī)上的低帶寬網(wǎng)絡(luò)是觀看視頻的最主要平臺(tái)。人工智能還通過根據(jù)觀眾位置，網(wǎng)絡(luò)擁塞等優(yōu)化所需比特率來提高在線媒體播放器的性能。

4、視覺識(shí)別

面部識(shí)別?和物體識(shí)別是一個(gè)重視視覺處理的AI區(qū)域。它涉及視頻和靜止圖像中個(gè)人和物體的識(shí)別以及隨時(shí)間的相對(duì)變化。雖然這種視覺處理對(duì)人類來說是自然而然的，但是機(jī)器能夠壓縮大量數(shù)據(jù)變化以達(dá)到期望的精度水平，這是一項(xiàng)艱巨的任務(wù)。最近，人工智能和機(jī)器學(xué)習(xí)越來越能夠掌握視覺感知 - 面部和模式識(shí)別，為內(nèi)容編輯和自動(dòng)化內(nèi)容創(chuàng)作開辟了豐富的途徑。想知道Facebook和眾多照片應(yīng)用程序如何用你的朋友的照片標(biāo)簽做出驚人的工作; 這是所有AI和ML在制作中

5、異常檢測(cè)

在過去的幾年中，在線視頻不成比例地增長(zhǎng)。YouTube，F(xiàn)acebook和在線網(wǎng)絡(luò)為業(yè)余愛好者和專業(yè)人士成為內(nèi)容創(chuàng)作者并接觸大眾觀眾創(chuàng)造了無限的機(jī)會(huì)。今天，對(duì)于每秒鐘產(chǎn)生的視頻和圖像數(shù)量來說，監(jiān)控和標(biāo)記不適當(dāng)?shù)膬?nèi)容（盜版，暴力，成人等）變得人力不可能。這再次是機(jī)器學(xué)習(xí)服務(wù)，在這個(gè)領(lǐng)域證明了這一點(diǎn)，大多數(shù)網(wǎng)絡(luò)在上傳時(shí)創(chuàng)建了基于AI的自動(dòng)檢測(cè)工具。Google的云視覺API就是這樣一種服務(wù)，它可以為標(biāo)記內(nèi)容做出適當(dāng)?shù)母倪M(jìn)。雖然假冒內(nèi)容的創(chuàng)作已經(jīng)成為人工智能越來越大的威脅，但是這種人工智能技術(shù)在限制惡意行為方面來拯救

6、內(nèi)容指紋識(shí)別

根據(jù)捕獲樣本內(nèi)容片段的原則，為識(shí)別創(chuàng)建獨(dú)特的指紋，內(nèi)容指紋識(shí)別在媒體行業(yè)已經(jīng)走過了很長(zhǎng)的路要走。隨著內(nèi)容繼續(xù)隨著多渠道分布而不斷增長(zhǎng)，基于AI的指紋識(shí)別技術(shù)在應(yīng)用中發(fā)揮了重要作用。一些用例是

通過有效的搜索找到精確和類似的配置文件媒體，Shazam是一個(gè)現(xiàn)場(chǎng)模型

使用區(qū)塊鏈對(duì)內(nèi)容進(jìn)行微許可進(jìn)行付款和跟蹤使用情況

識(shí)別和跟蹤消費(fèi)者觀看行為，衡量廣告

廣播監(jiān)視來驗(yàn)證事件發(fā)生

內(nèi)容保護(hù)音頻，視頻和圖像，追蹤未經(jīng)授權(quán)的分發(fā)

7、視頻質(zhì)量評(píng)估

視頻壓縮對(duì)視頻實(shí)現(xiàn)合理的傳輸速率至關(guān)重要。但是，壓縮是有損的，會(huì)引入損傷和偽像等工件。視頻質(zhì)量評(píng)估一直是內(nèi)容分發(fā)之前的關(guān)鍵過程，并且隨著多通道分布而逐漸擴(kuò)大。傳統(tǒng)上采用兩種標(biāo)準(zhǔn)方法，無論是單獨(dú)使用還是聯(lián)合使用都用于質(zhì)量評(píng)估。通過播放內(nèi)容和檢查錯(cuò)誤以及使用VQM，PSNR，MSE，SSIM等指標(biāo)進(jìn)行更加自動(dòng)化的基于參考的評(píng)估，實(shí)現(xiàn)基于人工的可視化分析。雖然前者需要大量的人力，但后來在準(zhǔn)確性，非實(shí)時(shí)性以及對(duì)參考模型的依賴方面面臨挑戰(zhàn)。人工智能和機(jī)器學(xué)習(xí)正在通過掌握基于非參考的視頻質(zhì)量評(píng)估來改變這一切。人工智能使用廣泛的功能集和從錯(cuò)誤模式中學(xué)習(xí)能夠提供接近實(shí)時(shí)的質(zhì)量評(píng)估。在視頻工作流程中實(shí)現(xiàn)質(zhì)量控制自動(dòng)化的巨大潛力，并在縮短內(nèi)容發(fā)布時(shí)間表方面帶來無與倫比的效率

8、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)

AR / VR市場(chǎng)潛力巨大，但由于成本，內(nèi)容成熟度和易用性方面的挑戰(zhàn)，該技術(shù)在很大程度上表現(xiàn)不佳。雖然虛擬現(xiàn)實(shí)（VR）專注于創(chuàng)造360度身臨其境的體驗(yàn)，但增強(qiáng)現(xiàn)實(shí)技術(shù)（AR）處理計(jì)算機(jī)圖形元素與真實(shí)世界元素的疊加。對(duì)于很大一部分VR / AR應(yīng)用程序和服務(wù)仍然非常粗糙，AI通過提高數(shù)據(jù)質(zhì)量和決策制定來帶來新的能源。人工智能幫助圖像準(zhǔn)確無誤，更好地理解用戶輸入和意圖，內(nèi)容關(guān)聯(lián)，情景化以及內(nèi)容創(chuàng)作，為用戶打造更加身臨其境的體驗(yàn)

9、后期制作

大量的創(chuàng)作過程基于定義的規(guī)則和技巧，因此可以通過機(jī)器學(xué)習(xí)算法掌握。人工智能系統(tǒng)可以自動(dòng)進(jìn)行劇情識(shí)別，場(chǎng)景選擇，腳本等各種創(chuàng)作過程所需的地面工作。聽說摩根？去年9月發(fā)行的一部基于人工智能的科幻電影與電影主題本身有共同之處。電影預(yù)告片雖然由人工編輯完成，但由AI使用IBM Watson提出。在這里，沃森被訓(xùn)練從相似主題的預(yù)告片中學(xué)習(xí)，并選擇電影中的關(guān)鍵場(chǎng)景，后來將它們縫合在一起制作最終預(yù)告片。一個(gè)很好的例子，AI可以選擇場(chǎng)景，插入視覺效果，并建立一個(gè)令人信服的人類編輯像拖車。以下是AI進(jìn)入的更多領(lǐng)域

對(duì)視頻內(nèi)容進(jìn)行結(jié)構(gòu)和語義分析，以幫助創(chuàng)建短片視頻片段，用于新聞，視頻分割以及用于粉絲參與的特殊興趣內(nèi)容。

腳本打樣，內(nèi)容清理，場(chǎng)景排序和電影編輯的第一通。給定一個(gè)腳本上下文，創(chuàng)建多個(gè)具有評(píng)分的場(chǎng)景表演供選擇

在緩慢移動(dòng)內(nèi)容捕捉中進(jìn)行視頻瀏覽以創(chuàng)建僅供參考的內(nèi)容

最近IBM與美國公開賽合作，通過認(rèn)識(shí)重要比賽時(shí)刻來提供體育亮點(diǎn)。人工智能能夠在體育和新聞中快速識(shí)別內(nèi)容并聚合相關(guān)內(nèi)容，這可以徹底改變體育和新聞報(bào)道的業(yè)務(wù)，因?yàn)樗F(xiàn)在已經(jīng)存在

10、內(nèi)容制作

內(nèi)容結(jié)構(gòu)和基于對(duì)象的分析已經(jīng)開啟了人工智能協(xié)助實(shí)際內(nèi)容開發(fā)的新途徑。從屏幕上角色的行為，走動(dòng)，談話和所有可能的面部表情的細(xì)節(jié)中學(xué)習(xí)，AI系統(tǒng)可以創(chuàng)建虛擬表演?？吹饺绾蝿?chuàng)造像真正的表演這樣的生活真是令人驚訝 - 檢查美國總統(tǒng)奧巴馬的一個(gè)他從未給出的演講剪輯，留下的想象力很少。人工智能在內(nèi)容創(chuàng)作領(lǐng)域仍然在不斷努力，并且在許多領(lǐng)域它可以使生產(chǎn)過程受益

通過學(xué)習(xí)流行名人的流行特征，表情，角色和風(fēng)格，創(chuàng)建虛擬人物角色（僅限數(shù)字化身）

使動(dòng)畫電影中的計(jì)算機(jī)圖形工作自動(dòng)化，取代人為密集的角色動(dòng)畫，但效率更高

總結(jié)

人工智能和機(jī)器學(xué)習(xí)有潛力影響基于一系列規(guī)則的任何事情，以及機(jī)器可以建立和學(xué)習(xí)模式的地方。AI和ML技術(shù)有其自己尚未探索的領(lǐng)域和障礙，但是為實(shí)現(xiàn)更大的目標(biāo)而定位，并承諾具有無與倫比的能力。隨著金融服務(wù)，高科技和電信業(yè)迅速采用人工智能，媒體和娛樂行業(yè)在自動(dòng)化工作流程方面也不甘落后。