當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 在這個(gè)數(shù)據(jù)爆炸的時(shí)代,收集數(shù)據(jù)本身是不夠的。它需要被加工,切片和切割,以獲得經(jīng)營(yíng)和發(fā)展業(yè)務(wù)的洞察力。不幸的是,當(dāng)今世界上大多數(shù)可用的數(shù)據(jù)是非結(jié)構(gòu)化的和隱藏的,使得在沒有顯著的人類參與的情況下難以

在這個(gè)數(shù)據(jù)爆炸的時(shí)代,收集數(shù)據(jù)本身是不夠的。它需要被加工,切片和切割,以獲得經(jīng)營(yíng)和發(fā)展業(yè)務(wù)的洞察力。不幸的是,當(dāng)今世界上大多數(shù)可用的數(shù)據(jù)是非結(jié)構(gòu)化的和隱藏的,使得在沒有顯著的人類參與的情況下難以處理。媒體行業(yè)的大部分?jǐn)?shù)據(jù)都屬于這一類,但已經(jīng)開始改變。

任何視頻文件,并將大量的非結(jié)構(gòu)化數(shù)據(jù)交織在其結(jié)構(gòu)中這需要密切的人類參與才能理解和解碼。它需要人力來完成內(nèi)容管理,處理,解釋,質(zhì)量檢查等最基本的工作,然后才能標(biāo)記為可供分發(fā)。有趣的是,人工智能和ML算法,特別是深度學(xué)習(xí),現(xiàn)在達(dá)到了與人類精確度相當(dāng)?shù)乃?,以大?guī)模地執(zhí)行大部分這些任務(wù)。人工智能處于有利位置,既可以自動(dòng)執(zhí)行工作流程活動(dòng),也可以從隱藏資產(chǎn)“數(shù)據(jù)”中獲得巨大的洞察力。因此,媒體行業(yè)目睹了自然語言處理(NLP),面部識(shí)別,異常檢測(cè)等領(lǐng)域的幾位獲獎(jiǎng)?wù)?,其中人工智能以其無與倫比的效率實(shí)現(xiàn)大規(guī)模自動(dòng)化。2107標(biāo)志著人工智能在廣播中開始收獲豐厚紅利的重要一年,內(nèi)容管理,后期制作,廣告和更多垂直行業(yè)。他們說,這只是AI之旅的開始!

預(yù)測(cè)分析和深度學(xué)習(xí)

預(yù)測(cè)分析使用了一個(gè)重要的假設(shè),即未來的行為可能受過去趨勢(shì)的影響,并且在大多數(shù)情況下,它在一段時(shí)間內(nèi)保持良好。在這些預(yù)測(cè)模型的基礎(chǔ)上,一組假設(shè)將多個(gè)獨(dú)立變量結(jié)合在一起(例如,對(duì)于內(nèi)容個(gè)性化的變量——如年齡、性別、財(cái)務(wù)狀況、教育、內(nèi)容興趣),以建立統(tǒng)計(jì)相關(guān)性。正是這些相關(guān)性的集體強(qiáng)度和程度,可以預(yù)測(cè)未來的行為。在這里閱讀更多關(guān)于預(yù)測(cè)分析的知識(shí)。最近,利用神經(jīng)網(wǎng)絡(luò)來產(chǎn)生人類大腦般的分析能力的深度學(xué)習(xí)正在使機(jī)器學(xué)習(xí)到更高的認(rèn)知水平。通過模擬人腦對(duì)情境的反應(yīng),深度學(xué)習(xí)帶來了從舊學(xué)校暴力決策樹到更真實(shí)的事物的顯著轉(zhuǎn)變。

媒體和娛樂行業(yè)的機(jī)器學(xué)習(xí)重點(diǎn)領(lǐng)域

過去幾十年來,AI和ML一直在學(xué)術(shù)和研發(fā)領(lǐng)域,直到最近幾年,真正的產(chǎn)業(yè)整合才開始取而代之。人工智能帶來的技術(shù)可以自動(dòng)執(zhí)行大部分人力密集的任務(wù),并且具有可擴(kuò)展性,計(jì)算速度和可重復(fù)性等優(yōu)點(diǎn)。通過自動(dòng)化內(nèi)容管理,媒體操作中的現(xiàn)有任務(wù)以及改善客戶參與度和體驗(yàn),它有很大的潛力來實(shí)現(xiàn)嚴(yán)重的成本節(jié)約。例如,AI可以自動(dòng)執(zhí)行復(fù)雜的音頻/視頻同步工作,從而節(jié)省大量的人工人力,并減少人為錯(cuò)誤。以下是媒體和娛樂行業(yè)進(jìn)入前十大AI轉(zhuǎn)型領(lǐng)域。

1、深入的視頻分析,翻譯,轉(zhuǎn)錄和標(biāo)記

AI花了幾年的時(shí)間來完善手寫識(shí)別并迅速轉(zhuǎn)向自然語言理解(NLU)。現(xiàn)在它已經(jīng)加速超越自然語言和元數(shù)據(jù)處理,深入深入分析內(nèi)容。機(jī)器主導(dǎo)的自動(dòng)化將口述音頻轉(zhuǎn)換成可讀文本,轉(zhuǎn)錄變得近乎實(shí)時(shí)。我們都看到了Alexa,Cortana和Google語音的早期到來。神經(jīng)網(wǎng)絡(luò)訓(xùn)練系統(tǒng)正在取代傳統(tǒng)的單詞轉(zhuǎn)換,通過增加新的情境和意圖相關(guān)維度。預(yù)計(jì)未來3年,AI將完全接管轉(zhuǎn)錄和翻譯活動(dòng),并將駐留在日常使用的音頻設(shè)備上。

深度視頻分析是另一個(gè)有趣的領(lǐng)域,通過學(xué)習(xí)場(chǎng)景變化,位置參考,語音,面部和物體識(shí)別,導(dǎo)致視頻見解的多方面擴(kuò)展。這種智能在豐富內(nèi)容分類和適當(dāng)標(biāo)記內(nèi)容方面有很長(zhǎng)的路要走,這提高了內(nèi)容鏈接,搜索和關(guān)聯(lián)的準(zhǔn)確性。在這里,人工智能通過機(jī)器驅(qū)動(dòng)索引,元數(shù)據(jù)標(biāo)記,編目等方式顯著改變整個(gè)內(nèi)容管理環(huán)境,將手動(dòng)流程轉(zhuǎn)變?yōu)楦叨茸詣?dòng)化的工作流程。視頻翻譯為多種語言和方言以及多語言字幕,有助于將內(nèi)容的可尋址市場(chǎng)擴(kuò)大到比以往更多的受眾。

2、基于語音的虛擬助理

在過去的兩年中,像Alexa,Google家庭和語音遙控器(如Siri和Roku)的語音助理已經(jīng)開始通過完善基本的菜單導(dǎo)航功能來消除笨重的電視遙控器。接下來是在用戶跟進(jìn)命令的幫助下進(jìn)行內(nèi)容搜索和發(fā)現(xiàn)的情報(bào)。使用監(jiān)督式學(xué)習(xí)算法的人工智能現(xiàn)在可以為虛擬助手提供動(dòng)力,將消費(fèi)者的知識(shí)圖,地理坐標(biāo),語音輸入和豐富的內(nèi)容元數(shù)據(jù)(演員表,摘要,報(bào)價(jià),位置等)結(jié)合起來提供個(gè)性化推薦。虛擬助手了解語言特征,情感和用戶意圖的能力使他們更智能,直觀和成熟的對(duì)話系統(tǒng)增加了更好的客戶體驗(yàn)。隨著個(gè)人數(shù)字關(guān)系變得更加深刻,

3、優(yōu)化的視頻編碼和傳輸

引入自適應(yīng)比特率(ABR)流后,視頻流有一個(gè)主要的優(yōu)點(diǎn)。ABR編碼將原始文件的小塊創(chuàng)建為不同的比特率,以基于可用帶寬為客戶端提供服務(wù)(請(qǐng)閱讀此處以了解更多關(guān)于流媒體)。通過引入技術(shù)來提高固定比特率分塊到基于場(chǎng)景的編碼,人工智能正在付出更多的努力。人工智能通過學(xué)習(xí)多個(gè)質(zhì)量度量的場(chǎng)景復(fù)雜度,可以確定所需的壓縮級(jí)別并給出編碼視頻,系統(tǒng)可以確定幀級(jí)復(fù)雜度和最佳壓縮參數(shù),同時(shí)保持質(zhì)量跟蹤。Netflix掌握了這項(xiàng)技術(shù),即使在比特率較低的情況下,也可以生成精確的編碼流。這種新的編碼方式正在徹底改變?yōu)椴粩嘣鲩L(zhǎng)的新興經(jīng)濟(jì)體觀眾提供不間斷視頻的方式,在這些新興經(jīng)濟(jì)體中,手機(jī)上的低帶寬網(wǎng)絡(luò)是觀看視頻的最主要平臺(tái)。人工智能還通過根據(jù)觀眾位置,網(wǎng)絡(luò)擁塞等優(yōu)化所需比特率來提高在線媒體播放器的性能。

4、視覺識(shí)別

面部識(shí)別?和物體識(shí)別是一個(gè)重視視覺處理的AI區(qū)域。它涉及視頻和靜止圖像中個(gè)人和物體的識(shí)別以及隨時(shí)間的相對(duì)變化。雖然這種視覺處理對(duì)人類來說是自然而然的,但是機(jī)器能夠壓縮大量數(shù)據(jù)變化以達(dá)到期望的精度水平,這是一項(xiàng)艱巨的任務(wù)。最近,人工智能和機(jī)器學(xué)習(xí)越來越能夠掌握視覺感知 - 面部和模式識(shí)別,為內(nèi)容編輯和自動(dòng)化內(nèi)容創(chuàng)作開辟了豐富的途徑。想知道Facebook和眾多照片應(yīng)用程序如何用你的朋友的照片標(biāo)簽做出驚人的工作; 這是所有AI和ML在制作中

5、異常檢測(cè)

在過去的幾年中,在線視頻不成比例地增長(zhǎng)。YouTube,F(xiàn)acebook和在線網(wǎng)絡(luò)為業(yè)余愛好者和專業(yè)人士成為內(nèi)容創(chuàng)作者并接觸大眾觀眾創(chuàng)造了無限的機(jī)會(huì)。今天,對(duì)于每秒鐘產(chǎn)生的視頻和圖像數(shù)量來說,監(jiān)控和標(biāo)記不適當(dāng)?shù)膬?nèi)容(盜版,暴力,成人等)變得人力不可能。這再次是機(jī)器學(xué)習(xí)服務(wù),在這個(gè)領(lǐng)域證明了這一點(diǎn),大多數(shù)網(wǎng)絡(luò)在上傳時(shí)創(chuàng)建了基于AI的自動(dòng)檢測(cè)工具。Google的云視覺API就是這樣一種服務(wù),它可以為標(biāo)記內(nèi)容做出適當(dāng)?shù)母倪M(jìn)。雖然假冒內(nèi)容的創(chuàng)作已經(jīng)成為人工智能越來越大的威脅,但是這種人工智能技術(shù)在限制惡意行為方面來拯救

6、內(nèi)容指紋識(shí)別

根據(jù)捕獲樣本內(nèi)容片段的原則,為識(shí)別創(chuàng)建獨(dú)特的指紋,內(nèi)容指紋識(shí)別在媒體行業(yè)已經(jīng)走過了很長(zhǎng)的路要走。隨著內(nèi)容繼續(xù)隨著多渠道分布而不斷增長(zhǎng),基于AI的指紋識(shí)別技術(shù)在應(yīng)用中發(fā)揮了重要作用。一些用例是

通過有效的搜索找到精確和類似的配置文件媒體,Shazam是一個(gè)現(xiàn)場(chǎng)模型

使用區(qū)塊鏈對(duì)內(nèi)容進(jìn)行微許可進(jìn)行付款和跟蹤使用情況

識(shí)別和跟蹤消費(fèi)者觀看行為,衡量廣告

廣播監(jiān)視來驗(yàn)證事件發(fā)生

內(nèi)容保護(hù)音頻,視頻和圖像,追蹤未經(jīng)授權(quán)的分發(fā)

7、視頻質(zhì)量評(píng)估

視頻壓縮對(duì)視頻實(shí)現(xiàn)合理的傳輸速率至關(guān)重要。但是,壓縮是有損的,會(huì)引入損傷和偽像等工件。視頻質(zhì)量評(píng)估一直是內(nèi)容分發(fā)之前的關(guān)鍵過程,并且隨著多通道分布而逐漸擴(kuò)大。傳統(tǒng)上采用兩種標(biāo)準(zhǔn)方法,無論是單獨(dú)使用還是聯(lián)合使用都用于質(zhì)量評(píng)估。通過播放內(nèi)容和檢查錯(cuò)誤以及使用VQM,PSNR,MSE,SSIM等指標(biāo)進(jìn)行更加自動(dòng)化的基于參考的評(píng)估,實(shí)現(xiàn)基于人工的可視化分析。雖然前者需要大量的人力,但后來在準(zhǔn)確性,非實(shí)時(shí)性以及對(duì)參考模型的依賴方面面臨挑戰(zhàn)。人工智能和機(jī)器學(xué)習(xí)正在通過掌握基于非參考的視頻質(zhì)量評(píng)估來改變這一切。人工智能使用廣泛的功能集和從錯(cuò)誤模式中學(xué)習(xí)能夠提供接近實(shí)時(shí)的質(zhì)量評(píng)估。在視頻工作流程中實(shí)現(xiàn)質(zhì)量控制自動(dòng)化的巨大潛力,并在縮短內(nèi)容發(fā)布時(shí)間表方面帶來無與倫比的效率

8、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)

AR / VR市場(chǎng)潛力巨大,但由于成本,內(nèi)容成熟度和易用性方面的挑戰(zhàn),該技術(shù)在很大程度上表現(xiàn)不佳。雖然虛擬現(xiàn)實(shí)(VR)專注于創(chuàng)造360度身臨其境的體驗(yàn),但增強(qiáng)現(xiàn)實(shí)技術(shù)(AR)處理計(jì)算機(jī)圖形元素與真實(shí)世界元素的疊加。對(duì)于很大一部分VR / AR應(yīng)用程序和服務(wù)仍然非常粗糙,AI通過提高數(shù)據(jù)質(zhì)量和決策制定來帶來新的能源。人工智能幫助圖像準(zhǔn)確無誤,更好地理解用戶輸入和意圖,內(nèi)容關(guān)聯(lián),情景化以及內(nèi)容創(chuàng)作,為用戶打造更加身臨其境的體驗(yàn)

9、后期制作

大量的創(chuàng)作過程基于定義的規(guī)則和技巧,因此可以通過機(jī)器學(xué)習(xí)算法掌握。人工智能系統(tǒng)可以自動(dòng)進(jìn)行劇情識(shí)別,場(chǎng)景選擇,腳本等各種創(chuàng)作過程所需的地面工作。聽說 摩根?去年9月發(fā)行的一部基于人工智能的科幻電影與電影主題本身有共同之處。電影預(yù)告片雖然由人工編輯完成,但由AI使用IBM Watson提出。在這里,沃森被訓(xùn)練從相似主題的預(yù)告片中學(xué)習(xí),并選擇電影中的關(guān)鍵場(chǎng)景,后來將它們縫合在一起制作最終預(yù)告片。一個(gè)很好的例子,AI可以選擇場(chǎng)景,插入視覺效果,并建立一個(gè)令人信服的人類編輯像拖車。以下是AI進(jìn)入的更多領(lǐng)域

對(duì)視頻內(nèi)容進(jìn)行結(jié)構(gòu)和語義分析,以幫助創(chuàng)建短片視頻片段,用于新聞,視頻分割以及用于粉絲參與的特殊興趣內(nèi)容。

腳本打樣,內(nèi)容清理,場(chǎng)景排序和電影編輯的第一通。給定一個(gè)腳本上下文,創(chuàng)建多個(gè)具有評(píng)分的場(chǎng)景表演供選擇

在緩慢移動(dòng)內(nèi)容捕捉中進(jìn)行視頻瀏覽以創(chuàng)建僅供參考的內(nèi)容

最近IBM與美國公開賽合作,通過認(rèn)識(shí)重要比賽時(shí)刻來提供體育亮點(diǎn)。人工智能能夠在體育和新聞中快速識(shí)別內(nèi)容并聚合相關(guān)內(nèi)容,這可以徹底改變體育和新聞報(bào)道的業(yè)務(wù),因?yàn)樗F(xiàn)在已經(jīng)存在

10、內(nèi)容制作

內(nèi)容結(jié)構(gòu)和基于對(duì)象的分析已經(jīng)開啟了人工智能協(xié)助實(shí)際內(nèi)容開發(fā)的新途徑。從屏幕上角色的行為,走動(dòng),談話和所有可能的面部表情的細(xì)節(jié)中學(xué)習(xí),AI系統(tǒng)可以創(chuàng)建虛擬表演??吹饺绾蝿?chuàng)造像真正的表演這樣的生活真是令人驚訝 - 檢查美國總統(tǒng)奧巴馬的一個(gè)他從未給出的演講剪輯,留下的想象力很少。人工智能在內(nèi)容創(chuàng)作領(lǐng)域仍然在不斷努力,并且在許多領(lǐng)域它可以使生產(chǎn)過程受益

通過學(xué)習(xí)流行名人的流行特征,表情,角色和風(fēng)格,創(chuàng)建虛擬人物角色(僅限數(shù)字化身)

使動(dòng)畫電影中的計(jì)算機(jī)圖形工作自動(dòng)化,取代人為密集的角色動(dòng)畫,但效率更高

總結(jié)

人工智能和機(jī)器學(xué)習(xí)有潛力影響基于一系列規(guī)則的任何事情,以及機(jī)器可以建立和學(xué)習(xí)模式的地方。AI和ML技術(shù)有其自己尚未探索的領(lǐng)域和障礙,但是為實(shí)現(xiàn)更大的目標(biāo)而定位,并承諾具有無與倫比的能力。隨著金融服務(wù),高科技和電信業(yè)迅速采用人工智能,媒體和娛樂行業(yè)在自動(dòng)化工作流程方面也不甘落后。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉