當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 任何曾經(jīng)編輯過磁帶或SpoTIfy播放列表的人都知道,當(dāng)他們?cè)诟枨袀鬟f出了某種情感時(shí),他們就會(huì)取得成功。這就是為什么Gracenote的音樂數(shù)據(jù)專家長(zhǎng)期以來一直根據(jù)情緒和情感對(duì)世界萬千繁雜音樂

任何曾經(jīng)編輯過磁帶或SpoTIfy播放列表的人都知道,當(dāng)他們?cè)诟枨袀鬟f出了某種情感時(shí),他們就會(huì)取得成功。這就是為什么Gracenote的音樂數(shù)據(jù)專家長(zhǎng)期以來一直根據(jù)情緒和情感對(duì)世界萬千繁雜音樂進(jìn)行分類的原因。

而Gracenote團(tuán)隊(duì)實(shí)際上并沒有真正逐首聽過他們數(shù)據(jù)庫(kù)中成千上百的歌曲。取而代之的是,它教會(huì)了電腦去識(shí)別情緒,使用機(jī)器聆聽,借助人工智能(AI)來判斷一首歌曲的風(fēng)格,進(jìn)而判別是夢(mèng)幻、性感,還是純粹的悲傷風(fēng)格。

機(jī)器學(xué)習(xí)是我們所具有的一個(gè)巨大的戰(zhàn)略優(yōu)勢(shì),”Gracenote的總經(jīng)理BrianHamilton在最近的一次采訪中說。

據(jù)悉,Gracenote在10年前就開始了它所謂的“聲音情緒分類”工作。隨著時(shí)間的推移,傳統(tǒng)算法越來越多地被先進(jìn)的神經(jīng)網(wǎng)絡(luò)算法所取代,這項(xiàng)工作也隨之進(jìn)化了。這也已經(jīng)成為音樂行業(yè)對(duì)人工智能越來越依賴的最佳例證之一。

舉例來說,電腦是如何得知LadyGaga的Lovegame是一首性感熱曲的呢?

首先,人工智能是不知道你的感受的。“我們不知道音樂作品會(huì)對(duì)個(gè)體聽眾產(chǎn)生了什么影響,”Gracenote的研究副總裁在接受采訪時(shí)表示。相反,它試圖將音樂家的創(chuàng)作意圖作為一種內(nèi)在的情感品質(zhì),并對(duì)這些品質(zhì)進(jìn)行辨別。換句話說:它想要教電腦識(shí)別哪些歌曲是悲傷的,而不是識(shí)別哪首歌會(huì)讓聽眾感到憂郁,因?yàn)槟愕母惺芸赡苁且驗(yàn)閭€(gè)人的經(jīng)歷而產(chǎn)生不同的情緒。

教電腦識(shí)別音樂中的情緒有點(diǎn)像心理治療

首先,你得說出你的感受。Gracenote的音樂團(tuán)隊(duì)最初開發(fā)了一種分類標(biāo)準(zhǔn),這包括了超過100種氛圍和情緒,之后又將這個(gè)標(biāo)準(zhǔn)擴(kuò)充到了400多種類別。

其中一些是“性感”和“時(shí)髦”這樣比較經(jīng)典的類別,但也有一些極其具體的類別,比如“夢(mèng)幻感”、“苦樂參半的柔情”和“絕望的瘋狂”。新的類別不斷被添加,而另一些則根據(jù)系統(tǒng)的表現(xiàn)進(jìn)行了微調(diào)。

“這是一個(gè)更新?lián)Q代的過程,”Gracenote的內(nèi)容架構(gòu)和探索主管彼得迪馬利亞解釋說,“分類在不斷進(jìn)化和演進(jìn)。”

除了這一系列情緒之外,Gracenote還使用所謂的“訓(xùn)練集”來進(jìn)行機(jī)器學(xué)習(xí)。該公司的音樂專家挑選了大約4萬首歌曲作為不同類別歌曲的例子。

匯編這種訓(xùn)練集本身就是一門藝術(shù)。迪馬利亞說:“我們需要確保提供了正確的范例。”與此同時(shí),范例歌曲必須是這些情緒的最佳例證。他說:“有些歌兒風(fēng)格有點(diǎn)模糊。”

目前的培訓(xùn)內(nèi)容包括LadyGaga的Lovegame,這首是性感熱曲的范例;電臺(tái)司令的PyramidSond是哀傷風(fēng)格的范例;而碧昂斯的MeMyself&I則是感性和親密風(fēng)格的范例。

就像情緒本身一樣,訓(xùn)練集需要不斷地被更新以保持新鮮。迪馬利亞說:“藝術(shù)家們一直在創(chuàng)造新的音樂表達(dá)方式。我們需要確保系統(tǒng)已經(jīng)聽到了這些聲音。”尤其是快速發(fā)展的音樂類型,如電子樂和嘻哈音樂,需要頻繁更新。

對(duì)電腦而言,它肯能會(huì)將壓縮過的歌曲識(shí)別為一種音樂風(fēng)格。一旦系統(tǒng)接受了這些歌曲的訓(xùn)練,它就會(huì)被應(yīng)用到數(shù)百萬的音軌上。但電腦不會(huì)一首一首地聽播放列表上的全部歌曲。

相反,Gracenote的系統(tǒng)將每條音軌切割成700毫秒的片段,然后從任何這類片中提取大約170種不同的聲學(xué)值,比如它們的音色。此外,有時(shí)一首歌分辨相似的風(fēng)格須要用到更長(zhǎng)的片段。然后這些值會(huì)與現(xiàn)有數(shù)據(jù)進(jìn)行比較,這樣一來將每首歌曲分類。

這樣的結(jié)果不僅是得到情緒風(fēng)格,而是得到每種情緒風(fēng)格的檔案。在此期間,Gracenote的團(tuán)隊(duì)必須定期確保不會(huì)出錯(cuò)。“混音是一件非常復(fù)雜的事情。”樂器、人聲和各種效果疊加,并且音樂本身會(huì)被針對(duì)在汽車音響播放或在流媒體播放的不同而被優(yōu)化:這樣一來電腦可以聽的東西太多了,這包括了那些不屬于音樂本身東西。“它可以捕捉到很多不同的東西,”他說。

在無人監(jiān)督的情況下,Gracenote的系統(tǒng)可能會(huì)決定關(guān)注被壓縮的部分,并將它們與情緒相匹配,而Cremer則開玩笑說系統(tǒng)可能會(huì)決定:“這些都是96kbps,所以這些歌曲屬于悲傷風(fēng)格。”

被情緒分類的世界音樂

Gracenote將音樂分類按照情緒分類,它之后就會(huì)把數(shù)據(jù)傳遞給客戶,而客戶使用它的方式多種多樣。較小的媒體服務(wù)商通常會(huì)授權(quán)Gracenote獲取他們的音樂數(shù)據(jù),并進(jìn)行端對(duì)端的音樂整理和推薦。例如,媒體中心應(yīng)用開發(fā)商Plex使用該公司的音樂推薦技術(shù),為客戶提供個(gè)性化播放列表,以及被該公司稱作“情緒電臺(tái)”的服務(wù)。

Plex的用戶可以選擇“苦樂參半的柔情”這一風(fēng)格,然后等著聽到MazzyStar樂隊(duì)的迷幻之音。

Gracenote還向包括蘋果和SpoTIfy在內(nèi)的一些業(yè)內(nèi)最大的音樂服務(wù)運(yùn)營(yíng)商提供數(shù)據(jù)。這些大公司通常不喜歡公開談?wù)撍麄兪侨绾问褂肎racenote的數(shù)據(jù)的。更大的流媒體服務(wù)公司一般都傾向于使用自己的音樂推薦算法,但他們通常仍會(huì)利用Gracenote的情緒數(shù)據(jù)來訓(xùn)練和改進(jìn)這些算法,或者幫助策展人預(yù)先選擇歌曲,這些歌曲隨后被編輯為播放列表。

這意味著樂迷們可能會(huì)敏銳地意識(shí)到Gracenote在情緒分類上做的工作,而其他人可能無法察覺該公司的人工智能技術(shù)是如何幫助他們提高音樂體驗(yàn)的。

不管怎樣,Gracenote必須確保其數(shù)據(jù)在國(guó)際上得到妥善的轉(zhuǎn)碼,尤其在它即將在別的國(guó)家開展業(yè)務(wù)之際。

該公司宣布將在歐洲和拉丁美洲開始銷售其音樂數(shù)據(jù)產(chǎn)品,其中包括情緒分類標(biāo)準(zhǔn),以及在分類中使用到的描述性、整潔的元數(shù)據(jù)。

為了確保這種轉(zhuǎn)碼過程中沒有任何損耗,該公司聘請(qǐng)了國(guó)際編輯,他們不僅翻譯了“感傷”一詞,而且還會(huì)聽一些歌曲,以找出在他們的文化背景下哪種表達(dá)最有效。

國(guó)際關(guān)注是雙向的

Gracenote也不斷在全球范圍內(nèi)搜尋新的國(guó)際聲音,以滿足其訓(xùn)練集的需求。“我們的數(shù)據(jù)可以用于所有那些即將消失的聲音,”他說。

像Gracenote這樣的公司不僅依賴人類,而且還依賴人工智能和機(jī)器監(jiān)聽等技術(shù);最終,我們將會(huì)能夠?qū)θ澜缢幸魳愤M(jìn)行分類。

在很多方面,教計(jì)算機(jī)識(shí)別悲傷的歌曲實(shí)際上可以幫助人類獲得更好、更有意義的音樂體驗(yàn)。

如果僅僅依靠人類進(jìn)行分類,那么會(huì)有上百萬首歌曲無法分類,而人們也無法獲得個(gè)性化的音樂列表。

利用數(shù)據(jù)和技術(shù)來解鎖世界音樂是他工作中最令人興奮的部分之一,Cremer說:“我在這里的原因是要確保每個(gè)人都能接觸到所有被妥善分類的音樂。”

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉