機(jī)器學(xué)習(xí)是不是好的工具
掃描二維碼
隨時(shí)隨地手機(jī)看文章
在2019世界人工智能大會(huì)期間,AI+藝術(shù)也成了其中一個(gè)關(guān)注和討論的板塊。在TensorFlow主題論壇上,兩位獨(dú)立開發(fā)者,AI研究員黃成之(Anna Huang)、蘭州大學(xué)信息工程學(xué)院助理研究員武強(qiáng),分別從AI+服飾創(chuàng)新、AI+音樂的角度分享了TensorFlow的應(yīng)用和研究成果。
據(jù)武強(qiáng)介紹,他們的團(tuán)隊(duì)通過TensorFlow+數(shù)據(jù)+機(jī)器學(xué)習(xí),將敦煌壁畫上的飛天服飾進(jìn)行收集,再結(jié)合現(xiàn)在服飾數(shù)據(jù)集,生成一些創(chuàng)新服飾,通過算法進(jìn)行風(fēng)格遷移,最后進(jìn)行階段性輸出。即基于TensorFlow,通過中國傳統(tǒng)文化創(chuàng)造出一個(gè)新的藝術(shù)形式。
目前,該項(xiàng)目已經(jīng)設(shè)計(jì)成課程在大學(xué)內(nèi)推廣。據(jù)武強(qiáng)介紹,未來團(tuán)隊(duì)將進(jìn)一步擴(kuò)展敦煌的傳統(tǒng)文化數(shù)據(jù)集,并推出服飾融合創(chuàng)新相關(guān)的平臺(tái)。
而對音樂更感興趣的黃成之,則分享了如何通過機(jī)器學(xué)習(xí)幫助用戶進(jìn)行音樂和藝術(shù)創(chuàng)作。黃成之和團(tuán)隊(duì)開發(fā)了一款巴赫Doodle(下文簡稱為 “巴赫涂鴉”),在2019年3月21日,在巴赫生日的這一天,谷歌上線了“巴赫涂鴉”。根據(jù)谷歌的官方介紹,利用這個(gè)涂鴉,你可以隨意創(chuàng)作自己的旋律,利用人工智能,涂鴉將用巴赫的風(fēng)格來演奏你創(chuàng)作的作品。
在接受新浪科技采訪時(shí),黃成之表示,這是一個(gè)把機(jī)器學(xué)習(xí)當(dāng)做非常好的工具去助推和加速整個(gè)文化和音樂創(chuàng)造的過程。
“我們在談到機(jī)器學(xué)習(xí)如何去助推創(chuàng)作的過程當(dāng)中,針對不一樣的人群,它是有不同的含義的?!比绻且粋€(gè)新人,想先接觸作曲狀態(tài),機(jī)器學(xué)習(xí)可以讓其有更快的方式去了解旋律。如果是有經(jīng)驗(yàn)的作曲家,利用機(jī)器學(xué)習(xí)可以很快做出一個(gè)小樣,呈現(xiàn)創(chuàng)作效果,幫助其做后續(xù)調(diào)整。
不過,創(chuàng)造力是人類對于機(jī)器最大的優(yōu)勢之一,有人好奇,為什么人類會(huì)需要讓機(jī)器來幫忙做比如創(chuàng)作、作曲這些創(chuàng)造類的事情?
黃成之表示,她自己就是一個(gè)作曲家,創(chuàng)作流程一般分成兩個(gè)階段:大量想法產(chǎn)生的階段和將確定的想法表達(dá)出來的階段,而機(jī)器學(xué)習(xí)在這兩個(gè)不同的階段都會(huì)有介入,會(huì)有不一樣的作用。
比如,創(chuàng)作者沒有靈感的時(shí)候,機(jī)器學(xué)習(xí)可能會(huì)給他一些靈感啟發(fā)。而作曲過程中,有某些細(xì)節(jié)需要人類的方式去進(jìn)行創(chuàng)作和調(diào)整,但有些比較大層面,像結(jié)構(gòu)化層面上的調(diào)整需要,屬于比較重復(fù)性的工作,這個(gè)時(shí)候機(jī)器學(xué)習(xí)就會(huì)發(fā)生作用了。
至于未來機(jī)器能否創(chuàng)作出完全屬于它自己的完整作品,黃成之表示,”我不會(huì)認(rèn)為未來我們希望讓機(jī)器去做出它自己的音樂作品。從我作為作曲家的角度來看,音樂其實(shí)是一個(gè)溝通和表達(dá)感情、感受的方式,所以我們要做的應(yīng)該是給創(chuàng)作者提供賦能的工具,讓他們可以更直接地、更好地去把自己的情感和感受表達(dá)出來?!?/p>
提到挑戰(zhàn),黃成之表示,在做巴赫Doodle的過程中,團(tuán)隊(duì)遇到了很多挑戰(zhàn),其中數(shù)據(jù)集的問題,是第一個(gè)挑戰(zhàn)。
“因?yàn)槲覀冎挥?00首巴赫的曲目來做訓(xùn)練的樣本,要學(xué)習(xí)一個(gè)作曲家的風(fēng)格,這個(gè)數(shù)據(jù)集的規(guī)模是非常小的?!睘榇?,團(tuán)隊(duì)用到了一個(gè)叫本能化、直觀化的數(shù)據(jù)采樣方式。即面對一篇樂譜,不是從頭到尾去讀這段音節(jié)、或這段旋律,而是隨機(jī)從中抽出幾塊遮蓋起來,讓機(jī)器去猜測這段旋律中空白的部分。
“如此一來,我們就將一段旋律,從不同角度、以排列組合的方式衍變成了許多段旋律,這就解決了我們這個(gè)數(shù)據(jù)集的問題。”
第二個(gè)問題,是建模的問題。黃成之透露,建模最大的挑戰(zhàn)在于“速度”,因?yàn)樾枰獙?shí)現(xiàn)互動(dòng)性——在瀏覽器網(wǎng)頁上與用戶做互動(dòng),速度非常關(guān)鍵?!拔覀冏隽撕芏嗉軜?gòu)上的改進(jìn),來實(shí)現(xiàn)從40秒加速到現(xiàn)在的大約2秒。除此之外,我們還要納入很多其他方面的技術(shù)來最終實(shí)現(xiàn)AI Doodle的互動(dòng)效果?!?/p>
最后,黃成之認(rèn)為,機(jī)器學(xué)習(xí)只是作曲家眾多輔助工具中的一個(gè),可以簡化很多音樂的結(jié)構(gòu)和特點(diǎn),也有很好的協(xié)同機(jī)制,但最終還是要取決于創(chuàng)作者創(chuàng)作的方式和他們在創(chuàng)作的作品。她同時(shí)表示,這些模型或許會(huì)對音樂教育有所幫助,可以讓更多人能夠擁有主動(dòng)創(chuàng)作的體驗(yàn)、去作曲,打開他們的興趣。
來源:新浪科技