當(dāng)前位置:首頁(yè) > 智能硬件 > 人工智能AI
[導(dǎo)讀]   機(jī)器學(xué)習(xí)(ML)在許多目標(biāo)明確的領(lǐng)域有優(yōu)秀的表現(xiàn)。具有明確正誤答案區(qū)分的任務(wù)將有助于訓(xùn)練,而且能讓算法實(shí)現(xiàn)預(yù)設(shè)的目標(biāo),比如準(zhǔn)確地從圖像中識(shí)別物體,或者合理的將語(yǔ)言進(jìn)行翻譯。然而,也有許多領(lǐng)域

  機(jī)器學(xué)習(xí)(ML)在許多目標(biāo)明確的領(lǐng)域有優(yōu)秀的表現(xiàn)。具有明確正誤答案區(qū)分的任務(wù)將有助于訓(xùn)練,而且能讓算法實(shí)現(xiàn)預(yù)設(shè)的目標(biāo),比如準(zhǔn)確地從圖像中識(shí)別物體,或者合理的將語(yǔ)言進(jìn)行翻譯。然而,也有許多領(lǐng)域的任務(wù)是很難客觀評(píng)價(jià)的,在諸如評(píng)價(jià)一張照片美麗與否這種太主觀的問(wèn)題上時(shí)這與每個(gè)人的審美有關(guān),就不太適合用機(jī)器學(xué)習(xí)來(lái)解決了。

  圖:賈斯珀國(guó)家公園的一張專業(yè)攝影照

  為了研究機(jī)器學(xué)習(xí)是如何學(xué)習(xí)主觀概念的,Google針對(duì)藝術(shù)性的創(chuàng)作引入了一種試驗(yàn)性的深度學(xué)習(xí)系統(tǒng)。這個(gè)系統(tǒng)會(huì)模仿專業(yè)攝影師來(lái)展開工作。它的工作流程如下:從谷歌街景中瀏覽景觀圖,分析出最佳的構(gòu)圖,然后進(jìn)行各種后期處理,從而創(chuàng)造出一幅賞心悅目的圖像。

  這位虛擬攝影師通過(guò)瀏覽阿爾卑斯山、加拿大的班夫及賈斯珀國(guó)家公園、加州BigSur和黃石國(guó)家公園等地的4萬(wàn)張全景照片,創(chuàng)作了許多令人印象深刻的作品,其中一些甚至達(dá)到了專業(yè)水準(zhǔn)專業(yè)攝影師如此評(píng)價(jià)到。

  訓(xùn)練模型雖然照片中的美感可以用類似AVA系統(tǒng)中的數(shù)據(jù)集來(lái)模擬,但是就這么直接的用AVA系統(tǒng)來(lái)處理照片,可能會(huì)在美感上有部分方面的缺失,比如做出的照片過(guò)飽和。再者,如果想通過(guò)監(jiān)督學(xué)習(xí)適當(dāng)?shù)貜亩鄠€(gè)方面來(lái)學(xué)習(xí)美感,所需的標(biāo)簽數(shù)據(jù)集會(huì)很難收集,所以這也不是一個(gè)好方法。

  他們的方法只需要一些高質(zhì)量的照片,不需要后期前后圖像的對(duì)比或額外的標(biāo)簽。這個(gè)系統(tǒng)能自動(dòng)將照片中的美感解析成不同方面,每一方面都能通過(guò)相反的圖像操作產(chǎn)生的負(fù)面例子來(lái)單獨(dú)學(xué)習(xí)。

  通過(guò)使圖像處理半正交化,可以找到快速和獨(dú)立的最優(yōu)化步驟,從構(gòu)圖、飽和度/HDR水平和明暗的張力上對(duì)圖像進(jìn)行美化:

  圖:圖(a)是全景圖,圖(b)將圖(a)進(jìn)行裁切,圖(c)是對(duì)圖(b)進(jìn)行飽和度和HDR優(yōu)化處理,圖(d)是應(yīng)用戲劇張力蒙版之后的效果。

  他們用傳統(tǒng)的圖像濾波器生成了包括飽和度、HDR細(xì)節(jié)和構(gòu)圖的負(fù)面例子,還引入了一種名為戲劇張力蒙版(dramaTIcmask)的特殊操作,它是在學(xué)習(xí)明暗張力概念的過(guò)程中一同產(chǎn)生的。

  這些負(fù)面例子是這樣生成的:應(yīng)用一組圖像濾波器,隨機(jī)地調(diào)整高質(zhì)量照片的亮度,將圖片的質(zhì)量變差。在訓(xùn)練中,他們使用生成對(duì)抗網(wǎng)絡(luò)(GAN),在這種模式下,生成網(wǎng)絡(luò)會(huì)創(chuàng)建一個(gè)蒙版來(lái)改善負(fù)面例子中的光線,判別網(wǎng)絡(luò)則試圖將光線改善后的照片與樣本照片進(jìn)行區(qū)分。

  與vignette這樣的固定形狀濾波器(shape-fixedfilter)不同,戲劇張力蒙版增加了內(nèi)容感知亮度調(diào)節(jié)部分。GAN訓(xùn)練天然的競(jìng)爭(zhēng)性極大地豐富了調(diào)節(jié)圖像特性的能力,在論文中可以看到更多的訓(xùn)練細(xì)節(jié)。

  結(jié)果

  下面是這種系統(tǒng)基于Google街景的一些創(chuàng)作。如下圖所示,經(jīng)過(guò)訓(xùn)練后能夠判斷美感的濾波器創(chuàng)造出了一些讓人驚嘆的照片(包括文中最初出現(xiàn)的照片):

  圖:加拿大,賈斯珀國(guó)家公園

  圖:瑞士,茵特拉肯

  圖:意大利,ParcodelleOrobieBergamasche公園

  圖:加拿大,賈斯珀國(guó)家公園

  專業(yè)評(píng)估為了評(píng)價(jià)這個(gè)算法的效果如何,他們?cè)O(shè)計(jì)了一個(gè)類“圖靈測(cè)試”實(shí)驗(yàn):將這個(gè)系統(tǒng)創(chuàng)作出來(lái)的照片和其他不同質(zhì)量的照片摻雜在一起,然后把它們展示給幾個(gè)專業(yè)攝影師。他們要求這些攝影師為每張照片評(píng)分,分?jǐn)?shù)是基于如下標(biāo)準(zhǔn):

  1分:傻瓜式拍照,照片沒(méi)有考慮構(gòu)圖以及光線等因素。

  2分:沒(méi)有攝影基礎(chǔ)的一般大眾拍出來(lái)的照片,看起來(lái)還可以,但沒(méi)有明顯的藝術(shù)感。

  3分:半專業(yè)。照片中展示出了明顯的藝術(shù)感,攝影師正朝著專業(yè)攝影師邁進(jìn)。

  4分:專業(yè)。

  在下面的圖表中,曲線顯示了專業(yè)攝影師為已經(jīng)預(yù)估分?jǐn)?shù)的圖片打的分?jǐn)?shù)。對(duì)于他們預(yù)估的高分圖片,大約有40%收到了“半專業(yè)”或“專業(yè)”的評(píng)價(jià)。

  未來(lái)的研究

  街道全景圖為這個(gè)項(xiàng)目提供了一個(gè)測(cè)試平臺(tái)。有一天,這種技術(shù)甚至可以幫助我們現(xiàn)實(shí)世界中拍出更好看的照片。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉