當前位置:首頁 > 公眾號精選 > 架構(gòu)師社區(qū)
[導讀]導讀:短視頻產(chǎn)品最近兩年蓬勃發(fā)展,百度旗下的短視頻品牌-好看視頻,人均使用時長70分鐘,短視頻播放量已超30億,從推薦系統(tǒng)的角度考慮,如何設(shè)計一個推薦系統(tǒng)的目標,以及短視頻迭代過程中沉淀的思考。全文2433字,預計閱讀時間8分鐘?!?020年中國網(wǎng)絡(luò)視聽發(fā)展研究報告》顯示,截至2...

百度短視頻推薦系統(tǒng)的目標設(shè)計導讀:短視頻產(chǎn)品最近兩年蓬勃發(fā)展,百度旗下的短視頻品牌-好看視頻,人均使用時長70分鐘,短視頻播放量已超30億,從推薦系統(tǒng)的角度考慮,如何設(shè)計一個推薦系統(tǒng)的目標,以及短視頻迭代過程中沉淀的思考。
全文2433字,預計閱讀時間 8分鐘。
《2020年中國網(wǎng)絡(luò)視聽發(fā)展研究報告》顯示,截至2020年6月,中國網(wǎng)絡(luò)視聽用戶規(guī)模已超過9億,短視頻用戶達到了8.2億,這些用戶平均每天花費近2小時觀看短視頻。與此同時,百度旗下的短視頻品牌——好看視頻,人均使用時長70分鐘,短視頻播放量已超30億,好看視頻的海量內(nèi)容也是搜索非常重要的供給方。
百度短視頻推薦系統(tǒng)的目標設(shè)計
對于推薦類產(chǎn)品,內(nèi)容是基石。那么好看視頻的內(nèi)容體系是怎樣的?首先,在好看視頻現(xiàn)有體系中,有著百萬級內(nèi)容創(chuàng)作者,在持續(xù)生產(chǎn)內(nèi)容;這其中還包括10萬 優(yōu)質(zhì)內(nèi)容的創(chuàng)作者;同時,我們也在持續(xù)創(chuàng)作和輸出自制劇,比如“越來越好看”、“你的生活好好看”等等。
一、推薦系統(tǒng)解決什么問題?
在推薦平臺或信息流產(chǎn)品中存在3個角色:用戶、創(chuàng)作者、廣告主,推薦系統(tǒng)要解決的用戶和創(chuàng)作者兩個角色的體驗問題:1)用戶端:極致優(yōu)化體驗,滿足用戶千人千面的高度個性化消費需求。我們在百度系有豐富的用戶畫像和理解,同時在App內(nèi),可以對使用環(huán)境有感知、并以用戶興趣表達等信號為基礎(chǔ),進一步抓住用戶的興趣。
百度短視頻推薦系統(tǒng)的目標設(shè)計
2)創(chuàng)作者:讓優(yōu)質(zhì)的內(nèi)容得到更多的分發(fā)、留住創(chuàng)作者、實現(xiàn)內(nèi)容優(yōu)勝劣汰。另外配合生態(tài)層面的宏觀調(diào)控,可以最大程度地保證優(yōu)質(zhì)的創(chuàng)作者在此平臺源源不斷的輸入更多內(nèi)容。
百度短視頻推薦系統(tǒng)的目標設(shè)計
二、視頻推薦系統(tǒng)的全貌
如下圖所示,創(chuàng)作者將內(nèi)容上傳至平臺后,會進入統(tǒng)一的正排流程;用戶打開APP請求時,系統(tǒng)會把所有相關(guān)的內(nèi)容召回(顯示、隱式等),其宗旨是:“Make Everything Happens”,然后通過粗排、精排、融合這三級漏斗,選出用戶最喜歡的內(nèi)容,最后通過機制調(diào)控呈現(xiàn)最終的內(nèi)容。
百度短視頻推薦系統(tǒng)的目標設(shè)計
三、視頻產(chǎn)品交互形態(tài)下的用戶興趣刻畫
用戶打開APP后,推薦的視頻就會自動播放,類似家里的電視機,打開就播放,喜歡就繼續(xù)停留在此頁面,不喜歡則劃到下一條,在APP中這是一種新的交互形態(tài),同時也給推薦帶來了挑戰(zhàn):如何去刻畫用戶的畫像?如何判定用戶是否喜歡?
可以借鑒傳統(tǒng)的點選式交互形態(tài),即用戶先判定是否感興趣,若感興趣則點開視頻;滿意則會持續(xù)看并播完;若不滿意,用戶可能會選擇退出。在自動播放這種新的交互形態(tài)下,我們將這種不喜歡就劃走的行為定義為“傷害”,將觀看一條視頻時間較長或者完全觀看完的行為定義為“滿意”。推薦系統(tǒng)將采用(傷害、時長、完播)這三級信號來刻畫用戶的興趣。
百度短視頻推薦系統(tǒng)的目標設(shè)計
除了通過播放行為刻畫用戶興趣外,關(guān)注、點贊、收藏等都是用戶表達喜好的信號。在設(shè)計推薦系統(tǒng)的時候,要先理解產(chǎn)品,然后再去設(shè)計。對于短視頻推薦系統(tǒng)的交互行為有如下信號,并將這些信號整理歸類到下圖四象限,并引入到推薦系統(tǒng)中。
百度短視頻推薦系統(tǒng)的目標設(shè)計
四、多目標排序的應用
1)多目標建模多目標建模從最開始基礎(chǔ)的shared-bottom的DNN建模發(fā)展到MMOE,最后采用分人群MMOE,將N個推薦系統(tǒng)目標建模出來,在真正實現(xiàn)的時候,低、中、高三種活躍度專家分別訓練,聯(lián)合決策防止高活人群樣本主導整個模型,從而保證系統(tǒng)的準確性。
百度短視頻推薦系統(tǒng)的目標設(shè)計
2)多目標融合排序通過模型預估N個多目標后,需要將這些多目標融合到一起,常見的方法是做簡單的多項式融合,這種是比較基礎(chǔ)的方式,簡單有效且易引入經(jīng)驗值。但缺點也很明顯,需要經(jīng)常調(diào)整且不能自適應。而現(xiàn)在發(fā)展到使用deepES的方式,即分場景個性化融合,每次通過擾動模型內(nèi)部參數(shù)獲得多組參數(shù)組合,然后根據(jù)設(shè)計的Reward來選擇最優(yōu)的參數(shù);其特征引入設(shè)備類型、狀態(tài)、刷新節(jié)奏等多種狀態(tài),邏輯圖如下:
百度短視頻推薦系統(tǒng)的目標設(shè)計
五、長期受益目標的推薦系統(tǒng)
前面討論的推薦目標都是根據(jù)當前即將推薦出視頻的消費情況來排序的,但我們把視角移到更長的時間序列上來。用戶的消費分為過去、現(xiàn)在和將來三個階段。對于過去的內(nèi)容,可以把它當成模型訓練的樣本、刻畫用戶興趣的特征。當下的推薦目標是:對于未來可能消費的內(nèi)容,本質(zhì)上是當前興趣的“延續(xù)”;而當前興趣可以看成對未來興趣的“激發(fā)”,將未來消費內(nèi)容價值歸因到當前視頻上,即未來長期價值(Long Term Value)。
百度短視頻推薦系統(tǒng)的目標設(shè)計
通過下圖方式設(shè)計LTV,舉例:用戶今天看到一個脫口秀視頻的價值定義為V0,假設(shè)未來用戶還會看此類視頻V2、Vn,那么我們可以將V2、Vn的消費時長和消費價值歸因于當前的V0,具體設(shè)計分為2步:1、找到相關(guān)內(nèi)容、設(shè)計衰減因子;2、用模型擬合LTV。
百度短視頻推薦系統(tǒng)的目標設(shè)計

六、視頻推薦系統(tǒng)多目標的探討
1)多目標的價值是否相同?比如用戶關(guān)注一個視頻和給這個視頻點贊,或者視頻的第1個贊和第10個贊的價值一樣嗎?
2)當前的目標是群體最優(yōu)的嗎?所推出的視頻被播放會產(chǎn)生協(xié)同價值嗎?當前視頻若對該用戶價值不是最大,但對整體價值最大,可以推薦出去嗎?
3)能否去設(shè)計一個目標、系統(tǒng)、模型去刻畫用戶的留存?多目標設(shè)計、以及未來收益設(shè)計,我們的目標都是提高用戶留存度。是否可以直接構(gòu)建用戶留存率模型呢?
以上都是值得同學們深入思考的問題,有機會我們可以一起交流討論。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
關(guān)閉
關(guān)閉