開發

個性化海報在愛奇藝視頻推薦場景中的實踐

導語

在信息過載的時代中,如何把恰當的內容恰時地呈現給用戶,并且讓用戶快速、準確地看到自己喜歡或需要的內容,對一個視頻平臺來說是一個非常重要且具挑戰的事情。

因此,愛奇藝技術產品團隊設計并實現了一套個性化海報生產與分發系統,本文將從整體框架、海報生產、海報分發、業務策略以及場景效果等幾個方面,一起看看個性化海報在視頻推薦場景中的實踐。

背景

個性化推薦是根據用戶的興趣特點和點擊或購買行為,向用戶推薦用戶感興趣的信息或 商品,最大的優點在于,它能收集用戶特征資料并根據用戶特征,如興趣偏好,為用戶主動作出個性化的推薦。而在視頻平臺上,海報則是用戶對某一部影片的第一映像,是影片的所有信息縮影。用戶看或不看該影片,往往在快速瀏覽時就有了答案。

Netflix早在2014年開始為相同劇集制作多個海報,并調整文字內容、字體、設計顏色和風格,做了大量的線上推薦實驗。并主要得出以下3點結論:

1、海報形式便于用戶做決策:海報承載了更多的信息,用戶看海報的時長比看字的時長高四倍,平均花費思考標題的時間只有1.8秒;

2、海報設計的質量非常關鍵:畫質差會讓用戶覺得影片low,影響用戶對該影片的點擊率;

3、海報中人物數量較重要:在海報設計中人物最好不要超過三個,人物越多用戶很難聚焦信息,導致用戶對該影片的理解能力變差。

用戶為什么點擊這張,而不是另一張。是因為海報上有你的idol讓你情非得已?演員的夸張的表情讓你欲罷不能?又或者是海報的色調搭配、構圖設計讓你賞心悅目?還是其他未知的原因?

然而這不得不讓我們開始思考,在提供個性化內容的同時,能不能滿足用戶對不同海報的審美需求。這給視頻平臺提出了一個新的挑戰。愛奇藝技術產品團隊設計并實現了一套個性化海報生產與分發系統,在愛奇藝的電視端與移動端進行了個性化海報分發的實踐,并得出結論:相比默認的單張海報圖,個性化海報圖的CTR(Click-Through-Rate即點擊通過率)有明顯的提升。

個性化海報智能生產與分發系統

圖 1 個性化海報圖整體框架

在獲取豐富的素材后,利用AI海報生產系統對海報、劇照素材進行智能裁剪,對視頻素材進行智能截幀。自動化生產出大量候選圖片集合,為保證海報質量能100%分發到線上,需進行二次人工復審,復審后的精選海報集合進入個性化海報池。

海報的線上分發模塊與傳統的視頻推薦類似,對需要展示個性化海報的視頻進行海報維度的召回、排序以及業務策略,最終為用戶推薦最優的個性化海報。下文將詳細介紹在AI海報制作、個性化海報分發以及線上實踐效果。

AI海報制作巧婦難為無米之炊,個性化海報推薦首先要有海報候選集合。愛奇藝技術產品團隊自研自動化海報生產與裁剪技術,生產出很多優質的海報候選。

圖 2 AI海報生產流程

智能裁剪:基于圖片的AI海報制作基于圖片的智能檢測,我們將海報生成算法分為了幾個模塊,分別是基礎算法、智能截圖、智能LOGO疊加、ZoomAI智能增強技術,具體如下:基礎算法模塊,主要利用多個AI算法來獲取基于圖片的海報語義信息。人臉、人體以及實體識別能有效的識別圖中的人物和其他實體,以及其所在位置信息。并利于文字檢測算法,我們可以知道文字出現的區域,避免出現文字被截斷。智能截圖模塊,利用基礎算法模塊得到的信息,進行智能構圖,從而得到任意目標尺寸的截圖。智能LOGO疊加模塊的主要作用是自動地將美化后的劇名LOGO合成到上一步的截圖模塊得到的圖片上。主要包括智能布局、智能調色和多LOGO智能選取等功能。

ZoomAI智能增強技術,包含去噪、色彩增強等功能,畫質增強算法可以用來提升圖片質量。用來進一步提升生成海報圖的質量。

智能截幀:基于視頻內容的AI海報制作

基于視頻內容的AI海報制作,有一個新的挑戰是需要從海量的視頻幀中選取合適的一些幀來作為生產素材,生產出高質量的海報圖,并且避免重復。因此,我們設計了智能采樣模塊來解決這個問題。在智能采樣模塊中,我們首先會將視頻進行場景切分,并且限制每個場景的素材數量,減少重復的同時提高生產效率。其次,采樣率會根據之前的結果動態調整,提高當前場景的生產率。同時,采樣率也和視頻類型息息相關,如片花的采樣率會比正片高,因為片花會包含更加高密度的信息。

個性化海報分發

個性化海報的分發,分為離線、在線兩個部分:

離線部分,將海報圖片上傳CDN生產線上可用的圖片鏈接,并將海報圖索引信息上傳數據庫。同時愛奇藝技術產品團隊還設計并實現了一套海報圖標簽特征抽取系統,結合臉譜用戶側特征以及用戶行為數據訓練個性化海報排序模型。我們嘗試了上下文無關MAB,上下文相關MAB以及淺層或深度排序算法,如FM、DeepFM等。

在線部分,我們通過愛奇藝推薦平臺,快速實現并部署了高可用的個性化海報服務。首先根據場景的配置,召回不同來源、不同尺寸、不同召回模型的海報集合,再利用訓練好的模型對召回集合好個性化排序,最后根據業務需求應用不同的策略邏輯,將最合適的海報分發給用戶

特征抽取在海報入庫之前,需要抽取海報本身的特征。我們獲取候選海報圖的圖片基礎特征、圖片質量特征、明星特征、輿情特征、Embedding特征以及行為統計特征等,其中統計特征包括實時和在線部分。

海報圖排序模型

在海報積累足夠用戶行為之前,我們并不能提前知道用戶在看到海報之后如何反饋,也就是不能提前獲得收益,唯一能做的就是不停地嘗試Exploration,并收集反饋更新策略,目的是使得整個過程損失的收益最小。這一過程就是十分經典的的多臂賭博機問題(Multi-armed bandit problem, MAB)。我們應用MAB算法是將不同的海報候選當做賭博機的多個臂,不斷的試探用戶,讓效果更好的海報的展示機會更多。

  • 上下文無關MAB

上下文無關的MAB有很多經典的算法,比如基于貪婪優先的Epsilon-Greedy算法,基于最大置信區間的UCB算法,以及基于Beta分布假設的ThompsonSampling算法。為了捕捉用戶不同時間段的興趣愛好,經過對幾種算法的實驗對比,我們最終采用了一種基于滑動時間窗口的MAB算法。

  • 上下文相關MAB

上下文無關的MAB能有效的利用用戶的群體智慧選擇合適的海報分發更多的流量,但是個性化不足。因此我們嘗試了上下文相關的MAB算法:一個海報被選擇后推送給一個用戶,其回報和相關特征成線性關系,這里的“相關特征”就是上下文,也是實際中發揮空間最大的部分。于是試驗過程就變成:用戶和海報的特征預估回報及其置信區間,選擇置信區間上界最大的海報推薦,觀察回報后更新線性關系的參數,以此達到學習的目的。應用的特征包括用戶特征與海報特征,用戶特征使用用戶臉譜的特征,海報特征參見上文的海報特征抽取。在實際應用過程中,有時為了提升場景的豐富度,會隨機丟棄一些歷史特征,以達到Exploration的目的。

  • 海報排序模型

與視頻推薦排序類似,在搜集了足夠多的用戶行為后,我們訓練了淺層的排序模型,如LR、FM與GBDT等,同時我們也嘗試了深度模型,如DeepFM等。因為篇幅的原因這里不在詳細說明各種排序算法。

  • 線上隨機小流量

值得一提的是,我們線上一直保留了一部分隨機小流量。一方面是增加Exploration,另一方面我們可以根據隨機流量的投遞日志,離線重放實驗模型的預測結果,在評估AUC之后,離線的評估模型可能的效果收益,將效果不明顯的優化扼殺下搖籃里,從而提升AB效率。

海報應用策略1、海報溝通豐富度同一個海報展位,如果展示的海報的構圖都比較類似,比如一排都是明星的表情特寫,整體上美觀度可能會有所影響,長期以往會讓用戶有種看到直播畫面的亂入感。因此我們根據業務需求,我們設計了兩種海報構圖豐富度算法:

  • 基于Tag的豐富度:每個視頻有N個海報圖候選,每個海報候選都有很Tag特征,有表示圖片構圖的,有表示圖片內實體的。我們根據場景的需求,在窗口內限制每類Tag的海報數量。
  • 基于圖片相似度的豐富度:基于海報圖的特征向量的相似度,應用MMR&Rule相似度打散算法。

2、展示降權

用戶對于長視頻的觀看決策周期比較長,我們在不同場景進行了實踐,同一個視頻可能對于同一個用戶展示多次。用戶海報維度的展示降權不僅能增加海報圖模型的探索性,也會讓用戶看到這個視頻不同風格類型的海報圖,吸引用戶做出決策。

3、海報退場

對于視頻的海報候選集合,我們設計了一套新增海報的爬坡退場機制。對于新增的海報候選,逐步的擴大其分發量與分發的用戶量。實時監控其CTR,對于沒有達到預期的海報圖,進行適當的降級,直到退場處理,有效的保證線上效果不會受到新增海報的較大負面影響。

4、場景匹配

在某些線上場景,我們嘗試了與場景結合的策略,主要是應用了圖片Tag與展位展示文本信息的相似匹配。比如電影專題,Card的標題會顯示的標識出明星的名字。如果我們優先的為用戶推薦包含該明星名字的海報,用戶將更容易理解,用戶的體驗將會進一步提升。實驗數據也證明,這個策略對于該場景的效果也會有提升。

線上實踐效果

在電視端、移動端的不同場景,我們均進行了小流量實驗。并且統計了展位維度、單片維度、海報維度三個維度的效果,均有不錯的提升。

圖 3 虛擬場景A與場景B的展位維度效果示意圖

上圖是兩個場景展位維度的CTR與UCTR數據,可以看到實驗組,尤其是最優分桶的提升比較明顯。下面可以看看一些海報維度的效果示例:

圖 4 海報維度效果示意圖

寫在最后個性化海報的智能生產如何能從大量的海報中學習出通用的模式,并利用相關語義自動填充必要的元素,比如人物、物體。綜合考慮構圖與素材的生成式生產是未來的研究方向。我們也將研究個性化內容與個性化海報的排序模型融合,訓練端到端的海報圖排序模型, 同時兼顧視頻內容和海報的影響,讓個性化推薦給用戶提供新的驚喜。

參考文檔

https://medium.com/netflix-techblog/artwork-personalization-c589f074ad76

https://www.jianshu.com/p/558d38c62579

愛奇藝技術產品團隊公眾號,由愛奇藝技術產品團隊發起,秉持高效、開放、創新的理念,分享前沿技術,傳達愛奇藝生態理念及技術進展。

盤點2019甲骨文 | 從產品轉向用戶體驗

上一篇

Serverless無服務器微服務實踐-移動應用包分發服務

下一篇

你也可能喜歡

個性化海報在愛奇藝視頻推薦場景中的實踐

長按儲存圖像,分享給朋友

ITPUB 每周精要將以郵件的形式發放至您的郵箱


微信掃一掃

微信掃一掃
海天娱乐群 海南体彩4 1规律图 湖南快乐十分开奖数据 赛车下载 怎么分析股票涨跌 湖北体彩11选五走势图l 研究七星彩有什么技巧吗 贵州11选五任三遗漏手机版 黑龙江十一选五任选三遗漏 秒速飞艇历史开奖记录 股票估值查询