日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據

作者| 阿里文娛高級開發工程師 至德

責編 | 王曉曼

頭圖 | CSDN 下載自東方 IC

用戶在優酷或者其它互聯網App上看到的文字、圖片、視頻等,都可以被稱為內容,那么這些內容是如何被生產、管理和組織的?本文將簡單介紹阿里文娛是如何利用網狀關系組織泛內容,以及如何構建泛內容的網狀關系。

 

泛內容存儲管理的挑戰

1、數據規模大:在阿里文娛內,泛內容實體類型多,實體數據規模龐大,如何高效存儲和管理;

2、兼顧內容生產和分發: 泛內容數據管理方式,既要提供快捷的內容生產模式,又能在分發鏈路上提效;

3、擴展能力要求: 泛內容實體類型會隨著業務發展而不斷增加,運營的新玩法也層出不窮,泛內容的存儲管理方式,要能夠適應和支撐未來的業務發展,必須要具有很強的業務擴展能力。

 

什么是泛內容的網狀關系

標簽是被廣泛應用于內容管理的一種方式,內容生產鏈路上,我們會將內容通過機器學習算法或人工標注的方式打上相關標簽。通過這些標簽,將內容連接并組織成一張網。如圖 1所示,以視頻為例,獨立的視頻通過標簽被連接成了一張網絡。

阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據

圖 1 視頻通過標簽連接成網

有了內容的連接關系,內容的組織方式也有了更多樣的玩法,運營同學也擁有了更豐富的運營工具進行內容分發。如圖 2所示,我們可以根據運營需求,將標簽1升級為話題,標簽2升級為榜單。運營便可以將視頻A、B、E組織成為一個話題,將視頻C、D組織成為一個榜單,用于前臺運營活動。

阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據

圖 2 標簽升級為話題和榜單

如圖 3所示,左圖為沉浸式視頻播放頁,可以通過點擊左下角話題標簽跳轉至右圖的話題詳情頁,詳情頁列表中則通過 Feeds 流形式展現出該話題下所有視頻。

阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據

圖 3 優酷內標簽話題引導形式

泛內容網狀關系背后的支撐技術是統一標簽服務,其包括標簽結構及打標結果的定義、基于媒資平臺的核心標簽服務、以及面向運營的標簽管理工具和打標工具,下面的篇幅中將依次進行介紹。

 

標簽結構及打標結果的設計

用戶或運營在為內容打標時,為了提高打標效率,往往會先選擇一個分類標簽,然后再針對這個分類進行打標。傳統設計中,標簽結構往往被描述為一顆樹,只能描述標簽間的父子關系,例如圖 4所示的五層標簽樹。傳統的標簽結構在描述這種場景時,主要有兩個問題:

1. 前三層的標簽是父子關系,但是第四層和第三層之間是屬性關系,兩種關系應區別對待;

2. 第五層和第四層之間是屬性值的關系,也應區別對待。

阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據

圖 4 傳統標簽結構設計

統一標簽服務的標簽結構對上述兩種關系進行了抽象,如圖 5所示。

首先,引入了標簽類型的概念,每一個標簽類型是個森林,例如圖中紫色方框標表示的分類、賽事、技巧標簽類型。對于簡單的標簽場景,例如內容標簽、質量標簽等場景,只需要使用標簽類型即可支持場景。

其次,對于復雜場景,引入了子標簽類型和標簽分組的概念,圖中橙色箭頭表示運動分類標簽關聯了賽事和技巧兩個子標簽類型,當一個內容被標記為運動或其子分類時,這些內容都可以繼續打賽事和技巧兩類標簽。圖中綠色方框表示用籃球、足球對賽事和技巧類型的標簽進行了可重疊的分組。

這一套標簽結構表述能力十分強大,支撐了目前泛內容的所有標簽。

阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據

圖 5 統一標簽服務的標簽結構

上述標簽結構描述的標簽為枚舉型標簽,除枚舉型外,打標結果中還支持保存開放型標簽和關聯型標簽。其他標簽類型的方案設計暫且不在本文贅述。

 

核心標簽服務

所有的原始數據,標簽庫和打標結果,都保存在媒資平臺,從理論上說,媒資平臺已經具備了內容的打標能力。然而這個讀寫能力較為原始,業務方使用起來多有不便,所以需要一個系統對原始能力針對標簽業務進行業務封裝,為業務方提供好用的標簽服務,這就是核心標簽服務,如圖 6所示。

其主要功能包括,對標簽按路徑進行展開,支持按照標簽來源、按照標簽類型、按照操作來源進行打標,提供了打標結果橫豎轉換的能力,同時還具備權限控制和流量控制能力。

為了支持運營和算法不斷地對標簽體系進行迭代,核心標簽服務中還提供標簽體系的 ABTest 能力。

阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據

圖 6 核心標簽服務


標簽管理工具和打標工具

標簽管理工具基于媒資內容管理平臺搭建,為運營提供標簽體系的查看、審核、新增、修改、下線、刪除、批量導入導出等功能。

由于打標流程中涉及機審、人審不同的打標方式,還涉及質量類標簽、安全類標簽、業務類標簽等多種標簽類型的打標需求,業務上需要使用打標工作流系統實現流程編排,如圖 7舉例所示(僅為流程編排示意,非實際業務流程)。通過打標工作流系統,可以按照業務需求實現復雜的打標流程管理。

阿里工程師用 8 張圖告訴你如何存儲、管理泛內容數據

圖 7 舉例打標流程(非實際業務流程)


小結和展望

目前,泛內容的網狀關系有效組織和管理了阿里文娛內海量的長短視頻、節目、人物、角色等泛內容實體,在生產和分發側,都便捷的支撐了算法和運營需求,并且不斷的為運營同學擴展提供了話題、榜片單等多種運營工具用于不同的內容分發場景,產生了極大的業務價值。

未來,泛內容的網狀關系也將在數據和算法方面進行深度挖掘,通過算法推動網狀關系演進,并且在算法打標、算法推薦等場景,利用網狀關系提升算法效果,最終更好地服務用戶。

分享到:
標簽:內容 數據
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定