日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

  9月7日晚間消息,以“AI智享未來”為主題的第二屆CTDC首席技術官領袖峰會在烏鎮盛大開幕,歡聚時代CTO魯鵬俊分享了主題為“科技讓人們的生活更愉悅”的演講,展現AI技術在直播領域的應用。

  魯鵬俊認為,目前消費升級已經呈現出線上化趨勢,人們的消費需求從生存型消費逐步向發展和享受型消費遷移,娛樂時代已經到來。內容是核心訴求,歡聚時代在人工智能的基礎上,圍繞內容從三個技術角度進行加強:生產用戶想要的內容、做好內容的理解、把好的內容推薦給用戶。

  魯鵬俊表示,在對內容的理解上,音視頻的需求已經占據主流,在難度上也遠大于文字和圖片。YY通過識別直播中的音視頻內容,建立數據模型對內容進行歸類,再根據大量的用戶使用習慣,去把相應的內容匹配給用戶。AI技術不但能極大節省產品開發試錯的成本,還能指導運營進行生態的調控,YY借助AI技術,已經實現用戶使用時長的持續增長。

歡聚時代CTO魯鵬俊

  以下是魯鵬俊的演講實錄:

  大家下午好!我是魯鵬俊,來自于歡聚時代。我今天演講的題目是《科技讓人們的生活更愉悅》。

  最近一直在講消費升級,其實這里有一個數據,就是恩格爾系數。這個系數說的是什么呢?說的是人們的主要消費,主要消費是指衣食住行在整個消費里面的占比,這個占比我們看到從1978年到今天2017年,占比一直在下降,說明人們更多的消費轉向于發展和享受型的消費。今天你就會看到有很多消費不停的去買買買,我們電商會很火,因為很多人在時間上會去消費,因為大家有錢了,他不需要去用時間換取食物,他更多的時間是用來享受,所以在時間消費上的變化也會很快。

  這曲線是百度搜索的一個曲線,是從2014年到2018年在娛樂上面消費的占比,娛樂的消費一直是在上升的,而且漲得非???。18年時的時候大概占30%,所以娛樂性在社會整個占比里面越來越重要。時至今日,有很多企業,比如抖音、快手,包含歡聚時代在內的直播公司,非常多公司,今天實際上說明了一點,娛樂化的時代已經到來了。

  我們歡聚時代一直是一個娛樂化的公司,從11年開始它就是一個做游戲語音的公司,然后逐漸發展直播,到今年我們把關鍵詞定位在人工智能上。歡聚時代我們有很多很多的內容,除了大家比較熟悉的比如漂亮的小姐姐、很帥氣的小哥哥之外,主要的秀場內容之外,其實我們還有很多游戲直播,最近我們也有一個子公司—虎牙在納斯達克上市。我們也有很多體育內容,我們用戶群體非常豐富,除了一線的白領、二線、三線包括學生全部都有,每個用戶來到歡聚時代,他們的訴求都不一樣。有的是為了打發時間,有的是為了感情傾訴,所以我們歡聚時代就是想用技術的手段,讓這些人的需求得到滿足,用技術的力量讓人們的生活更愉悅。

  以前我們歡聚時代一直在提倡“不卡、不掉、不延時”,但是用戶來到我們這個網站上,實際上他們是為了得到他們想要的東西,所以內容是核心訴求。我們一定要滿足每個用戶到我們這里的需求,圍繞內容,我們實際上今年從三個角度去做,第一個就是我們怎么生產用戶想要的內容,第二個我們怎么做好內容的理解,第三個就是我們怎么把我們好的內容推薦給我們的用戶。所有這些內容都是基于在我們的人工智能技術之上。

  我們先看內容生產,因為我們主要是以秀場為主,而人們跑到我們這里看直播一定是想得到更美好的東西,所以我們需要有工具幫助我們的主播,讓他去更好的生產更美好的內容,所以第一個我們就讓這個主播自己變得更美好的這個門檻降低。我們去做很多美顏、瘦身這種工具,讓主播變得更美。這里面技術很多,第一個,我們要做人臉的定位,肢體的定位、身體的定位,然后在這上面我們要去做一些美顏的算法,比如怎么去磨皮,怎么把它的輪廓給勾劃出來,再在上面去疊加。

  第二個,今天的用戶有很多需求在改變,但是有一點不會變。因為人們對更高品質的內容的追求永遠都是剛需,我們在這個品質上有兩個東西要去打造。第一個就是我們要把音質變得更高質,第二個就是我們要把圖像變得更高質。我們主要是在做兩個東西,一個是降噪,一個是超分辨,這句話里面有很多噪聲(音頻內容:然而很多經理人努力打拼卻依舊還在原地徘徊),這是我們在語音上的一個降噪技術。第二個是超分辨,(音頻內容:避開對方雷達追蹤的秘訣在于在機體上噴涂的特殊涂料,而這種特殊涂料是日本研制的)。在圖像上面我們也有一些高質量的處理,這個是我們對《射雕英雄傳》這個電影做了一個超分,左邊是超分前的,右邊是超分后的。這是我們在更高品質上面在圖像上的一個處理。

  第三個,我們是要讓我們的內容更加豐富,所以我們今天有很多AR技術,包括你比一顆心,一個手勢之后出一顆心,都是要從AR上去解決問題。我們還有更多的內容,比如我們口吐籃球,我們前面有一個籃球框,嘴巴一張吐一下,這個東西就會變成一個籃球去投籃,這些東西都是我們今天在去處理的。

  內容說完了,生產說完了,我們要對內容進行理解。為什么呢?第一個,我們今天的內容非常非常多,而且很繁雜。第二點,今天是一個音視頻的時代,音視頻占比非常大。以前我們在文本上面理解的是非常透徹的,但是到了音視頻之后,這個門檻就會大大增高。雖然我們有很多的文獻,在說他們怎么去牛,但是到今天你要是想完全去理解這個音頻或者視頻還是非常困難的。對于我們歡聚時代來說,我們有很多的內容,我們今天要重新去理解。因為只有我們理解了這個內容,我們才能夠把更好的內容推薦給我們的用戶。主播平時在干啥,在這個視頻里做了一些啥,他說了一些啥,底下用戶在敲字說666的時候,我們要知道這個用戶說什么很牛,這些東西都是我們要去理解的。

  我們傳統的做法就是有很多的人工去打標簽,比如說抖音招了四五千人,快手不知道招了多少人,會去打這種標簽。但是對于我們來說,我們發現人工標簽有一些問題。第一個就是這個粒度非常粗,不夠細。打個極端的比方說,假設你所有的內容都打一種標簽的時候,這種同質化非常嚴重。這個時候你是不知道用戶喜歡什么,而且這個內容說的是啥。第二個有很多覆蓋不全,這是我們歡聚時代的一個標簽內容,你會發現“其他”這里面是一個大雜燴,但是里面有非常非常多的內容,我們沒有辦法去打標簽。當它不全的時候,我們完全搞不清楚這個用戶要什么。

  我們在人工的基礎上要用機器去學習,我剛才也說了,我們有很多這種東西要去理解,但是我們今天沒有辦法,所以我們從最基礎的標簽開始。這就好象大家平時去學英文,聽英文,聽一整段話聽不懂的時候我們就去聽關鍵詞,這是同一個套路。當我們整個音視頻理解不了的時候,我們就去理解它的主題,理解這個標簽,所以我們在算法層面,我們第一方面就是先把它給聚類,大的粗的類先把它聚好,聚好之后然后送給人工,人工說這一波都是跳舞的,就輸入跳舞,我們知道這一波全部是跳舞的。里面有些不知道的就是做一些細微的調整,說這個不是跳舞,這明明是在唱歌,把這個標成唱歌。這個搞完了之后,我們就會把這些數據拿去做一個模型,我們有很多標簽模型會幫助我們去把這個東西給標出來。

  在語音方面,我們實際上也在做語音識別。語音識別也有很多公司技術也很成熟了,基本上就是一個DAN,上面套上CDC的一個網絡,然后就幫助把這個東西給學出來。學完了之后,我們有一個文本的模型,它就會把無論是文本也好還是語音識別出來的文本也好,把它去做一些歸類,最后得到我們的標簽。這里是一個視頻標簽的跳舞視頻,上面那個dance的標簽就是跳舞的概率,這時候已經70%、75%,這個99%了,這個沒跳舞的時候上面就是3%,基本上這就是我們今天是在做內容標簽一個小小的成果。

  一旦有了標簽,其實這個標簽有很多的應用,非常非常有用。第一個用途,因為標簽基本上說的是這個平臺的調性,打個比方,我們平臺一旦生產了這些標簽之后,我們就通過推薦算法,給這個用戶去消費,所以我們可以把這些數據統計起來之后,就知道在我們這個平臺上,比如跳舞有多少內容,然后有多少用戶在使用我們的內容。比如說對于跳舞的這個內容,我們只有十個主播在跳舞,但是我們的用戶有一千萬,我們就知道這個是一個供不應求的需求,所以我們要讓我們的運營引入更多跳舞的主播進來,因為有很多的用戶需要這個東西,我們就會去做主播的運營。相反,如果說我們有一百萬的跳舞主播,但是我今天只有一個人在這消費這個跳舞的內容,那么我們就知道我們缺少用戶,所以我們要去大力的拉喜歡看跳舞的用戶到我們的平臺上來,我們可以去做各種運營,這是標簽第一個非常重要的應用。

  第二個希望應用實際是在推薦算法里面的一個應用,打個很簡單的比方,比如jeff今天早上花了兩個小時看主播跳舞,接著聽了三分鐘的歌,接著又看了三個小時主播跳舞,我們大概可以推算出來這個杰夫是一個非常喜歡看女主播跳舞的人。當這個人來到YY平臺的時候我們就會把正在跳舞的主播排在前面。杰夫的感受就會非常棒,因為他喜歡看跳舞,一上來就有跳舞的主播在給他跳舞,所以他停留的時間就會長,打賞的概率就會變大。

  剛才說了內容的生產和理解,接下來我們還是要去把這個內容分發給我們的用戶。因為我們要去做一些用戶的推薦,這是一個千人千面的事,在內容推薦里面,數據是最最重要的,因為沒有這個你啥都干不了。

  什么數據對我們很重要呢?第一個數據就是我們用戶畫像,我們必須要非常精準的知道我們這個用戶喜歡什么,他是一個什么樣的人。這個數據我們要去收集。第二個數據就是我們主播的畫像,我們的內容畫像,這是一個什么樣的內容,我們剛才說了,做了很多內容的標簽,我們在這個地方就會用得上。第三個數據實際上是這個漏斗,在整個推薦算法里面,你要非常關注一個用戶來有多少數據在哪個漏斗上面,你才知道你的算法要朝什么樣的方向去優化,所以這三個數據是內容推薦非常非常重要的東西。

  有了數據之后,什么很重要?我覺得AB策略非常重要。假設我有100個流量,50個走策略A,50個走策略B,你把這些數據跑完了之后,去看一看策略A和策略B哪個好,你就用哪個。以前傳統的就是大家會去做很多很多的產品,做很多很多的測試,產品也是一種試錯的辦法,但是那個成本非常高。如果一旦有了這個工具,就可以幫助你大大縮短試錯的成本,因為你去調整一個算法,你馬上會知道這個算法是好的還是壞的。

  第三個就是模型,模型是核心競爭力,模型能夠幫助你去很好的匹配這個用戶和內容。我們今天實際上有非常大規模的DAN在我們的平臺上面,幫助我們去幫助用戶去做好推薦。

  最后一個內容是關鍵,這個東西還是很關鍵的,第一個就是內容池子你必須要足夠的大,很很多企業上來說我要推薦算法,我要做推薦,如果你的內容沒那么大的話,推薦沒什么用,要不然你人工去排一排,基本上就是了。第二,內容必須要足夠多樣,如果你的內容都是一樣的,推薦算法怎么推都是一樣的,你要想看漂亮的小姐姐,如果全部都是漂亮的,你怎么排都一樣。第三個就是內容的質量必須要足夠的高,如果你的內容質量不高的話,其實也沒有用。內容推薦實際上就是做一個千人千面的事,我把這個流程大概分成了三階段,第一個就是檢索,就是幫助你去召回更多的內容,第二個就是你要預測,我要知道這個內容對這個用戶來說,它的點擊率,它的時長,它的打賞概率有多大,第三個就是排序,你要在里面去做一些規則,去做一些生態的調控,這基本上是整個千人千面的三部分。

  我也給大家去看一下我們上了人工智能之后整個平臺的一個效果,這是我們的用戶觀看時長,從今年3月份我們把這個東西上上去,我們的用戶時長在我們這個平臺上一直在漲,大家可以看到這個趨勢還是非常明顯的。

  雙城記開篇說“這是一個最好的時代,這是一個最壞的時代。”對于我們來說,好的一方面就是今天是一個非常新的娛樂時代,我們有很多很多新奇的東西可以看得到。壞的是今天技術都沒有那么成熟,我們需要不斷的去打磨它。歡聚時代實際上一直在不斷的用技術的力量去打磨它,把這個時代所不容易做到的用技術的力量去解決,所以我們的愿景就是用技術讓人們的生活更加愉悅。我今天演講就到這兒,謝謝大家!

分享到:
標簽:歡聚時代CTO魯鵬?。航柚鶤I技術提升直播行業效能 人物動態
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定