流行短視頻應(yīng)用TikTok(抖音海外版)吸引了全球數(shù)億用戶持續(xù)沉迷其上,這在很大程度上要歸功于算法。該公司高管近日披露了有關(guān)這種“殺手級”算法的工作原理,包括如何利用機器學習最大限度地提高用戶參與度,以及如何打破“信息繭房”的桎梏。
TikTok的算法可為用戶推薦下一段要看的視頻,它幫助該應(yīng)用獲得大量人氣以及數(shù)百億美元估值。迫于美國壓力,字節(jié)跳動準備出售TikTok美國業(yè)務(wù),而算法成為潛在交易的焦點之一。TikTok高管在與記者舉行的電話會議上表示,他們正在披露有關(guān)算法和數(shù)據(jù)操作的細節(jié),以消除有關(guān)該公司的各種謠言和誤解。
TikTok負責美國公共政策的副總裁邁克爾·貝克曼(Michael Beckerman)說:“盡管我們剛剛成立兩年,但卻有著長遠目標。我們沒有機會在互聯(lián)網(wǎng)的黃金年代成長,當時科技公司不會做錯任何事。我們成長在科技狂潮的時代,人們對平臺、它們?nèi)绾螌徍藘?nèi)容以及它們的算法如何工作都持懷疑態(tài)度。”
TikTok高管為記者提供了一次虛擬之旅,參觀其位于洛杉磯的新“透明中心”。該中心將為人們提供演示計算機模塊的區(qū)域,這些模塊展示TikTok的算法和數(shù)據(jù)操作是如何工作的。
TikTok的算法使用機器學習來確定用戶最有可能參與的內(nèi)容,并為他們提供更多內(nèi)容,方法是找到相似的視頻,或者有相似用戶偏好的人喜歡的視頻。當用戶首次打開TikTok時,他們會看到8個熱門視頻,內(nèi)容包括不同的趨勢、音樂和主題。在此之后,算法將繼續(xù)根據(jù)用戶觀看或參與的視頻以及用戶在做的事情,為用戶提供8個更新的視頻。
該算法根據(jù)視頻信息(可能包括字幕、標簽或聲音等細節(jié))識別與用戶觀看的視頻相似的視頻。它還考慮到用戶設(shè)備和帳戶設(shè)置,其中包括語言首選項、國家/地區(qū)設(shè)置和設(shè)備類型等數(shù)據(jù)。
當TikTok收集了足夠多的用戶數(shù)據(jù),該應(yīng)用就能夠根據(jù)相似用戶的喜好來繪制用戶的偏好,并將他們分組到“集群”中。同時,它還根據(jù)類似的主題將視頻分組,比如“籃球”或“兔子”等。
使用機器學習,TikTok的算法可以根據(jù)用戶與其他用戶集群、他們所喜歡內(nèi)容的接近程度向用戶提供視頻。TikTok的邏輯旨在避免可能會讓用戶感到厭煩的冗余內(nèi)容,比如看到具有相同音樂的多個視頻或來自同一創(chuàng)建者的多個視頻。
TikTok承認,之所以能夠如此有效地鎖定用戶的偏好,意味著其算法可以產(chǎn)生“信息繭房”,強化用戶現(xiàn)有的偏好,而不是向他們顯示更多樣化的內(nèi)容,拓寬他們的視野,或者向他們提供不感興趣的內(nèi)容。
TikTok表示,他們正在研究“信息繭房”,包括它們能持續(xù)多長時間,以及用戶如何遇到它們,以便在必要時更好地打破它們。由于“信息繭房”會強化陰謀論、惡作劇和其他錯誤信息,TikTok的產(chǎn)品和政策團隊研究哪些賬戶和視頻信息(主題、標簽、字幕等)可能與錯誤信息有關(guān)。
鏈接到錯誤信息的視頻或創(chuàng)作者會被發(fā)送到公司的全球內(nèi)容審查員那里,這樣TikTok就可以在上述內(nèi)容在推薦頁面上分發(fā)給用戶之前對其進行管理。
TikTok還介紹了該公司在數(shù)據(jù)、隱私和安全方面的最新舉措。該公司表示,它試圖在事件發(fā)生之前對其平臺上的事件進行分類和預防,方法是在問題蔓延之前檢測問題的模式。
TikTok首席安全官羅蘭·克勞蒂埃(Roland Cloutier)表示,計劃在年底前在美國招聘100多名數(shù)據(jù)、安全和隱私專家。他還表示,該公司將在華盛頓特區(qū)建立一個監(jiān)測、反應(yīng)和調(diào)查反應(yīng)中心,以積極檢測和實時反應(yīng)危急事件。
貝克曼表示,TikTok的透明度努力是為了將公司定位為硅谷的領(lǐng)導者。他說:“我們希望占據(jù)領(lǐng)導地位,更多地展示這款應(yīng)用的工作原理。對我們來說,我們是新來者,我們想要這樣做,因為我們沒有什么可隱瞞的。我們與立法者交談和會面的次數(shù)越多,他們對我們的產(chǎn)品就越了解,感覺越滿意。”
【來源:網(wǎng)易科技】