流行短視頻應用TikTok(抖音海外版)吸引了全球數億用戶持續沉迷其上,這在很大程度上要歸功于算法。該公司高管近日披露了有關這種“殺手級”算法的工作原理,包括如何利用機器學習最大限度地提高用戶參與度,以及如何打破“信息繭房”的桎梏。
TikTok的算法可為用戶推薦下一段要看的視頻,它幫助該應用獲得大量人氣以及數百億美元估值。迫于美國壓力,字節跳動準備出售TikTok美國業務,而算法成為潛在交易的焦點之一。TikTok高管在與記者舉行的電話會議上表示,他們正在披露有關算法和數據操作的細節,以消除有關該公司的各種謠言和誤解。
TikTok負責美國公共政策的副總裁邁克爾·貝克曼(Michael Beckerman)說:“盡管我們剛剛成立兩年,但卻有著長遠目標。我們沒有機會在互聯網的黃金年代成長,當時科技公司不會做錯任何事。我們成長在科技狂潮的時代,人們對平臺、它們如何審核內容以及它們的算法如何工作都持懷疑態度。”
TikTok高管為記者提供了一次虛擬之旅,參觀其位于洛杉磯的新“透明中心”。該中心將為人們提供演示計算機模塊的區域,這些模塊展示TikTok的算法和數據操作是如何工作的。
TikTok的算法使用機器學習來確定用戶最有可能參與的內容,并為他們提供更多內容,方法是找到相似的視頻,或者有相似用戶偏好的人喜歡的視頻。
當用戶首次打開TikTok時,他們會看到8個熱門視頻,內容包括不同的趨勢、音樂和主題。在此之后,算法將繼續根據用戶觀看或參與的視頻以及用戶在做的事情,為用戶提供8個更新的視頻。
該算法根據視頻信息(可能包括字幕、標簽或聲音等細節)識別與用戶觀看的視頻相似的視頻。它還考慮到用戶設備和帳戶設置,其中包括語言首選項、國家/地區設置和設備類型等數據。
當TikTok收集了足夠多的用戶數據,該應用就能夠根據相似用戶的喜好來繪制用戶的偏好,并將他們分組到“集群”中。同時,它還根據類似的主題將視頻分組,比如“籃球”或“兔子”等。
使用機器學習,TikTok的算法可以根據用戶與其他用戶集群、他們所喜歡內容的接近程度向用戶提供視頻。TikTok的邏輯旨在避免可能會讓用戶感到厭煩的冗余內容,比如看到具有相同音樂的多個視頻或來自同一創建者的多個視頻。
TikTok承認,之所以能夠如此有效地鎖定用戶的偏好,意味著其算法可以產生“信息繭房”,強化用戶現有的偏好,而不是向他們顯示更多樣化的內容,拓寬他們的視野,或者向他們提供不感興趣的內容。
TikTok表示,他們正在研究“信息繭房”,包括它們能持續多長時間,以及用戶如何遇到它們,以便在必要時更好地打破它們。由于“信息繭房”會強化陰謀論、惡作劇和其他錯誤信息,TikTok的產品和政策團隊研究哪些賬戶和視頻信息(主題、標簽、字幕等)可能與錯誤信息有關。
鏈接到錯誤信息的視頻或創作者會被發送到公司的全球內容審查員那里,這樣TikTok就可以在上述內容在推薦頁面上分發給用戶之前對其進行管理。
TikTok還介紹了該公司在數據、隱私和安全方面的最新舉措。該公司表示,它試圖在事件發生之前對其平臺上的事件進行分類和預防,方法是在問題蔓延之前檢測問題的模式。
TikTok首席安全官羅蘭·克勞蒂埃(Roland Cloutier)表示,計劃在年底前在美國招聘100多名數據、安全和隱私專家。他還表示,該公司將在華盛頓特區建立一個監測、反應和調查反應中心,以積極檢測和實時反應危急事件。
貝克曼表示,TikTok的透明度努力是為了將公司定位為硅谷的領導者。他說:“我們希望占據領導地位,更多地展示這款應用的工作原理。對我們來說,我們是新來者,我們想要這樣做,因為我們沒有什么可隱瞞的。我們與立法者交談和會面的次數越多,他們對我們的產品就越了解,感覺越滿意。”