來源:極客公園
科技公司越來越好,這群參與創(chuàng)造的人卻在變成「工具」
如果只是用供需這種單一標準去慰勞這些「困在系統(tǒng)里的人」,是否足夠公平?
「人工智能會改變世界,那誰會改變人工智能?」這是 AI 科學家李飛飛的追問。15 年前的 AI 界,普遍信奉更好的算法就能帶來更好的決策,但李飛飛意識到了這種思路的局限:即使是最好的算法,如果沒有好的、能夠反映真實世界的訓練數(shù)據(jù),也沒辦法用。于是,李飛飛著手構建大規(guī)模的標注良好的圖片集 ImageNet。
從今天看,ImageNet 的革命性不言而喻。它的衍生賽事成了篩選算法競賽中的奧林匹克,各大機構紛紛拿它作為練兵場,測試自家算法優(yōu)劣。一時間,各種突破紛紛涌現(xiàn)。2012 年,Geoffrey Hinton 基于卷積神經(jīng)網(wǎng)絡的 AlexNet 拔得頭籌,深度學習也因此騰飛。十幾年來,它全程見證了深度學習在視覺領域的全面興起。
計算機視覺是當前 AI 發(fā)展最好的一個方向,而 ImageNet 是這個領域里經(jīng)典的數(shù)據(jù)集,不夸張地說,如果沒有它,現(xiàn)在的面部識別都會是一種奢望。但它產(chǎn)生的更重大的意義,是讓人們意識到構建優(yōu)良數(shù)據(jù)集的工作是 AI 研究的核心,數(shù)據(jù)和算法一樣至關重要。
最早期,ImageNet 需要有人手動查找、標記圖像并將其添加到數(shù)據(jù)集中。李飛飛想雇用本科生,每小時付 10 美元,但經(jīng)過計算,想到達到她預想的規(guī)模,本科生們不吃不喝得做數(shù)十年。最終,事情有了轉機,她注意到了亞馬遜眾包平臺 Mechanical Turk。在這個平臺上,一些科研人員會發(fā)布一些瑣碎任務,比如給圖像加標簽、鑒定色情照片等。每個能坐在電腦前的人都可以接活,完成后就能獲得金錢回報。
就這樣,來自 167 個國家的 49000 人次,花費兩年半的時間完成了這項偉大的工程。可以說,ImageNet 因為眾包才得以出生,但卻鮮少人會關注那群同樣參與創(chuàng)造的數(shù)據(jù)標注員。他們是真人,只不過平臺把服務背后的人「抽象化」了,讓人感覺這些任務是由計算機自動執(zhí)行的。他們是真人,點擊了無數(shù)次「圖片里是否有皮艇」和「圖片里是否有暹羅貓」。
今天,幾乎每個籌備上市的公司都恨不得在招股書上寫滿「AI +」,產(chǎn)業(yè)「言必稱人工智能」也就意味著人們對數(shù)據(jù)有著極大的渴望。數(shù)據(jù)標注員也因此擴展了好幾個數(shù)量級。Mechanical Turk 現(xiàn)在穩(wěn)定的活躍零工有 10 到 20 萬,在人力成本低廉的地區(qū),甚至形成了特色「數(shù)據(jù)標注村」。
但有點反直覺的是,這群「創(chuàng)造者」催生了 ImageNet,讓它開啟了深度學習乃至人工智能新的篇章,他們最后拿到的錢卻低得可憐。最近,幾所知名大學發(fā)表論文 The Limits of Global Inclusion in AI Development,揭示了一個現(xiàn)實:完成 ImageNet 的數(shù)據(jù)標注零工們,時薪中位數(shù)只有 2 美元左右,只有不到 4% 的標注員拿到了超過 7.25 美元的時薪。作為對比,現(xiàn)在美國一些地區(qū)的最低時薪都提高到了 15 美元。但因為這些兼職者不算員工,因此不受最低時薪法律保護。
他們拿著比最低時薪還低的錢,在無數(shù)次的點擊中,完成了一場開天鴻蒙的革命。這群同樣在為 AI 奠基的「隱形人」,應該得到更多人的重視。
有多少智能,就有多少人工
現(xiàn)代 AI 依賴各種算法處理規(guī)模達數(shù)百萬的示例、圖像或文本素材。但在此之前,首先需要由人工在圖片數(shù)據(jù)集中手動標記出對象,再將標記完成的大量圖像交付給算法以學習模式,掌握如何準確識別對象。
早前就記錄過一位數(shù)據(jù)標注女工的工作:小雪正在把一張張快遞單或家譜上的手寫體上的字母標注出來,告訴機器 i 可以有多種寫法。這樣的工作并不簡單。手寫的 i 可能是頂上一點加上一豎,也可能是朝后彎的小勾,更潦草一點就和數(shù)字 9 一樣 …… 小雪的筆記本上密密麻麻地擠滿了這些像字更像圖的墨跡。她做的,是一種介于手寫錄入和圖像標記之間的工作。同服務于智能駕駛的街景標記、服務于智能醫(yī)療的人體標記、服務于語音交互的聲音標記一樣,他們共同的行業(yè)學名叫做「人工智能數(shù)據(jù)標注」。
即便技術門檻低,但這份重復性極高的工作,對標注精度有著極高的要求,「95% 以上的準確率是理想情況。」如果用于訓練模型的數(shù)據(jù)精度低于要求,那 AI 就會「指鹿為馬」。
AI 行業(yè)對數(shù)據(jù)的渴求,催生出了一批數(shù)據(jù)標注眾包平臺,比如前面提到的亞馬遜 Mechanical Turk,還有谷歌 Crowdsource,國內的京東眾智、百度眾測等。而在這個平臺上兼職的人,也大多是打零工心態(tài)——利用閑暇時間賺點小錢。當然,他們也不全都能意識到自己經(jīng)手的數(shù)據(jù)其實是一些科技企業(yè)賴以生存的核心資產(chǎn)。
比如,美國創(chuàng)業(yè)公司 Sama 專門為 AI 項目提供訓練好的數(shù)據(jù),其眾包平臺面向全球開放,上面大多是非洲和東南亞零工。數(shù)據(jù)顯示,這些人平均每天只能賺到 8 美元(約 50 元人民幣),而依靠標注好的數(shù)據(jù),Sama 在 2019 年拿到的 A 輪融資就接近 1500 萬美元,營收超過 1900 萬美元,其客戶包括谷歌、沃爾瑪和福特。
2005 年就啟動的 Mechanical Turk,創(chuàng)辦初衷就是為了讓更多零工參與進來,幫預算不多的科研機構識別海量 AI 無法歸類的圖片。但隨著更多 AI 公司的涌入,零工和任務發(fā)布者的關系也在「惡化」。在這個平臺上,任務發(fā)布者擁有至高無上的權力。他們不僅可以任意調整任務價格(最低至 1 美分),還能拒絕任何已經(jīng)完成的任務成果,甚至是故意縮短任務建議完成時間,使其大幅低于實際完成時間,以吸引工作者并降低成本。
這類低薪隱形勞動,也走到了「線下」,在中國一些人力成本較低的地區(qū),還發(fā)展出了「數(shù)據(jù)標注工廠」。目前的數(shù)據(jù)標注工廠,多集中在河北、河南、山東、山西等地區(qū),這同以富士康為代表的傳統(tǒng)人力密集企業(yè)的選址偏好重合度極高——以更低廉的勞動力成本支撐起聚集在首都的人工智能底層數(shù)據(jù)需求。
印度也有不少「數(shù)據(jù)標注村」,他們?yōu)闅W美 AI 公司服務,F(xiàn)acebook 就曾將部分社交網(wǎng)絡上內容標注的工作外包給了一家印度公司。
他們不是工具,是參與創(chuàng)造的人
一項研究顯示,Mechanical Turk 上的零工的動機大多是「享受其中」,也有很多人表示是因為當?shù)貨]有好的工作機會。乍看之下,雙方的需求和興趣互相吻合。但同樣不可忽視的是,這類低技術門檻的工作,本質上并不能帶來任何技能上的提升。零工們犧牲掉了自己的本可以拿來自我提升的機會成本。
盡管對于非洲和東南亞的工作者來說,8 美元的日薪可能足夠維生,但這并不能改變其創(chuàng)造的價值被大大壓縮的現(xiàn)實。對于 Sama 這樣的公司來說,他們用極低成本拿到的數(shù)據(jù),創(chuàng)造了千萬美元級別的收益,但這些收益與其背后(一部分)真正的勞動者幾乎毫無關系。
在這種境況里,數(shù)據(jù)標注員更像是價值鏈條里的「可消耗資源」,是被無盡壓縮成一次性工具的角色,鮮有人關注他們個人的留存。
和數(shù)據(jù)標注員類似的,還有社交網(wǎng)絡審核員。他們受雇坐在電腦屏幕前,用審判的眼光看著互聯(lián)網(wǎng)上的帖子。赤裸的色情、嘶鳴的槍響、血腥的暴力都直白地鋪在他們的屏幕上,這些圖片、視頻是被互聯(lián)網(wǎng)平臺用戶舉報后聚集到審核隊列里的。他們在和互聯(lián)網(wǎng)的黑暗面貼身肉搏,做著算法還不能完全做到的事,就像社交網(wǎng)絡中的「人肉盾牌」,網(wǎng)絡審查員受到的精神傷害卻很少有人關注。
這些審核員的薪水同樣低廉。Facebook 正式員工的平均年薪是 24 萬美元,但據(jù) The Verge 前年的調查,替 Facebook 做平臺審查的外包勞工薪水卻只有前者收入的零頭——工作時薪僅 15 美元(年薪 2.8 萬美元)。
他們都在給「信息行業(yè)的富士康」打工,做的是被上層切分得異常細微的工作,這些工作簡單、單調、重復,但在用人方看來,這種切分能最大程度保證準確度。但如果只將這群人困在一個異常狹小的工作空間里,那他們是沒法脫離「工具」的角色成為「創(chuàng)造者」的。
Sama 也持一詞,公司開出的日薪是 9 美元,他們表示希望借此幫助那些日薪低于 2 美元的零工。「我們不會提供可能破壞當?shù)貏趧邮袌龅男匠晁健H绻覀兘o出的薪酬過高,就會給整個社會帶來麻煩。比如,可能會對我們員工所生活的社區(qū)的住房成本、還有食物成本等帶來潛在負面影響。」公司 CEO Leila Janah 說道。
市場供需需要考量,但人的成長也需要被重視。前提是用人方真正把他們當成「人」而非只是「工具」看待。論文提到,解決這個問題的潛在方案是,讓更多人參與到 AI 研究的核心環(huán)節(jié),尤其是 AI 模型和項目的研發(fā)、實現(xiàn)和部署,從而在欠發(fā)達國家培養(yǎng)和鍛煉更多本土 AI 人才,之后再鼓勵他們謀求管理崗位,或者支持其創(chuàng)業(yè)。相比之下,做再多數(shù)據(jù)收集和標注這樣的工作,也無法提升他們的能力。
科技越好,他們越?jīng)]有價值
如果說數(shù)據(jù)是原油,那數(shù)據(jù)標注員,這些挖掘數(shù)據(jù)、標記條目的礦工們,這些在價值鏈條最前端的創(chuàng)造者,是不該被遺忘的。這群人在幫助 AI 不斷成長,但最終他們就并沒有真正幫助到自己。越來越好的科技,可能會讓他們越來越?jīng)]有價值。
先拋開微薄的收入,更諷刺的是,這些零工可能會被他們一手訓練出來的 AI 歧視。零工們大多來自非洲和亞洲,有色人種居多。但在 AI 訓練中,輸入的數(shù)據(jù)卻往往是傾向西方語境。這些數(shù)據(jù)主要來自于西方語境,并帶有人類社會的刻板印象,由此得來的模型無法對不同于西方文化的人和物體做出準確判斷,還會產(chǎn)生類似人類的性別或種族偏見。
那篇論文的最大意義,就在于讓更多人看到那些「困在系統(tǒng)里的人」。這些沒有上升空間的零工,乍一看和平臺方的需求相吻合,但不知不覺中,前者成為被盤剝的角色。這群人就像外賣員、快遞員一樣。成長空間狹小,在算法和平臺的支配下,這些勞動者都被擠壓得喘不過氣。
科技公司在享受著 AI 給他們帶來的巨大紅利的同時,卻讓這群人成了不可見的「幽靈工作者」。如果只是用供需這種單一標準去慰勞這些「困在系統(tǒng)里的人」,是否足夠公平,這是我們都需要思考的。
18 世紀,一架國際象棋機器(The Turk)在歐洲巡回比賽,還曾打敗過富蘭克林和拿破侖。這臺機器曾被譽為人工智能的偉大壯舉,但是后來人們發(fā)現(xiàn)它根本不是機器,而是一個機械木偶,被藏在棋盤下方的人類象棋高手控制著。有意思的是,21 世紀,亞馬遜運營起了機械版 Turk —— Mechanical Turk。
改革并非一朝一夕之事,但我們要先看到那些藏在「棋盤」底下的輔助人工智能的人。