南之瑉
當人工智能取代你的工作時,你可能不會失業(yè),但你的工作可能會變得更加陌生、孤立和枯燥,就像那數(shù)以百萬計的數(shù)據(jù)標注員一樣。
從東非肯尼亞內(nèi)羅畢一所大學畢業(yè)幾個月后,30歲的喬找到了一份數(shù)據(jù)標注的工作,主要是處理用于訓練人工智能的原始數(shù)據(jù)。人工智能可以借助大量數(shù)據(jù)學習模式和規(guī)律,但首先,這些數(shù)據(jù)必須由人類進行分類和標注。這些標注員數(shù)量龐大,常常隱藏在機器之后,不為人知。喬的任務是為自動駕駛汽車標注圖像數(shù)據(jù),逐幀識別所有攝像機角度下的車輛、行人、騎自行車的人以及司機需要注意的其他細節(jié)。這是一項繁瑣而重復的工作,一段幾秒鐘的視頻片段可能需要標注8個小時,而且,喬僅僅為此獲得約10美元的報酬。
好在2019年,出現(xiàn)了一個新機會:喬替一家急需標注員的新公司開展標注訓練,收入是之前的4倍。每兩周就有50名新學員在內(nèi)羅畢的一棟辦公樓開始學徒期。他們給對鏡自拍照中的衣服分類,通過掃地機器人的眼睛定位其所在的房間,并在摩托車的激光雷達掃描圖上畫框。一般情況下,會有超半數(shù)的學員未完成訓練就選擇放棄?!坝行┤藦膩聿欢裁唇袌猿??!眴梯p描淡寫地解釋道。同時,他也承認,這份工作確實單調(diào)乏味。
對于雇傭他們的公司,大多數(shù)人只知道它叫“雷默任務”。它運營著一個面向所有英語流利者的求職網(wǎng)站。喬并不知道“雷默任務”其實是硅谷數(shù)據(jù)供應商“規(guī)模人工智能”下屬的子公司。規(guī)模人工智能估值數(shù)十億美元,其客戶包括開放人工智能公司和美國軍方。
對于開放人工智能公司的聊天生成式預訓練轉(zhuǎn)換器(ChatGPT)等語言模型,公眾最為關(guān)注的往往是它們似乎準備自動化所有工作。然而,即使是最卓越的人工智能系統(tǒng),背后也是人,是大量標注數(shù)據(jù)來訓練它并在數(shù)據(jù)混亂時整理數(shù)據(jù)的人。只有買得起數(shù)據(jù)的公司才能參與競爭,而這些公司也極有動力對數(shù)據(jù)保密。
當前的人工智能熱潮——幾乎能以假亂真的聊天機器人、僅憑簡單提示就能生成藝術(shù)作品的智能工具以及這些技術(shù)背后的估值數(shù)十億美元的公司——基于一項前所未有的單調(diào)而重復的勞動。
公司能以盡可能低的成本收集大量的標注數(shù)據(jù)用于訓練模型。如果模型運作有效,至少從理論上來講,就不再需要數(shù)據(jù)標注員了。然而實際上,數(shù)據(jù)標注的工作從未真正停止過。正如研究者所言,機器學習系統(tǒng)非常脆弱,極易受到那些所謂“邊緣案例”的影響而出現(xiàn)問題,甚至導致災難性后果。2018年,優(yōu)步一輛自動駕駛測試車就因未能正確處理“行人騎自行車穿越馬路”的情境,導致一名49歲的女性被撞死。隨著越來越多的人工智能系統(tǒng)被用來提供法律咨詢與醫(yī)療救助,可能產(chǎn)生的極端情況也就越多。這就需要更多的人來對數(shù)據(jù)進行分類和整理。這一現(xiàn)象催生了一個全球性的行業(yè),像喬這樣的人正利用他們獨特的人類能力來支持機器的發(fā)展。
很多數(shù)據(jù)標注員都在訓練最前沿的聊天機器人,他們實際做的工作卻大多瑣碎且重復,旨在維持人工智能系統(tǒng)的正常運行。
這些工作包括分類抖音視頻的情感內(nèi)容、甄別垃圾郵件的新類型以及評估在線廣告的內(nèi)容是否恰當?shù)鹊取S械臉俗T則分析信用卡交易與購物行為的關(guān)聯(lián),或檢查電商平臺推薦的效果,以判斷購買特定襯衫的顧客是否會對推薦的另一件襯衫感興趣。
數(shù)據(jù)標注員的日常工作還包括糾正客服聊天機器人的回復、處理亞馬遜智能助理的請求,以及對視頻通話中的情緒進行分類。此外,他們在標注食品時需要足夠細致,以防智能冰箱在遇到新包裝時判斷失誤,還要在安防攝像頭發(fā)出警報前進行校驗,甚至幫助困惑的無人駕駛拖拉機識別玉米。
人工智能合作組織的項目和研究負責人索南·金達爾說:“數(shù)據(jù)標注是人工智能的基礎(chǔ)設(shè)施,人類智能是人工智能的基礎(chǔ)。我們必須認識到,數(shù)據(jù)標注是人工智能經(jīng)濟中的一項真實工作,它將在一段時間內(nèi)長期存在。”
標注已成為一門大生意。
2022年底,喬開始注意到他的學生們常常抱怨無事可做。不久后,一封電子郵件告知他肯尼亞的培訓營即將被關(guān)閉。他還可以繼續(xù)在線上訓練數(shù)據(jù)標注員,但他開始擔憂自己的職業(yè)未來。他聽說標注業(yè)務正遷離肯尼亞,轉(zhuǎn)移至尼泊爾、印度和菲律賓。
與手機和汽車制造業(yè)不同,人工智能行業(yè)有著極大的流動性。這項工作可以輕易而迅速地得以重新配置,轉(zhuǎn)移到勞動力技能、帶寬條件和工資水平都更理想的任何地點。
2023年5月,規(guī)模人工智能公司在自己的網(wǎng)站上列出數(shù)據(jù)標注職位,招募人工智能有志于征服的幾乎每個領(lǐng)域的優(yōu)秀人才。這些人工智能培訓師具備的專業(yè)知識涵蓋健康指導、人力資源、金融、經(jīng)濟、法律、文化等多個領(lǐng)域。你可以每小時賺45美元教機器人法律,或者每小時賺25美元教機器人詩歌。還有人專門協(xié)助訓練軍事人工智能。規(guī)模型人工智能公司正在測試一款名為多諾萬的大語言模型,該模型被稱為“人工智能戰(zhàn)爭中的彈藥”,并已獲得美國機器人戰(zhàn)車項目的合同。
(摘自《經(jīng)濟日報》)