再聰明的AI,都需要人類來“飼養(yǎng)”。只不過它們吃的不是米飯,而是數(shù)據(jù)。越是高質(zhì)量的、標注清晰的數(shù)據(jù),越能幫助AI更快成長,變得更強大。27歲的亞歷山大·王(Alexandr"Wang)就掌握著世界上最著名,也是最龐大的AI“飼養(yǎng)廠”。這個數(shù)據(jù)“王國”名為Scale"AI。在這里,王指揮著20多萬名遍布全球的員工,進行故事輸入、圖片標注、句子編寫等工作,為各種AI大模型提供更好地理解人類語言模式所需的文本,從創(chuàng)作詩句、總結(jié)新聞稿件到用烏爾都語撰寫故事,不一而足。
在許多人工智能初創(chuàng)公司尚未賺到一分錢的時候,Scale"AI在2024年的年化收入已經(jīng)達到近10億美元(約合人民幣71億元)。要知道,推出ChatGPT的Open"AI公司的年收入,也僅僅是35億~45億美元。王甚至將自己公司在人工智能革命中的重要性比作英偉達。目前,Scale"AI估值已超過140億美元,他個人持有的股份估計價值20億美元(約合人民幣142億元),這使他成為世界上白手起家的最年輕的億萬富翁之一。
也是大學退學生
人類每一次巨大的技術(shù)變革,都會迎來一場造富神話。王,成為AI時代一個新的神話般的人物。這位1997年出生的華裔少年,長著一雙很細的眼睛,臉上還有這個年齡階段難以擺脫的青澀。正常而言,他現(xiàn)在正是讀大學的年紀。但從高中開始,他就擺脫了大多數(shù)人常走的那條路,開啟了一場人生的冒險。
王出生于美國新墨西哥州的洛斯阿拉莫斯,這里是原子彈的誕生地。他的父母都是從事武器研發(fā)項目的科學家,從他上幼兒園起就開始教授他高等物理知識。
在一篇題為《一六年我學到了什么》的文章中,王寫道,他在9年級(相當于初三)時就開始計劃創(chuàng)建一家公司,當時他和一個朋友在谷歌文檔上記下了創(chuàng)業(yè)的想法。
夢想只是一顆種子,種下之后并不一定會馬上萌發(fā)。十幾歲時,王像一些普通“好學生”一樣,參加辯論隊,學習拉小提琴,他還經(jīng)常參加全美各地的數(shù)學和物理競賽。高中,他的人生開始走上“岔路”。
他提前一年離開高中,前往硅谷工作,成為“美國知乎”Quora的一名工程師。那時,他17歲。
在Quora,他每天工作12小時。這種如今被視為“牛馬”般的工作強度,卻讓他切身體會并愈加重視努力的重要性。在那里,他還遇到了日后成為Scale"AI聯(lián)合創(chuàng)始人之一的露西·郭——一個和他一樣年輕,生于1994年的華裔女孩。
王表示,他是在參加舊金山的SPARC(應(yīng)用理性與認知夏令營)后,第一次看到了人工智能的突破性潛力。該夏令營旨在將有數(shù)學和科學天賦的學生聚集在一起。在那里,他結(jié)識了OpenAI聯(lián)合創(chuàng)始人格雷格·布羅克曼等早期人工智能研究人員,這激發(fā)了他對人工智能技術(shù)的興趣。
為了學習機器學習,2015年,王進入麻省理工學院學習。大一時,他同時修讀了5門研究生計算機科學的課程,并利用春假開發(fā)了一款名為Ava的iPhone應(yīng)用,幫助用戶預(yù)約醫(yī)生。
2015年夏天,他退學了。聽起來又是一個俗套的大學生退學創(chuàng)業(yè)的故事。但那時候的王意識到,技術(shù)帶來的機會不會待在原地等待自己。他必須做出選擇。
這一決定是在與在線房屋交易平臺Opendoor的首席執(zhí)行官埃里克·吳交流后做出的。吳勸說王加入當時尚在起步階段的Opendoor,而不是去成熟的科技公司工作,并鼓勵他趁年輕多冒險。
9年級時,寫在谷歌文檔上的夢想,在這一刻蠢蠢欲動了?!拔乙庾R到,如果不在最佳時機冒險成為一名創(chuàng)業(yè)者,我一定會后悔?!?/p>
2016年夏天,王為Ava報名參加了由著名風險投資公司Y"Combinator(當時由薩姆·奧爾特曼領(lǐng)導,他現(xiàn)在是OpenAI的首席執(zhí)行官)舉辦的創(chuàng)業(yè)培訓項目。不久之后,他和露西·郭一起,將Ava擴展成了一個更宏大的構(gòu)想,取名為Scale"AI。
在新冠肺炎疫情期間,王一直和奧爾特曼住在一起,后者最終通過與Y"Combinator的交易間接擁有了Scale"AI的股份。
“我告訴我的父母,這只是我夏天隨便玩玩的事?!蓖跽f,但顯然,他再也不想回學校了。
一個敏銳的機會主義者
有時候,你必須大膽地冒著風險去追逐夢想,即使這條路是非傳統(tǒng)的。王后來回憶道,自己看到了數(shù)據(jù)標注的巨大潛力,也明白時機的重要性。如果自己耐心完成學業(yè),就可能會錯失一個快速增長的市場。
他可能失敗,但決心要冒這樣的風險。
“即使最令人印象深刻的人工智能系統(tǒng),背后也是人?!蓖踉诮邮苊襟w采訪時說。任何試圖保持競爭力的人工智能公司,都需要“大量的人給數(shù)據(jù)貼上標簽,訓練數(shù)據(jù),并在數(shù)據(jù)混淆時澄清數(shù)據(jù)”。
然后,這些經(jīng)過注釋的數(shù)據(jù)就可以賣給OpenAI這樣的公司,用于訓練他們的算法。
這需要大量人力資源。Scale"AI旗下的子公司Remotasks在全球范圍內(nèi)雇用了20多萬名外包工人,王稱這些工人“對于構(gòu)建強大的人工智能系統(tǒng)至關(guān)重要”。
相比之下,OpenAI公司只有約1700名員工。
《福布斯》雜志報道稱,在創(chuàng)業(yè)的“頭幾個月”,王和露西·郭“意識到Scale"AI是一個可行的解決方案”,可以解決影響自動駕駛汽車公司的問題,而這些公司當時正處于“人工智能的前沿”。這些公司擁有數(shù)百萬英里的駕駛錄像,但沒有足夠的人來標注圖像,以便讓自動駕駛汽車識別停車標志和行人等物體。
Scale"AI成立幾個月后,就簽下了Cruise(通用汽車的子公司)和特斯拉作為早期客戶。到2018年,Scale"AI的客戶名單已經(jīng)包括了豐田和本田等“主要國際汽車制造商”。同年,王登上了福布斯“30位30歲以下創(chuàng)業(yè)者”榜單。
“每個行業(yè)都坐擁大量數(shù)據(jù),”王說,“我們的目標是幫助他們釋放數(shù)據(jù)的潛力,并用人工智能來增強他們的業(yè)務(wù)?!?/p>
面對數(shù)據(jù)這座金礦,Scale"AI成為最早的掘金者之一。正如他年輕時在Quora經(jīng)歷中學到的,王變成了一個工作狂。他提出了“為什么不更快”和“穿墻而過”等公司口號,并積極尋求風險投資支持。2019年,Scale"AI的估值達到了10億美元。
當然,事情并非一帆風順。創(chuàng)辦Scale"AI時,王只有19歲,露西·郭也只有21歲。“這無疑讓招聘變得更加困難了,”王說,“有人會問我,‘請給我解釋一下,為什么我應(yīng)該把我的事業(yè)托付給你?’”不少潛在的投資者也猶豫不決。
王證明了自己是一個“敏銳的機會主義者”。當舊的收入來源枯竭,他及時將Scale"AI引向新的方向。2019年,他與OpenAI簽訂了公司的第一份生成式人工智能合同,為ChatGPT背后的語言模型早期版本標注數(shù)據(jù)。
“王非常善于洞察先機,”指數(shù)風投公司的退休合伙人、Scale"AI董事會成員之一邁克·沃爾皮說,“他將多種創(chuàng)業(yè)技能和遠見卓識融為一體?!?/p>
“他有一種絕對瘋狂的職業(yè)熱情”
不少人,尤其是Scale"AI的競爭對手,對這家公司嗤之以鼻?!癝cale"AI把自己定位為一家科技公司。但對我們來說,他們與任何業(yè)務(wù)流程外包的公司沒有什么不同?!背鮿?chuàng)公司Labelbox的聯(lián)合創(chuàng)始人馬努·沙爾馬表示。
像沙爾馬這樣的科技新貴認為,他們可以比Scale"AI做得更好;而傳統(tǒng)外包商則認為,他們可以比Scale"AI做得更便宜。
“我想說的是,我們在這一領(lǐng)域研究的時間比任何人都長,所建立的技術(shù)也比任何人都多?!蓖鯇Υ朔瘩g道。
他放棄麻省理工學院的學業(yè)更早抓住機會,以及“為什么不更快”的工作狂做法,為公司帶來了領(lǐng)先地位。而為了保持這種地位,Scale"AI不斷壯大員工隊伍。
“我們總是希望有更多人參與其中?!蓖跽f。
在位于舊金山、占地1.67萬平方米的辦公室里,Scale"AI的員工通過在Reddit和LinkedIn等網(wǎng)站上發(fā)布廣告招募標注員,他們的主要目標是“全球南方”的廉價勞動力。其他員工則負責審查標注好的數(shù)據(jù),或處理員工入職和薪資問題。
管理這支龐大的團隊非常困難。最早的標注員中有許多人來自菲律賓,他們在網(wǎng)吧工作,一邊玩游戲一邊完成外包任務(wù),每小時能賺1.5美元,每周工作10個小時。Scale"AI的支付系統(tǒng)不夠穩(wěn)定,時常導致工人的薪水無故延期或根本沒有發(fā)放。一些人辭職了,其他人則想方設(shè)法在工作中作弊,以提高效率,賺更多的錢。有時,他們標注的數(shù)據(jù)質(zhì)量太低,以至于Scale"AI的員工、高管,甚至是王本人,都不得不親自上陣重做。
2023年,Scale"AI差點搞砸了Meta公司的一個項目。
2023年初,這家科技巨頭要求Scale"AI創(chuàng)建2.7萬條問答數(shù)據(jù),以幫助其訓練人工智能聊天機器人。當Meta的研究人員收到這些數(shù)據(jù)時,他們發(fā)現(xiàn)了一些奇怪的現(xiàn)象。許多答案看起來都一樣,或者以“作為一個人工智能語言模型……”開頭。原來,Scale"AI的外包員工使用了ChatGPT來編寫他們的回答。
王不得不宣布公司進入緊急狀態(tài),號召全體員工奮力挽救這份合同。他要求員工們不分晝夜地工作,重設(shè)全部問答。一個內(nèi)部排行榜顯示了誰完成了最多標注任務(wù),優(yōu)勝者的獎品是帶薪休假。
幸運的是,在他的帶領(lǐng)下,Scale"AI最終保住了Meta的合同。
“他取得今天的成就并不是因為他是個少年天才——麻省理工學院有很多這樣的天才輟學學生?!盨cale"AI的董事會成員威廉·霍基說,“(他能走到今天是因為)他有一種絕對瘋狂的職業(yè)熱情,而這,是我所見過的其他人都不具備的?!?/p>
編"輯/張"亦