周小琪 梁文雪
河南郟縣東邊一個建材廣場的三層,這些天,來了500個長了眼袋的人。他們被輪流帶進了臨時搭的攝影棚里——一個光線昏暗、不到30平方米的小房間。
有人指引他們坐在椅子上,面朝一部被固定在三腳架上的手機,手機和眼袋者之間的距離是25厘米,不能多,也不能少。每次開拍前,一名長著老實憨厚方臉的員工都會掏出卷尺,仔細再量一遍。
方臉員工叫張凱。量完距離后,他需要用5部像素不同的手機拍攝這些有眼袋的人。
這項工作名為“數(shù)據(jù)采集”。采集而來的照片、語音等,進行“數(shù)據(jù)標注”后,將會提供給人工智能企業(yè),作為機器的學習資料。這些資料能教計算機分辨車輛、廚具等不同的物體,讓它們像人一樣,去認識大千世界。
去年夏天,張凱要重新找工作養(yǎng)家,一家名為“千機數(shù)據(jù)”的公司正好在招人,人力主管向他介紹說,公司主要做“數(shù)據(jù)標注”,簡單來說就是給圖片上的物體拉框框,只要會用電腦就能干。工資保底2000元,多勞多得。
他被安排在一個有電腦的工位上。領導傳來幾百張廚房、餐廳的圖片。張凱需要做的是:把圖片上的碗、碟、杯子、筷子等餐具都框出來,然后選好屬性、分好類。拉對一個框能賺4分錢。
張凱覺得很新奇——把這些鍋碗瓢盆框出來能干嗎?但初來乍到,他沒好意思多打聽。
第一天上班,張凱費勁拉了幾百個框。他不熟悉規(guī)則,比如,三個堆在一起的碗,是應該一起拉一個框,還是分開拉三個框?
一周后,他已經(jīng)熟練到每天能拉幾千個框,掙100多塊錢了。時間久了,張凱看什么都帶框,看到家里廚房的鍋碗瓢盆,他第一反應是,框框應該從哪個角度拉?拉多大比較合適?
才來三個月,張凱就開始挑戰(zhàn)難度更高的3D全景圖。工作了大半年,張凱已經(jīng)是公司最優(yōu)秀的員工之一,但他依舊沒問過,拉這些框是為了什么?
“數(shù)據(jù)標注”的工作干了一年,張凱開始接手新任務“數(shù)據(jù)采集”。
他的第一項采集任務就是拍攝有眼袋的人。
一開始,張凱完全分不清眼袋、臥蠶和黑眼圈。在他看來,它們都是堆在下眼瞼的皮膚組織,只有喜歡熬夜或者上了年紀的人才會有。
為了這次拍攝任務,張凱仔細研究了很多張照片,終于搞明白這三者的區(qū)別:眼袋呈倒三角形,浮腫而松弛;臥蠶是橢圓形的,比眼袋小很多,笑的時候才明顯;黑眼圈則是烏黑色的、平坦的,不會像眼袋和臥蠶一樣凸出來。
拍攝前,張凱少不了回答被拍攝者的質(zhì)疑。有人問:“照片上有我們的正臉,你們會不會拿來做違法的事?要是把它們用來刷臉支付怎么辦?”
張凱給出解釋:“大街上那么多攝像頭,如果拍幾張照片就能用來刷臉支付的話,走在路上是不是也不安全?”“我們公司是正規(guī)的,幾百號人,合作的都是大企業(yè),你就放心吧?!?/p>
創(chuàng)辦“千機數(shù)據(jù)”之前,公司CEO劉洋鋒也很少聽說“人工智能”這個詞,上中專時他學計算機,畢業(yè)后從事的工作卻都跟計算機不沾邊。后來,劉洋鋒和兩個發(fā)小湊在一起,準備創(chuàng)業(yè)。去年,一個偶然的機會,他們在網(wǎng)上看到一個轉(zhuǎn)讓的“數(shù)據(jù)標注”的單子。他不明白“數(shù)據(jù)標注”是干什么的,直到在一個網(wǎng)頁看到這段話:
“要理解數(shù)據(jù)標注,得先理解AI其實是部分替代人的認知功能。我們學習認識蘋果,需要有人拿著一個蘋果告訴你,這是一個蘋果。類比機器學習,我們要教它認識一個蘋果,給它一張?zhí)O果的圖片,它是完全不知道的。我們得先有蘋果的圖片,上面標注著‘蘋果兩個字,然后機器通過學習了大量圖片的特征來認識蘋果?!?/p>
劉洋鋒懂了。他把“蘋果”的例子講給發(fā)小聽,他們都覺得“這事兒能成”。
三個人湊了10萬元,在縣城租下一間30平方米的單間,拉回20臺價值1000多塊的二手電腦,然后通過微信群和朋友圈招了十幾個員工。
乘著“人工智能”的東風,劉洋鋒接的單子越來越多,短短幾個月,公司就擴張到一整層3000平方米,可以容納數(shù)百名員工,還在鄭州、許昌、平頂山等地開設了分公司。
對張凱和千機數(shù)據(jù)的其他普通員工來說,他們現(xiàn)在采集、標注的數(shù)據(jù),和穿過的珠子、壓過的電池片沒有什么不同,都是流水線上的一個部件。
昔日流水線上的工人,成了教“人工智能”認識世界的第一位老師,把認知事物的經(jīng)驗濃縮進一張張圖片中以后,他們對人工智能也開始有了更敏銳的感知。
2019年6月,張凱第一次坐上了高鐵。進高鐵站時,張凱拿著身份證和高鐵票,經(jīng)過一道需要人臉識別的閘機,攝像頭對著他的臉掃描了幾秒鐘后,顯示“請通過”。他突然想到,以前做標注時做過人臉標點,會不會應用在了這上面?
“科技如果發(fā)展得太快,會淘汰掉很多東西”,張凱擔心,機器會取代掉那些流水線上的工人,他們都會失業(yè)。但他又覺得,像自己這樣做數(shù)據(jù)采集和標注的工人,很難被替代?!爱吘箼C器還要通過我們來學習?!?/p>
劉洋鋒也思考過這個問題。他把人工智能產(chǎn)業(yè)比作了一個人,“算法工程師他們負責的是大腦,而我們負責的是四肢”,二者都不可或缺。他們公司采集、標注好的數(shù)據(jù),要經(jīng)過一套特定的算法加工,才能喂給機器,算法是人工智能中最核心的部分。
劉洋鋒也擔憂,畢竟“承接的都是重復性的工作”。為了防止被淘汰,劉洋鋒開始把業(yè)務向高端化、專業(yè)化轉(zhuǎn)移。
在劉洋鋒過去的人生中,人工智能神秘、新奇且遙不可及。而短短兩年,他就發(fā)現(xiàn),“萬物皆可AI”。比如,視頻軟件錄制時的美顏功能要靠人工智能,加特效要靠人工智能,給用戶推送的內(nèi)容也要靠人工智能。
公司接了很多無人駕駛的項目,劉洋鋒?;孟耄谐蝗漳苜I一輛無人駕駛汽車,坐進車里,動動嘴,把目的地告訴系統(tǒng),然后倒頭大睡,車子便把自己送到目的地。
“那一天一定不會太遠?!?/p>
(白坤摘自2019年8月21日《新京報》,梁效誠圖)