南方周末記者 徐庭芳
人們對個人隱私被侵犯的問題,已從懵然不覺轉(zhuǎn)變?yōu)楦叨让舾??!⌒氯A社記者 ? 邵瑞 ?圖
人工智能的核心在于數(shù)據(jù),算法的形成最終也取決于數(shù)據(jù)量的大小,可供參考的數(shù)據(jù)越多,算法也就越精確,人工智能的學習結(jié)果就更為準確、高效。
對方僅僅擁有了你的面部信息并無用處,關(guān)鍵是要與你個人形成關(guān)聯(lián),知道你是誰,把你的銀行賬戶和頭像進行匹配,進而造成傷害。
近日,創(chuàng)新工場董事長兼CEO李開復在名為“HICOOL全球創(chuàng)業(yè)者峰會”的演講中提到,曾在早期幫助曠視科技公司找了包括美圖和螞蟻金服等合作伙伴,讓他們拿到了大量的人臉數(shù)據(jù)。
曠視科技(簡稱“曠視”)是國內(nèi)知名的人工智能AI創(chuàng)業(yè)公司,與商湯科技、依圖科技、云從科技共同被稱為國內(nèi)的“AI四小龍”。李開復的發(fā)言似乎驗證了公眾長期以來的擔憂:科技公司正在盜用大家的數(shù)據(jù)。
螞蟻集團、美圖秀秀和曠視都否認了數(shù)據(jù)共享一說,李開復也在微博上致歉稱發(fā)言系“個人口誤”,并稱合作中曠視提供AI技術(shù)給合作方,數(shù)據(jù)一直存在于客戶服務器中,不涉及任何數(shù)據(jù)共享與傳輸。
但公眾似乎對“口誤”一說并不買賬。上善若水資產(chǎn)管理公司董事長侯安揚在微博上發(fā)起了投票,“關(guān)于曠視的數(shù)據(jù)問題,你覺得李開復是說漏嘴了,還是搞錯了?”近6000人的投票中,有93%的人選擇了“說漏嘴了”。
早在2019年9月,曠視運用人工智能監(jiān)控學生課堂一舉一動的實驗就曾引發(fā)網(wǎng)友聲討,稱其將人臉識別扭曲為“人身監(jiān)視”。
人們對個人隱私被侵犯的問題,已從懵然不覺轉(zhuǎn)變?yōu)楦叨让舾?。如今,與大數(shù)據(jù)有關(guān)的互聯(lián)網(wǎng)公司都不免要面對這樣的質(zhì)疑:平臺是否擅自收集并使用了用戶的隱私數(shù)據(jù)。
南方周末記者分別向曠視科技和螞蟻金服發(fā)了約訪請求,但兩家公司均以不方便回答為由拒絕了采訪。
人工智能的核心在于數(shù)據(jù)
曠視科技成立于2011年,是人工智能產(chǎn)品和解決方案公司,2015年推出全球首款基于云端的人臉識別身份認證解決方案,其“刷臉支付”技術(shù)入選《麻省理工科技評論》2017年全球十大突破性技術(shù)。
人臉識別和刷臉支付,最常用的場景就是手機解鎖以及網(wǎng)絡支付。
據(jù)此前媒體報道,螞蟻金服曾與曠視科技合作研發(fā)“刷臉”系統(tǒng),用于支付寶內(nèi)。2015年馬云還曾在德國電子展開幕式上刷臉買郵票,那是“刷臉支付”首次在國內(nèi)成型。創(chuàng)建這套系統(tǒng)是為了讓人們在購物后的支付認證階段通過掃臉取代傳統(tǒng)密碼。
曠視和美圖的合作則是在移動設備上。美圖公司回應南方周末記者稱,雙方僅在人臉解鎖方案上有過合作,“曠視科技這個方案是面向整個手機行業(yè)的。雙方的合作僅限于美圖手機”。
據(jù)曠視此前發(fā)布的招股說明書顯示,2016年Face ID解決方案的客戶僅為128名,到2018年這一數(shù)據(jù)已經(jīng)增加至1044名。根據(jù)灼識咨詢提供的報告,2018年曠視占據(jù)云端人臉識別60%的市場份額,其中超過70%安卓手機搭載曠視的人臉識別解決方案。
除了OPPO、vivo、小米、諾基亞、榮耀、錘子等眾多國內(nèi)手機廠商外,曠視與阿里巴巴、螞蟻金服、聯(lián)想、富士康等多個行業(yè)巨頭也有合作。
就職于北京一家人工智能算法企業(yè)的王峰告訴南方周末記者,從邏輯推斷,平臺(如螞蟻、美圖)將自身數(shù)據(jù)共享給算法公司(曠視)的可能性很小,“螞蟻這類大平臺,數(shù)據(jù)是它的核心競爭力,不論是從收益還是合規(guī)角度,曠視都不太可能拿到用戶數(shù)據(jù)”。
人工智能的核心在于數(shù)據(jù),算法的形成最終也取決于數(shù)據(jù)量的大小,可供參考的數(shù)據(jù)越多,算法也就越精確,人工智能的學習結(jié)果就更為準確、高效,這使得曠視這類算法公司有了獲取數(shù)據(jù)的“動機”。
據(jù)王峰判斷,李開復所言的“掌握數(shù)據(jù)”,大概率可能是系統(tǒng)檢驗和測試用到的一小部分數(shù)據(jù),這些數(shù)據(jù)一般都做了脫敏,無法和個人真實信息相關(guān)聯(lián),目的只是為了讓AI模型更加準確?!跋喈斢谝环N數(shù)據(jù)訓練,算法公司即使證明了檢測人和賬戶使用者是同一個人,也無法確切知道這個人的身份?!?/p>
對公業(yè)務為主流
但這并非曠視第一次站在輿論的風口浪尖。
2019年9月,一段人工智能監(jiān)控學生課堂一舉一動的短視頻就曾引發(fā)熱議。在監(jiān)視畫面上,兩位穿著校服正在上課的女學生被貼了多個標簽,標簽內(nèi)容是其聽課情況,系統(tǒng)檢測數(shù)據(jù)包括趴桌子、玩手機、睡覺、聽講、閱讀、舉手等行為的次數(shù)。圖片的左上角標有“MEGII曠視”的字樣。
據(jù)媒體報道,這是曠視與南京中醫(yī)藥大學的一項合作,大學除了在校門口、學生宿舍大門口、圖書館和實驗樓等場所安裝了人臉識別門禁外,還在部分教室安裝了人臉識別系統(tǒng),以檢測學生和老師的出勤情況,以及學生的上課聽講質(zhì)量。
被質(zhì)疑是否侵犯學生隱私后,曠視回應稱,這只是曠世的技術(shù)場景化概念演示,未落地應用。
曠視曾在公開場合介紹有關(guān)視覺AI在教育場景中的應用。這一過程中,曠視科技將自主研發(fā)的人臉識別、行為識別、表情識別等技術(shù),集成在考勤及行為分析攝像機MegEye-C3和行為分析服務器中。同時通過對課堂視頻數(shù)據(jù)進行實時的結(jié)構(gòu)化分析,反饋學生行為、表情、專注度、前排上座率等多維度課堂數(shù)據(jù),從而輔助教學評估評價。
與上述螞蟻和美圖的案例略有不同,曠視在學校不僅收集了學生的面部數(shù)據(jù),而且將這類數(shù)據(jù)用于學習形成算法模型,并與學生實名匹配。
該學校管理人員對媒體回應稱,學校已經(jīng)詢問過公安部門和法務部門,在教室安裝人臉識別系統(tǒng)算不上侵犯隱私。換言之,學校成了主動收集信息的主體,曠視不僅為其量身定制了算法服務,還能夠獲得學生的真實身份信息,這相當于曠視間接獲得了學生面部的生物信息。
類似對公業(yè)務已經(jīng)成為國內(nèi)AI企業(yè)的核心業(yè)務。
根據(jù)曠視的招股書披露,曠視的人工智能解決方案主要有:個人物聯(lián)網(wǎng),城市物聯(lián)網(wǎng),供應鏈物聯(lián)網(wǎng)三個方面。
招股書顯示,近3年來,城市物聯(lián)網(wǎng)解決方案在三項收入中占比最大。2017年、2018年以及2019年上半年,該項收入分別為1.68億元、10.57億元、6.95億元,分別占同期總收入的53.6%、74.1%、73.2%。
“目前的城市物聯(lián)網(wǎng),最大的應用領(lǐng)域就是安防?!币晃籘MT行業(yè)資深分析師向南方周末記者解釋,人工智能企業(yè)最初的賽道集中在個人物聯(lián)網(wǎng)領(lǐng)域,但由于數(shù)據(jù)的可采集程度太低,無法形成良好的算法,業(yè)務收入也很少,所以在2017后,重心就換到了城市安防上。
具體來看,2016年、2017年及2018年與截至2019年6月30日止六個月,其五大客戶合計分別占總收入的41.7%、24.9%、22.0%及34.1%。
曠視介紹,這些客戶是中國智慧城市管理解決方案的系統(tǒng)集成商、中國智慧物流解決方案的系統(tǒng)集成商、中國電信服務供應商。在這一領(lǐng)域,曠視已經(jīng)建立攝像頭、邊緣服務器、云端服務器三大硬件體系,相繼推出三十余款攝像頭,用于不同場景。
就在今年,曠視還曾在北京市海淀區(qū)以及中關(guān)村科學城管委會的統(tǒng)一調(diào)度下,試用了“人體識別+外/可見光雙傳感”技術(shù)方案。
這套方案可以通過前端紅外相機鑒別人流中的高溫人員,再根據(jù)疑似發(fā)燒者的人體、人臉信息,通過AI技術(shù),幫助各類公共場所(火車站、汽車站、地鐵站、機場)等高密度人員流動場景下快速篩查體溫異常者。一旦有疑似發(fā)熱人員出現(xiàn)就會自動報警,結(jié)合曠視自研的人體ReID檢測檢索技術(shù),幫助工作人員快速篩查發(fā)熱人員位置線索,以進一步確認檢測和醫(yī)學觀察。
之后,這套測溫系統(tǒng)率先在北京市海淀政務大廳和部分地鐵站展開試點應用,南方周末記者在上海觀察到,該系統(tǒng)目前也被應用在上海部分影院中。
人臉識別的風險
2019年8月份,曠視宣布即將赴港上市。在這次IPO之前,曠視8年時間融資9輪,融資總額達74.6億元,估值已經(jīng)達到40億美元左右(約合人民幣287億元)。
在城市物聯(lián)網(wǎng)領(lǐng)域,已經(jīng)有海康威視、大華股份等行業(yè)龍頭。曠視2019年上半年的營收為6.9億元,??低?018年營收則為498億元,二者完全處于不同量級。這導致曠視的財務狀況緊張,現(xiàn)金流始終為負。
與此同時,個人隱私信息的保護也越來越被公眾所關(guān)注。
早在2018年,百度安全實驗室就曾公開通過實驗,以良性入侵的方式破解了指紋、虹膜等密碼,發(fā)現(xiàn)了包括人臉識別在內(nèi)的多項生物識別技術(shù)其實都具備“易于偽造”的特質(zhì),安全性甚至不如密碼。
“關(guān)鍵在于關(guān)聯(lián)性。”王峰解釋,對方僅僅擁有了你的面部信息并無用處,關(guān)鍵是要與你個人形成關(guān)聯(lián),知道你是誰,把你的銀行賬戶和頭像進行匹配,進而造成傷害。
數(shù)據(jù)泄露的消息近年來不絕于耳。先是2018年底,亞馬遜音箱被爆出發(fā)生重大監(jiān)聽事件,全球智能硬件竊聽風云的故事頻繁登場。一位德國用戶向當?shù)仉s志爆料,在向亞馬遜討要自己的個人活動語音數(shù)據(jù)時,對方發(fā)給他1700份陌生人對話的語音。
2019年2月,名叫Vic-tor Gevers的荷蘭安全研究員在社交網(wǎng)站上公開表示,中國的 一 家 面 部 識別 公 司SenseNets(深網(wǎng)視界)未對內(nèi)部數(shù)據(jù)庫做密碼保護,導致數(shù)百萬公民的個人信息數(shù)據(jù)能夠不受限制被訪問。
據(jù)其介紹,此次數(shù)據(jù)庫內(nèi)含超過250萬人的信息,包括身份證數(shù)據(jù)、照片、工作信息等。該數(shù)據(jù)庫還可動態(tài)記錄個人位置信息,僅2月12日至2月13日的24小時,就有超過680萬個地點被記錄在案。250萬人幾乎“裸奔”在了互聯(lián)網(wǎng)上。
法律介入已經(jīng)刻不容緩了。2019年11月,“中國人臉識別第一案”正式宣判,案件起因是杭州一家動物園強行要求購買年卡的客戶進行人臉識別,客戶將其告上法庭,最終宣判客戶獲勝。
如果人臉信息被泄露,加上動物園留存的客戶其他身份信息也被盜取,偷盜者完全可以建立起一套關(guān)于消費者的身份信息,包括指紋、家庭住址、電話、臉部信息等等,不法分子完全有可能通過這類信息實施偽造、偷盜等活動。
(應受訪者要求,王峰為化名)