瑞秋·博茨曼
若想請一個保姆,你會相信誰:直覺還是算法?
輕信陌生人會有危險,我第一次得到這方面的教訓是在1983年。那時我剛剛5歲多,一個名叫多麗絲的陌生女子來到我家做保姆。她來自格拉斯哥,將近30歲,是我的母親從一本名為《女士》的時尚雜志上找到的。
多麗絲穿著一身救世軍軍裝來到我們家,還戴著軍帽?!拔矣浀盟泻苤氐奶K格蘭口音,”母親回憶說,“她說,她曾經照看過像你當時那么大的孩子,還喜歡幫助別人,所以加入了救世軍。老實說,一見面我就很喜歡她?!?/p>
多麗絲在我們家待了10個月,絕大多數時間里,她都是個好保姆——開朗、可靠、樂于助人。除了有幾個周末不知所蹤外,她沒有表現出任何異樣。
當時,我們的鄰居盧森堡夫婦請了一位保姆,她常與多麗絲膩在一起。一天晚上,盧森堡先生來到我家,說他發(fā)現他家的保姆和多麗絲在販毒?!八齻兩踔羺⑴c持槍搶劫,”父親后來講述,“多麗絲是負責接應的司機?!倍掳l(fā)后我們得知,她用來接應的車子,是我們家那輛沃爾沃Estate轎車。
父母隨即決定搜查多麗絲的房間。在其床下的一個鞋盒里,塞滿了一沓沓外國貨幣鈔票,都是從我父母的家庭辦公室里偷來的。那天晚上,我父親手持棒球棍守在家門口,以防多麗絲突然回來。謝天謝地,她沒回來。
“哪怕再次說起這件事情,我都覺得后怕,”母親說,“我們竟然把你交給一個罪犯照看,而且過了那么長時間才看清她的真面目。真希望一開始能對她多一些了解。”
我的父母算是比較聰明且理性的那種人。在當今這個用數字連接的世界中,他們是否會犯當年那樣的錯誤呢?或許不會,因為不管是雇保姆、出租房屋或者叫出租車,正有越來越多的科技公司致力于幫我們決定該相信誰,不該相信誰。當今的科技讓我們能更深入地了解自己是誰,那么,在判斷“誰真的可信,誰是騙子”這方面,算法是否真的可以比人類表現得更好呢?
一個干冷的秋日上午,我來到位于硅谷北部的安靜小城洛斯阿圖斯,參觀了Trooly公司裝修簡單的辦公室。該公司CEO薩維·巴維迦很想向我展示他們的信用審查軟件有多強大,“我要是用Trooly開發(fā)的軟件來審查你,你猜猜會有什么結果出來?”他面帶笑容地說道,語氣中透著鼓勵之意。
我臉一紅,努力回想自己曾經做過的所有糟糕事或尷尬事:(能查出我)收到的大量超速及違停罰單,長時間瀏覽的那些怪異網站(當然是出于研究目的),還是那些老照片?
想到這里,我尷尬地笑了笑。巴維迦說:“別擔心,我們可以把審查過程投影到大屏幕上,這樣你就能實時觀看了?!笨蛇@話并沒讓我感到些許輕松。
安尼什·達斯·薩爾瑪是Trooly的首席技術官,谷歌公司的前高級研究員。他把我的姓名輸入到名為InstantTrust的程序中,接著輸入我的郵件地址,就完事了。不需要出生日期,也不需要電話號碼、職業(yè)或住址。
“Trooly的機器學習軟件目前可以挖掘3個公共的和獲得許可的數據源,”巴維迦解釋說,“首先是像出生證、結婚證、洗錢監(jiān)察名單以及性犯罪者登記簿等公共記錄,全球范圍內任何公共的、數字化的登記簿都可以為我們所用?!逼浯问菍ι罹W的挖掘,“它仍然是互聯網,只不過是隱藏的網絡,其頁面沒有被常規(guī)的搜索引擎編入索引。”是誰在用深網呢?“反社會人群、戀童癖、槍支買賣者……總之,活躍在深網的是形形色色詭異的人。”
最后的數據來源是社交媒體,比如臉書和Instagram。官方醫(yī)療記錄是禁區(qū),但如果你在推特上發(fā)消息說,“我剛做完了一個可怕的背部手術”,它就會被歸類為法律許可的數據且可被使用。
巴維迦和他的團隊花了9個月時間來評估哪些數據可以使用,哪些不可以使用。未成年人的數據就不可以使用。他說:“在有些國家,法律明確規(guī)定了‘私人信息和‘敏感私人信息之間的區(qū)別——后者包括醫(yī)療記錄、種族、信仰、工會會員身份等。我們在使用數據時,會止步于后一類信息,并十分清楚越界的可怕后果?!?/p>
大約過了30秒鐘,我的審查結果出現在大屏幕上?!扒?,你是其中之一!”巴維迦說。個人資料從1到5分為5個等級,其中1級最值得信賴。“僅有大約15%的人位列1級,他們是我們的‘超級好人群?!?/p>
這番話讓我感到輕松,并油然生出一股自豪感。那么又有多少“超級壞”的人呢?巴維迦給出了答案:“在Trooly覆蓋的國家中,包括英國和美國,大約有1%—2%的人口位列4級和5級?!?/p>
巴維迦曾是貝恩咨詢公司(Bain & Company)的合伙人。他最長久的客戶之一是某“知名在線市場”,這使得他開始考慮信用在數字世界中的重要性?!拔覀兊倪@家客戶需要使用他們全部預算中的6%——也就是數億美元——來應對其市場上發(fā)生的意外情況。這讓我開始思考,現有的星級評分體系根本不足以防止大量在線欺詐事件。”
當時,巴維迦的妻子在經營一家小型牙科診所,時而會有顧客拒絕支付費用或威脅給差評,周末時甚至還有人打來電話說要買毒品?!斑@讓我突然意識到,比起大公司來,小公司對他們的客戶了解得更少。如果有辦法能幫他們剔除潛在的不良客戶,那豈不是很酷?”
為了得出我的信用分數,Trooly的軟件在不到30秒鐘內,爬取了8000多個網站的30多億個網頁。數據被合并成3大塊,最基本的是驗證我的身份,看看“我是不是我”,這通過掃描完成,比如說將我的個人網站與讀大學時的信息比對一下,看看是否一致。接下來是篩查非法、危險或欺詐活動。但最令人著迷的是第三部分,在這部分,我被按照“黑暗三合一”進行評估。所謂“黑暗三合一”,即3種助騙子老手大行其道的無情人格特征——自戀(過度渴望受到關注的自我中心主義)、精神?。ㄈ狈ν樾幕虬没诟校┮约榜R基雅維利主義(一種不受道德支配的,極度想控制他人的天性)。遺憾的是,巴維迦無法單獨給出這部分的分數,但好在我通過了這部分的評估。
兩年前,Trooly為這款能“確定一個人的可信度與親和度”的軟件申請了美國專利。軟件的算法也融入了上世紀80年代研究人員廣泛采納的五大人格特征——開放性、自覺性、外向性、隨和性以及情緒穩(wěn)定性。
“通過從某個人的在線瀏覽記錄中挖掘的數百個特點,Trooly開發(fā)了復雜的模型來預測這些人格特征,”巴維迦說,“這些瀏覽記錄可能幫助我們預測出某人是否神經質或粗魯無禮。如果你查看某人的推特賬戶,要是發(fā)現上面充斥著可疑的、可能影射出其負面人格特征的信息和罵人的話,這個人很有可能具有反社會傾向?!?/p>
這讓我想起了自己18歲那年跟父親之間的一場激烈爭論。我在eBay上面看中了一輛顏值頗高的二手標致車,父親卻說,賣家網名叫“隱身的巫師”,這讓人不敢信任他。就這樣,我們最后還是從當地一家汽車經銷商那里買了車。
那些日子,即便謹慎如我父親,也開始沉迷于eBay。在這個社會中,隨著我們越來越多地通過科技與他人進行親密互動——通常是完全不認識的人,或者是曬我們的住宅和汽車,或者是在網上尋找伴侶或保姆,但當第一次接觸某個人時,你怎樣才能知道他們是否會對你構成威脅?他們是否真如自己所說的那樣?或者,跟你對話的是否是人類?
這些都是諸如UrbanSitter等公司需要回答的問題。這家美國網站將家庭與保姆聯系在一起,已有逾35萬名家長和30多萬名保姆在網站上注冊。和許多在線服務一樣,他們都必須通過臉書或領英加入。正如43歲的公司創(chuàng)始人琳恩·帕金斯所說,其結果就是,正當你打算預訂時,你可以看到多少“好友”之前也預訂過這位保姆,或者與這位保姆有何種關聯。
在UrbanSitter的網站上,保姆和家長需要列出詳細的個人資料。人們愿意公開的資料數量及類型多得讓人吃驚,帕金斯回憶說:“有一對父母長篇大論地描述了他們的大肚皮寵物豬,想以此來確保保姆對他們的寵物有好感。這事盡管聽上去怪怪的,卻是預期管理的一種很好的體現。”
審查保姆是否可靠的最后一道防線,則由Trooly或與其是競爭關系的其他信用評級服務公司負責,比如Checkr。審查的內容包括:該保姆是否真的有南泰晤士學院的保育文憑,是否曾在網上使用不當語言,是否為登記在冊的性犯罪者等等。
在這個平臺上開啟注冊的保姆當中,只有25%的人注冊成功,剩下的75%要么注冊被拒,要么中途放棄注冊,因為他們不愿按照平臺的要求乖乖接受審查。
在這個華麗的新世界中,糟糕的事情依然不時發(fā)生。但是像帕金斯這樣的創(chuàng)業(yè)者絕對不會告訴你,在其平臺上發(fā)生過的不良事故、輕微事故或嚴重事故的準確數量。她只會說:“這類事情確實會發(fā)生,但非常少?!?/p>
今年6月,民宿租賃網站愛彼迎收購了Trooly,具體交易金額不詳。此舉是愛彼迎為解決信用危機采取的舉措之一,該公司還在2015年聘請前中情局辦公室副主任尼克·夏皮羅擔任公司的全球信用及風險管理總監(jiān)?!霸谝粋€正常運轉的社會中,獲得并保持信用將永遠是核心部分,”夏皮羅說,“改變的只是信用的交換地點與方式。以往只要建立對大公司、媒體或政府等大型機構的信任即可,如今則不同,人與人之間的信任正變得越來越重要。”
夏皮羅的職責之一就是為愛彼迎制定出危機應對措施。就拿戴維·卡特的事例來說,2014年3月的某個周末,他預訂了紐約的一套豪華公寓,還對房東阿里·特曼說,他是在為哥哥嫂子找住處,他們準備在城里舉行婚禮。然而事實上,卡特口中所謂的“嫂子”是他的一群客人,他們在特曼的公寓里舉行以肥妞和毛絨玩具為特色的派對,縱情狂歡。直到特曼返回公寓取自己的行李時,才發(fā)現里面竟然在舉行限制級社交晚會。
卡特有經過驗證的愛彼迎賬戶,得到的也多是好評。夏皮羅說:“我們有責任審視過去,看看之前是否應該采取另一種方法來解決某些問題,是否犯下了錯誤?!睋Q句話說就是,怎樣才能將卡特這種人徹底剔除掉?
“其實很容易就能看出這類糟心事會發(fā)生,”巴維迦說,“你根本不需要深入研究卡特這個人的精神狀態(tài),來判斷他到底是不是一個性派對的專業(yè)組織者?!痹诠雀枭想S便搜一搜他的電子郵件地址,你就會發(fā)現一堆跟色情有關的在線廣告,如“偷女生內衣行動”“肥妞內衣劫掠派對”等,有人甚至將住址發(fā)布在推特上,以換取參加“色情狂歡盛宴”的資格。
“即使想一想,就足夠讓人面紅耳赤了。”巴維迦說。
我跟巴維迦說了多麗絲的事情。如果多麗絲申請注冊UrbanSitter的話,系統(tǒng)能不能把她揪出來呢?會的!那樣我的父母就會知道她其實并沒有加入救世軍,也沒有照顧小孩子的經驗,卻有一連串斑駁的犯罪記錄。這些,多麗絲都掩飾不掉。
這么說來,我們是否應該接受這些新的信用算法嗎?巴維迦和夏皮羅都認為,在嘗試采取倫理決策并將其轉化為代碼的同時,責任也會隨之而來。我們究竟愿意將多少個人數據交給算法進行測試?讓算法來判斷誰值得信賴,我們對此是否感到心安?
在接受Trooly的軟件測試時,我發(fā)現自己十分擔心一些小錯誤或很久以前的過失會被當眾呈現,此類公司是否會注意到這些呢?
“沒有人喜歡被評判,不管是被機器還是被別人,但對一個人做出評判并非我們開發(fā)篩查程序的目的,”夏皮羅強調,“我們的目的是發(fā)現嚴重的風險,如仇恨團體的成員,有暴力犯罪記錄或虛假身份的人。我們一點也不關心你是否在推特上發(fā)過愚蠢的內容,還是曾因違章停車被貼罰單。”
然而這些事情可能會對雇主產生影響。正有越來越多的招聘者使用數字足跡和機器學習來過濾求職者。諸如Belong、Talview以及SocialIndex等招聘工具,正在提供能夠收集和分析在線數據進而判斷求職者是否適合公司文化的產品。
還有其他問題。比如我的丈夫,從來沒有使用過推特、臉書以及領英,他的“少量信息”是否會降低其可信度呢?
“有那么10%—15%的人,我們給不出確信的分數,”巴維迦坦承,“這部分人要么缺乏足夠的線上瀏覽數據,要么沒有足夠的準確信息。”
在像愛彼迎這樣的網站上,“看不見”并非必然對你不利?!拔覀儗ふ业氖琴H損信息,缺乏信息并不會對你產生不良影響。”夏皮羅說。
在這個我們點幾下手機就能找個人來解決煤氣泄漏,或者開車送你回家,或者約會的世界中,線上信用值勢必將變得更快捷、智能及普及。比如說,起初在交友軟件Tinder上尋找約會對象時,人們會感到一絲不安,甚至覺得有些危險,但這種交友理念很快變得稀松平常。
科技能否徹底消除我們與陌生人打交道的風險?
絕對不可能!UrbanSitter的帕金斯說道。人類是復雜的道德生物,評判一個人時徹底將第一印象摒除是愚不可及之事?!叭绻粋€保姆站在你面前,你感到不放心,那么不管她是否通過了審查,不管她收到的評價有多高,也不管在網絡上你對她有何印象,你都會聽從直覺,不雇傭這個保姆?!?/p>
[譯自英國《衛(wèi)報》]