張勇
作為全球用戶規(guī)模最大的社交應(yīng)用,F(xiàn)acebook月活躍用戶數(shù)已經(jīng)超過(guò)20億,因此一旦Facebook出現(xiàn)大規(guī)模的數(shù)據(jù)問(wèn)題,必定會(huì)引發(fā)軒然大波,尤其是在高度重視隱私問(wèn)題的美國(guó)。5 000萬(wàn)用戶信息被第三方公司Cambridge Analytica用于大數(shù)據(jù)分析,根據(jù)用戶的興趣特點(diǎn)、行為動(dòng)態(tài)精準(zhǔn)投放廣告和資訊內(nèi)容,甚至被懷疑利用數(shù)據(jù)預(yù)測(cè)用戶政治傾向,成為間接影響總統(tǒng)大選的隱形黑手。
上一個(gè)被懷疑干擾美國(guó)總統(tǒng)大選的是俄羅斯,結(jié)果大家都看到了,美國(guó)政府全面封殺卡巴斯基軟件服務(wù)。同時(shí),偶爾的全球黑客攻擊事件矛頭也往往指向俄羅斯。
而Facebook這5 000萬(wàn)用戶的數(shù)據(jù)是什么概念,就是接近Facebook美國(guó)活躍用戶總數(shù)的三分之一,美國(guó)選民人數(shù)的四分之一。更可怕的是,大數(shù)據(jù)分析之后美國(guó)民眾究竟還剩下多少隱私?
這份龐大數(shù)據(jù)的根源,則是由一位科學(xué)家Aleksandr Kogan開(kāi)發(fā)的一個(gè)Facebook個(gè)人測(cè)試應(yīng)用收集的。當(dāng)Facebook用戶參加測(cè)試時(shí),他們都會(huì)允許訪問(wèn)自己的數(shù)據(jù),包括姓名、地點(diǎn)、年齡和性別等人口統(tǒng)計(jì)學(xué)信息,還包括“點(diǎn)贊”歷史,甚至一些Facebook好友的數(shù)據(jù)。整件事情還在繼續(xù)發(fā)酵,更多的內(nèi)容被挖掘出來(lái)。
大數(shù)據(jù)環(huán)境下智能推薦算法隱患
其實(shí)在這件事情爆發(fā)出來(lái)之前,筆者在知乎上看到一個(gè)內(nèi)容非常值得作為Facebook這件事的參考。問(wèn)題為《有沒(méi)有以前很火,現(xiàn)在發(fā)現(xiàn)很危險(xiǎn)的發(fā)明》,幾天前的一個(gè)回答發(fā)布后迅速獲得了一萬(wàn)多的贊同。答主直接點(diǎn)明:智能推薦算法。這個(gè)的危險(xiǎn)性遠(yuǎn)比很多人以為的大。其中有幾個(gè)例子非常有意思:
某些人常瀏覽某圈帖子,刷幾次客戶端后,就容易誤以為這圈子已經(jīng)成了網(wǎng)絡(luò)時(shí)代主流圈子了———事實(shí)上依舊小眾;
某些人總看黑某明星的帖子,刷幾次客戶端后,就容易誤以為這女星已經(jīng)人人喊打全民公敵就差貧病交加流落街頭了———事實(shí)上她依舊數(shù)錢(qián)到手軟;
某些人討論了幾次女權(quán)相關(guān)問(wèn)題,刷幾次客戶端后,就容易誤以為天下年輕男女都不想著過(guò)日子凈想著搞斗爭(zhēng)了———事實(shí)上依舊是過(guò)日子的人多;
某些人工作不順抱怨了幾個(gè)職場(chǎng)白領(lǐng)的問(wèn)題,刷幾次客戶端后,就容易誤以為當(dāng)前社會(huì)最普遍的艱辛就是職場(chǎng)青年的苦惱———事實(shí)上跟沒(méi)法被推送到你面前的人的艱辛比你那都不是事;
某些人沒(méi)事聊幾句皇漢蠻夷,刷幾次客戶端后,就容易誤以為這時(shí)代怎么那么多漢奸走狗,中華民族簡(jiǎn)直到了最危險(xiǎn)的時(shí)刻了———事實(shí)上真不是。
這其實(shí)是目前國(guó)內(nèi)各大個(gè)性化資訊APP、社交應(yīng)用、電商所采用的所謂“智能推薦算法”或者“個(gè)性化推薦算法”,這也是基于大數(shù)據(jù)分析的結(jié)果導(dǎo)向之一。
所謂的個(gè)性化推薦,大部分公司只道出了其好的一面,可以了解用戶興趣而推薦其想要看到的內(nèi)容。但也可能潛在意思是間接幫用戶選擇了他們將看到的內(nèi)容,而屏蔽掉了其他的內(nèi)容。所以,很可能出現(xiàn)一個(gè)非常極端的情況就是,當(dāng)你長(zhǎng)時(shí)間用幾款A(yù)PP之后,每次打開(kāi)你所看到的內(nèi)容基本上都是一樣的,這就形成了你每天所了解的全球時(shí)事,逐漸形成你所認(rèn)知的世界。
結(jié)合我們實(shí)際生活,很多人喜歡看微博熱搜榜,幾乎每個(gè)上榜的熱搜都會(huì)被數(shù)以萬(wàn)計(jì)的用戶討論,可能有那么一瞬間,讓你覺(jué)得微博熱搜榜上的事件就是今天的頭條。但其實(shí),微博能夠給人展示的信息圈依然非常有限。
如果再陰謀論一點(diǎn)的話,就如Facebook事件一樣,Cambridge Analytica利用所掌握的大量用戶數(shù)據(jù),對(duì)每個(gè)用戶進(jìn)行高度定制的內(nèi)容推送,不知不覺(jué)中逐漸影響其對(duì)某些事件的認(rèn)知,甚至影響他們?cè)诳偨y(tǒng)大選中的投票。
這樣一來(lái),所謂的大數(shù)據(jù)、智能推薦算法甚至能夠逐漸影響民眾價(jià)值觀,而且用戶根本無(wú)法察覺(jué)。
有個(gè)電影講述曾經(jīng)有一個(gè)叫楚門(mén)的人,從小生活在桃源島(其實(shí)是一個(gè)影視棚),看上去他的生活與常人無(wú)異,但是他不知道的是,每一秒都有上千部攝像機(jī)對(duì)著他,而他所有接觸到的人包括他的妻子、朋友都是只是演員,但只有他一個(gè)人不知道。這就是20年前由Jim Carrey主演的一部電影《楚門(mén)的世界》中的情節(jié)。
我們誰(shuí)也不想生活在楚門(mén)的世界,所遇到的事、認(rèn)識(shí)的人、看到的畫(huà)面都只是某種算法想讓我看到的部分,而我們自己卻以為是全部。當(dāng)然,筆者希望這只是自己的杞人憂天。
國(guó)內(nèi)社交平臺(tái)可能也存在類(lèi)似的信息安全隱患
放眼國(guó)內(nèi)互聯(lián)網(wǎng)現(xiàn)狀、微博、微信、今日頭條等,哪一個(gè)不是在社交或者資訊領(lǐng)域的“Facebook”,坐擁數(shù)以億計(jì)的用戶量,大數(shù)據(jù)應(yīng)用已經(jīng)深入到各大主流平臺(tái)。作為全球最大的社交平臺(tái),F(xiàn)acebook在管理用戶數(shù)據(jù)上尚且出現(xiàn)如此大的紕漏,利用一個(gè)小小的測(cè)試類(lèi)應(yīng)用就能夠獲取大量用戶真實(shí)信息。而在國(guó)內(nèi)的各大社交平臺(tái),依然充斥著各類(lèi)情感測(cè)試、性格測(cè)試、投票等小應(yīng)用,這一類(lèi)應(yīng)用究竟能夠獲取多少信息,我們似乎并不清楚。
除此之外,還有越來(lái)越多的網(wǎng)站、APP紛紛接入微信、QQ、微博登錄,第三方應(yīng)用也可以獲取社交賬號(hào)的用戶名、頭像等信息。突然想起來(lái)一句話“當(dāng)你接入互聯(lián)網(wǎng)的那一刻,也許你的隱私就失控了”,讓我們感受到害怕的不僅僅是兇獸惡徒,那些我們無(wú)法看見(jiàn)、無(wú)法控制的一些東西同樣能夠讓我們感到不安。