摘 要:數(shù)據(jù)正悄悄地成為我們一生中最寶貴的財(cái)富,根據(jù)麥肯錫全球研究院的預(yù)測(cè)2020年全世界將創(chuàng)造43兆GB的數(shù)據(jù),而此后每天估計(jì)有2.3兆GB的數(shù)據(jù)被創(chuàng)建。這些數(shù)據(jù)被收集、存儲(chǔ)和分析,將使得我們的生活得越來(lái)越智能化,未來(lái)將是一個(gè)完全智能化的世界。本文的主題是指出智能化的實(shí)際現(xiàn)狀并預(yù)測(cè)它將在未來(lái)的重要角色,首先我們將定義大數(shù)據(jù),數(shù)據(jù)分析和智能城市,其次分析它們將如何改變我們的生活方式,最后我們將討論即將出現(xiàn)的新技術(shù),以及它將如何窺探我們的隱私,進(jìn)而把我們變成技術(shù)的奴隸。
關(guān)鍵詞:大數(shù)據(jù),數(shù)據(jù)分析,智能城市,決策模型,隱私
一、引言
據(jù)國(guó)際電信聯(lián)盟2017年7月的統(tǒng)計(jì),當(dāng)今世界104個(gè)國(guó)家中15-24歲年齡段中80%以上的人使用網(wǎng)絡(luò),約有8.3億人,其中有39%的人是在中國(guó)和印度[1],而在1995年全球的網(wǎng)絡(luò)用戶(hù)比例尚不足1%。在Internet livestats網(wǎng)站上顯示現(xiàn)在1秒內(nèi)會(huì)產(chǎn)生——7751條推特,802張Instagram的照片,1284篇帖子,262萬(wàn)封電子郵件,互聯(lián)網(wǎng)流量每秒達(dá)到48.3TB!數(shù)據(jù)隨著我們生活方式的改變而大量產(chǎn)生,它讓各種服務(wù)越來(lái)越智能化,讓我們逐漸進(jìn)入智能城市的時(shí)代。
二、大數(shù)據(jù)
1、定義
大數(shù)據(jù)理論上講是一個(gè)尚未準(zhǔn)確定義的術(shù)語(yǔ),主要是因?yàn)槠洹按蟆钡暮x實(shí)在無(wú)法定義。十多年前,測(cè)量大數(shù)據(jù)的單位只是TB級(jí),而今天已經(jīng)達(dá)到PB級(jí),EB級(jí)也將不日來(lái)臨。Meta集團(tuán)的分析師Doug Laney曾在2001年發(fā)表了一篇研究報(bào)告,名為“三維數(shù)據(jù)管理:控制容量、速度和類(lèi)型?!彼褂昧恕?V”作為定義大數(shù)據(jù)的三個(gè)維度:容量、速度和類(lèi)型(Volume,Velocity,Variety)[2]:
容量:整個(gè)數(shù)據(jù)集所包含的信息數(shù)量和細(xì)節(jié)
速度:數(shù)據(jù)產(chǎn)生和變化的速率
類(lèi)型:現(xiàn)在已不單是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),如金融交易、證券交易、個(gè)人文件等,而更多是音頻、視頻、照片、位置信息、微博,傳感器數(shù)據(jù)等非結(jié)構(gòu)化的數(shù)據(jù)。
除3V之外,還有一些研究者在定義中添加了第四V:準(zhǔn)確性(Veracity),指數(shù)據(jù)完整性和構(gòu)建有效數(shù)據(jù)的能力,并且能有依據(jù)地使用它做出關(guān)鍵性決策。[3]
2、數(shù)據(jù)分析
數(shù)據(jù)分析是收集、存儲(chǔ)、提取、清洗、轉(zhuǎn)換、聚合和分析數(shù)據(jù)的科學(xué),目的是發(fā)現(xiàn)和創(chuàng)造有價(jià)值的信息。數(shù)據(jù)分析能利用有價(jià)值的信息建立預(yù)測(cè)模型、提供決策依據(jù),并不斷自我優(yōu)化,應(yīng)用于各領(lǐng)域,如科學(xué)、體育、廣告和公共衛(wèi)生等,隨企業(yè)的數(shù)據(jù)管理系統(tǒng),以及其他各硬件、軟件和應(yīng)用程序的發(fā)展而不斷進(jìn)步?,F(xiàn)大多數(shù)公司都已意識(shí)到,為了提高生產(chǎn)力和競(jìng)爭(zhēng)力,不可避免地需要數(shù)據(jù)和分析。麥肯錫董事蒂姆·麥奎爾曾表示:“數(shù)據(jù)分析將決定輸家和贏家之間的區(qū)別?!盵4]
三、智能城市
信息和通信技術(shù)的進(jìn)步使我們的生活方式發(fā)生了巨大變化,智能城市的時(shí)代也已加速到來(lái)?,F(xiàn)在人們已利用分布在城市里的各大傳感器網(wǎng)絡(luò)獲取各種數(shù)據(jù),并使用數(shù)據(jù)的智能化滿足我們的需求。以美國(guó)費(fèi)城為例,在垃圾桶內(nèi)安裝傳感器,感知桶內(nèi)是否裝滿,進(jìn)而調(diào)整垃圾桶的收集數(shù)量以節(jié)約城市成本。從這個(gè)例子中可以看到,在智能城市中,數(shù)據(jù)首先會(huì)被傳送到處理中心,再用于分析和向外界提供信息,最終智能的為人們提供服務(wù),這就是智能城市的理想樣子。
四、問(wèn)題:智能服務(wù),我們將控制我們的選擇還是被控制?
在介紹了大數(shù)據(jù)和智能城市之后,本文將換個(gè)角度思考未來(lái),以分析問(wèn)題的全面性。為了獲得大數(shù)據(jù)智能化后的服務(wù)便利,我們將會(huì)付出什么樣的代價(jià)?大數(shù)據(jù)的崛起是否意味著隱私權(quán)的衰落?接下來(lái),本文將會(huì)說(shuō)明未來(lái)的“智能”服務(wù)將會(huì)如何使用有關(guān)個(gè)人的大數(shù)據(jù),如何麻木我們的神經(jīng),甚至控制我們的思維。
人本身就是一個(gè)大數(shù)據(jù)集,如履歷資料,生物數(shù)據(jù)(臉,指紋,虹膜…),旅游數(shù)據(jù)和銀行信息等。不僅政府一直在收集個(gè)人數(shù)據(jù),一些商業(yè)公司、IT公司、甚至小型業(yè)余網(wǎng)站也喜歡存儲(chǔ)用戶(hù)的web數(shù)據(jù)。在大數(shù)據(jù)智能化服務(wù)的時(shí)代,跟蹤記錄網(wǎng)頁(yè)瀏覽、社交活動(dòng)、購(gòu)買(mǎi)記錄、位置定位,再將這些私人信息通過(guò)智能手機(jī)的傳送以及機(jī)構(gòu)的窺探結(jié)合在一起,就能挖掘出我們無(wú)法想象的信息量。
《紐約客》在1993年7月刊登了一篇漫畫(huà),一只狗坐在電腦前的椅子上,爪子在鍵盤(pán)上,然后對(duì)它的同伴說(shuō):“在互聯(lián)網(wǎng)上,沒(méi)有人知道你是一只狗。”但是現(xiàn)在,人們已經(jīng)不僅能知道你是一只狗,還很了解你皮毛的顏色,你多久會(huì)去看獸醫(yī),你最喜歡的食物是什么。網(wǎng)頁(yè)瀏覽其實(shí)是無(wú)法保護(hù)隱私的,例如在線跟蹤技術(shù)就可以確認(rèn)誰(shuí)坐在電腦屏幕前,他的興趣和愛(ài)好是什么。還有一種更先進(jìn)的在線跟蹤技術(shù)——設(shè)備指紋識(shí)別技術(shù),它甚至可以在用戶(hù)配置瀏覽器避免被跟蹤的情況下仍能監(jiān)視用戶(hù),收集和識(shí)別用戶(hù)的私人信息。
我們手機(jī)上的應(yīng)用程序可以很自然的訪問(wèn)我們的大多數(shù)個(gè)人信息,如聯(lián)系人、日歷、短信、電話記錄、媒體文件、電話號(hào)碼、設(shè)備id、位置等,以及獲得對(duì)設(shè)備(如照相機(jī)和麥克風(fēng))的控制。我們?cè)谟幸鉄o(wú)意間就自愿給這些應(yīng)用程序提供訪問(wèn)權(quán)限,但我們很可能根本沒(méi)有意識(shí)到,只是在安裝按鈕上輕輕一點(diǎn),我們的信息即有可能開(kāi)始泄露了。即使是那些被認(rèn)為可以安全地存儲(chǔ)在webmail供應(yīng)商數(shù)據(jù)庫(kù)中的電子郵件其實(shí)都已被解析過(guò),以谷歌為例,谷歌向其用戶(hù)推送的廣告都是基于用戶(hù)電子郵件的內(nèi)容。
社交媒體實(shí)際上也是數(shù)據(jù)的搜集者,很多社交平臺(tái)都是人們分享生活的媒介,但在這其中,唯一暴露出來(lái)的并不只是用戶(hù)身份,從深度層面上觀察用戶(hù)的習(xí)慣、活動(dòng)、社會(huì)行為和傾向等信息,這些被收集起來(lái)的私人信息完全可以形成足夠多的個(gè)人隱私資料,而這并不管用戶(hù)是否愿意或知情。維基解密的主編朱利安?阿桑奇在2011年接受俄羅斯國(guó)家衛(wèi)星頻道采訪時(shí)將臉書(shū)稱(chēng)為“令人震驚的間諜機(jī)器”,“在這里,我們擁有世界上最全面的有關(guān)人及其姓名、住址、彼此通信、親屬乃至人際關(guān)系的數(shù)據(jù)庫(kù),這些數(shù)據(jù)全都可被美國(guó)情報(bào)機(jī)關(guān)獲得?!眅ndprint
隨著越來(lái)越多的用戶(hù)上網(wǎng),收集到的海量私人數(shù)據(jù)就成為了一個(gè)金礦!想象一下當(dāng)你知道某人的一切,當(dāng)他所有的弱點(diǎn)和優(yōu)點(diǎn)都暴露出來(lái)時(shí),他會(huì)變得多么脆弱和容易控制。而現(xiàn)在這些無(wú)價(jià)的數(shù)據(jù)正在被挖掘、分析和用于不同的目的或智能服務(wù),以智能電子商務(wù)和搜索為例:
智能商務(wù)
現(xiàn)在市面上的各種推薦系統(tǒng)、客戶(hù)行為分析等系統(tǒng)有針對(duì)性的營(yíng)銷(xiāo)將用戶(hù)轉(zhuǎn)變?yōu)榭蛻?hù)。這些技術(shù)分析用戶(hù)的偏好、個(gè)性、習(xí)慣等,再利用這些信息改進(jìn)市場(chǎng)營(yíng)銷(xiāo)和廣告商務(wù)??赡苡腥藭?huì)說(shuō),更好的用戶(hù)體驗(yàn)可以幫助人們輕松找到他們想要的東西,雖然這有好的一面,但也很可能變成更壞的事,當(dāng)大量的私人數(shù)據(jù)被分析,“智能的”用于控制用戶(hù)的選擇,慫恿、強(qiáng)迫用戶(hù)盡可能的去購(gòu)買(mǎi)需要或不需要的東西,培養(yǎng)用戶(hù)成消費(fèi)狂,公司的業(yè)績(jī)是上去了,但用戶(hù)是自由的還是被操縱的?
智能搜索
谷歌強(qiáng)大的搜索引擎早已為我們“定制”了個(gè)性化搜索結(jié)果。假設(shè)你我同時(shí)搜索某樣相同東西時(shí),我們也可能會(huì)得到不同的搜索結(jié)果。一名工程師曾說(shuō),即使你退出了搜索,也會(huì)有57項(xiàng)信息被谷歌監(jiān)視——從你使用的電腦到你在哪使用的瀏覽器——都會(huì)用來(lái)調(diào)整你的搜索結(jié)果。正如谷歌董事長(zhǎng)埃里克?施密特所言:“人們很難觀看或消費(fèi)那些在某種意義上沒(méi)有為他們量身定制的東西。”現(xiàn)在我們被一個(gè)個(gè)過(guò)濾算法包圍著,它們決定何時(shí)何事對(duì)我們顯示或隱藏,讓我們保持對(duì)其他觀點(diǎn)的距離,只讓我們看到它們提供的“現(xiàn)實(shí)世界”。
《鷹眼》是2008年上映的科幻電影,里面有一臺(tái)由美國(guó)國(guó)防部設(shè)計(jì)的超級(jí)計(jì)算機(jī),能自動(dòng)實(shí)時(shí)采集、結(jié)構(gòu)化和非結(jié)構(gòu)化整個(gè)世界的數(shù)據(jù),幾乎能控制所有電子系統(tǒng)和自動(dòng)化設(shè)備。這已經(jīng)非常適合如今大數(shù)據(jù)分析系統(tǒng)和智能城市的定義描述,但是在電影中,超級(jí)計(jì)算機(jī)已經(jīng)有了自己的思維,可以采取自己的行動(dòng),決定誰(shuí)必須死,誰(shuí)可以活,我們現(xiàn)在是否也正朝著這個(gè)方向努力前進(jìn)?
五、結(jié)束語(yǔ)
雖然大數(shù)據(jù)有重要價(jià)值,但它也給我們的個(gè)人安全帶來(lái)重大風(fēng)險(xiǎn),不管我們喜歡與否,我們的個(gè)人數(shù)據(jù)是我們?nèi)粘I畹母碑a(chǎn)品。網(wǎng)上購(gòu)物,車(chē)牌監(jiān)拍,社交發(fā)布,這些產(chǎn)生的數(shù)據(jù)信息其實(shí)早已把我們的生活展現(xiàn)給了任何人,只不過(guò)很多時(shí)候沒(méi)有被那些別有用心的人所利用。因此,我們需要考慮的是:當(dāng)我們使用新的應(yīng)用程序和移動(dòng)設(shè)備時(shí),我們的隱私和安全會(huì)有多少風(fēng)險(xiǎn)?下次安裝東西時(shí),權(quán)限設(shè)置是否會(huì)出賣(mài)我們的私人信息?現(xiàn)在數(shù)據(jù)已不再僅僅是數(shù)據(jù),它已經(jīng)是一種可以被公司、政府和個(gè)人買(mǎi)賣(mài)的商品!
最后,本文一方面呼吁消費(fèi)者既該意識(shí)到自己的私人數(shù)據(jù)是如何被收集、利用,反過(guò)來(lái)約束他們自由的,也該意識(shí)到應(yīng)該由自己決定對(duì)個(gè)人數(shù)據(jù)分享的“度”。另一方面,也希望科技公司能負(fù)責(zé)任的既讓城市變得聰明,也能在實(shí)踐中尊重個(gè)人隱私,并給消費(fèi)者選擇的自由!
總之,當(dāng)民主社會(huì)中的權(quán)利和自由得到遵守和保護(hù)時(shí),好處才會(huì)遠(yuǎn)遠(yuǎn)大于風(fēng)險(xiǎn)。智能城市雖好,但代價(jià)不能是自由。
參考文獻(xiàn):
[1]ICT Facts and Figures 2017.Brahima Sanou&ITU-D.2017
[2]Deja VVVu: Others Claiming Gartners Construct for Big Data. Doug Laney. 2001
[3]What is Big Data.Villanova University. 2014
[4]Making data analytics work: Three key challenges. McKinsey & Company. 2013
作者簡(jiǎn)介
孫楊昕 北京對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)統(tǒng)計(jì)學(xué)院在職人員高級(jí)課程 研修班學(xué)員 100043endprint