陳婧
眼前是231塊LED屏幕,每隔幾秒,每塊屏幕上都會(huì)閃現(xiàn)不同的詞語或句子的片段,“女孩”、“有翅膀的天使”,“墨西哥人”這些不著四六的文字,其實(shí)是從在線聊天工具、在線開放式論壇上交談的10多萬名用戶的信息中截取的數(shù)據(jù)片段。可要注意的是,這些文字并不是滯后才“發(fā)布”的,幾秒前你剛剛敲落在鍵盤上的文字,這個(gè)時(shí)候已經(jīng)出現(xiàn)在了這一塊塊小小的屏幕之上。
你的耳邊還會(huì)得到提示,因?yàn)檫@些文字正在通過機(jī)器合成的聲音進(jìn)行自動(dòng)播報(bào)。不要以為這是個(gè)隨機(jī)現(xiàn)象,其實(shí)231塊屏幕的背后蘊(yùn)含著至少6組統(tǒng)計(jì)規(guī)律。只有在符合特定的篩選機(jī)制后,計(jì)算機(jī)軟件才會(huì)實(shí)時(shí)地從不規(guī)則的數(shù)據(jù)中,抓取出需要顯示的信息。當(dāng)機(jī)器相繼播報(bào)出這些符合篩選規(guī)律的句子時(shí),就已經(jīng)幾乎成為了一種讓人可以安靜下來“白噪音”,讓你可以坐在那里幾個(gè)小時(shí),只為了仔細(xì)聆聽這些句子表達(dá)出的內(nèi)容。有意思的是,這些機(jī)器的聲音聽起來很遙遠(yuǎn),很失真,像來自于另一個(gè)外星空間的電波,被重新發(fā)射回到了地球上。
這件名叫《監(jiān)聽站》的作品,雖然問世時(shí)間不久,卻已然成為了當(dāng)代藝術(shù)的經(jīng)典,在包括倫敦科學(xué)博物館、巴黎維萊特科技館、美國圣何塞藝術(shù)博物館等多地巡回展出,并奪得奧地利林茨電子藝術(shù)大獎(jiǎng)。創(chuàng)作這件作品的作者,是美國加州大學(xué)洛杉磯分校的統(tǒng)計(jì)學(xué)教授馬可·漢森(Mark Hanson)和來自紐約的多媒體藝術(shù)家本恩·魯賓 (Ben Rubin)。漢森用一個(gè)數(shù)學(xué)家的方式,從數(shù)據(jù)篩選的角度,解讀了由人構(gòu)成的“互聯(lián)”世界和他們的行為變化,讓數(shù)據(jù)做到了“可讀”;魯賓和漢森一起,讓更多的聽眾可以“收聽”數(shù)據(jù)的分析結(jié)果。
《監(jiān)聽站》與傳統(tǒng)的對(duì)數(shù)據(jù)進(jìn)行視覺轉(zhuǎn)化的最大不同之處,在于其并非依靠現(xiàn)有的資料或嵌入式的運(yùn)行環(huán)境,而是展示了一個(gè)需要對(duì)數(shù)據(jù)進(jìn)行即時(shí)響應(yīng)的動(dòng)態(tài)環(huán)境,從數(shù)以十萬計(jì)的創(chuàng)作者中,運(yùn)用統(tǒng)計(jì)學(xué)和數(shù)據(jù)模型,去發(fā)現(xiàn)、獲得有意義的輸出。雖然采用的方法是“竊聽”和“偷窺”,但這種方式本身也顯得“人性化”,就像在偷看好友鎖在抽屜里的一本日記,或是偶然忍不住去看朋友手機(jī)里儲(chǔ)存著的短消息。
每時(shí)每刻,我們都在線上遇到朋友、交換新聞、交互信息或是分享想法。這些數(shù)量為天文級(jí)的、碎片式的信息經(jīng)過數(shù)據(jù)的重組、排列和篩選之后,就不再只作為公共空間里的數(shù)據(jù)而存在,而是呈現(xiàn)了人與人之間相互連接的一種行為模式。而且,數(shù)據(jù)可視化呈現(xiàn)出的效果,讓我們得以擺脫社交活動(dòng)的表象而進(jìn)入到更深層次:我們的意見、想法、希望、理性,都可以從這些互聯(lián)網(wǎng)上實(shí)時(shí)截取的文字段落中得到表達(dá),重新歸類,最終再通過機(jī)器復(fù)讀的形式得到強(qiáng)化。對(duì)數(shù)據(jù)的重新演繹,讓互聯(lián)網(wǎng)上零散的、碎片化的信息獲得了真正的意義和價(jià)值。
大數(shù)據(jù)時(shí)代,各個(gè)跨行業(yè)的公司都在千方百計(jì)地匯總數(shù)據(jù)來精確定位數(shù)字、趨勢和模式。但隨著數(shù)據(jù)環(huán)境變得越來越復(fù)雜和繁瑣,也向管理這些數(shù)據(jù)并提取數(shù)據(jù)價(jià)值的組織提出了一個(gè)挑戰(zhàn):怎么樣才能以更加巧妙的方式截取數(shù)據(jù),并讓這些碎片化的互動(dòng)式數(shù)據(jù)獲得價(jià)值?交互式大數(shù)據(jù)的可視化與可分析化還停留在較為初步的階段,怎么樣可以打開這道未知的大門,讓更多的即時(shí)數(shù)據(jù)的價(jià)值被發(fā)現(xiàn)?就這些話題,記者采訪了漢森,與他一起交流在大數(shù)據(jù)時(shí)代,怎么樣從即時(shí)數(shù)據(jù)背后去挖掘人類行為上的差異性與共性,如何在保留個(gè)性化的前提下,去優(yōu)化交互式數(shù)據(jù)的可視化傳播。
Q:你們?cè)趺磿?huì)想到去截取互聯(lián)網(wǎng)上的即時(shí)信息作為輸入端的數(shù)據(jù)呢?
A:我曾經(jīng)在貝爾實(shí)驗(yàn)室的研發(fā)部門工作,在那里我開始關(guān)注到統(tǒng)計(jì)學(xué)與藝術(shù)之間的交互,并意識(shí)到這會(huì)成為一件非常有意思的事情。當(dāng)時(shí)我們的想法很簡單,就是想知道假如10萬人同時(shí)在線互動(dòng)聊天,在這個(gè)過程中到底發(fā)生了些什么,于是就有了《監(jiān)聽站》。在互聯(lián)網(wǎng)上,有成千上萬的不設(shè)限制的站點(diǎn),都可以讓計(jì)算機(jī)進(jìn)行即時(shí)搜索,從發(fā)帖、留言,再到用戶間的對(duì)話。當(dāng)這些文字匯入到數(shù)據(jù)庫中,將數(shù)據(jù)重新定義、排序、篩選并經(jīng)過系統(tǒng)的分析之后,數(shù)據(jù)分析的結(jié)果就會(huì)給我們講很多故事。比如《監(jiān)聽站》很像是在寫人物傳記,每個(gè)人都在說著自己的故事。它也可以成為歷史故事:當(dāng)你把《紐約時(shí)報(bào)》創(chuàng)刊100多年來的讀者評(píng)價(jià)作一次系統(tǒng)的分析,或者當(dāng)你把圖書館里所有的書籍來個(gè)數(shù)據(jù)匯總,就會(huì)有這么一個(gè)效果。
Q:這讓我們想到美國著名作曲家、音樂家約翰·凱奇創(chuàng)作的那些即興音樂,他從電臺(tái)播放的音樂中隨機(jī)選出音樂片段和歌詞,然后進(jìn)行重新創(chuàng)作。
A:和約翰·凱奇一樣,我想這都是另一種“偷窺”世界的方式。在音樂的歌詞中,你會(huì)聽到歌手對(duì)這個(gè)世界的抱怨或是贊美,憤怒或是喜悅。而在即時(shí)的對(duì)話中,你會(huì)聽到大家對(duì)這個(gè)世界的真實(shí)想法,這些想法之間可能是針鋒相對(duì)的,但都是由他們自己表達(dá)出來的,所以你聽到的是他們發(fā)自內(nèi)心的聲音,比如對(duì)美國出兵作戰(zhàn)的想法,對(duì)佛羅里達(dá)南部發(fā)生颶風(fēng)的想法,對(duì)俄羅斯發(fā)生人質(zhì)綁架案的想法等等,盡管這件作品本身是不存在特定立場的。你可以聽到的還有他們最真實(shí)的自我,“我喜歡藍(lán)色”、“我喜歡咖啡”、“我喜歡貓”,都是不用去遮掩或怯于表達(dá)的,不管是虛構(gòu)的或是真實(shí)的。
Q:從數(shù)據(jù)池篩選數(shù)據(jù)的過程中,你設(shè)定它們應(yīng)當(dāng)滿足哪些規(guī)律?
A:我設(shè)計(jì)了6組場景,背后應(yīng)用了不同的統(tǒng)計(jì)規(guī)律,分組并滾動(dòng)式地出現(xiàn)在231塊屏幕上。比如有一組場景,都以“我是”開頭,計(jì)算機(jī)會(huì)從龐大的“數(shù)據(jù)池”中篩選到符合這一類場景的信息,截取關(guān)于性別、國籍、政治傾向等自我介紹的語句,然后輸出到屏幕上:舉個(gè)例子來說,“我是澳大利亞人”,“我很性感但不成熟”,“我在為我的兒子做飯”。還有的以“我喜歡”、“我來自”等等作為句首,都應(yīng)對(duì)了不同的統(tǒng)計(jì)學(xué)運(yùn)算模型。我還和魯賓一起研究了將文字轉(zhuǎn)化成聲音的軟件,最后讓3臺(tái)計(jì)算機(jī)可以同時(shí)截獲互聯(lián)網(wǎng)上的內(nèi)容并進(jìn)行朗讀。事實(shí)上,因?yàn)槲覀兘厝?shù)據(jù)的實(shí)時(shí)樣本來自超過10萬人,這要求對(duì)詞匯篩選的速度比瀑布飛濺還要快。
Q:屏幕上展示的詞匯,僅僅是為了表達(dá)他們的多元化和個(gè)性么?
A:當(dāng)用戶使用聊天工具或者進(jìn)入論壇時(shí),他就進(jìn)入了“與他人交往”的狀態(tài)。在鍵盤前敲擊的時(shí)候,他才真正進(jìn)入到了那個(gè)“社區(qū)”,他會(huì)在對(duì)話中感受到差異,也感受到那種交互。他的輸入,因此也成為了另一種形式的輸出。但“社交”的狀態(tài)并不代表他的個(gè)性非常擅長這些,相反,他可能正處于孤獨(dú)、隔絕中。所以在這一塊塊屏幕上,他們內(nèi)心真正的孤獨(dú),變得可以聽得到、可以見得到、也可以感受得到。在個(gè)性化的表達(dá)中,你會(huì)從中發(fā)現(xiàn)更多共性的存在,就是那種對(duì)心貼心交流的那種渴望,對(duì)人與人之間充滿人情味互動(dòng)的渴望。
Q:有人說這件作品最成功的地方,在于把作曲家一直想做但沒有做到的事情,把普通生活化的語言,變成了一種可視聽的藝術(shù)。
A:讓即時(shí)的、動(dòng)態(tài)的數(shù)據(jù)變得可視化的同時(shí)又很藝術(shù),是很多人都在追求的東西。但其實(shí)這和傳統(tǒng)的繪畫藝術(shù)很像,你要學(xué)會(huì)去把握局部和整體之間的關(guān)系,局部的東西是在描寫細(xì)節(jié),但畫面作為一個(gè)整體就要能夠去包容,很抽象、很概括。在我看來還有一點(diǎn)非常重要,你要學(xué)會(huì)去銜接“閱讀”和“觀看”之間的通道,這兩者雖然都是用眼睛在看,但并不是等同的。舉個(gè)例子來說,有一副基督的畫像,遠(yuǎn)觀的時(shí)候就是耶穌的頭像,但實(shí)際上它由600幅圖像拼湊而成,每一幅圖像本身也是可以供閱讀的,是用希伯來語和阿拉姆語在紙草、皮革上寫成的死海手卷。
Q:要實(shí)現(xiàn)大數(shù)據(jù)可視化的最優(yōu),您認(rèn)為哪些因素是非常重要的?
A:我最近在和紐約的藝術(shù)家耶·索普一起從事社交媒體的可視化項(xiàng)目,比如Twitter的可視化。大數(shù)據(jù)的可視化最大的不同之處在于,對(duì)實(shí)時(shí)響應(yīng)的要求非常高,就像汽車的儀表盤,必須能夠反映當(dāng)下的、動(dòng)態(tài)的數(shù)據(jù);同時(shí)不僅僅讓你看到你的網(wǎng)絡(luò)里哪些人,而且要能夠把握對(duì)你的用戶來說,哪些分享和他們之間是更加有關(guān)聯(lián)的。大數(shù)據(jù)的可視化最不能忽視的關(guān)鍵的一點(diǎn),在我看來,是尊重?cái)?shù)據(jù)表達(dá)的個(gè)性化需求。我們不能讓所有的數(shù)據(jù)都用看起來一模一樣的方法去呈現(xiàn),否則就是一種非常懶惰的做法,一組數(shù)據(jù)和另一組數(shù)據(jù)之間的表達(dá)往往是存在差異的,我們需要去找到最漂亮的那種方式。
Q:在您看來,大數(shù)據(jù)的可視化可以發(fā)揮哪些社會(huì)價(jià)值?
A:我們每天都在產(chǎn)生數(shù)據(jù),每天都在消費(fèi)數(shù)據(jù),數(shù)據(jù)已經(jīng)變成我們?nèi)粘I畹囊徊糠?。然而我們并沒有從文化上完全認(rèn)識(shí)到這種轉(zhuǎn)變,這種轉(zhuǎn)變意味著什么,這樣的轉(zhuǎn)變會(huì)帶來什么。
從藝術(shù)的角度來看,大數(shù)據(jù)的可視化可以起到讓數(shù)據(jù)更加“人性化”的作用,從而幫助人們認(rèn)識(shí)到這樣的轉(zhuǎn)變已經(jīng)發(fā)生,而且可以變得更加美好?;蛟S,這一切的終極目的就是讓數(shù)據(jù)變得更加實(shí)用。我會(huì)希望數(shù)據(jù)和人性化之間有更多的對(duì)話,理性與感性之間可以達(dá)到更完美的平衡。