我們生活在一個(gè)“信息時(shí)代”,而且“信息”正在“爆炸”。談到信息爆炸的程度,美國(guó)人多愛引用西奧多·羅斯扎克(Theodore Roszak)《信息崇拜》(TheCult of Information)一書里的例子。羅斯扎克說,現(xiàn)在,一份《紐約時(shí)報(bào)》所含的信息量比17世紀(jì)一個(gè)普通英國(guó)人一生當(dāng)中所接觸的信息還要多。
2009年12月9日,加州大學(xué)圣地亞哥分校的“全球信息產(chǎn)業(yè)研究中心”(Global Information Industry Center)發(fā)布了一份研究報(bào)告《信息2009》(HowMuch Information2009),統(tǒng)計(jì)2008年美國(guó)家庭的信息消費(fèi)。這份研究報(bào)告所說的信息,是指“傳送給個(gè)人、供個(gè)人使用的信息”,不包括人們上班時(shí)消費(fèi)的信息。研究的數(shù)據(jù)取自20種不同的渠道,從傳統(tǒng)的書籍報(bào)刊到新興的手機(jī)游戲到衛(wèi)星廣播和網(wǎng)絡(luò)視頻。研究人員用三個(gè)標(biāo)準(zhǔn)來(lái)衡量大眾的信息消費(fèi):小時(shí)、字?jǐn)?shù)和字節(jié)。
2008年,按消費(fèi)時(shí)間算,美國(guó)家庭消費(fèi)信息的時(shí)間總數(shù)為1.3兆小時(shí),平均每人每天消費(fèi)信息12個(gè)小時(shí)(這里說的信息消費(fèi)包括讀書、上網(wǎng)、玩手機(jī)游戲、聽收音機(jī)、看網(wǎng)絡(luò)視頻等)。若按字節(jié)和字?jǐn)?shù)算,2008年美國(guó)家庭總共消費(fèi)了3.6個(gè)皆字節(jié)(Zettabyte)的信息,10845萬(wàn)億個(gè)字,平均下來(lái)。每人每天消費(fèi)34個(gè)吉字節(jié),10萬(wàn)個(gè)字(列夫·托爾斯泰的《戰(zhàn)爭(zhēng)與和平》英文版有46萬(wàn)字)。
在二進(jìn)制里,數(shù)字信息的傳輸和存儲(chǔ)的基本單位是比特(bit)和字節(jié)(byte)。一個(gè)比特的信息是0或1,一個(gè)英文字母大約是5個(gè)比特,一個(gè)字節(jié)是8個(gè)比特。衡量數(shù)字信息的其他單位還有: 千字節(jié)(Kilobyte,KB),一個(gè)千字節(jié)=1024個(gè)字節(jié)。一頁(yè)打印紙的內(nèi)容相當(dāng)于2個(gè)千字節(jié),一幅低清晰度照片有100個(gè)千字節(jié)。
兆字節(jié)(Megabyte,MB),一個(gè)兆字節(jié)=106字節(jié)。通常,一本書數(shù)字化以后,容量是一個(gè)兆字節(jié),一幅高清晰度照片有2個(gè)兆字節(jié),一部英文版莎士比亞全集有5個(gè)兆字節(jié),一張光盤有500個(gè)兆字節(jié)。
吉字節(jié)(Gigabyte,GB),一個(gè)吉字節(jié)109字節(jié)。一個(gè)吉字節(jié)的圖書可以裝滿一部小型卡車,100個(gè)吉字節(jié)的學(xué)術(shù)期刊可以裝滿一層圖書館。
太字節(jié)(Terabyte,TB),一個(gè)太字節(jié):1012字節(jié)。5萬(wàn)棵樹制成紙,印上字,是一個(gè)太字節(jié)。一個(gè)學(xué)術(shù)圖書館的全部館藏相當(dāng)于2個(gè)太字節(jié)。世界最大的圖書館是美國(guó)國(guó)會(huì)圖書館,那兒所有的印刷品達(dá)10個(gè)太字節(jié)。
拍字節(jié)(Petabyte,PB),一個(gè)拍字節(jié)=1015字節(jié)。美國(guó)所有學(xué)術(shù)圖書館館藏的總和是2個(gè)拍字節(jié)。
艾字節(jié)(Exabyte,EB),一個(gè)艾字節(jié)=1018字節(jié)。人類有史以來(lái)說出的全部口頭語(yǔ)言為5個(gè)艾字節(jié)。世界所有人的基因是6個(gè)艾字節(jié)。
皆字節(jié)(Zettabyte,ZB),一個(gè)皆字節(jié)=1021字節(jié)。
2002年,全球一共生產(chǎn)了5個(gè)艾字節(jié)的信息,比1999年增加了一倍。如果通過電視來(lái)播放5個(gè)艾字節(jié)的信息,一個(gè)人要坐在屏幕前觀看40700年。
那么3.6個(gè)皆字節(jié)有多大呢?根據(jù)《信息2009》,如果將3.6個(gè)皆字節(jié)的文字印成圖書,像磚一樣壘起來(lái),它們將覆蓋全美國(guó)(包括阿拉斯加),書堆的高度達(dá)7英尺。
全球有多少信息呢?2005年10月8日,在美國(guó)全國(guó)廣告商協(xié)會(huì)年會(huì)上,谷歌總裁埃里克·施密特(Eric Schmidt)說,根據(jù)一項(xiàng)研究報(bào)告,世界上的信息總量是500萬(wàn)個(gè)太字節(jié)(Terabyte),但是,其中已經(jīng)被編好索引、可供網(wǎng)絡(luò)搜索的信息僅有170個(gè)太字節(jié)。有人問,谷歌以提供信息搜索為己任,那么要多長(zhǎng)時(shí)間,谷歌才能為全球500萬(wàn)太字節(jié)的信息編完索引,供人搜索?施密特回答,根據(jù)谷歌內(nèi)部的估計(jì),大約要花300年的時(shí)間。
2007年2月7日,在凱洛格技術(shù)大會(huì)(KeUogg Technology Conference)上,有人問谷歌負(fù)責(zé)產(chǎn)品搜索的副總裁瑪麗莎·梅耶(Marissa Mayer),谷歌已經(jīng)為多少信息編制了索引?梅耶說大約已經(jīng)完成了500個(gè)太字節(jié)。也就是說,谷歌已經(jīng)為全球0.01%的信息編制了索引。這個(gè)數(shù)字與16個(gè)月前施密特所說的170個(gè)太字節(jié)相比,多了330個(gè)太字節(jié),增幅為194%。有人計(jì)算,如果谷歌能一直保持這個(gè)增速,那么只需28年,谷歌即可為全球500萬(wàn)太字節(jié)的信息編制索引。
說到信息,離不開圖書。世上圖書又有多少?谷歌“圖書原數(shù)據(jù)小組”(Google Books metadata team)負(fù)責(zé)人喬恩·沃萬(wàn)特(Jon Orwant)透露,根據(jù)谷歌的統(tǒng)計(jì),截至2009年8月28日,世界上的圖書一共有1.68億種(精確地說,有168178719種)。
中文信息有多少呢?筆者還未看到有關(guān)的統(tǒng)計(jì),但是,2009年10月21日,在高德納咨詢公司(Gartner)主辦的一次電子技術(shù)研討會(huì)上,谷歌總裁施密特預(yù)計(jì),5年后,中文的內(nèi)容將在互聯(lián)網(wǎng)上占統(tǒng)治地位。
(本文作者系紐約佩斯大學(xué)出版系兼職教授,本刊特約撰稿人)