譚躍
我曾讀到這樣一個(gè)觀點(diǎn),數(shù)據(jù)化將使世界一切皆可量化。一切,當(dāng)然也包含出版。這個(gè)觀點(diǎn)指出,過去年代的重點(diǎn)是在技術(shù);而現(xiàn)在,人們聚焦在信息,也就是數(shù)據(jù)(Data)。Data的拉丁文本意是已知,是存在過的現(xiàn)實(shí)。
那么,數(shù)據(jù)化與數(shù)字化是什么樣關(guān)系呢?學(xué)術(shù)上有很多表述。我認(rèn)為,在二進(jìn)制的數(shù)字條件下,數(shù)據(jù)又做了進(jìn)一步開拓,讓它更加實(shí)用,更加能夠運(yùn)用到社會(huì)領(lǐng)域的方方面面。美國很多專家認(rèn)為,數(shù)據(jù)無處不在。
美國專家認(rèn)為,人類現(xiàn)在正進(jìn)入一個(gè)新的時(shí)代,這個(gè)時(shí)代的“數(shù)據(jù)”事實(shí)證明,世界的本質(zhì)不是原子,而是信息。也就是說,世界是由萬物組成的,過去我們對(duì)世界的認(rèn)知是基于萬物由原子構(gòu)成,而今專家們認(rèn)為萬物的基礎(chǔ)不是原子而是信息。這讓我想到了老子在《道德經(jīng)》中所講:“大道汜兮,其可左右。萬物恃之以生而不辭,功成而不有。衣養(yǎng)萬物而不為主,常無欲,可名于小。”不管是原子,還是數(shù)據(jù),都是從不同角度回答什么是道的問題。其實(shí),我們的祖先早在很多年前就已經(jīng)闡釋了它。道,就是原子形式的物質(zhì),數(shù)據(jù)形式的信息,不同領(lǐng)域的道表現(xiàn)不同,所以它無處不在。
任何事物都不是從天而降的,都有一個(gè)歷史演化過程,都能找到它的根。在中國,這個(gè)根就是中國古老的思想文化。我們知道,佛教上有一樁公案,講的是釋迦牟尼在一次佛眾大會(huì)上,拈起了一枝花,高高舉起,什么都不說,注視著全場。大家都不明白他的意思,面面相覷,只有他的大弟子迦葉破顏一笑。正是這一拈一笑,彼此心領(lǐng)神會(huì),后來釋迦牟尼就把衣缽傳給了迦葉。
這也是“拈花一笑”的出處。對(duì)此闡釋的學(xué)者很多,最有名的是南懷瑾先生。他與孔子的“一以貫之”聯(lián)系了起來??鬃痈诱f:“曾參啊,我的道是什么呢?吾道一以貫之?!边^去人們的理解是,講道的人做任何事情都要一以貫之。而南先生的理解是,道是一,因而要一以貫之。老子《道德經(jīng)》講:“道生一,一生二,二生三,三生萬物?!边@與我們前面講的“數(shù)據(jù)”是有聯(lián)系的,只是我們的先賢在當(dāng)時(shí)的條件下已經(jīng)以自身獨(dú)到的悟性作出了闡釋。隨后,孔子講完,曾子就說:“是,我知道了?!钡鹊娇鬃右蛔?,曾子的同門就問,“一以貫之”到底是什么意思呢?曾子說,“夫子之道,忠恕而已矣!”老師的道,只有忠恕而已矣。
孔子講的是“一以貫之”,而不是“二以貫之”,怎么用“忠恕”二字解呢?南懷瑾先生認(rèn)為,這就是陰陽,一就是二,二就是三,三就是萬物。這就是中國古老哲學(xué)中的大數(shù)據(jù)。一是一切的一,一是一的一切。還有什么大數(shù)據(jù)比“一”還大嗎?這就是古代哲學(xué)觀與現(xiàn)代大數(shù)據(jù)的聯(lián)系。
不只如此?!兑捉?jīng)》的三大原則——變易、簡易、不易,三大法則——象、數(shù)、理,也跟大數(shù)據(jù)的問題相關(guān)。象是現(xiàn)象,八卦就是8個(gè)現(xiàn)象掛在墻上,然后又演化成16卦、32卦和64卦,這些都是自然和社會(huì)的現(xiàn)象。大數(shù)據(jù)所描述的東西就是各個(gè)領(lǐng)域的現(xiàn)象。數(shù),是數(shù)據(jù)。理,也叫辭,是對(duì)象和數(shù)的理性認(rèn)識(shí)。象靠看,靠眼睛觀察。數(shù)靠算,也即是運(yùn)算。理講判斷,也就是理性思維。象、數(shù)、理,最終是判斷。因此,有人提出的理論不存在的觀點(diǎn)是不成立的,只是理論建立在什么基礎(chǔ)上很重要;如果建立在象、數(shù)的基礎(chǔ)上,理還是有必要、有道理的。所以,在《易經(jīng)》64卦的基礎(chǔ)上,孔子才寫了《十翼》,作了10篇論文,在“理”的層面把《周易》講清楚了。
了解這一文化內(nèi)容,我們心中便有了數(shù)。俗話說“掐指一算”,“算”的背后是數(shù),心中有數(shù),算到心中有數(shù)的層面就定了。就像現(xiàn)在的出版業(yè),如果對(duì)大數(shù)據(jù)背后的道理不理解就會(huì)產(chǎn)生畏懼,數(shù)字化還沒明白,又來大數(shù)據(jù)了?
中國人的思想中,什么事情發(fā)生了,大家會(huì)說“早有定數(shù)”,這是普通老百姓都會(huì)講的。但這些思想是哪里來的呢?比如,先天八卦、后天八卦,這些是數(shù)字?!兑捉?jīng)》在漢朝時(shí)的研究被稱為“京房十六卦變”,也離不開數(shù)字。黃道十二宮,還是數(shù)字。當(dāng)然,“十二宮”里面的數(shù)字就更復(fù)雜了。六十花甲,60年一個(gè)花甲,也離不開數(shù)字。十二生肖,還是離不開數(shù)字。前一段,我又翻出《洛書》來看,之前只注意它的圖案,這次帶著問題看,發(fā)現(xiàn)圖案的上面全是數(shù)字,還有一句話:“戴九履一、左三右七、二四為肩、六八為足?!薄兑捉?jīng)》中有“六爻之動(dòng)”,講的是八卦的每一卦里有六個(gè)爻,“六爻之動(dòng),三極之道也”,它告訴我們的第一層意思是,天地之間雖然數(shù)字很多,但是真正有用的不會(huì)超過“六”。中國文化博大精深,中國先賢也是極具智慧。對(duì)此后來的科學(xué)家做過研究,除了極少的現(xiàn)象,萬事萬物的物理現(xiàn)象,基本上都是六個(gè)階段。它講的第二層意思是,“六爻”都在動(dòng),動(dòng)的本質(zhì)是什么呢?它告訴我們是“三極之道”,“三極”指的是天、地、人,也就是說,“六爻”是三極變化的法則。
這些都是古代人們的一種表達(dá)方式,現(xiàn)代人也許會(huì)認(rèn)為這是非理性的,甚至是一種迷信說法。其實(shí),這就是古人對(duì)科學(xué)研究的一種數(shù)據(jù)表達(dá),只不過現(xiàn)在我們不使用、不研究了。
因此,從中國古代文化中可以看出,中國先人有很強(qiáng)的數(shù)字概念,而如今所講的數(shù)字、數(shù)據(jù)、大數(shù)據(jù)等,其實(shí)古已有之。
對(duì)大數(shù)據(jù)的理解,我們要正確去把握。數(shù)據(jù)本來就是有的,古人早就意識(shí)到了,并做了高度抽象的概括。只不過到了新的條件下,特別是到了大數(shù)據(jù)時(shí)代、云計(jì)算的條件下,它的作用和潛能被釋放了出來,只是和古代數(shù)據(jù)觀已不可同日而語了。這是第一個(gè)觀念。
第二個(gè)觀念是,哲學(xué)上講量變到質(zhì)變,大數(shù)據(jù)其實(shí)也一樣。當(dāng)數(shù)據(jù)大到一定程度的時(shí)候,事物的形態(tài)就發(fā)生變化了。大數(shù)據(jù)的意義就在于此,它已經(jīng)不是原來的樣子了,或者說它是、也不是了。
舉個(gè)例子,法國拉斯科洞窟壁畫中有很多是馬的造型。畢加索參觀后開玩笑說,人類自這以后就沒有再創(chuàng)造了,畫來畫去,都是馬。然而,現(xiàn)在的科學(xué)家又從量變到質(zhì)變的角度重新解釋,雖然一幅馬的圖案大同小異、十分相似,但是把它分成24幅,變成電影以后,性質(zhì)就發(fā)生變化了。這就是數(shù)字帶來的變化。靜止“1”的時(shí)候它是一幅畫,到了動(dòng)態(tài)“24”的時(shí)候它成為一部電影,性質(zhì)發(fā)生了變化。
還有一個(gè)例子,是關(guān)于納米技術(shù)。納米技術(shù)告訴我們,把東西變小,變到分子量級(jí)的程度,物質(zhì)形態(tài)、本質(zhì)就會(huì)發(fā)生變化。比如銅,銅是可以導(dǎo)電的,分子級(jí)別的銅就不導(dǎo)電了。還有陶土,分子級(jí)別的陶土,就成了柔軟、帶有彈性的物質(zhì)。再說金屬,金屬是硬的,分子級(jí)別的金屬是軟的,可以任意擺弄它。
這些例子都在說明“大數(shù)據(jù)”的概念早已存在,只是到了現(xiàn)代技術(shù)條件下,較為集中地體現(xiàn)了出來,但體現(xiàn)并揭示的仍然是哲學(xué)上的定律,量變到質(zhì)變。這也就是大數(shù)據(jù)的意義所在。
第三個(gè)觀念,作為企業(yè),過去最為強(qiáng)調(diào)的是有形資產(chǎn),當(dāng)然現(xiàn)在還作為一個(gè)重要的判斷標(biāo)準(zhǔn),也就是企業(yè)規(guī)模。我們知道,與有形資產(chǎn)同樣重要的,還有無形資產(chǎn)。對(duì)出版業(yè)來說,那就是版權(quán)、商標(biāo)、商號(hào)等。到了大數(shù)據(jù)時(shí)代,它又告訴人們,比這些還重要的是數(shù)據(jù)資源。一個(gè)企業(yè)做得好,數(shù)據(jù)也是投入,也是潛在的競爭力。比如美國蘋果手機(jī)公司,如果用有形資產(chǎn)去評(píng)估它,那它就沒什么了不起,如果用大數(shù)據(jù)的思維去評(píng)價(jià)它,那就不得了。因?yàn)橄襁@樣的公司,他們擁有巨量的數(shù)據(jù),并且每天還在增加。
第四個(gè)觀念,是主因。我們分析得知,大數(shù)據(jù)古已有之,只是現(xiàn)在集中體現(xiàn)了出來,那么主因是什么?我認(rèn)為,是處理數(shù)據(jù)的能力在迅速提升。
大數(shù)據(jù)首先來源于哪里呢?一是來源于天文學(xué),因?yàn)樘煳膶W(xué)的信息量巨大。二是來自生物學(xué)中對(duì)基因的研究。一個(gè)是宏觀,一個(gè)是微觀,這兩極的數(shù)據(jù)都是巨量的,以至于大到現(xiàn)在的計(jì)算能力都無法實(shí)現(xiàn)。因此,到了大數(shù)據(jù)時(shí)代,這就倒逼著科學(xué)家們處理數(shù)據(jù)的能力迅速提升。
再舉幾個(gè)例子。有資料顯示,2000年在美國新墨西哥州啟動(dòng)的斯隆數(shù)字巡天項(xiàng)目啟動(dòng),用望遠(yuǎn)鏡幾周之內(nèi)收集的數(shù)據(jù),比自人類有史以來收集的所有數(shù)據(jù)還要多。但到了2010年,智利利用巡天望遠(yuǎn)鏡5天的時(shí)間就完成了它所有的運(yùn)算,打破了新墨西哥州的記錄。2013年,中國的“天河二號(hào)”超級(jí)計(jì)算機(jī),已經(jīng)又把計(jì)算速度提高了幾倍,成為當(dāng)時(shí)全球最快超級(jí)計(jì)算機(jī)。2020年,我國的神威·太湖之光超級(jí)計(jì)算機(jī)已經(jīng)實(shí)現(xiàn)千萬核心并行第一性原理計(jì)算模擬,排名于世界前列。
10多年前,全球科學(xué)家聯(lián)手用10年的時(shí)間完成了31.6億個(gè)基因堿基對(duì)的排序。而今,這樣的工作量只需十幾分鐘完成。谷歌公司每天要處理超過24拍字節(jié)的數(shù)據(jù),這意味著其每天的數(shù)據(jù)處理量是美國國家圖書館所有紙質(zhì)出版物所含數(shù)據(jù)量的上千倍。Facebook每天更新的照片量超過1000萬張,每天的點(diǎn)擊量或者寫評(píng)論大約有30億次,點(diǎn)擊一次,就有大量的數(shù)據(jù)保留下來。當(dāng)然,這些數(shù)據(jù)還在不斷增長。
那么,問題就來了:第一,大數(shù)據(jù)的核心是什么?第二,大數(shù)據(jù)的特點(diǎn)是什么?第三,關(guān)鍵在哪里?通過不斷學(xué)習(xí),思路就慢慢清晰了。
首先,大數(shù)據(jù)的核心在于預(yù)測(cè)。對(duì)于出版業(yè)來說,早在幾年前,亞馬遜公司就已經(jīng)開始使用大數(shù)據(jù)預(yù)測(cè),預(yù)測(cè)市場需求、市場反應(yīng)。這樣的預(yù)測(cè),可以明確某一個(gè)人的閱讀領(lǐng)域是什么、最近的閱讀熱點(diǎn)在哪里,等等。不管是手機(jī)端、電腦端,只要使用一次就能留下數(shù)據(jù),公司后臺(tái)通過數(shù)學(xué)模式計(jì)算運(yùn)轉(zhuǎn),結(jié)果就出來了。
其次,有人提出,大數(shù)據(jù)的特點(diǎn)有三個(gè):一是數(shù)據(jù)更多,二是數(shù)據(jù)更雜,三是數(shù)據(jù)更好。這有一定道理。
數(shù)據(jù)更多,不是隨機(jī)樣本,而是全體數(shù)據(jù)。就是對(duì)一件事用全數(shù)據(jù)——即這件事的幾乎所有數(shù)據(jù)來預(yù)測(cè),準(zhǔn)確率將會(huì)大大提高。比如人口普查,與抽樣是相反的理念,抽樣最大的特點(diǎn)是用盡量少的數(shù)據(jù)反映更多更真實(shí)的信息,而大數(shù)據(jù)預(yù)測(cè)則與之相反。
數(shù)據(jù)更雜,不是精確性,而是混雜性。說的是越復(fù)雜、越紛繁的數(shù)據(jù),預(yù)測(cè)將更有效、更接近真實(shí)。這種預(yù)測(cè)不是在追求每個(gè)數(shù)據(jù)的精確性,當(dāng)一件事物的數(shù)據(jù)達(dá)到臨界點(diǎn)的時(shí)候,它的形態(tài)性質(zhì)等可能就發(fā)生了變化。這與抽樣又不一樣,抽樣強(qiáng)調(diào)的是隨機(jī)性,不能帶入主觀意愿,犧牲的是數(shù)據(jù)的量。而大數(shù)據(jù)追求的是量,放棄的是精確性。
數(shù)據(jù)更好,不是因果關(guān)系,而是相關(guān)關(guān)系。比如沃爾瑪?shù)臍v史數(shù)據(jù)表明,一旦有颶風(fēng)的時(shí)候,蛋撻的銷量就大增,不問為什么,不問因果關(guān)系,只問相關(guān)關(guān)系,就是一旦A出現(xiàn)了,B必然出現(xiàn)。所以沃爾瑪就把蛋撻和雨傘、手電筒等颶風(fēng)用品放在一起,銷量大增。這就是相關(guān)關(guān)系,也就是讓數(shù)據(jù)說話,只說現(xiàn)象,不問原因。
最后,關(guān)鍵在哪里?我歸納有這樣幾條:一是整體性,就是關(guān)于某個(gè)事物數(shù)據(jù)的整體性,而不是隨機(jī)、抽樣、代表。二是既然有了大數(shù)據(jù),就必然呼喚云計(jì)算處理能力。三是容錯(cuò),如谷歌公司為了做翻譯平臺(tái),它建立了上萬億的語料庫。這些數(shù)據(jù)都是互聯(lián)網(wǎng)上已經(jīng)發(fā)生過的數(shù)據(jù),其中大多是廢舊數(shù)據(jù),所以會(huì)出錯(cuò),那么容錯(cuò)才能接近真理。四是相關(guān)性。它的核心是量化兩個(gè)數(shù)據(jù)值之間的數(shù)理關(guān)系。簡單說,就是此長彼長或此消彼長的關(guān)系,A情況出現(xiàn)時(shí)B情況必然出現(xiàn)的關(guān)系,就是相關(guān)關(guān)系。
聯(lián)系實(shí)際,我有這樣的體會(huì):一方面,傳統(tǒng)出版人要正視這一問題,有必要清楚大數(shù)據(jù)的由來、爆發(fā)的主因,及其核心、特點(diǎn)和關(guān)鍵所在,這是大勢(shì)所趨,也是發(fā)展方向;但另一方面,要充分估算到互聯(lián)網(wǎng)、數(shù)字化、大數(shù)據(jù)、云計(jì)算等對(duì)出版的影響,以及又是如何影響的,還要對(duì)此進(jìn)行總結(jié)。
15世紀(jì)印刷機(jī)被發(fā)明出來以后,它帶動(dòng)了一次世界性的信息爆炸。印刷機(jī)面世以后,大約出版了1.3億冊(cè)圖書。到2010年,也就是谷歌的數(shù)字化圖書計(jì)劃實(shí)行7年之后,大約有2000萬圖書被掃描成了數(shù)字圖書,這幾乎相當(dāng)于人類所有書寫文明的15%;也就是說500多年產(chǎn)生的信息量,它只用了7年就完成了。這還只是一家公司,還沒有完全展開來做。
大家知道亞馬遜,它的優(yōu)勢(shì)是Kindle(電子書閱讀器)。在Kindle上閱讀的重復(fù)率、標(biāo)記次數(shù)以及畫線次數(shù)會(huì)有數(shù)據(jù)留存,這都是讀者的重要信息??墒莵嗰R遜都把它藏在那兒,不愿意跟出版商共享,因?yàn)槌霭嫔桃膊辉敢獍寻鏅?quán)跟它分享。前面我們也講了數(shù)據(jù)無處不在,如今大數(shù)據(jù)已經(jīng)運(yùn)用到各個(gè)行業(yè),從未來的眼光看,它一定會(huì)繼續(xù)深刻的、長期的影響社會(huì)生活的各個(gè)方面。
再回到出版業(yè),我們需以辯證的眼光來看待。
第一,究竟改變的是什么呢?數(shù)字化已經(jīng)并將持續(xù)改變我們圖書生產(chǎn)和管理流程,并部分改變呈現(xiàn)方式、閱讀方式和營銷方式。我還是比較保守的,不太相信顛覆論。因?yàn)榻Y(jié)果往往不是專家預(yù)測(cè)的,而是消費(fèi)者來決定的。我的簡單判斷是,像我這樣的人,正常情況閱讀還有 30年,我們的選擇傾向主要還是紙質(zhì)書。但是改變是必然的,現(xiàn)實(shí)已經(jīng)改變了,并且還將更大地改變。
第二,凸顯的問題是什么呢?是內(nèi)容的海量,以至于泥沙俱下,難以選擇。我們打開各種數(shù)字化的端口,只要打開就會(huì)感覺到什么都有,但困惑的是不知道如何選擇?,F(xiàn)在有了監(jiān)管,效果是好了很多。
第三,最終稀缺的是什么呢?稀缺的是有效內(nèi)容的搜索,以及重大思想成果的選擇和獲得。這一方面表現(xiàn)了不管是互聯(lián)網(wǎng),還是大數(shù)據(jù),都在不斷成長中,另一方面也說明傳統(tǒng)出版的努力依然有著巨大空間。
第四,比較難辦的是什么呢?難辦的是內(nèi)容主體的孤島化。剛才說到亞馬遜,各大書商和亞馬遜之間,雖然各有資源優(yōu)勢(shì),但之間卻是屏蔽的。這雖然是幾年前的數(shù)據(jù),但主體的孤島化以及內(nèi)容數(shù)據(jù)化的商業(yè)模式還是有待探索與開發(fā)。
第五,數(shù)字化和數(shù)據(jù)化,改變著關(guān)于內(nèi)容生產(chǎn)的市場預(yù)測(cè)、加工方式、管理過程、呈現(xiàn)樣式、交易方法,但是沒有改變內(nèi)容本身的價(jià)值。沒有改變傳統(tǒng)出版人原來所擁有的立點(diǎn),就是內(nèi)容這個(gè)立點(diǎn)沒有改變;也沒有改變內(nèi)容創(chuàng)新的主體地位,特別是不會(huì)改變精神產(chǎn)品生產(chǎn)的規(guī)律,即是說規(guī)律是不會(huì)改變的。
前些年,美國人在歡呼、崇拜大數(shù)據(jù)的同時(shí),也發(fā)現(xiàn)了問題。比如,有人問喬布斯,蘋果公司經(jīng)營得這么好,市場是怎么調(diào)研的?喬布斯說沒有調(diào)研,并接著說,消費(fèi)者沒有義務(wù)去了解自己想要什么,這是生產(chǎn)者的事。這是一個(gè)反向的例子,不用大數(shù)據(jù)預(yù)測(cè)卻成功的例子。還有一個(gè),500多年前哥倫布發(fā)現(xiàn)新大陸,沒人做過預(yù)測(cè),沒人有數(shù)據(jù)概念,更沒有大數(shù)據(jù)概念,但是一個(gè)歷史性的重大發(fā)現(xiàn)誕生了。還有,福特時(shí)代沒有數(shù)據(jù)顯示,汽車可以代替馬車,但是汽車這個(gè)重大發(fā)明也誕生了。這些都說明,大數(shù)據(jù)是管用的,但是更大的數(shù)據(jù),比大數(shù)據(jù)更大的數(shù)據(jù)是什么呢?是源于人本身,是人的創(chuàng)造力、直覺和天賦。我們的先賢哲人,那個(gè)時(shí)候都不具備大數(shù)據(jù)的運(yùn)算能力,依靠的就是他們的智慧,給我們留下了豐厚的文化遺產(chǎn),這種智慧源于直覺,靠的是人自身的悟性,對(duì)事物規(guī)律的把握。
因此,我們要看到,數(shù)字化、大數(shù)據(jù)對(duì)傳統(tǒng)出版帶來了知識(shí)的集成、需求的判斷、趨勢(shì)的把握、搜索的便捷以及跨界的鏈接。這不僅是挑戰(zhàn),更重要的是商機(jī),是發(fā)展空間,是文化的傳承??茖W(xué)再怎么發(fā)展,它不會(huì)改變出版的本質(zhì)——選擇。比如,孔子年代占卜書不少,著名的、上了《左傳》的、和《周易》一樣地位的就有兩本。但是孔子最后列入“六藝”的只有《周易》。沒有這方面內(nèi)容的選擇,就不會(huì)有后來《周易》的地位。《詩經(jīng)》也是一樣,也是孔子選擇的結(jié)果??瓷先ヒ粋€(gè)簡單的、具體的編輯工作,帶來的是長久的社會(huì)影響和偉大的思想成果。
歸根結(jié)底,我們應(yīng)積極認(rèn)真地對(duì)待并研究數(shù)字化、大數(shù)據(jù)等科技手段給出版帶來的影響,應(yīng)跟隨時(shí)代步伐、適應(yīng)時(shí)代要求,為傳統(tǒng)出版在新的技術(shù)條件下尋找出路,繁榮發(fā)展出版業(yè)。
(摘自8月2日《人民政協(xié)報(bào)》)