吳 哲 丁海斌
(1.沈陽建筑大學(xué)馬克思主義學(xué)院,遼寧沈陽,110168;2.廣西民族大學(xué)管理學(xué)院,廣西南寧,530006; 3.廣西數(shù)字檔案管理研究所,廣西南寧,530006)
“數(shù)據(jù)”概念從學(xué)界對其進行察考或闡釋開始,常處于較為抽象之境地,難以有一個精準(zhǔn)的、達成共識的概念界定。又因為數(shù)據(jù)時代之“數(shù)據(jù)”,已經(jīng)成為社會熱點詞匯,被許多學(xué)科所關(guān)注與引入,又經(jīng)過不同學(xué)科視角的研究,從而引申出若干內(nèi)涵與外延。由于著眼點不同、學(xué)術(shù)進路不同、認(rèn)知差異等多種因素影響,對于“數(shù)據(jù)”概念的闡釋呈現(xiàn)了百花齊放的態(tài)勢,至少存在數(shù)十種概念界定。在某種程度上,“數(shù)據(jù)”概念呈現(xiàn)出不確定性、多元性與歧義性。因此,形成這樣的判定并不是沒有原因的:“數(shù)據(jù)本身沒有確切的含義,其含義來源于背景語義?!保?]此外,在人文社會科學(xué)的一些學(xué)科領(lǐng)域(比如哲學(xué)),容易想當(dāng)然地認(rèn)為“數(shù)據(jù)”一詞,是由“數(shù)”而來,所以不乏“數(shù)—數(shù)據(jù)—大數(shù)據(jù)的歷史沿革”[2]這樣的討論。而計算機學(xué)科認(rèn)為:“編碼都必須是計算機能夠接收的形式,因此,‘?dāng)?shù)據(jù)’一詞的最早來源就是指‘計算機數(shù)據(jù)’?!保?]既然“數(shù)據(jù)”一詞的歷史淵源、“數(shù)據(jù)”一詞的概念界定等都尚未完全厘清,那么,對“數(shù)據(jù)”進行一次概念史考察,或許可以消解某些歧義,提升我們對“數(shù)據(jù)”概念認(rèn)識的明晰度。
“數(shù)(數(shù))”字始見于戰(zhàn)國文字,由“婁”而來,簡化字為“婁”?!皧洹弊殖鲇诮鹞模艜r即有“數(shù)”之涵義,段玉裁釋謂:“婁,亟也。亟者,數(shù)也?!保?]例如,戰(zhàn)國中期之郭店楚墓竹簡《語叢二》中,所謂“名婁”,即“名數(shù)”[5]也。后加“小擊也”之“攴”,乃造為專字“數(shù)”,其簡化字寫作“數(shù)”。
《說文解字》將“數(shù)”字之本義厘定為動詞“計算”,訓(xùn)曰:“數(shù),計也,從攴婁聲?!保?]作動詞時讀音為shǔ,如《道德經(jīng)》:“善數(shù),不用籌策。”[7]從動詞義計算,引申出名詞義“數(shù)目”,名詞讀音為shù,如《莊子·秋水》:“號物之?dāng)?shù)謂之萬?!保?]自漢代以后,盡管“數(shù)”的形容詞、副詞詞義仍然使用,如數(shù)百步、數(shù)見不鮮等,但其主要詞義“計算”“數(shù)目”已然相當(dāng)穩(wěn)固,此二義與今之“數(shù)據(jù)”概念存在著一定的關(guān)聯(lián)性。
現(xiàn)代人談?wù)摗皵?shù)據(jù)”的概念時,其重心在于“數(shù)”“數(shù)字”“數(shù)字化”等,“據(jù)”字多被視為后綴,因此在概念闡釋時,“據(jù)”字常常為人所忽視。釋“數(shù)”者多,釋“據(jù)”者少,就像前文所述,有學(xué)者討論“數(shù)—數(shù)據(jù)”的歷史沿革,卻幾乎沒人會去討論“據(jù)—數(shù)據(jù)”的歷史沿革。以今審之,“數(shù)據(jù)”概念之涵義恐亦與“據(jù)”之動詞義“依托”、名詞義“憑證”有所關(guān)聯(lián),絕非僅為后綴而已。如,我們?nèi)粘J褂谩皳?jù)研究表明”“據(jù)調(diào)查表明”,是可以的,但若說“據(jù)數(shù)據(jù)表明”,則有病句之嫌。
“數(shù)據(jù)”乃為“數(shù)”字與“據(jù)”字兩詞素相疊加之合成詞。所謂“數(shù)據(jù)”,取“據(jù)”之名詞義,則為“數(shù)字之憑據(jù)”;取“據(jù)”之動詞義,則為“據(jù)之以數(shù)”或“以數(shù)為據(jù)”。此二義其實一脈相循,互為呼應(yīng),即數(shù)據(jù)何以能成為“數(shù)字憑據(jù)”呢?在于“以數(shù)為據(jù)”是也;反之,若可以“以數(shù)為據(jù)”,則數(shù)據(jù)便可以成為“憑據(jù)”。
在中國歷史文化語境中,“數(shù)”與“據(jù)”連綴使用時,“據(jù)”字多為動詞依托、依據(jù)之義。自古統(tǒng)計數(shù)目,于數(shù)目后,常跟隨此種“以數(shù)為據(jù)”之義,即“某某數(shù),據(jù)某某”。如“戶千六十七萬七千九百六十,此《通典》所載之?dāng)?shù),據(jù)《東漢書》”。[11]但是古時“數(shù)”“據(jù)”二字連綴使用,尚非固化之雙音節(jié)合成詞,只是表達根據(jù)什么而來、以某某為依據(jù)之類的涵義。如,《春秋谷梁傳》:“今傳言公田什一者,舉其全數(shù),據(jù)出稅言之”[12];《素問》:“守數(shù)據(jù)治,無失俞理”[13]等,此中所謂守數(shù)據(jù)治,即根據(jù)常規(guī)、規(guī)律而進行治療,實為“據(jù)數(shù)”之義。又如“臣不過據(jù)數(shù)而言,豈敢妄議是非?”[14]此中之“據(jù)”固為動詞,而“數(shù)”亦并非全是數(shù)目、數(shù)字的涵義,還有規(guī)律、術(shù)數(shù)等其他涵義。一如現(xiàn)代之“數(shù)據(jù)”概念,“數(shù)”亦并非只能指代數(shù)字,除數(shù)字外,文字、圖形、圖像、音頻、視頻等亦皆可稱“數(shù)據(jù)”。此外,將“數(shù)據(jù)”當(dāng)作雙音合成詞來使用,出之甚晚。以現(xiàn)有資料考察,清代學(xué)者楊守敬所撰《日本訪書志》,其中《太平圣惠方》一百卷《目錄》一卷中,謂“計其所采方書,增于《外臺秘要》數(shù)據(jù)倍”。[15]其中所謂“數(shù)據(jù)倍”,結(jié)合前面“增于”二字,則此“倍”或為加倍之義,即“數(shù)據(jù)倍之”,故“數(shù)據(jù)”似當(dāng)為合成詞。不過這種用法即使在近代,亦非常見。
關(guān)于Data的歷史溯源,最早可追溯至古希臘數(shù)學(xué)家、被稱為“幾何學(xué)之父”的歐幾里得。即,Data早期與數(shù)學(xué)具有較強的關(guān)聯(lián)性,此恐怕亦是Data在現(xiàn)代詞語涵義上等于“數(shù)據(jù)”之基礎(chǔ)與淵源所在。從歐幾里得時代到現(xiàn)代,以概念史視角來看,Data的涵義主旨似未發(fā)生顛覆式的變化,但其所指卻出現(xiàn)過數(shù)次微妙的調(diào)整。
Data概念源自數(shù)學(xué)(幾何)著作,因此,對于Data的優(yōu)先譯介權(quán)也在數(shù)學(xué)史的領(lǐng)域里發(fā)生。據(jù)稱歐幾里得除《幾何原本》外,另有15部著作,不過基本都已散佚。“《已知條件》(Data)……是唯一以希臘原文幸存至今的另一部著作”[16],這里面至少提供了兩個至關(guān)重要的信息:其一,早期的Data,涵義為“已知條件”;其二,學(xué)界現(xiàn)在廣泛流行的觀點認(rèn)為“數(shù)據(jù)”一詞最早出現(xiàn)于“拉丁文”,或許可以商榷。這一著作中提出的若干涉及比例與圖形等眾多命題在數(shù)學(xué)史上的意義值得我們重視。因為這些意義在現(xiàn)代的“數(shù)據(jù)”概念里仍在延續(xù)。
數(shù)學(xué)家們并未執(zhí)著于意義,只是指出“在已知圖形中某些部分或關(guān)系是已知時,其他部分或關(guān)系在這種或那種意義上也是已知的”這種解釋,正是《已知條件》(Data)這部著作的核心思想,而對于這種核心思想的最簡潔的內(nèi)涵表達即是:Data。因此,或可將Data的原始意義做一次提煉,即,限于圖形范疇,若某些元素已知,則其他元素也可以成為已知。在此種意義上,現(xiàn)代“數(shù)據(jù)”之“以數(shù)為據(jù)”的概念與數(shù)學(xué)史上的“已知條件”相吻合。例如,在數(shù)據(jù)時代,若“已知”某人的每日出行軌跡,則該人的其他元素,如家庭住址與工作單位可“成為已知”等。因此,“數(shù)據(jù)”概念的原初涵義“已知條件”,在21世紀(jì)仍然成立?,F(xiàn)實生活中,所有互聯(lián)網(wǎng)服務(wù)商們之所以能夠?qū)W(wǎng)民群體使用“自動推送”“精準(zhǔn)投放”等手段,都是基于“部分已知,其他部分也已知”的底層邏輯。
如果說強調(diào)“已知”意蘊的Data,多存在于數(shù)學(xué)領(lǐng)域。那么,對于強調(diào)Data之“資料”意蘊的解讀,則較多地存在于歷史學(xué)領(lǐng)域(在這個意義上,“資料”“文獻”“檔案”等概念為近義詞甚至同義詞,常可互換使用)。其中,雙方的研究重心不相同,數(shù)學(xué)領(lǐng)域中的“已知”,具有計算性、思辨性意義,歷史領(lǐng)域的“資料”,則更多的是Data的功能性意義。
強調(diào)“資料”意蘊的Data,其較早似可追溯至精于魏晉玄學(xué)、佛教史的近代歷史學(xué)家湯用彤先生。湯先生在論“科學(xué)推理之諸原則”之際,曾將Data界定為“算術(shù)之材料”。[17]民國時期,“史學(xué)即是史料學(xué)”“只要把材料整理好,則事實自然明顯”[18]等觀念頗為流行,以“史料”作為史學(xué)之起點與基礎(chǔ),具有相當(dāng)先進的意義。盡管湯用彤先生走的不是“史料學(xué)”一路,但其對于史料的重視是顯而易見的。而在史學(xué)家眼中,“數(shù)”“量”“數(shù)量”也好,“已知條件”也罷,恐怕皆為歷史之“材料”而已。此種歷史視角之界定,將“數(shù)據(jù)”指向“材料”“資料”意蘊的習(xí)慣,到了現(xiàn)代,似在史學(xué)界仍有所延續(xù),例如,在《新史學(xué)之古代科學(xué)與現(xiàn)代文明》一書中,便將數(shù)學(xué)家眼中的《已知條件》(Data),明確釋譯為《資料集》(Data)。[19]
前文曾述,現(xiàn)代探討“數(shù)據(jù)”之概念,重心在于“數(shù)”“計算機”“數(shù)字化”等,“據(jù)”字多被視為后綴,常為人所忽略。然而,從“數(shù)據(jù)(Data)”的詞語內(nèi)涵角度,無論是漢語還是外語,其“依據(jù)”意蘊都不應(yīng)如此輕易地被摒棄或丟失。
盡管《英語同義詞辨析大詞典》將Data釋譯為“系(以事實、數(shù)字或統(tǒng)計為形式的)數(shù)據(jù),資料”,但也明確提出了“Data的要件是dat=give提供”。[20]無論是“已知條件”,還是“材料”“資料”,都是名詞,而“提供”卻是動詞,那么“Data的要件是dat=give提供”之意蘊,只能由數(shù)據(jù)之“據(jù)”來表達。前述“據(jù)之以數(shù)”“以數(shù)為據(jù)”之“據(jù)”,其動詞義為“依托”“依據(jù)”,而“Data的要件是dat=give提供”中的“提供”,即為“依托”。
在強調(diào)Data詞語內(nèi)涵的主旨為“依據(jù)”這一方向上,亦有學(xué)者提出:“數(shù)據(jù)(Data)這個詞來自拉丁語,指‘一些給定的東西’?!保?1]盡管認(rèn)為“數(shù)據(jù)”一詞來自拉丁語尚待商榷,但是,這所謂“給定”的涵義,卻與“提供”“已知條件”頗有異曲同工之妙。而“給定”相比僅僅“提供”,在“據(jù)”之可為“依托”的方向上,似又更進一步。
總而言之,“數(shù)據(jù)”一詞的三種歷史涵義“已知條件”“資料”“依據(jù)”,各有其視角與著眼點,但這三種不同視角的意蘊闡釋,卻又可回環(huán)相通。其回環(huán)如下:“已知條件”,是可知的,所以當(dāng)然可以成為“資料”(不可知的不能稱為資料,只能稱佚失或闕如了);而“資料”具有存儲或記錄之屬性,因此是可搜集、可整理、可提取的,若占據(jù)了“資料”,就順理成章可以成為某種“依據(jù)”或“憑證”;而“依據(jù)”或“憑證”,既然都以此為據(jù)、以此為憑了,便無法將其歸入“未知”,則顯然屬于“已知條件”。
數(shù)據(jù)時代,作為核心概念的“數(shù)據(jù)”一詞,早已經(jīng)跨越了學(xué)科壁壘,被若干學(xué)科所關(guān)注并頻繁使用,各個學(xué)科也都曾對“數(shù)據(jù)”進行過概念解釋。理工學(xué)科大多從“工具價值”的角度使用“數(shù)據(jù)”;而人文社會科學(xué)學(xué)科則大多從向理工科“借用”“引用”的角度出發(fā)來使用“數(shù)據(jù)”。因為數(shù)據(jù)時代之所謂“數(shù)據(jù)”,與計算機、互聯(lián)網(wǎng)的發(fā)展密不可分,所以一個潛在的事實為:人文社會科學(xué)大體上默認(rèn)“數(shù)據(jù)”概念的原始解釋權(quán)屬于理工科,而人文社會科學(xué)的不同學(xué)科在使用“數(shù)據(jù)”概念時,基本上要遵循理工科的定義、邊界與范式,至多小心翼翼地在理工科概念框架內(nèi)增添一點該人文社會學(xué)科的特色語詞,將“數(shù)據(jù)”涵義進行某種嫁接式的“二次開發(fā)”。所以,在學(xué)術(shù)界若干學(xué)科里,其實都對“數(shù)據(jù)”概念進行過界定,只不過這數(shù)十種界定,由于過于對計算機學(xué)科“察言觀色”、小心翼翼,從而對于“數(shù)據(jù)”的概念界定紛紛走上了一條“不求有功,但求無過”的學(xué)術(shù)進路。甚至在“一切學(xué)科的基礎(chǔ)”之哲學(xué)領(lǐng)域里,對“數(shù)據(jù)”的釋義都難以觸摸本質(zhì),現(xiàn)在看來,似乎亦是“無過即是功”式的含糊其辭。例如,將“數(shù)據(jù)”界定為“人類認(rèn)知活動的產(chǎn)物”“客觀事物的主觀反映”“對事物現(xiàn)象進行表征的一種邏輯語言”。[22]將“數(shù)據(jù)”定義為人類認(rèn)知活動的產(chǎn)物、客觀事物的主觀反映,或許無過,但是“人類認(rèn)知活動的產(chǎn)物,客觀事物的主觀反映”只是等于“數(shù)據(jù)”么?也即是說,“=”的左右兩邊其實并不對等。至于“一種邏輯語言”,則顯然是計算機學(xué)科對“數(shù)據(jù)”定義的某種借用,因為只有計算機視角,才能將數(shù)據(jù)界定為“語言”。所謂“計算機語言”,實在只是以人為主體視角中人類“語言”一詞的比喻、比擬而已。
在檔案界,“數(shù)據(jù)”一詞的應(yīng)用與其他學(xué)科有所不同,因為數(shù)據(jù)就是數(shù)字時代的檔案,二者在數(shù)字時代實為一物。
(1)原因與根據(jù)
為什么說數(shù)據(jù)是數(shù)字時代的檔案呢?有以下原因與根據(jù):
第一,從歷史角度講,檔案與數(shù)據(jù)從來就密不可分。從前面的論述可知,“數(shù)據(jù)”一詞的來源與本義,不論是漢語的“以數(shù)為據(jù)”,還是西文的“已知條件”“資料”“依據(jù)”,都具有檔案的含義。在計算機還未興起之前,“數(shù)據(jù)”就具有 “已知條件”“資料”“依據(jù)”等涵義,已經(jīng)與“檔案”密不可分。第二,從定義角度講,檔案是人們有意識保存起來的原始符號記錄[23],而數(shù)據(jù)的屬性完全符合這個定義。數(shù)據(jù)時代,“數(shù)據(jù)”一詞在具有了計算機的內(nèi)涵之后,與檔案的關(guān)系不疏反密。一方面,數(shù)據(jù)是人通過計算機有意識形成與保存的;另一方面,從原生態(tài)的數(shù)據(jù)而言,數(shù)據(jù)是原始符號(數(shù)字符號)記錄。從這一點看,它完全具備檔案的屬性,是一種稱為“數(shù)據(jù)”的檔案事物。第三,從實踐角度講,檔案是人類實踐活動的原始符號記錄,而絕大多數(shù)原生態(tài)的數(shù)據(jù)是具有這種屬性的,它們是網(wǎng)絡(luò)世界中人類活動的符號記錄,是數(shù)字實踐活動的檔案記錄,在屬性上屬于檔案事物是確定無疑的。我們不能因為它們中有一些目前不屬于檔案機構(gòu)的管理范圍,而說它們不是檔案。第四,從功用角度看,對其他人文社會學(xué)科而言,“數(shù)據(jù)”只是本學(xué)科發(fā)展的輔助資料,其著眼點只在本學(xué)科關(guān)注的部分。而在檔案學(xué)界,就研究對象而言,“數(shù)據(jù)”并非只是“輔助”,而是“主體”“全部”,檔案學(xué)關(guān)注的不只是“小小一部分”,而是人類實踐活動中形成的“數(shù)據(jù)世界的整體”。不論哪個學(xué)科的“數(shù)據(jù)”,都可成為檔案;不論結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù),都具有檔案價值,都可成為檔案。
總之,檔案學(xué)界使用“數(shù)據(jù)”一詞,與其他人文社會學(xué)科有著巨大的區(qū)別。對檔案學(xué)而言,“數(shù)據(jù)”就是自己,是“主體”或“全部”,所以只是用“拿來主義”的態(tài)度來對待它是遠(yuǎn)遠(yuǎn)不夠的,必須用本學(xué)科的核心概念和理論來做出科學(xué)的解讀。
(2)形式與內(nèi)涵
目前,“數(shù)據(jù)”與“檔案”的結(jié)合包括 “檔案數(shù)據(jù)”“數(shù)據(jù)檔案”“檔案大數(shù)據(jù)”等多種形式。其中“檔案數(shù)據(jù)”一詞最為流行,筆者以該詞為主進行分析。從20世紀(jì)90年代,計算機含義的“檔案數(shù)據(jù)”一詞產(chǎn)生以來,主要被理解為偏正結(jié)構(gòu),即“檔案”是“數(shù)據(jù)”的定語,起修飾、限定作用。但歸結(jié)起來,基于偏正結(jié)構(gòu),“檔案數(shù)據(jù)”一詞中的“檔案”,主要有兩種含義:“具備檔案性質(zhì)的”或“關(guān)于檔案的”。
在數(shù)據(jù)形態(tài)的檔案世界中,我們可以把其存在形態(tài)分為兩種基本情形:一是基于局域網(wǎng)、行業(yè)網(wǎng)等的各種業(yè)務(wù)系統(tǒng)中的數(shù)據(jù),它們一般為結(jié)構(gòu)化數(shù)據(jù),其檔案性質(zhì)能夠較清晰地被人們意識到并較容易地被接受,其檔案管理機制也較容易地被建立起來;二是基于廣域網(wǎng)中的各種非業(yè)務(wù)系統(tǒng)中產(chǎn)生的數(shù)據(jù),如社交系統(tǒng)中產(chǎn)生的數(shù)據(jù),由于它們多數(shù)是非結(jié)構(gòu)化數(shù)據(jù),其檔案性質(zhì)容易被人們忽略,或者說其檔案屬性不明顯,是否轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)是它們是否被認(rèn)為是傳統(tǒng)意義上的“檔案”的關(guān)鍵。
各種業(yè)務(wù)系統(tǒng)上的數(shù)據(jù)被視為檔案管理起來,是目前檔案界要解決的較為直接與緊迫的工作,也是檔案界目前的“共識”,這些結(jié)構(gòu)化數(shù)據(jù)被檔案界內(nèi)外認(rèn)可為檔案較容易,所以這些數(shù)據(jù)常常被稱為“檔案數(shù)據(jù)”。但同樣具有價值的非結(jié)構(gòu)化數(shù)據(jù),因其數(shù)量更大、形態(tài)更多,加上非結(jié)構(gòu)化不利于管理,在實踐中成為傳統(tǒng)檔案機構(gòu)的管理對象是一件很難的事情,所以,雖然它們在屬性上是檔案,但在管理行為上和思想認(rèn)識上較難被接納為檔案,它們往往不會被稱為“檔案數(shù)據(jù)”,這是人們較難接受“數(shù)據(jù)即檔案”觀點的關(guān)鍵。數(shù)據(jù)時代的檔案工作,說到底可以分為兩個部分:一是將結(jié)構(gòu)化數(shù)據(jù)科學(xué)管理起來;二是將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)并科學(xué)地管理起來。后者一旦得以實現(xiàn),人們就不會再說它們不是檔案了。
(3)兩條路徑與“檔案數(shù)據(jù)”的重新解讀
關(guān)于“檔案數(shù)據(jù)”的解讀,筆者將思路重點放在廣義與狹義的兩種解釋路徑上,即廣泛存在的具有“保存起來的原始符號記錄”屬性的數(shù)據(jù)和檔案界內(nèi)的較傳統(tǒng)的解釋路徑(“關(guān)于檔案的數(shù)據(jù)”“檔案內(nèi)容數(shù)據(jù)”等)。這兩種解釋路徑可以并存,且只是廣義與狹義之分,不是非此即彼、相互排斥的關(guān)系。
關(guān)于狹義的“檔案數(shù)據(jù)”,我們將其理解為一種偏正詞組結(jié)構(gòu),即“檔案的數(shù)據(jù)”。在這種“檔案數(shù)據(jù)”的偏正詞組結(jié)構(gòu)認(rèn)知中,“檔案數(shù)據(jù)”一詞的詞義相當(dāng)復(fù)雜,會生發(fā)若干歧義。所謂的“檔案數(shù)據(jù)”,到底是“‘屬于檔案的’‘關(guān)于檔案的’‘檔案中的’‘檔案機構(gòu)所有或管控的’‘檔案業(yè)務(wù)活動中形成的’‘檔案數(shù)據(jù)化后的’‘檔案化處理后的’‘歸檔或存檔的’還是‘具有檔案屬性的’等都無法厘清。”[24]當(dāng)然,以“檔案的數(shù)據(jù)”的偏正詞組而言,這些理解都是有思辨意義的。隨著社會信息化的發(fā)展,檔案界處于左右兩難的境地。向左,檔案即數(shù)據(jù),檔案范圍擴大了,但界限模糊了,很多情況下檔案人會覺得自己似乎也消失在數(shù)據(jù)的海洋中了;向右,堅持“檔案數(shù)據(jù)是關(guān)于檔案的數(shù)據(jù)”,就會使檔案工作的范圍越來越窄,原有的領(lǐng)地也一步一步地被蠶食掉,會使自己處于一種非常尷尬的境地——將檔案管理與數(shù)據(jù)管理截然分開,自己只是歷史檔案的管理者,將檔案的現(xiàn)實實踐意義拱手讓給“數(shù)據(jù)工作者”。檔案工作與數(shù)據(jù)工作變成了兩個職業(yè),檔案工作不是得到了發(fā)展,而是倒退了。
事實上,融合和發(fā)展是不可避免的,用傳統(tǒng)的觀念理解今天的檔案世界,已經(jīng)是不可能的事情了。世界在改變,我們的思想和概念也必須發(fā)生改變,這是不以人的意志為轉(zhuǎn)移的客觀現(xiàn)實。概念的突破,詞匯的發(fā)展,說到底是思想上的突破與發(fā)展。這種思想上的突破與發(fā)展,要從事物的本質(zhì)出發(fā),從發(fā)展著的實踐出發(fā),從歷史唯物主義的發(fā)展的角度出發(fā)。其中,傳統(tǒng)的檔案機構(gòu)本身就是突破和發(fā)展的對象,傳統(tǒng)意義上的檔案機構(gòu)即將發(fā)生改變,那么,“保存在檔案機構(gòu)的原始符號記錄才是檔案”的思想自然也會被突破。同樣,我們也要突破“即時與歷時”的局限。在數(shù)字世界中,數(shù)據(jù)即生即存、形成與保存一體,即時與歷時已經(jīng)沒有了明顯的界限。因此,我們不能因為它們的實時性而否認(rèn)它們的檔案性質(zhì)。當(dāng)然,在辦公和業(yè)務(wù)系統(tǒng)中,電子文件與電子檔案在程序上的前后區(qū)分仍然存在。
關(guān)于廣義概念的“檔案數(shù)據(jù)”,我們可以有偏正結(jié)構(gòu)和同義并列式復(fù)合詞(同義復(fù)詞)結(jié)構(gòu)兩種理解方式。偏正結(jié)構(gòu)方面,我們可以認(rèn)為“檔案數(shù)據(jù)是具有檔案性質(zhì)的數(shù)據(jù)”,而因為絕大多數(shù)數(shù)據(jù)都具有檔案性質(zhì),我們得出“數(shù)據(jù)即檔案”這種概略性的說法(數(shù)據(jù)有少部分不具有檔案性質(zhì),如圖書數(shù)據(jù)庫中的圖書數(shù)據(jù)。因此我們說“數(shù)據(jù)即檔案”是一種概略性的說法)。同義復(fù)詞結(jié)構(gòu)方面,管理學(xué)有“管理數(shù)據(jù)”,考古學(xué)有“考古數(shù)據(jù)”等,“數(shù)據(jù)”作為一個熱詞,是被以“拿來主義”的方式使用,用來豐富本學(xué)科學(xué)術(shù)內(nèi)容的,“檔案數(shù)據(jù)”當(dāng)然也有這一層用意。在此意義上,所謂“檔案數(shù)據(jù)”與“管理數(shù)據(jù)”等名詞一樣,皆可為偏正關(guān)系詞組。但是除此之外,與其他學(xué)科不同的是,它還是一個并列關(guān)系詞組。因為在“資料”“依據(jù)”意義上,甚至在“已知條件”的意義上,數(shù)據(jù)與檔案是同義詞,因此,從這個角度而言,數(shù)據(jù)即檔案。
結(jié)合前述,從歷史溯源來看,在計算機尚未興起之前,“數(shù)據(jù)”與“檔案”已經(jīng)密不可分,甚至某種程度上為同義詞。因此,我們似不必一定要以“計算機、數(shù)據(jù)化”的視角去解讀“檔案”與“數(shù)據(jù)”,從而將“檔案”與“數(shù)據(jù)”視為截然不同之二物;所謂“檔案數(shù)據(jù)”,亦不必一定得將其內(nèi)涵默認(rèn)為“檔案的數(shù)據(jù)”,進而因“到底什么是‘檔案的’?”而產(chǎn)生大量分歧。我們可以對它進行另外一種解讀,即將之理解為同義復(fù)詞“檔案和數(shù)據(jù)”(“數(shù)據(jù)”不過是對“檔案”的重申)。
從歷史淵源和同義復(fù)詞視角看“檔案數(shù)據(jù)”一詞,可以解除“屬于檔案的”“關(guān)于檔案的”“檔案中的”“檔案機構(gòu)所有或管控的”等方面的爭議。此類爭議的特點在于全部都是以“的”結(jié)尾,這種闡釋模式下,即便暫時用“檔案數(shù)據(jù)”解釋得通,但未來仍存有較大之隱患,即“檔案”若是僅將自己定位成定語與修飾詞,那么,檔案或成為計算機或計算主義之附庸。因為在數(shù)據(jù)時代,強勢的計算機術(shù)語正在大量植入其他學(xué)科,并成為熱點詞匯,如云計算、共享池、虛擬化、區(qū)塊鏈、元宇宙、生態(tài)云,等等。如果我們將檔案僅當(dāng)作數(shù)據(jù)的定語與修飾詞,那么,“檔案虛擬化”“檔案云計算”“檔案共享池”“檔案云”“檔案區(qū)塊鏈”等一旦成詞,則“檔案”復(fù)將一次次地成為“云計算、共享池、虛擬化、區(qū)塊鏈……”等無數(shù)計算機術(shù)語的定語與修飾詞。
前述檔案其實不像其他人文社會學(xué)科那樣只關(guān)注“小小一部分”數(shù)據(jù),而是關(guān)注“數(shù)據(jù)世界整體”,因為所有不同學(xué)科的“資料”,都可成為檔案,因此,“數(shù)據(jù)”之于檔案學(xué),應(yīng)該與其他人文社會科學(xué)學(xué)科有所不同。那么,將“檔案”僅當(dāng)作“數(shù)據(jù)”的定語與修飾詞,可以是其他視角,而不應(yīng)該是檔案學(xué)的視角。事實上,在以檔案為主體的視角中,龐大的計算機、互聯(lián)網(wǎng),也只不過是檔案的“工具”或者說具有“工具價值”罷了。在這種意義上,檔案自身在數(shù)據(jù)時代的主體意義才能得以確認(rèn)。而且,檔案學(xué)界應(yīng)該理直氣壯地確認(rèn)檔案在信息社會的這種主體地位,而不必“茍且偷生”。
在對“數(shù)據(jù)”賦義的過程中,其概念界定呈現(xiàn)出不確定性、多元性與歧義性,學(xué)界存在多種定義與闡釋,代表著我們對“數(shù)據(jù)”的認(rèn)識多立足于局部,尚未完全清晰,包括本文在內(nèi),學(xué)界每一次對“數(shù)據(jù)”進行的考察,都可視為厘清之努力。作為合成詞的“數(shù)據(jù)”,其主要來源是與Data進行的對譯,但是由于“數(shù)據(jù)”一詞已徹底融入中國語境,則對其漢語漢字之意蘊亦不可無視。尤其不應(yīng)該選擇性地忽略“據(jù)(據(jù))”字,將其僅視為語詞之后綴。在對“數(shù)據(jù)”概念進行界定之際,某些時候,“據(jù)”反而處于關(guān)鍵地位。
從歷史源流角度考察出的“數(shù)據(jù)”三種意蘊:“已知條件”“資料”“依據(jù)”,外在表象似乎不同,內(nèi)里卻是相通的。并且,此三種意蘊不只是在歷史上成立,現(xiàn)代依然在運行。比如相對于“資料”“依據(jù)”而言較難理解的“已知”,現(xiàn)代互聯(lián)網(wǎng)的“數(shù)據(jù)推送”依然基于“部分已知——其他部分也已知”的底層邏輯?!皵?shù)據(jù)”的三種意蘊使得它與“檔案”具有一種天然的自始至終的密切聯(lián)系,而這種聯(lián)系是此前的學(xué)術(shù)研究所忽略的。
至于“檔案數(shù)據(jù)”,現(xiàn)代多將之理解為“檔案的數(shù)據(jù)”,實則“數(shù)據(jù)”與“檔案”為近義詞甚至在“資料”“依據(jù)”意義上為同義詞。“檔案數(shù)據(jù)”是一種同義復(fù)詞,“數(shù)據(jù)”不過是對“檔案”的重申,因此,不應(yīng)將“檔案”僅僅視為“數(shù)據(jù)”的定語與修飾詞。即便不以語詞詮釋的視角,只以現(xiàn)實應(yīng)用的視角,若能夠認(rèn)清檔案的“主體”地位,則計算機、互聯(lián)網(wǎng)以及存儲或傳送于其中的“數(shù)據(jù)”,亦只是具有“工具價值”。堅持檔案的“主體”地位,在未來才不至淪為計算機或計算主義之附庸。