史文靜
一、檔案
(一)檔案的起源
《周易注》:“古人無文字,結繩為約,事大,大結其繩;事小,小結其繩?!边@在易經(jīng)中早有“上古結繩以記事的記載”。類似之舉外國古代也有應用,被稱作“坎普”。在竹片、木片、骨片和玉片上刻上各種形狀的標志來表達和記錄信息的“刻契”與“結繩”可以說是檔案的萌芽。
1899年發(fā)現(xiàn)的甲骨檔案是我國迄今發(fā)現(xiàn)最早的檔案,這是人們公認的我國最早的文字。而“檔案”一詞,據(jù)現(xiàn)有的材料初見于清代。現(xiàn)存順治年間的官府文書中,已有“檔案”一詞的使用。例如,順治十八年(1661年)十月初一日戶部尚書阿思哈題查審霸州乾清宮胭粉錢糧地土事本中,即有“查得順治十年四月臣部題定檔案”之語?!皺n”字在《康熙字典》里解釋為“橫木框當”,就是木架框格的意思?!鞍浮保墩f文解字》釋作“幾屬”,就是像小桌子一類的東西,由此引深,又把處理一樁事件的有關文件叫做一案,并通稱收官的官方文件為“案”?!皺n”和“案”連用,顧名思義,就是存入檔架的文案。這種稱呼一直沿用到現(xiàn)在,仍有其形象上的和內(nèi)在的意義,并有了新的科學涵義。
(二)傳統(tǒng)意義上的檔案
古今中外從不同角度和歷史條件對檔案的定義也不盡相同,而且在不斷變化。隨著近現(xiàn)代檔案學的產(chǎn)生和發(fā)展而演進的,特別是20世紀以來,關于檔案的定義很多,對檔案內(nèi)涵的揭示也日趨深入。簡要考察一下關于檔案的各種定義,對我們現(xiàn)在認識檔案是有很重要的意義的。
我國是具有悠久歷史的文明古國,檔案史料典藏豐富,檔案的沿革源遠流長。自我中華民族進入歷史文明時期以來,甲骨金石、竹簡木牘、縑帛卷帙、金冊鐵卷,以至紙墨文件,其年代之久遠、數(shù)量之龐大、內(nèi)容之廣泛、價值之珍貴,都是舉世少有的。
19世紀末,荷蘭斯·繆勒、伊·阿·斐斯、阿·福羅英臺合著的《檔案的整理與編目手冊》(1898年),在檔案學史上負有盛名,書中寫到:檔案是“某一行政機關或其某一官員正式收到或產(chǎn)生并被指定由他們保管的書寫文件、圖片和印刷品的總和?!?/p>
20世紀二三十年代的一些中外檔案學著作中,常常引用英國希拉里·詹金遜所著《檔案管理手冊》(1922年)中所下的定義,稱檔案是“某一行政管理或行政事務(無論是公共的還是私人的)實施過程中所擬就或使用,作為該事務的組成部分,事后由該項事務的負責人或其合法繼承者保管,以備不時查考的各種文件”。
何魯成著《檔案管理與整理》(1938年)一書認為:“我國文字中之檔案二字,適等于西文中Archives一名詞。如合并中西文而對于檔案一名詞下一定義,當為:檔案者乃已辦理完畢歸檔后匯案編制留待參考之文書”。作者指出:文件未必一一歸檔保存,唯須長期保存而留待參考者方可作為檔案,其中包括機關內(nèi)所收入及發(fā)出之公文及其附件。
20世紀七八十年代以來,國外有關著作和文件中可以舉出美國和法國關于檔案的定義:
《美國大百科全書》(1975年):“檔案,是執(zhí)行法律和處理事務中制成或受到的因具有永久價值而保存起來的文件的有機體,包括文稿、簿冊、地圖、錄音帶和其他文獻材料在內(nèi)。”
《法蘭西共和國檔案法》(1979年)第一條指出:“任何自然人或法人,任何國家機關或組織,任何私人機構或部門,子啊自身活動中產(chǎn)生或受到的文件整體,不管其形成日期、形成和制成材料,都是檔案?!?/p>
經(jīng)過長時間的積淀,綜合各種關于檔案概念的定義。中華人民共和國國家標準《情報與文獻工作詞匯基本術語》和《檔案著錄規(guī)則》(1985年)中均寫道:“檔案:國家機構、社會組織以及個人從事政治、經(jīng)濟、科學、文化等社會實踐活動直接形成的文字、圖表、聲像等形態(tài)的歷史記錄?!?/p>
中華人們共和國行業(yè)標準《檔案工作基本術語》(2000年)中國“檔案”一條釋為“國家機構、社會組織和個人在社會活動中直接形成的有價值的各種形式的歷史記錄?!?/p>
(三)創(chuàng)新時代下的檔案
古往今來,任何一項新技術的問世,都將毫無疑問的預示著一個新時代的來臨。
正如信息化時代挑戰(zhàn)了紙質(zhì)時代的來源原則、生命周期理論、檔案價值鑒定理論,催生了基礎理論的新變革,產(chǎn)生新來源觀、文件連續(xù)體理論、宏觀鑒定理論等等革新的理論。
1984年9月鄧小平同志曾題詞:開發(fā)信息資源,服務四化建設。八十年代改革開放之初,作為領導人的鄧小平同志就提出開發(fā)信息資源這樣的宏偉愿景。足見在日新月異的時代形勢下,創(chuàng)新檔案工作是有十分重要的意義。
任何檔案中都承載著一定的信息,檔案是一種重要的信息資源。1985年2月中共中央和國務院關于檔案工作的批示中就明確要求“大力開發(fā)檔案信息資源”,“為建設社會主意物質(zhì)文明和精神文明服務”(《中共中央、國務院批轉<關于調(diào)整我國檔案工作領導體制的請示>的通知》,見《檔案工作文匯集》第二集,45頁,北京,檔案出版社,1985)。認識和研究檔案的信息屬性,對于更新檔案界的思維和提高檔案管理水平,有著現(xiàn)實的指導意義。
2006年1月9日,全國科學技術大會上胡錦濤主席指出,建設創(chuàng)新型國家的決策,是事關社會主義現(xiàn)代化建設全局的重大戰(zhàn)略決策,要把創(chuàng)新型戰(zhàn)略思想貫穿到各個行業(yè),各個部門。
我國的檔案信息化建設已經(jīng)持續(xù)進行了20年,進入21世紀,檔案工作已形成向檔案信息化、集成管理、向數(shù)字化檔案館前進的發(fā)展趨勢。伴隨信息時代的到來,檔案信息化的發(fā)展趨勢使檔案工作的概念發(fā)生了根本性的變革,比較明顯的是:
檔案形式——從實體檔案到電子文件檔案;
檔案內(nèi)容——從國家機構、社會組織的典籍、文件到各類社會信息;
檔案管理——從人工管理到廣泛采用計算機軟件、向信息集成管理發(fā)展;
檔案存儲——從庫房存儲擴展到網(wǎng)站、網(wǎng)絡;
檔案基地——從實體檔案館到數(shù)字化檔案館。endprint
可以說檔案工作根本性變革的全新時代已經(jīng)到來。
所謂檔案信息電子化,就是以館(室)藏檔案資料(紙質(zhì)或機讀形式的)為主要物質(zhì)對像,用微機對檔案文獻進行收集、篩選和不同層次的加工,使之轉化成為微機軟件形式的二次文獻信息供人們利用的過程。眾所周知,檔案信息化在過去的二十年中見證了三次模式的變遷,從最初的主機計算機時代,到后來的局域網(wǎng)應用時代,再到如今的互聯(lián)互通時代,這也就是數(shù)字檔案管理的演變。
而現(xiàn)今,大數(shù)據(jù)繼云計算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)又一次顛覆性的技術變革。在大數(shù)據(jù)時代,新文件來源觀、文件連續(xù)體理論都將受到不同程度的挑戰(zhàn),檔案學基礎理論將會有更深一步的發(fā)展。
檔案信息資源管理的挑戰(zhàn)。從紙質(zhì)檔案到檔案信息化再到大數(shù)據(jù)時代,檔案信息資源呈指數(shù)型增長,用現(xiàn)有的檔案信息化手段、工具難以滿足大數(shù)據(jù)時代的檔案信息資源管理。在大數(shù)據(jù)時代,檔案信息不再匱乏,而是泛濫,如何實現(xiàn)檔案數(shù)據(jù)長期可讀性、安全可靠性,并在海量數(shù)據(jù)中實現(xiàn)對檔案信息的挖掘分,從而提供有價值的信息。因為檔案具有其他事物所不可替代的特殊價值,所以檔案管理將面臨更新、更大的挑戰(zhàn)。
二、數(shù)據(jù)
(一)檔案的信息屬性
毛澤東同志指出:“科學研究的區(qū)分,就是根據(jù)科學對象具有的特殊矛盾性。因此,對于某一現(xiàn)象的領域所特有的某一種矛盾的研究,就構成了某一門科學的對象?!彼终f:“如果不研究矛盾的特殊性,就無從確定一事物不同于他事物的特殊本質(zhì),就無從發(fā)現(xiàn)事物運動發(fā)展的特殊原因,或特殊的根據(jù),也就無從辨別事物,無從區(qū)分科學研究的領域。”這就是我們探討檔案屬性的正確指導思想。
錢學森在《論系統(tǒng)工程》藝術中有比較明確通俗的關于信息的表述:“信息是代表物質(zhì)某一狀態(tài)的資料”,“情報資料、圖書、文獻和檔案都是一種‘信息”。美國數(shù)學家、控制論和信息論創(chuàng)始人之一維納說,信息是我們在適應外部世界和控制外部世界的過程中,同外部世界進行交換的內(nèi)容和名稱。
檔案信息作為信息家族中的一員,具有信息的一般屬性,如中介性、可替代性、可傳輸性、可分享性等。同時檔案信息又具有自身的某些特性,主要表現(xiàn)為原始性和回溯性。
1、檔案信息的原始性。檔案是人們在社會實踐中直接形成的,其內(nèi)容為社會實踐活動的內(nèi)容、過程及結論的原始記錄。與自然界中自然形成的原始記錄物不同,檔案是人類自覺創(chuàng)建的信息控制系統(tǒng)。按照信息的特征和技能,可以將信息分為原始信息和加工信息。原始信息是指用數(shù)字和文字對某一項活動所作出的最初的直接的記載,對原始信息進行不同的加工處理,才成為加工信息。檔案是人們當時社會的原始記錄,它與圖書、資料等其他信息相比,具有顯著的原始性特征。檔案信息的這種原始性,使它具備了一種其他信息形式無法替代的證據(jù)作用,從而獲得了珍貴的價值。
2、檔案信息的回溯性。從現(xiàn)行文件到檔案是有一個過程的,因此,檔案信息與其反映的社會活動內(nèi)容的真是過程必然有一定的時間距離,正是這種時間距離,使檔案信息具備了回溯性的特征。從時態(tài)上講,檔案是過去已經(jīng)形成的而不是正在形成或尚未形成的東西。所謂“讓過去告訴現(xiàn)在,讓歷史告訴未來”。它并非人類歷史文化遺產(chǎn)的全部,而是其中只有基礎性支持意義的重要部分。檔案一旦形成,就成了過去活動的記述,即歷史的記述。檔案信息的存貯,成了一種歷史財富,檔案成了人們了解過去、研究歷史、總結經(jīng)驗、探究規(guī)律的依據(jù)。古人云:知古不知今,謂之陸沉;知今不知古,謂之盲瞽。檔案信息的這種回溯性的特征,使之成為貫通古今的信息流,不僅成了今人了解過去,后人了解今人的中介,而且又是為現(xiàn)實服務和預測未來的系統(tǒng)的信息。
(二)檔案的數(shù)據(jù)意義
1、檔案數(shù)字化的涵義
檔案數(shù)字化是指利用計算機技術、掃描技術、OCR技術、數(shù)字攝影(錄音、錄像)技術、數(shù)據(jù)庫技術、多媒體技術、存儲技術等高新技術把各種載體的檔案資源轉化為數(shù)字化的檔案信息。在未來,檔案館的發(fā)展方向不可避免的將實現(xiàn)全數(shù)字化檔案館,而就如何解決好海量數(shù)據(jù)的壓縮與存儲、分類檢索、組織管理、交互界面等問題,是這一時期所面臨的重要課題。
傳統(tǒng)紙質(zhì)檔案以“卷”“件”“份”為單位,在大數(shù)據(jù)時代,檔案更多以“字段”“數(shù)據(jù)庫”為管理對象。在檔案統(tǒng)計方面,從原來的以“頁”“米”為統(tǒng)計單位改為以“GB”(千兆字節(jié))為統(tǒng)計單位。檔案工作者不能局限于電子檔案的收、管、用,要將更多的時間去監(jiān)控電子檔案的生成及保障電子檔案的可讀、安全性。其以數(shù)字化的形式存儲、網(wǎng)絡化的形式相互聯(lián)結,利用計算機系統(tǒng)進行管理,形成一個有序機構的檔案信息庫,及時提供利用,實現(xiàn)資源共享,是檔案信息化建設的重要組成內(nèi)容。
2、檔案數(shù)字化的主要內(nèi)容
(1)檔案目錄信息的數(shù)字化,建立檔案目錄的數(shù)據(jù)庫;
(2)載體檔案的數(shù)字化,如紙質(zhì)檔案、檔案微縮品、照片檔案及錄像檔案等的數(shù)字化,建立檔案影像數(shù)據(jù)庫或多媒體數(shù)據(jù)庫;
(3)檔案專題信息的采集與建庫。
2.2.3檔案數(shù)字化的重要意義
(1)檔案數(shù)字化是檔案信息化建設重要內(nèi)容,而檔案信息化建設的核心是資源建設。其中包含兩個大的方面:一是現(xiàn)有館藏檔案的目錄數(shù)據(jù)庫建設和館藏重要檔案和照片、錄音、錄像檔案的數(shù)字化;二是電子檔案歸檔與電子檔案管理。
(2)檔案數(shù)字化能有效的保護檔案原件。代替原件使用,保護檔案原件;數(shù)字化副本異地保存;恢復殘缺數(shù)據(jù),保證數(shù)據(jù)的永久性。
(3)檔案數(shù)字化能改善其利用方式。不再受“孤本”限制,一份文件可以同時提供給所有需要它的人共享;數(shù)字影像文件可以通過計算機局域網(wǎng)或者廣域網(wǎng)進行異地傳輸,使異地調(diào)閱成為可能。擴大了檔案的利用空間,為實現(xiàn)檔案價值最大化又向前邁進了一大步;“時間”不再是限制,利用者可以隨時使用自己所需要的文件。檔案數(shù)字化以后,將開放的檔案上網(wǎng),這樣所有的利用者就可以在任何時間、任何地點上網(wǎng)利用檔案資源。檔案數(shù)字化能充實各檔案網(wǎng)站的內(nèi)容。對我國大多數(shù)已上網(wǎng)的檔案館來說,普遍存在網(wǎng)上信息資源貧乏、簡薄的通病,信息加工深度不夠、指引性信息過多、實質(zhì)性信息少。要改變這種尷尬的局面,只有盡快將豐富的館藏信息化和數(shù)字化。檔案數(shù)字化是傳統(tǒng)檔案館走向數(shù)字檔案館的必經(jīng)之路。數(shù)字檔案館無疑是21世紀各級各類檔案館的發(fā)展方向。盡管當前它的具體組成結構、組織管理模式還處于探索之中,可其“館藏”的數(shù)字化特征是肯定的,傳統(tǒng)檔案的數(shù)字化將是“館藏”的重要組成部分。endprint
三、企業(yè)檔案工作
(一)企業(yè)檔案的現(xiàn)實意義
1、企業(yè)檔案的定義
要科學地管理企業(yè)檔案,做好企業(yè)檔案工作,必須首先理解檔案定義的涵義。一般認為,檔案是國家機構、社會組織和公民個人在實踐活動中直接形成的有一定保存價值的各種形式的歷史記錄。企業(yè)檔案是企業(yè)在研發(fā)、生產(chǎn)、經(jīng)營和管理活動中形成的有保存價值的各種形式的文件,是企業(yè)各項工作的自然產(chǎn)物和原始記錄,而不是工作活動事后形成的。它是企業(yè)活動的產(chǎn)物,又是企業(yè)職能活動的工具、生產(chǎn)要素和資本,企業(yè)檔案主要供企業(yè)自用。
2、企業(yè)檔案的形成條件和價值體現(xiàn)
形成條件:
(1)必須是辦理完畢的文件。所謂辦理完畢的文件,是指文件的處理程序和文件辦理的事情已經(jīng)完畢。文件處理程序和文件辦理完畢的事情,一般情況下是同時完成的。
(2)必須是具有一定保存價值的文件。這主要是針對文件參考作用,有查考和利用價值的文件才要作為檔案保存下來。
(3)必須是按照一定的程序集中保存起來的文件。人們把平時形成的文件經(jīng)過挑選和集中,按照一定的特點和規(guī)律組合起來,才能成為檔案。
一般意義上的檔案,均是由文件經(jīng)過歸檔程序轉為檔案集中保存起來的。文件是檔案的前身和基礎,檔案是文件的精華。所以,歸檔時既不能“有文必檔”,也不能遺漏有價值的文件。
價值體現(xiàn):
檔案的價值,是指檔案在人們的社會活動中具有的其他文獻所不能代替的作用,它主要指檔案的憑證作用和參考作用。前者被稱為憑證價值,后者被稱為情報價值。
(1)憑證價值
檔案是歷史的真憑實據(jù),具有一種法律效用,在這一點上它不同于其他文獻。檔案之所以具有憑證作用,是由檔案形成的特點和檔案本身的特點所決定的。從檔案自身物質(zhì)體態(tài)上看,它保留了當事人的歷史真跡,如親筆手稿、印信等,有些檔案還保留了當事人的聲音、影像等。
(2)參考價值
檔案作為一種歷史記錄,不僅具有憑證作用,同樣也具有廣泛的參考作用。檔案是原始記錄,是第一手的資料。歷史學家稱檔案為“沒有摻過水的史料”,可見,檔案比其他資料來源可靠。董必武在《題贈檔案工作》中寫到,“創(chuàng)業(yè)擴基,前軌可跡”,“查網(wǎng)知來,事茲故軼”,對檔案的參考作用給予了高度的概括。
(二)企業(yè)檔案的發(fā)展趨勢
“地球村”的概念儼然不是一個遙不可及的夢,風生水起的互聯(lián)網(wǎng)技術,應運而生的龐大而復雜的網(wǎng)絡技術讓“地球村”成為可能。信息技術迅猛發(fā)展,互聯(lián)網(wǎng)技術廣泛應用,催生了海量信息的衍生,巨大的數(shù)據(jù)量有一次顛覆了云時代,堂而皇之的迎來了信息量暴增的嶄新時代——大數(shù)據(jù)時代。據(jù)國際數(shù)據(jù)公司(IDC)的研究報告稱,2011 年全球被創(chuàng)建和被復制的數(shù)據(jù)總量為1.8ZB,并預測到2020 年,全球?qū)碛?35ZB(1ZB=10 億TB)的數(shù)據(jù)量,為2009年(0.8ZB)的44倍,且其中80%以上為非結構化數(shù)據(jù)(如圖片、視頻等)。大數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和領域,被視為“未來的新石油” ,逐漸成為重要的生產(chǎn)因素。近年來,大數(shù)據(jù)技術研究和應用迅速發(fā)展,許多國家已經(jīng)意識到了大數(shù)據(jù)的重要性,并作為戰(zhàn)略性技術大力推動其發(fā)展,大數(shù)據(jù)時代已悄然而至。
IBM從三個基本特性角度來定義大數(shù)據(jù),即:“3V”:體量(Volume),速度(Velocity)和多樣性(Variety)。也有人為大數(shù)據(jù)包括三個要素,即:大分析(Big Analytic)、大帶寬(Big Bandwidth)和大內(nèi)容(Big Content)。所謂的大數(shù)據(jù),簡而言之就是巨量資料、海量信息,指的是所設計的資料量規(guī)模巨大到無法通過主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。
面對數(shù)量巨大、異構的文檔信息,同時還要與時俱進的滿足現(xiàn)代人類對于信息多樣化、高效化、個性化、專深化的需求,顯然傳統(tǒng)的檔案信息服務已經(jīng)不能滿足時代的需求。在大數(shù)據(jù)時代,檔案信息不再匱乏,而是泛濫,如何實現(xiàn)檔案數(shù)據(jù)長期可讀性、安全可靠性,并在海量數(shù)據(jù)中實現(xiàn)對檔案信息的挖掘分析,從而提供有價值的信息,是檔案管理面臨的新挑戰(zhàn)。
1、業(yè)務環(huán)節(jié)的挑戰(zhàn)
檔案業(yè)務環(huán)節(jié)的挑戰(zhàn),從檔案的收集、管理、利用3個環(huán)節(jié)來看:
在傳統(tǒng)管理方式下,“收”是各部門移交,簡單的整理、裝盒、上架;“管”是手工管理,手工查詢,按照手寫目錄查詢,相對費時、費力,效率低下;“用”是提供被動的查閱服務,有借閱利用者來找尋,才提供相應的查找,借閱服務。
在計算機時代,“收”主要是部門移交與系統(tǒng)推送部分電子文件相結合,這樣相對而言節(jié)約了時間、效率有了較高程度的提升;“管”主要是電腦代替手工勞動,查閱速度加快,使得檔案服務更加便捷;“用”是利用現(xiàn)代信息技術進行制作、加工、傳播、轉換和二次開發(fā),使得檔案的價值體現(xiàn)更為突出,也為提升工作效率和方便用戶提供了便利。
在大數(shù)據(jù)時代下,“收”將是數(shù)據(jù)實時的、自動歸集,這樣檔案收集方面的效率將大大提高,對檔案工作者來說,管理更加便捷;“管”將采用云平臺儲存、計算、分析,不僅對于保存方式的轉變,而且對于利用方式的轉化也是很有利的,多份備存,異地查閱,時間將不再是限制條件,更加精華的檔案,將成為利用者更有價值的憑據(jù)。
2、統(tǒng)計單位的轉變
大數(shù)據(jù)時代給檔案管理工作帶來挑戰(zhàn)的同時也帶來了新的機遇:傳統(tǒng)紙質(zhì)檔案以“卷”“件”“份”為單位,在大數(shù)據(jù)時代,檔案更多以“字段”“數(shù)據(jù)庫”為管理對象。在檔案統(tǒng)計方面方,從原來的以“頁”“米”為統(tǒng)計單位改為以“GB”(千兆字節(jié))為統(tǒng)計單位。檔案工作者將不再局限于電子檔案的收、管、用,更多的時間用來監(jiān)控電子檔案的生成及保障電子檔案的可讀、安全性。這樣快速增長的海量檔案數(shù)據(jù)必須基于云計算平臺上建設云檔案系統(tǒng),實現(xiàn)計算資源,存儲資源的動態(tài)擴展。endprint
3、價值體現(xiàn)的更新
大數(shù)據(jù)是如何彰顯對于整個檔案行業(yè)的優(yōu)勢的?已經(jīng)持續(xù)了20多年的檔案信息化建設,無論是傳統(tǒng)載體的檔案數(shù)字化,還是電子政務系統(tǒng)的建設,都產(chǎn)生了大量的數(shù)字信息,即是通過對于云計算、云存儲、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新型IT服務模式在檔案管理工作中的大范圍運用,依然是無法滿足我們?nèi)粘5男枰?。面對這樣的現(xiàn)實,對于檔案管理工作進行一場技術革新也是在所難免的。
大數(shù)據(jù)猶如一筆富庶的礦藏,通過海量數(shù)據(jù)的處理、整合分析,可以發(fā)現(xiàn)新的知識,從而創(chuàng)造新的更大的價值。大數(shù)據(jù)為許多行業(yè)帶來新的商機和發(fā)展機遇,充分利用大數(shù)據(jù)可為企業(yè)帶來強大的競爭力。這項新的技術優(yōu)勢讓企業(yè)走出了傳統(tǒng)的決策模式,而進一步掌握了“數(shù)據(jù)驅(qū)動的決策方法”,從而使得企業(yè)的決策更加趨向于“科學化、合理化”。隨著大數(shù)據(jù)的“商務智能”技術在企業(yè)中的廣泛應用,實現(xiàn)了企業(yè)內(nèi)部財務系統(tǒng)、人力資源系統(tǒng)以及CRM系統(tǒng)的有效銜接,不僅提高了企業(yè)運營的效率,有效的幫助企業(yè)總結發(fā)展過程中的模式,同時數(shù)據(jù)分析能從龐大的數(shù)據(jù)中發(fā)現(xiàn)稀疏而有高價值的知識和規(guī)律,為企業(yè)預測和決策提供相關支持。如視頻監(jiān)控的數(shù)據(jù)量通常十分大,雖然絕大部分可能沒有實際利用價值,但幾秒鏡頭捕捉到某罪犯體貌特征,可能對公安部門而言就是彌足珍貴的。簡而言之,對于大數(shù)據(jù)中“大”的理解,主要有兩個方面,第一是指大量的、快速增長的數(shù)據(jù),第二則是數(shù)據(jù)中所蘊含的價值量較大。可見,大數(shù)據(jù)之“大”,并不光是指數(shù)據(jù)的數(shù)量之大,它的意義還在于數(shù)據(jù)的價值之大。
(三)企業(yè)檔案的利用服務
1、企業(yè)提升競爭力需要大數(shù)據(jù)的支持。數(shù)據(jù)競爭已經(jīng)成為企業(yè)提升核心競爭力的利器。來自諸多方面零碎而龐大數(shù)據(jù)融合起來,就可構建出企業(yè)競爭的全景圖,洞察到競爭環(huán)境和競爭對手的細微變化,從而快速響應,制定有效競爭策略。巨量的數(shù)據(jù)更具有統(tǒng)計意義,能為各種預測模型提供支持,找到并預測未來的發(fā)展趨勢,幫助企業(yè)獲得先機。
2、企業(yè)提高生產(chǎn)率需要大數(shù)據(jù)的分析。大數(shù)據(jù)的動態(tài)性強,要求分析處理應快速響應,在動態(tài)變化的環(huán)境中快速完成分析過程,有些甚至必須實時分析,否則這些結果可能就是過時、無效的。如導航定位系統(tǒng)、股票分析系統(tǒng)等對數(shù)據(jù)實時處理有著較高的要求,大數(shù)據(jù)分析和處理的方法必須能快速地適應相關業(yè)務更新頻率加快的需求。這些相關項目的數(shù)據(jù)整合在一起,能不斷產(chǎn)生新的信息和知識,有助于提高生產(chǎn)率、降低經(jīng)營成本。
3、企業(yè)提高競爭力需要大數(shù)據(jù)的運作。在大數(shù)據(jù)時代,各種數(shù)據(jù)源源不斷的產(chǎn)生,比如交易數(shù)據(jù)、網(wǎng)站訪問日志等,從中必然會呈現(xiàn)出時間上的規(guī)律,企業(yè)希望從積累了大量的歷史數(shù)據(jù)中分析出一些模式,以便從中發(fā)現(xiàn)商業(yè)機會,通過趨勢分析,甚至預先發(fā)現(xiàn)一些正在新涌現(xiàn)出來的機會,比如企業(yè)可以通過數(shù)據(jù)時間序列分析了解產(chǎn)品銷售的旺季和淡季,制定針對性的營銷策略,減少生產(chǎn)和銷售的波動性,從而獲得利潤和競爭優(yōu)勢?,F(xiàn)今,企業(yè)的競爭不再只是勞動生產(chǎn)率的競爭,而是知識生產(chǎn)率的競爭。數(shù)據(jù)是信息的載體,是知識的源泉,是企業(yè)創(chuàng)造價值和利潤的原材料,因此,基于知識的競爭將集中體現(xiàn)在基于數(shù)據(jù)的競爭上。正如馬云所說,未來是數(shù)據(jù)競爭的時代,誰擁有數(shù)據(jù),誰就擁有未來。
(作者單位:山西汽運集團陽泉汽車運輸有限公司)endprint