游桃琴
(江西省地方志編纂委員會(huì)辦公室,江西南昌330008)
大數(shù)據(jù)思維方式對(duì)地方綜合年鑒工作創(chuàng)新的啟示
游桃琴
(江西省地方志編纂委員會(huì)辦公室,江西南昌330008)
大數(shù)據(jù)時(shí)代來(lái)臨,形成與之相適應(yīng)的思維方式就成為駕馭大數(shù)據(jù)和實(shí)現(xiàn)其價(jià)值的關(guān)鍵。地方綜合年鑒為更好地發(fā)揮為國(guó)存史,為當(dāng)代社會(huì)服務(wù)的作用,就要在思維方式上進(jìn)行創(chuàng)新,形成總體思維、容錯(cuò)思維、相關(guān)思維、智能思維。
大數(shù)據(jù) 思維方式 年鑒創(chuàng)新 啟示
2013年被稱為大數(shù)據(jù)時(shí)代元年,大數(shù)據(jù)已滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為競(jìng)爭(zhēng)力、創(chuàng)新力和生產(chǎn)力發(fā)展的重要手段。大數(shù)據(jù)技術(shù),讓所有社會(huì)科學(xué)領(lǐng)域能夠借由前沿技術(shù)的發(fā)展從宏觀群體走向微觀個(gè)體。誰(shuí)能率先實(shí)現(xiàn)和占有大數(shù)據(jù),誰(shuí)對(duì)大數(shù)據(jù)的挖掘更為深刻,誰(shuí)就將搶占未來(lái)先機(jī)。而這取決于人們對(duì)大數(shù)據(jù)及其潛在價(jià)值功能的認(rèn)知和態(tài)度,也就是說(shuō),形成與之相適應(yīng)的思維方式就成為駕馭大數(shù)據(jù)和實(shí)現(xiàn)其價(jià)值的關(guān)鍵。建立在大數(shù)據(jù)平臺(tái)上,運(yùn)用大數(shù)據(jù)思維方式運(yùn)作的地方綜合年鑒工作將不僅僅是一項(xiàng)工作,而將成為一項(xiàng)事業(yè)。當(dāng)然,大數(shù)據(jù)思維方式離不開(kāi)大數(shù)據(jù)的支撐,大數(shù)據(jù)是大數(shù)據(jù)思維方式出現(xiàn)的源頭和賴以生存的基礎(chǔ)。從根本上說(shuō),大數(shù)據(jù)思維方式是產(chǎn)生于大數(shù)據(jù)時(shí)代、立足于大數(shù)據(jù)技術(shù)之上的新觀念體系。
何為“大數(shù)據(jù)”?至今還沒(méi)有一個(gè)統(tǒng)一的定義。著云臺(tái)的分析師團(tuán)隊(duì)認(rèn)為,“大數(shù)據(jù)”通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢(qián)。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百甚至數(shù)千的電腦分配工作?;ヂ?lián)網(wǎng)行業(yè)認(rèn)為,“大數(shù)據(jù)”指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運(yùn)營(yíng)中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。在維克托·邁爾—舍恩伯格及肯尼斯·庫(kù)克耶編寫(xiě)的《大數(shù)據(jù)時(shí)代》中,“大數(shù)據(jù)”指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。美國(guó)互聯(lián)網(wǎng)數(shù)據(jù)中心認(rèn)為,“大數(shù)據(jù)”是通過(guò)高速捕捉、發(fā)現(xiàn)/分析,從大容量數(shù)據(jù)中獲取價(jià)值的一種新的技術(shù)架構(gòu)。我國(guó)政府還沒(méi)直接就“大數(shù)據(jù)”專有名詞提出來(lái)給予政策支持。不過(guò),工信部發(fā)布的物聯(lián)網(wǎng)“十二五”規(guī)劃上,把信息處理技術(shù)作為4項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程之一被提出來(lái),其中包括海量數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、圖像視頻智能分析,這都是大數(shù)據(jù)的重要組成部分。而另外3項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程,包括信息感知技術(shù)、信息傳輸技術(shù)、信息安全技術(shù),也都與“大數(shù)據(jù)”密切相關(guān)??梢?jiàn),“大數(shù)據(jù)”是一個(gè)寬泛的概念,見(jiàn)仁見(jiàn)智。但也突出了一些共同的東西,即大數(shù)據(jù)的特點(diǎn)。
(一)大數(shù)據(jù)的特點(diǎn)
整體性。大數(shù)據(jù)的資料量規(guī)模龐大到不能用G或T來(lái)衡量,無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成為幫助決策的資訊。物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車(chē)聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及遍布地球各個(gè)角落的各種各樣的傳感器,都在以數(shù)據(jù)的形式追蹤人們的日常生活,并將這些數(shù)據(jù)存儲(chǔ)在相應(yīng)的數(shù)據(jù)庫(kù)中。這些數(shù)據(jù)庫(kù)以某些相關(guān)性相聯(lián),構(gòu)成大數(shù)據(jù)海量資料量的整體。大數(shù)據(jù)的技術(shù)手段和理念賦予人們?cè)诟囝I(lǐng)域、更多層次獲取前所未有的信息機(jī)會(huì)。
多樣性。大數(shù)據(jù)中數(shù)據(jù)類型繁多,這種類型的多樣性也讓數(shù)據(jù)被分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對(duì)于以往便于存儲(chǔ)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來(lái)越多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高要求。
關(guān)聯(lián)性。大數(shù)據(jù)中所謂的“數(shù)據(jù)”與“數(shù)字”是具有不同內(nèi)涵的。一個(gè)數(shù)字背后的背景數(shù)據(jù)、評(píng)論數(shù)據(jù)、心情數(shù)據(jù)等全方位界定了該數(shù)據(jù)的意義。數(shù)據(jù)能否被賦予新的價(jià)值、實(shí)現(xiàn)從數(shù)字支撐到數(shù)據(jù)支撐的順利轉(zhuǎn)化,理解巨量數(shù)據(jù)的關(guān)聯(lián)性是至關(guān)重要的。發(fā)掘這些形態(tài)各異、快慢不一的數(shù)據(jù)流之間的相關(guān)性,是大數(shù)據(jù)做前人之未做、能前人所不能的機(jī)會(huì)。
開(kāi)放性。大數(shù)據(jù)產(chǎn)生速度快、體量龐大,任何單位和個(gè)體想壟斷占有都不現(xiàn)實(shí),大數(shù)據(jù)向所有合法用戶開(kāi)放。海量數(shù)據(jù)本身的價(jià)值密度較低,但是經(jīng)過(guò)清洗和“提純”的數(shù)據(jù)價(jià)值卻很高。這就造成大數(shù)據(jù)可以從多角度、多層面進(jìn)行組合、篩選,為使用者所使用。
(二)大數(shù)據(jù)的價(jià)值
在總數(shù)據(jù)量相同的情況下,與個(gè)別分析獨(dú)立的小型數(shù)據(jù)集相比,將各個(gè)小型數(shù)據(jù)集合并后進(jìn)行分析可得出許多額外信息和數(shù)據(jù)關(guān)系性,來(lái)察覺(jué)商業(yè)趨勢(shì)、判定研究質(zhì)量、避免疾病擴(kuò)散、打擊犯罪或測(cè)定實(shí)時(shí)交通等用途是大型數(shù)據(jù)集盛行的原因。
預(yù)測(cè)價(jià)值。預(yù)測(cè)是大數(shù)據(jù)的核心價(jià)值。大數(shù)據(jù)將為人類的生活創(chuàng)造前所未有的可量化的維度,從而達(dá)到對(duì)事物發(fā)生的可能性進(jìn)行預(yù)估的目的。美劇《紙牌屋》的走紅,就是一次成功運(yùn)用大數(shù)據(jù)預(yù)測(cè)的結(jié)果。Netflix公司基于其3000萬(wàn)北美用戶觀看視頻時(shí)留下的行為數(shù)據(jù),預(yù)測(cè)出“凱文·史派西”“大衛(wèi)·芬奇”和“BBC出品”三種元素結(jié)合在一起的電視劇產(chǎn)品將會(huì)大火特火,由此大膽在拍攝、發(fā)布方式上做了一系列革新,并對(duì)觀眾需求進(jìn)行了“精確推送”,在美國(guó)及40多個(gè)國(guó)家成為最熱門(mén)的在線劇集。類似運(yùn)用大數(shù)據(jù)成功預(yù)測(cè)的案例還有很多。而預(yù)測(cè)系統(tǒng)之所以受到重視,關(guān)鍵就在于他們是建立在海量數(shù)據(jù)基礎(chǔ)之上的,接收和處理的數(shù)據(jù)量越龐大,系統(tǒng)糾錯(cuò)和自我改善的功能就越發(fā)達(dá)。在大數(shù)據(jù)時(shí)代日益精密的數(shù)字技術(shù)條件下,人們的活動(dòng)、決定、社會(huì)關(guān)系都能夠被記錄,這些電子蹤跡為分析人類行為提供了思路。人類的行為不再是被視為互不相關(guān)、隨意偶然的獨(dú)立事件,而是相互依存、相互關(guān)聯(lián)的數(shù)據(jù)網(wǎng)絡(luò)中的一部分。
科研價(jià)值。在信息流通和信息獲取手段受限的時(shí)代,人們解釋未知現(xiàn)象或?qū)ふ乙?guī)律,往往采用經(jīng)驗(yàn)或直覺(jué)判斷甚至信奉超自然的神秘力量??茖W(xué)研究則往往采取隨機(jī)抽樣、問(wèn)卷調(diào)查的方法,并假設(shè)這些數(shù)據(jù)是具有代表性的典型樣本,以期通過(guò)最少的數(shù)據(jù)獲得更多的信息,這本身就存在很多的缺陷。在大數(shù)據(jù)時(shí)代的今天,無(wú)處不在的信息感知和采集終端為我們采集了海量的數(shù)據(jù),而以云計(jì)算為代表的計(jì)算技術(shù)的不斷進(jìn)步,為我們提供了強(qiáng)大的計(jì)算能力,這就圍繞個(gè)人以及組織的行為構(gòu)建起了一個(gè)與物質(zhì)世界相平行的數(shù)字世界。更本質(zhì)上,它是為我們看待世界提供了一種全新的方法,即決策行為將日益基于數(shù)據(jù)分析做出,而不是像過(guò)去更多憑借經(jīng)驗(yàn)和直覺(jué)做出。這就使得社會(huì)科學(xué)研究者能夠在更多領(lǐng)域和更深層次獲得和使用全面而完整的數(shù)據(jù),改變從演繹到歸納到提升至理論的思維路徑,顛覆千百年來(lái)人類的思維慣性,對(duì)人類的認(rèn)知和與世界交流的方式提出了全新的挑戰(zhàn)。
(一)總體思維
過(guò)去采樣是獲取主要數(shù)據(jù)的手段,大數(shù)據(jù)時(shí)代,隨著數(shù)據(jù)收集、存儲(chǔ)、分析技術(shù)的突破性發(fā)展,更方便、快捷、動(dòng)態(tài)地獲得研究對(duì)象有關(guān)的所有數(shù)據(jù)成為現(xiàn)實(shí)。相應(yīng)地,思維方式也應(yīng)該從樣本思維轉(zhuǎn)向總體思維,才能夠更全面、立體、系統(tǒng)地反映研究對(duì)象。
(二)容錯(cuò)思維
小數(shù)據(jù)時(shí)代,對(duì)樣本精確度的要求是苛刻的,因?yàn)槭占畔⒌挠邢抟馕吨?xì)微的錯(cuò)誤會(huì)被放大,甚至有可能影響整個(gè)結(jié)果的準(zhǔn)確性。大數(shù)據(jù)時(shí)代,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無(wú)法利用,只有接受不精確性,我們才能打開(kāi)一扇從未涉足的世界的窗戶。當(dāng)擁有海量即時(shí)數(shù)據(jù)時(shí),絕對(duì)的精準(zhǔn)不再是追求的主要目標(biāo),適當(dāng)忽略微觀層面上的精確度,容許一定程度的錯(cuò)誤與混雜,反而可以在宏觀層面擁有更好的認(rèn)知和洞察力。
(三)相關(guān)思維
小數(shù)據(jù)時(shí)代,人們往往執(zhí)著于現(xiàn)象背后的因果關(guān)系,試圖通過(guò)有限樣本數(shù)據(jù)來(lái)剖析其中的內(nèi)在機(jī)理。大數(shù)據(jù)時(shí)代,人們可以通過(guò)大數(shù)據(jù)技術(shù)挖掘出事物之間隱蔽的相關(guān)關(guān)系,獲得更多的認(rèn)知與洞見(jiàn),運(yùn)用這些認(rèn)知與洞見(jiàn)就可以幫助捕捉現(xiàn)在和預(yù)測(cè)未來(lái)。通過(guò)關(guān)注線性的相關(guān)關(guān)系,以及復(fù)雜的非線性相關(guān)關(guān)系,可以看到很多以前不曾注意的聯(lián)系,還可以掌握以前無(wú)法理解的復(fù)雜技術(shù)和社會(huì)動(dòng)態(tài),相關(guān)關(guān)系甚至可以超越因果關(guān)系,成為我們了解世界的更好視角,而且不易受偏見(jiàn)的影響。
(四)智能思維
自進(jìn)入到信息社會(huì)以來(lái),人類社會(huì)的自動(dòng)化、智能化水平得到明顯提升,但始終無(wú)法取得突破性進(jìn)展,機(jī)器的思維方式仍屬于線性、簡(jiǎn)單、物理的自然思維。但大數(shù)據(jù)時(shí)代的到來(lái),可以為提升機(jī)器智能帶來(lái)契機(jī),推進(jìn)機(jī)器思維方式由自然思維轉(zhuǎn)向智能思維。隨著物聯(lián)網(wǎng)、云計(jì)算、社會(huì)計(jì)算、可視技術(shù)等的突破發(fā)展,大數(shù)據(jù)系統(tǒng)也能夠自動(dòng)地搜索所有相關(guān)的數(shù)據(jù)信息,并讓數(shù)據(jù)主動(dòng)“發(fā)聲”,類似“人腦”一樣主動(dòng)、立體、邏輯地分析數(shù)據(jù)、做出判斷,從而獲得具有洞察力和新價(jià)值的東西,甚至類似于人類的“智慧”。
地方綜合年鑒,是指系統(tǒng)記述本行政區(qū)域自然、政治、經(jīng)濟(jì)、文化、社會(huì)等方面情況的年度資料性文獻(xiàn),屬信息密集型工具書(shū)?!度珖?guó)地方志事業(yè)發(fā)展規(guī)劃綱要(2015—2020年)》指出,修志編鑒、開(kāi)發(fā)利用地方志資源……是為國(guó)存史的一項(xiàng)重要工作,在……傳承文明、發(fā)展文化、激發(fā)民族自豪感和自信心、推動(dòng)海內(nèi)外文化交流合作、提供促進(jìn)經(jīng)濟(jì)社會(huì)發(fā)展的歷史借鑒和智力支持等方面有重要作用。修鑒為用,是年鑒發(fā)揮其作用的唯一途徑,也是年鑒價(jià)值的重要體現(xiàn)。把大數(shù)據(jù)思維方式貫穿整個(gè)年鑒工作,是年鑒工作脫胎換骨的變革,必須統(tǒng)籌謀劃、綜合施策。結(jié)合地方志工作的實(shí)際,著眼大數(shù)據(jù)思維方式的有效貫徹,把握年鑒工作的階段性特點(diǎn)和重要作用,應(yīng)著重做好以下幾方面的工作:
(一)建立以大數(shù)據(jù)整體性為支撐的總體思維
在小數(shù)據(jù)時(shí)代,由于技術(shù)條件的限制,人們只能通過(guò)把復(fù)雜的整體分解為簡(jiǎn)單的部分的方法來(lái)分析研究事物,并試圖用這些部分來(lái)描述整體。而在大數(shù)據(jù)時(shí)代,人們可以利用大數(shù)據(jù)技術(shù),收集、處理和運(yùn)用海量數(shù)據(jù),實(shí)現(xiàn)思維和認(rèn)知從被迫關(guān)注局部向主動(dòng)關(guān)注全局轉(zhuǎn)變,從更廣的范圍、更高的層次、更深的程度認(rèn)識(shí)事物,形成基于大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境的總體思維。
年鑒工作涉及組稿、供稿、編輯、出版發(fā)行、使用等多個(gè)環(huán)節(jié)和要素。結(jié)合筆者的工作實(shí)踐來(lái)看,當(dāng)前年鑒工作思維割裂的問(wèn)題比較嚴(yán)重。年鑒工作者非常重視組稿、供稿、編輯、出版發(fā)行工作(不贅述),卻忽略了最重要的讀者體驗(yàn),幾乎沒(méi)有關(guān)于讀者體驗(yàn)的跟蹤和反饋。因?yàn)槟觇b是紙質(zhì)的,發(fā)行后不知道誰(shuí)在看,也不知道他看了哪些內(nèi)容,看后有什么感想,所以最難以掌握的就是讀者行為。而且,當(dāng)前年鑒還只是靠?jī)?nèi)容一個(gè)維度影響讀者,黏性較弱,讀者更容易被新媒體全新的閱讀體驗(yàn)所吸引,閱讀興趣也會(huì)隨之發(fā)生轉(zhuǎn)移。
年鑒工作應(yīng)當(dāng)抓住這一歷史機(jī)遇,形成“讀者畫(huà)像”,通過(guò)與各種大數(shù)據(jù)團(tuán)隊(duì)的融合,知道讀者的興趣所在,并推送一些內(nèi)容不斷研究讀者,增強(qiáng)讀者黏性。從而扭轉(zhuǎn)當(dāng)前年鑒工作編輯忙得熱火朝天,讀者卻“把頭偏向一邊”的自說(shuō)自話、自?shī)首詷?lè)的現(xiàn)狀,營(yíng)造供稿者、編輯環(huán)境、編輯、讀者間的良性互動(dòng)封閉環(huán),充分發(fā)揮年鑒為社會(huì)服務(wù)的作用。
(二)建立以大數(shù)據(jù)多樣性為支撐的容錯(cuò)思維
容錯(cuò)思維,不是縱容錯(cuò)誤存在,而是接受不精確的存在,并不斷調(diào)整糾偏。在大數(shù)據(jù)時(shí)代,由于技術(shù)的進(jìn)步,人們基本可以做到實(shí)時(shí)、實(shí)地采集、傳輸、處理數(shù)據(jù),可以實(shí)時(shí)準(zhǔn)確地把握事物的動(dòng)態(tài)發(fā)展變化情況,隨時(shí)調(diào)整決策,糾正錯(cuò)誤。
從橫向來(lái)看,地方綜合年鑒反映本行政區(qū)域內(nèi)自然、政治、經(jīng)濟(jì)、文化、社會(huì)等方面情況,稿件來(lái)源廣泛,稿件質(zhì)量參差不齊,數(shù)據(jù)統(tǒng)計(jì)口徑也不盡相同,可謂名副其實(shí)的“眾手成書(shū)”。再加上從組稿到使用有很長(zhǎng)的時(shí)間,涉及多個(gè)環(huán)節(jié),存在出錯(cuò)概率。從縱向來(lái)看,年鑒涉及的有些內(nèi)容跨越多個(gè)年份,在記載過(guò)程中,可能存在有頭無(wú)尾甚至無(wú)疾而終的現(xiàn)象。有些內(nèi)容是以年度為單位持續(xù)開(kāi)展的,但是有的年份記載、有的年份漏記;有的年份全面記載,有的年份只記了部分。有的事件有記載卻實(shí)際沒(méi)實(shí)施等等。
在信息受限的時(shí)代,可能缺乏參照,可能發(fā)現(xiàn)不了問(wèn)題。但在大數(shù)據(jù)時(shí)代,信息來(lái)源廣,更新快,數(shù)據(jù)分析能力極大提升,年鑒參與者發(fā)現(xiàn)問(wèn)題的概率上升。這就需要突破年鑒紙質(zhì)載體的限制,實(shí)現(xiàn)信息化和數(shù)字化,搭建大數(shù)據(jù)技術(shù)平臺(tái),不斷采集最新數(shù)據(jù)、更新動(dòng)態(tài)和進(jìn)展。跳出汲汲于微觀層面的精確性,反而能獲得宏觀領(lǐng)域更深刻的認(rèn)知和把握,促使年鑒工作者更加完善每一部年鑒的頂層設(shè)計(jì),突出地方綜合年鑒的地方特色和年度特色。
(三)建立以大數(shù)據(jù)關(guān)聯(lián)性為支撐的相關(guān)思維
大數(shù)據(jù)時(shí)代,事物各組成要素之間的關(guān)系已經(jīng)不完全是簡(jiǎn)單的線性因果關(guān)系,而更多的是一種非線性的相關(guān)關(guān)系。通過(guò)分析研究數(shù)據(jù)變化所反映的事物之間的內(nèi)在聯(lián)系以及相關(guān)關(guān)系,可以避免我們的思維方式陷入冗長(zhǎng)的因果關(guān)系鏈,較為快捷地發(fā)現(xiàn)事物不同要素之間的相互關(guān)系和相互影響及相互作用方式,為快捷準(zhǔn)確地找到解決復(fù)雜問(wèn)題的方案提供有效的路徑。
年鑒工作要求基本形成黨委領(lǐng)導(dǎo)、政府主持、負(fù)責(zé)地方志工作的機(jī)構(gòu)(以下簡(jiǎn)稱地方志工作機(jī)構(gòu))組織實(shí)施、社會(huì)各界廣泛參與的工作體制。當(dāng)前年鑒工作也確實(shí)是在黨委領(lǐng)導(dǎo)、政府主持、地方志機(jī)構(gòu)組織實(shí)施下開(kāi)展工作的。但是社會(huì)各界參與度還比較欠缺,從稿件來(lái)源來(lái)看,還主要是政府各單位和部門(mén),組稿方式主要靠行政手段。由于市場(chǎng)經(jīng)濟(jì)體制下,政府部門(mén)不再包攬一切,許多工作轉(zhuǎn)移到民間組織、中介機(jī)構(gòu)等,單靠政府部門(mén)供稿勢(shì)必造成年鑒內(nèi)容的缺項(xiàng)或遺漏,無(wú)法反映生動(dòng)火熱的社會(huì)實(shí)踐。
拓展組稿渠道,擴(kuò)大稿件來(lái)源,是做好做精年鑒工作的當(dāng)務(wù)之急。因此,在維護(hù)原有來(lái)稿途徑的同時(shí),我們還可以向社會(huì)征集稿件,如向各行業(yè)協(xié)會(huì)、各主要企業(yè)、檔案部門(mén)、主要媒體等組稿,向一些專家學(xué)者或行家里手征稿,甚至還可以及時(shí)采集互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、手機(jī)、微信、Facebook以及Twitter等產(chǎn)生的海量數(shù)據(jù),利用大數(shù)據(jù)處理技術(shù),對(duì)這些海量數(shù)據(jù)進(jìn)行分析處理篩選。多視角、全方位地記述社會(huì)實(shí)踐,能提高年鑒“鑒”的價(jià)值,也有利于向讀者推送多方面的相關(guān)信息,展示事物的多面性。
(四)建立以大數(shù)據(jù)開(kāi)放性為支撐的智能思維
封閉導(dǎo)致混沌,而開(kāi)放則會(huì)帶來(lái)生機(jī)和活力。大數(shù)據(jù)的一個(gè)鮮明特征就是其開(kāi)放性。從數(shù)據(jù)來(lái)源來(lái)看,大數(shù)據(jù)時(shí)代的數(shù)據(jù)建設(shè)對(duì)所有的有效數(shù)據(jù)保持開(kāi)放;從數(shù)據(jù)的使用來(lái)看大數(shù)據(jù)時(shí)代的數(shù)據(jù)向所有的合法用戶保持開(kāi)放,任何用戶都沒(méi)有數(shù)據(jù)特權(quán)。這種開(kāi)放性為人們的智能思維奠定了基礎(chǔ),為我們探索掌握現(xiàn)實(shí)和未來(lái)事物發(fā)展的特點(diǎn)規(guī)律,智慧思考、超前謀劃提供了支撐和條件。
當(dāng)前,絕大部分省級(jí)綜合年鑒都能做到當(dāng)年編輯當(dāng)年出版,有些地方甚至在當(dāng)年編輯的上半年就出版了。小數(shù)據(jù)時(shí)代,各類數(shù)據(jù)必須要在規(guī)定的某個(gè)時(shí)間點(diǎn)采集,到某個(gè)時(shí)間點(diǎn)結(jié)束,然后再利用相當(dāng)長(zhǎng)的時(shí)間處理采集到的數(shù)據(jù),這是很快的速度。但是,大數(shù)據(jù)時(shí)代,這些數(shù)據(jù)從一出爐,就意味著已經(jīng)是過(guò)時(shí)的歷史數(shù)據(jù)。紙質(zhì)年鑒更多時(shí)候可能從一出版,就決定了其更多的作用是“為國(guó)存史”的命運(yùn)。
為國(guó)存史固然是年鑒的重要作用之一,但是年鑒還需要參與當(dāng)下的社會(huì)實(shí)踐,為當(dāng)今時(shí)代服務(wù),才能不斷煥發(fā)生機(jī)活力。這就需要突破紙質(zhì)介質(zhì)的束縛,主動(dòng)參與大數(shù)據(jù)時(shí)代、擁抱大數(shù)據(jù)平臺(tái)。年鑒擁有強(qiáng)大而成熟的來(lái)稿途徑,擁有打破各單位壁壘的數(shù)據(jù)庫(kù),這是非常寶貴的資源,但條塊分割嚴(yán)重。建立相應(yīng)的保障機(jī)制,融合大數(shù)據(jù)技術(shù),重新分布和整合資源,在兼顧全面的基礎(chǔ)上,打破均衡原則,年鑒資源也可以變成平臺(tái)化的產(chǎn)品。平臺(tái)化的產(chǎn)品有點(diǎn)像共享經(jīng)濟(jì),本身并不生產(chǎn)內(nèi)容,借助別人生產(chǎn)內(nèi)容分享收益。地方綜合年鑒借助大數(shù)據(jù)中心技術(shù),把內(nèi)容提供給第三方,第三方基于內(nèi)容再生產(chǎn)深入加工還可以創(chuàng)造效益,這也是增加年鑒利用率的一種思考。
大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨,采集、處理某些特定數(shù)據(jù)的平臺(tái)和技術(shù)都已具備,決策的制定不再依賴于直覺(jué)或經(jīng)驗(yàn)判斷,而是建立在體量龐大的數(shù)據(jù)基礎(chǔ)上,讓數(shù)據(jù)智能化、智慧化,年鑒工作只有與時(shí)俱進(jìn),主動(dòng)擁抱和融入大數(shù)據(jù)熱潮,才能不斷煥發(fā)生機(jī)和活力,年鑒事業(yè)的大好局面才能順利開(kāi)展。(責(zé)編:樊譽(yù))
Enlightenment about Big Data Thinking Mode to Innovation of Local Comprehensive Yearbook
You Taoqin
游桃琴(1982—),女,江西省地方志編纂委員會(huì)辦公室,副主任科員,研究方向?yàn)槟觇b編纂。