周信泉
近年來,大數(shù)據(jù)技術(shù)發(fā)展風(fēng)起云涌,勢不可擋,已悄然滲透到包括檔案在內(nèi)的社會(huì)各行各業(yè),給檔案工作帶來前所未有的機(jī)遇和挑戰(zhàn)。檔案工作者只有更新觀念、順勢而為,充分運(yùn)用大數(shù)據(jù)技術(shù)發(fā)掘檔案里隱含的價(jià)值并加以開發(fā)利用,才能更好地服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展。
一、大數(shù)據(jù)是實(shí)現(xiàn)檔案資源高效利用的必然趨勢
服務(wù)性是檔案工作的根本屬性,即服務(wù)于黨和國家工作大局,服務(wù)于經(jīng)濟(jì)社會(huì)發(fā)展。長期以來,大量檔案只是躺在各單位的檔案柜里或系統(tǒng)里,其作用也僅限于為解決本地區(qū)、本單位工作中的問題或者作為解決糾紛的證據(jù),檔案的潛在價(jià)值并沒有得到充分發(fā)掘。在大數(shù)據(jù)時(shí)代,作為人類活動(dòng)和智力成果原始記錄的海量檔案無疑是大數(shù)據(jù)極其寶貴的來源。但海量檔案并不一定能夠產(chǎn)生海量的價(jià)值,它如同一座未開發(fā)的金礦不能產(chǎn)生價(jià)值一樣,必須經(jīng)過深加工和專業(yè)化處理。大數(shù)據(jù)技術(shù)恰恰是對(duì)檔案數(shù)據(jù)進(jìn)行專業(yè)化處理的新模式,它通過采集、存儲(chǔ)、管理和分析處理包括檔案數(shù)據(jù)在內(nèi)的龐大數(shù)據(jù),在各類數(shù)據(jù)之間建立關(guān)聯(lián),通過智能化的數(shù)據(jù)計(jì)算處理平臺(tái),形成具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn),從而為政府決策、企業(yè)經(jīng)營和其他檔案服務(wù)對(duì)象提供需要的全方位服務(wù),使政府決策、企業(yè)經(jīng)營等活動(dòng)更趨理性、客觀。正如美國前總統(tǒng)詹姆斯·加菲爾德所說,人類使用數(shù)據(jù),不應(yīng)該僅僅局限于用數(shù)據(jù)說話、用數(shù)據(jù)來支持自己的觀點(diǎn),而是要通過數(shù)據(jù)獲得啟示,發(fā)現(xiàn)新的知識(shí)和規(guī)律。大數(shù)據(jù)恰恰為我們從檔案數(shù)據(jù)中發(fā)現(xiàn)新的知識(shí)和規(guī)律提供了一個(gè)捷徑。例如交通部門借助大數(shù)據(jù)平臺(tái)中的車輛型號(hào)、地區(qū)分布等檔案數(shù)據(jù)決定新建或改建娜條公路以及公路建設(shè)標(biāo)準(zhǔn);醫(yī)生借助病例檔案大數(shù)據(jù),探尋某類傳染性疾病致病源,提出疾病預(yù)防的有效對(duì)策和個(gè)性化診療方案,等等。
二、數(shù)據(jù)共享是實(shí)現(xiàn)檔案數(shù)據(jù)高效利用的必然途徑
數(shù)據(jù)的價(jià)值在于共享,大數(shù)據(jù)只有在高度共享的環(huán)境中才能更好地發(fā)揮作用,但共享的前提是開放。隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)就像傳統(tǒng)的“人、財(cái)、物”一樣,成為重要的生產(chǎn)資料和創(chuàng)新資源,其內(nèi)開放的程度,將決定一個(gè)國家發(fā)展的動(dòng)力、一個(gè)社會(huì)創(chuàng)新的活力。①因此,實(shí)現(xiàn)檔案資源的開放共享必須做好檔案數(shù)據(jù)的內(nèi)開放,即向國內(nèi)機(jī)關(guān)、企事業(yè)單位、本國公民開放。一是打造高效的檔案數(shù)據(jù)共享平臺(tái)。要打破各單位的“信息孤島”狀態(tài),推動(dòng)檔案部門與其他部門的互聯(lián)互通,逐步實(shí)現(xiàn)檔案數(shù)據(jù)的無障礙傳輸,實(shí)現(xiàn)各類檔案數(shù)據(jù)的在線歸檔、在線移交接受和在線利用。在此基礎(chǔ)上,以國家大數(shù)據(jù)平臺(tái)建設(shè)為依托,打造標(biāo)準(zhǔn)統(tǒng)一的檔案數(shù)據(jù)收集平臺(tái)、智能化的檔案數(shù)據(jù)處理平臺(tái)和服務(wù)精準(zhǔn)化的搜索應(yīng)用平臺(tái),為檔案數(shù)據(jù)的開放共享提供軟、硬件支持。二是建立檔案數(shù)據(jù)開放體系。要建立以檔案管理機(jī)構(gòu)為內(nèi)核、各類政府公共服務(wù)機(jī)構(gòu)為中層,企業(yè)檔案數(shù)據(jù)為外圍的多層次檔案開放共享體系。根據(jù)檔案性質(zhì)、檔案密級(jí)、檔案所有制形式將檔案數(shù)據(jù)設(shè)置不同的開放等級(jí),同時(shí)對(duì)檔案數(shù)據(jù)訪問用戶賦予不同的權(quán)限等級(jí),使具有相應(yīng)訪問權(quán)限的用戶訪問對(duì)應(yīng)的公開范圍內(nèi)的檔案數(shù)據(jù)。三要實(shí)施檔案大數(shù)據(jù)開放利益分配激勵(lì)機(jī)制。對(duì)涉及群眾公共利益的如產(chǎn)品質(zhì)量、食品衛(wèi)生、藥物安全等大部分公共檔案數(shù)據(jù)而言,其開放應(yīng)該是免費(fèi)的。對(duì)于許多企事業(yè)單位和個(gè)人的檔案數(shù)據(jù)而言應(yīng)當(dāng)是收費(fèi)的,即數(shù)據(jù)利用方利用檔案數(shù)據(jù)從事生產(chǎn)經(jīng)營活動(dòng)產(chǎn)生的收益,應(yīng)當(dāng)在檔案數(shù)據(jù)提供方和檔案數(shù)據(jù)使用方之間建立合理的利益分配機(jī)制,以此來激勵(lì)更多的企業(yè)、個(gè)人實(shí)施檔案數(shù)據(jù)開放共享。
三、確保安全是實(shí)現(xiàn)檔案資源高效利用前提條件
大數(shù)據(jù)時(shí)代,數(shù)據(jù)安全是頭等大事。沒有數(shù)據(jù)開放,就難以形成大規(guī)模的數(shù)據(jù)應(yīng)用,沒有數(shù)據(jù)安全就沒有國家安全和社會(huì)和諧穩(wěn)定,因此數(shù)據(jù)開放利用要以保障數(shù)據(jù)安全為前提。一要確保數(shù)據(jù)主權(quán)在我。要確保國家對(duì)在我國境內(nèi)產(chǎn)生的檔案數(shù)據(jù)的有效管轄權(quán),保障本國檔案數(shù)據(jù)不受他國侵害,在管理和利用方面具有獨(dú)立自主性。二要完善檔案數(shù)據(jù)安全的技術(shù)支持。當(dāng)前,相當(dāng)一部分檔案數(shù)據(jù)涉及保密,稍有不慎,就容易出現(xiàn)數(shù)據(jù)安全問題。一方面要加強(qiáng)信息安全技術(shù)研究,建設(shè)高效的數(shù)據(jù)安全防護(hù)系統(tǒng),如采取分散化存儲(chǔ)、分離密鑰等技術(shù)手段,提高數(shù)據(jù)安全等級(jí)。另一方面,對(duì)于許多涉及公眾利益確實(shí)需要公開的檔案數(shù)據(jù),實(shí)施“人工數(shù)據(jù)合成”,即利用人為手段,產(chǎn)生一些統(tǒng)計(jì)特征和原始數(shù)據(jù)一樣的人工虛擬數(shù)據(jù),以虛擬的數(shù)據(jù)數(shù)值取代敏感數(shù)據(jù)字段,從而保證原始檔案數(shù)據(jù)不會(huì)泄露。三要制定并完善檔案數(shù)據(jù)安全制度體系。各有關(guān)單位要按照統(tǒng)一標(biāo)準(zhǔn),建立檔案分級(jí)制度和用戶等級(jí)制度,能公開的用來建設(shè)檔案大數(shù)據(jù),不能公開的依法進(jìn)行嚴(yán)格管理。針對(duì)檔案大數(shù)據(jù)的密級(jí)程度和用戶需求不同,對(duì)檔案數(shù)據(jù)和用戶設(shè)置不同的訪問權(quán)限等級(jí),并對(duì)訪問權(quán)限做出一定的控制。從國家層面,要制定并完善得個(gè)人信息安全、信息主權(quán)的配套法律法規(guī),用法律來界定信息主體、信息主權(quán)的邊界,在此基礎(chǔ)上積極推動(dòng)全球數(shù)據(jù)安全公約,實(shí)現(xiàn)數(shù)據(jù)安全的全球化治理。
參考文獻(xiàn):
[1] 《數(shù)據(jù)之巔》[M].中信出版社,涂子沛,2014
(作者單位:濰坊市坊子區(qū)公路局)
科學(xué)導(dǎo)報(bào)·學(xué)術(shù)2019年8期