李莉
摘 ?要:大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,個人數(shù)字檔案逐步取代傳統(tǒng)紙質(zhì)檔案成為個人信息管理的主要方式,且個人數(shù)字檔案的內(nèi)容、樣式更豐富,安全性也更高。針對各個數(shù)字檔案的分類管理問題,提出基于元數(shù)據(jù)和標簽的分類管理模式,提升信息分類查詢和提取效率的同時還附帶了定位功能,且能夠滿足一定的社交要求;在個人檔案的隱私保護方面,以私鑰加密為基礎(chǔ)采用CA電子證書認證的方式,在大數(shù)據(jù)和開放的網(wǎng)絡(luò)環(huán)境下提升個人隱私保護的安全等級。
關(guān)鍵詞:大數(shù)據(jù);個人數(shù)字檔案;分類管理;隱私保護;檔案管理
Abstract: In the big data network environment, personal digital Archives gradually replace the traditional paper Archives as the main way of personal information management, and the content, style and security of personal digital Archives are richer. Aiming at the classification management of digital Archives, a classification management mode based on metadata and tags is proposed to improve the efficiency of information classification query and extraction, and at the same time, it also has positioning function, which can meet certain social requirements; In the privacy protection of personal files, based on private key encryption, CA electronic certificate authentication is adopted to improve the security level of personal privacy protection in the big data and open network environment.
Keywords: Big data; Personal digital archives; Classified management; Privacy protection; Archives management
在大數(shù)據(jù)環(huán)境下,個人檔案的數(shù)字化管理與傳統(tǒng)管理模式相比,具有更重要的意義和價值。當前,在云存儲技術(shù)的支持下,個人數(shù)字檔案可以被存儲于云端,進一步提高了個人數(shù)字檔案的安全性。本文在大數(shù)據(jù)環(huán)境下,深入研究了個人數(shù)字檔案資源體系的變化,分類管理的方法,及具體的加密防護措施,通過對個人數(shù)字檔案的優(yōu)化管理的加密處理,進一步提升個人數(shù)字檔案的管理效率及安全性。
1 大數(shù)據(jù)環(huán)境下個人檔案管理資源體系的變化
1.1 數(shù)字化個人檔案數(shù)量多,來源廣泛。當前我國個人檔案的普及率明顯提高,在傳統(tǒng)個人檔案管理模式下,丟失的、不完整的或被損壞的檔案占很大比例。在推進個人檔案管理數(shù)字化工作以后,個人檔案的總體數(shù)量和完整度都有很大程度的改善。尤其是在大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,個人檔案數(shù)據(jù)的來源呈現(xiàn)出社會化和平民化的趨勢,檔案數(shù)據(jù)的來源也更為廣泛。
1.2 個人數(shù)字檔案數(shù)據(jù)內(nèi)容、樣式更加豐富。數(shù)字檔案的載體樣式較為豐富,具體包括文本類、圖像類、視頻類、音頻類等,同一組信息能夠通過不同的樣式展現(xiàn)出來,也更方便用戶查詢和調(diào)用信息。個別特殊復(fù)雜個人檔案,如含有過多半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),需要借助大數(shù)據(jù)和云計算工具處理。個人檔案復(fù)雜化,是未來網(wǎng)絡(luò)大數(shù)據(jù)時代的主要發(fā)展趨勢之一,也是評價個人素質(zhì)、能力的主要依據(jù)之一。
1.3 個人數(shù)字檔案的采集方式趨于多樣化。個人數(shù)字檔案的一些基礎(chǔ)信息主要來源于歷史檔案,隨著個人履歷的增長,一些重要的有價值的信息會被及時地填充到檔案系統(tǒng)當中。權(quán)威的網(wǎng)絡(luò)信息是個人數(shù)字檔案的有效補充,能夠讓個人檔案更豐富、完整,也便于檔案的使用者調(diào)用相關(guān)信息。
2 基于元數(shù)據(jù)和標簽的個人數(shù)字檔案管理
分類存儲和管理是個人檔案管理的核心,也是數(shù)字檔案處理的首個步驟,本文利用元數(shù)據(jù)和個性化標簽對原始個人檔案進行分類,并建立完善的查詢索引和目錄,個人數(shù)字檔案的分類管理循環(huán)過程描述如圖1。
個人數(shù)字檔案在歸檔和存儲前,需要一定的標準分類,例如可以按數(shù)字檔案的年度分類或按數(shù)字檔案的類型分類。其中,按照檔案類型分類的方式更利于檔案信息的查詢和修改,個人數(shù)字檔案類型分類具體包括個人數(shù)字相片、數(shù)字視頻、數(shù)字音頻、個人郵件、個人郵箱微博等。個人數(shù)字相片是最基本的數(shù)字檔案內(nèi)容,在檔案分類中為個人數(shù)字相片添加元數(shù)據(jù)標簽,可以增加與其他信息項的關(guān)聯(lián)關(guān)系以便于查詢,同時也起到防偽和避免個人數(shù)據(jù)丟失的作用。
個人數(shù)字檔案中的個人相片由數(shù)字照片、與之匹配的文字說明及EXIF(可交互圖像)信息等構(gòu)成。相片中的元數(shù)據(jù)可通過Adobe-Lightroom計算機軟件讀取和編輯處理,攜帶元數(shù)據(jù)的個人數(shù)字檔案在查詢、調(diào)用和修正等方面具有良好的安全性和便捷性。
Adobe-Lightroom是針對數(shù)字檔案元數(shù)據(jù)編輯和使用的一種高效信息管理軟件,既可以在相片中添加不同類型的元數(shù)據(jù),還可以根據(jù)數(shù)字相片中已有的元數(shù)據(jù)查詢用戶感興趣的信息。除了元數(shù)據(jù)之外,為個人檔案添加標簽也是分類管理的重要措施之一。首先,可以為個人檔案數(shù)字相片添加PICASA工具或GPS LOGGER工具,以上兩種工具都具有GPS定位功能,且與主流的IOS系統(tǒng)、ANDROID系統(tǒng)兼容,在移動網(wǎng)絡(luò)環(huán)境下即可進行數(shù)據(jù)的導(dǎo)入、調(diào)取和導(dǎo)出。其次,個人檔案管理系統(tǒng)中的個性化標簽與WE CHAT、MICROBLOG等社交軟件在網(wǎng)絡(luò)環(huán)境下實現(xiàn)兼容,滿足用戶在檔案處理中的社交需求。
隨著個人數(shù)字檔案資源的信息量不斷增多和應(yīng)用范圍的不斷拓展,電子檔案的重要性逐漸被更多用戶認可。個人電子檔案的分類管理中,按照檔案的元數(shù)據(jù)和標簽建立個人檔案索引目錄十分必要,根據(jù)檔案的元數(shù)據(jù)、文件名、位置信息、用戶名+密碼等不同的方式,能夠檢索出用戶需要的檔案信息。
由于個人每天都會產(chǎn)生大量的信息,包括位置信息、偏好信息、網(wǎng)絡(luò)瀏覽軌跡等,除了一些核心與關(guān)鍵的信息以外,絕大部分信息要被及時地覆蓋和清理掉,避免個人數(shù)字檔案的規(guī)模被無限制擴大,個人數(shù)字檔案管理系統(tǒng)會主動標記信息重要性的星級,通過循環(huán)同步更新更多重要的信息會被保留下來,而不重要、冗余的甚至錯誤的檔案信息會被系統(tǒng)當成臟數(shù)據(jù)清洗掉。
3 大數(shù)據(jù)模式下個人數(shù)字檔案的加密處理與保護
3.1 個人數(shù)字檔案的加密。目前個人數(shù)字檔案的加密主要通過密鑰實現(xiàn),密鑰作為一種從“明文-密文-明文”的計算機算法轉(zhuǎn)換參數(shù),更適合于海量大數(shù)據(jù)模式下的個人數(shù)字檔案加密。
密鑰根據(jù)加密的方式又細分為私鑰和公鑰,私鑰的加密過程運行速度快,但公鑰的加密方式更加靈活,兩種方式分別適用于不同的場景,其中個人數(shù)字檔案的加密處理更適合于私鑰加密和解密方式。
密鑰是個人數(shù)字檔案信息加密和解密的唯一憑證,具有較高的安全性,但密鑰的算法只能供個人數(shù)字檔案的使用者單獨使用;而公鑰的解密算法都是公開的,可以對外給其他人使用。
例如,CA證書是一種典型的私鑰類型,其由硬件部分和軟件部分構(gòu)成,CA證書是個人數(shù)字檔案信息提取的唯一憑證,經(jīng)過加密后具有較高的安全性和使用便捷性。為防止個人數(shù)字檔案數(shù)據(jù)丟失或被損毀,需要周期性地對個人檔案數(shù)據(jù)做備份處理。
3.2 個人數(shù)字檔案隱私的保護。就個人隱私保護而言,首先從根本上還是要依靠密鑰技術(shù)和網(wǎng)絡(luò)防火墻技術(shù)。[1]當前一些網(wǎng)絡(luò)病毒、蠕蟲和惡意攻擊手段都在變種和升級,針對攻擊手段的多樣化,個人隱私保護技術(shù)也要不斷地升級加以應(yīng)對。
在大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,面對規(guī)模不斷膨脹的個人數(shù)字檔案,只有不斷地提高技術(shù)水平和防御技術(shù),才能更好地保護個人檔案管理和存儲等方面的安全性。其次就個人層面而言,急需強化個人信息的自我保護意識?;ヂ?lián)網(wǎng)環(huán)境下個人數(shù)字檔案的重要性不斷升級,不僅關(guān)系到個人隱私的泄露,還會影響到個人的經(jīng)濟安全、個人信用乃至職業(yè)生涯。個人在注冊數(shù)字檔案時應(yīng)妥善管理自己的賬戶、密碼、私鑰等信息,不能夠在任何情況下透露私密信息,禁止或減少在公共網(wǎng)絡(luò)環(huán)境下或公共電腦終端登錄個人檔案信息。此外,還要定期地驗證自己的個人賬戶,發(fā)現(xiàn)異常及時聯(lián)系系統(tǒng)管理員排除異常因素。最后,個人數(shù)字檔案的安全防護已經(jīng)成為一個事關(guān)公眾隱私保護的普遍性問題。從國家和相關(guān)信息安全管理部門的角度來看,一方面應(yīng)從立法的角度將打擊網(wǎng)絡(luò)攻擊保護網(wǎng)絡(luò)安全寫入法律條例,提升法律對不法分子的震懾力。另一方面加強對網(wǎng)絡(luò)安全的宣傳與推廣工作,繼續(xù)推進網(wǎng)絡(luò)實名制和軟件使用的實名制工作,有效緩解網(wǎng)絡(luò)入侵和網(wǎng)絡(luò)攻擊,保護個人數(shù)字檔案和隱私的安全性。
4 保障措施
4.1 優(yōu)化數(shù)字檔案資源的采集方式,提升個人數(shù)字檔案資源整合的科學(xué)性。目前,半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)在數(shù)字資源體系中占據(jù)重要的地位,在個人數(shù)字檔案中,圖像、視頻、音頻、符號等是大數(shù)據(jù)背景下個人數(shù)字檔案資源的基礎(chǔ)。半結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)中,一些底層化、碎片化的數(shù)據(jù)中也包含著重要信息。因此,大數(shù)據(jù)環(huán)境下的個人數(shù)字檔案資源管理,應(yīng)從信息資源采集的多樣化和碎片化信息整合的角度提升分類管理的科學(xué)性。
4.2 拓寬數(shù)字檔案的服務(wù)范圍,進一步提升管理效率。大數(shù)據(jù)時代背景下,個人數(shù)字檔案服務(wù)會朝著個性化服務(wù)和智能化服務(wù)的方向發(fā)展,其中個性化服務(wù)以滿足用戶個性化需求為目標,注重管理細節(jié)的提升和服務(wù)范圍的拓展。只有從服務(wù)范圍、服務(wù)質(zhì)量和技術(shù)投入等層面入手,才能提高個人數(shù)字檔案的管理效率,更好地滿足用戶個性化、智能化的使用要求。
4.3 以技術(shù)防御為核心,加大對網(wǎng)絡(luò)安全技術(shù)革新的資金投入,強化個人數(shù)字檔案的安全服務(wù)標準。防御技術(shù)能力和水平提升仍舊是當前數(shù)字檔案管理和安全防護的首要問題,如果無法保證用戶個人數(shù)據(jù)和隱私的安全,個人數(shù)字檔案分類管理就失去了意義。[2]提升技術(shù)防御等級,一方面要做好系統(tǒng)軟硬件的適配工作,盡量減少個人數(shù)字檔案管理系統(tǒng)安全漏洞的產(chǎn)生;另一方面還要加大對個人隱私防火墻技術(shù)的資金投入和軟件升級力度,全方位保障用戶的個人因素安全。
質(zhì)疑。
參考文獻:
[1]孫大東,張歡笑.我國檔案網(wǎng)站隱私政策調(diào)查研究[J].檔案管理,2018(06):65-68.
[2]卞咸杰.大數(shù)據(jù)時代檔案信息資源共享平臺構(gòu)建的目標定位與實現(xiàn)[J].檔案管理,2020(05):75-76.
(作者單位:鄭州市第七人民醫(yī)院 來稿日期:2021-07-15)