楊仙瑜 李章華 曹澤
摘要: 隨著數(shù)字經(jīng)濟下大數(shù)據(jù)、云平臺、互聯(lián)網(wǎng)、區(qū)塊鏈技術(shù)的不斷完善和發(fā)展[1],傳統(tǒng)的數(shù)據(jù)恢復(fù)技術(shù)已經(jīng)無法有效地處理海量數(shù)據(jù)集合中發(fā)生的數(shù)據(jù)災(zāi)難。本文探索以人工智能數(shù)據(jù)技術(shù)應(yīng)用于數(shù)據(jù)恢復(fù)領(lǐng)域,提升傳統(tǒng)數(shù)據(jù)恢復(fù)算法的計算能力,對海量數(shù)據(jù)進行實時、高效、準(zhǔn)確地處理,實現(xiàn)數(shù)據(jù)準(zhǔn)確、高效的重構(gòu)和恢復(fù)。
關(guān)鍵詞:人工智能; 數(shù)據(jù)恢復(fù); 海量數(shù)據(jù); 重構(gòu);
0 引言
大數(shù)據(jù)時代的到來,標(biāo)志著數(shù)據(jù)將成為人類發(fā)展的關(guān)鍵。隨著大數(shù)據(jù)、5G技術(shù)、互聯(lián)網(wǎng)技術(shù)、人工智能技術(shù)、區(qū)塊鏈技術(shù)的不斷完善和發(fā)展,對傳統(tǒng)的數(shù)據(jù)恢復(fù)技術(shù)帶來了變革和挑戰(zhàn),傳統(tǒng)的數(shù)據(jù)恢復(fù)技術(shù)已經(jīng)無法有效地處理海量數(shù)據(jù)集合中發(fā)生的數(shù)據(jù)災(zāi)難[2]。因此,開發(fā)一款集互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)的人工智能數(shù)據(jù)恢復(fù)軟件成為解決這一問題的關(guān)鍵,人工智能數(shù)據(jù)恢復(fù)軟件將人工智能和傳統(tǒng)的數(shù)據(jù)恢復(fù)技術(shù)相結(jié)合,提升傳統(tǒng)數(shù)據(jù)恢復(fù)算法的計算能力,對海量數(shù)據(jù)進行實時、高效、準(zhǔn)確地處理,實現(xiàn)數(shù)據(jù)準(zhǔn)確、高效的重構(gòu)和恢復(fù)。
通過人工智能數(shù)據(jù)恢復(fù)軟件的研發(fā),可對海量數(shù)據(jù)進行實時、高效、準(zhǔn)確地處理和恢復(fù),滿足大數(shù)據(jù)時代與日劇增的數(shù)據(jù)恢復(fù)需求,通過機器學(xué)習(xí),預(yù)測分析數(shù)據(jù)丟失的因素,通過不斷地模擬學(xué)習(xí),不斷調(diào)整算法以從各種不同的場景中實現(xiàn)數(shù)據(jù)的恢復(fù)。
1 人工智能數(shù)據(jù)恢復(fù)介紹
數(shù)據(jù)恢復(fù)技術(shù)是指通過各種技術(shù)手段對丟失和遭到破壞的數(shù)據(jù)進行恢復(fù)和重建,是一種跨硬件平臺、軟件系統(tǒng),包容了操作系統(tǒng)、文件格式、數(shù)據(jù)庫結(jié)構(gòu)、數(shù)據(jù)存儲原理、存儲硬件設(shè)計等多種要素的綜合技術(shù)數(shù)據(jù)恢復(fù)。傳統(tǒng)的數(shù)據(jù)恢復(fù)技術(shù)即通過恢復(fù)軟件、恢復(fù)設(shè)備對存儲介質(zhì)的數(shù)據(jù)進行恢復(fù)的過程,傳統(tǒng)數(shù)據(jù)恢復(fù)軟件由于受存儲介質(zhì)的制約,數(shù)據(jù)恢復(fù)針對性強,擴展性差,沒有形成規(guī)?;幕謴?fù)。
人工智能數(shù)據(jù)恢復(fù)技術(shù)即將大數(shù)據(jù)、互聯(lián)網(wǎng)技術(shù)、人工智能等技術(shù)和傳統(tǒng)的數(shù)據(jù)恢復(fù)技術(shù)相結(jié)合,對傳統(tǒng)數(shù)據(jù)恢復(fù)技術(shù)進行變革,提升傳統(tǒng)數(shù)據(jù)恢復(fù)算法的計算能力,對海量數(shù)據(jù)進行實時、高效、準(zhǔn)確地處理,實現(xiàn)數(shù)據(jù)準(zhǔn)確、高效的重構(gòu)和恢復(fù)的技術(shù),人工智能數(shù)據(jù)恢復(fù)軟件擴展性強,通過預(yù)測分析模型,更好地將不同的代碼串在一起,以確保它被正確地重構(gòu),實現(xiàn)對各種不同的場景中數(shù)據(jù)的恢復(fù)。人工智能數(shù)據(jù)恢復(fù)軟件集成多款數(shù)據(jù)恢復(fù)功能,通過預(yù)測分析,加入了智能分析的因素,使得系統(tǒng)可以不依靠固定介質(zhì),具有系統(tǒng)推廣性強、適應(yīng)范圍更廣、數(shù)據(jù)恢復(fù)準(zhǔn)確率更高以及恢復(fù)效率快等特點。
2人工智能數(shù)據(jù)恢復(fù)原理及技術(shù)路線
人工智能數(shù)據(jù)恢復(fù)的原理即對丟失和遭到破壞的數(shù)據(jù)進行重構(gòu)的過程。存儲介質(zhì)數(shù)據(jù)丟失后,數(shù)據(jù)內(nèi)部結(jié)構(gòu)被打亂成亂碼,需要通過算法進行重組和拼合,系統(tǒng)結(jié)合大數(shù)據(jù)獲取海量數(shù)據(jù)恢復(fù)案例,通過機器學(xué)習(xí)對算法進行清洗和提取,對具體的數(shù)據(jù)恢復(fù)案例進行智能分析,根據(jù)分析結(jié)果選擇最佳的算法。同時通過深度學(xué)習(xí)不斷調(diào)整算法,對預(yù)測分析模型進行訓(xùn)練,將代碼進行重構(gòu),從而實現(xiàn)數(shù)據(jù)恢復(fù)。
綜上,人工智能數(shù)據(jù)恢復(fù)路線如下圖:
3 人工智能數(shù)據(jù)恢復(fù)關(guān)鍵技術(shù)
人工智能數(shù)據(jù)恢復(fù)系統(tǒng)采用的技術(shù)有數(shù)據(jù)備份技術(shù)、碎片重組技術(shù)、數(shù)據(jù)重構(gòu)技術(shù)、數(shù)據(jù)遷移技術(shù)、互聯(lián)網(wǎng)技術(shù)、機器學(xué)習(xí)技術(shù)和深度學(xué)習(xí)技術(shù)等。
數(shù)據(jù)備份技術(shù):即以只讀的方式對故障系統(tǒng)做完整鏡像的技術(shù),主要采用逐檔及鏡像兩種手段。
碎片重組技術(shù):即基于信息熵特征提取算法,結(jié)合支持向量機作為分類器來分類文件碎片,并使用基于磁盤簇邏輯順序的重組算法對文件碎片進行重組的技術(shù);
數(shù)據(jù)重構(gòu)技術(shù):指根據(jù)損壞的NTFS文件系統(tǒng)殘留信息對文件進行初揀的技術(shù);
數(shù)據(jù)遷移技術(shù):對歷史數(shù)據(jù)進行清洗、轉(zhuǎn)換,并轉(zhuǎn)載到新系統(tǒng)的過程;
互聯(lián)網(wǎng)技術(shù):指互聯(lián)網(wǎng)的技術(shù)、平臺、商業(yè)模式和應(yīng)用與移動通信技術(shù)結(jié)合并實踐的技術(shù),用戶使用手機、平板電腦等移動終端,通過移動網(wǎng)絡(luò)獲取互聯(lián)網(wǎng)服務(wù)。
機器學(xué)習(xí)技術(shù):機器學(xué)習(xí)是人工智能(Artificial Intelligence, AI)的核心,是使計算機具有智能的根本途徑,它主要使用歸納、綜合而不是演繹。機器學(xué)習(xí)就是探究和開發(fā)一系列算法來如何使計算機不需要通過外部明顯的指示,而可以自己通過數(shù)據(jù)來學(xué)習(xí)建模,并且利用建好的模型和新的輸入來進行預(yù)測的學(xué)科;
深度學(xué)習(xí)技術(shù):深度學(xué)習(xí)是基于機器學(xué)習(xí)延伸出來的一個新的領(lǐng)域,由以人大腦結(jié)構(gòu)為啟發(fā)的神經(jīng)網(wǎng)絡(luò)算法為起源加之模型結(jié)構(gòu)深度的增加發(fā)展,并伴隨大數(shù)據(jù)和計算 能力的提高而產(chǎn)生的一系列新的算法。
4人工智能數(shù)據(jù)恢復(fù)應(yīng)用研究
將人工智能技術(shù)應(yīng)用于數(shù)據(jù)恢復(fù)領(lǐng)域,需要解決的問題包括:
1)基于信息熵特征提取算法,結(jié)合支持向量機作為分類器來分類文件碎片,使用重組算法對文件碎片進行重組;
2)通過機器學(xué)習(xí)對算法進行清洗和提取,對具體的數(shù)據(jù)恢復(fù)案例進行智能分析,根據(jù)不同的場景選擇不同的算法;
3)結(jié)合人工智能和數(shù)據(jù)共享模式,建立云南省數(shù)據(jù)恢復(fù)共享服務(wù)平臺。
4 結(jié)語
目前,我國信息化建設(shè)高歌猛進,人工智能與數(shù)據(jù)恢復(fù)技術(shù)的結(jié)合是時代發(fā)展的需求[3],如何處理海量數(shù)據(jù),如何保障數(shù)據(jù)安全已成為數(shù)據(jù)恢復(fù)領(lǐng)域研究的熱點,本文從人工智能數(shù)據(jù)恢復(fù)原理、涉及關(guān)鍵技術(shù)以及應(yīng)用需要解決的問題進行探討,為人工智能數(shù)據(jù)恢復(fù)軟件的開發(fā)提供支撐,為進一步提供數(shù)據(jù)安全性提供前期研究。
參考文獻
崔校郡.新時期大數(shù)據(jù)分析與應(yīng)用關(guān)鍵技術(shù)研究[J].信息技術(shù)與信息化,2020:204-206.
田兵,嚴(yán)文濤,李明,殷齊林,郭爽爽.海量結(jié)構(gòu)化數(shù)據(jù)實時恢復(fù)技術(shù)研究[J].自動化與儀器儀表,2019:133-135+139.
董磊,崔永波.新時期數(shù)據(jù)恢復(fù)技術(shù)應(yīng)用與研究[J].電子世界,2019:132-132.
作者簡介:
楊仙瑜(1990-),女,云南,工程師,2014年畢業(yè)于云南大學(xué),主要從事軟件系統(tǒng)研發(fā)相關(guān)的工作。