尹鎖強
(延邊職業(yè)技術學院,吉林 延吉 133000)
隨著大數(shù)據(jù)技術的不斷發(fā)展,數(shù)據(jù)包技術已成為當前大數(shù)據(jù)處理的重要方式。 數(shù)據(jù)包技術可對多類信息進行處理,批量完成信息處理任務,數(shù)據(jù)信息發(fā)展時產(chǎn)生的相關隱患、障礙等問題,通過數(shù)據(jù)包的數(shù)據(jù)分析處理技術可以得到有效解決,使其更加科學化[1]。 可見,在網(wǎng)絡數(shù)據(jù)包的大數(shù)據(jù)中,數(shù)據(jù)處理工作可通過程序本體進行自動處理、轉化,從根本上完善了數(shù)據(jù)處理系統(tǒng),使其應用效果逐漸加強,防止最終功能弱化。 如今,隨著計算機網(wǎng)絡技術發(fā)展,產(chǎn)生了更多大數(shù)據(jù)處理系統(tǒng),滿足了更多類型的處理需求,本文針對這一技術性方案展開討論。
網(wǎng)絡數(shù)據(jù)包中的數(shù)據(jù)處理技術可完成大任務量,在網(wǎng)絡數(shù)據(jù)發(fā)展的同時,會遇到一定的問題,可通過數(shù)據(jù)分析處理進行控制。 在大數(shù)據(jù)分析程序設計中,云計算可加快數(shù)據(jù)處理速度。 結合環(huán)境進行數(shù)據(jù)處理,加強對接傳輸,進而完善程序運行控制。 大數(shù)據(jù)信息量大,因此需要大工作環(huán)境,而大工作環(huán)境下,程序會自動將處理能力向FB 級轉化,可優(yōu)化處理效率,防止出現(xiàn)相關問題,同時大數(shù)據(jù)環(huán)境可開展批量處理,對客戶信息統(tǒng)計進行分類處理。
地圖縮減(Map Reduce,MR)是如今應用頻繁的大數(shù)據(jù)處理系統(tǒng),可滿足大數(shù)據(jù)的大規(guī)模要求[2]。 在MR系統(tǒng)工作時,可將不同類型的大數(shù)據(jù)信息進行整合,同時具有一定效率,將各類型的大數(shù)據(jù)信息形成常態(tài)、正規(guī)的處理模型,是當前大數(shù)據(jù)處理的主流技術之一,具有較好的自動化處理能力,運算效果強,人工操作簡單,可方便用戶理解。 大數(shù)據(jù)處理應用MR 系統(tǒng)進行數(shù)據(jù)處理時,可暫時隱蔽復雜處理過程,簡化顯示界面,從而提升其操作簡單性。 同時,MR 系統(tǒng)存在學習記憶、挖掘數(shù)據(jù)及算法應用等相關功能,在這些功能被應用的同時,也在不斷拓展與加深,使大數(shù)據(jù)的管理環(huán)境更為堅實,符合現(xiàn)代大數(shù)據(jù)處理要求。 記憶功能可將所處理的信息編入歷史數(shù)據(jù)庫資源,隨著大數(shù)據(jù)信息資源的不斷增加,記憶功能可參照大量歷史數(shù)據(jù)對其他數(shù)據(jù)信息進行有效處理,大大縮短了處理時間,提升了處理效率。 技術的發(fā)展與進步使大數(shù)據(jù)信息不斷增加,提高了高端數(shù)據(jù)處理的要求。
網(wǎng)絡存在一定開放性的特點,致使目標系統(tǒng)容易受到攻擊。 互聯(lián)網(wǎng)技術具有開放性,具有信息共享特征,雖然為互聯(lián)網(wǎng)用戶帶來了便利,提升了知識認知,但也為黑客提供了可乘之機。 對于互聯(lián)網(wǎng)而言,開放與安全一直都存在一定的對立面,一旦開放過大,目標系統(tǒng)便易受攻擊,黑客乘虛而入,網(wǎng)絡安全難以保障;一旦安全系數(shù)增加,開放性也存在一定縮減,致使網(wǎng)絡信息的溝通、交流效率下降,不符合社會的飛速發(fā)展,有悖于互聯(lián)網(wǎng)的開放初衷。
電腦運行與軟件開發(fā)、運行、更新時,往往存在一定的軟件漏洞,黑客會憑借相關漏洞乘虛而入,對計算機網(wǎng)絡展開攻擊。 軟件運行、升級時,漏洞難以避免,其中微軟“視窗”系統(tǒng)是最為常見的漏洞,因此在其軟件正式上架、運行前,應通過大量的內部測試與外部測試,尋找其問題、漏洞并及時修補,防止黑客入侵,然而即便是測試,依舊會在軟件運行時出現(xiàn)一些漏洞[3]。可見“視窗”操作系統(tǒng)與網(wǎng)絡瀏覽器中,都存在可危害網(wǎng)絡的漏洞,致使整個網(wǎng)絡系統(tǒng)得不到安全保障。 同時,網(wǎng)站執(zhí)行開發(fā)程序時,部分網(wǎng)絡開發(fā)用戶在接口程序期間未通過科學、合理的標準過濾程序,致使黑客通過指令輸入直接對數(shù)據(jù)庫產(chǎn)生嚴重破壞。
大數(shù)據(jù)的信息處理應用周期性方法,將數(shù)據(jù)整體在處理系統(tǒng)中分為多個單元格,再以單元格為目標將上面的任務依次處理完成,提升各單元格的精準度,進而達到大數(shù)據(jù)的分析標準。 然而,此類處理方式會產(chǎn)生較多單元格,處理海量的信息,往往需要較長的處理時間,因此無法提升效率,信息處理的速度過低。 同時,單元格內每個數(shù)據(jù)都需要經(jīng)過分析計算,在計算時需對各項任務進行分析處理,而網(wǎng)絡數(shù)據(jù)包中有大量任務需要處理,這也是當前常用的技術方法,其數(shù)據(jù)分析構成模型如圖1 所示。
圖1 BSP 計算模式的結構狀態(tài)(模型)
根據(jù)圖1 可以看出,系統(tǒng)會自動將需要分析處理的數(shù)據(jù)進行匯總整理,將數(shù)據(jù)轉化為等待處理形式,在劃分單元的結構上,通過多種處理進而節(jié)省一定時間,提高效率。 在超級處理步驟中,可同時啟動多項處理器,使其共同參與,加強全局的通信系統(tǒng),將網(wǎng)絡環(huán)境中獲取的相關數(shù)據(jù),通過板級支持包(Board Support Package,BSP)計算模式整合為需要的模式[4],而傳統(tǒng)的處理模式需要較多時間進行調動,因此效率較低,時間較長,需進一步改進。
BSP 系統(tǒng)中含有超級步驟,在此環(huán)節(jié)中,若應用處理器進行數(shù)據(jù)信息的處理與傳送,會消耗大量時間,還要處理各類信息的上限,因此在大數(shù)據(jù)的開發(fā)過程中,BSP 無法達到最好的使用效果。 在網(wǎng)絡環(huán)境下,對大數(shù)據(jù)程序的開發(fā)與設計,應加強其系統(tǒng)化、正規(guī)化,完善存儲環(huán)境,而現(xiàn)代BSP 運行模式下,尚未滿足大數(shù)據(jù)程序的開發(fā)與設計要求,處理問題的能力存在不足。第一,在超級處理過程中,對存儲空間要求嚴格,在數(shù)據(jù)的傳輸過程中,會占用部分網(wǎng)絡位置,致使網(wǎng)絡的適應與信息傳統(tǒng)出現(xiàn)卡頓、延遲問題,無法在規(guī)定時間內滿足相關任務,傳輸效率過低,用戶的網(wǎng)絡使用效果差。 第二,在BSP 系統(tǒng)的主要工作內容為處理量與對應網(wǎng)絡需求之間存在問題及矛盾,而在運算模式層面,BSP 模式仍存在一定不足,需進行改進與創(chuàng)新,優(yōu)化運行效果,對于在運算中即將出現(xiàn)或可能出現(xiàn)的問題,需加強篩選,通過有效地防控措施提升其運行能力,防止大數(shù)據(jù)的整體功能受到影響與阻礙。
SAT 模型邏輯分層分為3 個結構,S 層對數(shù)據(jù)進行分隔,避免在進行數(shù)據(jù)的分析處理過程中出現(xiàn)干擾;A層為數(shù)據(jù)分析處理過程中的任務操作穩(wěn)定性,根據(jù)大數(shù)據(jù)特征進行針對性的信息規(guī)劃,進而達到最佳的處理效果;T 層為數(shù)據(jù)分析中的加工整合,加強具體包裝,對應實際情況,根據(jù)不同數(shù)據(jù)分析特征對數(shù)據(jù)進行優(yōu)化,使其符合大數(shù)據(jù)的數(shù)據(jù)包應用特征,對相關任務進行控制,進而提升效率與數(shù)據(jù)分析速度[5]。 SAT 模型邏輯具體流程如圖2 所示。
圖2 SAT 模型大數(shù)據(jù)分析流程
通過圖2 可以看出,SAT 模型中,大數(shù)據(jù)處理對各個人物的處理劃分明確,具有一定系統(tǒng)性,在處理過程中,針對可能出現(xiàn)的問題進行充分解決,各個模塊都加入了防御程序,進而使分析效果達到最佳,與之相匹配的數(shù)據(jù)分析任務結果更為理想。 可見,大數(shù)據(jù)分析速度的提升,5 個功能的模塊可統(tǒng)一控制,減少了中間處理環(huán)節(jié),提高了分析速度,同時還可調動多個系統(tǒng)相互合作,共同完成任務,實現(xiàn)在總控制中應用分控制,和諧轉換,具有更好的處理效果,可直接展現(xiàn)分析結果。
4.2.1 數(shù)據(jù)預處理
為加強大數(shù)據(jù)信息的使用,對其進行預處理,結合實際情況觀察分析數(shù)據(jù),保證其使用時符合實際情況,在網(wǎng)絡數(shù)據(jù)包基礎上,開展數(shù)據(jù)分析與處理,通過云計算,可加強數(shù)據(jù)的信息處理,待其處理完畢,分析任務,將其分為若干模塊,通過確定屬性提升其性能,結合相關技術模式對問題進行分析、處理,探究相關對策,形成預處理聯(lián)系,進而確認屬性。 對信息的模糊預處理,可節(jié)省較多時間,將更多處理精力放在重點信息上,對任務進行深入探究,提出處理辦法,提升其操作效果。 完成模糊處理后,對篩選數(shù)據(jù)進行二次分析,令數(shù)據(jù)進入分析程序循環(huán)鏈,此時,循環(huán)流程至關重要,在同時進行多項任務時,不僅要提升速度與效率,還需保證結果更為理想,控制程序的有序進行,建立環(huán)境基礎。
4.2.2 刪除失效數(shù)據(jù)
預處理操作與任務分析工作完成后,對現(xiàn)場進行預處理。 此時,一旦信息處理結果與實際不符,需將無用數(shù)據(jù)刪除,此工作一般在程序中自動完成,刪除實銷數(shù)據(jù)可提升內部存儲空間。 數(shù)據(jù)庫內部可完成數(shù)據(jù)分析,處理復雜問題,與大數(shù)據(jù)的價值稀疏性特征相結合,優(yōu)化數(shù)據(jù)的分析、存儲、執(zhí)行。 同時將大數(shù)據(jù)的存儲、感知、計算等原則結合,探究其性能評價體系與流失數(shù)據(jù)計算框架,分析系統(tǒng)性能,高效提取大數(shù)據(jù)所需數(shù)據(jù)。
4.2.3 基于網(wǎng)絡數(shù)據(jù)包的文件下載
系統(tǒng)按照大數(shù)據(jù)任務對有效文件進行下載,流程如圖3 所示,并將其應用到合適的控制模塊中。 通過圖3 可以看出,程序先是進行檢索,將其連接到有用的判斷中,一旦被判斷為無用,可對其進行重新獲取,直至其范圍與需求一致,才可進入下載,針對網(wǎng)絡數(shù)據(jù)包的基礎,下載可用文件夾進入數(shù)據(jù)使用環(huán)節(jié),大數(shù)據(jù)的分析也與之保持一致。 大數(shù)據(jù)分析環(huán)節(jié)易出現(xiàn)隱患,因此需加強文件夾的審核,確定精準程度,再次進入分析環(huán)節(jié),高效完成任務[6]。
圖3 文件下載流程
4.2.4 系統(tǒng)功能初始化
將操作數(shù)據(jù)文件設置為初始化狀態(tài),節(jié)省信息篩選時間,引入系統(tǒng)運行所需信息,同時通過清除與恢復功能,將相關程序開發(fā)階段的控制功能納入規(guī)劃方案,落實細節(jié)達到相關需求,自動恢復無效內容,進而優(yōu)化空間,提高后續(xù)任務效率。
綜上所述,批量化處理可結合大數(shù)據(jù)程序運行特征,加強其運用,面對復雜多變的大數(shù)據(jù)環(huán)境將客戶信息歸總,實施數(shù)據(jù)處理,將得出的結果納入后續(xù)分析鏈條中,即可完成程序運行處理任務。