孫金超
(天津中德應用技術大學,天津 300350)
隨著當前網(wǎng)絡技術的大規(guī)模應用,人們在使用網(wǎng)絡技術時生成各種類型數(shù)據(jù),將這些數(shù)據(jù)實施實時采集及分析,能夠提取一些具有高價值的數(shù)據(jù),可為人們的工作生活提供便利。大數(shù)據(jù)技術的合理使用,能夠針對海量數(shù)據(jù)實施高效處理,已在計算機信息系統(tǒng)中獲得有效應用,可提升系統(tǒng)功能性及數(shù)據(jù)處理能力,提升計算機信息系統(tǒng)服務質量,因此加強大數(shù)據(jù)技術在計算機信息系統(tǒng)中的應用研究意義重大。
1.1.1 處理海量數(shù)據(jù)
一般來說,大數(shù)據(jù)技術在應用時,實際儲存單位基本在TB級別及以上,而實際計算處理量則以PB級別實施具體計算。特別是基于當前大眾網(wǎng)絡生活及網(wǎng)絡辦公的趨勢下,各種應用及信息平臺被大量使用,導致實際數(shù)據(jù)產生量及處理量較大。
1.1.2 技術類型多樣化
技術類型多樣化是大數(shù)據(jù)應用的主要特征之一。目前,大數(shù)據(jù)來源較為廣泛,諸如數(shù)據(jù)采集裝置、行業(yè)信息、網(wǎng)絡數(shù)據(jù)等,其數(shù)據(jù)表現(xiàn)形式也不相同,具體的技術類型可大體分為結構化數(shù)據(jù)以及非結構化數(shù)據(jù)。結構化數(shù)據(jù)具體利用二維數(shù)據(jù)表現(xiàn)形式,實際數(shù)據(jù)形態(tài)相對規(guī)則,與結構化數(shù)據(jù)形態(tài)比較來說,非結構化數(shù)據(jù)結構規(guī)則性較差,并且相關數(shù)據(jù)模型隨機性加強,例如當前大眾生活中查看的各種圖片數(shù)據(jù)、音頻數(shù)據(jù)以及視頻數(shù)據(jù)等,均是非結構化數(shù)據(jù),其不可單獨利用二維數(shù)據(jù)表面形式[1]。
1.1.3 數(shù)據(jù)處理速度快、效率高
基于當前信息時代的主要特征,信息增長速度及信息采集量顯著增加,特別是大眾應用一些信息軟件或者登錄信息過程中便會產生及接收大量信息,而大數(shù)據(jù)技術合理應用,可根據(jù)不同要求在較短時間內實現(xiàn)數(shù)據(jù)信息處理,這樣可顯著提升信息傳輸以及交換速率,從而提煉出重要信息,便于相關人員查閱及使用。
1.2.1 動態(tài)及靜態(tài)信息數(shù)據(jù)采集功能
一般來說,計算機信息系統(tǒng)數(shù)據(jù)采集主要利用服務端系統(tǒng)對于相關動態(tài)信息以及靜態(tài)信息進行深入分析以及處理,然后采用感知技術實現(xiàn)預期效果。但具體操作階段,基于數(shù)據(jù)源的差異性,采集過程使用的相關技術體系也不相同,以靜態(tài)信息為例,其主要利用本地數(shù)據(jù)庫及相關互聯(lián)網(wǎng)數(shù)據(jù)源獲取數(shù)據(jù),然后再利用計算機信息系統(tǒng)中央處理單元對于這些數(shù)據(jù)進行處理。而動態(tài)信息處理則需使用各種傳感器攝像頭以及GPS等諸多數(shù)據(jù)采集設備進行實時收集。
1.2.2 大數(shù)據(jù)分析以及處理功能
信息分析工作意義重大,實時數(shù)據(jù)作為大數(shù)據(jù)處理的主要任務之一,其實際價值尤為突出。依據(jù)網(wǎng)絡數(shù)據(jù)實時性特征,相關人員應將動態(tài)信息數(shù)據(jù)以及靜態(tài)信息數(shù)據(jù)進行具體分析,大多采用不同的分析方法,例如實時分析以及離線分析,這兩種方法能夠滿足不同分析過程的相關需求動態(tài)信息處理階段。為了保證信息價值,在最短時間內對于相關數(shù)據(jù)進行深入分析,然后及時上傳相關分析結果,特別是一些數(shù)據(jù)會隨著時間延長,其采集價值會逐漸降低。因此,這些動態(tài)信息數(shù)據(jù)處理大多采用合適的分析處理方法。例如采用流數(shù)據(jù)處理方法,工作人員需將相關數(shù)據(jù)作為流主體通過數(shù)據(jù)積累形成數(shù)據(jù)流,當新數(shù)據(jù)獲取時,能夠及時處理,并將相關處理結果進行有效反饋。計算機信息系統(tǒng)應用大數(shù)據(jù)技術能夠有效降低數(shù)據(jù)格式轉換成本,提升相關數(shù)據(jù)處理能力以及處理效率。目前,計算機信息系統(tǒng)靜態(tài)信息大多采用MapReduce的處理模式與離線分析模式,其中MapReduce模型可將相關靜態(tài)信息數(shù)據(jù)實施有效分塊,再將其交付相關任務區(qū)實施對應處理[2]。
1.2.3 大數(shù)據(jù)管理功能
對于計算機信息系統(tǒng)來說,通過大數(shù)據(jù)技術合理應用,能夠有效整合相關信息數(shù)據(jù),優(yōu)化完善計算機信息體系,將各種潛在影響因素預先輸入計算機信息系統(tǒng),從而構建以大數(shù)據(jù)技術為核心的信息集成處理模式,確保計算機信息系統(tǒng)各種功能的充分發(fā)揮。同時,大數(shù)據(jù)技術還可針對計算機信息系統(tǒng)實施智能化管理,其可針對客戶需求及時從大數(shù)據(jù)中篩選有用信息,并在最短時間內進行處理。另外,利用大數(shù)據(jù)高預測功能,計算機信息系統(tǒng)運行質量顯著提升,增加信息采集處理的準確性,從而達到各種信息數(shù)據(jù)動態(tài)化管理的效果。
當前計算機信息系統(tǒng)已引入云計算技術。云計算平臺已成為今后計算機信息系統(tǒng)常用的數(shù)據(jù)處理方式之一,其可針對系統(tǒng)內部的各種數(shù)據(jù)資源進行精準管理。云計算技術利用虛擬運算模式實施計算,不用額外采購相關設備或軟件,還可根據(jù)相關要求向客戶提供云服務,通過軟件抓取大量不同類型的數(shù)據(jù),并依據(jù)數(shù)據(jù)規(guī)律性建立相應的反饋信息處理模型,這樣有助于提升數(shù)據(jù)處理效率。云計算數(shù)據(jù)處理任務完成后,會將數(shù)據(jù)處理結果采用流程圖的方式具體展開。另外,整個云計算技術框架極為復雜,可針對各種數(shù)據(jù)開展相應的虛擬實驗,這樣能保證相關數(shù)據(jù)在計算機信息系統(tǒng)應用有效性,減少數(shù)據(jù)處理時間。而計算機信息系統(tǒng)通過云計算技術能實現(xiàn)資源共享,提升數(shù)據(jù)利用效率,并有效防止發(fā)生數(shù)據(jù)多次處理情況。
通常數(shù)據(jù)備份技術合理應用,能夠利用各種數(shù)據(jù)存儲設備實施數(shù)據(jù)備份處理,防止由于數(shù)據(jù)丟失影響大眾生活工作。特別是在大數(shù)據(jù)技術大規(guī)模應用以及工作效率持續(xù)提升的背景下,大眾已開始注重信息數(shù)據(jù)的安全性。例如人們在日常登錄網(wǎng)站時,如注冊內容需填寫個人信息時,假使網(wǎng)站安全性不足,便會導致個人信息被竊或篡改,假使個人重要信息被盜取,如身份證號、家庭住址等,這會威脅個人財產安全性。同時,對于企業(yè)來說,如果企業(yè)重要數(shù)據(jù)丟失,會影響企業(yè)正常生產、銷售,從而產生嚴重的經(jīng)濟損失。因此為了減少數(shù)據(jù)丟失或數(shù)據(jù)損壞產生的不良影響,大數(shù)據(jù)技術應用過程時已集成數(shù)據(jù)備份功能。假使數(shù)據(jù)信息發(fā)生丟失或損壞情況時,通過數(shù)據(jù)備份技術能夠實現(xiàn)數(shù)據(jù)還原,這樣可保證相關信息存儲的完整性。實際數(shù)據(jù)備份技術應用時,工作人員需檢驗該技術與現(xiàn)有數(shù)據(jù)信息系統(tǒng)的匹配性,僅當兩者之間匹配性良好,才可在數(shù)據(jù)信息系統(tǒng)加裝數(shù)據(jù)備份軟件及硬件設備。如發(fā)生信息數(shù)據(jù)丟失或損壞時,數(shù)據(jù)信息系統(tǒng)及時加載備份數(shù)據(jù),確保計算機信息系統(tǒng)正常運行[3]。
數(shù)據(jù)備份技術不僅具有信息備份處理以及信息回復等功能。立容災系統(tǒng)可確保數(shù)據(jù)安全性以及使用價值。當前數(shù)據(jù)備份可采用數(shù)據(jù)備份介質進行數(shù)據(jù)存儲,如U盤以及硬盤,也可采用網(wǎng)絡平臺數(shù)據(jù)存儲方式,利用互聯(lián)網(wǎng)將各種數(shù)據(jù)上傳至網(wǎng)絡平臺進行數(shù)據(jù)備份,假使現(xiàn)有數(shù)據(jù)發(fā)生損壞或丟失時,可通過網(wǎng)絡加裝平臺備份數(shù)據(jù),這樣確保相關數(shù)據(jù)存儲安全性和數(shù)據(jù)使用效率。
2.3.1 安全感知
一般來說,網(wǎng)絡安全感知能力作為大數(shù)據(jù)技術背景下計算機信息系統(tǒng)安全建設的基礎條件。安全感知技術具體包括資產感知、脆弱性感知、安全事件感知和異常行為感知等諸多方面。網(wǎng)絡安全感知具體利用大數(shù)據(jù)技術實現(xiàn)快速處理,并根據(jù)相關設備日志、網(wǎng)絡運行數(shù)據(jù),依據(jù)應用日志重點分析計算機信息系統(tǒng)用戶行為特征等信息,判斷其是不是正常訪問行為?;诖髷?shù)據(jù)技術的網(wǎng)絡安全感知功能,重點確定計算機信息系統(tǒng)是否存在漏洞、病毒或黑客攻擊。
2.3.2 安全融合
大數(shù)據(jù)網(wǎng)絡安全融合作為計算機信息系統(tǒng)提供網(wǎng)絡安全保障,其具體涉及安全技術融合、安全和業(yè)務融合、安全和管理融合。依據(jù)現(xiàn)階段網(wǎng)絡安全大數(shù)據(jù)分析來看,如采取單一的網(wǎng)絡安全防護技術,其實際安全防御效果較差。因此,根據(jù)當前計算機信息系統(tǒng)網(wǎng)絡安全防御需求,基于大數(shù)據(jù)技術將多種安全技術融合使用,能夠有效識別病毒入侵,并及時實施安全隔離。安全防護范圍覆蓋用戶、終端、網(wǎng)絡邊界直至數(shù)據(jù)中心,根據(jù)實際需求建立主動防御、自動修復以及自動學習的網(wǎng)絡安全防御體系,從而提升整體計算機信息系統(tǒng)的網(wǎng)絡安全性。
2.3.3 安全服務
通?;谟嬎銠C信息系統(tǒng)網(wǎng)絡安全建設的需求,大數(shù)據(jù)網(wǎng)絡安全服務能力尤為重要。網(wǎng)絡安全服務可細分為安全產品服務、基礎安全服務和安全運維服務。其中,安全產品服務主要基于大數(shù)據(jù)技術為計算機信息系統(tǒng)提供安全服務,可為計算機信息系統(tǒng)用戶提供高安全性的加密服務和身份認證機制。同時,計算機信息系統(tǒng)引入大數(shù)據(jù)技術后,其數(shù)據(jù)存儲量大且類型多,這些數(shù)據(jù)存儲需執(zhí)行相應的存儲安全標準規(guī)范,并利用安全傳輸協(xié)議對整個大數(shù)據(jù)傳輸過程實施加密處理,這樣可有效提升數(shù)據(jù)流傳輸及使用質量。安全運維服務則是針對計算機信息系統(tǒng),利用大數(shù)據(jù)技術為系統(tǒng)相關網(wǎng)絡設備、終端、應用系統(tǒng)及內容信息實施綜合風險評估,并且服務內容包括網(wǎng)絡安全防護、監(jiān)控、安全響應恢復和安全審計等。通過相關安全風險評估結果,查找計算機信息系統(tǒng)相關的安全風險、漏洞及缺陷,明確具體風險等級,生成分析評估結果。根據(jù)評估結果和我國有關法律法規(guī)要求,計算機信息系統(tǒng)可建立健全網(wǎng)絡安全系統(tǒng),提升網(wǎng)絡安全檢測、網(wǎng)絡安全監(jiān)控及網(wǎng)絡安全管理功能效果[4]。
計算機信息系統(tǒng)應用Hadoop。因為Hadoop系統(tǒng)本身的性能較強,并且所耗費的成本比較少,所以各個領域普遍應用該技術。Hadoop系統(tǒng)可以在短時間內結合所有數(shù)據(jù)信息與數(shù)據(jù)倉庫系統(tǒng),全面的存儲且不會出現(xiàn)排斥現(xiàn)象。例如:鐵路系統(tǒng)中的運輸數(shù)據(jù)很難對數(shù)據(jù)信息進行優(yōu)化整合,但是應用Hadoop系統(tǒng)可以有效解決該問題,充分滿足鐵路運輸過程中的多種數(shù)據(jù)信息。將Hadoop系統(tǒng)與數(shù)據(jù)倉庫系統(tǒng)結合,可以構建一個以貨運數(shù)據(jù)信息系統(tǒng)為載體的大數(shù)據(jù)分析平臺,進而優(yōu)化和整合相關數(shù)據(jù)信息。Hadoop系統(tǒng)能夠完整地管理各項復雜的數(shù)據(jù),同時該系統(tǒng)中的各項功能都能通過合作滿足數(shù)據(jù)信息處理的要求。現(xiàn)階段的Hadoop系統(tǒng)正在不斷地完善,將系統(tǒng)中各個部件的功能進行明確的劃分,從而形成一個健全的大數(shù)據(jù)信息分析平臺引用系統(tǒng)。
根據(jù)當前我國大數(shù)據(jù)技術在計算機信息系統(tǒng)中的應用情況,政府及相關行業(yè)結構應建立專業(yè)性的數(shù)據(jù)質量監(jiān)控以及評估管理機構,加強大數(shù)據(jù)技術應用管理意識,構建科學合理的產品統(tǒng)計及質量管理體系,從而實現(xiàn)數(shù)據(jù)統(tǒng)計高效精確。同時,實際數(shù)據(jù)采集過程中存在各種干擾因素,并且數(shù)據(jù)應具有明顯的時效性,這均在一定程度上影響數(shù)據(jù)質量。針對這種情況,相關企業(yè)及行業(yè)機構應針對計算機信息系統(tǒng)情況,組建大數(shù)據(jù)集成管理平臺。平臺重點對大數(shù)據(jù)管理數(shù)據(jù)收集工作實施規(guī)范性管理,這樣可以減小數(shù)據(jù)時效性低以及干擾因素的影響。工作人員還應當重點針對數(shù)據(jù)倉庫以及統(tǒng)計數(shù)據(jù)的集成平臺實施有效管理,并采取適當方法提升管理效率,提升各種類型數(shù)據(jù)存儲效率及質量,便于數(shù)據(jù)集成以及提升數(shù)據(jù)分析處理效率。另外,依據(jù)實際需求,工作人員需對于大數(shù)據(jù)技術應用流程實施優(yōu)化,并創(chuàng)新升級相關統(tǒng)計技術及方式,提升數(shù)據(jù)共享質量,盡量將用戶需求作為今后大數(shù)據(jù)技術在計算機信息系統(tǒng)領域應用的工作基礎條件。
在實際的大數(shù)據(jù)處理過程中,深度學習技術較為關鍵。深度學習能力有助于數(shù)據(jù)特征歸納精度以及大數(shù)據(jù)內容分析的準確性。因此,深度學習功能作為大數(shù)據(jù)技術應用的重要保障措施。同時,計算機信息系統(tǒng)運行時,基于大數(shù)據(jù)相關技術,增加知識計算挖掘深度,以便查找大數(shù)據(jù)中的各種隱藏信息,再利用數(shù)據(jù)歸納功能總結各種碎片化信息,從而提升數(shù)據(jù)信息的完整性。
例如:AB公司內部應用信息化時間較長,每年在計算機信息系統(tǒng)投資較多,企業(yè)內部已建立局域網(wǎng)以及廣域網(wǎng)。未使用大數(shù)據(jù)技術前,信息孤島現(xiàn)象較為嚴重,銷售、生產及財務等諸多環(huán)節(jié)斷層情況較為常見,信息共享程度不足,并且數(shù)據(jù)缺乏標準化,缺少統(tǒng)一化的開發(fā)、應用平臺及工具。這會導致系統(tǒng)維護及人員培訓成本較高。針對這種情況,該公司已引入大數(shù)據(jù)技術,建立信息化建設的統(tǒng)一標準以及客戶關系管理系統(tǒng),通過客戶信息資源庫開展銷售工作,經(jīng)營業(yè)績明顯上漲。該公司已搭建新的信息技術架構,云計算、數(shù)據(jù)備份及數(shù)據(jù)安全性明顯增強。制定科學合理的公司信息化發(fā)展規(guī)劃,有助于提升今后企業(yè)內部的信息數(shù)據(jù)化網(wǎng)絡建設水平。
綜上所述,大數(shù)據(jù)技術在計算機信息系統(tǒng)中合理應用,已成為未來信息技術發(fā)展的主要趨勢之一,其需要提升相關企業(yè)及工作人員對于大數(shù)據(jù)技術的類型和應用效果了解程度,深入解析大數(shù)據(jù)技術與計算機信息系統(tǒng)之間的關聯(lián)性,進而提升大數(shù)據(jù)計算應用有效性。雖然大數(shù)據(jù)技術可顯著提升計算機信息系統(tǒng)運行效率,但易遭受各種外界信息的安全威脅,因此需要加強大數(shù)據(jù)安全防護功能,提升計算機信息系統(tǒng)的整體信息安全防御水平。