陸冉
摘要:本文研究的主要目的是在現(xiàn)代化信息技術高速發(fā)展背景下,強調(diào)基于大數(shù)據(jù)的信息系統(tǒng)關鍵技術研究的重要性。明確大數(shù)據(jù)技術的定義、特征與應用價值,對大數(shù)據(jù)語境下的信息系統(tǒng)關鍵技術做出細致分析,以全方面提升大數(shù)據(jù)技術在信息系統(tǒng)中的應用水準,進而推動社會主義現(xiàn)代化建設,滿足人民群眾的生產(chǎn)生活需要。此次研究選用的是文獻研究法,通過對相應文獻的查找,為文章的分析提供一些理論基礎。
關鍵詞:大數(shù)據(jù);信息系統(tǒng);關鍵技術
前言:大數(shù)據(jù)技術是在互聯(lián)網(wǎng)技術與計算機技術飛速發(fā)展的技術環(huán)境下應運而生的,其在信息數(shù)據(jù)管理工作中的效率優(yōu)勢使其成為當今社會下的熱點話題。信息系統(tǒng)管理技術在現(xiàn)階段已經(jīng)延伸進社會生產(chǎn)生活的方方面面,已經(jīng)成為社會生產(chǎn)有序開展的關鍵。可以預見的是,將大數(shù)據(jù)技術應用與信息系統(tǒng)管理將為我國信息技術行業(yè)的發(fā)展與人民生活水平的提高提供新的動力。因此,本文此次研究的內(nèi)容和提出的策略對大數(shù)據(jù)技術研究具有理論性意義,對信息系統(tǒng)關鍵技術突破具有現(xiàn)實意義。
1.大數(shù)據(jù)概述
1.1大數(shù)據(jù)的定義
大數(shù)據(jù)作為現(xiàn)階段新興的信息技術,其定義的模糊復雜是現(xiàn)階段時代屬性的突出展現(xiàn)。根據(jù)該技術使用主體的經(jīng)驗可以將大數(shù)據(jù)定義為高于使用者本身處理與分析能力最高限度的數(shù)據(jù)。在互聯(lián)網(wǎng)行業(yè)中,其主要是指信息數(shù)據(jù)的流通,將其應用到人們?nèi)粘I铑I域中就是需要對其進行的收集、整理以及分析分,從而能做出最正確的判斷和決策[1]。在對于現(xiàn)階段的大數(shù)據(jù)應用而言,數(shù)據(jù)量的提升并沒有與數(shù)據(jù)價值呈現(xiàn)正相關關系,數(shù)據(jù)大爆炸時代下的數(shù)據(jù)價值的弱化問題,反映出人們對待數(shù)據(jù)的漠視同時也呼吁著更多技術與人才的引入。
1.2大數(shù)據(jù)的特征與價值
大數(shù)據(jù)最明顯的特征在于其內(nèi)容龐雜、類型多樣,同時其自身的價值性與生成的時效性在目前研究中的關注度也在不斷上升。可以肯定的是大數(shù)據(jù)技術中不僅蘊含著數(shù)據(jù)量累積相加的價值,更包含了由數(shù)據(jù)組別間的關聯(lián)性與規(guī)律性所帶來的潛在衍生價值,合理利用此類價值將會給整個社會的經(jīng)濟發(fā)展、技術創(chuàng)新和價值取向帶來重大變革[2]。以現(xiàn)代企業(yè)為例,企業(yè)在生產(chǎn)過程中的原料采辦、交通運輸、產(chǎn)品銷售環(huán)節(jié)都將產(chǎn)生大量的數(shù)據(jù)信息,其中或是蘊含這原料交通成本價格波動規(guī)律,或是包括用戶偏好數(shù)據(jù)等產(chǎn)品銷售層面的影響因素信息。隨著互聯(lián)網(wǎng)技術的發(fā)展與移動終端設備技術支持水平的不斷提高,大數(shù)據(jù)的來源更加多樣,其內(nèi)部結構組成的系統(tǒng)化正逐漸受到消解,而與此同時大數(shù)據(jù)在數(shù)據(jù)生成過程與傳播變換過程的速度卻呈現(xiàn)出指數(shù)上升的趨勢,這無疑對大數(shù)據(jù)的處理分析與價值挖掘造成相當程度的干擾。
2.基于大數(shù)據(jù)的信息系統(tǒng)關鍵技術研究
2.1分布式數(shù)據(jù)庫與處理系統(tǒng)
根據(jù)大數(shù)據(jù)技術數(shù)據(jù)內(nèi)容的龐雜特點,傳統(tǒng)關系型數(shù)據(jù)庫在處理大體量多樣性信息時存在一定程度上的卡頓缺陷,面臨著數(shù)據(jù)混亂丟失的風險,對于此類數(shù)據(jù)而言,其有效價值比例低于數(shù)據(jù)整體搜集比例,同時大數(shù)據(jù)服務強調(diào)通過將各類大數(shù)據(jù)操作進行封裝,為消費者提供無處不在的、標準化的、隨需的檢索、分析與可視化服務[3]。因此,其呼吁著一類管理方式更加便捷簡單的信息數(shù)據(jù)庫處理系統(tǒng)的出現(xiàn)。在這種背景下分布式數(shù)據(jù)庫利用大數(shù)據(jù)信息傳播原理以其精簡的數(shù)據(jù)處理模型與大容量的數(shù)據(jù)儲存空間脫穎而出,分布式數(shù)據(jù)庫與處理系統(tǒng)的結構模型如圖1所示。該系統(tǒng)內(nèi)部主要采用了Bigtable與Dynamo兩種技術工藝,在Bigtable工藝中,該技術將數(shù)據(jù)信息使用字符串的方式進行單位統(tǒng)一,通過犧牲具體內(nèi)容展示的方式獲取了高速信息處理的能力。在Dynamo工藝中,該技術將分布式哈希表管理理念注入大數(shù)據(jù)信息管理工作中,為信息管理提供了批處理與流處理兩種方案結合的處理思路。批處理技術在大數(shù)據(jù)處理中使用特定處理方案對大數(shù)據(jù)進行分組處理,在此基礎上大數(shù)據(jù)處理實現(xiàn)了多個處理器的并聯(lián)處理,雖然一定程度上打散了原有數(shù)據(jù)的關聯(lián)性,但只要根據(jù)待處理數(shù)據(jù)特點規(guī)律。采取科學合理的數(shù)據(jù)分組模式,數(shù)據(jù)間的處理速度和靈活調(diào)度能力將會得到相應的提升。流處理技術則不同于批處理技術,該技術將大數(shù)據(jù)內(nèi)的信息數(shù)據(jù)看成某種連續(xù)的信息流整體,在處理的過程中信息以此進入系統(tǒng)并將處理結果進行同步上傳,應對時效性要求較高的數(shù)據(jù)信息常優(yōu)先采用流處理技術。
2.2分布式文件管理技術
大數(shù)據(jù)技術對數(shù)據(jù)的存儲與管理所提出的要求較高,傳統(tǒng)的文件管理技術在速度與空間上往往難以滿足其要求,為了提高大數(shù)據(jù)信息管理的效率分布式文件管理技術結合大數(shù)據(jù)信息特點廣泛應用于國內(nèi)外互聯(lián)網(wǎng)公司。分布式文件管理技術結構模型如圖2所示。在該技術中最具代表性的為谷歌公司所推出的GFS文件管理系統(tǒng),該系統(tǒng)充分發(fā)揮了谷歌公司作為互聯(lián)網(wǎng)大廠內(nèi)部原有的資源基礎優(yōu)勢,將多個低成本服務器進行連接,極大地提高了文件管理工作中的拓展性。分布式文件管理結束整體借鑒了分布式數(shù)據(jù)庫與處理系統(tǒng)的批處理技術工藝與經(jīng)驗,將數(shù)據(jù)分組放置于多個服務器之中進行管理,同時為了避免數(shù)據(jù)分流所帶來的時效性損耗,谷歌公司的GFS系統(tǒng)創(chuàng)新采用了在服務器間增設緩沖層的技術,以提升大數(shù)據(jù)信息傳輸與存讀速度。
結束語:將大數(shù)據(jù)技術與信息系統(tǒng)技術相結合是我國數(shù)字化、信息化、現(xiàn)代化轉型升級的重要舉措,目前已經(jīng)得到行業(yè)內(nèi)廣泛的認可。通過本文研究得知大數(shù)據(jù)技術在定義、特征與價值方面與信息系統(tǒng)技術存在契合點與兼容性,基于此本文著重研究并分析了分布式數(shù)據(jù)庫與處理系統(tǒng)與分布式文件管理技術兩種基于大數(shù)據(jù)的信息系統(tǒng)關鍵技術。
參考文獻:
[1]張海浪.基于大數(shù)據(jù)的信息系統(tǒng)關鍵技術研究[J].數(shù)字技術與應用,2018,36(01):67+69.
[2]禹祿君.基于大數(shù)據(jù)的信息系統(tǒng)關鍵技術研究[J].湖南郵電職業(yè)技術學院學報,2015,14(03):40-42.
[3]朱攀.基于大數(shù)據(jù)的信息系統(tǒng)關鍵技術研究[J].電子技術與軟件工程,2014(04):216.