侯玉林
(安徽亳州新能源學(xué)校 安徽 亳州 236700)
人們的日常生活工作與電子信息處理技術(shù)息息相關(guān),大數(shù)據(jù)技術(shù)已經(jīng)逐漸成為人們對信息數(shù)據(jù)進(jìn)行挖掘的重要手段。 借助于大數(shù)據(jù)技術(shù),各行各業(yè)的發(fā)展腳步在不斷加快,其對于計算機信息技術(shù)的應(yīng)用水平也越來越高[1]。同時每一天都會產(chǎn)生大量的數(shù)據(jù),必須有相應(yīng)的信息處理技術(shù)來提供技術(shù)支持,才能夠更好地篩選其中的信息,將其中的價值提煉出來。 在當(dāng)前大數(shù)據(jù)時代的背景下,必須加強對于計算機信息技術(shù)這一方面的研究,從而更好地為各行各業(yè)提供幫助,促進(jìn)各行各業(yè)更好地發(fā)展。
電子信息技術(shù)是一種涉及電路設(shè)計、數(shù)字信號處理、通信網(wǎng)絡(luò)、集成電路等領(lǐng)域的綜合技術(shù),它的應(yīng)用已經(jīng)滲透到現(xiàn)代社會的方方面面。 根據(jù)當(dāng)前階段計算機信息技術(shù)發(fā)展的實際情況來看,可以將計算機電子信息技術(shù)分為三種類型,分別是信息系統(tǒng)技術(shù)、數(shù)據(jù)庫技術(shù)以及檢索技術(shù)。 首先,針對信息系統(tǒng)技術(shù)而言,其以計算機作為各種技術(shù)的中心,數(shù)據(jù)庫以及通信網(wǎng)絡(luò)技術(shù)是實現(xiàn)信息處理的主要方式。 其次,數(shù)據(jù)庫技術(shù)的主要內(nèi)容是整理各種信息的順序,其不僅能夠集合相關(guān)信息,還能夠完成對于各種信息以及數(shù)據(jù)的儲存。 最后,檢索技術(shù)在使用時,人們能夠非常方便地查詢各種信息[2]。 隨著我國科技水平不斷提高,電子信息技術(shù)也得到了快速發(fā)展和大范圍的應(yīng)用,大幅地提升了人們生活質(zhì)量。 可預(yù)見的是在未來的發(fā)展中,電子信息科技將向更加智能化、自動化以及集成化方向發(fā)展。 同時,電子信息科學(xué)技術(shù)還能夠與互聯(lián)網(wǎng)進(jìn)行有效結(jié)合,實現(xiàn)對各種資源的共享和利用,并且可以為人們提供更多便利服務(wù)。
大數(shù)據(jù)是指由巨型數(shù)據(jù)集組成,這些數(shù)據(jù)集必須借助計算機對數(shù)據(jù)進(jìn)行統(tǒng)計、對比和分析才能得出客觀結(jié)果。目前大數(shù)據(jù)技術(shù)及應(yīng)用已經(jīng)滲透進(jìn)我們生活的各個方面,如自動駕駛、網(wǎng)絡(luò)購物、直播平臺等醫(yī)療衛(wèi)生、商業(yè)分析、國家安全、食品安全、金融安全等。 近十年以來,大數(shù)據(jù)已經(jīng)作為國家重要的戰(zhàn)略資源,其實現(xiàn)了創(chuàng)新發(fā)展,在全社會形成了“用數(shù)據(jù)來說話、用數(shù)據(jù)來管理、用數(shù)據(jù)來決策、用數(shù)據(jù)來創(chuàng)新”的文化氛圍與時代特征。
在當(dāng)前大數(shù)據(jù)時代的背景下,各行各業(yè)產(chǎn)生的數(shù)據(jù)量非常龐大,所以需要采集的數(shù)據(jù)量也在不斷變化,在這樣的情況下,必須有強大的電子信息處理技術(shù)和大數(shù)據(jù)處理技術(shù)提供支撐。
2.1.1 數(shù)據(jù)的采集技術(shù)
在以往的傳統(tǒng)模式當(dāng)中,只有一些社會中的企業(yè)對本行業(yè)內(nèi)的用戶采集數(shù)據(jù),在近些年來,由于數(shù)據(jù)共享理念正在不斷地發(fā)展,所以數(shù)據(jù)采集的對象也越來越多樣化[3]。 雖然從數(shù)據(jù)本身來說不會造假,但是在實際收集數(shù)據(jù)的過程中,難免會出現(xiàn)數(shù)據(jù)錯誤的情況。 這主要是因為數(shù)據(jù)的收集工作會涉及非常多的流程,而且在數(shù)據(jù)采集的過程中還會出現(xiàn)各種細(xì)節(jié)性的內(nèi)容,這都會直接影響到最終的數(shù)據(jù),甚至?xí)苯佑绊懙綌?shù)據(jù)的收集,這是當(dāng)前階段人們在收集數(shù)據(jù)時所面臨的主要問題。
2.1.2 數(shù)據(jù)的存儲技術(shù)
當(dāng)前,很多企業(yè)更加傾向于選擇“云端”作為數(shù)據(jù)的存儲方式,例如亞馬遜、谷歌云、微軟以及阿里云都是非常常見的信息儲存工具,儲存數(shù)據(jù)的一個重要目的之一就是更好地處理各項數(shù)據(jù)。 因此,在數(shù)據(jù)處理的過程中,云計算或者其他類別的計算框架都能夠?qū)?shù)據(jù)處理與存儲相互融合,從而成為一個整體[4]。
2.1.3 計算與處理技術(shù)
根據(jù)當(dāng)前階段的實際情況來看,國內(nèi)的很多企業(yè)都開始采取各種措施來開發(fā)自身的云計算體系。 從一定程度上來說。 云計算實際上是計算以及大數(shù)據(jù)轉(zhuǎn)移存儲的協(xié)同體,在處理分布式數(shù)據(jù)庫的過程中可以實現(xiàn)分布處理,而且當(dāng)前其正在朝著并行計算的方向發(fā)展。 由此可見,其最大的優(yōu)勢是能夠及時地對各種類型大量的數(shù)據(jù)進(jìn)行處理,所以要能夠準(zhǔn)確地看待云計算技術(shù)與大數(shù)據(jù)技術(shù)之間緊密的關(guān)系[5]。 借助于云計算技術(shù),能夠深度挖掘大數(shù)據(jù)的價值,然后有針對性和目的性地進(jìn)行系統(tǒng)性判斷,從而為廣大的用戶推送更多準(zhǔn)確的信息,最終創(chuàng)造出更大的價值。 在這一過程中,還有不少的企業(yè)受限于自身技術(shù)方面的限制,缺乏開發(fā)云計算的能力,這時他們就需要積極地尋求與高端企業(yè)之間進(jìn)行合作,共同合作和開發(fā)云計算系統(tǒng),更好地利用大數(shù)據(jù),處理好大數(shù)據(jù)技術(shù)與云計算技術(shù)之間的關(guān)系。
從一定程度上來說,大數(shù)據(jù)實際上就是在信息獲取、存儲、管理以及分析的過程中,能夠超出傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,其主要具有四大特征,分別是海量的數(shù)據(jù)規(guī)模、價值密度低、數(shù)據(jù)流轉(zhuǎn)快以及數(shù)據(jù)類型多樣化。 在當(dāng)前多元化發(fā)展的時代背景下,大數(shù)據(jù)發(fā)揮著不可替代的作用。 大數(shù)據(jù)技術(shù)與應(yīng)用研究方向是將大數(shù)據(jù)分析挖掘與處理、移動開發(fā)與架構(gòu)、軟件開發(fā)、云計算等前沿技術(shù)相結(jié)合的“互聯(lián)網(wǎng)+”前沿科技。 在這樣的背景下,加強對于大數(shù)據(jù)價值的分析和研究具有十分重要的意義,將會直接對整個社會的發(fā)展走向產(chǎn)生影響。
大數(shù)據(jù)技術(shù)通常包含:分布式存儲技術(shù)、分布式計算技術(shù)、數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)、數(shù)據(jù)庫技術(shù)、可視化和報告技術(shù)、安全和隱私保護(hù)技術(shù)等。
2.2.1 大數(shù)據(jù)建模技術(shù)
在應(yīng)用大數(shù)據(jù)的過程中,通常采用流處理和批處理兩種方法進(jìn)行數(shù)據(jù)建模,其中,流處理具有比較快的數(shù)據(jù)處理速度,能夠幫助相應(yīng)的技術(shù)人員實時分析數(shù)據(jù)。 流處理這種方式在金融業(yè)當(dāng)中被廣泛運用,這主要是因為金融業(yè)發(fā)展的過程中需要大量的實時信息作為支撐,而采用流處理的方式,能夠?qū)蛻綦娮愚D(zhuǎn)賬的業(yè)務(wù)進(jìn)行快速處理,從而為用戶提供更加高質(zhì)量的金融服務(wù)。 針對批處理技術(shù)而言,其主要是整理和加工已經(jīng)處理過的各種信息,從而促使大量數(shù)據(jù)的儲存和利用率大幅提升,以便于其他各項工作的開展。 由此可見,這兩種建模方法都具有自身的優(yōu)勢,能夠在最大程度上豐富電子信息處理技術(shù)系統(tǒng)。 在實際應(yīng)用的過程中,要將大批量數(shù)據(jù)資源應(yīng)用好,以此為基礎(chǔ)制定更多具有目標(biāo)性的技術(shù)解決方案,然后通過建模的方式,對這些數(shù)據(jù)內(nèi)部的價值進(jìn)行分析,最終為企業(yè)日后的正常發(fā)展創(chuàng)造更多的有利條件。
2.2.2 大數(shù)據(jù)的安全技術(shù)
隨著大數(shù)據(jù)技術(shù)的不斷應(yīng)用,大數(shù)據(jù)的安全問題也逐漸開始受到了人們的廣泛關(guān)注。 之前廣泛使用的等保1.0 體系,在時效性以及適用性等方面還需要不斷地進(jìn)行完善,在這一背景下,等保2.0 體系就出現(xiàn)了。 從大數(shù)據(jù)的安全性方面來說,其通常覆蓋兩個方面的內(nèi)容,首先是用戶方面,用戶在瀏覽商品的過程中,喜好被記錄,而且在發(fā)送信息的過程中自己的位置也很有可能會被暴露。 為了解決這一問題,在利用大數(shù)據(jù)平臺時,就需要謹(jǐn)慎處理其所擁有的各種權(quán)限。 其次就是如何在大數(shù)據(jù)開發(fā)方面確保數(shù)據(jù)的安全性。 例如很多企業(yè)的數(shù)據(jù)在共享以及流通的過程中很容易泄露,還有一部分黑客也會攻擊企業(yè)的網(wǎng)絡(luò)來獲取各種數(shù)據(jù)信息。
在當(dāng)前大數(shù)據(jù)的時代背景下,分布式存儲技術(shù)的應(yīng)用是計算機處理技術(shù)的主要應(yīng)用領(lǐng)域,這一技術(shù)是在谷歌公司全球定位系統(tǒng)的基礎(chǔ)上建立的,廣泛應(yīng)用到了很多大型互聯(lián)網(wǎng)企業(yè)當(dāng)中。 這是隊列存儲概念的一個典型應(yīng)用。 其在存儲數(shù)據(jù)的過程中所采用的單位為列,所具有的優(yōu)勢在壓縮方面完全體現(xiàn)出來,能夠促使信息技術(shù)循環(huán)的速度加快。 與此同時,在具體應(yīng)用的過程中,其在高效應(yīng)用磁盤空間以及加載數(shù)據(jù)方面也具有無可比擬的優(yōu)勢。
當(dāng)前,人們更加關(guān)注遺傳算法。 遺傳算法,顧名思義,其主要的原理就是對生物界的進(jìn)化演化規(guī)律進(jìn)行模仿,最終達(dá)到能夠隨機化搜索的目標(biāo)。 而且在使用這一方法的過程中,還需要采用概率化的方法實現(xiàn)尋優(yōu),從而自動地調(diào)整搜索的方向[6]。 在當(dāng)前階段,遺傳算法已經(jīng)得到了人們的廣泛運用,其中最為典型的應(yīng)用是機器學(xué)習(xí)以及信號處理這些領(lǐng)域。 針對模擬神經(jīng)算法來說,其主要是對動物的運行神經(jīng)進(jìn)行模擬,在不斷模擬的過程中產(chǎn)生一些具體化的網(wǎng)絡(luò)行為,其最明顯的一個特點就是在處理信息的過程中可以實現(xiàn)分布式處理。
在當(dāng)前大數(shù)據(jù)的背景下,信息數(shù)據(jù)的挖掘也是電子信息處理技術(shù)的一個相當(dāng)重要的應(yīng)用領(lǐng)域,其以對網(wǎng)絡(luò)實施搜索作為基礎(chǔ),然后再分析和關(guān)聯(lián)。 在當(dāng)前階段,排序算法是互聯(lián)網(wǎng)信息搜索領(lǐng)域當(dāng)中熱度非常高的話題,其被很好地運用在了大規(guī)模社會媒體信息量的短文特征搜索當(dāng)中,以便于能夠更好地對各種信息進(jìn)行處理。 結(jié)合當(dāng)前階段的實際情況來看,主要從三個領(lǐng)域來研究排序?qū)W習(xí)算法,分別是逐點、逐列和逐對。
在當(dāng)前大數(shù)據(jù)時代的背景下,數(shù)據(jù)的高效索引技術(shù)是熱點研究方向。 當(dāng)前谷歌公司的BIGTABLE 技術(shù)比較先進(jìn)的索引技術(shù),主要集中體現(xiàn)在以下兩個方面:第一,聚簇索引方式。 以索引順序作為指導(dǎo),存儲全部的數(shù)據(jù)結(jié)構(gòu);第二,互補式聚簇索引方式。 主要是運用副本作為索引列,創(chuàng)建互為補充的索引表,其在具體使用的過程中,往往會與查詢結(jié)果相互配合以達(dá)到更好的效果。
數(shù)據(jù)感知與獲取技術(shù)是大數(shù)據(jù)時代背景下電子信息處理技術(shù)中非常重要的一個技術(shù)。 信息量非常龐大以及訪問形式特殊是這一技術(shù)的明顯特征。 這一技術(shù)最主要的用途就是充分利用數(shù)據(jù),高質(zhì)量集成海量數(shù)據(jù)是最有價值的內(nèi)容,實現(xiàn)對于數(shù)據(jù)的整合和抽取。
為了確保計算機處理技術(shù)能夠更加符合實際情況,就可以通過模擬的方式來實現(xiàn)計算機輔助控制,從而確??刂菩Ч麡?biāo)準(zhǔn)和規(guī)范。 與此同時,在運用自動化模擬運行技術(shù)的過程中,還需要以計算機作為輔助,通過這種方式確保所設(shè)計的效果與預(yù)期高度相似,在這一過程中,需要對智能化技術(shù)進(jìn)行合理運用,最終為企業(yè)的發(fā)展提供全新的動力。 根據(jù)當(dāng)前階段的實際情況來看,計算機大數(shù)據(jù)分析工作當(dāng)中還存在著劃分不清的問題,這就需要在確保網(wǎng)絡(luò)系統(tǒng)運行效率的基礎(chǔ)上,深入地優(yōu)化整合子網(wǎng),然后結(jié)合自身的實際發(fā)展?fàn)顩r,使防護(hù)網(wǎng)絡(luò)的覆蓋面不斷地擴大。在此基礎(chǔ)上,還需要將電子電路系統(tǒng)與電子信息工程相互配合,確保信息資源在使用的過程中更加有效和安全。
應(yīng)用服務(wù)供應(yīng)商(application service provider,ASP)是當(dāng)前比較成熟的第三方專業(yè)管理平臺,通過ASP 語言編制的計算機網(wǎng)絡(luò)服務(wù)管理系統(tǒng),能夠以板塊設(shè)置作為基礎(chǔ),合理劃分各種內(nèi)容。 對于使用者而言,他們在各種論壇之間開展討論,可以在這一平臺上學(xué)習(xí)技術(shù)操作視頻等內(nèi)容。 同時還可以多部門同時獲得豐富的項目信息,節(jié)省層層上報的時間,確保信息共享的效率得到提升[7]。 與此同時,在全面信息化的過程中,全面信息管理工作也要求更高水平的安全管理,這時可以將安全監(jiān)管作為初步的安全保障工作,將一些不安全的服務(wù)請求以及非法用戶的侵入篩選出來,然后根據(jù)實際的情況建立相應(yīng)的安全系統(tǒng),確保共享數(shù)據(jù)的安全性有所保障。
當(dāng)前,電子信息處理技術(shù)集成智能化已經(jīng)逐漸成為不可阻擋的趨勢,不同技術(shù)之間的相互融合具有無可比擬的優(yōu)勢,不僅能夠促使我國科技發(fā)展的進(jìn)程加快,同時還能夠?qū)⑸a(chǎn)技術(shù)之間存在的差距縮小,確保整體的設(shè)計更加準(zhǔn)確。 與此同時,為了確保大數(shù)據(jù)分析處理工作具有更高的效率,在實際應(yīng)用的過程中還需要將計算機設(shè)備作為輔助設(shè)備使用,融合數(shù)據(jù)的收集、分析、整理以及應(yīng)用環(huán)節(jié),在最大程度上提升數(shù)據(jù)處理的效率[8]。 例如利用傳統(tǒng)的數(shù)據(jù)處理方式,每小時只能過濾掉1 000 條數(shù)據(jù),但是如果使用集成智能化處理方式,數(shù)據(jù)處理的效率能夠提升80%左右。
重要意義主要在以下幾個方面有所體現(xiàn)。 首先,大數(shù)據(jù)已經(jīng)不再僅僅是一些數(shù)據(jù),更是國家級別的重要戰(zhàn)略性資源,所以要想能夠提升國家的信息安全競爭力,就必須加強對于大數(shù)據(jù)的研究。 其次,加強對于大數(shù)據(jù)方面的研究,能夠為人們的日常生活和工作創(chuàng)造更多的便利,對我國未來經(jīng)濟發(fā)展及產(chǎn)業(yè)升級產(chǎn)生直接的影響。 最后,推動科學(xué)思維革命也需要不斷地加強對大數(shù)據(jù)的研究。
大數(shù)據(jù)技術(shù)所擁有的發(fā)展機遇主要集中在以下幾個方面。 首先其具有非常明顯的產(chǎn)業(yè)價值,所以加強對于信息基礎(chǔ)的挖掘以及應(yīng)用非常重要。 其次,在當(dāng)前大數(shù)據(jù)時代的背景下,對于大數(shù)據(jù)本身而言面臨著非常多的風(fēng)險,其信息安全的要求也在不斷提升。
綜上所述,隨著社會的不斷發(fā)展,大數(shù)據(jù)時代對電子信息處理技術(shù)既帶來了機遇,同時又帶來了挑戰(zhàn)。 這同時也代表信息處理技術(shù)將會涉及更多的領(lǐng)域,對電子信息處理技術(shù)提出了更高的要求。 當(dāng)前電子信息處理技術(shù)還存在著較多的不足,在充分明確了大數(shù)據(jù)所面臨的發(fā)展機遇之后,必須對其面臨的挑戰(zhàn)產(chǎn)生正確的認(rèn)識。 需不斷深入地挖掘各種類型的數(shù)據(jù),采取各種措施不斷地進(jìn)行完善,提升信息安全等級,實現(xiàn)電子信息處理技術(shù)又快又好地發(fā)展,為社會中更多的領(lǐng)域提供服務(wù)。