李春光
摘要:隨著互聯(lián)網(wǎng)技術(shù)能力的提高,人們已經(jīng)邁入了信息化時代,在國內(nèi)各行各業(yè)各領(lǐng)域,都充斥著不同種類的龐大數(shù)據(jù),這是人類進入全面數(shù)據(jù)化時代的標(biāo)志。隨著計算機用戶量的不斷攀升,網(wǎng)絡(luò)信息處理的技術(shù)就需要創(chuàng)新完善,從而幫助人們處理生活與工作。目的:以遵義師范學(xué)院為基礎(chǔ)數(shù)據(jù)庫進行剖析網(wǎng)絡(luò)信息處理技術(shù);方法:通過查閱相關(guān)資料結(jié)合學(xué)院自身實際進行技術(shù)分析;結(jié)論:信息處理技術(shù)主要包括收集、加工、傳播、儲存、應(yīng)用。
關(guān)鍵詞:大數(shù)據(jù)時代;網(wǎng)絡(luò)信息;信息處理技術(shù);信息化
中圖分類號:TP311 ? ? ?文獻標(biāo)識碼:A
文章編號:1009-3044(2020)28-0048-03
1 大數(shù)據(jù)與網(wǎng)絡(luò)信息處理技術(shù)概論
1.1 大數(shù)據(jù)概論
從字面意思來看,大數(shù)據(jù)就是指數(shù)量巨大地數(shù)據(jù)信息。然而大數(shù)據(jù)并不單單說明數(shù)據(jù)量地龐大,從更加嚴(yán)謹?shù)亟嵌葋碚f,大數(shù)據(jù)是具有較為復(fù)雜的、多樣的、重復(fù)的一個大數(shù)據(jù)庫特點的數(shù)據(jù)。從當(dāng)前國內(nèi)的科學(xué)技術(shù)的發(fā)展前景來看,是可以提前預(yù)料大數(shù)據(jù)的產(chǎn)生的,大數(shù)據(jù)與較為傳統(tǒng)的計算技術(shù)不同,大數(shù)據(jù)具有更多的優(yōu)勢,比如說價格相比而言較低、其規(guī)模性更大、對于資源的利用率有著更高的比率。同時,由于大數(shù)據(jù)自身具有復(fù)雜的特點,就能夠更緊密地對信息之間進行關(guān)聯(lián)。此外,大數(shù)據(jù)能夠更加完整的保存數(shù)量龐大的數(shù)據(jù),這也是大數(shù)據(jù)最為關(guān)鍵的一個優(yōu)勢。大數(shù)據(jù)的主要技術(shù)包括有分類分析、機器學(xué)習(xí)與遺傳算法等等[1]。
同時,與傳統(tǒng)數(shù)據(jù)挖掘相比而言,大數(shù)據(jù)更加具有決策力與洞察力,除去能夠奠定計算機技術(shù)的發(fā)展基礎(chǔ)以外,同時能夠?qū)τ谌藗兊纳鐣c生活的發(fā)展產(chǎn)生巨大的影響。大數(shù)據(jù)實際上是一種技術(shù)性的改革,同時屬于技術(shù)性的改革的還包括自動化生產(chǎn)、無線網(wǎng)革命等等,這些都是新時代的重要發(fā)展工具。
1.2 網(wǎng)絡(luò)信息處理技術(shù)概論
當(dāng)前,所有的信息也正處于從一個電子信息的形式逐步轉(zhuǎn)變?yōu)闊o形化的發(fā)展方向。社會活動也正逐漸向無形化趨勢發(fā)展,這能夠極大地減少人們的活動時間,縮小人們的活動空間。這一優(yōu)勢極為明顯的體現(xiàn)于網(wǎng)絡(luò)信息處理技術(shù)。相比較為傳統(tǒng)的手段,網(wǎng)絡(luò)信息處理技術(shù)能夠在儲存介質(zhì)以及快速復(fù)制、查詢速度上帶來很多新的處理方式。計算機與網(wǎng)絡(luò)的發(fā)展給人們帶來的源源不斷的利益,網(wǎng)絡(luò)信息處理額能夠幫助人們運用各類心理進行信息處理技術(shù)地新加工從而生成新的信息、新的資源,進一步結(jié)合自身需求進行篩選運用。在這樣的情況下,人們能夠更加及時、方便的獲取自身所需求的信息從而更加有效地進行信息管理,加深信息流通的效率,大大減少辦公的成本。對于企業(yè)、院校、政府等等工共組織等等溝通、交流、合作的實現(xiàn)提供了助力。
2 大數(shù)據(jù)下網(wǎng)絡(luò)信息處理技術(shù)的剖析
2.1 信息收集技術(shù)
網(wǎng)絡(luò)信息處理技術(shù)的首要步驟就是信息的收集工作,只有在信息收集過后才能進行下一步的數(shù)據(jù)加工傳播、儲存應(yīng)用等等工作。信息的收集就是通過利用現(xiàn)有的計算機的相關(guān)軟件技術(shù)針對特定的數(shù)據(jù)源進行實時的采集與收取,同時還f可以深入挖掘處理將結(jié)構(gòu)化的一些必要信息進行提取處理并輸入機構(gòu)化的相關(guān)數(shù)據(jù)庫中,這個過程能夠為各類的信息系統(tǒng)進行數(shù)據(jù)輸入。同時,有效運用網(wǎng)絡(luò)技術(shù)能夠保障在收集過程中信息的完整、全面性。與此同時,也能夠加速數(shù)據(jù)的搜集效率以及收集數(shù)量,從而保障信息技術(shù)的搜集高效性。
通過網(wǎng)絡(luò)信息的采集系統(tǒng),能夠更好地幫助信息采集工作的有效進行。信息的收集系統(tǒng)往往通過網(wǎng)絡(luò)的信息搜索引擎為系統(tǒng)的基礎(chǔ)。這樣的系統(tǒng)能夠在最少的時間得到最新的信息,同時將這個存在于不同網(wǎng)站的信息進行統(tǒng)一的采集并分類、整理、統(tǒng)一,并能夠最早的將信息整合并發(fā)布于自身的數(shù)據(jù)站點,進一步保證信息的新鮮性,從而輔助人們進行高效的學(xué)習(xí)辦公。
在我院進行相關(guān)信息收集時,信息挖掘可以用的工具包括有KNIME、ORANGE等等,能夠?qū)Ψ衷~進行處理、提取關(guān)鍵詞從而對信息進行整合。同時,不可否認的是,當(dāng)代網(wǎng)絡(luò)用戶所面臨的問題不再是信息匱乏,而是信息魚龍混雜、信息過載。通過信息采集也是對于輿情分析的一種主要手段,對此我院通過爬蟲PYTHON、Heritrix來對信息進行收集篩查。
2.2 信息加工技術(shù)
在通過計算機網(wǎng)絡(luò)技術(shù)的信息采集系統(tǒng)進行相關(guān)的信息收集之后,網(wǎng)絡(luò)信息處理技術(shù)就可以進入下一階段,對信息進行加工。信息的加工處理技術(shù)就是指通過利用設(shè)立的網(wǎng)絡(luò)信息加工系統(tǒng)對收集的信息進行分類、標(biāo)記、整理、加工一系列過程的技術(shù)。信息處理技術(shù)可以簡要的分為三個板塊:整理、測量、統(tǒng)計。整理即是指將網(wǎng)絡(luò)信息采集系統(tǒng)所搜集到的有效信息從混亂、零散、無規(guī)律轉(zhuǎn)換為有秩序的、完整的信息。測量即是指通過對所收集到的信息進行屬性分析判斷,從而進一步的摸索特點從而更好地投入運用中去。統(tǒng)計即是指通過對統(tǒng)計學(xué)的相關(guān)理論知識進行結(jié)合,將收集的信息進行較為統(tǒng)一的整理,事數(shù)據(jù)變得更加完整、有序、可控、利于應(yīng)用。
同時信息的加工也包括信息的預(yù)處理,信息數(shù)量極為龐大的,我院一般將較為原始的數(shù)據(jù)儲存于PostgreSQL數(shù)據(jù)庫,進一步通過將數(shù)據(jù)庫轉(zhuǎn)化為txt格式文件、使用停用詞分析篩選無用信息。
2.3 信息傳播技術(shù)
在大數(shù)據(jù)的時代下,網(wǎng)絡(luò)信息的處理技術(shù)中最為關(guān)鍵的一項技術(shù)就是信息的傳播。在經(jīng)歷過信息的收集、加工之后就進入傳播的階段。信息只有經(jīng)過傳播才能夠引起社會的注意,從而得到認同肯定后被社會更加廣泛的投入應(yīng)用,從而更好地服務(wù)于社會。經(jīng)過網(wǎng)絡(luò)信息傳播的數(shù)據(jù)信息往往以數(shù)字的形式存在于儲存介質(zhì)之中,并通過計算機的網(wǎng)絡(luò)進行更加高效的傳播,進一步運用計算機等信息設(shè)備進行查閱使用[2]。信息傳播需要網(wǎng)絡(luò)作為傳播媒介,來進行信息的傳遞交流從而更好地進行利用。網(wǎng)絡(luò)信息的傳播能夠更好地將信息傳遞給社會,使得人們更加便捷、及時地得到有效信息從而更好地進行學(xué)習(xí)辦公。同時通過網(wǎng)絡(luò)進行信息傳播存在著許多的優(yōu)勢,例如說其具有很高的互動性與及時性,能夠及時地關(guān)聯(lián)到多個用戶得到相關(guān)的信息反饋;同時具有個性化以及傳播代價較小的等等優(yōu)點。
2.4 信息儲存技術(shù)
通過網(wǎng)絡(luò)信息處理技術(shù)的處理后,信息能夠得到有效的收集、加工、傳播,在這個過程中,信息就需要載體進行儲存,信息經(jīng)過儲存后,就給網(wǎng)絡(luò)帶來了“記憶”,或者說“痕跡”,在后期再次需要相關(guān)的信息運用時就可以更加及時高效的將信息調(diào)取出來進行利用。
前文反復(fù)提出,大數(shù)據(jù)時代最具有的明顯特點就是數(shù)據(jù)量的龐大,通過網(wǎng)絡(luò)信息儲存系統(tǒng)的處理,就可以進行大容量儲存、長時間儲存,同時該項技術(shù)也具有更加方便地存取的優(yōu)點,這一點能夠在很大程度上對人力資源的壓力進行減緩,對于空間與時間也能夠在最大程度上的進行縮小。在人們的日常生活與工作中,人們已經(jīng)離不開網(wǎng)絡(luò)儲存技術(shù)的運用。比如說在網(wǎng)絡(luò)中儲存的大量的學(xué)習(xí)信息資料,企業(yè)的相關(guān)資料與檔案等等。通過對網(wǎng)絡(luò)信息處理技術(shù)進行信息的儲存能夠使得數(shù)據(jù)時代下,大量得數(shù)據(jù)信息具有很高的歸屬性和分類性,能夠更加方便人們的查詢使用[3]。
在信息得到收集、加工后,我院主要將信息儲存于PostgreSQL數(shù)據(jù)庫,從而進一步進行相關(guān)數(shù)據(jù)的提取等等。
2.5 信息應(yīng)用技術(shù)
網(wǎng)絡(luò)信息處理技術(shù)進入最后一個階段就是信息的應(yīng)用,所有的網(wǎng)絡(luò)信息處理技術(shù)都最終服務(wù)于網(wǎng)絡(luò)信息的應(yīng)用。網(wǎng)絡(luò)信息的應(yīng)用也隨著計算機網(wǎng)絡(luò)的高速發(fā)展形成了一個較為成熟的技術(shù)系統(tǒng),在這項技術(shù)的發(fā)展之下,各類的應(yīng)用軟件也在不斷地被研究開發(fā)出來,這些軟件在不同的行業(yè)、領(lǐng)域中都發(fā)揮了極大的作用,使得人們的生活、學(xué)習(xí)、辦公都變得更加高效、方便[4]。這里我們可以通過舉一個比較便于理解得例子來概括這項技術(shù)在所有領(lǐng)域中相關(guān)應(yīng)用;以自動化智能辦公為例,自動化智能辦公就是指在當(dāng)下發(fā)的網(wǎng)絡(luò)信息技術(shù)的背景下,通過對網(wǎng)絡(luò)信息處理技術(shù)與現(xiàn)代的辦公系統(tǒng)進行整合的一種新型的辦公形式。自動智能化的辦公同樣經(jīng)歷了一系列的發(fā)展階段。而這項技術(shù)的在辦公中的應(yīng)用對于辦公效率而言有著極高的改善的作用,同時更加便利于人工的相關(guān)學(xué)習(xí)、管理工作。對于企業(yè)而言更是能夠推動企業(yè)發(fā)展的有利武器,它能夠更加便利于企業(yè)內(nèi)部員工以及各部門之間的溝通交流,從而促進企業(yè)內(nèi)部辦公運行的效率,對于企業(yè)建設(shè)與企業(yè)發(fā)展都有著基礎(chǔ)又推波助瀾的作用。
3 大數(shù)據(jù)時代背景下網(wǎng)絡(luò)信息處理技術(shù)所面臨的挑戰(zhàn)及機遇
3.1 網(wǎng)絡(luò)信息安全性的高需求挑戰(zhàn)
在大數(shù)據(jù)的時代背景下,網(wǎng)絡(luò)正處于一個高速發(fā)展的時期,每日產(chǎn)生的數(shù)據(jù)已足夠龐大,但依然呈持續(xù)上漲的趨勢增加。在這樣的情況下,無論是對于企業(yè)而言還是對于個人而言,數(shù)據(jù)信息的安全問題就成了人們無法忽視的問題。打個比方說,當(dāng)前對于人們而言,網(wǎng)購已經(jīng)成了日常購物占比極為龐大的一部分,而在進行網(wǎng)購的過程中,若是對于網(wǎng)絡(luò)信息沒有多加注意鑒別就有可能進入網(wǎng)絡(luò)的一個黑洞,從而產(chǎn)生很大程度的網(wǎng)絡(luò)信息的安全上的隱患,更對由信息泄露引起的經(jīng)濟損失產(chǎn)生一定的威脅[5]。故而,對于網(wǎng)絡(luò)信息而言,還需要格外地注重信息的真假性,由此,也應(yīng)當(dāng)由國家進行相關(guān)政策的制定,從而進一步維護網(wǎng)絡(luò)安全,同時相應(yīng)的一些機構(gòu)可以通過建立一些有效的安全舉措來保護數(shù)據(jù)的安全,從而避免信息泄露造成的財產(chǎn)損失。
3.2 對于高素質(zhì)人才的高需求挑戰(zhàn)
在大數(shù)據(jù)背景下,除去對于網(wǎng)絡(luò)信息處理技術(shù)提出更高的要求也對相關(guān)工作人員的專業(yè)素質(zhì)提出了一定的要求。網(wǎng)絡(luò)信息技術(shù)雖然在近些年間發(fā)展較為迅猛,但相較而言,還是屬于新興的產(chǎn)業(yè),對相關(guān)性的專業(yè)人才也具有很強的需求性。但當(dāng)下社會除去需求高專業(yè)素養(yǎng)的人才以外,還需要人才具有更高的綜合素質(zhì)。故而,對于已有的相關(guān)專業(yè)人才,應(yīng)當(dāng)定期的加強相關(guān)培訓(xùn)[6]。此外,除去專業(yè)技術(shù)型人才以外,對于管理層的人才的缺口相對而言更大一些。這就需求相關(guān)的領(lǐng)導(dǎo)者應(yīng)當(dāng)轉(zhuǎn)變較為傳統(tǒng)的思維模式,通過對數(shù)據(jù)、管理為參照的相關(guān)依據(jù)進行相關(guān)人才的選拔。時代在進步,人們的思想與創(chuàng)意也在不斷進步,經(jīng)驗不應(yīng)當(dāng)成為一種限制,也不能成為一種定論。
3.3 數(shù)據(jù)深入發(fā)掘?qū)π庐a(chǎn)業(yè)的刺激機遇
對于不同的數(shù)據(jù)進行充分的分析了解后,在巨大的數(shù)據(jù)庫中尋找出一定的規(guī)模的方法稱之為數(shù)據(jù)發(fā)掘。數(shù)據(jù)的發(fā)掘能夠在很大程度上提升決策力。在平時進行數(shù)據(jù)處理時,常常會出現(xiàn)一些數(shù)據(jù)庫龐大,但缺乏信息的情況。針對這種情況出現(xiàn)的原因就是在一開始的準(zhǔn)備階段就出現(xiàn)了問題。當(dāng)網(wǎng)絡(luò)系統(tǒng)較為簡單化,數(shù)據(jù)庫的數(shù)據(jù)信息整理錄入、查找統(tǒng)計等等無法及時的提取出有效的信息,從而無法掌握信息的規(guī)律性,進一步使得系統(tǒng)不能夠?qū)Υ罅康男畔⑦M行處理。所以,對龐大的數(shù)據(jù)庫進行更為準(zhǔn)確的分析就能夠更加準(zhǔn)確地得到行為習(xí)慣與興趣愛好等等信息,再經(jīng)過相關(guān)人員進行整理處理并提出針對性決策從而增加工作者的工作效率,進一步推動企業(yè)的優(yōu)良發(fā)展。
舉個例子來說明這個問題:在我們在進行“百度搜索”時,會發(fā)現(xiàn)在輸入關(guān)鍵詞后能夠看到系統(tǒng)自動彈出相關(guān)的關(guān)鍵詞[7]。這就是瀏覽器對于所有搜索樣本點擊的關(guān)鍵詞進行了有效的整合與處理從而進一步進行分析,更加充分的發(fā)掘出具有代表性的詞條,從而能夠提升信息應(yīng)用效率,改善用戶獲得信息的效率性,從而獲得用戶的好感,進一步鎖定用戶。
3.4 云計算的機遇
在大數(shù)據(jù)的時代背景下,云服務(wù)技術(shù)也在不斷地發(fā)展。云服務(wù)通過對數(shù)據(jù)進行集中處理從而達到云計算的方式在各個平臺、電子設(shè)備上進行相關(guān)的數(shù)據(jù)交換的目的。通過這樣的方式能夠給需求者提供更多有效、可利用的資源。在當(dāng)前各項技術(shù)都在迅猛發(fā)展的狀態(tài)下,云服務(wù)也在不斷完善,云計算的意識也在不斷攀升,逐步實現(xiàn)網(wǎng)絡(luò)信息處理技術(shù)與云計算共同結(jié)合的新形勢[8]。
4 結(jié)束語
在大數(shù)據(jù)時代背景下的網(wǎng)絡(luò)信息處理技術(shù)包含了信息的收集、加工、儲存、傳播等等技術(shù)工作。大量的數(shù)據(jù)信息在網(wǎng)絡(luò)信息的處理技術(shù)下從雜亂無章、零碎不齊、毫無規(guī)律逐步變?yōu)橛行虻?、高效的、可利用的信息。這些數(shù)據(jù)信息也變得更加合理、便捷,能夠更及時地在人們的日常應(yīng)用中被獲取,從而為人們的學(xué)習(xí)辦公提供更有效的支持。
參考文獻:
[1] 田文濤.大數(shù)據(jù)時代下計算機信息處理技術(shù)研究[J].黑龍江科學(xué),2019,10(12):86-87.
[2] 楊成.初探大數(shù)據(jù)時代如何運用計算機信息處理技術(shù)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2018(3):54,59.
[3] 張華.大數(shù)據(jù)時代計算機信息處理技術(shù)探析[J].信息系統(tǒng)工程,2018(2):137-138.
[4] 孫婷.大數(shù)據(jù)時代計算機信息處理技術(shù)及應(yīng)用研究[J].中國戰(zhàn)略新興產(chǎn)業(yè),2019(12):121,123.
[5] 周寶富.大數(shù)據(jù)時代計算機信息處理技術(shù)分析[J].信息與電腦:理論版,2019,422(4):12-13.
[6] 景奕然."大數(shù)據(jù)+計算機"是強強聯(lián)手還是暗藏危機?——以信息處理技術(shù)為例[J].中國新通信,2018,20(23):110-111.
[7] 唐和卿.基于大數(shù)據(jù)時代的計算機信息處理技術(shù)淺析[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(5):10-11.
[8] 馮含楓.計算機在大數(shù)據(jù)時代下信息處理技術(shù)[J].計算機產(chǎn)品與流通,2019(2):105-105.
【通聯(lián)編輯:李雅琪】