郭亞平
[摘 要]數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,已經(jīng)成為社會發(fā)展的必然趨勢和社會變革的驅(qū)動力。本文介紹了大數(shù)據(jù)的產(chǎn)生背景、概念內(nèi)涵和主要特點,提出了大數(shù)據(jù)背景下推進信息資源開發(fā)與利用面臨的問題,探討我國科技信息資源開發(fā)與利用的發(fā)展思路和初步進展,旨在為開展后續(xù)信息服務(wù)工作奠定基礎(chǔ)。
[關(guān)鍵詞]大數(shù)據(jù);信息資源;信息管理人員
doi:10.3969/j.issn.1673 - 0194.2019.12.083
[中圖分類號]G322[文獻標識碼]A[文章編號]1673-0194(2019)12-0-02
0? ? ?引 言
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)不僅推動社會發(fā)展與變革,也提高了國家、軍隊各方面的競爭力和保障水平,給信息資源開發(fā)與利用帶來機遇的同時也帶來了挑戰(zhàn)。
1? ? ?大數(shù)據(jù)概述
1.1? ?產(chǎn)生背景
大數(shù)據(jù)產(chǎn)生的背景包括以下幾方面。第一,信息科技進步。信息科技的3個最核心基礎(chǔ)能力(信息處理、信息存儲和信息傳遞)飛速進步。第二,互聯(lián)網(wǎng)把每臺計算機連接起來,成為人們獲取各類數(shù)據(jù)的首要渠道。第三,云計算將分布式、高性價比的大量計算、網(wǎng)絡(luò)和資源集成管理,并將應用軟件簡化為服務(wù)。云計算是大數(shù)據(jù)處理的重要支撐,大數(shù)據(jù)依托云計算挖掘海量數(shù)據(jù)。第四,物聯(lián)網(wǎng)是互聯(lián)網(wǎng)的延伸和擴展,通過智能感知、識別等信息技術(shù),廣泛應用于網(wǎng)絡(luò)中,在物與物間進行信息交換和通信,產(chǎn)生大量數(shù)據(jù),其中,一些數(shù)據(jù)被持續(xù)收集起來成為大數(shù)據(jù)的重要來源之一。
1.2? ?概念內(nèi)涵
“大數(shù)據(jù)”術(shù)語最早出現(xiàn)在apache org的開源項目中。大數(shù)據(jù)的意義是提高對巨量數(shù)據(jù)的專業(yè)化處理能力,實現(xiàn)數(shù)據(jù)增值,而不是掌握這些數(shù)據(jù)信息。大數(shù)據(jù)的概念是一種規(guī)模大到在獲取、存儲、管理、分析方面遠遠超出傳統(tǒng)數(shù)據(jù)庫軟件工具范圍的數(shù)據(jù)集集合,是海量資源和技術(shù)構(gòu)架的統(tǒng)稱。大數(shù)據(jù)以海量數(shù)據(jù)為核心,泛指在以網(wǎng)絡(luò)為基礎(chǔ),智能分析為手段,輔助決策為目標的資源、技術(shù)和應用的統(tǒng)稱。
1.3? ?特征
大數(shù)據(jù)的特征就是眾所周知的“4V標準”。第一,數(shù)量(Volume),即數(shù)據(jù)規(guī)模巨大,從現(xiàn)在的TB/PB級體量,很快進入ZB時代。第二,多樣性(Variety),即數(shù)據(jù)類型多樣,包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。第三,速度(Velocity),即數(shù)據(jù)處理快速,數(shù)據(jù)采集和處理時效性強。第四,真實性(Veracity),即追求高質(zhì)量的數(shù)據(jù)。
2? ? ?大數(shù)據(jù)背景下推進信息資源開發(fā)利用存在的問題
2.1? ?數(shù)據(jù)管理與呈現(xiàn)數(shù)據(jù)面臨困難
信息管理人員面臨的首個難題是數(shù)據(jù)管理。各個單位的不同部門產(chǎn)生的數(shù)據(jù)形式多樣,結(jié)構(gòu)復雜,標準不同,往往包括異構(gòu)多源的各型數(shù)據(jù),增加了數(shù)據(jù)采集、編輯與整合的困難。此外,網(wǎng)絡(luò)數(shù)據(jù)信息量大、價值密度低,干擾和劣質(zhì)的信息影響了信息資源開發(fā)與利用的質(zhì)效。在管理過程中,管理人員不僅要收集數(shù)據(jù),還要通過集成和模型分析,呈現(xiàn)數(shù)據(jù)。
2.2? ?大數(shù)據(jù)技術(shù)要求高
數(shù)據(jù)管理依賴先進的技術(shù)手段。目前,大多數(shù)數(shù)據(jù)挖掘算法的計算復雜度高,計算任務(wù)耗時長,非常迫切地需要相關(guān)企業(yè)掌握適應大數(shù)據(jù)特征的新型加工處理技術(shù)。只有借助符合大數(shù)據(jù)特征的數(shù)據(jù)分析工具提供技術(shù)層面的支持,才能及時分析利用數(shù)據(jù),抓住數(shù)據(jù)最佳時效,不影響人們對事物的認知與判斷,滿足數(shù)據(jù)的準確性、完整性、全面性要求,才能批量挖掘大數(shù)據(jù)信息,獲得有價值的數(shù)據(jù),滿足動態(tài)數(shù)據(jù)處理需求。
2.3? ?信息安全問題頻發(fā)
隨著信息技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)系統(tǒng)防護,專業(yè)數(shù)據(jù)備份、還原等信息要求越來越高,信息安全地位日顯突出。網(wǎng)絡(luò)信息泄露與竊密問題時有發(fā)生,網(wǎng)絡(luò)病毒層出不窮。信息技術(shù)的發(fā)展引起了信息內(nèi)容、載體和傳遞方式的變化,也引起了很多意想不到的問題和糾紛。
3? ? ?在大數(shù)據(jù)背景下進行科技信息資源開發(fā)與利用的發(fā)展思路和內(nèi)容架構(gòu)
3.1? ?發(fā)展思路
在大數(shù)據(jù)背景下,緊緊圍繞科技信息工作的任務(wù),針對基于大數(shù)據(jù)的資源體系構(gòu)建、知識體系構(gòu)建、情報智能分析等開展研究,收集各種渠道的信息,利用多種途徑推動應用技術(shù)發(fā)展,提高應用大數(shù)據(jù)作戰(zhàn)能力、情報感知能力,不斷完善自身建設(shè),爭取在前沿研究等方面取得突破,形成有效信息挖掘與情報分析支撐能力,推動科技信息工作的發(fā)展與進步。
3.2? ?內(nèi)容架構(gòu)
目前,筆者所在單位還處于信息資源開發(fā)與利用的初級階段。信息中心購置服務(wù)器,搭建了服務(wù)器集群,基礎(chǔ)條件支撐環(huán)境已經(jīng)實現(xiàn)高性能計算和高帶寬網(wǎng)絡(luò)通信,正在構(gòu)建科技信息獲取平臺和信息重構(gòu)與融合平臺,逐步實現(xiàn)科技信息采集、處理、管理和轉(zhuǎn)播服務(wù),以及信息抽取、聚合服務(wù)?,F(xiàn)急需建立一種有效的服務(wù)機制,在應用層面提升信息服務(wù)質(zhì)量,實現(xiàn)信息資源互聯(lián)互通、資源共享和服務(wù)創(chuàng)新。應用體系架構(gòu)如圖1所示。
4? ? ?信息資源開發(fā)與利用在大數(shù)據(jù)背景下的初步進展
云計算等新型信息技術(shù)推動了信息資源開發(fā)與利用的快速轉(zhuǎn)型,尤其是在大數(shù)據(jù)背景下,已經(jīng)實現(xiàn)了數(shù)據(jù)轉(zhuǎn)換、傳輸、存儲、遠程獲取以及各類數(shù)據(jù)的分析與統(tǒng)計。此外,信息網(wǎng)絡(luò)和數(shù)據(jù)平臺已有一定規(guī)模,具備數(shù)據(jù)開發(fā)與利用基礎(chǔ)。目前,筆者所在單位在數(shù)據(jù)工程項目建設(shè)的基礎(chǔ)上持續(xù)開展數(shù)據(jù)采集與處理工作,為科研課題、裝備建設(shè)等工作提供信息支撐。
4.1? ?建立個性化服務(wù)系統(tǒng)
應用大數(shù)據(jù)技術(shù)提高了數(shù)據(jù)開發(fā)與利用能力,也提高了科技信息服務(wù)水平。筆者所在單位的信息中心每年根據(jù)工作重點確定服務(wù)主題內(nèi)容,面對快速增長的數(shù)據(jù),提煉有價值的信息,提供準確的信息資源。目前,筆者所在單位深度分析數(shù)據(jù),建立個性化的數(shù)據(jù)分析模型,提供個性化信息服務(wù)。個性化服務(wù)系統(tǒng)主要包括用戶分析系統(tǒng)、信息推送系統(tǒng)、定題跟蹤系統(tǒng)等。
4.2? ?課題跟蹤服務(wù)
課題跟蹤服務(wù)涵蓋了信息搜集、傳遞及分析等多個方面。作為一種新型信息服務(wù)形式,打破了被動提供參考咨詢的傳統(tǒng)模式。目前,筆者所在單位指定信息服務(wù)人員為科研課題項目組搜集信息,專職人員跟蹤項目進度,獲得項目實時需求,利用現(xiàn)有資源與平臺搜集提供前沿性的信息資源,有效參與到單位建設(shè)中。
4.3? ?云搜索服務(wù)
云搜索是專業(yè)站內(nèi)搜索和內(nèi)容推薦系統(tǒng),在分布式搜索引擎的基礎(chǔ)上,提供更穩(wěn)定、實時、可靠的個性化、智能化信息。筆者所在單位定制開放云搜索服務(wù),信息檢索人員可根據(jù)自己的需求尋找各種類型的相關(guān)數(shù)據(jù)信息,搜索方式靈活、搜索結(jié)果精準、搜索速度更快。
5? ? ?結(jié) 語
大數(shù)據(jù)為科技信息資源的開發(fā)與利用提供了信息平臺、技術(shù)支撐和保障,有助于解決信息管理服務(wù)效率低、信息資源分散、深層次開發(fā)不足、共享不足等問題。因此,要不斷提高信息資源開發(fā)與利用的廣度和深度,加大對大數(shù)據(jù)技術(shù)的扶持與投資,推動信息傳遞的共享化,充分發(fā)揮信息資源在推動科研、裝備建設(shè)等方面發(fā)展中的作用,不斷提高科技信息資源的價值。
主要參考文獻
[1]姜虹.大數(shù)據(jù)背景下圖書館信息資源的管理及利用[J].黑河學院學報,2016(7).
[2]李雪森,佟琳.淺談大數(shù)據(jù)時代信息技術(shù)的機遇與挑戰(zhàn)[J].信息安全與技術(shù),2013(11).
[3]鄔賀銓.大數(shù)據(jù)時代的機遇與挑戰(zhàn)[J].唯實:現(xiàn)代管理,2013(5).
[4]曾方,黃紹斌,黃璐.大數(shù)據(jù)背景下政府信息資源開發(fā)利用供給機制探討[J].唯實:現(xiàn)代管理,2016(7).
[5]高峰,王劍.大數(shù)據(jù)背景下科技信息資源創(chuàng)新支撐能力研究[J].情報雜志,2018(10).
[6]黃雙穎.大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)信息資源的管理與利用研究[J].科技情報開發(fā)與經(jīng)濟,2014(21).
[7]袁偉,石蕾.大數(shù)據(jù)背景下科技資源信息挖掘與利用的思考[J].中國科技資源導刊,2017(49).
[8]王學琴,楊劍,康磊,等.大數(shù)據(jù)驅(qū)動科技信息資源市場化開發(fā)利用[J].中國科技信息,2015(5).
[9]周萍.大數(shù)據(jù)背景下醫(yī)院檔案信息資源利用問題研究[J].檔案天地,2016(4).