胥橙庭 張蓓 張彤
[摘 要] 根據(jù)大數(shù)據(jù)特征,從編輯應(yīng)熟悉并應(yīng)用種類豐富的信息載體、篩選和甄別高度復(fù)雜的不確定信息、建立信息網(wǎng)資源庫三方面分析大數(shù)據(jù)時代編輯的信息處理能力。
[關(guān)鍵詞] 大數(shù)據(jù) 編輯 信息處理能力 信息資源庫
[中圖分類號] G232 [文獻標識碼] A [文章編號] 1009-5853 (2016) 06-0040-02
[Abstract] The characteristics of the big data are analyzed. The information processing abilities of the editor in big data age are discussed, i.e., familiar with various information carriers and skilled in the use of them, screening highly complex uncertain information, and building the resource library of information network.
[Key words] Big data Editor Information processing ability Information databases
隨著大數(shù)據(jù)時代的到來,科技期刊作為傳統(tǒng)的科技信息的載體與傳播途徑,無疑已經(jīng)并且還會持續(xù)地受到強烈的沖擊,從而引起整個行業(yè)的徹底變革[1]。作為科技期刊編輯,如何改變舊有的工作模式,迅速找到適合大數(shù)據(jù)時代的工作方法就成了最大的挑戰(zhàn)。面對復(fù)雜多變的大數(shù)據(jù),如何采用全新的理念及技術(shù),迅速有效地處理信息,是科技期刊編輯面臨的最急迫的任務(wù)[2]。
1 大數(shù)據(jù)的信息特征
目前,對大數(shù)據(jù)還沒有統(tǒng)一的標準定義,業(yè)界存在幾種不同的定義[3]。一般情況下,大數(shù)據(jù)是指無法在一定時間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具進行感知、獲取、管理、處理和應(yīng)用的海量、復(fù)雜的數(shù)據(jù)集合。大數(shù)據(jù)的主要信息特征有三點[4]。
1.1 信息的復(fù)雜性
信息的復(fù)雜性體現(xiàn)在兩方面:一是信息載體多種多樣,從互聯(lián)網(wǎng)遍布物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器;二是數(shù)據(jù)模型變化多端,從傳統(tǒng)的文本信息轉(zhuǎn)變?yōu)閳D形、圖像、音頻、視頻等各種多媒體信息。信息的復(fù)雜多樣性給傳統(tǒng)的信息處理方式帶來挑戰(zhàn)。
1.2 信息的不確定性
信息的不確定性源于兩方面因素:一是由信息固有的復(fù)雜性帶來的原始數(shù)據(jù)的不準確性;二是由于傳統(tǒng)數(shù)據(jù)處理方式在數(shù)據(jù)采集處理粒度、應(yīng)用需求與數(shù)據(jù)集成和展示等方面的局限所導(dǎo)致的信息不同程度的不確定性。信息的不確定性要求編輯創(chuàng)新確認信息的方式。
1.3 信息的涌現(xiàn)性
大數(shù)據(jù)時代,每時每分每秒都有大量的信息產(chǎn)生,信息呈現(xiàn)前所未有的涌現(xiàn)性,使得數(shù)據(jù)信息的度量、研判與預(yù)測難以駕馭。如何在海量信息中保證目的性、時效性,是編輯面臨的最大挑戰(zhàn)。
2 大數(shù)據(jù)背景下科技期刊編輯應(yīng)具備的信息處理能力
編輯的信息處理能力是指其對信息的敏感性、辨識性和把握信息的能力,以及正確而又精準地分析、選擇、利用信息的能力。它是編輯在長期的編輯活動中,培養(yǎng)發(fā)展起來的一種捕捉、篩選、轉(zhuǎn)換和利用信息并改變固有信息環(huán)境的能力。在大數(shù)據(jù)時代,編輯應(yīng)具備以下信息處理能力。
2.1 熟悉并應(yīng)用種類豐富的信息載體的能力
大數(shù)據(jù)時代信息載體的復(fù)雜性要求科技期刊編輯要熟悉并能熟練使用各種新型科技信息來源,如微博、微信、臉書等社交媒體。很多原來在科技會議、個人主頁上率先發(fā)布的科學(xué)動態(tài),可能演變?yōu)槲⒉?、微信、臉書中的一兩句話,或者是網(wǎng)絡(luò)公開課中的某一段落??萍计诳庉嫴粌H應(yīng)當掌握這些碎片化信息的載體來源,還應(yīng)當熟悉一些大型的科研工作者的個人社交平臺,如researchgate、crossref等國際主流科研交流社區(qū),要能迅速在科研工作者的數(shù)字圈中找到自己的位置,并憑借自身在專業(yè)上的敏感度,迅速獲取原始信息。
不僅是個人媒體的發(fā)展帶來變革,一些傳統(tǒng)的大型數(shù)據(jù)庫也不斷推陳出新,為科技信息檢索的定向性、個性化提供新鮮的技術(shù)。計算機科學(xué)的發(fā)展從一開始就與科技信息的傳播息息相關(guān)。作為科技期刊的編輯,歸根結(jié)底,就是要具備不斷探索、不斷學(xué)習(xí)的能力,這樣才能在日新月異的技術(shù)變革中立于不敗之地。
2.2 篩選和甄別高度復(fù)雜的不確定信息的能力
在大數(shù)據(jù)時代,信息來源紛繁復(fù)雜,編輯不再只是從官方網(wǎng)站、權(quán)威數(shù)據(jù)庫以及紙質(zhì)期刊上獲得經(jīng)過鑒別、可信的數(shù)據(jù),還要從各種載體上獲得未經(jīng)證實的不確定信息。這就要求編輯依靠過硬的專業(yè)背景,提取隱藏的、潛在的有效信息,篩選、甄別并進行整合,經(jīng)過分析、處理,提煉出需要的、有價值的信息。
篩選和甄別的過程,不僅需要編輯具備專業(yè)理論知識,還需要編輯掌握各種信息處理工具。信息的鑒別可以通過一些信息技術(shù)手段,如圖形圖像處理、視頻提取、文本語義甄別等技術(shù)進行交叉驗證,但這些都是客觀技術(shù),最終還是要靠編輯自身的專業(yè)素養(yǎng)、能力、信息敏感性等各方面的綜合素質(zhì),才能使編輯在數(shù)據(jù)海洋中迅速準確地找到需要的信息。
2.3 建立信息網(wǎng)資源庫的能力
大數(shù)據(jù)的最大特征是涌現(xiàn)性。海量的數(shù)據(jù)似乎存在自身的智慧,通過對來自大量自發(fā)個體的語義進行互相融合和連接而形成語義,整個過程隨著數(shù)據(jù)的變化而持續(xù)演進[5]??梢姶髷?shù)據(jù)中不同類型、不同載體、不同結(jié)構(gòu)的數(shù)據(jù)之間在進行著聯(lián)絡(luò)和發(fā)展,形成元數(shù)據(jù)網(wǎng)絡(luò)??萍计诳庉嫬@得不同的信息之后,也應(yīng)當借助元數(shù)據(jù)信息固有的特性,通過先進技術(shù)及專業(yè)知識的加工處理,形成本期刊、本專業(yè)特有的信息網(wǎng)絡(luò)模型。在此基礎(chǔ)上,為以后各種海量信息的處理提供標準、高效的流程。圖1說明了大數(shù)據(jù)環(huán)境下編輯處理海量信息形成信息網(wǎng)絡(luò)的過程。
所建立的信息網(wǎng)絡(luò)可以根據(jù)自身的要求,網(wǎng)羅各種前沿科技動態(tài)、學(xué)者個人專業(yè)動向及國家政策調(diào)整、出版行業(yè)最新規(guī)劃等各種信息,互相交叉,相互服務(wù),為期刊的整體發(fā)展指明方向。
3 結(jié) 語
大數(shù)據(jù)環(huán)境下,編輯要具備信息處理能力,包括熟悉并應(yīng)用種類豐富的信息載體的能力,篩選和甄別高度復(fù)雜的不確定信息的能力,建立信息網(wǎng)資源庫的能力。在此基礎(chǔ)上,編輯才能自如地駕馭信息。海量信息的大數(shù)據(jù)時代對編輯獲取信息的能力提出了挑戰(zhàn),同時也給編輯獲取信息提供了更多的機會和便利。只要善加利用,大數(shù)據(jù)會給編輯注入新的能量。
注 釋
[1]柴英,馬婧.大數(shù)據(jù)時代學(xué)術(shù)期刊功能的變革[J]. 編輯之友,2014(6):28-31
[2]胥橙庭,孫松茜,張彤,等.大數(shù)據(jù)時代編輯的信息獲取能力初探[J].科技與出版,2015(3):43-44
[3]夏雪.基于大數(shù)據(jù)的科技情報研究芻議[J].江蘇航空,2014(2):21-22
[4]王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計算機學(xué)報,2013,36(6):1125-1138
[5] 周傲英,金澈清,王國仁,等.不確定性數(shù)據(jù)管理技術(shù)研究綜述[J].計算機學(xué)報,2009,32(1 ):1-16
(收稿日期:2016-01-27)