張迎
[摘要]本文首先回顧了情報學(xué)的一些定義,包括廣義的和狹義的,再介紹情報學(xué)的產(chǎn)生,接著介紹情報學(xué)面臨的一些困境,并對大數(shù)據(jù)時代下的情報學(xué)發(fā)展進(jìn)行思考,分析大數(shù)據(jù)給情報學(xué)帶來的影響。因此,情報學(xué)雖然發(fā)展起來困難重重,但是因為大數(shù)據(jù)的出現(xiàn),抓住機(jī)遇充分利用信息技術(shù),情報學(xué)研究與工作也會得到很好的發(fā)展。
[關(guān)鍵詞]情報學(xué) 大數(shù)據(jù)
現(xiàn)如今,大數(shù)據(jù)是當(dāng)今的熱點詞匯。無論是中國還是美國,大數(shù)據(jù)成為各個領(lǐng)域關(guān)注的焦點,無論是商業(yè)界還是學(xué)術(shù)界,都打算或者已經(jīng)與“大數(shù)據(jù)產(chǎn)生關(guān)聯(lián)。情報學(xué)是以數(shù)據(jù)、信息為主要研究對象的學(xué)科。情報學(xué)在傳統(tǒng)領(lǐng)域面臨一些困境,例如學(xué)科困境、教育困境、職業(yè)困境。大數(shù)據(jù)時代給情報學(xué)研究帶來了機(jī)遇,為解決這些困境提供了條件,但是與此同時也給情報學(xué)帶來了挑戰(zhàn)。情報研究工作需要新的思路和研究方法來適應(yīng)大數(shù)據(jù)時代的到來,并在大數(shù)據(jù)環(huán)境下得到更好的發(fā)展。
一、情報學(xué)的定義
“情報學(xué)”術(shù)語是由法國學(xué)者阿曼德,路易斯創(chuàng)立的,并把它定義為“計算機(jī)情報處理”,其含義是用計算機(jī)進(jìn)行信息處理的手段和學(xué)科課程的總和,還包括在人類活動各個不同部門使用計算技術(shù)的廣闊領(lǐng)域。
情報學(xué)的狹義定義指的是科學(xué)情報學(xué)。情報是一種普遍的社會現(xiàn)象,科學(xué)情報學(xué)就是揭示這種現(xiàn)象的特性及其社會作用的學(xué)科。科學(xué)情報學(xué)的情報現(xiàn)象發(fā)生在科學(xué)領(lǐng)域內(nèi),與人類在認(rèn)識和改造自然之中所積累的科學(xué)知識密切相關(guān)??茖W(xué)情報學(xué)利用許多學(xué)科的理論綜合研究科學(xué)情報的產(chǎn)生、收集、加工傳遞和利用。
二、情報學(xué)面臨的困境
情報學(xué)發(fā)展主要面臨三大困境,即學(xué)科困境、教育困境和職業(yè)困境,Griffith作為ASIST年會的主席講演時,提到了情報學(xué)相互聯(lián)系的三個方面:學(xué)科、教育和職業(yè)。本節(jié)將具體分析這三大困境。
(一)學(xué)科困境
情報學(xué)的發(fā)展主要面臨以下兩大困境:
一方面是學(xué)科名稱與性質(zhì)搖擺不定。情報一直與信息緊密相連,所以曾經(jīng)“情報”被更名為“信息”,“情報學(xué)”也被叫做是“信息學(xué)”,大學(xué)里的信息學(xué)系、信息管理系取代了原有的圖書館學(xué)情報學(xué)系。另一方面是學(xué)科定位和發(fā)展不穩(wěn)定、不成熟。固守客觀知識的問題域(圖書館學(xué)的問題域),是符合這個學(xué)科的實際情況的,但是似乎不符合社會的潮流和拔高學(xué)科地位的需求,也不能將情報學(xué)真正與圖書館學(xué)相區(qū)別開;而脫離圖書館學(xué)的傳統(tǒng),又離開了原來的問題域,變成了技術(shù)的應(yīng)用,這樣,情報學(xué)學(xué)科同樣也不是獨立存在的,定位也因此變得模糊。
(二)教育困境
在圖情教育方面可以發(fā)現(xiàn)以下特點:一是所授予的學(xué)位越來越不集中,即提供的課程越來越多學(xué)科化或者交叉學(xué)科化。二是課程的變化:課程的范圍擴(kuò)大了,更多地加進(jìn)社會、經(jīng)濟(jì)等方面的內(nèi)容;去掉和圖書館相關(guān)的,如目錄、圖書館學(xué)、編目等方面的內(nèi)容,而更多地代之以技術(shù)類的課程。在這樣一個變化過程中,情報學(xué)容易失去內(nèi)核。圖情的核心課程一時不同于一時,一校不同于一校。
(三)職業(yè)困境
情報學(xué)缺乏職業(yè)認(rèn)同感。舉例來講,美國情報科學(xué)協(xié)會ASIS更名為美國情報科學(xué)與技術(shù)協(xié)會,增加了技術(shù)色彩,提升和強(qiáng)調(diào)了在這一學(xué)科中的技術(shù)成分,這一協(xié)會包括管理者、計算機(jī)科學(xué)家、工程師、律師等等,但是就是沒有情報學(xué)家。英國與圖書館協(xié)會獨立存在的情報科學(xué)家協(xié)會,在20世紀(jì)末討論出兩種融合方案,一是與英國計算機(jī)協(xié)會融合,二是和圖書館協(xié)會合并。大多數(shù)成員選擇與圖書館協(xié)會合并,組建英國圖書館與情報科學(xué)協(xié)會。所以說,圖書、情報、檔案一體化組織已經(jīng)成為全歐洲趨勢。
三、大數(shù)據(jù)時代的情報學(xué)
大數(shù)據(jù)的特點可以用4V來概括,即Volume,Velocity,Variety,Value。
(1)VoIume意思是數(shù)量巨大。現(xiàn)在的大數(shù)據(jù)中的數(shù)據(jù)其數(shù)據(jù)級以PB(1TB=1024TB)或EB來(1EB=100萬TB)或更高計算。人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,而歷史上全人類說過的所有的話的數(shù)據(jù)量大約是5EB。
(2)Velocity意思是處理速度快。對于大數(shù)據(jù)的處理速度,有一個著名的‘1秒定律或稱秒級定律,也就是說在秒級時間范圍內(nèi)給出分析的結(jié)果,如果超出這個時間,數(shù)據(jù)就失去了價值。
大數(shù)據(jù)帶來的機(jī)遇主要分為以下四個方面:
(1)大數(shù)據(jù)為情報學(xué)研究提供了豐富的數(shù)據(jù)資源支持。情報學(xué)研究大多建立在大量數(shù)據(jù)的基礎(chǔ)上,人們時刻在以各種方式生產(chǎn)不同的數(shù)據(jù),比如圖片、動畫、音頻、視頻等等。
(2)大數(shù)據(jù)使情報學(xué)學(xué)科技術(shù)日益完善。大數(shù)據(jù)的數(shù)據(jù)收集、存儲、處理、分析、挖掘技術(shù)是大數(shù)據(jù)時代的產(chǎn)物,例如云計算、物聯(lián)網(wǎng)、文本挖掘、數(shù)據(jù)可視化等等。
大數(shù)據(jù)給情報學(xué)的發(fā)展帶來的挑戰(zhàn)有:
(1)大數(shù)據(jù)的數(shù)量巨大、價值密度低的特點,使得獲取信息的難度加大。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,現(xiàn)在的大數(shù)據(jù)中的數(shù)據(jù)其數(shù)據(jù)級以PB(1TB=1024TB)或EB來(1EB=100萬TB)或更高計算,但是真正有價值的數(shù)據(jù)只會是在很小的范圍內(nèi)。這就導(dǎo)致在提取有用信息時要利用先進(jìn)技術(shù),例如數(shù)據(jù)挖掘、文本處理等來進(jìn)行信息提取。
(2)大數(shù)據(jù)的數(shù)據(jù)巨大,數(shù)據(jù)類型多樣的特點,使得數(shù)據(jù)的管理成為一大問題。在大數(shù)據(jù)時代,已經(jīng)不能用原有的傳統(tǒng)的數(shù)據(jù)管理方式來管理數(shù)據(jù),需要利用計算機(jī)硬件和軟件技術(shù),對數(shù)據(jù)進(jìn)行有效的收集、存儲、處理和應(yīng)用等有效的管理,并促進(jìn)其廣泛共享,使之價值最大化。這對于情報學(xué)來講,不僅僅是技術(shù)挑戰(zhàn),更是一種管理思維模式的轉(zhuǎn)變。
四、結(jié)語
綜上所述,情報學(xué)的發(fā)展面臨很大的困境,但是大數(shù)據(jù)時代的到來為情報學(xué)研究帶來了前所未有的機(jī)遇。大數(shù)據(jù)方面的豐富技術(shù)手段和方法研究,給情報學(xué)的技術(shù)和方法提供了指導(dǎo)?,F(xiàn)在需要做的是在理論上對情報學(xué)的理論基礎(chǔ)進(jìn)行進(jìn)一步的研究,建立起真正的情報學(xué)理論體系來,增進(jìn)學(xué)科技術(shù)發(fā)展,提供更好的方法,讓情報學(xué)逐步擺脫面臨的種種困境。