李玲
【摘 要】隨著移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)的快速發(fā)展和廣泛應(yīng)用,大數(shù)據(jù)成為了當(dāng)今時(shí)代信息技術(shù)的必然產(chǎn)物。簡(jiǎn)單分析了大數(shù)據(jù)環(huán)境下信息組織面臨的困難和挑戰(zhàn),總結(jié)出信息組織發(fā)展的趨勢(shì)。
【關(guān)鍵詞】大數(shù)據(jù);信息組織;發(fā)展趨勢(shì)
Abstract: With the rapid development and wide application of mobile Internet, Internet of things, cloud computing and other technologies, big data has become an inevitable product of information technology in today's era. This paper analyzes the difficulties and challenges that faced by information organizations in the big data environment and summarizes the development trend of the information organization.
Keywords: big data; information organization; development tendency
一、引言
信息組織是采用各種方法和手段使信息有序化的過(guò)程。它通過(guò)揭示信息間內(nèi)在的邏輯關(guān)系,對(duì)信息進(jìn)行加工、整理、提煉,使之系統(tǒng)化、濃縮化,從而達(dá)到便于信息傳遞和交流的目的。今天,國(guó)際互聯(lián)網(wǎng)的飛速發(fā)展和普及,使其成為當(dāng)今最大的信息資源庫(kù),如何對(duì)這分布式的、異構(gòu)的、多格式的、海量的、高動(dòng)態(tài)的信息,進(jìn)行快速的整序,以最方便用戶(hù)、最人性化、最智能化的形式提供給信息的使用者,成了檢驗(yàn)信息組織水平和效率,促進(jìn)信息組織理論和技術(shù)深刻變革的強(qiáng)大動(dòng)力。大數(shù)據(jù)環(huán)境給信息組織帶來(lái)了巨大的影響,正確地識(shí)別這些影響,對(duì)于凝練信息組織的研究方向、使其適應(yīng)當(dāng)前的發(fā)展環(huán)境、與國(guó)家的重大需求對(duì)接、為國(guó)家大數(shù)據(jù)戰(zhàn)略的實(shí)施提供智力支持,具有非常重大的意義[1]。
本文通過(guò)探析面臨的困難和挑戰(zhàn),并針對(duì)這些困難和挑戰(zhàn),總結(jié)出信息組織在大數(shù)據(jù)環(huán)境下的發(fā)展趨勢(shì)。
二、大數(shù)據(jù)環(huán)境信息組織面臨的困難及挑戰(zhàn)
海量、異構(gòu)、動(dòng)態(tài)變化的數(shù)據(jù)使得信息組織的任務(wù)變得更為復(fù)雜,具體體現(xiàn)在數(shù)據(jù)本身的復(fù)雜性、計(jì)算的復(fù)雜性和信息系統(tǒng)的復(fù)雜性等方面。這也是大數(shù)據(jù)處理任務(wù)面臨的普遍問(wèn)題,有賴(lài)于大數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)計(jì)算、大數(shù)據(jù)挖掘與分析等基礎(chǔ)性技術(shù)的突破和迭代。大數(shù)據(jù)環(huán)境信息組織面臨的困難及挑戰(zhàn)表現(xiàn)在以下三方面:
(1)信息組織的作用極易被忽視。在大數(shù)據(jù)環(huán)境下的某些場(chǎng)景中,數(shù)據(jù)經(jīng)過(guò)挖掘可以直接生成情報(bào)(解決方案),無(wú)需經(jīng)過(guò)組織的便可直接服務(wù)于決策。另外,某些大數(shù)據(jù)在一定程度上強(qiáng)調(diào)實(shí)時(shí)性,很多數(shù)據(jù)還沒(méi)有被存儲(chǔ)和組織,就已經(jīng)失去了效用。在這種情況下,信息組織的作用也很難顯性化,再加上大數(shù)據(jù)時(shí)代人們?cè)谒枷肷蠈?duì)數(shù)據(jù)挖掘和分析的重視與推崇,信息組織在從數(shù)據(jù)到解決方案這個(gè)過(guò)程中的作用往往被隱藏或忽略了。
(2)信息描述標(biāo)準(zhǔn)的建立存在困難。在文獻(xiàn)組織階段,MARC,F(xiàn)RBR,DTD是文獻(xiàn)信息資源描述的標(biāo)準(zhǔn);在網(wǎng)絡(luò)信息組織階段,Dublin Core等元數(shù)據(jù)是網(wǎng)絡(luò)信息資源描述的標(biāo)準(zhǔn);在知識(shí)組織階段,RDF,OWL等形式化語(yǔ)言使得數(shù)據(jù)可以被機(jī)器讀取并理解。而在大數(shù)據(jù)環(huán)境下,無(wú)論是數(shù)據(jù)類(lèi)型還是數(shù)據(jù)載體,其表現(xiàn)形式正變得更加多樣化,越來(lái)越多的大數(shù)據(jù)來(lái)源于科學(xué)觀察中的實(shí)驗(yàn)數(shù)據(jù)、生命科學(xué)中的基因組數(shù)據(jù)、物聯(lián)網(wǎng)中的傳感器數(shù)據(jù)、互聯(lián)網(wǎng)中的社交媒體數(shù)據(jù)等等。所以,建立跨領(lǐng)域和跨數(shù)據(jù)類(lèi)型的統(tǒng)一描述標(biāo)準(zhǔn)、實(shí)現(xiàn)不同領(lǐng)域的大數(shù)據(jù)描述標(biāo)準(zhǔn)的關(guān)聯(lián)和互操作存在較大因難。
(3)信息組織的學(xué)科邊界逐漸模糊。近現(xiàn)代的信息組織最早起源于圖書(shū)情報(bào)領(lǐng)域,以應(yīng)對(duì)文獻(xiàn)信息資源的急劇增長(zhǎng)[2],分類(lèi)法、標(biāo)題法、編目、文摘索引等文獻(xiàn)組織的方法是早期的主要方法,《杜威十進(jìn)制分類(lèi)法》、《美國(guó)圖書(shū)館協(xié)會(huì)標(biāo)題表》、《化學(xué)文摘》等是信息組織早期的重要成果。隨著時(shí)代的發(fā)展和技術(shù)的進(jìn)步,計(jì)算機(jī)技術(shù)被廣泛應(yīng)用于信息組織,自動(dòng)分類(lèi)、自動(dòng)標(biāo)引、聯(lián)機(jī)檢索、自然語(yǔ)言檢索技術(shù)得到快速發(fā)展,隨之而來(lái)的是計(jì)算機(jī)科學(xué)對(duì)傳統(tǒng)信息組織研究的巨大沖擊。大數(shù)據(jù)環(huán)境下的元數(shù)據(jù)標(biāo)準(zhǔn)制定等信息組織研究?jī)?nèi)容與信息技術(shù)標(biāo)準(zhǔn)化等領(lǐng)域有重合,大數(shù)據(jù)組織等研究?jī)?nèi)容與數(shù)據(jù)科學(xué)、數(shù)據(jù)管理等領(lǐng)域產(chǎn)生了聯(lián)系與交叉。可見(jiàn),在計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、語(yǔ)義技術(shù)、大數(shù)據(jù)技術(shù)的沖擊下,信息組織的學(xué)科邊界逐漸模糊。
三、大數(shù)據(jù)環(huán)境信息組織的發(fā)展趨勢(shì)
為了應(yīng)對(duì)大數(shù)據(jù)環(huán)境提出的挑戰(zhàn),信息組織未來(lái)應(yīng)該朝著自動(dòng)化、語(yǔ)義化、標(biāo)準(zhǔn)化、開(kāi)放化的方面邁進(jìn)。其發(fā)展趨勢(shì)和任務(wù)可以總結(jié)為以下幾個(gè)方面:
(1)借助存量語(yǔ)義資源,對(duì)大數(shù)據(jù)進(jìn)行語(yǔ)義化組織。語(yǔ)義化是信息組織的重要發(fā)展方向,無(wú)論是語(yǔ)義網(wǎng)的提出,還是關(guān)聯(lián)數(shù)據(jù)、知識(shí)圖譜的蓬勃發(fā)展,都是在朝著語(yǔ)義化的方向邁進(jìn)。對(duì)于大數(shù)據(jù)來(lái)說(shuō),可以通過(guò)信息組織的方法、工具對(duì)大數(shù)據(jù)進(jìn)行一定程度的語(yǔ)義化,進(jìn)而通過(guò)實(shí)體的關(guān)聯(lián)對(duì)各類(lèi)大數(shù)據(jù)進(jìn)行連接、整合。要利用存量語(yǔ)義資源,必須對(duì)可用的存量語(yǔ)義資源進(jìn)行清查與摸底,掌握現(xiàn)有存量語(yǔ)義資源的數(shù)量、種類(lèi)和分布.并對(duì)存量語(yǔ)義資源進(jìn)行集成.關(guān)聯(lián)開(kāi)放數(shù)據(jù)[3]和中文開(kāi)放知識(shí)圖譜[4]在這方面已經(jīng)取得了較大的進(jìn)展。同時(shí),由于大數(shù)據(jù)涉及的領(lǐng)域廣泛、數(shù)據(jù)類(lèi)型多樣,難以直接為大數(shù)據(jù)標(biāo)注指定相應(yīng)的知識(shí)庫(kù),所以,還要研究存量語(yǔ)義資源的發(fā)現(xiàn)與更新機(jī)制、算法和模型,研究大數(shù)據(jù)與存量語(yǔ)義資源中知識(shí)庫(kù)進(jìn)行匹配的方法等等。
(2)依托大數(shù)據(jù)技術(shù),提升信息組織的自動(dòng)化水平和效率。具體體現(xiàn)在:
第一,大數(shù)據(jù)環(huán)境下,機(jī)器學(xué)習(xí)、人工智能、數(shù)據(jù)挖掘與分析等領(lǐng)域取得了長(zhǎng)足的進(jìn)步,將為大數(shù)據(jù)組織提供有力的技術(shù)支撐[5]。
第二,大數(shù)據(jù)處理需求催生的新型計(jì)算模式,有利于數(shù)據(jù)的整合,比如查詢(xún)分析計(jì)算模式可用于結(jié)構(gòu)化數(shù)據(jù)的整合,圖計(jì)算模式可應(yīng)用于社交媒體中的知識(shí)整合,等等。
第三,大數(shù)據(jù)可視化技術(shù)進(jìn)一步豐富了信息組織的表達(dá)和展示方式。長(zhǎng)期以來(lái),可視化是信息組織成果展示的重要渠道和方式,大數(shù)據(jù)環(huán)境使人們對(duì)可視化的需求呈現(xiàn)爆發(fā)式增長(zhǎng),催生了一系列新的可視化工具、技術(shù)和方法,其中的一些工具、技術(shù)和方法也同樣適用于展示信息組織的成果。
信息組織研究需要充分引入大數(shù)據(jù)處理的新范式、新技術(shù)和新工具,提高信息組織的自動(dòng)化水平和效率。
四、結(jié)語(yǔ)
信息組織作為圖書(shū)情報(bào)學(xué)的核心研究領(lǐng)域,是信息存儲(chǔ)、信息檢索、信息利用與服務(wù)的基礎(chǔ)和前提。現(xiàn)階段,雖然信息組織在大數(shù)據(jù)環(huán)境下面臨嚴(yán)峻的挑戰(zhàn),但我們始終相信在相關(guān)學(xué)者的堅(jiān)持不懈、艱苦深入的研究下,我們定能創(chuàng)新出新的信息組織工具,應(yīng)對(duì)大數(shù)據(jù)環(huán)境帶來(lái)的影響與挑戰(zhàn)。
【參考文獻(xiàn)】
[1]趙一鳴,馬費(fèi)成.大數(shù)據(jù)環(huán)境對(duì)信息組織的影響[J].博士論壇,2017(1):4-10.
[2]葉繼元.信息組織[M].北京:電子工業(yè)出版社,2010:5-6,18-26,170.
[3]The Linking Open Data Community. The linking open data cloud diagram[EB/OL]. [2016-03-20]. http://lod-cloud.net/
[4]CKAN聯(lián)盟.中文開(kāi)放知識(shí)圖譜[EB/OL].[2016-09-01 ].http: //openkg.cn/
[5]馮芷艷,郭迅華,曾大軍,等.大數(shù)據(jù)背景下商務(wù)管理研究若干前沿課題[J].管理科學(xué)學(xué)報(bào),2013,16(1):1-9.