李 鵬
關(guān)于信息組織與知識(shí)組織的比較研究
李 鵬
在信息組織與知識(shí)組織的含義、特點(diǎn)、技術(shù)方法歸納的基礎(chǔ)上,引入相關(guān)技術(shù)研究的現(xiàn)狀分析,認(rèn)為信息技術(shù)的不斷升級(jí)是推動(dòng)信息組織向知識(shí)組織過渡的關(guān)鍵因素。
信息組織;知識(shí)組織;信息技術(shù)
[作 者]李鵬,山西工程職業(yè)技術(shù)學(xué)院。
各種先進(jìn)的信息技術(shù)及Internet的發(fā)展和運(yùn)用,切實(shí)改變了信息資源的組織方式。第一,數(shù)字化數(shù)據(jù)在網(wǎng)絡(luò)環(huán)境中是處于核心位置,沒有單一的信息對(duì)象,同時(shí)文獻(xiàn)特征的描述局限也被超越了,知識(shí)和信息單元也得到了深化。當(dāng)前傳統(tǒng)的靜態(tài)和規(guī)范以及集中化變成了動(dòng)態(tài)、復(fù)雜以及存取分散化,同時(shí)信息組織內(nèi)容也發(fā)生了本質(zhì)的變化;第二,信息資源共享的實(shí)現(xiàn)在當(dāng)前的網(wǎng)絡(luò)環(huán)境中要怎樣才能做到,同時(shí)這個(gè)問題也對(duì)信息組織的結(jié)構(gòu)與方式提出新的要求。知識(shí)經(jīng)濟(jì)的興起使得知識(shí)成為社會(huì)經(jīng)濟(jì)發(fā)展中最重要的資源和內(nèi)在變量,信息資源的組織方式也由信息組織發(fā)展到了知識(shí)組織。信息組織向知識(shí)組織飛躍的過程中起關(guān)鍵作用的是信息技術(shù)的飛速發(fā)展。
(一)信息組織的含義及特點(diǎn)
信息組織是把某一方面信息進(jìn)行了整理并且有效的排序,而這些信息往往是量大而且又分散無秩序的,整理的過程也是對(duì)這些信息進(jìn)行重新地排序和利用的過程,即信息序化或信息整序。數(shù)據(jù)庫或索引只存儲(chǔ)數(shù)據(jù)信息,減少了信息冗余,增加了信息容量。但實(shí)踐證明,信息系統(tǒng)并沒有像人們想象的那么簡(jiǎn)單,這是一個(gè)靜態(tài)、列舉式的結(jié)構(gòu)構(gòu)建過程,而這個(gè)過程中所服務(wù)的對(duì)象就是信息,而且這個(gè)過程也不能完全體現(xiàn)知識(shí)的創(chuàng)造性的動(dòng)態(tài)邏輯過程。
(二)信息組織的方法
當(dāng)前,使用比較多關(guān)于信息組織的方法,筆者總結(jié)如下:
第一,文件的方式,保留計(jì)算機(jī)處理結(jié)果的基本單元。文件方式具有這些優(yōu)勢(shì):在實(shí)現(xiàn)上較為簡(jiǎn)單,同時(shí)也能夠?qū)γ恳环N不是結(jié)構(gòu)化的信息進(jìn)行有效的存儲(chǔ)。其不足主要有:其一,文件的大小會(huì)和數(shù)量起沖突,同時(shí)也加重了網(wǎng)絡(luò)的負(fù)載量;其二,當(dāng)前文件系統(tǒng)還只是比較簡(jiǎn)單的信息邏輯結(jié)構(gòu),而在組織和管理結(jié)構(gòu)化信息中就顯得比較軟弱,對(duì)信息組織效率是一種降低的作用。
第二,數(shù)據(jù)庫的方式,是以固定的記錄格式存儲(chǔ)所有已獲得的網(wǎng)絡(luò)信息資源,用戶查找到其所需要的信息線索需要采用一定的方式,相應(yīng)的網(wǎng)絡(luò)信息資源也必須連接相應(yīng)的線索。其主要具備這些特征:對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行大量高速的處理;與此同時(shí)作為數(shù)據(jù)最小的存取單位,信息項(xiàng)對(duì)網(wǎng)絡(luò)負(fù)載起到了降低的作用。但是,當(dāng)前處理非結(jié)構(gòu)化信息如果采用數(shù)據(jù)庫處理方式,仍然會(huì)面臨著很大的困難,其不能對(duì)關(guān)聯(lián)的知識(shí)進(jìn)行有效提供,同時(shí)仍然缺少對(duì)逐漸復(fù)雜的信息單元的方法,直觀性和人際交互性也較為不足。
第三,主題樹的方式,用戶進(jìn)行交流是以當(dāng)前所提供的界面和網(wǎng)絡(luò)信息資源的主題目錄為主,鏈接主題目錄和多個(gè)實(shí)際有效的數(shù)據(jù)資源進(jìn)行連接。優(yōu)點(diǎn)在于:當(dāng)前檢索網(wǎng)絡(luò)信息和對(duì)界面的利用都相對(duì)比較簡(jiǎn)單;而且范疇分類體系也必須遵守,這是信息檢索中的必然要求;有較強(qiáng)的目的性和較高的查準(zhǔn)率;能夠?qū)?yán)密的系統(tǒng)性以及良好的可擴(kuò)充性進(jìn)行掌握。其存在的不足有:沒有復(fù)雜的體系結(jié)構(gòu),不能有太多的信息索引條目,這也對(duì)所能容納的網(wǎng)絡(luò)信息資源數(shù)量起到了很大的制約作用。
第四,超媒體的方式,這是一種超文本組織文本、聲音以及圖像等多媒體的信息的過程,找到任意一種媒介所載的內(nèi)容。其對(duì)人們跳躍性思維的習(xí)慣和非線性方式組織信息是相符的,同時(shí)其的包容性和擴(kuò)充性都較好,滿足了鏈接瀏覽的搜索方式。缺點(diǎn)在于是進(jìn)行信息搜尋時(shí)采用的是瀏覽的方式,遇到過于龐大的超媒體網(wǎng)絡(luò)的時(shí)候,定位的準(zhǔn)確性和迅速性很難得到保證,其也很難對(duì)瀏覽過程中的歷史記錄予以保存,這就導(dǎo)致了“迷航”現(xiàn)象的出現(xiàn)。
(三)信息組織技術(shù)的研究
信息組織的最終實(shí)現(xiàn)必須依賴信息技術(shù)的運(yùn)用。信息技術(shù)主要以下幾種:
1.元數(shù)據(jù)技術(shù)。元數(shù)據(jù)(Metadata)能夠幫助識(shí)別、發(fā)現(xiàn)描述和選擇信息,電子目錄所具備的功能其都擁有,同時(shí)每種電子文獻(xiàn)的內(nèi)容和特點(diǎn)也都可以予以揭示,對(duì)網(wǎng)絡(luò)信息資源的分類、組織和索引的實(shí)現(xiàn)起到了積極的促進(jìn)作用。
2.搜索引擎技術(shù)。這里指的就是對(duì)超文本方式、檢索情報(bào)和數(shù)據(jù)庫系統(tǒng)進(jìn)行建立,標(biāo)引和檢索WWW站點(diǎn)資源和其他網(wǎng)絡(luò)資源這一類的一類檢索系統(tǒng)機(jī)制。
3.數(shù)據(jù)庫技術(shù)。數(shù)據(jù)庫的內(nèi)部結(jié)構(gòu)體系可概括為:基于三級(jí)模式(概念模式、外模式、內(nèi)模式)的兩種映射。該技術(shù)作為數(shù)據(jù)管理的最新技術(shù),已先后經(jīng)歷了第一代數(shù)據(jù)庫(層次式數(shù)據(jù)庫與網(wǎng)狀數(shù)據(jù)庫)應(yīng)用的成功和第二代數(shù)據(jù)庫(關(guān)系數(shù)據(jù)庫)的輝煌。
4.推送技術(shù)。是信息公司以一定的技術(shù)標(biāo)準(zhǔn)或者協(xié)議通過海量的網(wǎng)絡(luò)信息經(jīng)過特定的頻道向用戶發(fā)送信息的傳播系統(tǒng)。信息推送技術(shù)不僅能利用其強(qiáng)大的功能,對(duì)有用的信息進(jìn)行分類和管理,還能按照用戶的要求以固定的信息頻道進(jìn)行播發(fā)。
(一)知識(shí)組織的含義及特點(diǎn)
整理、加工、引導(dǎo)、提示、控制知識(shí)客體過程和方法,就是知識(shí)組織。相對(duì)于信息組織來說,知識(shí)組織是要實(shí)現(xiàn)知識(shí)挖掘的知識(shí)表示過程。它有自動(dòng)、集成、智能等特點(diǎn)。
(二)知識(shí)組織的途徑
就像之前論述的一樣,對(duì)大量數(shù)據(jù)的合理利用的問題進(jìn)行解決不能沿用已經(jīng)存在的信息組織方法。知識(shí)組織具體歸納起來主要有以下五種:
1.知識(shí)表示。表達(dá)和揭示知識(shí)因子和知識(shí)關(guān)聯(lián)這些存在于知識(shí)客體中的因素,就稱之為知識(shí)表示。具體有主觀知識(shí)表示和客觀知識(shí)表示。
2.知識(shí)重組。是在結(jié)構(gòu)上重新融合相關(guān)知識(shí)客體中的知識(shí)因子和知識(shí)關(guān)聯(lián),從而形成另一種形式的知識(shí)產(chǎn)品的過程。主要有知識(shí)因子重組和知識(shí)關(guān)聯(lián)重組。
3.知識(shí)聚類。是按一定的聚類標(biāo)準(zhǔn)分別對(duì)知識(shí)進(jìn)行類聚和整序。主要有以學(xué)科、以主題、以人、以用、以時(shí)空聚類5大種類。
4.知識(shí)存檢。“存儲(chǔ)”和“檢索”二者構(gòu)成知識(shí)存檢的系統(tǒng),分為知識(shí)的腦內(nèi)存檢和知識(shí)的腦外存檢。前者實(shí)際就是主觀知識(shí)的形成過程,后者屬于客觀知識(shí)的存檢范疇。
5.知識(shí)編輯。是搜集、整理、加工知識(shí)客體的編輯活動(dòng)。其篩選功能有利于實(shí)現(xiàn)知識(shí)產(chǎn)品的“優(yōu)生”,分為輯錄性、撰寫性、匯集性、審讀性、譯介性、評(píng)價(jià)性、專輯性等編輯類型。
(三)知識(shí)組織的技術(shù)研究
計(jì)算機(jī)技術(shù)以及人工智能技術(shù)或者其他與之相關(guān)的技術(shù)的發(fā)展過程決定著知識(shí)組織智能化水平,所以在現(xiàn)有技術(shù)內(nèi)擴(kuò)張和保持知識(shí)組織智能化是必需的。目前使用范圍最廣、影響最大的幾種知識(shí)組織智能化技術(shù)分別為:
1.超文本技術(shù)。這是對(duì)計(jì)算機(jī)技術(shù)和人工智能的知識(shí)表示技術(shù)的利用的一種技術(shù),其對(duì)多接電子信息的軟件技術(shù)進(jìn)行非線性地組織和管理。語義網(wǎng)絡(luò)式方法的采用體現(xiàn)著超文本和知識(shí)的關(guān)系,節(jié)點(diǎn)表示其工作原理,知識(shí)關(guān)聯(lián)用網(wǎng)絡(luò)來表示。人們思維的瞬時(shí)聯(lián)系它也十分的重視,同時(shí)思維聯(lián)系信息的提供,從瀏覽和查詢信息可以從任何一個(gè)節(jié)點(diǎn)開始,對(duì)用戶而言十分的便利。
2.專家系統(tǒng)。這是當(dāng)前一個(gè)最新的研究領(lǐng)域,代表著人工智能走向?qū)嶋H運(yùn)用,其存貯某一特定領(lǐng)域內(nèi)人類專家的知識(shí),其基礎(chǔ)是知識(shí),這也是一款智能化計(jì)算機(jī)軟件系統(tǒng)。專家系統(tǒng)分別由知識(shí)、數(shù)據(jù)庫,以及推力機(jī)制和智能人機(jī)接口、獲取知識(shí)五個(gè)內(nèi)容組成的。
3.數(shù)據(jù)倉(cāng)庫技術(shù)。這是以管理和利用數(shù)據(jù)管理為基礎(chǔ),也是一種綜合性技術(shù)以及解決方案。集合結(jié)成主題和數(shù)據(jù),可用于支持制定決策的過程。數(shù)據(jù)倉(cāng)庫中的數(shù)據(jù)必須良好定義,具有一致性與不變性。
4.知識(shí)挖掘技術(shù)。控制顯性知識(shí)的同時(shí)也重視挖掘和利用隱性的知識(shí),這是知識(shí)組織所發(fā)揮的重要作用。當(dāng)前主要有以下這些知識(shí)挖掘技術(shù):聯(lián)機(jī)分析處理,其特征有快速、分析性強(qiáng)和多維以及信息性特征。同時(shí)處理方式也多樣化,有關(guān)系書籍庫以及多維服務(wù)引擎等,對(duì)內(nèi)容的研究是指能自動(dòng)處理數(shù)據(jù)庫中大量的原始數(shù)據(jù),挖掘、搜索出擁有必然性、富有意義的模式,主要對(duì)象仍是關(guān)系數(shù)據(jù)庫;數(shù)據(jù)挖掘(DM),是從大量的、不完整的原始數(shù)據(jù)中,提取出隱含在其中的與先前未知的信息和知識(shí)的過程。
以計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)為代表的現(xiàn)代信息技術(shù)的導(dǎo)入,把信息資源組織方式從信息組織引入一個(gè)新的境界——知識(shí)組織。知識(shí)組織實(shí)現(xiàn)了整序知識(shí)、科學(xué)分流、促進(jìn)選擇、保證利用的組織職能,更好地反映了社會(huì)發(fā)展的需要。知識(shí)經(jīng)濟(jì)時(shí)代,知識(shí)組織必將日益凸現(xiàn)、放大其作用。而人工智能技術(shù)的發(fā)展,必將把知識(shí)組織推進(jìn)到一個(gè)全新的高度,從而開啟信息資源組織方式的新篇章。
[1]蔣永福.圖書館與知識(shí)組織[J].中國(guó)圖書館學(xué)報(bào),l999(5):19-23.
[2]施向春.信息技術(shù)與圖書館新概念[J].圖書情報(bào)工作,2000(2):29-31.
[3]盛小平.數(shù)字圖書館的知識(shí)組織[J].圖書情報(bào)工作,2001(3):24-27.
[4]張彩虹,田建良.圖書館知識(shí)組織問題[J].圖書館雜志,200l(5):6-8.
[5]曾媚.文獻(xiàn)組織、信息組織與知識(shí)組織的比較研究[J].圖書館論叢,2003(2):6-10.
[6]李印結(jié).信息組織與知識(shí)組織比較研究[J].圖書情報(bào)工作,2012(增1):278-281.