朱海燕
(安徽大學(xué)管理學(xué)院,安徽 合肥 230601)
朱海燕 女,1988年生,2010級圖書館學(xué)研究生。
隨著計算機技術(shù)的迅猛發(fā)展,網(wǎng)上信息急劇增長。面對海量無序、內(nèi)容繁雜的網(wǎng)絡(luò)信息,如何對其有效地進行組織,成為網(wǎng)絡(luò)信息使用者關(guān)注的重點。在目前網(wǎng)絡(luò)環(huán)境下,采用分類法進行信息組織主要有兩種方式:一是人工標引方式的傳統(tǒng)文獻分類法,二是以人工標引或自動標引方式采用自編的網(wǎng)絡(luò)信息分類法[1],如搜狐網(wǎng)。筆者以搜狐網(wǎng)和《中圖法》為例,對網(wǎng)絡(luò)信息資源分類法與傳統(tǒng)文獻分類法進行比較,并分析其特點,指出其不足及完善之方法。
網(wǎng)絡(luò)信息分類法是按主題為中心或按主題與科學(xué)相結(jié)合為立類原則,從方便用戶使用的角度出發(fā),采用自然語言來命名類目。通過層層劃分,逐級展開類目。例如,搜狐網(wǎng)根據(jù)網(wǎng)站的主題,首先把網(wǎng)站分為18大類,再按細分主題層層分下去,從而形成一個“樹技狀”分類結(jié)構(gòu),再根據(jù)不同用戶的使用習(xí)慣,以及不同的分類方式,把不同類目下“相關(guān)”的類目“鏈接”起來,從而形成搜狐的“網(wǎng)狀”分類體系。其中以主題分類為主設(shè)立了娛樂休閑、新聞媒體、工商經(jīng)濟、公司企業(yè)、電腦網(wǎng)絡(luò)、教育培訓(xùn)、文學(xué)、藝術(shù)、體育健身、衛(wèi)生健康、科學(xué)技術(shù)、生活服務(wù)、旅游交通、社會文化、政法軍事、社會科學(xué)、個人主頁17個大類[2],另外結(jié)合分面組配的方法設(shè)立國家與地區(qū),把其他17個大類下的所有網(wǎng)站又按所屬地域進行分類。
傳統(tǒng)文獻分類法是等級列舉式結(jié)構(gòu)的分類體系,以學(xué)科和邏輯劃分為標準展開嚴密而深細的類目劃分,并以高度規(guī)范化的代碼和語詞為標識來揭示和組織信息,用等級體系以及參照、注釋、互見、交替等方法來直接顯示類目之間的知識關(guān)聯(lián),比較全面客觀地反映了知識全貌及其內(nèi)在的邏輯關(guān)系[3]。如《中圖法》以自然科學(xué)、社會科學(xué)、哲學(xué)作為人類知識領(lǐng)域的基本構(gòu)成建立基本序列,并將作為社會主義分類法編制指導(dǎo)思想的“馬克思主義、列寧主義、毛澤東思想、鄧小平理論”和結(jié)合文獻特殊性設(shè)置的“綜合性圖書”作為部類,形成5個部類的基本序列,22個基本大類。其中按學(xué)科立類的有17個,按主題立類的只有5個:A馬克思主義、列寧主義、毛澤東思想、鄧小平理論;T工業(yè)技術(shù);U交通運輸;V航空、航天;Z綜合性圖書。
網(wǎng)絡(luò)信息分類系統(tǒng)分類標準較傳統(tǒng)分類法更加多元化。它采用以主題為中心或者主題與學(xué)科相結(jié)合的兩種方式立類,類目之間邏輯關(guān)系不夠嚴密,不需要以標記符號來表示類目之間的關(guān)系,主觀上不存在分類標準的使用數(shù)量問題,客觀上每一等級的劃分都使用了多重分類標準,劃分后子類之間的內(nèi)涵是相互交叉的。例如在搜狐網(wǎng)的新聞大類中,將其劃分為國內(nèi)、國際、社會、軍事、財經(jīng)、IT、體育、娛樂、教育、文化、旅游、健康等這些二級類目。其中,國內(nèi)、國際是根據(jù)新聞發(fā)生的地點進行的劃分;軍事、體育是按照學(xué)科進行的劃分;娛樂、財經(jīng)等是根據(jù)主題進行的劃分。而在國際和國內(nèi)新聞中也包括有軍事、財經(jīng)、娛樂等多種類型的新聞,財經(jīng)、娛樂等也囊括有國內(nèi)和國際的新聞。因此,其各子類之間的內(nèi)涵是相互交叉的。
傳統(tǒng)文獻分類法是將知識的學(xué)科范疇屬性層層劃分,以代碼為標識對信息分門別類地予以揭示和組織成系統(tǒng)。在分類標準的使用數(shù)量上,一般要求一次劃分采用一個分類標準,必要時再采用兩個或兩個以上標準。如《中圖法》主要是從科學(xué)分類和知識分類的角度來解釋文獻內(nèi)容的區(qū)別與聯(lián)系,按學(xué)科和專業(yè)集中文獻,提供從學(xué)科和專業(yè)角度檢索文獻的途徑,如I24小說,就是按照小說的題材,將其劃分為革命斗爭小說、軍事小說、史傳小說、經(jīng)濟政治小說、科學(xué)科幻小說、驚險推理小說、社會言情小說等。
網(wǎng)絡(luò)信息分類法采用的類目名稱比較隨意,多采用自然語言命名類目,旨在便于用戶理解和使用。不少類目名稱不夠科學(xué),沒有準確地表達類目的內(nèi)涵和外延,多是網(wǎng)民常見的俗稱、簡稱、習(xí)慣用語。
傳統(tǒng)文獻分類法所使用的類目名稱能夠確切表達類目的實際內(nèi)容范圍,內(nèi)涵、外延清楚,通常采用科學(xué)、規(guī)范、通用、穩(wěn)定性高的術(shù)語或譯名。如《中圖法》一級類目中的“政治法律”、“軍事”、“經(jīng)濟”、“文學(xué)”、“藝術(shù)”等,讓用戶能夠清楚明了地知道各大類的主要內(nèi)容。
網(wǎng)絡(luò)分類法類目展開主要是結(jié)合超文本技術(shù)的應(yīng)用,采取多維結(jié)構(gòu),從多個角度設(shè)置類目、展開類目體系。如搜狐網(wǎng)提供了從地區(qū)和資源類型角度的檢索入口,是一種不同于傳統(tǒng)線性序列的網(wǎng)狀結(jié)構(gòu),從不同角度對主題關(guān)系進行揭示。如檢索娛樂方面的信息,可以從國內(nèi)、國外地區(qū)開始檢索,同時也可以從電影、電視、音樂、戲劇等多個角度進行精確全面的檢索。搜狐網(wǎng)中,對于子類目同屬于幾個大類的類目,使用鏈接方式,將其在相應(yīng)類下重復(fù)反映,使其同時成為有關(guān)類目的有機組成部分。如搜狐網(wǎng)中新聞、體育等大類中都包含國內(nèi)、國外二級類目,都在其大類下列出。
傳統(tǒng)文獻分類法類目展開基本上采用線性序列。如《中圖法》分類體系中采用的是從屬關(guān)系、并列關(guān)系、交替關(guān)系和相關(guān)關(guān)系4種關(guān)系類型。從屬關(guān)系、并列關(guān)系是類目體系展開的主要線索,反映了類目的縱向聯(lián)系;交替類、類目參照則是對類目體系主要關(guān)系的補充,揭示被類目體系分散了的橫向聯(lián)系。通過二者的結(jié)合,文獻分類法按照類目之間的關(guān)系建立起了縱橫交叉、嚴密而又實用的分類體系。
類目交叉關(guān)系的處理是指涉及多個學(xué)科或主題的類目在不同學(xué)科或主題下的揭示和反映。網(wǎng)絡(luò)信息分類系統(tǒng)對類目交叉關(guān)系的處理采用類目重復(fù)反映的方法,也就是涉及多個學(xué)科的主題在多個類目下重復(fù)設(shè)置。如搜狐網(wǎng)中“體育”、“財經(jīng)”等既作為一級類目,同時又是“新聞”中的二級類目。
傳統(tǒng)文獻分類法對類目交叉關(guān)系的處理有3種手段:一種是設(shè)置交替類目。對于與兩個學(xué)科有關(guān)、可以隸屬于兩個科學(xué)部門的學(xué)科或類目,根據(jù)需要將一個類目設(shè)為正式類目,將另一個類目設(shè)為供選擇使用的交替類目。其次是作注釋說明。對于一類事物的總論和分論,一般在總論的類目下說明“總論入此,專論入有關(guān)各類”,或注明總論與分論的關(guān)系。第三是設(shè)參見項。對具有交叉關(guān)系的兩個類目,互設(shè)參見。《中圖法》運用組配技術(shù)主要有3個方面:一是編制各種類型的復(fù)分表,作為全表或某個局部組配復(fù)分的依據(jù);二是采用部分類目仿照已列出的類目進行細分;三是主類號之間使用冒號直接組配,合成新主題。
網(wǎng)絡(luò)信息分類方法是直接面向用戶的,沒有注釋,類目間的橫向聯(lián)系采用交叉列類,類目的內(nèi)容注釋則以有選擇的列舉下位類方式為主,便于鏈接[4]。在搜狐網(wǎng)中可以在主頁中看到各大類,然后直接選擇各大類進入新頁面,進行下一步選擇。
傳統(tǒng)分類法的類目注釋是標引人員的重要參考,也是讀者使用分類目錄的參考。除了說明類目含義的注釋外,還有大量的歸類方法注釋、組號方法注釋、參照注釋等。
網(wǎng)絡(luò)分類搜索引擎能提供多個檢索入口,適應(yīng)各種類型終端用戶的需要。它不同于傳統(tǒng)分類法的線性結(jié)構(gòu),網(wǎng)絡(luò)信息分類法從多角度利用文本技術(shù)和鏈接技術(shù)進行全方位的分類揭示,為其大類體系提供了多維檢索入口。如搜狐網(wǎng)除從信息資源的主題角度設(shè)類外,一般還同時從地區(qū)、資源類型、機構(gòu)等角度設(shè)類。如設(shè)立“國家與地區(qū)”大類提供了地區(qū)檢索的入口,設(shè)立“視頻”、“博客”、“圖庫”等提供了資源類型的檢索入口,設(shè)立“公司企業(yè)”提供了機構(gòu)檢索的入口。
網(wǎng)絡(luò)信息用戶主要是通過類名來識別和選擇檢索途徑。網(wǎng)絡(luò)信息分類法采用自然語言標引,簡單易懂。用戶可以根據(jù)類目直接進行檢索。如用戶登錄搜狐網(wǎng)后,在主頁上可以直接選擇“娛樂”、“體育”、“健康”等類目,進行信息瀏覽。
網(wǎng)絡(luò)分類法采取以主題為中心或按主題與學(xué)科相結(jié)合的類目設(shè)置方式,增強了類目的包容性。從便于用戶使用的角度出發(fā),根據(jù)用戶使用需要列類,突出了與用戶生活息息相關(guān)的如教育、娛樂、旅行、生活等普通用戶感興趣的類目,弱化科學(xué)技術(shù)、學(xué)術(shù)性類目的設(shè)置,便于用戶檢索。如搜狐網(wǎng)將“娛樂休閑”、“旅游交通”、“衛(wèi)生健康”等用戶需求量高的類目單獨設(shè)為大類,置于首頁之上,極大地方便了用戶查找。
由于網(wǎng)絡(luò)信息具有高度的動態(tài)性,各種信息處于不斷更新的狀態(tài)中,它所鏈接的網(wǎng)站、網(wǎng)頁也處于變化之中[5]。所以要求網(wǎng)絡(luò)信息分類體系具有跟蹤動態(tài)發(fā)展的能力。網(wǎng)絡(luò)分類引擎利用超文本技術(shù),根據(jù)需要動態(tài)調(diào)整類間關(guān)系,這種類間關(guān)系一旦不需要,可以隨時取消,出現(xiàn)新的類目關(guān)系也能夠及時添加。
一個完整的綜合性分類體系在劃分基本大類時應(yīng)將所涉及到的知識領(lǐng)域全部涵蓋進去,而目前的搜索引擎往往只從商業(yè)角度出發(fā)設(shè)置類目,因此體系的系統(tǒng)性和完整性受到很大影響。從類目設(shè)置情況來看,搜狐網(wǎng)有18個基本大類,涵蓋的知識不夠全面,也沒有形成較為完整的科學(xué)體系,有些信息難以歸類。如教育大類中,有高等教育,無中等和初等教育;有國內(nèi)院校,無國外院校。
網(wǎng)絡(luò)信息分類采用自然語言設(shè)置類名,雖然直觀易懂,但是大量口頭語言、網(wǎng)絡(luò)語言的使用使得類目名稱不規(guī)范,有時給用戶查找?guī)砝щy,難以查到真正需要的東西。如搜狐網(wǎng)一級類目中的“女人”、“原創(chuàng)”等,不熟悉的話不能準確地查找出所需信息。
目前許多網(wǎng)絡(luò)信息分類法未能嚴格地按照概念的內(nèi)涵和外延科學(xué)歸類,以用戶感興趣的內(nèi)容設(shè)置類目,對于用戶使用較少的信息沒有設(shè)置類目。因而,這種分類法不是科學(xué)的分類法,并未從知識領(lǐng)域、知識體系的角度分類。如《中圖法》中“工業(yè)技術(shù)”、“語言文字”等一級類目并沒有出現(xiàn)在搜狐網(wǎng)的類目中。搜狐網(wǎng)的大類設(shè)置使用了主題對象、學(xué)科、地區(qū)、文獻類型等多個標準但其類目之間邏輯性不強,類目歸屬存在不合理的現(xiàn)象。這種分類使得類目層次不一,破壞了分類的等級結(jié)構(gòu)和系統(tǒng)性,影響了類目體系的清晰度,在一定程度上干擾了用戶的檢索,降低了查準率。
網(wǎng)絡(luò)信息分類法普遍存在著分類體系不統(tǒng)一的問題。在類目的劃分、排列上都存在很大差別。類目采用多重列類使得同一個子類目出現(xiàn)在不同大類下,類目劃分層次也參差不齊,有的類目劃分為兩三層,有的類目則多達十幾層。用戶從分類途徑查找某個類名,往往要鏈接10多個頁面,既費時又費力。最常見的是邏輯關(guān)系比較混亂,常出現(xiàn)隸屬關(guān)系不清的現(xiàn)象。例如搜狐網(wǎng)中,從“文化”大類入口查找小說,需再選擇“讀書”大類,在“讀書”大類中可以看到“小說”子類目,可是該“小說”子類目屬于“聽書”上位類,檢索出來的小說不是文本格式的,而是音頻格式的,這樣用戶花費時間找到的并不是自己所需要的信息,而文本格式或在線閱讀的小說應(yīng)該從“文化”大類下的“原創(chuàng)”子類入口查找。
分類法中基本大類的設(shè)置應(yīng)將穩(wěn)定的、較為概括的學(xué)科或知識領(lǐng)域作為一級類目。網(wǎng)絡(luò)信息分類法的基本大類除了要考慮網(wǎng)站的商業(yè)性,還必須考慮知識的完整性與穩(wěn)定性。因此,設(shè)計基本大類時,應(yīng)盡量采用按學(xué)科進行分類,一級類目數(shù)量控制在15~20個為宜。如將哲學(xué)、社會科學(xué)、自然科學(xué)等學(xué)科分明、較為穩(wěn)定的類目設(shè)為一級類目;二級類目的設(shè)置可采取按主題分類,如娛樂休閑、生活服務(wù)等,類目劃分一般控制在四~六級左右,不宜過多。二級以下類目可采用“多重列類”等方法合理立類。類目內(nèi)容應(yīng)科學(xué)完整,既有學(xué)術(shù)信息、新聞信息,又有專業(yè)信息、個人信息等。
網(wǎng)絡(luò)信息類名的設(shè)置既要符合大多數(shù)用戶的使用習(xí)慣,同時要科學(xué)、準確、規(guī)范,涵蓋的知識領(lǐng)域要全面并且應(yīng)采用規(guī)范語詞,不使用復(fù)雜的標記制度,以便各種各樣的信息都有類可入??梢酝ㄟ^對類目進行科學(xué)注釋的手段來幫助用戶了解類目的含義,提高網(wǎng)絡(luò)信息的查全率及查準率??梢圆捎靡韵聝煞N注釋方式:一是通過精煉的文字,指明該類包含的內(nèi)容范圍;二是用列舉下位類的方式揭示本類的內(nèi)容范圍。
網(wǎng)絡(luò)信息分類法應(yīng)建立在科學(xué)的知識分類的基礎(chǔ)上,按照各學(xué)科之間的內(nèi)在聯(lián)系和相互關(guān)系并結(jié)合網(wǎng)絡(luò)信息資源的特點,形成一個科學(xué)的檢索系統(tǒng)。類目的設(shè)置與排序必須遵守基本的學(xué)科劃分和邏輯劃分原則[6]。由于類目的排列次序?qū)τ脩羰褂煤蜋z索速度會產(chǎn)生一定的影響,所以確定合理的排列次序是分類體系建立的一個基本內(nèi)容。首先,應(yīng)按照知識的邏輯次序和重要程度排列,共性區(qū)分的問題集中排列,采用相同標準區(qū)分的類目使用相同的次序排列。其次,對無明顯邏輯聯(lián)系的類目,可按照字順或網(wǎng)站信息點擊率排列。
網(wǎng)絡(luò)信息分類法的體系要統(tǒng)一,類目層次不宜過多,要突出重點類目。在編列類目時,要符合網(wǎng)絡(luò)信息的實際情況,以足夠的信息內(nèi)容作為保障。信息內(nèi)容多,類目就分得細;信息內(nèi)容少,類目就分得粗。對于一些類目在其上位類或其他類目中能明確反映出來的同時又不影響整個體系編制的情況下可以不單獨列出。如在網(wǎng)頁中可將熱點問題單獨列出。
網(wǎng)絡(luò)信息分類與傳統(tǒng)文獻分類法各有所長。隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展及人們越來越多地利用互聯(lián)網(wǎng),網(wǎng)絡(luò)分類法勢必要不斷完善。充分吸收傳統(tǒng)文獻分類法的優(yōu)勢來彌補其不足,是網(wǎng)絡(luò)信息分類體系趨于完善的必由之路。
[1] 鐘永萍.傳統(tǒng)文獻分類法與網(wǎng)絡(luò)信息分類法的比較研究[D].福建師范大學(xué),2008.
[2] 搜狐網(wǎng).搜狐首次對外展示搜索引擎網(wǎng)站分類法[EB/OL].[2011-11-27].http://it.sohu.com/77/81/article16718177.shtml.
[3]郭曉蘭.網(wǎng)絡(luò)信息分類方法與傳統(tǒng)分類法的比較研究[J].圖書館建設(shè),2003(3):48-50.
[4] 宋蓓玲.淺析構(gòu)建網(wǎng)絡(luò)信息分類體系[J].情報雜志,2004(8):110-111,114.
[5] 王麗瑜,李梅娟.網(wǎng)絡(luò)信息分類法與傳統(tǒng)文獻分類法的比較分析——以Yahoo!和《中圖法》為例[J].中國成人教育,2007(2):56-57.
[6]邰峻.從搜狐分類引擎分析網(wǎng)絡(luò)信息資源的分類組織[J].新世紀圖書館,2006(1):52-53.
[7] 王巍.搜狐分類體系初探[J].圖書館建設(shè),2001(1):72-74.