關鍵詞:知識論;數(shù)據(jù)挖掘;資源整合;知識服務
摘要:文章從知識論的視角出發(fā),將數(shù)據(jù)挖掘技術與方法貫穿于圖書館自建數(shù)字資源整合工作中,得出知識結構圖,把圖書館數(shù)字資源以知識層次結構形式清晰地予以揭示。
中圖分類號:G253文獻標識碼:A文章編號:1003-1588(2014)05-0086-03
收稿日期:2014-02-22
作者簡介:賈鳳旭(1971-),鞍山師范學院圖書館館員。1知識服務推動數(shù)字資源整合
隨著數(shù)字資源的快速普及,極大地拓展了人們獲取信息知識的渠道,對數(shù)字資源獲取和利用效率的新需求也隨之而來,其主要表現(xiàn)在對數(shù)字資源檢索的系統(tǒng)性需求和具體化為對知識的需求,讀者對數(shù)字資源的需求已不再限于信息表面,而是具體深入到信息內(nèi)部的知識層面,即對知識服務的需求。這些新需求讓圖書館開始加強信息資源服務內(nèi)容的知識性,注重信息服務中知識因素的培育和發(fā)展,把各類數(shù)字資源按其知識結構和相互之間的邏輯關系,基于一定的科學方法進行整合,形成一個井然有序、結構明晰的數(shù)字資源新結構體系,幫助讀者在浩如煙海的數(shù)字資源中找到需要的信息知識,在海量的信息中捕獲蘊涵的知識內(nèi)容及其邏輯關系,從而方便了對知識的理解、應用并轉化為創(chuàng)造新知識。
如何對整體無序的數(shù)字資源進行合理的整合,這需要結合讀者的需求對數(shù)字資源進行知識挖掘,將分布在異構系統(tǒng)中的資源進行科學組織,形成以知識結構為脈絡、主題知識為節(jié)點的知識結構圖,讓讀者按其所需,透過知識結構圖的導引,輕而易舉地獲取所需要的有價值的信息知識。而如何提供有效知識,滿足讀者對知識的需求,與資源整合的程度密不可分,作為資源整合高級階段的知識整合,是圖書館做好知識服務的前提保障。知識服務的需求促進了知識組織方法與技術的發(fā)展,推動了圖書館基于知識的信息資源整合的研究與應用。
2知識論與數(shù)據(jù)挖掘
2.1基于知識論和數(shù)據(jù)挖掘的知識服務
知識服務是從資源內(nèi)部所具有的各種顯性和隱性信息,提煉出來讀者所需知識的一種服務,它把人們獲取知識的方式提升到一個全新的階段。知識是資源整合的最主要結果,是資源整合的關鍵性問題。信息科學中以知識論為基礎建立的“信息——知識——智能的轉換與統(tǒng)一理論”[1-3]同樣可以借鑒到圖書館數(shù)字資源整合實踐中,以知識為出發(fā)點,探究數(shù)字資源本質和內(nèi)在規(guī)律,最終利用知識來解決各種實際問題。各種信息資源均與知識密切相關,信息資源只有提煉成知識,才能實現(xiàn)其價值——智能的轉化,這也是資源整合研究中的核心問題。知識是各種經(jīng)驗、數(shù)據(jù)和信息的概念化抽象,是對客觀世界真實、可靠、準確的揭示和描述,其本質屬性具有關聯(lián)性[4-7]。知識以各種表現(xiàn)形式蘊含在信息資源的各個部分,因此,資源整合要注重對其本身內(nèi)部各種數(shù)據(jù)、信息的獲取、分析和計算,對知識客觀、科學地描述表示,運用以知識論為基礎的數(shù)據(jù)挖掘方法對資源進行重組整合無疑是一種科學合理的和系統(tǒng)的智能化處理方式,針對各個資源內(nèi)部知識的確定和不確定性,規(guī)范和不規(guī)范性的特點,采用人工和智能相結合的基于知識論的挖掘方法,科學規(guī)范地完成對資源的合理整合。
數(shù)據(jù)挖掘是在已有的數(shù)據(jù)基礎上,通過歸納、整理、機器學習、統(tǒng)計分析等方法得到數(shù)據(jù)對象之間的內(nèi)在特征,采用相關技術提取出所需要的信息知識。挖掘技術沿用Robot、全文檢索等信息檢索技術,綜合了人工智能、模式識別等技術,根據(jù)目標需求在信息資源中進行有目的的資源搜尋[8-9]。并把搜尋結果用聚類、分類等方法表示出來。
2.2基于知識論的數(shù)據(jù)挖掘的實現(xiàn)
知識蘊含于信息之中,必須把信息中的知識提煉出來并提供給應用者,才能轉化為生產(chǎn)力。采用基于知識論的數(shù)據(jù)挖掘方法把信息中蘊含的知識科學、系統(tǒng)地挖掘出來,并按一定的方法加以整理,最終傳遞給需求者,為其做出決策提供知識保障。基于知識論的數(shù)據(jù)挖掘流程如圖1所示。
圖1知識論數(shù)據(jù)挖掘的流程經(jīng)過信息確定、收集整理兩個步驟得到的各種信息資源,通過事先制定的數(shù)據(jù)挖掘模型,按數(shù)理統(tǒng)計的邏輯方法或KDD(Knowledge Discovery in Databases)計算機技術和工具來提煉信息資源中的知識元,結合知識的體系結構,通過類聚分析,按標準元數(shù)據(jù)規(guī)范要求對其進行描述,以此描述為依據(jù),重組成為可供用戶直接利用的系統(tǒng)性知識結構體系[8-9]。
3基于知識論的數(shù)據(jù)挖掘在數(shù)字資源整合中的應用
以知識服務為目的的信息資源整合,就是通過利用數(shù)據(jù)挖掘方法,基于知識論的原理對信息資源進行分析重組,把各種信息資源以知識結構圖的形式展示出來。知識結構圖中關于知識之間的脈絡關系是利用節(jié)點和連線來實現(xiàn)的,某一領域的知識點圍繞中心概念而被整合到一個結構之中,知識單元之間既有縱向貫通,也有橫向紐帶??v向貫通表示知識單元的概括范圍以及知識單元之間的從屬關系,即知識單元按層次排列,上層是對下層的總括,下層是上層的細化。橫向紐帶則是同一級別知識單元之間隸屬同一知識節(jié)點的并列細分。各知識單元從縱向層次架構和橫向交叉構成了知識結構圖。
賈鳳旭:基于知識論和數(shù)據(jù)挖掘的數(shù)字資源整合研究賈鳳旭:基于知識論和數(shù)據(jù)挖掘的數(shù)字資源整合研究關于知識結構圖層次結構的劃分,第一,按各主題知識的總分關系進行各個知識點的層次劃分,這種層次劃分讓其所聚合的各類資源排列從總括到細分一目了然。第二,從定義各節(jié)點知識元入手設計組織層次架構模型,根據(jù)各節(jié)點對應的知識結構關系,可以將結構中的知識資源按節(jié)點位置相對獨立地構建出其本身的知識層次架構模型。第三,結構中的知識層次根據(jù)各主題知識元自身的總分關系進行劃分,將出現(xiàn)頻率較高的,并且具有指導價值的知識元定義為主題知識點,然后根據(jù)其自身的總分關系進行知識結構排列,這樣能夠讓用戶更清晰地明確高頻有價值知識組織所包含知識的總體范圍,以及與其他知識的關聯(lián)性,增強了知識服務的實用性和管理性。
基于以上理論規(guī)劃,筆者在圖書館自建數(shù)字資源的整合工作中,構建了數(shù)字資源整合知識結構圖和知識元規(guī)范描述的體系,并在具體實施的過程中主要做好以下幾方面工作。
3.1選題確定為核心知識領域。在組織收集資源過程中,首先梳理組織核心主題的相關知識,據(jù)此對這些主題知識點進行分類整理,通過考察、研究各專題發(fā)展動態(tài),根據(jù)讀者的利用價值,選取具有一定價值意義的知識點作為該領域知識結構的根節(jié)點。例如,圖書館自建數(shù)字資源整合流程分析中,專題性、典型性的需求知識是貫穿整個資源整合流程的主要知識點,如:世界經(jīng)典名著、中華傳世藏書、古籍整理、外文原版等經(jīng)典收集,以及按文化專題歸輯的華夏文化、雪域探幽等專題類別。并按這些經(jīng)典和專題知識作為業(yè)務核心知識域進行分析、規(guī)劃知識結構,通過在館藏文獻資源和網(wǎng)絡上收集,經(jīng)過篩選、加工、整理并歸納到其所屬的各知識節(jié)點資源集合中。
3.2按知識的層次性制定各類型資源的層次結構圖。圖書館自建數(shù)字資源整合工作,確定了主題知識點為基礎工作之后,按各個主題知識點本身的知識層次結構來確定該主題知識點的縱向知識結構,讓各主題知識形成一個相對獨立的專題體系,如華夏文化主題知識點下,通過知識挖掘設計了宮廷文化、建筑沿革、民俗采擷、古跡遺風二級專題知識點,宮廷文化專題之下又設計出宮廷制度、宮廷服飾、宮廷建筑、宮廷飲食三級主題知識點,以此方法逐級排列,構建出該主題知識點的分層分級排列的知識結構模型,讓讀者對此專題知識在知識結構上有一個比較清晰的了解,并且在點擊同級別主題知識節(jié)點時,可以兼顧到同級別其他分節(jié)點的資源,這樣對分支知識資源也起到了一定的知識推介作用。
endprint
3.3挖掘同級別主題知識點之間的關聯(lián)性。同級別的主題知識是上一級別主題知識的細化分支,這些主題知識點之間存在著一定程度的聚合性和類同性,通過知識挖掘方法,可以找出各知識點之間彼此內(nèi)在的關聯(lián)性,從而可以把各種信息資源觸類旁通地聯(lián)系在一起。如華夏文化專題知識的二級知識點專題建筑沿革、宮廷文化、民俗采擷、古跡遺風以及宮廷文化之下三級專題知識點的宮廷制度、宮廷服飾、宮廷建筑、宮廷飲食中所屬的數(shù)字資源,通過數(shù)據(jù)挖掘技術尋找這些資源內(nèi)部知識在諸如歷史時期、人物和事件等方面聚合條件的聯(lián)系,由此,設計出具有多種組合條件的檢索模塊,按其內(nèi)部知識的上述等邏輯關系搜尋出來的資源組合,為用戶的個性化知識需求提供寬范圍、多角度的知識參考。
3.4主題知識點的創(chuàng)建和知識資源的收集、更新。密切關注各學科、專業(yè)、專題知識領域的發(fā)展動態(tài),根據(jù)現(xiàn)實需求創(chuàng)建新的主題知識點,并對所屬的知識資源進行收集、整理。同時,不斷更新、補充各主題知識點的知識資源,保持知識結構體系中的知識不斷完善和持續(xù)發(fā)展,構建基于知識管理與服務的圖書館自建數(shù)字資源整合系統(tǒng)。按照以上四個主要方面的工作,構建出如圖2所示的圖書館自建數(shù)字資源整合的知識結構圖。
圖2圖書館自建數(shù)字資源整合知識結構圖基于知識論和數(shù)據(jù)挖掘技術形成的知識結構圖,把數(shù)字資源整合到對應知識點的集合內(nèi),實現(xiàn)了圖書館自建數(shù)字資源按知識論原理的知識結構描述和資源整合重組,為用戶提供了統(tǒng)一的結構明晰的知識視圖,讓用戶從整體上把握了資源知識結構,方便用戶直觀地查找、掌握和使用所需的知識資源。用戶通過集成資源的知識結構圖按圖索驥,對某一主題知識的全局結構一目了然。
5結語
筆者結合了知識論原理的數(shù)據(jù)挖掘方法在數(shù)字資源整合中的應用,把圖書館的資源管理和服務提升到了一個新高度,通過知識節(jié)點的穿針引線作用,把紛紜復雜的數(shù)字資源按知識結構圖整合鏈接,提高了數(shù)字資源的系統(tǒng)性、整體性和易用性,讓圖書館的數(shù)字資源從原本數(shù)據(jù)集合的倉儲形式轉變成為以知識脈絡為紐帶的相互聯(lián)系的整體架構形式,實現(xiàn)了資源按知識結構的聚合體系,促進了圖書館數(shù)字資源與用戶之間的知識交流,提高了圖書館數(shù)字資源的利用效率,極大地增強了在知識經(jīng)濟時代背景下圖書館知識服務的能力。
參考文獻:
[1]柯平.知識學研究導論[J].圖書情報工作,2006(4):6-10,34.
[2]鐘義信.信息科學原理[M].北京:北京郵電大學出版社,2002:15.
[3]胡運發(fā).數(shù)據(jù)與知識工程導論[M].北京:清華大學出版社,2003:2-3.
[4]馬文峰,杜小勇.數(shù)字資源整合:理論、方法與應用[M].北京:北京圖書館出版社,2007:62-63.
[5]馬文峰.數(shù)字資源整合研究[J].中國圖書館學報,2002(4):64-67.
[6]胡昌平,嚴煒煒.基于概念圖的個人數(shù)字圖書館知識服務拓展[J].情報理論與實踐,2013(6):37-40.
[7]李寧,李秉嚴.知識挖掘技術及應用[J].情報雜志,2003(6):34-36.
[8]毛國君等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學出版社,2005:7-8.
[9]王光宏,蔣平.數(shù)據(jù)挖掘綜述[J].同濟大學學報,2004(2):246-252.(編校:嚴真)
endprint