李 坤
(湖南文理學(xué)院圖書(shū)館,湖南 常德 415000)
CNKI是中國(guó)知識(shí)基礎(chǔ)設(shè)施 (China National knowledge Infrastructure)的英文縮寫(xiě)。CNKI工程的宗旨就是建設(shè)一個(gè)進(jìn)行知識(shí)收集、傳播、擴(kuò)散的供個(gè)人與機(jī)構(gòu)利用的知識(shí)信息資源系統(tǒng)和交互網(wǎng)絡(luò)平臺(tái),為全社會(huì)提供一個(gè)知識(shí)信息共享的服務(wù)平臺(tái)和協(xié)同工作平臺(tái),為各行各業(yè)的各類(lèi)機(jī)構(gòu)對(duì)本單位的知識(shí)收集、傳播、擴(kuò)散進(jìn)行有效管理提供適用的知識(shí)管理平臺(tái),二者結(jié)合起來(lái),實(shí)現(xiàn)知識(shí)服務(wù)之目標(biāo)[1]。CNKI工程于1995年正式立項(xiàng)。在國(guó)家領(lǐng)導(dǎo)以及教育部、中宣部、科技部、新聞出版總署、國(guó)家版權(quán)局、國(guó)家計(jì)委的大力支持下,在全國(guó)學(xué)術(shù)界、教育界、出版界、圖書(shū)情報(bào)界等社會(huì)各界的密切配合和清華大學(xué)的直接領(lǐng)導(dǎo)下,CNKI經(jīng)過(guò)多年努力,采用自主開(kāi)發(fā)并具有國(guó)際領(lǐng)先水平的數(shù)字圖書(shū)館技術(shù),建成了世界上中文信息量規(guī)模最大的 “CNKI數(shù)字圖書(shū)館”。 CNKI數(shù)字圖書(shū)館集知識(shí)信息資源精華之大成,基于知識(shí)網(wǎng)絡(luò)與知識(shí)服務(wù)網(wǎng)絡(luò)而建造超大型期刊、圖書(shū)、博碩士論文、會(huì)議論文、專(zhuān)利、報(bào)紙等數(shù)據(jù)庫(kù),一覽浩瀚知識(shí)信息資源;引文鏈接、知識(shí)元鏈接,將知識(shí)內(nèi)容點(diǎn)點(diǎn)關(guān)聯(lián),對(duì)知識(shí)發(fā)現(xiàn)、發(fā)展脈絡(luò)步步跟蹤;用戶遍及全國(guó)和歐美、東南亞、澳洲等各個(gè)國(guó)家和地區(qū),實(shí)現(xiàn)了我國(guó)知識(shí)信息資源在互聯(lián)網(wǎng)條件下的社會(huì)化共享與國(guó)際化傳播,使我國(guó)各級(jí)各類(lèi)教育、科研、政府、企業(yè)、醫(yī)院等各行各業(yè)獲取與交流知識(shí)信息的能力達(dá)到了國(guó)際先進(jìn)水平。
“中國(guó)知網(wǎng)”是CNKI的一個(gè)門(mén)戶網(wǎng)站,該網(wǎng)由中國(guó)學(xué)術(shù)期刊光盤(pán)版電子雜志社、清華同方知網(wǎng)北京技術(shù)有限公司主辦,是基于《中國(guó)知識(shí)資源總庫(kù)》的全球最大的中文知識(shí)門(mén)戶網(wǎng)站,具有知識(shí)的整合、集散、出版和傳播功能。CNKI自1995年起建設(shè)至今已有近15年的歷史,其技術(shù)產(chǎn)品發(fā)展過(guò)程經(jīng)歷了光盤(pán)版時(shí)代(《中國(guó)學(xué)術(shù)期刊《光盤(pán)版》1996年12月一1999年5月)、網(wǎng)絡(luò)版時(shí)代(中國(guó)期刊www.chinajournal.net.cn,1999年6月一2001年8月)和知識(shí)服務(wù)平臺(tái)時(shí)代 (中國(guó)知網(wǎng) www.chki.net,2001 年 9 月至今)[2]。前兩個(gè)時(shí)期CNKI的文獻(xiàn)產(chǎn)品比較單一,只有期刊全文數(shù)據(jù)庫(kù)一種,是典型的提供文獻(xiàn)型數(shù)據(jù)庫(kù)。而現(xiàn)在的CNKI己擁有期刊論文、學(xué)位論文、會(huì)議論文、報(bào)紙、年鑒、圖書(shū)等多種文獻(xiàn)類(lèi)型的數(shù)據(jù)庫(kù),并己將所有數(shù)據(jù)庫(kù)資源統(tǒng)一置于“中國(guó)知網(wǎng)”網(wǎng)絡(luò)服務(wù)平臺(tái)上,開(kāi)始實(shí)現(xiàn)從信息服務(wù)到知識(shí)服務(wù)的轉(zhuǎn)變?!爸袊?guó)知網(wǎng)”現(xiàn)階段整合上網(wǎng)的文獻(xiàn)、信息、知識(shí)的數(shù)字化資源有“CNKI知網(wǎng)數(shù)字圖書(shū)館”、“中國(guó)期刊網(wǎng)”、“中國(guó)研究生網(wǎng)”、“中國(guó)社會(huì)團(tuán)體網(wǎng)”、“電子圖書(shū)網(wǎng)”、“中國(guó)名師教育網(wǎng)”、“《問(wèn)答與導(dǎo)學(xué)》名師多媒體輔導(dǎo)網(wǎng)”、“中國(guó)醫(yī)院數(shù)字圖書(shū)館”、“中國(guó)企業(yè)知識(shí)倉(cāng)庫(kù)系列”、“中國(guó)城建知識(shí)資源網(wǎng)”、“CNKI中國(guó)農(nóng)業(yè)知識(shí)資源網(wǎng)”、“中小學(xué)多媒體數(shù)字圖書(shū)館”、“CNKI英漢/漢英詞典”和“中國(guó)知識(shí)資源總庫(kù)”。其中,《中國(guó)知識(shí)資源總庫(kù)》是中國(guó)知網(wǎng)的核心資源,涵蓋CNKI所有自制資源及加盟資源,是基本源數(shù)據(jù)庫(kù),其它各種專(zhuān)業(yè)知識(shí)數(shù)據(jù)庫(kù)大多由其衍生出來(lái)。
CNKI工程作為國(guó)家級(jí)重點(diǎn)新產(chǎn)品重中之重項(xiàng)目,經(jīng)過(guò)不斷培育和發(fā)展,長(zhǎng)期致力于知識(shí)信息資源的全社會(huì)共建共享,致力于利用互聯(lián)網(wǎng)進(jìn)行互動(dòng)協(xié)同學(xué)習(xí)、工作平臺(tái)的建設(shè),通過(guò)與全國(guó)期刊界、博碩士培養(yǎng)單位、學(xué)術(shù)界、新聞出版與圖書(shū)情報(bào)等社會(huì)各界的廣泛合作,目前已經(jīng)建設(shè)、積累了大量的知識(shí)信息資源,開(kāi)發(fā)了一系列的信息服務(wù)、知識(shí)服務(wù)與知識(shí)管理技術(shù),搭建了基于互聯(lián)網(wǎng)和衛(wèi)星網(wǎng)覆蓋全球的“CNKI數(shù)據(jù)庫(kù)交換服務(wù)中心”,實(shí)施了標(biāo)準(zhǔn)化改造,初步完成了從信息服務(wù)到知識(shí)服務(wù)的模式轉(zhuǎn)變。在贏得國(guó)內(nèi)外高??蒲小Ⅻh政機(jī)關(guān)、企業(yè)、醫(yī)院廣大用戶高度認(rèn)可的基礎(chǔ)上,為了全面實(shí)現(xiàn)國(guó)家“十五”計(jì)劃制定的知識(shí)信息資源全社會(huì)共享的目標(biāo),促進(jìn)高校數(shù)字圖書(shū)館建設(shè)、科研文獻(xiàn)信息保障體系、電子政務(wù)工程、教育信息化、醫(yī)院信息化、企業(yè)信息化以及各行各業(yè)創(chuàng)新與知識(shí)管理戰(zhàn)略的實(shí)施,近日,CNKI工程做出決定,正式向全社會(huì)各類(lèi)機(jī)構(gòu)和個(gè)人開(kāi)始實(shí)施個(gè)性化知識(shí)服務(wù)[3]。
從CNKI平臺(tái)結(jié)構(gòu)功能及其知識(shí)構(gòu)建程度可知,該平臺(tái)是一個(gè)集信息搜集、知識(shí)加工、存貯、檢索為一體化服務(wù)的數(shù)字圖書(shū)館整體解決方案。基于此平臺(tái)上的CNKI數(shù)字圖書(shū)館也必須具備網(wǎng)絡(luò)虛擬化、分布協(xié)同工作、統(tǒng)一管理等基本特征,具備下列知識(shí)服務(wù)功能[4]。
CNKI數(shù)字圖書(shū)館通過(guò)知識(shí)網(wǎng)站管理系統(tǒng)為用戶單位提供了專(zhuān)門(mén)的數(shù)據(jù)接口,經(jīng)過(guò)《總庫(kù)》出版者的許可,可以將用戶單位所需知識(shí)資源從不同子庫(kù)中抽取到本地,重新組合建庫(kù)發(fā)布;也可以揉和以自身特有資源,作為內(nèi)容豐富的特色數(shù)據(jù)庫(kù)為本單位提供更好的服務(wù)。
面對(duì)分布異構(gòu)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù),CNKI數(shù)字圖書(shū)館利用知識(shí)網(wǎng)站管理系統(tǒng),為用戶提供了分布異構(gòu)統(tǒng)一檢索系統(tǒng)(USP),在網(wǎng)絡(luò)數(shù)據(jù)庫(kù)和用戶之間搭起了知識(shí)服務(wù)的橋梁。
作為知識(shí)創(chuàng)建與出版者,圖書(shū)情報(bào)機(jī)構(gòu)應(yīng)能將本館的特色館藏有選擇的揭示出來(lái),或?qū)δ骋活I(lǐng)域的知識(shí)進(jìn)行深入挖掘,依法解決作品著作權(quán)使用許可之后,即可作為本館創(chuàng)建發(fā)行的特色知識(shí)庫(kù)提供給用戶。根據(jù)知識(shí)來(lái)源不同,特色知識(shí)庫(kù)的建設(shè)有紙質(zhì)資源電子化、現(xiàn)有電子資源整合、互聯(lián)網(wǎng)信息資源整合三種類(lèi)型。
網(wǎng)絡(luò)視頻會(huì)議系統(tǒng)和網(wǎng)上協(xié)同工作平臺(tái)可以實(shí)現(xiàn)視頻傳輸和音頻交互,支持多路視頻同時(shí)傳送;支持多人同時(shí)操作電子白板;具有程序共享功能;具有文字聊天、資源同步與共享、實(shí)錄回放、會(huì)議控制及管理、服務(wù)器級(jí)連等多種功能,而且可選擇多種模式,如分組會(huì)議、廣播會(huì)議、研討會(huì)議、兩點(diǎn)會(huì)議等。
2.5.1 網(wǎng)上授課系統(tǒng)
針對(duì)不同學(xué)科建立教師推薦參考書(shū)庫(kù)、教學(xué)素材庫(kù)、教師教案講義庫(kù);答卷/作業(yè)提交系統(tǒng)及試題/作業(yè)庫(kù);問(wèn)/答系統(tǒng)及問(wèn)題答案庫(kù)。
2.5.2 咨詢(xún)服務(wù)系統(tǒng)
該系統(tǒng)能夠自動(dòng)回答一些提問(wèn)頻率較高的常見(jiàn)問(wèn)題,問(wèn)題庫(kù)于日積月累并逐漸擴(kuò)充,此種咨詢(xún)方式可以24小時(shí)響應(yīng)終端提問(wèn)。如果在咨詢(xún)服務(wù)系統(tǒng)中找不到答案,用戶可以進(jìn)一步利用Web表單與E-mail咨詢(xún)系統(tǒng)提問(wèn),在有限工作日內(nèi)咨詢(xún)員將做出答復(fù)。
2.5.3 個(gè)性化服務(wù)系統(tǒng)
個(gè)性化信息服務(wù)系統(tǒng)能夠?yàn)椴煌脩籼峁┎煌姆?wù),以滿足不同的需求;通過(guò)收集和分析用戶信息來(lái)研究用戶的興趣和行為,從而實(shí)現(xiàn)主動(dòng)推薦的目的;充分提高站點(diǎn)的服務(wù)質(zhì)量和訪問(wèn)效率,從而吸引更多的訪問(wèn)者。
在上述功能支持下,CNKI數(shù)字圖書(shū)館便可為用戶提供如查新服務(wù)、遠(yuǎn)程傳送、引文索引、推送服務(wù)、個(gè)性化服務(wù)和數(shù)字參考服務(wù)等多種增值服務(wù)內(nèi)容。
CNKI平臺(tái)是在網(wǎng)絡(luò)時(shí)代人們檢索信息的繁瑣與不便的背景下產(chǎn)生的,它除將大量的知識(shí)資源進(jìn)行數(shù)字化外,最重要的是將信息進(jìn)行了知識(shí)挖掘和專(zhuān)業(yè)分理,使人們能更加方便、有針對(duì)性地在浩如煙海的信息中找到所需內(nèi)容。其具有以下優(yōu)勢(shì)。
CNKI針對(duì)人們的需求提供解決具體問(wèn)題的方案,大幅度提高了人們獲取知識(shí)的能力。我們可與標(biāo)準(zhǔn)化建設(shè)同步,對(duì)CNKI現(xiàn)有的信息資源和技術(shù)加以提升、改造,建立起產(chǎn)業(yè)化知識(shí)服務(wù)模式,盡快實(shí)現(xiàn)從信息服務(wù)到知識(shí)服務(wù)的跨越式發(fā)展。
從CNKI數(shù)據(jù)庫(kù)的作者庫(kù)中,可以得到描述、評(píng)價(jià)、管理我國(guó)各學(xué)科專(zhuān)業(yè)研究隊(duì)伍的專(zhuān)業(yè)知識(shí);從期刊和碩博士論文的引文數(shù)據(jù)庫(kù)中,可以得到學(xué)科相關(guān)的知識(shí)、成果評(píng)價(jià)的知識(shí)、核心期刊的知識(shí)等;由全文文獻(xiàn)的智能化聚類(lèi),可以得到專(zhuān)業(yè)細(xì)化、面向課題的知識(shí)等等。
利用網(wǎng)絡(luò)會(huì)議可以將人們隱含于頭腦中的知識(shí),在“思維碰撞”過(guò)程中開(kāi)發(fā)出來(lái),經(jīng)語(yǔ)音識(shí)別、文字整理后建成知識(shí)庫(kù)。利用分布式知識(shí)庫(kù)建庫(kù)系統(tǒng),隨時(shí)將人們?cè)诠ぷ鳌W(xué)習(xí)、生活中產(chǎn)生的知識(shí),建成個(gè)性化的知識(shí)倉(cāng)庫(kù),在特定的管理之下共享利用。
從全文數(shù)據(jù)庫(kù)中提煉出能夠明確表述一個(gè)知識(shí)內(nèi)容的知識(shí)元,形成相互印證、相互關(guān)聯(lián)的“網(wǎng)絡(luò)化知識(shí)元數(shù)據(jù)庫(kù)”,并與各種數(shù)據(jù)庫(kù)的全文進(jìn)行鏈接,構(gòu)成內(nèi)容廣泛的知識(shí)網(wǎng)絡(luò),為用戶提供方便的知識(shí)獲取途徑。
基于CNKI平臺(tái)的數(shù)字圖書(shū)館應(yīng)用是網(wǎng)格技術(shù)在信息資源管理領(lǐng)域的嘗試,與原來(lái)的基于Web的信息資源相比,其具有一些明顯的優(yōu)勢(shì),但是,它并沒(méi)有充分實(shí)現(xiàn)知識(shí)網(wǎng)格平臺(tái)上知識(shí)的完全共享和資源的高效利用,距離滿足真正意義上的知識(shí)需求仍存在著較大差距。
基于CNKI平臺(tái)的數(shù)字圖書(shū)館可提供兩種個(gè)性化服務(wù),即面向機(jī)構(gòu)用戶和面向個(gè)人。對(duì)機(jī)構(gòu)的個(gè)性化體現(xiàn)在建立CNKI專(zhuān)業(yè)知識(shí)庫(kù)上,面向個(gè)人的個(gè)性化指根據(jù)用戶具體需求、定期或及時(shí)將最新數(shù)據(jù)發(fā)送給用戶、為用戶提供個(gè)性化的知識(shí)服務(wù)頁(yè)面及內(nèi)容等。不管是專(zhuān)業(yè)數(shù)據(jù)庫(kù),還是最新數(shù)據(jù),這兩種個(gè)性化服務(wù)僅僅只能滿足用戶對(duì)顯性知識(shí)的需求,無(wú)力于滿足用戶對(duì)隱性知識(shí)的需求,這些服務(wù)只能算是個(gè)性化服務(wù)的前提,并不是真正意義上的個(gè)性化服務(wù)。
針對(duì)人們的需求提供解決具體問(wèn)題的方案,仍處于從信息服務(wù)走向知識(shí)服務(wù)的過(guò)渡階段。
知識(shí)間的鏈接主要是通過(guò)知識(shí)元鏈接和引文鏈接將文獻(xiàn)間的知識(shí)關(guān)聯(lián)起來(lái),雖然開(kāi)發(fā)知識(shí)元數(shù)據(jù)庫(kù),但是,知識(shí)間的關(guān)系仍是建立在孤立的知識(shí)元基礎(chǔ)之上。這些知識(shí)元均是顯性知識(shí)的記錄,知識(shí)元間的相互印證、相互關(guān)聯(lián)仍是局限于詞匯的層次,并沒(méi)有深入到語(yǔ)義層面。
雖然在信息資源開(kāi)發(fā)利用中清華同方(CNKI)敢干大膽探索,應(yīng)用先進(jìn)信息/知識(shí)技術(shù)構(gòu)建了CNKI平臺(tái),在邁向知識(shí)服務(wù)的道路上走在國(guó)內(nèi)的前列,但是面對(duì)著日益增長(zhǎng)的知識(shí)需求,還顯得力不從心。所以,對(duì)CNKI平臺(tái)的知識(shí)構(gòu)建程度改進(jìn)已成為當(dāng)務(wù)之急。筆者認(rèn)為,改進(jìn)CNKI平臺(tái)知識(shí)構(gòu)建程度應(yīng)從以下幾點(diǎn)出發(fā)。
知識(shí)技術(shù)可解決知識(shí)構(gòu)建中的知識(shí)采集、知識(shí)模型化、知識(shí)檢索、知識(shí)重用、知識(shí)提供和知識(shí)維護(hù)這六個(gè)挑戰(zhàn)。可見(jiàn),加快知識(shí)技術(shù)的應(yīng)用,可以從根本上改進(jìn)CNKI平臺(tái)的知識(shí)構(gòu)建程度,從本質(zhì)上提升CNK數(shù)字圖書(shū)館知識(shí)服務(wù)水平。網(wǎng)格技術(shù)為知識(shí)構(gòu)建提供了知識(shí)管理支持,而語(yǔ)義Web技術(shù)為知識(shí)構(gòu)建奠定了知識(shí)集成基石。正因?yàn)閮烧咴谥R(shí)構(gòu)建的作用各有側(cè)重,要解決CNK數(shù)字圖書(shū)館知識(shí)服務(wù)系統(tǒng)中在語(yǔ)義上的互聯(lián)性、在存儲(chǔ)上的分布性和在組織上的異構(gòu)性的統(tǒng)一問(wèn)題,CNKI平臺(tái)需要融合這兩種技術(shù)的優(yōu)勢(shì)來(lái)提高知識(shí)構(gòu)建的效率與質(zhì)量。為此,CNKI平臺(tái)應(yīng)將語(yǔ)義網(wǎng)格技術(shù)納入其知識(shí)構(gòu)建之中,作為提高CNKI數(shù)字圖書(shū)館知識(shí)服務(wù)功能的新基點(diǎn)。
知識(shí)構(gòu)建是建立在知識(shí)元全面挖掘、鏈接和語(yǔ)義互聯(lián)的基礎(chǔ)上。而CNKI平臺(tái)僅對(duì)文本中的關(guān)鍵詞、作者及其單位等進(jìn)行了有限的知識(shí)元抽取與鏈接,尚未對(duì)文本中所包含的最有價(jià)值的大量知識(shí)元和知識(shí)單元進(jìn)行挖掘建庫(kù)。這就需要組建各學(xué)科的知識(shí)工程師,對(duì)比較成熟的學(xué)科進(jìn)行知識(shí)元?dú)w類(lèi)分析、標(biāo)引規(guī)則建立和人工抽取實(shí)驗(yàn),并在條件成熟的情況下實(shí)現(xiàn)計(jì)算機(jī)軟件知識(shí)元自動(dòng)抽取和人工修改,建立起知識(shí)元本體庫(kù),實(shí)現(xiàn)人類(lèi)知識(shí)在語(yǔ)義上的互聯(lián)和在實(shí)體上的鏈接,通過(guò)數(shù)字圖書(shū)館便可達(dá)到對(duì)任何知識(shí)的求索。
[1]http://www.cnki.net/index.htm.2009-12-10.
[2]趙蓉英,邱均平.CNKI發(fā)展研究[J].情報(bào)科學(xué),2005(4):627-634.
[3]http://www.dl.cnki.net/gycnki/daobao/cnkidao bao6/txtdaobao01.htm.2010-2-5.
[4]戴鐵成.面向知識(shí)管理的知識(shí)元數(shù)據(jù)庫(kù).June,18,2004.http://www.edu.cnki.net/gycnki/gycnki05_15.htm.