[摘 要] 智能化服務(wù)是一種全新的信息服務(wù)模式,它主要借助于網(wǎng)絡(luò)并通過計(jì)算機(jī)模擬 或 實(shí)現(xiàn)類似于人的智能行為,為用戶提供信息服務(wù)。同傳統(tǒng)圖書館服務(wù)相比,數(shù)字圖書館 智能化服務(wù)具有明顯的優(yōu)勢(shì),而先進(jìn)的技術(shù)則是推動(dòng)其發(fā)展的主要?jiǎng)恿?,本文著重?duì) 智能化服務(wù)所涉及的關(guān)鍵技術(shù)進(jìn)行了分析。
[關(guān)鍵詞]數(shù)字圖書館;智能化服務(wù);關(guān)鍵技術(shù)
[中圖分類號(hào)]G250.76[文獻(xiàn)標(biāo)志碼]A[文章編號(hào)]1005-6041(2010)03-0016-03
隨著現(xiàn)代信息技術(shù)的迅速發(fā)展,傳統(tǒng)圖書館逐步向數(shù)字圖書館轉(zhuǎn)變。為了不斷滿足讀者 需求 ,圖書館應(yīng)不斷引進(jìn)并整合智能代理、數(shù)據(jù)挖掘、專家系統(tǒng)、機(jī)器 學(xué)習(xí) 等先進(jìn)技術(shù),加快人工智能和信息服務(wù)的融合,積極為用戶提供智能化服務(wù)。本文試從智能 化服務(wù)的概念入手,著重對(duì)智能化服務(wù)所涉及的關(guān)鍵技術(shù)進(jìn)行分析。
1 智能化服務(wù)的概念及特征
智能化服務(wù)是指在網(wǎng)絡(luò)環(huán)境下通過計(jì)算機(jī)模擬或?qū)崿F(xiàn)類似于人的智能行為,為不同用戶提 供信息服務(wù)。這是一種全新的信息服務(wù)模式,服務(wù)系統(tǒng)能迅速、準(zhǔn)確地理解用戶的意圖,自 主或交互地執(zhí)行各種模擬任務(wù),為不同用戶提供自動(dòng)化、網(wǎng)絡(luò)化、數(shù)字化服務(wù),真正體現(xiàn) 以用戶為中心的服務(wù)理念。
在智能化服務(wù)過程中,智能是整個(gè)服務(wù)的靈魂,是區(qū)別于傳統(tǒng)服務(wù)、純網(wǎng)絡(luò)服務(wù)的重要標(biāo)志 。先進(jìn)的智能化服務(wù)應(yīng)具備以下幾個(gè)特征:能主動(dòng)分析、預(yù)測(cè)用戶需求及期望目標(biāo),把 相關(guān)問題描述出來并提供給用戶;強(qiáng)調(diào)服務(wù)與被服務(wù)之間的一一對(duì)應(yīng),強(qiáng)調(diào)量體裁衣式的 個(gè) 性化服務(wù);集成了專家系統(tǒng)、機(jī)器學(xué)習(xí)、人機(jī)接口等功能,能自我學(xué)習(xí)和自我調(diào)整,知識(shí)庫 更新較快。
智能化服務(wù)系統(tǒng)不是一個(gè)簡(jiǎn)單的系列操作過程,它是由智能斷定、獲取、精練、開發(fā)創(chuàng)新、 提供信息和信息應(yīng)用效益評(píng)估等系統(tǒng)組成的完整的有機(jī)統(tǒng)一體。[1]
2 智能化服務(wù)關(guān)鍵技術(shù)分析
技術(shù)是推動(dòng)數(shù)字圖書館發(fā)展的主要?jiǎng)恿?,?shù)字圖書館的智能化服務(wù)正是在計(jì)算機(jī)、網(wǎng)絡(luò)通信 、人工智能等新技術(shù)的基礎(chǔ)上發(fā)展起來的。目前,智能化服務(wù)主要涉及智能代理、數(shù)據(jù)挖掘 、資源整 合、智能檢索、信息過濾、智能推送、信息安全等關(guān)鍵技術(shù)。
2.1 智能代理技術(shù)
智能代理(Intelligent Agent)常被稱為“會(huì)思維的軟件”。它具有以下主要特征: 1)智能性。具有與執(zhí)行任務(wù)相關(guān)的知識(shí),能夠進(jìn)行相關(guān)的推理、判斷或計(jì)算,比較準(zhǔn)確地 理解用戶需求,提供針對(duì)性服務(wù);2)代理性。能引導(dǎo)并代替用戶完成某些任務(wù);3)自主性 。在沒有外界干預(yù)的情況下,能自主決策,自主完成任務(wù);4)通訊能力。每個(gè)智能代理都有 標(biāo)準(zhǔn)的接口,采用統(tǒng)一的通信語言進(jìn)行信息的交流,以便獲取信息,充實(shí)和更新知識(shí)庫;5) 推理能力。能利用當(dāng)前知識(shí)和經(jīng)驗(yàn),根據(jù)環(huán)境變化,以一種類似于人的思維方式進(jìn)行推理和 規(guī)劃。這是智能代理區(qū)別于其他軟件的關(guān)鍵所在;6)自適應(yīng)性。為了維護(hù)自治和推理能力, 智能代理必須能評(píng)估外部環(huán)境的當(dāng)前狀態(tài)并將其融入下一步行動(dòng)的有關(guān)決策之中;7)可信賴 性。智能代理必須準(zhǔn)確可信地代表用戶,這是智能代理能否被用戶接受的關(guān)鍵。[2 ]
智能代理作為一種新型的人工智能技術(shù),其快速發(fā)展無疑為數(shù)字圖書館開展智能化服務(wù)提供 了強(qiáng)大的技術(shù)支持。但由于智能代理技術(shù)還不完善,圖書館界對(duì)智能代理的研究和利用目前 還主要集中在信息導(dǎo)航、信息檢索等方面。
2.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(Data Mining)也稱數(shù)據(jù)庫的知識(shí)發(fā)現(xiàn)(Knowledge Discover Database),就是 利用信息技術(shù)和信息分析手段從大量的數(shù)據(jù)中提取有用信息和知識(shí)的過程。數(shù)據(jù)挖掘所得到 的結(jié)果,一定是潛在的、事先未知的。通過數(shù)據(jù)挖掘,可以從各種數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他 信息存儲(chǔ)中提取有用的知識(shí)、規(guī)律或高層信息,并從不同角度加以觀察或?yàn)g覽。數(shù)據(jù)挖掘的 主要 功能包括發(fā)現(xiàn)、預(yù)測(cè)、關(guān)聯(lián)分析、聚類、概念描述、偏差分析等。[3]
數(shù)據(jù)挖掘在數(shù)據(jù)組織與分析、知識(shí)發(fā)現(xiàn)及信息深層挖掘等方面具有強(qiáng)大優(yōu)勢(shì),圖書館可以運(yùn) 用關(guān)聯(lián)規(guī)則分析、聚類分析、決策樹、時(shí)間序列分析等數(shù)據(jù)挖掘方法,找出數(shù)據(jù)庫中蘊(yùn)藏的 對(duì)于服務(wù)有用的規(guī)則、描述、預(yù)測(cè),為圖書館改進(jìn)服務(wù)措施、提高服務(wù)質(zhì)量提供決策支持。 如利用關(guān)聯(lián)規(guī)則分析從圖書館借閱記錄中發(fā)現(xiàn)規(guī)律,并利用這些規(guī)律改進(jìn)圖書推薦服務(wù);利 用時(shí)間序列分析方法對(duì)圖書館流通數(shù)據(jù)庫或者Web日志進(jìn)行挖掘,找出圖書流通規(guī)律,以便 科學(xué)安排流通部門的服務(wù)工作;利用分類模式挖掘方法對(duì)圖書館用戶管理數(shù)據(jù)庫中的歷史數(shù) 據(jù)進(jìn)行挖掘,分析不同用戶群體的特征,細(xì)分群體的偏向愛好,開展個(gè)性化服務(wù)。
2.3 數(shù)字資源整合技術(shù)
隨著圖書館資源數(shù)量的增加以及類型的豐富,將會(huì)出現(xiàn)越來越多異質(zhì)、異構(gòu)的數(shù)字資源。 圖 書館需要整合這些資源,建立相關(guān)聯(lián)的數(shù)字資源體系,為用戶提供迅速、方便、簡(jiǎn)潔的智能 化服務(wù)。
數(shù)字資源整合就是對(duì)各種自主的、異構(gòu)的乃至離散式分布的數(shù)字資源采用各種整合技術(shù)實(shí) 現(xiàn)透明無縫集成,以便用戶在統(tǒng)一的界面下獲取和利用各種資源。目前,在國(guó)外SFX作為 一種比較先進(jìn)的數(shù)字資源整合技術(shù)被提出并開始應(yīng)用。運(yùn)用SFX,可以把不同來源和不同通 信協(xié)議的數(shù)字信息完全融合起來,使不同類型、格式的數(shù)字資源實(shí)現(xiàn)無縫鏈接。國(guó)內(nèi)對(duì)異 構(gòu)資源整合技術(shù)的研究稍晚,主要有CALIS資源統(tǒng)一檢索平臺(tái)、匯文一站式文獻(xiàn)檢索系統(tǒng)、 同 方USP統(tǒng)一檢索平臺(tái)等。MetaLib內(nèi)嵌的SFX是目前數(shù)字資源整合最優(yōu)良的解決方案。MetaLib 中 的SFX擴(kuò)展服務(wù)實(shí)現(xiàn)了各種資源之間的透明鏈接和導(dǎo)航,并且可以與圖書館現(xiàn)有的全文傳遞 、館際互借、參考咨詢等服務(wù)無縫集成。它同時(shí)整合了技術(shù)、服務(wù)、資源等功能,這是Meta Lib區(qū)別于其他資源整合系統(tǒng)的顯著優(yōu)勢(shì)。哈佛大學(xué)、麻省理工學(xué)院以及國(guó)內(nèi)的 清華大學(xué)、復(fù)旦大學(xué)等高校的圖書館都已應(yīng)用了這一技術(shù)。 此外,南 京師范大學(xué)、北京理工大學(xué)等圖書館也實(shí)現(xiàn)了MetaLib內(nèi)嵌SFX的整合檢索。[4]
2.4 智能檢索技術(shù)
智能檢索是信息檢索和人工智能研究的一個(gè)交叉領(lǐng)域。它將信息檢索從目前基于關(guān)鍵詞的層 面 提高到基于知識(shí)(或概念)層面,對(duì)知識(shí)有一定的理解和處理能力,能夠正確運(yùn)用分詞技術(shù) 、同義詞技術(shù)、概念搜索、短詞識(shí)別以及機(jī)器翻譯等技術(shù)。因而,智能檢索更具有信息服務(wù) 的智能化、人性化特征,能為用戶提供更方便、準(zhǔn)確地搜索服務(wù)。
隨著人工智能技術(shù)廣泛應(yīng)用于信息檢索領(lǐng)域,現(xiàn)已產(chǎn)生多種智能檢索系統(tǒng)模型。歸納起來, 主 要有2大類:一類是基于機(jī)器學(xué)習(xí)的大范圍信息檢索系統(tǒng),一類是智能化的用戶個(gè)性化信息 檢索系統(tǒng)。這些檢索系統(tǒng)需要依賴許多先進(jìn)的技術(shù)來實(shí)現(xiàn)它的各項(xiàng)功能,所涉及的關(guān)鍵技術(shù) 主要包括:1)信息收集和存儲(chǔ)技術(shù),分人工和自動(dòng)2種方式。其中自動(dòng)方式是由“網(wǎng)絡(luò)Robo t”來完成的;2)信息預(yù)處理技術(shù),包含信息格式支持、轉(zhuǎn)換和信息過濾;3)信息索引技術(shù) ,建立索引涉及的信息語詞切分和語詞語法分析,進(jìn)行詞性標(biāo)注及相關(guān)自然語言處理,建立 檢索項(xiàng)索引及檢索結(jié)果處理技術(shù)。其中檢索結(jié)果處理技術(shù)是關(guān)鍵技術(shù),其核心是依據(jù)計(jì)算結(jié) 果與查詢?cè)~的相關(guān)程度來排序。[5]
由于智能檢索所涉及的相關(guān)技術(shù)不是很成熟,現(xiàn)有的智能檢索系統(tǒng)仍然存在一些缺陷。 大部分的概念檢索,只是單純對(duì)輸入的關(guān)鍵詞進(jìn)行概念擴(kuò)展,檢索結(jié)果并不能達(dá)到預(yù)期的 效果。目前,國(guó)內(nèi)外許多公司和研究機(jī)構(gòu)已投入大量資金和人力用于智能檢索的研制和開發(fā) ,智能檢索系統(tǒng)將變得越來越“聰明”。
2.5 信息過濾技術(shù)
信息過濾技術(shù)是指根據(jù)用戶興趣幫助用戶過濾掉那些他不感興趣的信息。常用的信息過濾方 法有2種:一是基于內(nèi)容的過濾方法,主要是通過資源與用戶描述的比較來推薦資源。可以 利 用基于關(guān)鍵詞的方法將信息流與用戶描述進(jìn)行匹配計(jì)算,具有簡(jiǎn)單、有效等優(yōu)點(diǎn),其缺 點(diǎn)是難以區(qū)分資源的特征與形式,只能發(fā)現(xiàn)那些與用戶曾經(jīng)感興趣的相似資源,而不能為用 戶發(fā)現(xiàn)新的感興趣的資源;二是基于協(xié)作的過濾方法,主要是根據(jù)用戶的相似性來推薦信息 資源。這種方式能夠發(fā)現(xiàn)新的、用戶可能感興趣的資源,其缺點(diǎn)是在系統(tǒng)使用之初,由于系 統(tǒng)資源還未獲得足夠多的評(píng)價(jià),因而很難利用這些評(píng)價(jià)來發(fā)現(xiàn)資源。隨著用戶和資源 的逐漸增長(zhǎng),這種方法的性能將會(huì)降低。[6]以上2種過濾方式各有利弊,應(yīng)綜合 利用這2種方法的優(yōu)點(diǎn),構(gòu)建混合型的信息過濾模式,以提高信息過濾的性能。
信息過濾技術(shù)可以過濾掉與用戶無關(guān)的信息,能夠滿足不同用戶的信息需求。隨著數(shù)字圖書 館的迅速發(fā)展,信息過濾技術(shù)必將在智能化服務(wù)中發(fā)揮越來越重要的作用。
2.6 智能推拉技術(shù)
推拉技術(shù)是一種新的網(wǎng)上信息服務(wù)技術(shù),從“信息源”與“用戶”的關(guān)系來看,可分為信息 推送與信息拉取2種技術(shù)。信息推送技術(shù)是由“信息源”主動(dòng)將信息發(fā)送給“用戶”,如新 書通報(bào)和定題服務(wù)等。這種技術(shù)時(shí)效性好,應(yīng)用面廣,但針對(duì)性差,難以滿足用戶的個(gè)性化 需求。信息拉取技術(shù)是由“用戶”主動(dòng)從“信息源”中提取所需信息,如信息查詢。這種技 術(shù) 針對(duì)性強(qiáng),用戶能夠有目的地查詢自己所需的信息,但時(shí)效性差,需要用戶掌握一定的檢索 技術(shù)。
為了適應(yīng)信息服務(wù)需要,信息推送和拉取2種技術(shù)應(yīng)相互結(jié)合、優(yōu)勢(shì)互補(bǔ),并在此基礎(chǔ)上融 入 人工智能、機(jī)器學(xué)習(xí)、知識(shí)發(fā)現(xiàn)等技術(shù),從而形成智能信息推拉技術(shù)。這項(xiàng)技術(shù)是當(dāng)前Inte rnet/Extranet/Intranet、數(shù)據(jù)庫系統(tǒng)及其他信息系統(tǒng)為用戶提供信息服務(wù)的一個(gè)發(fā)展方向 。智能推拉技術(shù)的引入,可以提高網(wǎng)絡(luò)及數(shù)據(jù)庫的智能水平,從而從根本上解決“推送”和 “拉取”技術(shù)應(yīng)用過程中所遇到的難題。[7]
智能推拉技術(shù)是實(shí)現(xiàn)信息檢索、發(fā)布和傳播的重要手段。數(shù)字圖書館利用智能推拉技術(shù),一 方面,可以從所“推送——拉取” 的信息中發(fā)現(xiàn)其內(nèi)在規(guī)律,提取用戶最關(guān)心、最感興趣 的 有用信息,以便更有針對(duì)性、更及時(shí)地向用戶推送實(shí)用信息;另一方面,用戶也可以更快、 更準(zhǔn)確地從資源數(shù)據(jù)庫中獲取到所需信息,大大提高服務(wù)質(zhì)量和效果。
2.7 信息安全技術(shù)
圖書館在提供智能化服務(wù)的同時(shí),也面臨著嚴(yán)重的信息安全問題。如果服務(wù)系統(tǒng)一旦受到黑 客攻擊,感染病毒,將導(dǎo)致大量數(shù)據(jù)的丟失或破壞,其損失將是災(zāi)難性的。因此,圖書館 必須增強(qiáng)信息安全意識(shí),不斷加強(qiáng)和完善信息安全防護(hù)措施。
在網(wǎng)絡(luò)環(huán)境下,信息安全防范體系是分層次的,不同層次有著不同的信息安全問題。根據(jù) 信息傳輸和應(yīng)用網(wǎng)絡(luò)的情況,信息安全技術(shù)應(yīng)分為物理層安全、系統(tǒng)層安全、網(wǎng)絡(luò)層安全、 應(yīng)用層安全和管理層安全5個(gè)層次。[8]但是,技術(shù)不是萬能的,圖書館應(yīng)逐步 建立融技 術(shù)、管理、人才、制度等為一體的多層次信息安全防護(hù)體系,才能有效地維護(hù)網(wǎng)絡(luò)信息安全 。
3 結(jié) 語
近年來,上述諸多關(guān)鍵技術(shù)在數(shù)字圖書館服務(wù)中得到廣泛應(yīng)用,大大提升了數(shù)字圖書館服務(wù) 質(zhì)量和水平,進(jìn)一步拓展了信息服務(wù)空間。目前,數(shù)字圖書館所提供的智能檢索、智能推送 、智能咨詢、智能輔導(dǎo)、智能決策和智能Web站點(diǎn)等服務(wù)形式,都離不開先進(jìn)技術(shù)的支撐。 因此,在數(shù)字圖書館建設(shè)過程中,要自覺地以科學(xué)方法為指導(dǎo),密切關(guān)注相關(guān)技術(shù)的研究動(dòng) 態(tài)和 發(fā)展?fàn)顩r,不斷探索、引進(jìn)和應(yīng)用智能化技術(shù),促進(jìn)智能化服務(wù)的快速發(fā)展。同時(shí),也要在 實(shí)踐的基礎(chǔ)上,不斷補(bǔ)充、完善、拓展相關(guān)技術(shù),推進(jìn)智能技術(shù)與信息服務(wù)的融合,使智能 化服務(wù)更好地滿足讀者需求。
[參考文獻(xiàn)]
[1] 張安珍.論網(wǎng)絡(luò)環(huán)境下的智能信息服務(wù)[J].情報(bào)理論與實(shí)踐,2004(6):659—662 .
[2] 王惠仙.智能代理及其在數(shù)字圖書館中的應(yīng)用[D].中山大學(xué),2001:3—6.
[3] 朱立紅.高校圖書館的數(shù)據(jù)挖掘技術(shù)應(yīng)用與用戶研究[J].圖書館雜志,2008(6) :39—40.
[4] 毛秀梅,劉青華,王春梅.高校圖書館數(shù)字化服務(wù)技術(shù)應(yīng)用分析及優(yōu)化策略探討[J ].圖 書館建設(shè),2007(5):81.
[5] 馬 靜.網(wǎng)上信息資源及其檢索技術(shù)智能化研究[J].圖書情報(bào)工作,2001(1):57 —58.
[6] 焦玉英,王 娜.信息過濾技術(shù)在數(shù)字圖書館的應(yīng)用[J].中國(guó)圖書館學(xué)報(bào),2006( 3) :46—48.
[7] 劉志敏,董 慧.推拉技術(shù)在數(shù)字圖書館中的應(yīng)用[J].中國(guó)圖書館學(xué)報(bào),2003(2) : 60—63.
[8] 俞承杭.信息安全技術(shù)[M].北京:科學(xué)技術(shù)出版社,2005:28.
[收稿時(shí)間]2009-12-24
[作者簡(jiǎn)介] 程風(fēng)剛(1973—),男,本科,館員,主要從事數(shù)字圖書館服務(wù)研究,已發(fā)表論 文十余篇。
[說 明]本文系鹽城師范學(xué)院人文社會(huì)科學(xué)研究項(xiàng)目 (項(xiàng)目編號(hào):07YCKW032)成果之一。