[摘 要]隨著個性化時代的到來,信息服務(wù)機構(gòu)必須提供個性化服務(wù),才有可能在激烈的競爭中取得勝利#65377;web數(shù)據(jù)挖掘技術(shù)是實現(xiàn)個性化信息服務(wù)的關(guān)鍵技術(shù)#65377;在構(gòu)建基于web數(shù)據(jù)挖掘的個性化信息服務(wù)的實現(xiàn)模型后,還對建立在web數(shù)據(jù)挖掘基礎(chǔ)上的個性化信息服務(wù)系統(tǒng)運行的基本流程#65380;web挖掘的數(shù)據(jù)資源#65380;web挖掘的技術(shù)方法#65380;信息系統(tǒng)的服務(wù)內(nèi)容#65380;系統(tǒng)運行的注意事項等進行了探討#65377;
[關(guān)鍵詞]個性化信息服務(wù);web數(shù)據(jù)挖掘;信息服務(wù)機構(gòu)
[中圖分類號]G202 [文獻標(biāo)識碼]B [文章編號]1008-0821(2010)03-0067-04
Personalized Information Service Based on Web Data Mining TechniquesDing Jinlong
(Library,Hunan Institute of Engineering,Xiangtan 411104,China)
[Abstract]With the era of personalized information services to provide personalized service,it will be possible in the fierce competition in the win.Web data mining technology is a personalized information services to key technologies.Data Mining in building web-based personalized information services,implementation of model,also based on web data mining based on personalized information service system is running the basic flow,web mining data sources,web mining technology,methods,information systems of services,the system runs for attention were discussed.
[Key words]personalized information service;web data mining;information service
隨著信息技術(shù)的飛速發(fā)展,以及經(jīng)濟一體化#65380;競爭全球化#65380;服務(wù)網(wǎng)絡(luò)化#65380;需求個性化趨勢的不斷推進,眾多社會組織都必須面臨新的工作環(huán)境#65380;學(xué)習(xí)環(huán)境與競爭環(huán)境,信息服務(wù)組織也不例外#65377;特別是互聯(lián)網(wǎng)目前已成為人們學(xué)習(xí)#65380;工作和生活的重要組成部分,信息服務(wù)組織如何在網(wǎng)絡(luò)環(huán)境下開展有效的信息服務(wù),在日趨激烈的市場競爭中取得佳績,是一個值得大家探討的課題#65377;
1 個性化信息服務(wù)概述
自1995年3月Robert Armstrong等人在美國人工智能協(xié)會上提出個性化導(dǎo)航Web Watcher以來,在世界范圍內(nèi)掀起了個性化學(xué)術(shù)研究的熱潮,現(xiàn)在已逐漸走向?qū)嶋H運用,很多公司紛紛推出個性化系統(tǒng),提供個性化服務(wù)#65377;信息服務(wù)組織也受到這股熱潮的深刻影響,正在經(jīng)歷傳統(tǒng)通用信息服務(wù)階段向個性化信息服務(wù)階段的轉(zhuǎn)變#65377;
1.1 傳統(tǒng)通用信息服務(wù)的弊端
隨著計算機技術(shù)#65380;通信技術(shù)#65380;網(wǎng)絡(luò)技術(shù)的發(fā)展,眾多信息服務(wù)組織紛紛“觸網(wǎng)”,建立了基于互聯(lián)網(wǎng)的信息服務(wù)系統(tǒng)(如圖1所示),在一定程度上實現(xiàn)了信息服務(wù)的自動化和網(wǎng)絡(luò)化#65377;
圖1 傳統(tǒng)通用信息服務(wù)系統(tǒng)結(jié)構(gòu)示意圖 但不可否認的是,這類信息服務(wù)系統(tǒng)多是以系統(tǒng)自身為中心,并沒有充分考慮用戶的需求與習(xí)慣,要求用戶來適應(yīng)系統(tǒng)而不是系統(tǒng)去適應(yīng)用戶,沒有充分按照用戶的興趣#65380;愛好#65380;專業(yè)等來提供信息,易造成交互性差#65380;信息服務(wù)質(zhì)量偏低等諸多問題#65377;如果信息資源庫中的數(shù)據(jù)非常龐大,而每個用戶真正感興趣的信息又非常有限的話,用戶為了找到真正感興趣的信息,需要耗費大量的時間和精力,易形成“信息迷航”與“信息過載”現(xiàn)象#65377;
1.2 個性化信息服務(wù)的內(nèi)涵
顯然傳統(tǒng)信息服務(wù)系統(tǒng)這種“人找信息”的服務(wù)模式已經(jīng)越來越難于適應(yīng)人們對迅速增長的信息資源的需求,用戶迫切需要一種能夠根據(jù)自身特點自動組織和調(diào)整信息的服務(wù)模式,個性化信息服務(wù)應(yīng)運而生#65377;對于個性化信息服務(wù)的概念,目前業(yè)內(nèi)存在多種解釋#65377;國內(nèi)學(xué)者劉榮認為,個性化信息服務(wù)是指能夠滿足用戶個體信息需求的一種服務(wù),是根據(jù)用戶提出的明確服務(wù)要求,或通過對用戶個性#65380;使用習(xí)慣的分析而主動向用戶提供其可能需要的信息服務(wù)#65377;國外學(xué)者James和Charles則認為,個性化信息服務(wù)是針對用戶的個人需求#65380;環(huán)境#65380;心理#65380;知識等特征實施的信息服務(wù),即以符合用戶興趣#65380;身份和滿足用戶特定需求的信息形式為其提供針對性的服務(wù)#65377;盡管兩者的定義在表述上有差異,但都體現(xiàn)著個性化信息服務(wù)“以用戶為中心”的服務(wù)原則,其實質(zhì)就是要做到以下3個方面:服務(wù)時空的個性化#65380;服務(wù)方式的個性化#65380;服務(wù)內(nèi)容的個性化#65377;個性化信息服務(wù)是解決用戶“眾口難調(diào)”問題的關(guān)鍵,它是適應(yīng)用戶多樣化需求的重要手段,也是信息服務(wù)機構(gòu)應(yīng)對信息資源多樣化的一個重要措施#65377;網(wǎng)絡(luò)環(huán)境下的個性化信息服務(wù)體系結(jié)構(gòu)如圖2所示#65377;
圖2 個性化信息服務(wù)體系結(jié)構(gòu)框絮圖2010年3月第30卷第3期現(xiàn)?代?情?報Journal of Modern InformationMar.,2010Vol.30 No.32010年3月第30卷第3期基于Web數(shù)據(jù)挖掘技術(shù)下的個性化信息服務(wù)Mar.,2010Vol.30 No.32 web數(shù)據(jù)挖掘是個性化信息服務(wù)的關(guān)鍵技術(shù)
個性化信息服務(wù)不僅需要針對不同的用戶需求提供不同的服務(wù),更重要的在于發(fā)現(xiàn)用戶的潛在需求進行主動的信息服務(wù),而對用戶需求#65380;興趣#65380;愛好#65380;身份的了解和獲取是個性化信息服務(wù)具備針對性的前提#65377;20世紀80年代末興起的數(shù)據(jù)挖掘(Data Mining)技術(shù),特別是Web數(shù)據(jù)挖掘技術(shù),為解決此問題開辟了一條道路#65377;數(shù)據(jù)挖掘是信息服務(wù)活動不可缺少的重要工具,能為正確的服務(wù)行為提供強有力的支持和可靠的保證,但是傳統(tǒng)的數(shù)據(jù)挖掘方法大部分只能對同質(zhì)#65380;同構(gòu)的數(shù)據(jù)進行分析,這對于互聯(lián)網(wǎng)上大量的異構(gòu)文本信息#65380;日志信息#65380;超鏈接等不太適用#65377;因此,在傳統(tǒng)數(shù)據(jù)挖掘的基礎(chǔ)上產(chǎn)生了一個新的技術(shù)——web數(shù)據(jù)挖掘#65377;Web挖掘可分為三類:Web內(nèi)容挖掘#65380;Web結(jié)構(gòu)挖掘和web使用記錄的挖掘,其所處理的對象包括靜態(tài)網(wǎng)頁#65380;Web數(shù)據(jù)庫#65380;Web結(jié)構(gòu)#65380;用戶使用記錄等信息,其分類如圖3所示#65377;Web數(shù)據(jù)挖掘的主要方法包括訪問路徑分析#65380;關(guān)聯(lián)規(guī)則發(fā)現(xiàn)#65380;序列模式分析#65380;分類規(guī)則發(fā)現(xiàn)#65380;聚類分析等#65377;Web數(shù)據(jù)挖掘技術(shù)是實現(xiàn)個性化信息服務(wù)的關(guān)鍵技術(shù)#65377;從圖2可以看出,個性化信息服務(wù)系統(tǒng)能否正常運轉(zhuǎn)的關(guān)鍵在于用戶建模,即通過收集用戶的各種信息,然后分析用戶數(shù)據(jù),進而創(chuàng)建符合用戶特性的訪問模式#65380;需求模式#65380;愛好模式#65377;而Web數(shù)據(jù)挖掘通過訪問路徑分析#65380;關(guān)聯(lián)規(guī)則發(fā)現(xiàn)#65380;序列模式分析#65380;分類規(guī)則發(fā)現(xiàn)#65380;聚類分析等技術(shù),能夠?qū)崿F(xiàn)用戶建模,使個性化信息服務(wù)的實現(xiàn)成為可能#65377;
圖3 Web數(shù)據(jù)挖掘技術(shù)的簡單分類3 基于web數(shù)據(jù)挖掘的個性化信息服務(wù)的模型
Web數(shù)據(jù)挖掘是輔助個性化信息服務(wù)的綜合分析工具和關(guān)鍵技術(shù),運行在信息服務(wù)系統(tǒng)的用戶數(shù)據(jù)庫和數(shù)據(jù)倉庫之上,應(yīng)包括以下功能模塊:(1)過濾器,用來從Web數(shù)據(jù)庫中抽取相關(guān)數(shù)據(jù),進行二義性分析,消除不一致性#65377;(2)挖掘綜合器,是一個挖掘驅(qū)動引擎,根據(jù)挖掘要求和挖掘方法的知識庫到Web數(shù)據(jù)挖掘算法庫中去選擇合適的挖掘方法,并且使用該方法去執(zhí)行挖掘任務(wù)#65377;(3)方法選擇專家系統(tǒng)及知識庫,是Web數(shù)據(jù)挖掘的“大腦”,是一個規(guī)則集合,能夠根據(jù)不同的挖掘要求來選擇最有效的挖掘算法或幾種算法的序列組合,并且隨著應(yīng)用的深人,該知識庫可以不斷融入新的規(guī)則,以增加專家系統(tǒng)的智能性#65377;(4)Web數(shù)據(jù)挖掘算法庫,是一個數(shù)據(jù)挖掘分析方法的綜合性算法庫#65377;(5)用戶評估界面,提供一個和分析人員交互的友好界面#65377;如果本次的挖掘結(jié)果不能滿足分析人員的需要或者還有進一步的猜想,就可以再次從這里輸入挖掘需求#65377;(6)方法驅(qū)動模塊,它利用挖掘出來的有益信息,去進行相應(yīng)的統(tǒng)計與分析工作#65377;據(jù)此分析,可以構(gòu)建一種基于Web數(shù)據(jù)挖掘的個性化信息服務(wù)系統(tǒng)(如圖4所示)#65377;
圖4 基于Web數(shù)據(jù)挖掘的個性化信息服務(wù)系統(tǒng)模框架4 基于web數(shù)據(jù)挖掘的個性化信息服務(wù)系統(tǒng)的運行
該系統(tǒng)結(jié)構(gòu)以Web數(shù)據(jù)挖掘模塊為中心,對多個數(shù)據(jù)源的信息進行處理,是一個將用戶數(shù)據(jù)#65380;信息轉(zhuǎn)化為知識的過程#65377;
4.1 系統(tǒng)運行的基本流程
(1)明確Web數(shù)據(jù)挖掘的目標(biāo),確定個性化信息服務(wù)的應(yīng)用主題,并對挖掘目標(biāo)建立恰當(dāng)?shù)哪P?65377;挖掘目標(biāo)主要有兩個方面:一是從與信息資源#65380;用戶相關(guān)的數(shù)據(jù)中發(fā)現(xiàn)對個性化信息服務(wù)起關(guān)鍵作用的新的有價值的知識;二是通過數(shù)據(jù)挖掘去驗證假設(shè)是否成立#65377;(2)圍繞個性化信息服務(wù)主題收集數(shù)據(jù)源,并對數(shù)據(jù)進行清理#65380;轉(zhuǎn)換#65380;集成等技術(shù)處理,裝載進入用戶原始數(shù)據(jù)庫和數(shù)據(jù)倉庫#65377;(3)在正式挖掘之前,對數(shù)據(jù)進行格式化操作,并將所有數(shù)據(jù)導(dǎo)入到特制的數(shù)據(jù)集市中#65377;(4)選取合適的數(shù)據(jù)挖掘方法,構(gòu)建數(shù)據(jù)挖掘模型,從目標(biāo)數(shù)據(jù)中提取有價值的知識與數(shù)據(jù),然后對結(jié)果進行分析和驗證,調(diào)整數(shù)據(jù)挖掘模型,從而保證結(jié)果的可靠性和實用性#65377;(5)挖掘結(jié)果評估與知識表示,將這些知識集成到用戶模式庫,融合專家知識與領(lǐng)域規(guī)則,以信息機構(gòu)自有資源庫和Web信息資源庫為基礎(chǔ),向用戶提供個性化信息#65377;
4.2 web挖掘的數(shù)據(jù)資源
web挖掘的數(shù)據(jù)資源有以下4類:
4.2.1 Web服務(wù)器數(shù)據(jù)
當(dāng)用戶訪問Web服務(wù)器時就會在服務(wù)器上產(chǎn)生相應(yīng)的服務(wù)器數(shù)據(jù),這些數(shù)據(jù)可以分為日志文件#65380;查詢數(shù)據(jù)兩種#65377;日志文件是Web服務(wù)器上用以記錄用戶訪問頁面情況的文件,分為server logs#65380;error logs和cookie logs#65377;用戶每訪問一個頁面,Web服務(wù)器的日志中就會增加一條記錄#65377;不同的Web服務(wù)器的產(chǎn)品日志格式不同,但通常都包括訪問者的IP地址#65380;訪問時間#65380;訪問方式#65380;訪問頁面#65380;協(xié)議#65380;錯誤代碼以及傳輸?shù)淖止?jié)數(shù)信息#65377;服務(wù)器日志數(shù)據(jù)是使用Web數(shù)據(jù)挖掘技術(shù)的重要數(shù)據(jù)來源#65377;查詢數(shù)據(jù)是信息服務(wù)機構(gòu)網(wǎng)站在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù),它是在線用戶在查詢所需信息時生成的,這些查詢信息通過cookie或是登記信息連接到服務(wù)器的訪問日志上#65377;
4.2.2 用戶登記信息
它是指用戶通過web頁在屏幕上輸入的要提交給服務(wù)器的相關(guān)信息,包括注冊信息#65380;登錄信息#65380;網(wǎng)上留言等#65377;在Web數(shù)據(jù)挖掘中,用戶登記信息必須和訪問日志集成,以提高數(shù)據(jù)挖掘的準確度#65377;通過對用戶登記信息和日志信息的綜合,能夠更好地了解用戶的行為,并針對不同的用戶制定不同的政策#65377;
4.2.3 代理服務(wù)器數(shù)據(jù)
代理服務(wù)器相當(dāng)于在客戶瀏覽器和web服務(wù)器之間提供了緩存功能的中介服務(wù)器,它的緩存功能減少了web服務(wù)器的網(wǎng)絡(luò)流量,加快了網(wǎng)頁的運行速度,同時將大量的用戶訪問信息通過代理日志的形式保存起來#65377;
4.2.4 業(yè)務(wù)往來數(shù)據(jù)
信息服務(wù)機構(gòu)內(nèi)部#65380;信息服務(wù)機構(gòu)之間,因為業(yè)務(wù)往來關(guān)系,其中也產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)對于個性化信息服務(wù)機制具有重要的參考價值#65377;因此,這些業(yè)務(wù)往來數(shù)據(jù)也是Web數(shù)據(jù)挖掘技術(shù)需要分析的數(shù)據(jù)#65377;
4.3 web挖掘的技術(shù)方法
對于個性化信息服務(wù)系統(tǒng)來說,關(guān)鍵就是要通過web數(shù)據(jù)挖掘來挖掘出用戶的興趣#65380;愛好#65380;偏好#65380;專業(yè)#65380;使用習(xí)慣等,提高信息服務(wù)的針對性#65380;合理性#65380;安全性和可操作性#65377;在該系統(tǒng)中,用到的Web數(shù)據(jù)挖掘技術(shù)方法主要有以下幾類:
4.3.1 關(guān)聯(lián)規(guī)則
它是描述數(shù)據(jù)庫中數(shù)據(jù)項之間存在關(guān)聯(lián)的規(guī)則,根據(jù)一個事物中某些項的出現(xiàn)可導(dǎo)出另一項在同一事物中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系,其基本表述為:只要訪問頁面A就有可能訪問B(或C……)#65377;Apriori算法是挖掘用戶興趣關(guān)聯(lián)規(guī)則的經(jīng)典算法#65377;用戶的行為反映了用戶的興趣,通過用戶集與會話集的關(guān)聯(lián)分析,可以得到個性化信息服務(wù)的最重要的信息——用戶的興趣,發(fā)掘出每個用戶的所有的興趣信息;也可以得出用戶同時訪問不同站點的訪問模式#65380;不同興趣(會話)之間同時出現(xiàn)的概率#65377;在個性化信息服務(wù)中,關(guān)聯(lián)規(guī)則可用于優(yōu)化網(wǎng)站信息組織為用戶提供預(yù)取可能請求的頁面,以減少等待時間,建立起一個方便有效的服務(wù)環(huán)境#65377;
4.3.2 聚類分析
聚類是把一組個體按照相似性歸成若干類別,即“物以類聚”#65377;在web挖掘中存在兩種類型的聚類,即用戶聚類和網(wǎng)頁聚類#65377;用戶聚類主要是把具有相似訪問特征的用戶分在一組;網(wǎng)頁聚類,則可以找出具有相關(guān)內(nèi)容的網(wǎng)頁組#65377;聚類分析可以從服務(wù)器訪問信息數(shù)據(jù)中聚集出具有相似特性的用戶組,即把有相似特性的用戶#65380;數(shù)據(jù)項集合到一起,能為用戶提供個性化信息服務(wù)發(fā)揮巨大作用#65377;如根據(jù)用戶的詢問或過去所需信息的歷史來生成靜態(tài)或動態(tài)頁面,從而向用戶推薦相關(guān)的超鏈接;自動給一個特定的用戶群發(fā)送信息服務(wù)郵件,當(dāng)屬于一個用戶群的用戶再次訪問信息服務(wù)系統(tǒng)時,為其動態(tài)地改變站點的內(nèi)容等#65377;
4.3.3 分類規(guī)則
分類是將一組組個體分門別類地歸入預(yù)先設(shè)定好的幾個類中#65377;分類的目的是通過統(tǒng)計方法#65380;機器學(xué)習(xí)方法(包括決策樹法和規(guī)則歸納法)#65380;神經(jīng)網(wǎng)絡(luò)方法等構(gòu)造一個分類模型,然后把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中的某一個特定類,以對同一類別中的用戶提供相似的服務(wù)#65377;在個性化信息服務(wù)系統(tǒng)中,可通過用戶填寫的個人信息及用戶訪問行為模式的分析,用分類方法可以得出用戶輪廓特征,以提供相似或個性化的信息服務(wù)#65377;同時,還可以發(fā)現(xiàn)未來的潛在用戶并開展有針對性的信息服務(wù)活動#65377;
4.3.4 統(tǒng)計分析
統(tǒng)計分析是用來統(tǒng)計用戶最常訪問的網(wǎng)頁#65380;每頁平均訪問的時間#65380;瀏覽路徑的平均長度等數(shù)據(jù),以獲得用戶訪問站點的基本信息#65377;此外還能提供有限的低層次的錯誤分析,比如檢測未授權(quán)入口點,找出最常見不變的URL等#65377;在個性化信息服務(wù)系統(tǒng)中,可以分析單個用戶的訪問次數(shù)#65380;總停留時間#65380;訪問的信息量#65380;對哪些信息內(nèi)容停留時間較長,還可統(tǒng)計系統(tǒng)某個時間段內(nèi)訪問的次數(shù)#65380;訪問次數(shù)最多的用戶URL地址等#65377;這樣,就可以對用戶的訪問行為進行預(yù)測,為開展個性化信息服務(wù)提供決策支持#65377;
4.3.5 序列模式
序列模式挖掘技術(shù)就是試圖在時間戳有序的事務(wù)集中找到一組數(shù)據(jù)項之后出現(xiàn)另一數(shù)據(jù)項的內(nèi)部事務(wù)模式,即挖掘出會話集之間有時間序列關(guān)系的模式,從而形成一組按時間排序的會話#65377;在網(wǎng)站日志里,用戶的訪問是以時間段來標(biāo)記的,經(jīng)數(shù)據(jù)清理和事務(wù)識別后是一個間斷的時間序列#65377;通過序列模式研究,能夠預(yù)測用戶的訪問模式,了解用戶的興趣及需求所在,可以解決個性化信息服務(wù)中針對各種類型用戶提供優(yōu)質(zhì)服務(wù)的問題,使用戶在自己的網(wǎng)站上駐留更長的時間#65377;
4.3.6 依賴關(guān)系建模
依賴關(guān)系建模是建立一個能描述web領(lǐng)域中各種變量間具有的顯著依賴關(guān)系的模型,通過該模型得到用戶的興趣遷移模式#65377;有多種方法可以為用戶的瀏覽和信息獲取行為建模,如決策樹學(xué)習(xí)法#65380;神經(jīng)網(wǎng)絡(luò)法#65380;隱馬爾可夫鏈模型#65380;貝葉斯信念網(wǎng)絡(luò)法等#65377;通過建模,不僅為分析用戶的行為提供了理論框架,還具有預(yù)測系統(tǒng)資源消耗的潛力,為改進用戶導(dǎo)航的便利性提供依據(jù),改進個性化信息服務(wù)的質(zhì)量與效率#65377;
4.3.7 模式分析
模式分析通過選擇和觀察把發(fā)現(xiàn)的規(guī)則#65380;模式和統(tǒng)計值轉(zhuǎn)換為知識,再經(jīng)過分析得到有價值的模式,即那些有意義#65380;感興趣的規(guī)則#65380;模式,采用可視化技術(shù),以圖形界面的方式提供給使用者#65377;
4.4 信息系統(tǒng)的服務(wù)內(nèi)容
建立在web數(shù)據(jù)挖掘技術(shù)基礎(chǔ)上的個性化信息服務(wù)系統(tǒng),能夠根據(jù)用戶的需求#65380;興趣#65380;愛好#65380;專業(yè)#65380;習(xí)慣#65380;身份等,提供以下極具個性化的服務(wù):
4.4.1 個性化定制服務(wù)
個性化信息服務(wù)系統(tǒng)能根據(jù)用戶的興趣特征#65380;需求偏好,提供個性化定制服務(wù)#65377;這類定制服務(wù)主要包括服務(wù)內(nèi)容定制#65380;服務(wù)界面定制和服務(wù)方式定制#65377;服務(wù)內(nèi)容定制是指用戶可以選擇常用的數(shù)據(jù)庫#65380;電子期刊#65380;搜索引擎以及搜索的專業(yè)范圍等,服務(wù)內(nèi)容不再是千篇一律,而是各取所需;服務(wù)界面定制是指用戶能夠根據(jù)自己的喜好或?qū)徝澜嵌?,選擇不同的系統(tǒng)界面總體模塊#65380;頁面組合和布局形式,彰顯個性;服務(wù)方式定制是指用戶可以設(shè)定電子郵件#65380;手機短信#65380;電話告知#65380;專家咨詢等服務(wù)方式,以便根據(jù)自己的時間和地理方位獲得信息服務(wù)#65377;
4.4.2 個性化文獻信息服務(wù)
現(xiàn)階段,眾多信息服務(wù)機構(gòu)除了提供數(shù)字化信息外,紙質(zhì)文獻信息也是其信息資源的重要組成部分#65377;通過個性化信息服務(wù)系統(tǒng),信息服務(wù)機構(gòu)可根據(jù)用戶各自的具體特征和需求,事先組織#65380;分類#65380;聚合自身的文獻信息資源和服務(wù),向用戶提供針對性較強的一次文獻書目信息#65380;附加價值較高的二次文獻及三次文獻等信息#65377;
4.4.3 個性化推薦服務(wù)
個性化推薦服務(wù)是一種比較深層次的信息服務(wù)方式,它在深入分析用戶專業(yè)特征#65380;研究興趣的基礎(chǔ)上,主動向用戶推薦其可能需要的信息#65377;個性化推薦的原理是根據(jù)用戶模型尋找與其匹配的信息,或者尋找具有相近興趣的用戶群而后相互推薦瀏覽過#65380;檢索過#65380;下載過#65380;借閱過的信息#65377;它的實質(zhì)是一種“信息找人”的服務(wù)模式,可以減少用戶尋找信息的時間,提高服務(wù)效率,這也是信息服務(wù)機構(gòu)競爭制勝的法寶之一#65377;
4.4.4 個性化檢索服務(wù)
個性化信息檢索是指根據(jù)用戶的興趣和特點進行檢索,返回與用戶需求相關(guān)的檢索結(jié)果#65377;由于在檢索中考慮了用戶的差異,個性化信息檢索可以大大提高檢索的效率#65377;目前個性化信息檢索還處于研究階段,對于信息服務(wù)機構(gòu)來說,應(yīng)緊跟信息技術(shù)的發(fā)展,一旦技術(shù)成熟,就可以將其與Web挖掘技術(shù)相結(jié)合,向用戶提供個性化信息檢索服務(wù),提高競爭力#65377;
4.4.5 個性化決策支持服務(wù)
這種服務(wù)強調(diào)充分運用數(shù)據(jù)挖掘#65380;語義網(wǎng)絡(luò)#65380;知識發(fā)現(xiàn)等先進技術(shù),對有用的信息內(nèi)容再進行深層次的分析與挖掘,向用戶提供能夠用于決策支持#65380;智能查詢#65380;科學(xué)研究#65380;解決問題等知識服務(wù)方面的規(guī)則和模式#65377;
4.5 系統(tǒng)運行的注意事項
(1)發(fā)揮人的主觀能動性#65377;技術(shù)不是萬能的,技術(shù)也不可能解決所有問題,要提高信息服務(wù)質(zhì)量和效率,需要信息服務(wù)機構(gòu)的工作人員增強責(zé)任感和事業(yè)心,精心維護系統(tǒng),提高信息加工質(zhì)量,夯實服務(wù)基礎(chǔ)#65377;(2)保護用戶隱私#65377;建立在Web挖掘基礎(chǔ)上的個性化信息服務(wù)系統(tǒng)必_須有用戶的參與,同時還要分析用戶反饋的信息,這就可能涉及到用戶的隱私#65377;因此,信息服務(wù)機構(gòu)在提供個性化信息服務(wù)時,要充分考慮用戶的隱私權(quán)問題,在尊重用戶自己選擇的前提下提供主動服務(wù);同時,要避免用戶個人信息的外泄,從而保護用戶的合法權(quán)益#65377;(3)提高系統(tǒng)性能#65377;建立在web挖掘基礎(chǔ)上的個性化信息服務(wù)系統(tǒng)一般都繼承了瀏覽器/服務(wù)器結(jié)構(gòu),當(dāng)中間處理過程費時過多或用戶數(shù)量過大時,必然會延長響應(yīng)時間,系統(tǒng)性能不穩(wěn)定,這易造成部分用戶的抱怨或離開#65377;因此,信息服務(wù)機構(gòu)還需想辦法提高系統(tǒng)性能#65377;
參考文獻
[1]趙紅霞,趙玉梅.Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J].華南金融電腦,2004,(11):96-99.
[2]李德杰.Web數(shù)據(jù)挖掘工具及其在電子商務(wù)中的應(yīng)用[J].微計算機應(yīng)用,2002,(7):180.
[3]朱曉云.Web數(shù)據(jù)挖掘與個性化信息服務(wù)中用戶研究[J].情報雜志,2004,(2):34-35.
[4]張淼,張國鵝.個性化遠程教育平臺的研究與實現(xiàn)[J].計算機時代,2004,(8):34-37,43.
[5]張冬梅,張志東.構(gòu)建基于Web數(shù)據(jù)挖掘技術(shù)的信息服務(wù)系統(tǒng)[J].圖書情報工作,2003,(2):88-89,83.
[6]楊小平.利用數(shù)據(jù)挖掘提升internet個性化服務(wù)[J].統(tǒng)計與決策,2005,(9):130-131.