付建清
摘 要:在網(wǎng)絡環(huán)境下,信息的種類和數(shù)量越來越多。網(wǎng)絡信息推薦系統(tǒng)是面向用戶的系統(tǒng),怎樣向用戶推薦感興趣的信息,在用戶對信息的個性化要求日益明顯的情況下,個性化服務技術(shù)就變成網(wǎng)絡信息推薦系統(tǒng)的關(guān)鍵問題。因此研究和開發(fā)先進的推薦系統(tǒng)就越來越被人們重視。該文主要分析了目前網(wǎng)絡信息推薦系統(tǒng)存在的問題,以及未來網(wǎng)絡信息推薦系統(tǒng)的發(fā)展方向。
關(guān)鍵詞:網(wǎng)絡信息系統(tǒng) 推薦 數(shù)據(jù)庫 需求
中圖分類號:TP393 文獻標識碼:A 文章編號:1674-098X(2016)01(b)-0001-02
推薦系統(tǒng)是指將個性化的推薦信息作為輸出的系統(tǒng)或在大規(guī)??蛇x對象中引導用戶做出選擇的系統(tǒng)。如果從技術(shù)層面上講,推薦系統(tǒng)就是如何發(fā)現(xiàn)特定類型的數(shù)據(jù)中有價值的信息的應用技術(shù)。它的服務方式中采用了多種數(shù)據(jù)分析技術(shù)為用戶服務,向用戶自動、實時、精確地提供其所需信息,并從用戶的反饋中收集信息對推薦結(jié)果進行修改。推薦系統(tǒng)是協(xié)助用戶獲取有價值的信息的一種工具。它能夠?qū)τ脩舻臑g覽歷史等訪問站點信息進行收集、統(tǒng)計,并根據(jù)用戶的瀏覽與查找行為來推薦信息內(nèi)容。推薦系統(tǒng)同檢索系統(tǒng)與其他系統(tǒng)一樣,是網(wǎng)絡信息服務的一部分,是整個網(wǎng)絡信息系統(tǒng)的一個組成部分。
在網(wǎng)絡環(huán)境下,信息的種類和數(shù)量非常多,推薦系統(tǒng)向用戶推薦的信息只有滿足用戶的興趣愛好,才有其存在的價值。
1 網(wǎng)絡信息推薦系統(tǒng)存在的問題
作為新興研究領(lǐng)域的網(wǎng)絡信息推薦系統(tǒng),雖然已經(jīng)具備較好的功能,但還存在很多問題,特別是推薦系統(tǒng)的開發(fā)、應用與其它系統(tǒng)的兼容性還不夠,推薦方式的應用還不夠廣泛,除推薦方式的原因外,也與其提供的信息質(zhì)量、相關(guān)度不高等問題有關(guān),具體原因主要有如下幾點。
(1)信息推薦服務基本是由數(shù)據(jù)庫中封閉系統(tǒng)來提供,這跟數(shù)據(jù)庫能提供方便的信息推薦服務有一定的關(guān)系,包括如下幾項。
①大部分數(shù)據(jù)庫系統(tǒng)中的信息專業(yè)化、系統(tǒng)化,都是以學科知識體系編排,用戶的信息需求顯得較為集中和單一,因此能很容易獲取和表達信息需求。
②經(jīng)過標引的信息,具有一致的發(fā)布標準和更新定時,只要通過關(guān)鍵詞匹配查找,準確性也很高。
③相似性的用戶群體,更能方便系統(tǒng)用戶操作的記錄,不大的記錄數(shù)量,容易進行分析,這樣有利于協(xié)同推薦等技術(shù)的應用。
④傳統(tǒng)的實體圖書館早就開始提供定題服務,與數(shù)據(jù)庫信息推薦服務的宗旨類似,起到了借鑒作用。
因此技術(shù)條件要求不高、需分析的數(shù)據(jù)量不多、需求較為簡單統(tǒng)一的數(shù)據(jù)庫信息推薦服務得到了更早的發(fā)展和更廣泛的應用。
(2)信息推薦前期常使用文本匹配技術(shù),內(nèi)容挖掘不足。中文檢索的瓶頸如同義詞的使用、分詞技術(shù)不足等,都說明了單一的關(guān)鍵詞匹配,是很難完整表達用戶信息需求的,這也正是郵件定制所提供信息的質(zhì)量得不到保證的原因。有部分推薦服務的提供會使用系統(tǒng)自動化的分析,但也由于自然語言處理的困難而效果不佳。
(3)系統(tǒng)對用戶興趣模型的創(chuàng)建較為簡單,智能化和動態(tài)更新能力不足,難以表達用戶的真實需求。用戶在進行信息檢索時,初始時刻的信息需求常模糊不清,或者用戶認為自己已認識清楚,但可能因其表達能力或總結(jié)能力的缺乏而與實際有所偏差,需要更深入的挖掘。需求具有派生性和可啟發(fā)性,使得通過外界因素激發(fā)潛在需求成為可能,并有可能進一步引發(fā)其他需求。人們的認知結(jié)構(gòu)會經(jīng)歷同化與順應,從不平衡向平衡發(fā)展,循環(huán)往復,推動認知的前進,并最終影響用戶對其自身需求的定義和理解。表現(xiàn)有:在前期用戶反饋中,用戶判定相關(guān)的項目可能在后期反饋中被認為不能滿足需求。這也說明了用戶的興趣是不斷變化發(fā)展的,只在前期根據(jù)用戶的個人信息來定義興趣模型,將很快不適用。當然,協(xié)同推薦等技術(shù)也關(guān)注用戶發(fā)展的信息需求,但是其算法質(zhì)量仍在改進中。
(4)信息推薦前期的信息挖掘,主要是對網(wǎng)頁信息進行分析,如Web日志挖掘等,缺乏較完善的知識庫來輔助。Web數(shù)據(jù)挖掘包括內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用記錄挖掘三種,能夠有效反映網(wǎng)頁的內(nèi)容和價值以及用戶的使用習慣和頁面跳轉(zhuǎn),三者的有效結(jié)合,可以較好地把握用戶的需求變化,并檢索獲取高價值的網(wǎng)頁內(nèi)容,通過優(yōu)化后的排序呈現(xiàn)在用戶面前。但是,完備的知識庫中存儲著大量的知識規(guī)則,可以形成相互關(guān)聯(lián)的知識網(wǎng)絡,推薦系統(tǒng)的分析模塊與其交互,存取利用相應的知識規(guī)則,結(jié)合使用數(shù)據(jù)挖掘或多維聯(lián)機分析等技術(shù),效果更好。
(5)動態(tài)性和智能化不足。信息推薦的內(nèi)容是前期預定義的,無法自動跟蹤變化,要想獲得真實的、與時俱進的信息,常需要不斷地交互反饋,如問卷或?qū)υ捒虻男问?,從個人信息到對信息的評價,從舊需求變更到新需求的表達,方方面面的獲取用戶意見,從而通過數(shù)學計算,如簡單的加權(quán)或其他推薦算法,來明確用戶的傾向。但是,頻繁的對話容易使用戶產(chǎn)生厭煩情緒,導致隨意作答,甚至拒絕作答的情況出現(xiàn)。這樣,直接影響了高質(zhì)量的推薦服務的提供。
(6)推薦對象通常是網(wǎng)站的長期用戶,對非注冊用戶等推薦不足。因為瀏覽歷史是網(wǎng)站分析用戶的主要來源,只有長期并經(jīng)常使用該網(wǎng)站的注冊用戶才有豐富的歷史記錄,但是對于不經(jīng)常登錄或未注冊用戶而言,則缺少可供分析信息需求的文檔,就會造成推薦的內(nèi)容個性化不足,或沒有推薦服務。
2 網(wǎng)絡信息的個性化推薦策略存在的問題
(1)推薦的個性化不夠明顯,沒有按照用戶的實際需要給出不一樣的產(chǎn)品推薦。
(2)推薦的自動化程度水平低,因為現(xiàn)在的推薦技術(shù)還是通過內(nèi)容搜索和分類瀏覽的方法推薦,用戶要得到有關(guān)的信息內(nèi)容,就要通過關(guān)鍵詞或所屬類別逐層查找搜索。
(3)推薦的持久性水平低,國內(nèi)大部分網(wǎng)站使用的推薦都是采用用戶登錄時得到的信息,這樣很難知道用戶每次瀏覽網(wǎng)頁的興趣愛好等信息進行富有個性化的推薦。
(4)推薦的方法過于單一,大部分網(wǎng)站的檢索主要是應用分類瀏覽和內(nèi)容。
(5)推薦功能不夠靈活,無法滿足用戶在不同的場合和時間需要不同的推薦類型。
(6)對多個推薦工具和大量數(shù)據(jù)很難進行動態(tài)有效地管理和維護。隨著網(wǎng)絡信息服務中大量應用推薦系統(tǒng),大量的推薦工具、數(shù)據(jù)和應用接口如何管理和維護的問題突出。
3 網(wǎng)絡信息推薦系統(tǒng)的發(fā)展方向
(1)多樣化的數(shù)據(jù)。目前的推薦系統(tǒng)主要通過過濾的方式,它不需要領(lǐng)域知識,能進行跨類型推薦、自適應性較好。用戶是以顯式評價的信息作為原始數(shù)據(jù)進行收集,這樣只有在用戶對推薦系統(tǒng)做出評價時,系統(tǒng)才能得到有關(guān)的信息內(nèi)容。將來的推薦系統(tǒng)不僅要通過顯式提取用戶信息,還要在網(wǎng)絡挖掘技術(shù),收集用戶的隱式瀏覽信息方面,提高信息收集的自動化水平。
(2)改進推薦算法。提高推薦算法的運算性能及實時性,以使推薦系統(tǒng)能產(chǎn)生更精確、實時的推薦。盡管目前對協(xié)作過濾技術(shù)的研究很多,但實際效果并不理想,尤其在處理稀疏和冷開始問題上缺乏真正有效的方法。隨著網(wǎng)絡技術(shù)的發(fā)展,用戶評價數(shù)據(jù)庫的不斷增大,對推薦算法的運算性能提出了新的要求,要求提高推薦算法的速度,加強算法的推薦實時性。同時,提高推薦的準確性也是研究推薦算法的主要任務,目前個性化推薦系統(tǒng)沒有真正普及,用戶并不使用個性化推薦系統(tǒng),主要原因就是推薦系統(tǒng)推薦的準確度并不高,造成用戶不去依賴推薦系統(tǒng)。
(3)推薦系統(tǒng)的研究要以用戶為中心,從單一用戶推薦變成客戶群推薦。目前的推薦系統(tǒng)都是支持單一用戶的個性化推薦,將來應該是支持多用戶推薦的推薦系統(tǒng),可為特定用戶群做出推薦,用戶群之間、用戶之間能共享興趣資料信息。
(4)重視推薦策略。推薦策略泛指所有能使用戶得到自己想要的或感興趣的信息方法和策略。推薦系統(tǒng)給出的推薦結(jié)果要符合用戶的興趣愛好,具有可用的準確度、個性化程度高。
(5)用戶需求模型的建立與動態(tài)跟蹤相結(jié)合。網(wǎng)絡信息推薦服務的針對性,必然要求建立通用的用戶需求模型,并根據(jù)具體的用戶修改、增刪相應的參數(shù),從而真實反應個體用戶的信息需求,提供符合要求的服務方式和信息質(zhì)量。此外,為了保證用戶使用信息推薦服務的“黏性”,既成為長期的、忠實的用戶,信息推薦必須認真考慮三個問題:什么用戶在使用著該推薦?用戶需要怎樣質(zhì)量(從信息種類、推薦層次等方面考慮)的推薦?用戶能利用該推薦做什么?只有明確了這三個問題,才能提高用戶使用的滿意度。而根據(jù)用戶需求動態(tài)發(fā)展的原理,推薦服務必須能發(fā)掘并動態(tài)跟蹤變化,不斷地豐富原需求模型,使得模糊、概括性的模型逐步清晰,甚至差異化,為個性化的推薦服務打下基礎。如果可能,最好能有類似于“發(fā)散思維”般的興趣擴展,幫助用戶明確自己的傾向,甚至引導或誘發(fā)潛在的信息需求。
(6)系統(tǒng)智能化與用戶間交流相結(jié)合。正如系統(tǒng)開發(fā)的原型法一般,用戶需求在系統(tǒng)使用中的逐步確定、對系統(tǒng)功能的評價等,都是貫穿開發(fā)始終,推薦服務也應該有此思想。雖然提供了多種技術(shù)以提高系統(tǒng)的智能化,希望在后臺盡力實現(xiàn)信息的高質(zhì)量挖掘、抽取、概括,從而減少前臺繁復的交互,并提供高質(zhì)量的推薦服務。但是,用戶表達意見的渠道始終要建立并良好維護,尤其是用戶間的交流。網(wǎng)站信息推薦的其中一個思想,就是將用戶進行大概分組,組中某用戶感興趣的信息,也默認為對組中另一用戶同樣具有吸引力。因此,系統(tǒng)不但要與用戶進行交互對話,還要提供板塊給用戶們進行交流。事實證明,用戶交流區(qū)正是經(jīng)驗、知識分享的自由區(qū)域,新手在此可以快速的入門并確定自己的需求,而智能化的系統(tǒng)如能對此區(qū)域進行相應的信息挖掘,也將有助于獲知用戶評價和熱點、缺點,提高其推薦的信息質(zhì)量。
參考文獻
[1] 謝幼如.網(wǎng)絡信息資源的開發(fā)與運用[M].北京:電子工業(yè)出版社,2015.
[2] 李葆萍.信息技術(shù)教育應用[M].北京:人民郵電出版社,2014.
[3] 黃曉斌.數(shù)字圖書館推薦系統(tǒng)研究[J].情報資料工作,2005(4):53-56.
[4] 余力,劉魯.電子商務個性化推薦研究[J].計算機集成制造系統(tǒng),2004,10(10):1306-1313.