●周玲元,段隆振
(1.南昌大學(xué)信息工程學(xué)院,南昌330063;2.南昌航空大學(xué)經(jīng)濟(jì)管理學(xué)院,南昌330063)
數(shù)字圖書館聯(lián)盟中基于情境感知的個(gè)性化推薦服務(wù)研究
●周玲元1,2,段隆振1
(1.南昌大學(xué)信息工程學(xué)院,南昌330063;2.南昌航空大學(xué)經(jīng)濟(jì)管理學(xué)院,南昌330063)
個(gè)性化推薦;情境感知;數(shù)字圖書館聯(lián)盟;本體
數(shù)字圖書館聯(lián)盟情境感知服務(wù)是圖書館在數(shù)字化、移動網(wǎng)絡(luò)環(huán)境下面臨的一個(gè)嶄新課題。本文對情境感知推薦進(jìn)行了系統(tǒng)研究,探討了移動環(huán)境下情境感知計(jì)算流程,給出了基于本體的用戶情境偏好模型,在此基礎(chǔ)上提出了數(shù)字圖書館聯(lián)盟情境感知推薦模型,并對功能模塊進(jìn)行了闡述,為數(shù)字圖書館聯(lián)盟個(gè)性化推薦應(yīng)用提供了理論參考。
數(shù)字圖書館聯(lián)盟是對傳統(tǒng)圖書館聯(lián)盟功能的進(jìn)一步繼承與深化,[1]以實(shí)現(xiàn)資源共享、互惠互利為目的而組織起來的、受共同認(rèn)可的協(xié)議和合同制約的圖書館聯(lián)合體。其目的是通過數(shù)字圖書館聯(lián)盟門戶網(wǎng)站的形式將分布在不同信息源的內(nèi)容整合在一起集中實(shí)現(xiàn)統(tǒng)一檢索、推送服務(wù)等網(wǎng)絡(luò)服務(wù)。[2,3]
隨著數(shù)字資源的指數(shù)級增長,出現(xiàn)了“信息超載”問題,因此,如何集成數(shù)字圖書館聯(lián)盟的服務(wù),為不同用戶提供個(gè)性化服務(wù),是當(dāng)前數(shù)字圖書館聯(lián)盟研究的熱點(diǎn)問題。焦玉英[4]等提出了基于用戶個(gè)性化需求的數(shù)據(jù)圖書館集成模型;牛亞真、祝忠明[5]對個(gè)性化服務(wù)中跨系統(tǒng)的用戶建模方法進(jìn)行了系統(tǒng)研究,總結(jié)歸納跨系統(tǒng)的用戶建模方法;潘家武[6]等提出基于領(lǐng)域本體的數(shù)字圖書館跨系統(tǒng)用戶模型。沈嶸[7]提出數(shù)字圖書館聯(lián)盟的技術(shù)實(shí)現(xiàn)方案,利用企業(yè)技術(shù)聯(lián)盟引入現(xiàn)代圖書館數(shù)字化建設(shè)中,解決數(shù)字圖書館聯(lián)盟的信息資源共享問題。周明明[8]系統(tǒng)分析了“深圳文獻(xiàn)港”數(shù)字圖書館聯(lián)盟的數(shù)字門戶,對區(qū)域數(shù)字圖書館聯(lián)盟的門戶功能進(jìn)行研究。為提高個(gè)性化服務(wù)的準(zhǔn)確性,胡慕海[9]、袁靜[10]、潘旭偉[11,12]等分別提出基于情境感知的自適應(yīng)個(gè)性化推薦服務(wù)方案。
目前對數(shù)字圖書館聯(lián)盟的研究主要集中在兩方面:一是數(shù)字圖書館聯(lián)盟機(jī)制構(gòu)建,主要研究對象為數(shù)字圖書館聯(lián)盟機(jī)制、組織結(jié)構(gòu)及功能、業(yè)務(wù)范圍和版權(quán)保護(hù)等;二是數(shù)字圖書館個(gè)性化服務(wù)技術(shù)改進(jìn)方面,主要研究對象為單個(gè)數(shù)字圖書館的個(gè)性化搜索和個(gè)性化推薦技術(shù)。對中國知網(wǎng)、萬方論文檢索發(fā)現(xiàn)國內(nèi)還沒有學(xué)者對數(shù)字圖書館聯(lián)盟中的情境感知推薦服務(wù)進(jìn)行研究。鑒于以上情況,筆者認(rèn)為當(dāng)前的數(shù)字圖書館聯(lián)盟缺乏有效的情境感知能力,從而無法保證個(gè)性化服務(wù)質(zhì)量。本文系統(tǒng)研究了情境感知及個(gè)性化推薦技術(shù),利用語義web描述語言O(shè)WL用戶情境偏好本體模型,在此基礎(chǔ)上給出了面向數(shù)字圖書館聯(lián)盟網(wǎng)絡(luò)門戶的情境感知推薦服務(wù)機(jī)制,并對推薦機(jī)制的核心模塊進(jìn)行了詳細(xì)論述。
2.1 情境感知
在數(shù)字圖書館推薦系統(tǒng)領(lǐng)域,人們往往只關(guān)注“用戶—項(xiàng)目”之間的關(guān)聯(lián)關(guān)系,而較少考慮它們所處的情境(如時(shí)間、位置、周圍人員、情緒、活動狀態(tài)、網(wǎng)絡(luò)條件等)。但是,僅僅依靠“用戶—項(xiàng)目”二元關(guān)系并不能生成有效推薦。[13]例如,有的用戶喜歡在“早上”而不是“中午”被推薦合適的新聞信息,有的用戶在“心情愉悅”時(shí)更愿意被推薦一些輕松的雜志。情境感知推薦系統(tǒng)通過將情境信息引入推薦系統(tǒng),以進(jìn)一步提高推薦精確度和用戶滿意度,兼具“普適計(jì)算”和“個(gè)性化”兩種優(yōu)勢,逐漸成為推薦系統(tǒng)研究領(lǐng)域最為活躍的分支之一,同時(shí)對于提高數(shù)字圖書館聯(lián)盟的服務(wù)質(zhì)量具有重要的理論及社會價(jià)值。
情境感知計(jì)算研究內(nèi)容主要有:(1)情境獲取,處于系統(tǒng)的數(shù)據(jù)收集階段,主要方式有顯示獲取、隱式獲取和推理獲取三種;(2)情境建模,形式化表示情境模型,主要方法有面向?qū)ο竽P汀D模型、標(biāo)記語言模型和本體模型;(3)情境用戶偏好提取,將情境信息引入用戶偏好建模,主要分為定性分析、定量分析兩大類提取技術(shù)。
2.2 個(gè)性化推薦
為有效地解決“信息超載”問題,人們提出“個(gè)性化服務(wù)”的概念。推薦系統(tǒng)作為個(gè)性化服務(wù)研究領(lǐng)域的重要分支,幫助用戶從大量數(shù)據(jù)中發(fā)現(xiàn)其可能感興趣的項(xiàng)目,并生成個(gè)性化推薦以滿足個(gè)性化需求。其中應(yīng)用最為成功的是協(xié)同過濾推薦技術(shù),但是該推薦技術(shù)依然存在著原始數(shù)據(jù)稀疏性、實(shí)時(shí)性、精確性等問題,特別是在移動網(wǎng)絡(luò)情況下,用戶所處的環(huán)境(如網(wǎng)絡(luò)狀況、位置等)易變,而這些因素影響用戶需求的表達(dá),使得上述問題更加嚴(yán)重。為此,國內(nèi)外相關(guān)學(xué)者及研究機(jī)構(gòu)對情境感知推薦系統(tǒng)理論、方法及應(yīng)用展開了深入研究工作。相對而言,目前我國主要關(guān)注的還是非情境化的推薦系統(tǒng)研究。
隨著3G網(wǎng)絡(luò)的發(fā)展,移動商務(wù)越來越普及,基于情境感知技術(shù)的移動商務(wù)在時(shí)間和位置上擁有更高的自由度。情景感知推薦服務(wù)是未來移動信息服務(wù)的一個(gè)方向,它是不同產(chǎn)業(yè)融合的產(chǎn)物,能夠有效的滿足人們的個(gè)性化需求,將使人們的生活更加便利。因此移動環(huán)境下個(gè)性化推薦中融入情境感知技術(shù)的研究具有現(xiàn)實(shí)的理論意義和應(yīng)用價(jià)值。
3.1 跨系統(tǒng)用戶情境興趣建模
考慮到用戶偏好和需求會隨著時(shí)間、情境發(fā)生變化,本文將用戶情境劃分為:用戶情境、時(shí)間情境、設(shè)備情境和數(shù)字圖書館情境。其中,用戶情境包括用戶的個(gè)人信息、興趣偏好等,時(shí)間情境包括用戶登錄退出系統(tǒng)的時(shí)間、數(shù)據(jù)停留等,設(shè)備情境包括用戶終端顯示設(shè)備、網(wǎng)絡(luò)狀況等,數(shù)字圖書館情境為描述系統(tǒng)任務(wù)對應(yīng)的領(lǐng)域本體概念和數(shù)字圖書館聯(lián)盟各館情況數(shù)據(jù)。本體與情境之間的聯(lián)系用元組H={O,C,R}來表示,其中,O表示本體的集合,C表示情境的集合,R表示本體與情境信息之間的關(guān)系。本體集合O={O1, O2,O3…},其中O1,O2,O3…等表示本體。情境集合C={C1,C2,C3…},其中C1,C2,C3…等表示情境信息。關(guān)系集合R={r1,r2,r3…},其中r1,r2,r3…表示情境信息直接的關(guān)系。在用戶使用數(shù)字圖書館聯(lián)盟門戶的過程中,所需感知的用戶信息主要包括登錄、退出系統(tǒng)的時(shí)間、訪問某場景的次數(shù)及在聯(lián)盟系統(tǒng)上駐留的時(shí)間等。下面以此為例,具體說明如何用本體來表示情境信息。具體程序段如下:
上述程序段中,OWL描述為用戶對數(shù)字圖書館聯(lián)盟門戶的訪問情境記錄,本文標(biāo)記為一個(gè)本體類ⅤisitSZTSGLMSystem,它的屬性描述了用戶訪問數(shù)字圖書館聯(lián)盟門戶過程中感知的情境信息,其中一階謂詞邏輯是情境信息的形式化表示,上述程序中用情境實(shí)例的方式表述一階謂詞邏輯形式。同時(shí)對數(shù)字圖書館的資源進(jìn)行科學(xué)組織,建立數(shù)字資源領(lǐng)域本體,在此基礎(chǔ)上構(gòu)建用戶偏好模型的空間向量表示。本文應(yīng)用文獻(xiàn)辦法構(gòu)建用戶興趣模型,[14]表示為U={(,),(,),…,(,)};表達(dá)式中c為數(shù)字圖書館中數(shù)字資源領(lǐng)域本體的概念單元,w為權(quán)重,表示用戶對特征項(xiàng)C的興趣程度,對于用戶的n個(gè)興趣,都有相應(yīng)的權(quán)重與之對應(yīng)。為了減少系統(tǒng)在計(jì)算上的開銷,本文中選取m個(gè)權(quán)重較大的特征項(xiàng)組成特征向量表示用戶的興趣模型,如U={(,),(,),…,(,)}。
為實(shí)現(xiàn)跨系統(tǒng)的用戶模型,本文提出結(jié)合數(shù)字資源領(lǐng)域本體的空間向量偏好模型表示方法,建模過程包括用戶情境偏好概念的生成和用戶興趣度的計(jì)算,用戶偏好模型中權(quán)重越大表明用戶興趣度越大。在數(shù)字圖書館聯(lián)盟系統(tǒng)中,用戶模型的構(gòu)建步驟如下:(1)感知用戶情境以及瀏覽行為,獲取用戶建模的數(shù)據(jù);(2)參考數(shù)字圖書館聯(lián)盟系統(tǒng)的領(lǐng)域本體,從用戶訪問的情境中提取用戶興趣特征項(xiàng),即用戶興趣概念;(3)通過數(shù)字資源與興趣概念的語義匹配算法計(jì)算用戶模型中概念權(quán)重。
3.2 數(shù)字圖書館聯(lián)盟情境感知推薦模型
數(shù)字圖書館聯(lián)盟情境感知推薦模型不僅需要實(shí)現(xiàn)用戶的無縫跨館訪問需求,而且需要滿足移動用戶動態(tài)情境環(huán)境下推薦服務(wù)實(shí)時(shí)性、準(zhǔn)確性需求。推薦模型完成一個(gè)用戶的個(gè)性化需求的大致流程為:用戶情境知識獲取、用戶情境偏好提取、數(shù)字資源本體構(gòu)建、用戶情境偏好與數(shù)字資源匹配、發(fā)送檢索結(jié)果,更新用戶情境模型等任務(wù)。因此本文將數(shù)字圖書館聯(lián)盟情境感知推薦模型分為五個(gè)模塊:用戶情境信息的獲取與更新合成模塊、數(shù)字資源本體構(gòu)建模塊、用戶情境偏好模型構(gòu)建模塊、數(shù)字信息語義匹配模塊、基于情境感知的數(shù)字圖書館聯(lián)盟推薦服務(wù)模塊(如圖示)。
(1)用戶情境信息的獲取與更新合成。情境信息獲取模塊負(fù)責(zé)從分布廣泛的傳感器、工作流引擎、3G手機(jī)等終端設(shè)備中采集原始情境并進(jìn)行初步處理,使情境感知與實(shí)際使用相分離,該模塊的主要功能有情境的建模、過濾、推斷和存儲,其目標(biāo)是通過對原始情境進(jìn)行過濾、推斷后得到各應(yīng)用所需的高層情境。
(2)數(shù)字資源本體構(gòu)建。根據(jù)數(shù)字圖書館聯(lián)盟實(shí)際使用需要,構(gòu)建數(shù)字資源本體,它分為兩層:上層本體和數(shù)字資源領(lǐng)域本體。[15]上層本體有情境信息涉及的各種實(shí)體概念抽象而成,這些概念還可以各自細(xì)化成子類別;領(lǐng)域本體包含數(shù)字圖書館聯(lián)盟應(yīng)用中數(shù)字資源領(lǐng)域的具體子類(圖書類別、出版社、作者等)。
圖數(shù)字圖書館聯(lián)盟情境感知推薦模型
(3)用戶情境偏好模型。上文3.1節(jié)重點(diǎn)介紹了如果構(gòu)建情境偏好模型,主要是對捕獲的情境信息進(jìn)行分析并根據(jù)主題內(nèi)容進(jìn)行分類,利用余弦相似度公式計(jì)算情境信息與領(lǐng)域本體中概念權(quán)重,權(quán)重越高表明用戶興趣越大,以產(chǎn)生模型實(shí)例進(jìn)而描述用戶情境偏好。
(4)數(shù)字信息語義匹配模塊。該模塊通過匹配算法確定數(shù)字資源與特定情境下用戶偏好之間的匹配相似度,算法過程首先是將數(shù)字資源領(lǐng)域本體和用戶情境偏好本體中的概念與實(shí)例都映射到通用本體概念結(jié)構(gòu)樹中,然后在擴(kuò)展的本體概念間計(jì)算兩者的匹配相似度,進(jìn)而得到基于情境感知的個(gè)性化數(shù)字資源匹配結(jié)果集。
(5)數(shù)字資源情境感知推薦。結(jié)合用戶情境模型對數(shù)字信息語義匹配模塊產(chǎn)生的結(jié)果集進(jìn)行重新排序等個(gè)性化處理操作,推薦給用戶以及具有相同或相似情境需求的其他用戶,實(shí)現(xiàn)用戶之間的協(xié)同過濾推薦。同時(shí)根據(jù)用戶的反饋及時(shí)更新情境模型,實(shí)現(xiàn)下一輪的個(gè)性化推薦。
[1]李富玲,盧振波.?dāng)?shù)字圖書館聯(lián)盟研究[J].大學(xué)圖書館學(xué)報(bào),2005(2):11-15.
[2]陳定權(quán),等.?dāng)?shù)字圖書館門戶的個(gè)性化[J].新世紀(jì)圖書館,2009(2):30-32.
[3]ShiriA,Chase-KruszewskiS.Knowledge organization systems in North American digital library collections[J].Program:Electronic Library andⅠnformation Systems,2009,43(2):121-139.
[4]焦玉英,袁靜.基于情景模型的數(shù)字圖書館個(gè)性化服務(wù)研究[J].中國圖書館學(xué)報(bào),2008(6):58-63.
[5]牛亞真,祝忠明.個(gè)性化服務(wù)中跨系統(tǒng)用戶建模方法研究綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2012(5):1-6.
[6]潘家武.基于領(lǐng)域本體的數(shù)字圖書館動態(tài)用戶興趣模型的構(gòu)建[J].圖書情報(bào)工作,2010(8):64-67.
[7]沈嶸.技術(shù)聯(lián)盟:高校圖書館數(shù)字化建設(shè)的新方向[J].圖書情報(bào)工作,2010(5):71-74.
[8]周明明.區(qū)域數(shù)字圖書館聯(lián)盟的數(shù)字門戶構(gòu)建[J].大學(xué)圖書館學(xué)報(bào),2010(4):64-67.
[9]胡慕海,等.面向移動數(shù)字圖書館的情境敏感型知識推薦研究[J].計(jì)算機(jī)科學(xué),2011(8):92-95.
[10]袁靜,焦玉英.基于情景信息的學(xué)習(xí)資源個(gè)性化推薦[J].情報(bào)理論與實(shí)踐,2009(7):116-119.
[11]潘旭偉,等.自適應(yīng)個(gè)性化信息服務(wù):基于情境感知和本體的方法[J].中國圖書館學(xué)報(bào)2009(6):41-48.
[12]周莉,等.情境感知的電子商務(wù)個(gè)性化商品信息服務(wù)[J].圖書情報(bào)工作,2011(10):130-134,29.
[13]王立才,等.情境感知推薦系統(tǒng)[J].軟件學(xué)報(bào),2012,23(1):1-20.
[14]陳國棟,等.基于情境感知的人體經(jīng)絡(luò)個(gè)性化信息服務(wù)研究[J].電視技術(shù),2012(13):78-82.
[15]嚴(yán)雋薇,等.基于本體用戶興趣模型的個(gè)性化推薦算法[J].計(jì)算機(jī)集成制造系統(tǒng),2010(6):2757-2782.
G250.76;G252.62
A
1005-8214(2014)07-0067-03
周玲元(1982-),男,博士研究生,南昌大學(xué)信息工程學(xué)院講師,研究方向:信息管理與信息系統(tǒng);段隆振(1961-),男,教授,南昌航空大學(xué)經(jīng)濟(jì)管理學(xué)院博導(dǎo),研究方向:數(shù)據(jù)挖掘與知識發(fā)現(xiàn)。
2013-06-25
[責(zé)任編輯]邵晉蓉
本文系江西省社會科學(xué)規(guī)劃課題“手機(jī)圖書館情境感知服務(wù)研究”(項(xiàng)目編號:13TQ16),江西省藝術(shù)科學(xué)規(guī)劃項(xiàng)目“基于網(wǎng)格資源匹配的數(shù)字圖書館個(gè)性化推薦服務(wù)研究——以南昌市高校為例”(項(xiàng)目編號:DB201209393)的研究成果。