亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學習的高校圖書館個性化智能推薦服務方案*

        2020-03-26 02:09:04柳益君蔡秋茹吳智勤
        圖書館研究與工作 2020年3期
        關鍵詞:圖書館智能情感

        柳益君 羅 燁 蔡秋茹 吳智勤 何 勝

        (1.江蘇理工學院計算機工程學院 江蘇常州 213001)

        (2.江蘇理工學院圖書館 江蘇常州 213001)

        1 引言

        個性化推薦是高校圖書館個性化服務的重要內(nèi)容之一,準確而深入地了解用戶是個性化推薦的前提?!盎ヂ?lián)網(wǎng)+”、社交網(wǎng)絡等技術在圖書館的應用給用戶分析提供了多源數(shù)據(jù),學者們重點關注如何挖掘用戶的偏好和興趣并通過推薦服務滿足之。李樹青等人[1]根據(jù)圖書館借閱記錄,挖掘圖書閱讀相關性,利用圖書類別相關性鏈接關系,提出用戶個性化模式的表達方法,從長期興趣和短期興趣兩方面為用戶提供個性化圖書推薦服務。劉海鷗等人[2]融合圖書館用戶的情境信息進行面向大數(shù)據(jù)的協(xié)同過濾推薦。王剛等人[3]根據(jù)用戶社交行為,通過分析用戶之間社交密切程度、資源使用情況和用戶近期偏好因素,為用戶提供個性化推薦服務。柳益君等人[4]提出一種基于社交網(wǎng)絡分析的閱讀推薦方法,發(fā)現(xiàn)用戶的多樣興趣,進而提供主題多樣性的閱讀推薦服務。劉愛琴等人[5]應用SOM神經(jīng)網(wǎng)絡對用戶Web訪問行為進行聚類和優(yōu)化,識別用戶的興趣點,進而提供主題推薦、圖書推薦和專家推薦。

        圖書館個性化推薦服務受到廣泛關注,取得了諸多成果,但是依然面臨著挑戰(zhàn)。圖書館發(fā)展至今,文獻、資料、內(nèi)容日趨繁多復雜,個性化推薦服務面臨的“信息過載”“信息迷航”“情感缺失”問題仍然嚴重。用戶興趣是情感的顯性表達,用戶需求則是潛在的隱性情感需要?,F(xiàn)實中,推薦符合用戶顯性興趣的資源往往并不能滿足用戶潛在需求。例如,一位計算機專業(yè)的學生借閱了圖書《數(shù)據(jù)結構》,顯示了他對“數(shù)據(jù)結構”有明顯興趣,但是如果給他推薦此類圖書文獻,他很可能未必需要。也許他會覺得一本《數(shù)據(jù)結構》已經(jīng)夠了,不需要更多,他需要的是算法分析和設計類書籍。初景利[6]指出,圖書館依附于用戶而存在,用戶需求是圖書館存在的基礎與發(fā)展的動力。圖書館要留住用戶、壯大用戶群,僅著眼于用戶顯性興趣是不夠的,更應捕捉用戶的潛在需求。分析目前的研究,推薦的個性化主要體現(xiàn)在滿足用戶的顯性偏好和興趣,對于如何滿足用戶的潛在需求尚缺乏深入探索。為了實現(xiàn)以用戶為中心的推薦服務,有必要研究如何滿足用戶深層潛在需求,而非僅僅是顯性興趣,從而最終提供用戶高滿意度的個性化推薦服務。

        2 機器學習在構建個性化智能推薦服務中的優(yōu)勢

        目前,我國各行各業(yè)都在推進人工智能技術的應用。通過人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等現(xiàn)代信息技術,對行業(yè)實行顛覆性重構和革命性改造。人工智能在圖書館應用甚多,使圖書館升華為智能圖書館的新形態(tài),圖書館服務也走向適應時代的智能服務[7-9]。在智能服務的背景下,圖書館需要提升傳統(tǒng)推薦服務的智能化水平。個性化智能推薦服務是傳統(tǒng)個性化服務的進一步發(fā)展,充分利用智能技術,不僅能夠發(fā)現(xiàn)用戶的顯性興趣,也能夠深入挖掘用戶的深層需求,實現(xiàn)升級的個性化推薦服務,主動為用戶推薦其所需的資源,全面、深層地滿足用戶個性化需求,并提高資源的利用率。

        作為人工智能的重要分支之一,機器學習在分析用戶數(shù)據(jù),發(fā)現(xiàn)用戶需求,進而提供個性化智能推薦服務上有很大優(yōu)勢?!度斯ぶ悄軜藴驶灼?018版)》指出,人工智能的特征之一是“由人類設計,為人類服務,本質為計算,基礎為數(shù)據(jù)”[10],而機器學習是一種基于數(shù)據(jù)的重要智能技術。我國著名機器學習專家周志華教授[11]在專著《機器學習》中談到,機器學習在大數(shù)據(jù)時代是必不可少的核心技術,沒有機器學習技術分析數(shù)據(jù),則數(shù)據(jù)利用無從談起,“數(shù)據(jù)分析”是機器學習技術的舞臺,各種機器學習技術已經(jīng)在這個舞臺上大放異彩。物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、社交網(wǎng)絡等技術在圖書館日益廣泛的應用使圖書館積累了海量用戶數(shù)據(jù)。用戶數(shù)據(jù)中既有宏觀層面群體涌現(xiàn)的大數(shù)據(jù),也有微觀層面?zhèn)€人和團體的小數(shù)據(jù),蘊含了大量的特征、模式和關系,為用戶分析提供了寶貴資源,也為機器學習提供了用武之地。

        梁少博等人[12]認為,機器學習的相關工具、算法能夠幫助圖書館分析用戶行為數(shù)據(jù)、業(yè)務處理數(shù)據(jù)等,從而為用戶提供更加智能的信息服務。張坤等人[13]指出,個性化推薦服務是機器學習在圖書情報領域的重要應用之一,應用機器學習技術可以對用戶的檢索、閱讀、瀏覽等記錄進行識別與分析,進而判斷出用戶的潛在信息需求及興趣偏好,最終提供滿足用戶需求的資源。機器學習在深入分析和學習用戶數(shù)據(jù),提取數(shù)據(jù)智能,進而深層地洞察用戶、理解用戶中有巨大的應用前景,是構建個性化智能推薦服務的支撐技術。

        3 基于機器學習的個性化智能推薦服務方案

        本文設計基于機器學習的圖書館個性化智能推薦服務方案,如圖1所示。該方案由圖書館用戶數(shù)據(jù)采集與清洗、個性化興趣提取和需求發(fā)現(xiàn)、個性化智能推薦三部分組成。其中,機器學習主要用于個性化需求發(fā)現(xiàn)。

        圖1 基于機器學習的高校圖書館個性化智能推薦服務方案

        3.1 用戶數(shù)據(jù)采集與清洗

        在數(shù)據(jù)采集與清洗階段,全面收集高校圖書館用戶數(shù)據(jù)。除了用戶基本信息、借閱記錄、網(wǎng)站行為(點擊、瀏覽、下載、收藏等)、“互聯(lián)網(wǎng)+”、物聯(lián)網(wǎng)、社交網(wǎng)絡等現(xiàn)代信息技術在高校圖書館的應用產(chǎn)生了各種新類型的用戶數(shù)據(jù)。高校圖書館應用微博社交平臺開展服務產(chǎn)生了社交數(shù)據(jù),學校的教務系統(tǒng)和科研系統(tǒng)可以提供師生的學習數(shù)據(jù)、科研數(shù)據(jù)等,移動圖書館、眼動儀、生理監(jiān)測儀等智能終端可以提供關于用戶情境、生理、狀態(tài)等各方面的感知數(shù)據(jù)。對多源異構的用戶數(shù)據(jù)進行清洗、規(guī)范化和整合,為進一步分析用戶數(shù)據(jù)并從中進行個性化興趣提取和需求發(fā)現(xiàn)奠定基礎。

        3.2 個性化興趣提取和需求發(fā)現(xiàn)

        3.2.1 個性化興趣提取

        個性化顯性興趣是用戶情感的顯性表達,而個性化潛在需求是用戶的隱性情感體現(xiàn)。在個性化興趣提取和需求發(fā)現(xiàn)階段,首先通過關鍵字提取、協(xié)同過濾、統(tǒng)計分析等傳統(tǒng)的方法技術獲取用戶情感的顯性表達,提取用戶的個性化顯性興趣;然后通過機器學習技術,進行用戶隱性情感挖掘,克服圖書館資源推薦服務面臨的用戶情感缺失的困難,發(fā)現(xiàn)用戶的個性化潛在需求。

        3.2.2 基于機器學習的個性化需求發(fā)現(xiàn)

        圖書館用戶的個性化需求發(fā)現(xiàn)主要包含三部分內(nèi)容:當前需求挖掘、需求趨勢預測、需求特征識別。①當前需求挖掘:當前需求挖掘旨在發(fā)現(xiàn)用戶在當前較短一段時間內(nèi)的需求,比如當前一個月、一周的需求,甚至一個學習或一個科研場景下的需求。②需求趨勢預測:用戶對資源的需求常常具有時間上和內(nèi)容上的連貫性,需求趨勢預測旨在根據(jù)用戶當前的興趣和需求去預測用戶未來一段時期內(nèi)的需求。③需求特征識別:需求特征識別旨在發(fā)現(xiàn)某個個體用戶或某個群體用戶的特有的需求,例如,一位從事數(shù)據(jù)結構課程教學的教師會需要這門課程的多種教材和教學參考書,一個研究圖書館服務的團隊特別需要圖書館學、圖書館管理、讀者工作等相關方向的圖書、論文等文獻。

        采用監(jiān)督學習、無監(jiān)督學習、主動學習、半監(jiān)督學習等機器學習方法發(fā)現(xiàn)個性化需求。機器學習主要研究在計算機上從數(shù)據(jù)中產(chǎn)生模型的算法,即學習算法,把經(jīng)驗數(shù)據(jù),即訓練數(shù)據(jù)提供給學習算法,學習算法就能基于這些數(shù)據(jù)產(chǎn)生模型,面對新情況時模型能給出判斷和預測。用于機器學習的用戶數(shù)據(jù)可以分為有標記和無標記兩類,具有已知標簽或結果的訓練數(shù)據(jù)是有標記數(shù)據(jù),反之是無標記數(shù)據(jù)。根據(jù)訓練數(shù)據(jù)是否有標記信息,機器學習任務大致分為監(jiān)督學習、無監(jiān)督學習兩大類,它們分別用于從有標記數(shù)據(jù)和無標記數(shù)據(jù)中學習。此外還有主動學習、半監(jiān)督學習,用于從有標記和無標記的混合數(shù)據(jù)中學習[11]。應用各類機器學習算法在海量用戶數(shù)據(jù)中進行分布探索、關系探索、特征探索、異常探索、推測探索、趨勢探索等,發(fā)現(xiàn)高校圖書館用戶在學習、科研、教學等方面潛在的個性化需求。

        (1)監(jiān)督學習和無監(jiān)督學習在需求發(fā)現(xiàn)中的應用

        在監(jiān)督學習中,輸入的訓練數(shù)據(jù)具有已知標簽或結果,對訓練數(shù)據(jù)集進行訓練以構建模型,并通過接受反饋預測對模型進行持續(xù)改進,當模型在訓練數(shù)據(jù)上達到期望的精度時學習停止;在無監(jiān)督學習中,訓練數(shù)據(jù)沒有標注已知結果,通過探索訓練數(shù)據(jù)中存在的結構而生成模型,該模型可能是提取一般規(guī)則、通過數(shù)學過程減少冗余,或者通過相似性測試組織數(shù)據(jù)[14]。

        從服務對象的角度看,高校圖書館個性化智能推薦服務對象可以是個體用戶,比如一位學生、一位教師,也可以是某一特定用戶群,比如一個科研團隊。無監(jiān)督學習適于在眾多用戶中識別特殊用戶群體,并對其進行需求分析。監(jiān)督學習在發(fā)現(xiàn)個體用戶需求中更有優(yōu)勢,如預測用戶對資源的評分或情感,克服用戶的情感缺失。表1列出了常用監(jiān)督學習和無監(jiān)督學習算法及其在個性化需求發(fā)現(xiàn)中的應用。

        表1 常用監(jiān)督學習和無監(jiān)督學習算法及其在個性化需求發(fā)現(xiàn)中的應用

        (2)主動學習和半監(jiān)督學習在需求發(fā)現(xiàn)中的應用

        監(jiān)督學習要求所有訓練數(shù)據(jù)均有標記信息,而現(xiàn)實中圖書館的很多數(shù)據(jù)標記不完全。例如,通過推薦系統(tǒng)向用戶推薦文獻時請用戶標記出需要的文獻,以獲取用戶對于推薦結果的反饋,但并非所有的用戶都愿意花時間來提供標記,愿意這么做的用戶常常是少數(shù)。專門組織大量人力來標記數(shù)據(jù)顯然不現(xiàn)實。主動學習和半監(jiān)督學習為圖書館充分利用大量的未標記數(shù)據(jù)提供了方法和技術。主動學習在模型訓練過程中選取一部分最有價值的數(shù)據(jù)請用戶或專家進行標注,通過與外界的交互使部分未標記數(shù)據(jù)獲得標記,最終不需要大量標記數(shù)據(jù)便能獲得高效的模型。半監(jiān)督學習同時使用未標記數(shù)據(jù)和標記數(shù)據(jù)來進行模式識別工作,建模過程不需要與用戶或專家交互[11]。有了半監(jiān)督學習和主動學習,大量未標記數(shù)據(jù)也可以用于圖書館用戶當前需求挖掘、需求特征識別、需求趨勢分析等。

        3.3 個性化智能推薦

        根據(jù)所提取的個性化興趣和發(fā)現(xiàn)的個性化需求關聯(lián)書目庫、論文庫、專利庫、知識庫等數(shù)據(jù)庫中的資源,形成個性化智能推薦列表提供給用戶。個性化智能推薦列表由基于個性化興趣的推薦和基于個性化需求的推薦兩部分組成,且以基于個性化需求的推薦為主。這樣,興趣和需求相結合、以需求驅動為主的個性化智能推薦服務得以實現(xiàn),有助于高校圖書館獲得用戶高滿意度。

        4 基于機器學習的個性化智能推薦服務應用案例

        本文以“圖書推薦服務”為例,提出機器學習應用下的高校圖書館個性化智能推薦服務。應用樸素貝葉斯算法發(fā)現(xiàn)目標用戶的當前圖書需求,為其提供個性化智能圖書推薦服務。

        4.1 用戶圖書服務信息

        用戶U1是目標用戶,即推薦服務的對象。近一個月內(nèi)用戶U2-U5與目標用戶U1有部分相同的借閱書籍。對用戶U2-U5的圖書借閱記錄進行分析,以發(fā)現(xiàn)目標用戶U1的當前需求。5位用戶U2-U5近一個月內(nèi)圖書借閱目錄如表2所示,他們共借閱8本圖書b1-b8。用戶對圖書的評分如圖2所示,由于目標用戶U1未借閱圖書b5-b8,故對b5-b8的評分用“?”表示。評分分數(shù)有1、2、3、4、5五種,根據(jù)評分判斷用戶情感,若用戶對圖書的評分大于等于3分,則將用戶對該圖書的情感歸為“正向”類,否則歸為“負向”類。將圖2用戶-圖書評分矩陣轉換為圖3用戶-圖書情感矩陣,用表情圖表示正向和負向情感。圖3展現(xiàn)了用戶對圖書的顯性情感。

        表2 用戶圖書借閱目錄

        圖2 用戶-圖書評分矩陣

        圖3 用戶-圖書情感矩陣

        個性化智能圖書推薦服務兼顧用戶的顯性興趣和潛在需求,首先提取目標用戶顯性興趣,基于興趣進行推薦,然后應用機器學習算法挖掘目標用戶對圖書資源的隱性情感,克服情感缺失,發(fā)現(xiàn)用戶當前潛在需求,進行基于需求的推薦,最終為目標用戶提供符合興趣且以滿足潛在需求為主的圖書推薦。

        4.2 個性化興趣提取

        由圖3可見,目標用戶U1對圖書b1-b4表達了顯性情感。U1對圖書b1、b2、b3的情感是正向的,說明他對這3本圖書有顯性興趣,而U1對圖書b4的情感為負向,說明他對圖書b4缺乏興趣,如表3所示。

        表3 目標用戶的個性化興趣和需求

        4.3 基于機器學習的個性化需求發(fā)現(xiàn)

        在眾多機器學習算法中,樸素貝葉斯算法(Naive Bayes Algorithm,NBA)是一種簡單有效且應用廣泛的監(jiān)督學習算法[15]。它基于概率論,具有數(shù)學基礎堅實、分類效率穩(wěn)定、對缺失數(shù)據(jù)敏感性不高等優(yōu)點。在近期借閱記錄數(shù)據(jù)上訓練得到的樸素貝葉斯分類器可以預測用戶對圖書的隱性情感,進而發(fā)現(xiàn)用戶的當前圖書需求。

        樸素貝葉斯算法的思想和過程如下[11]。假設類別標記集合C={ci} (i=1, 2, …, n),樣本a有m個屬性aj(j=1,2, …, m),樸素貝葉斯分類器采用“屬性條件獨立假設”,按公式(1)計算類條件概率P(ci|a):

        選擇能使P(ci|a)最大的類別標記作為樣本a的分類。由于P(a)對每個類別都相同,貝葉斯判定準則見公式(2):

        訓練樸素貝葉斯分類器的過程就是根據(jù)訓練數(shù)據(jù)集來估計類先驗概率P(ci),并為每個屬性估計條件概率P(aj|ci)。

        表4 個性化智能圖書推薦列表

        應用樸素貝葉斯算法,根據(jù)圖3所示的用戶-情感矩陣預測目標用戶U1對未評分圖書b5-b8的隱性情感,即判別隱性情感類別。情感分為“正向”和“負向”兩類,類別標記集合C={C1=正,C2=負}。屬性aj(j=1, 2, …, 8)表示對圖書bj的情感,例如,用戶U5對圖書b1情感是“負向”,則用戶U5這個樣本在a1的屬性值是“負”。由樸素貝葉斯算法判別得到目標用戶U1對圖書b5-b8的隱性情感依次是“正向”“正向”“正向”“負向”。U1對圖書b5、b6、b7具有正向的隱性情感,說明U1對這3本圖書具有潛在需求(如表3所示)。

        4.4 個性化智能圖書推薦結果

        個性化智能圖書推薦列表如表4所示,由基于個性化興趣的推薦和基于個性化需求的推薦兩部分組成,共9本圖書。

        由表3可知,目標用戶對于圖書b1、b2、b3具有個性化興趣。采用基于圖書的協(xié)同過濾得到與b1、b2、b3相似的3本圖書,包括《新編數(shù)據(jù)結構案例教程》《數(shù)據(jù)結構精講與習題詳解(C語言版)》和《離散數(shù)學及其應用》,將其作為基于興趣的推薦結果。

        由表3可知,目標用戶對于圖書b5、b6、b7具有個性化需求。首先,將目標用戶U1具有潛在需求的3本圖書b5、b6、b7,即《你也能看得懂的Python算法書》《精通數(shù)據(jù)科學算法》《機器學習:算法視角》加入表4基于個性化需求的推薦部分。其次,通過協(xié)同過濾得到與圖書b5、b6、b7相似的3本算法類和機器學習類圖書《Python算法指南》《面向數(shù)據(jù)挖掘的算法設計與分析》和《機器學習案例實戰(zhàn)》,也將其加入表4基于個性化需求的推薦部分。

        表4所示的推薦列表不僅考慮到了用戶個性化顯性興趣,更洞察了用戶對圖書的隱性情感,為其推薦滿足當前個性化潛在需求的圖書,因此獲得了目標用戶的高滿意度。

        5 結語

        機器學習是人工智能最重要的分支之一,已經(jīng)有效應用于互聯(lián)網(wǎng)搜索、醫(yī)學數(shù)據(jù)分析、客戶信息分析、天氣預報等諸多領域,也必將在智能圖書館建設和圖書館智能服務構建中發(fā)揮重要作用。本文對應用機器學習技術構建圖書館個性化智能推薦服務進行探討,提出了基于機器學習的個性化智能推薦服務方案,以傳統(tǒng)統(tǒng)計分析、協(xié)同過濾、關鍵字提取等方法從用戶數(shù)據(jù)發(fā)現(xiàn)個性化顯性興趣,以機器學習方法進行用戶的個性化當前需求挖掘、需求特征識別、需求趨勢分析等,為用戶提供合乎興趣而又滿足潛在需求的智能推薦服務。最后給出圖書推薦服務的案例,應用經(jīng)典機器學習算法之一的樸素貝葉斯算法在近期借閱記錄中提取顯性化興趣并發(fā)現(xiàn)當前潛在需求,為用戶高滿意度的個性化智能推薦服務。

        猜你喜歡
        圖書館智能情感
        如何在情感中自我成長,保持獨立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        如何在情感中自我成長,保持獨立
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        飛躍圖書館
        精品av天堂毛片久久久| 国产小车还是日产的好| 激情综合网缴情五月天| 精品亚洲一区二区三洲| 大香蕉av一区二区三区| 久久无码潮喷a片无码高潮 | 水蜜桃无码视频在线观看| a级福利毛片| 精品久久久久久99人妻| 国产三级精品三级在线| 日本一区二区三区爱爱视频| 亚洲日韩精品a∨片无码加勒比 | 精品久久杨幂国产杨幂| 亚洲区福利视频免费看| 日本中文一区二区在线| 午夜精品久久久久久99热| 亚洲经典三级| 中文字幕经典一区| 免费无码AⅤ片在线观看| 亚洲中文字幕第15页| 伊人久久大香线蕉av色| 中文字幕精品一区二区2021年 | 精品国产亚洲av麻豆尤物| 黄片一级二级三级四级| 国产精品人妻熟女男人的天堂| 久久国产精品一国产精品金尊| 老司机亚洲精品影院| 97免费人妻在线视频| 欧美性一区| 国产精品久久夜伦鲁鲁| 顶级高清嫩模一区二区| 色婷婷一区二区三区四区成人网| 亚洲av无码久久精品狠狠爱浪潮 | 国产一区资源在线播放| 亚洲欧美色一区二区三区| 丰满多毛的大隂户视频| 久久青青草原国产精品最新片| 一级内射免费观看视频| 久久国产劲爆∧v内射| 国产女女精品视频久热视频| 国产亚洲精品国产福利在线观看|