亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用關聯(lián)規(guī)則挖掘技術(shù)實現(xiàn)數(shù)字圖書館個性化推薦服務

        2020-12-23 02:02:40李冬云
        蘭臺內(nèi)外 2020年23期
        關鍵詞:Apriori算法個性化服務關聯(lián)規(guī)則

        李冬云

        摘 要:從數(shù)字挖掘的定義出發(fā),分析利用關聯(lián)規(guī)則挖掘技術(shù)實現(xiàn)數(shù)字圖書館個性化推薦服務的必要性,介紹關聯(lián)規(guī)則的具體實現(xiàn)原理和求解過程。基于此,詳細介紹了關聯(lián)規(guī)則中的Apriori算法如何分析用戶歷史借閱記錄,挖掘出潛在的有針對性的有用信息,選擇出最適合推薦的圖書推薦給讀者,實現(xiàn)在數(shù)字圖書館環(huán)境下為讀者提供個性化服務。

        關鍵詞:數(shù)字圖書館;數(shù)據(jù)挖掘;關聯(lián)規(guī)則;Apriori算法;個性化服務

        數(shù)字圖書館作為一個電子化信息的倉儲,具有信息量大、更新速度快、信息存儲和用戶訪問不受地域限制等特點,給人們帶來了許多方便和快捷,但人們也深受其龐大且形式多樣的信息資源的困擾。由于存儲在計算機文件和數(shù)據(jù)庫中的數(shù)據(jù)量不斷增加,而用戶卻希望能夠從龐大的數(shù)據(jù)中獲得有針對性的有用信息,數(shù)據(jù)挖掘就應運而生了。近幾年,數(shù)據(jù)挖掘技術(shù)逐漸應用于數(shù)字圖書館領域,提高了數(shù)字圖書館的服務功能。本文探討了如何利用數(shù)據(jù)挖掘技術(shù)中的關聯(lián)規(guī)則Apriori算法對讀者的歷史閱讀情況進行分析,通過分析讀者的信息行為以及他們的需求特征,得出讀者的興趣偏好,從而為讀者提供個性化推薦服務。

        一、關聯(lián)規(guī)則挖掘的定義

        數(shù)據(jù)挖掘最早由Gregory Piatetsky-Shapir提出,它是從大量的、不完整的、有噪聲的、模糊的數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的,但是又是可信的、潛在的和有價值的信息和知識的過程。數(shù)據(jù)挖掘是在統(tǒng)計學、人工智能和數(shù)據(jù)庫技術(shù)的基礎上發(fā)展起來的一門多學科交叉的新技術(shù),本文主要是從數(shù)據(jù)庫的觀點來理解數(shù)據(jù)挖掘,指的是從存儲在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其它信息倉庫中的大量數(shù)據(jù)中發(fā)現(xiàn)有用的知識的過程。數(shù)據(jù)挖掘主流的技術(shù)方法有很多,其中非常重要的方法之一就是關聯(lián)規(guī)則,它是由R.Agrawal等人于1993年首先提出,通過從大量數(shù)據(jù)中的項集之間發(fā)現(xiàn)有趣的關聯(lián)或相關,從而達到認識事物客觀規(guī)律的技術(shù)方法。關聯(lián)是指存在于兩個或多個變量的取值之間的某種規(guī)律性,關聯(lián)規(guī)則就是尋找在同一個事件中出現(xiàn)的不同項的相關性的技術(shù)方法。

        二、利用關聯(lián)規(guī)則挖掘技術(shù)實現(xiàn)數(shù)字圖書館個性化推薦服務的必要性

        隨著網(wǎng)絡圖書館、數(shù)字圖書館等技術(shù)在圖書館中廣泛應用,圖書館的管理理念和服務方式都發(fā)生了重大的變化。堅持“以人為本”的服務理念,更好地發(fā)揮圖書館的館藏服務職能,努力提高讀者的滿意度等,仍然是圖書館新的發(fā)展方向和工作原則。1979年,美國學者舒曼提出“圖書館和信息提供者應該提供迎合個人需求的新服務”的觀點,這就是個性化信息服務,也就是圖書館的服務方式不再是“圖書館提供什么,讀者就接受什么”,而是更注重“讀者需要什么,圖書館就提供什么”,重點考慮讀者的興趣和主動性這兩個方面。

        如今,數(shù)字圖書館雖然能為讀者提供豐富的資源,但是也使讀者面臨著如何從這些海量信息資源中獲得具有針對性的有用信息的困擾。不同讀者的信息需求具有多樣化的特點,單個用戶不可能需要所有信息資源,信息也不能夠滿足所有讀者的需求,錯綜復雜的信息之間存在著某種關系。借閱的圖書與圖書之間、讀者和圖書之間也可能存在一定的關系?,F(xiàn)有的圖書館管理系統(tǒng)還無法找到圖書館大量統(tǒng)計數(shù)據(jù)之間的關系和規(guī)律,因此無法精準預測讀者的信息需求,限制了讀者順利找到所需信息資源。這就需要我們利用數(shù)據(jù)挖掘的方法,來充分揭示這些數(shù)據(jù)背后所隱藏的關系。關聯(lián)規(guī)則挖掘通過分析讀者的歷史借閱數(shù)據(jù),發(fā)現(xiàn)讀者的借閱模式,預測讀者的閱讀偏好情況,再及時主動地向讀者提供符合讀者需求的個性化推薦服務。

        三、關聯(lián)規(guī)則挖掘的原理

        1.關聯(lián)規(guī)則中涉及的重要概念

        定義3-1? 設項的集合I={I1,I2,…,Im}(其中Ij稱為項,包含k個項的項集稱為k-項集)和事務集D={t1,t2,…,tm},其中ti={Ii1,Ii2,…,Iik}并且Iij∈I,即D中的每個事務都是I的子集。關聯(lián)規(guī)則是形如A?B的蘊含式,其中A?I,B?I是兩個項目集合,稱為項目集,并且A∩B=?(即項集A和項集B不能相交)。

        定義3-2? 項集A的支持度support(A)是事務D中支持A的事物數(shù)占庫中所有事務的百分比。即support(A)=count(A)/D*100%.

        定義3-3? 如果項集A的支持度support(A)不小于用戶指定的最小支持度閾值minsup,則稱A為頻繁項集,否則稱A為非頻繁項集。

        定理3-1? 假設X?I,Y?I是兩個項目集合。

        若X?Y,則support(X)≥support(Y);

        若X?Y,如果X是非頻繁項集,則Y也是非頻繁

        項集;

        若X?Y,如果Y是頻繁項集,則X也是頻繁項集。

        定義3-4? 關聯(lián)規(guī)則A?B的支持度是數(shù)據(jù)庫中包含A∪B的事務數(shù)占庫中所有事務的百分比,記為:support(A?B)。即:support(A?B)=count(A∪B)/D*100%.

        關聯(lián)規(guī)則A?B的置信度(或強度)是包含A∪B的事務數(shù)和包含A的事務數(shù)的比值,記為:confidence(A?B)。即:confidence(A?B) =count(A∪B)/count(A)*100%.

        定義3-5? 如果support(A?B)≥minsup且confidence(A?B)≥minconf,(其中minconf為用戶指定的最小置信度閾值)。則稱關聯(lián)規(guī)則A?B為強關聯(lián)規(guī)則,否則稱關聯(lián)規(guī)則A?B為弱關聯(lián)規(guī)則。

        2.關聯(lián)規(guī)則挖掘求解過程

        關聯(lián)規(guī)則挖掘目的是發(fā)現(xiàn)強關聯(lián)規(guī)則,也就是從數(shù)據(jù)庫中挖掘出滿足最小支持度minsup和最小置信度minconf的關聯(lián)規(guī)則。其中,minsup和minconf是根據(jù)數(shù)據(jù)情況和用戶需要設定。minsup表示項集在統(tǒng)計意義上需滿足的最低程度,minconf反映關聯(lián)規(guī)則需滿足的最低可靠度。關聯(lián)規(guī)則挖掘通過找出數(shù)據(jù)庫中的所有頻繁項集,再由頻繁項集找出關聯(lián)規(guī)則。

        猜你喜歡
        Apriori算法個性化服務關聯(lián)規(guī)則
        淺析移動時代的圖書館發(fā)展策略
        青年時代(2016年30期)2017-01-20 02:26:57
        基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
        互聯(lián)網(wǎng)思維下數(shù)字圖書館個性化服務建設研究
        需求理論在高校圖書館就業(yè)服務中的應用研究
        基于Apriori算法的高校學生成績數(shù)據(jù)關聯(lián)規(guī)則挖掘分析
        基于云平臺MapReduce的Apriori算法研究
        關聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學質(zhì)量評價體系中的應用
        關聯(lián)規(guī)則挖掘Apriori算法的一種改進
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關聯(lián)規(guī)則的計算機入侵檢測方法
        亚洲国产精品成人久久久 | 国产aⅴ天堂亚洲国产av| 偷拍一区二区三区在线观看| 亚洲最大一区二区在线观看| 亚洲国产精品久久电影欧美| 天堂在线www中文| 亚洲av永久无码精品成人| 亚洲肥婆一区二区三区| 亚洲av高清在线观看一区二区| 亚洲av无码专区国产乱码不卡 | 久久红精品一区二区三区| 久久视频在线| av中文字幕不卡无码| 青青草免费在线视频导航| 亚洲中文字幕人妻久久| 亚洲精品乱码久久久久久日本蜜臀| 天天狠狠综合精品视频一二三区| 国产91熟女高潮一曲区| 日韩精品久久中文字幕| 国产69精品久久久久999小说| 久久99久久久无码国产精品色戒| 日韩精品自拍一区二区| 日日摸夜夜添夜夜添高潮喷水| 人人添人人澡人人澡人人人人| 午夜精品久视频在线观看| 免费看av网站在线亚洲| 国内精品伊人久久久久网站| 亚洲人免费| 青青草最新在线视频观看| 女人无遮挡裸交性做爰| 国产乱子乱人伦电影在线观看| 国产精品国三级国产av| 国产一区二区精品人妖系列在线| 18禁无遮拦无码国产在线播放 | 精品乱码一区内射人妻无码| 杨幂AV污网站在线一区二区| 国产青青草自拍视频在线播放| 狠狠综合久久av一区二区蜜桃| 欧美天欧美天堂aⅴ在线| 狠狠色噜噜狠狠狠狠97俺也去| 日本一区二区免费在线看|