亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘在電子政務(wù)中的應(yīng)用

        2013-08-28 06:03:20
        關(guān)鍵詞:項集置信度電子政務(wù)

        王 昭

        (中國人壽保險股份有限公司河北省分公司,河北石家莊 050000)

        隨著近年來網(wǎng)絡(luò)的普及和應(yīng)用,電子政務(wù)已經(jīng)被越來越多的企事業(yè)單位、政府機構(gòu)所應(yīng)用。然而海量的信息使得用戶難以快速找到需要的信息,因此如何根據(jù)用戶的訪問興趣來進行個性化推薦,更加有針對性的滿足用戶的需求,從而提供個性化服務(wù)變得非常重要。數(shù)據(jù)挖掘(Data Mining,DM)是從大量模糊的、不確定的、不完全的數(shù)據(jù)中揭示隱含的、先前未知的并有潛在價值的信息的非平凡過程。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、機器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)、數(shù)據(jù)庫、可視化技術(shù)等,高度自動化地分析用戶數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的、有意義的模式。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中比較重要的一種算法。它通過挖掘數(shù)據(jù)項集之間的潛在關(guān)系,從在大量數(shù)據(jù)中發(fā)現(xiàn)有用的知識,這些知識對于用戶分析、知識分類、個性推薦等決策的制定起到了很大的作用。本文針對電子政務(wù)系統(tǒng)的個性化推薦服務(wù)的弊端,提出利用數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則及其改進算法實現(xiàn)個性化推薦,以提高電子政務(wù)應(yīng)用效率。

        1 關(guān)聯(lián)規(guī)則算法

        關(guān)聯(lián)規(guī)則挖掘是從大量數(shù)據(jù)項中發(fā)現(xiàn)有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。設(shè)I={i1,i2,…,im}是項的集合,其中的元素稱為項(item)。記D為交易T的集合,這里交易T是項的集合,并且T?I。對應(yīng)每一個交易有唯一的標(biāo)識,如交易號(TID)。設(shè)X是一個I中項的一個集合,如果X?T,那么稱交易T包含X。

        一個關(guān)聯(lián)規(guī)則是形如X?Y的蘊涵式,這里X?I,Y?I,并且X∩Y=Φ。規(guī)則X?Y在事物數(shù)據(jù)庫D中的支持度(support)是事物集中包含X和Y的事物數(shù)與所有事物數(shù)之比,記為support(X?Y),即

        規(guī)則X?Y在事物集中的可信度(confidence)是指包含X和Y的事務(wù)數(shù)與包含X的事物數(shù)之比,記為confidence(X?Y),即:

        2 關(guān)聯(lián)規(guī)則在電子政務(wù)網(wǎng)站中的應(yīng)用

        用戶使用電子政務(wù)系統(tǒng)都會有相對固定的瀏覽路徑。每個瀏覽路徑都代表了一個完整的用戶行為,從用戶角度看,這些瀏覽路徑滿足了用戶這次的辦公或查詢需求,而從政府管理部門的角度看,這些瀏覽路徑有可能被再一次同時點擊。當(dāng)然僅僅通過一個用戶行為所反映出來的信息關(guān)聯(lián)不具有普遍性,但是通過大量的用戶行為分析,就可以整理出那些隱藏在大量數(shù)據(jù)中令人感興趣的聯(lián)系,從而展開各種個性推薦。

        所謂關(guān)聯(lián),可以理解為用戶行為中出現(xiàn)的所有點擊路徑,因為這些點擊路徑出現(xiàn)在同一個用戶行為中,我們就可以認(rèn)為這些點擊中具有某種聯(lián)系。關(guān)聯(lián)規(guī)則就是發(fā)現(xiàn)的聯(lián)系,可以用規(guī)則A→B(S,C)的形式表示,也就是說,用戶一旦點擊了A功能或信息,他極有可能會點擊B功能或路徑。支持度和置信度就是衡量指標(biāo),是用來描述規(guī)則強度的,支持度代表事件發(fā)生的頻率,支持度很低也就是意味著這種事件只是偶爾發(fā)生,是個小概率事件,因此,對于關(guān)聯(lián)分析的第一步,就是用支持度過濾掉那些偶然事件。置信度代表著利用這個規(guī)則進行推理的可信程度。置信度越大,表示可能被關(guān)聯(lián)點擊的程度越高。

        說的簡單一點,關(guān)聯(lián)規(guī)則就是在給定的事務(wù)集中,挖掘出支持度(support)和置信度(confidence)分別大于用戶給定的最小支持度(minsupp)和最小置信度(minconf)的規(guī)則。

        3 實例分析

        本文以某電子政務(wù)網(wǎng)站為例,利用關(guān)聯(lián)規(guī)則算法進行分析。因為系統(tǒng)數(shù)據(jù)庫數(shù)量比較大,本文只選取其中的一部分?jǐn)?shù)據(jù)進行分析。用戶行為路徑數(shù)據(jù)如表1所示,其中ABCDEF分別代表不同信息的路徑,設(shè) minsup=0.5,minconf=0.5。關(guān)聯(lián)規(guī)則挖掘過程主要包含兩個階段:第一階段利用支持度尋找頻繁項目集,第二階段再由這些頻繁項目集產(chǎn)生關(guān)聯(lián)規(guī)則。

        首先對表1中的相關(guān)數(shù)據(jù)進行挖掘,得到候選1項集如表2所示。

        其中第一條記錄A的支持度為0.75,這是因為在表1中共有3條記錄包含A,表1中共有4條事件記錄,所以A的支持度為3/4=0.75,大于預(yù)設(shè)的最小支持度0.5,所以保留A作為頻繁1項集中的一條記錄。表2中的其它記錄也可以類似得到。對候選1項集C1的篩選,可得頻繁1項集L1。

        對頻繁1項集分析很簡單,卻提供了很多有價值的信息,可以對那些初次到訪的用戶提供熱門的內(nèi)容推薦。除了提供熱門信息列表,頻繁1項集分析根據(jù)支持度過濾掉了非熱門信息,減少了做對頻繁2項集分析的運算量。

        頻繁1項集L1經(jīng)過“連接”和“剪枝”,得到候選2項集C2。如表4所示。

        因為最小支持度是0.5,所以舍棄所有支持度小于0.5的項集,只剩下了A->C,并且所有出現(xiàn)了A的三個訂單中,同時出現(xiàn)C的有兩個,因此置信度是2/3=0.67。

        表1 用戶行為路徑數(shù)據(jù)表

        表2 候選1項集C1

        表3 頻繁1項集L1

        表4 候選2項集C2

        A->C的支持度等于0.5,也就是說在所有的用戶行為信息中,至少有50%的行為信息出現(xiàn)了A和C被同時點擊。而Confidence=0.67則說明在所有點擊A的行為信息中,至少有67%的行為會同時點擊C。因此,今后若有某用戶點擊了A,電子政務(wù)系統(tǒng)將同時推薦C。因為歷史交易數(shù)據(jù)告訴我們,大部份點擊A的用戶行為中,會同時點擊C。

        5 結(jié)論

        本文利用數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則算法對用戶訪問信息進行挖掘,有效的實現(xiàn)了電子政務(wù)的個性化推薦,達到了預(yù)期的效果。

        [1]Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large database[C]∥In Proc.1993 ACM - SIGMOD Int.conf.Management of Data(SIGMOD’93).Washington,DC:[s.n.],1993:207-216.

        [2]劉晶.基于數(shù)據(jù)倉庫的高校圖書館管理的設(shè)計與實現(xiàn)[J].圖書情報工作,2009.15(53).126-128.

        [3]劉晶,朱清香,梅群,張蕾.一種基于單處理機的并行關(guān)聯(lián)規(guī)則算法及其在數(shù)字圖書館中的應(yīng)用[J].圖書情報工作,2011,7(55):114-117.

        [4]劉晶,楊萬成.基于簡易聚合技術(shù)對電子商務(wù)個性檢索的應(yīng)用[J].計算機工程與設(shè)計,2008.29(1):173-174.

        猜你喜歡
        項集置信度電子政務(wù)
        硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
        論基于云的電子政務(wù)服務(wù)平臺構(gòu)建
        正負(fù)關(guān)聯(lián)規(guī)則兩級置信度閾值設(shè)置方法
        電子政務(wù)工程項目績效評價研究
        中國電子政務(wù)的“短板”
        置信度條件下軸承壽命的可靠度分析
        軸承(2015年2期)2015-07-25 03:51:04
        關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        一種頻繁核心項集的快速挖掘算法
        計算機工程(2014年6期)2014-02-28 01:26:12
        試論基于Petri網(wǎng)的電子政務(wù)系統(tǒng)
        多假設(shè)用于同一結(jié)論時綜合置信度計算的新方法?
        性无码免费一区二区三区在线| 亚洲视频中文字幕更新| 97久久久一区二区少妇| 国产一区二区黄色的网站| 一本久道综合色婷婷五月| 伊人久久大香线蕉av网禁呦| 大地资源中文在线观看官网第二页| 国产精品国产自线拍免费| 国产精品亚洲最新地址| 富婆猛男一区二区三区| 丁香美女社区| 国产午夜视频在线观看| 亚洲无码图| 国产av一级二级三级| 亚洲av片无码久久五月| 色 综合 欧美 亚洲 国产| 亚洲国产理论片在线播放| 99久久精品国产亚洲av天| 中文字幕日韩精品永久在线| 久久亚洲av无码精品色午夜| 国产精品ⅴ无码大片在线看 | 精品亚洲一区二区视频| 最新在线观看免费的a站国产| 狠狠躁18三区二区一区| 国产全肉乱妇杂乱视频 | 西西人体444www大胆无码视频| 亚洲动漫成人一区二区| 最新国产主播一区二区| 亚洲第一幕一区二区三区在线观看| 国产激情无码一区二区三区| 精品国产v无码大片在线观看| 无码三级国产三级在线电影| 激情五月天在线观看视频| 人妻精品久久久久中文字幕69| 亚洲永久无码7777kkk| 久久久99久久久国产自输拍 | 免费va国产高清不卡大片| 亚洲长腿丝袜中文字幕| 欲求不満の人妻松下纱荣子 | 日韩在线永久免费播放| 久久精品99久久香蕉国产色戒 |