亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘中的隱私保護(hù)技術(shù)研究

        2008-12-31 00:00:00龔惠群
        商場(chǎng)現(xiàn)代化 2008年22期

        [摘要] 數(shù)據(jù)挖掘中的隱私保護(hù)問(wèn)題近年來(lái)得到了廣泛研究。本文首先分析了在數(shù)據(jù)挖掘中進(jìn)行隱私保護(hù)的必要性,隨后對(duì)隱私保護(hù)的主要技術(shù)進(jìn)行了研究,最后指出了數(shù)據(jù)挖掘領(lǐng)域中隱私保護(hù)方法未來(lái)的主要研究方向。

        [關(guān)鍵詞] 數(shù)據(jù)挖掘 隱私保護(hù) 知識(shí)發(fā)現(xiàn)

        一、引言

        在當(dāng)今社會(huì),企業(yè)、政府,以及各類研究機(jī)構(gòu)所收集的海量數(shù)據(jù)已被認(rèn)為是一項(xiàng)重要的資源。如何對(duì)這些數(shù)據(jù)進(jìn)行有效分析與處理,將其轉(zhuǎn)換為對(duì)決策過(guò)程有用的各種知識(shí),是當(dāng)前信息管理領(lǐng)域面臨的重要問(wèn)題。數(shù)據(jù)挖掘,也稱為知識(shí)發(fā)現(xiàn),主要研究如何從大規(guī)模的數(shù)據(jù)中抽取非平凡的、有潛在使用價(jià)值的知識(shí),近年來(lái)在眾多領(lǐng)域都得到廣泛的研究與應(yīng)用。

        然而數(shù)據(jù)挖掘技術(shù)在應(yīng)用過(guò)程中也出現(xiàn)了一些問(wèn)題,隱私保護(hù)就是近年來(lái)所出現(xiàn)的一類重要問(wèn)題。主要體現(xiàn)在兩個(gè)方面:一方面,供各種挖掘方法使用的數(shù)據(jù)庫(kù)中存儲(chǔ)了大量的敏感信息,其中有些信息是在個(gè)人無(wú)意識(shí)甚至是不知情的情況下被收集的,而網(wǎng)絡(luò)及其他媒體對(duì)信息的無(wú)限制暴露,已經(jīng)開(kāi)始對(duì)個(gè)人隱私構(gòu)成嚴(yán)重威脅;另一方面,各種數(shù)據(jù)挖掘方法與工具的不斷完善,也為一些普通用戶通過(guò)不正當(dāng)手段(如對(duì)信息進(jìn)行推論)獲取他人隱私信息提供了可能。如何對(duì)數(shù)據(jù)進(jìn)行有效的挖掘,并同時(shí)保證個(gè)人的相關(guān)隱私不被泄漏,成為近年來(lái)數(shù)據(jù)挖掘領(lǐng)域的一個(gè)研究熱點(diǎn)。

        二、隱私保護(hù)方法的研究維度

        隱私保護(hù)技術(shù)近年來(lái)出現(xiàn)了大量的新方法和新技術(shù)。主要可以從以下的四個(gè)維度進(jìn)行研究:

        1.數(shù)據(jù)分布方式。數(shù)據(jù)挖掘的數(shù)據(jù)一般可分為集中和分布式兩種,分布式數(shù)據(jù)又可以分為水平和垂直分布兩種。水平分布指數(shù)據(jù)按記錄分布在不同的站點(diǎn),垂直分布指數(shù)據(jù)按屬性分布在不同的站點(diǎn)。不同的數(shù)據(jù)分布形式會(huì)影響隱私保護(hù)算法的設(shè)計(jì)。

        2.數(shù)據(jù)修改方法。數(shù)據(jù)修改指根據(jù)組織的隱私保護(hù)政策,在發(fā)布數(shù)據(jù)之前,對(duì)原始數(shù)據(jù)進(jìn)行適當(dāng)?shù)男薷?,達(dá)到保護(hù)這些數(shù)據(jù)的目的。常用的修改方法包括隨機(jī)化處理、數(shù)據(jù)加密、數(shù)據(jù)過(guò)濾和數(shù)據(jù)抽樣等。

        3.數(shù)據(jù)挖掘算法。目前數(shù)據(jù)挖掘的算法主要可以分為關(guān)聯(lián)分析、序列分析、分類、聚類,以及異常檢測(cè)等幾個(gè)類別。根據(jù)這個(gè)維度,相應(yīng)的隱私保護(hù)算法也可分為這幾大類。

        4.數(shù)據(jù)與規(guī)則隱藏。即隱私保護(hù)算法是隱藏原始數(shù)據(jù)還是隱藏挖掘的各種規(guī)則。由于規(guī)則大多是對(duì)數(shù)據(jù)進(jìn)行分析得到,因此各種規(guī)則比原始數(shù)據(jù)的抽象層次高、更具有價(jià)值,保護(hù)敏感規(guī)則有時(shí)比保護(hù)原始數(shù)據(jù)更重要。

        三、隱私保護(hù)的主要技術(shù)

        為保護(hù)敏感信息,常見(jiàn)的方法就是對(duì)數(shù)據(jù)進(jìn)行分片保存,對(duì)數(shù)據(jù)進(jìn)行水平分割或者垂直分割。水平分割指在每個(gè)節(jié)點(diǎn)上都保留原始數(shù)據(jù)的部分完整記錄,各節(jié)點(diǎn)數(shù)據(jù)匯總即得到完整的原始數(shù)據(jù)。垂直分割指將對(duì)象的屬性數(shù)據(jù)進(jìn)行分割,在不同的節(jié)點(diǎn)上保存對(duì)象的部分屬性數(shù)據(jù)。

        對(duì)于上述兩種數(shù)據(jù)分布形式,隱私保護(hù)的數(shù)據(jù)挖掘算法要求各節(jié)點(diǎn)在不知道對(duì)方數(shù)據(jù)的基礎(chǔ)上即能完成各種挖掘任務(wù)。文獻(xiàn)[1]中實(shí)現(xiàn)了數(shù)據(jù)水平分布時(shí)的隱私保護(hù)分類挖掘算法;文獻(xiàn)[2]提出一種在數(shù)據(jù)垂直分布情況下的隱私保護(hù)分類挖掘算法;文獻(xiàn)[3]則提出一個(gè)從垂直分割的數(shù)據(jù)中挖掘全局關(guān)聯(lián)規(guī)則的隱私保護(hù)算法。

        另外,對(duì)原始數(shù)據(jù)進(jìn)行抽樣、過(guò)濾或有目的的修改,也能有效保護(hù)隱私。在隱私保護(hù)中,推論問(wèn)題是一個(gè)重要的研究?jī)?nèi)容,指普通用戶使用相關(guān)的數(shù)據(jù)挖掘技術(shù),通過(guò)不斷改變算法的參數(shù),從結(jié)果中推斷出未經(jīng)授權(quán)的他人隱私信息。

        在數(shù)據(jù)庫(kù)中建立隱私約束規(guī)則可以限制用戶發(fā)現(xiàn)或者訪問(wèn)某些形式的規(guī)則,從而保護(hù)相關(guān)的隱私。使用數(shù)據(jù)抽樣方法,每次僅使用隨機(jī)得到的部分?jǐn)?shù)據(jù)參與挖掘,這樣可以避免惡意的窮舉式訪問(wèn)竊取相關(guān)隱私信息。

        對(duì)數(shù)據(jù)進(jìn)行隨機(jī)化修改也稱為數(shù)值變形(Value Distortion),在時(shí)間序列數(shù)據(jù)挖掘中經(jīng)常被使用。該方法對(duì)每個(gè)原始數(shù)據(jù)加上一個(gè)隨機(jī)干擾,其中服從某種統(tǒng)計(jì)分布。在此基礎(chǔ)上,使用新的數(shù)據(jù)替代進(jìn)行各種挖掘分析。由于使用數(shù)據(jù)進(jìn)行各種挖掘分析,并且普通用戶通常無(wú)法確認(rèn)隨機(jī)干擾的確切分布形式,因而該方法可有效防止對(duì)原始數(shù)據(jù)的惡意推斷。因此在時(shí)間序列數(shù)據(jù)挖掘中,提出對(duì)噪聲不敏感的挖掘算法,對(duì)于隱私保護(hù)而言同樣具有重要的意義。

        四、未來(lái)的主要研究方向

        1.高性能的方法:提出具有優(yōu)良性能的相關(guān)方法,包括時(shí)間性能與空間開(kāi)銷,以及網(wǎng)絡(luò)開(kāi)銷。

        2.高準(zhǔn)確度的方法:盡可能完整地生成相應(yīng)規(guī)則,而不遺漏重要規(guī)則,并且所生成規(guī)則的準(zhǔn)確度也不應(yīng)有明顯的降低。

        3.保護(hù)程度更高級(jí)的方法:應(yīng)當(dāng)具有較高的保護(hù)級(jí)別。

        4.適用于分布環(huán)境的方法:隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,如何在分布式環(huán)境下進(jìn)行各種隱私保護(hù)的數(shù)據(jù)挖掘,也將是一個(gè)重要的研究方向。

        參考文獻(xiàn):

        [1]Lindell Y, Pinkas B. Privacy preserving data mining[C]. Proceedings of the 20th AICCAC, 2000, Santa Barbara, USA, 36–54

        [2]Du W L, Zhan Z J. Building decision tree classifier on private data. Proceedings of the ICDM, 2002, Maebashi City, Japan, 1-8

        [3]Vaidya J, Clifton C. Privacy Preserving Association rule mining in vertically partitioned data[C]. Proceedings of the 8th SIGKDD, 2002, Edmonton,Canada, 639-644

        [4]李蒙宋翰濤:數(shù)據(jù)挖掘中隱私保護(hù)的隨機(jī)化處理方法.計(jì)算機(jī)工程與科學(xué), 2005, 27(2): 58-59

        [5]黃超朱揚(yáng)勇:基于回歸系數(shù)的時(shí)間序列維約簡(jiǎn)與相似性查找. 模式識(shí)別與人工智能, 2006, 19(1): 52-57

        中文字幕亚洲五月综合婷久狠狠| 在线观看播放免费视频| 男女扒开双腿猛进入免费看污| 97欧美在线| 日本免费一区二区三区在线看| 国产精品98福利小视频| 日韩精品一区二区三区中文9| 亚洲一区二区日韩在线| 久久精品免费视频亚洲| 国产精品一区二区三区专区| 加勒比hezyo黑人专区| 亚洲av无码乱码国产精品| 免费无码黄动漫在线观看| 亚洲精品无码高潮喷水在线| 真实国产乱视频国语| 国产精品久久婷婷婷婷| 亚洲二区三区四区太九| 麻豆成年人视频在线观看| 亚洲av专区国产一区| 无码国产精品一区二区免费式芒果| 欧美猛少妇色xxxxx猛交| 性色av浪潮av色欲av| 久久久精品波多野结衣| 亚洲不卡无码高清视频| 久天啪天天久久99久孕妇| 亚洲一区二区三区ay| 日本一二三区免费在线| 98色婷婷在线| 国产女女精品视频久热视频| 亚洲欧美日韩综合在线观看| 亚洲国产成人aⅴ毛片大全| 日韩精品一区二区免费| 欧美丰满少妇xxxx性| 大地资源在线播放观看mv| 欧亚精品无码永久免费视频| 日本高清色一区二区三区| 久久久精品中文字幕麻豆发布 | 后入到高潮免费观看| 亚洲av成人一区二区三区| 91视频香蕉| 国产精品欧美成人片|