亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        XML信息共享中隱私保護(hù)技術(shù)研究

        2010-10-16 01:50:58門(mén)愛(ài)華秦曉薇
        關(guān)鍵詞:數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)信息

        鄒 妍,門(mén)愛(ài)華,秦曉薇

        (赤峰學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系,內(nèi)蒙古 赤峰 024000)

        XML信息共享中隱私保護(hù)技術(shù)研究

        鄒 妍,門(mén)愛(ài)華,秦曉薇

        (赤峰學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系,內(nèi)蒙古 赤峰 024000)

        隨著計(jì)算機(jī)處理能力、存儲(chǔ)技術(shù)以及網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,信息電子化程度得到了極大的提高,這也使得XML信息共享更加廣泛地深入到人們的生產(chǎn)和生活的方方面面.但是,隨之產(chǎn)生的隱私泄露現(xiàn)象屢見(jiàn)不鮮,所以,如何保護(hù)XML隱私數(shù)據(jù)和防止敏感信息泄露成為當(dāng)前面臨的巨大挑戰(zhàn).而信息共享中隱私保護(hù)研究的目標(biāo)就是在保護(hù)數(shù)據(jù)隱私的同時(shí)又不影響數(shù)據(jù)應(yīng)用.本文對(duì)隱私保護(hù)領(lǐng)域已有的研究成果進(jìn)行了總結(jié),對(duì)各類(lèi)隱私保護(hù)技術(shù)的基本原理、特點(diǎn)進(jìn)行了闡述,并介紹了各類(lèi)技術(shù)的典型應(yīng)用.在對(duì)已有技術(shù)深入對(duì)比分析基礎(chǔ)上,指出了隱私保護(hù)技術(shù)的未來(lái)發(fā)展方向.

        XML;隱私保護(hù);數(shù)據(jù)發(fā)布

        1 引言

        XML數(shù)據(jù)挖掘和數(shù)據(jù)發(fā)布是當(dāng)前數(shù)據(jù)庫(kù)應(yīng)用的兩個(gè)重要方面.一方面,數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)在各個(gè)領(lǐng)域都扮演著非常重要的角色.數(shù)據(jù)挖掘的目的在于從大量的數(shù)據(jù)中抽取出潛在的、有價(jià)值的知識(shí)(模型或規(guī)則)[1].傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)在發(fā)現(xiàn)知識(shí)的同時(shí),也給數(shù)據(jù)的隱私帶來(lái)了威脅.例如,疾病控制中心需要收集各醫(yī)療機(jī)構(gòu)的病例信息,以進(jìn)行疾病的預(yù)防與控制.在這個(gè)過(guò)程中,傳統(tǒng)數(shù)據(jù)挖掘技術(shù)將不可避免地暴露敏感數(shù)據(jù)(如“病人所患疾病”),而這些敏感數(shù)據(jù)是數(shù)據(jù)所有者(醫(yī)療機(jī)構(gòu)、病人)不希望被揭露的.另一方面,數(shù)據(jù)發(fā)布是將數(shù)據(jù)庫(kù)中的數(shù)據(jù)直接地展現(xiàn)給用戶(hù).而在各種數(shù)據(jù)發(fā)布應(yīng)用中,如果數(shù)據(jù)發(fā)布者不采取適當(dāng)?shù)臄?shù)據(jù)保護(hù)措施,將可能造成敏感數(shù)據(jù)的泄漏,從而給數(shù)據(jù)所有者帶來(lái)危害.譬如企業(yè)發(fā)布的產(chǎn)品信息,或者上市公司發(fā)布的財(cái)務(wù)年報(bào),如果不對(duì)發(fā)布的數(shù)據(jù)進(jìn)行仔細(xì)甄別,就會(huì)給商業(yè)上的競(jìng)爭(zhēng)者以可乘之機(jī).所以,如何在各種數(shù)據(jù)庫(kù)應(yīng)用中保護(hù)數(shù)據(jù)的隱私,成為近年來(lái)學(xué)術(shù)界的研究熱點(diǎn)[2].

        隱私保護(hù)技術(shù)[3]的出現(xiàn)就是為了解決上述問(wèn)題.具體的說(shuō),實(shí)施數(shù)據(jù)隱私保護(hù)主要考慮以下兩個(gè)方面:(1)如何保證數(shù)據(jù)應(yīng)用過(guò)程中不泄露隱私;(2)如何更有利于數(shù)據(jù)的應(yīng)用.當(dāng)前,隱私保護(hù)領(lǐng)域的研究工作主要集中于如何設(shè)計(jì)隱私保護(hù)原則和算法更好的達(dá)到這兩方面的平衡.

        本文對(duì)隱私保護(hù)技術(shù)的最新進(jìn)展進(jìn)行綜述.對(duì)該領(lǐng)域的主要技術(shù)進(jìn)行了分類(lèi)闡述,在具體應(yīng)用中對(duì)該技術(shù)的優(yōu)缺點(diǎn)、適用范圍等進(jìn)行分析.在此基礎(chǔ)上對(duì)隱私保護(hù)技術(shù)進(jìn)行了綜合對(duì)比與分析,并指明了隱私保護(hù)技術(shù)未來(lái)的研究方向.

        2 主要研究方向與國(guó)內(nèi)研究現(xiàn)狀

        2.1 隱私保護(hù)的主要研究方向

        隱私保護(hù)的研究問(wèn)題是由實(shí)際應(yīng)用中不同的隱私保護(hù)需求決定的.通用的隱私保護(hù)技術(shù)致力于在較低應(yīng)用層次上保護(hù)數(shù)據(jù)的隱私,一般通過(guò)引入統(tǒng)計(jì)模型和概率模型來(lái)實(shí)現(xiàn);而面向數(shù)據(jù)挖掘的隱私保護(hù)技術(shù)主要解決在高層數(shù)據(jù)應(yīng)用中,如何根據(jù)不同數(shù)據(jù)挖掘操作的特性,實(shí)現(xiàn)對(duì)隱私的保護(hù);基于隱私保護(hù)的數(shù)據(jù)發(fā)布原則是為了提供一種在各類(lèi)應(yīng)用可以通用的隱私保護(hù)方法,進(jìn)而使得在此基礎(chǔ)上設(shè)計(jì)的隱私保護(hù)算法也具通用性.

        2.2 國(guó)內(nèi)研究現(xiàn)狀

        作為新興的研究熱點(diǎn),隱私保護(hù)技術(shù)不論在理論研究還是實(shí)際應(yīng)用方面,都具有非常重要的價(jià)值.在國(guó)內(nèi)對(duì)隱私保護(hù)技術(shù)的研究亦受到學(xué)術(shù)界的關(guān)注與重視,包括清華大學(xué)、復(fù)旦大學(xué)、中國(guó)科技大學(xué)、北京大學(xué)、東北大學(xué)、華中科技大學(xué)等在內(nèi)的多個(gè)課題組也開(kāi)展了相關(guān)的研究工作.

        國(guó)內(nèi)關(guān)于隱私保護(hù)技術(shù)的研究目前主要集中于基于數(shù)據(jù)失真或數(shù)據(jù)加密技術(shù)方面的研究,如基于隱私保護(hù)分類(lèi)挖掘算法[4]、關(guān)聯(lián)規(guī)則挖掘[5]、分布式數(shù)據(jù)的隱私保持協(xié)同過(guò)濾推薦、網(wǎng)格訪問(wèn)控制等.

        總的來(lái)說(shuō),國(guó)內(nèi)關(guān)于隱私保護(hù)技術(shù)的研究還處于起步階段,具有廣闊的發(fā)展空間;與國(guó)外和我國(guó)港臺(tái)地區(qū)的研究組相比,尚有一定的差距.

        3 各類(lèi)隱私保護(hù)技術(shù)的比較分析

        3.1 各類(lèi)隱私保護(hù)技術(shù)的分類(lèi)與描述

        本文將隱私保護(hù)技術(shù)分為以下三類(lèi):

        (1)基于數(shù)據(jù)失真(Distorting)的技術(shù):使敏感數(shù)據(jù)失真但同時(shí)保持某些數(shù)據(jù)或數(shù)據(jù)屬性不變的方法.例如,采用添加噪聲(Adding Noise)、交換(Swapping)等技術(shù)對(duì)原始數(shù)據(jù)進(jìn)行擾動(dòng)處理,但要求保證處理后的數(shù)據(jù)仍然可以保持某些統(tǒng)計(jì)方面的性質(zhì),以便進(jìn)行數(shù)據(jù)挖掘等操作.

        (2)基于數(shù)據(jù)加密的技術(shù):采用加密技術(shù)在數(shù)據(jù)挖掘過(guò)程中隱藏敏感數(shù)據(jù)的方法.

        (3)基于限制發(fā)布的技術(shù):根據(jù)具體情況有條件地發(fā)布數(shù)據(jù).

        另外,對(duì)于許多新方法,由于其融合了多種技術(shù),很難將其簡(jiǎn)單地歸到以上某一類(lèi),但它們?cè)诶媚愁?lèi)技術(shù)的優(yōu)勢(shì)的同時(shí),將不可避免的引入其它的缺陷.基于數(shù)據(jù)失真的技術(shù),效率比較高,但卻存在一定程度的信息丟失;基于加密的技術(shù)則剛好相反,它能保證最終數(shù)據(jù)的準(zhǔn)確性和安全性,但計(jì)算開(kāi)銷(xiāo)比較大;而限制發(fā)布技術(shù)的優(yōu)點(diǎn)是能保證所發(fā)布的數(shù)據(jù)一定真實(shí),但發(fā)布的數(shù)據(jù)會(huì)有一定的信息丟失.

        3.1.1 基于數(shù)據(jù)失真的隱私保護(hù)技術(shù)

        數(shù)據(jù)失真技術(shù)通過(guò)擾動(dòng)(Perturbation)原始數(shù)據(jù)來(lái)實(shí)現(xiàn)隱私保護(hù).它要使擾動(dòng)后的數(shù)據(jù)同時(shí)滿足:

        (1)攻擊者不能發(fā)現(xiàn)真實(shí)的原始數(shù)據(jù).也就是說(shuō),攻擊者通過(guò)發(fā)布的失真數(shù)據(jù)不能重構(gòu)出真實(shí)的原始數(shù)據(jù).

        (2)失真后的數(shù)據(jù)仍然保持某些性質(zhì)不變,即利用失真數(shù)據(jù)得出的某些信息等同于從原始數(shù)據(jù)上得出的信息.這就保證了基于失真數(shù)據(jù)的某些應(yīng)用的可行性.

        3.1.2 基于數(shù)據(jù)加密的隱私保護(hù)技術(shù)

        在分布式環(huán)境下實(shí)現(xiàn)隱私保護(hù)要解決的首要問(wèn)題是通訊的安全性,而加密技術(shù)正好滿足了這一需求,因此基于數(shù)據(jù)加密的隱私保護(hù)技術(shù)多用于分布式應(yīng)用中,如分布式數(shù)據(jù)挖掘、分布式安全查詢(xún)、幾何計(jì)算、科學(xué)計(jì)算等.在分布式下,具體應(yīng)用通常會(huì)依賴(lài)于數(shù)據(jù)的存儲(chǔ)模式和站點(diǎn)(Site)的可信度及其行為.

        分布式應(yīng)用采用兩種模式存儲(chǔ)數(shù)據(jù):垂直劃分的數(shù)據(jù)模式和水平劃分的數(shù)據(jù)模式.垂直劃分?jǐn)?shù)據(jù)是指分布式環(huán)境中每個(gè)站點(diǎn)只存儲(chǔ)部分屬性的數(shù)據(jù),所有站點(diǎn)存儲(chǔ)的數(shù)據(jù)不重復(fù);水平劃分?jǐn)?shù)據(jù)是將數(shù)據(jù)記錄存儲(chǔ)到分布式環(huán)境中的多個(gè)站點(diǎn),所有站點(diǎn)存儲(chǔ)的數(shù)據(jù)不重復(fù).

        對(duì)分布式環(huán)境下的站點(diǎn)(參與者),根據(jù)其行為,可分為:準(zhǔn)誠(chéng)信攻擊者(Semi-honest Adversary)和惡意攻擊者(Malicious Adversary):準(zhǔn)誠(chéng)信攻擊者是遵守相關(guān)計(jì)算協(xié)議但仍試圖進(jìn)行攻擊的站點(diǎn);惡意攻擊者是不遵守協(xié)議且試圖披露隱私的站點(diǎn).一般地,假設(shè)所有站點(diǎn)為準(zhǔn)誠(chéng)信攻擊者.

        3.1.3 基于限制發(fā)布的隱私保護(hù)技術(shù)

        限制發(fā)布即是有選擇的發(fā)布原始數(shù)據(jù)、不發(fā)布或者發(fā)布精度較低的敏感數(shù)據(jù),以實(shí)現(xiàn)隱私保護(hù).當(dāng)前此類(lèi)技術(shù)的研究集中于“數(shù)據(jù)匿名化”:即在隱私披露風(fēng)險(xiǎn)和數(shù)據(jù)精度間進(jìn)行折中,有選擇地發(fā)布敏感數(shù)據(jù)及可能披露敏感數(shù)據(jù)的信息,但保證對(duì)敏感數(shù)據(jù)及隱私的披露風(fēng)險(xiǎn)在可容忍范圍內(nèi).數(shù)據(jù)匿名化研究主要集中在兩個(gè)方面:一是研究設(shè)計(jì)更好的匿名化原則,使遵循此原則發(fā)布的數(shù)據(jù)既能很好地保護(hù)隱私,又具有較大的利用價(jià)值.另一方面是針對(duì)特定匿名化原則設(shè)計(jì)更“高效”的匿名化算法.本節(jié)內(nèi)容將圍繞這兩方面展開(kāi).

        3.2 比較分析

        容易看出,每類(lèi)隱私保護(hù)技術(shù)都有不同的特點(diǎn),在不同應(yīng)用需求下,它們的適用范圍、性能表現(xiàn)等不盡相同.表1是對(duì)隱私保護(hù)的對(duì)比分析.

        4 總結(jié)與展望

        隨著信息不斷膨脹、信息獲取渠道越來(lái)越多樣化,數(shù)據(jù)庫(kù)的應(yīng)用無(wú)處不在,不論是在理論研究還是實(shí)際應(yīng)用領(lǐng)域,對(duì)隱私保護(hù)技術(shù)進(jìn)行研究都具有非常重要的意義.但由于隱私保護(hù)技術(shù)涉及多學(xué)科交叉且發(fā)展時(shí)間較短,還存在許多問(wèn)題有待進(jìn)一步研究:

        4.1 分布式和Web環(huán)境下的隱私保護(hù)研究

        隨著分布式數(shù)據(jù)庫(kù)以及Web應(yīng)用的發(fā)展和普及,眾多已有的針對(duì)XML數(shù)據(jù)庫(kù)應(yīng)用的隱私保護(hù)技術(shù)不能滿足分布式環(huán)境下的新需求.由于分布式環(huán)境下各站點(diǎn)相對(duì)獨(dú)立、數(shù)據(jù)異構(gòu)的特點(diǎn),通訊、數(shù)據(jù)協(xié)同等其他操作將更加頻繁.而這些操作,有意或無(wú)意間,都對(duì)敏感數(shù)據(jù)和隱私信息構(gòu)成了威脅.

        如何在分布式情況下,實(shí)現(xiàn)多點(diǎn)高效協(xié)同工作的同時(shí),保證頻繁的信息交互、數(shù)據(jù)傳輸行為過(guò)程中,不會(huì)給隱私信息、敏感數(shù)據(jù)帶來(lái)威脅?如何在保護(hù)各獨(dú)立站點(diǎn)私有隱私的同時(shí),還實(shí)現(xiàn)對(duì)整個(gè)分布式系統(tǒng)的共同隱私的保護(hù)?如何使得隱私保護(hù)策略或算法在有效的同時(shí),對(duì)分布式查詢(xún)、存儲(chǔ)以及網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的負(fù)面影響盡量的???分布式數(shù)據(jù)庫(kù)和Web具有巨大的潛力和廣闊的應(yīng)用前景,雖然在分布式環(huán)境下進(jìn)行隱私保護(hù)的相關(guān)研究,將面臨一系列新的問(wèn)題和挑戰(zhàn),但相關(guān)問(wèn)題的解決,將無(wú)疑對(duì)各種應(yīng)用起到巨大的推動(dòng)作用.

        表1 隱私保護(hù)技術(shù)的對(duì)比分析

        4.2 特定應(yīng)用背景下專(zhuān)有隱私保護(hù)技術(shù)的研究

        雖然數(shù)據(jù)庫(kù)在所有領(lǐng)域都有廣泛的應(yīng)用,但是不同領(lǐng)域的應(yīng)用場(chǎng)景卻千差萬(wàn)別.不僅數(shù)據(jù)的表現(xiàn)形式、存儲(chǔ)方式、數(shù)量、更新頻率等都各不相同,而且隱私信息的表現(xiàn)形式、數(shù)量往往也是不同的.因此,眾多領(lǐng)域和現(xiàn)實(shí)應(yīng)用,都急切需要一種符合其實(shí)際情況和特點(diǎn)、針對(duì)性強(qiáng)、效率/效果優(yōu)的隱私保護(hù)方法.

        4.3 基于動(dòng)態(tài)數(shù)據(jù)的隱私保護(hù)技術(shù)研究

        大部分現(xiàn)有隱私保護(hù)技術(shù)都是基于靜態(tài)數(shù)據(jù)集的,而現(xiàn)實(shí)世界中,數(shù)據(jù)庫(kù)中的數(shù)據(jù)卻是無(wú)時(shí)無(wú)刻不在變化,包括數(shù)據(jù)表現(xiàn)形式的改變、屬性的增減、新數(shù)據(jù)的加入、舊數(shù)據(jù)的刪除等.并且,數(shù)據(jù)庫(kù)數(shù)據(jù)的這種變化,一般都不是完全隨機(jī)、獨(dú)立的,數(shù)據(jù)與數(shù)據(jù)之間,數(shù)據(jù)與數(shù)據(jù)變化之間,都是相互關(guān)聯(lián)的.因此,怎樣在這種更加復(fù)雜的環(huán)境下同時(shí)實(shí)現(xiàn)對(duì)動(dòng)態(tài)數(shù)據(jù)的利用和隱私保護(hù),是一個(gè)更具挑戰(zhàn)的難題.

        〔1〕周志純.隱私保護(hù)數(shù)據(jù)挖掘研究.2008:5-19.

        〔2〕王智慧.信息共享中隱私保護(hù)若干問(wèn)題研究.2007:5-15.

        〔3〕臧鋮.個(gè)性化搜索中隱私保護(hù)的關(guān)鍵問(wèn)題研究.2008:12-30.

        〔4〕張斌.隱私保護(hù)的分布式關(guān)聯(lián)規(guī)則挖掘算法研究.2007:4-21.

        〔5〕仲波.基于關(guān)聯(lián)規(guī)則的隱私保護(hù)算法研究.2007:6-27.

        TP311.13

        A

        1673-260X(2010)02-0035-03

        內(nèi)蒙古自治區(qū)高等學(xué)??茖W(xué)研究項(xiàng)目基金資助(NJzy08152)

        猜你喜歡
        數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)信息
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        展會(huì)信息
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        台湾佬中文网站| 国产一区二区三区亚洲精品| 亚洲视频在线免费观看一区二区| 五月激情综合婷婷六月久久| 农村欧美丰满熟妇xxxx| 国产特级全黄一级毛片不卡| 国产精品国产三级国av在线观看 | 国产亚洲欧洲三级片A级| 一道本加勒比在线观看| 色婷婷一区二区三区四区成人网| 国产成人免费一区二区三区| 亚洲丁香五月激情综合| 翘臀诱惑中文字幕人妻| 久久亚洲av无码精品色午夜 | 国内免费AV网站在线观看| 国产精品国产三级国av在线观看| 亚洲一区二区三区蜜桃| 亚洲 另类 日韩 制服 无码 | 男女激情床上视频网站| 麻豆人妻性色av专区0000| 99爱在线精品免费观看| 九九视频免费| 激情一区二区三区视频| 日韩亚洲一区二区三区四区| 精品9e精品视频在线观看| 亚洲色欲Aⅴ无码一区二区| 91中文在线九色视频| 亚洲色精品三区二区一区 | 久青草影院在线观看国产| 精品日韩欧美一区二区在线播放| av狼人婷婷久久亚洲综合| 天堂久久一区二区三区| 国产又爽又大又黄a片| 久久艹影院| 精品国产一区二区三区毛片| 天堂一区二区三区在线观看视频| 久久夜色精品国产噜噜av| 美女视频很黄很a免费国产| 国产精品熟女视频一区二区三区| 免费无码a片一区二三区| 日日摸日日碰人妻无码老牲|