亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)可用性的評估方法分析

        2015-05-30 10:48:04楊道平簡巖
        關(guān)鍵詞:評估方法數(shù)據(jù)質(zhì)量可用性

        楊道平 簡巖

        摘 要:針對日益突顯的數(shù)據(jù)質(zhì)量問題,文章從數(shù)據(jù)可用性的角度,介紹并分析了目前國內(nèi)外基于單個屬性的數(shù)據(jù)質(zhì)量評估方法,指出了相關(guān)工作的進一步研究方向。

        關(guān)鍵詞:數(shù)據(jù)質(zhì)量;可用性;評估方法

        中圖分類號:TP315 文獻標(biāo)識碼:A 文章編號:1006-8937(2015)15-0062-02

        隨著大數(shù)據(jù)時代的來臨,數(shù)據(jù)集合中劣質(zhì)數(shù)據(jù)也隨之大量產(chǎn)生,導(dǎo)致信息數(shù)據(jù)整體質(zhì)量下降,數(shù)據(jù)的有效使用受到了極大限制。為了更加有效發(fā)揮各行各業(yè)大數(shù)據(jù)的作用,開展數(shù)據(jù)可用性研究具有較大的戰(zhàn)略意義。

        1 數(shù)據(jù)可用性定義

        研究者們普遍認為,數(shù)據(jù)的可用性可以從數(shù)據(jù)的一致性、準(zhǔn)確性、完整性、時效性及實體同一性五個方面進行考察,其具體定義如下:

        ①數(shù)據(jù)的一致性:指數(shù)據(jù)信息系統(tǒng)中各相關(guān)數(shù)據(jù)信息之間相容、不產(chǎn)生矛盾。

        ②數(shù)據(jù)的準(zhǔn)確性:指數(shù)據(jù)信息系統(tǒng)中每個數(shù)據(jù)表示現(xiàn)實物體的精準(zhǔn)程度。人們對數(shù)據(jù)進行操作的各個環(huán)節(jié)都可能影響數(shù)據(jù)準(zhǔn)確性。

        ③數(shù)據(jù)的完整性:指數(shù)據(jù)集合包含的數(shù)據(jù)完全滿足對數(shù)據(jù)進行各項操作的要求。

        ④數(shù)據(jù)的時效性:是指在不同需求場景下數(shù)據(jù)的及時性和有效性。對應(yīng)用系統(tǒng)而言,往往對數(shù)據(jù)時效性要求較高,過時的數(shù)據(jù)即使分析出來了也不會對實際應(yīng)用產(chǎn)生有價值的影響。

        ⑤實體的同一性:指同一實體在各種數(shù)據(jù)源中的描述統(tǒng)一。

        一個數(shù)據(jù)集合,滿足以上五個性質(zhì)的程度稱為該數(shù)據(jù)集合的可用性。

        2 評估方法分析

        對于數(shù)據(jù)可用性評估,國內(nèi)外研究人員也進行了許多工作。以下從數(shù)據(jù)的一致性、精確性、完整性、時效性、實體同一性五個方面進行介紹和分析。

        2.1 基于一致性的方法

        文獻[1]針對異地備份系統(tǒng)中數(shù)據(jù)持續(xù)變化的情況,設(shè)計并實現(xiàn)了一種基于累積摘要值的一致性檢測方法。該方法解決了傳統(tǒng)一致性檢測需要中斷備份任務(wù)的問題,保證了備份任務(wù)的連續(xù)性,并且能夠迅速檢測本地服務(wù)器和遠程備份中心數(shù)據(jù)的一致性,提高了一致性檢測的效率。

        文獻[2]從已有的一致性維護方法出發(fā),針對海量數(shù)據(jù)多副本之間一致性維護,從一致性維護過程中所涉及的更新發(fā)布、更新傳播方式、更新傳播內(nèi)容、更新沖突解決等幾個方面進行了分析,提出了相應(yīng)的解決辦法。

        文獻[3]針對P2P分布存儲系統(tǒng)中大型數(shù)據(jù)對象面臨的數(shù)據(jù)一致性問題,提出了數(shù)據(jù)一致性維護方法PLCP。該方法從提高更新傳播速度和減少日志空間開銷的角度進行了數(shù)據(jù)優(yōu)化。同時針對數(shù)據(jù)更新的問題和關(guān)鍵屬性更新的問題,提出數(shù)據(jù)一致性維護方法DACP和KACP。

        文獻[5]從無線傳感網(wǎng)絡(luò)數(shù)據(jù)安全的角度,結(jié)合一些廉價的保護技術(shù),提出了利用跨層一致性評估信息整體質(zhì)量的方法。

        基于數(shù)據(jù)一致性的方法,主要體現(xiàn)在集中存儲方面,對于分布式和非關(guān)系數(shù)據(jù)方面研究還較少,適用于海量數(shù)據(jù)的一致性評估方法有待進一步探索。

        2.2 基于精確性的方法

        數(shù)據(jù)精確性方面的研究結(jié)果比較少見,文獻[6]從精確度低的角度,提出了對應(yīng)的精確性評估算法。該算法考慮了一種基于可能世界語義的描述方法。目前的研究結(jié)果顯示,數(shù)據(jù)精確性的評估方法還有待研究者們深入探究。

        2.3 基于完整性的方法

        針對海量關(guān)系數(shù)據(jù)中普遍存在的數(shù)據(jù)不完整現(xiàn)象,劉永楠等研究了關(guān)系數(shù)據(jù)完整性度量問題。針對數(shù)據(jù)的完整性計算問題,提出了數(shù)據(jù)完整性計算模型,以及精確算法和基于均勻抽樣的近似算法。理論分析證明了近似算法可以達到任意的精度要求,可以高效地對數(shù)據(jù)完整性進行計算,通過在DBLP數(shù)據(jù)上的實驗驗證了算法的有效性和高效性。

        在具體應(yīng)用領(lǐng)域,張少敏等利用IEC61970對智能電網(wǎng)進行信息集成,然后根據(jù)完整性定義,對智能電網(wǎng)數(shù)據(jù)進行自動機建模,給出了一種無需對數(shù)據(jù)進行直接操作的數(shù)據(jù)完整性定量評估模型。

        Barcelo P等將傳統(tǒng)的完整性理論擴展到XML數(shù)據(jù)上,討論了不完整XML數(shù)據(jù)的表示問題。

        另外,針對云存儲服務(wù)中數(shù)據(jù)的完整性問題,一些研究者提出了PDP 和POR。這兩種方案都采用了概率性證明思路,即存儲服務(wù)提供商向數(shù)據(jù)擁有者證明其完整的持有數(shù)據(jù)擁有者存儲的數(shù)據(jù)。

        基于數(shù)據(jù)完整性評估方面的結(jié)論還較少,特別是具有普遍適用價值的方法,還有待進一步研究。

        2.4 基于時效性的方法

        文獻[7]針對歷史評價數(shù)據(jù)時效性會影響評價計算準(zhǔn)確性的問題,引入了評價數(shù)據(jù)的時間屬性,構(gòu)造了評價數(shù)據(jù)衰減因子,減小了時效性對于評價計算準(zhǔn)確性的影響。

        文獻[8]研究了包含冗余記錄的集合在給定時效約束下的時效性判定問題,并首次提出了時效性判定問題的求解算法.

        在建筑能耗領(lǐng)域,文獻[9]通過對幾類典型公共建筑能耗數(shù)據(jù)的統(tǒng)計分析對比,提出了采用近1年的能耗數(shù)據(jù)作為統(tǒng)計樣本的建議。

        基于時效性方面的研究非常匱乏,已有的少量研究結(jié)論都主要針對一些特殊應(yīng)用,還需深入系統(tǒng)的研究。

        2.5 基于實體同一性的方法

        實體同一性是數(shù)據(jù)可用性研究較多的一個方面,實體同一性研究主要涉及兩類方法:第一類是從語義規(guī)則的角度進行同一性研究,這類方法主要通過經(jīng)驗知識來描述實體的同一性問題;第二類是從相似性的角度進行同一性研究,該類方法主要采用相似度函數(shù)來對實體同一性進行判定。

        針對實體同一性方面的相關(guān)技術(shù),包括實體識別的效率問題、識別的增量計算、半結(jié)構(gòu)化數(shù)據(jù)上的實體識別等,文獻[4] 展開了相對完整的討論。

        對于實體統(tǒng)一性的評估方法大多針對關(guān)系數(shù)據(jù),針對復(fù)雜結(jié)構(gòu)數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非機構(gòu)化數(shù)據(jù)方面的研究還很少。

        3 結(jié) 語

        在大數(shù)據(jù)時代,數(shù)據(jù)量急劇增長,數(shù)據(jù)的可用性問題將嚴(yán)重影響基于數(shù)據(jù)的知識和決策。確保大數(shù)據(jù)的可用性是進行大數(shù)據(jù)分析、處理的關(guān)鍵基礎(chǔ),將直接關(guān)系到大數(shù)據(jù)價值的體現(xiàn)。本文針對數(shù)據(jù)質(zhì)量問題,從數(shù)據(jù)可用性的角度,介紹并分析了目前國內(nèi)外基于單個屬性的數(shù)據(jù)質(zhì)量評估方法,將有助于促進大數(shù)據(jù)可用性的研究。

        參考文獻:

        [1] 劉仕一,李濤,劉哲哿,等.異地備份系統(tǒng)數(shù)據(jù)一致性檢測方法[J].計算機工程與設(shè),2010,(17).

        [2] 周婧,王意潔,阮煒,等.面向海量數(shù)據(jù)的數(shù)據(jù)一致性研究[J].計算機科學(xué),2006,(4).

        [3] 周婧.P2P分布存儲系統(tǒng)中海量數(shù)據(jù)的數(shù)據(jù)一致性維護技術(shù)研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2007.

        [4] 劉顯敏,李建.中實體識別問題的相關(guān)研究[J].智能計算機與應(yīng)用,2013,(2).

        [5] Mattia Monga,Sabrina Sicari.Assessing Data Quality by a Cross-Layer

        Approach[D].Ultra Modern Telecommunications & Workshops,2009.

        [6] Cheng R,Chen J,xie X.Cleaning uncertain data with quality guarant-

        ees[J].Proceedings of the VLDB Endowment,2008,(1).

        [7] 楊超,吳愛榮.基于衰減因子的評價數(shù)據(jù)時效性處理方法[J].計算機工程與設(shè)計,2010,(3).

        [8] 李默涵,李建中,高宏.數(shù)據(jù)時效性判定問題的求解算法[J].計算機學(xué)報,2012,(11).

        [9] 黃志鋒.建筑能耗定額編制中數(shù)據(jù)樣本的時效性分析[J].廣東土木與建筑,2012,(7).

        猜你喜歡
        評估方法數(shù)據(jù)質(zhì)量可用性
        基于文獻計量學(xué)的界面設(shè)計可用性中外對比研究
        包裝工程(2023年24期)2023-12-27 09:18:26
        基于輻射傳輸模型的GOCI晨昏時段數(shù)據(jù)的可用性分析
        淺析電網(wǎng)規(guī)劃中的模糊可靠性評估方法
        淺析統(tǒng)計數(shù)據(jù)質(zhì)量
        中國市場(2016年40期)2016-11-28 04:58:19
        金融統(tǒng)計數(shù)據(jù)質(zhì)量管理的國際借鑒與中國實踐
        時代金融(2016年27期)2016-11-25 19:02:25
        爛尾樓資產(chǎn)證券化及定價方法的探討
        商(2016年32期)2016-11-24 16:33:01
        淺談統(tǒng)計數(shù)據(jù)質(zhì)量控制
        提高政府統(tǒng)計數(shù)據(jù)質(zhì)量,增強政府公信力
        物聯(lián)網(wǎng)系統(tǒng)檢測與評估方法
        中壓配電網(wǎng)可靠性評估方法的比較
        亚洲最新中文字幕一区| 高潮潮喷奶水飞溅视频无码| 国产一区亚洲二区三区极品| 日本一本免费一二区| 亚洲精品久久久久久久久久吃药| 国产一区二区三区在线观看免费| 国产午夜三级一区二区三| 国产又黄又爽又无遮挡的视频| 美女黄网站永久免费观看网站| 日本视频在线播放一区二区| 少妇无码av无码专线区大牛影院| 日韩精品久久久肉伦网站| 精品少妇ay一区二区三区| 午夜无码熟熟妇丰满人妻| 国产av自拍在线观看| 日本一区二区视频免费在线看| 无码aⅴ免费中文字幕久久| 又黄又爽又高潮免费毛片| 亚洲AV成人无码天堂| 精品国产亚洲av高清日韩专区| 亚洲综合国产成人丁香五月激情 | 日韩人妻大奶子生活片| 精品福利一区二区三区蜜桃| 国产色在线 | 亚洲| 熟女俱乐部五十路二区av| 亚洲av综合色区久久精品天堂| 亚洲丰满熟女一区二亚洲亚洲| 中文字幕在线日亚州9| 国产免费无码一区二区三区| 国产欧美亚洲精品第二区首页 | 亚洲精品第四页中文字幕| 天堂中文а√在线| 99偷拍视频精品一区二区| 国内精品视频成人一区二区| 日韩在线视频专区九区| 久久精品丝袜高跟鞋| 天天做天天爱天天爽综合网 | 久久狠狠爱亚洲综合影院| 精品日本一区二区三区| 又色又爽又黄高潮的免费视频| 久久丫精品国产亚洲av|