亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于塊嵌套循環(huán)的海洋大數(shù)據(jù)質(zhì)量檢驗(yàn)方案選擇算法*

        2013-05-08 13:40:22黃冬梅王振華施黎莉
        關(guān)鍵詞:質(zhì)量檢驗(yàn)百分比殘差

        黃冬梅,陳 括,王振華,施黎莉

        (上海海洋大學(xué)信息學(xué)院,上海201306)

        1 引言

        隨著世界各國對海洋資源探索和海洋事業(yè)發(fā)展的日益重視,海洋信息化成為全面了解和研究海洋的重要途徑之一。目前,海洋數(shù)據(jù)的獲取手段多種多樣,海洋數(shù)據(jù)的“量”急劇增長,同時(shí)海洋數(shù)據(jù)的“類”多樣化發(fā)展,可以說,海洋數(shù)據(jù)已逐漸成為大數(shù)據(jù)的典范。海洋大數(shù)據(jù)為海洋環(huán)境的監(jiān)測、海洋資源的探測以及海洋災(zāi)害的預(yù)警預(yù)報(bào)等研究提供了重要的信息資源,但海洋大數(shù)據(jù)的“質(zhì)”問題也成為大家關(guān)注的重點(diǎn)。

        以某海域海洋養(yǎng)殖區(qū)監(jiān)測為例。該海域基礎(chǔ)數(shù)據(jù)包括經(jīng)度、緯度以及海底地形;海洋環(huán)境要素?cái)?shù)據(jù)包括溫、鹽、浪、流、潮等,要素?cái)?shù)據(jù)采集周期為10分鐘;海洋養(yǎng)殖區(qū)域?qū)傩詳?shù)據(jù)包括養(yǎng)殖類型、養(yǎng)殖面積、養(yǎng)殖單位等。在海洋數(shù)據(jù)的整個(gè)生命周期中,從采集、傳輸、處理到應(yīng)用,都有可能使數(shù)據(jù)產(chǎn)生質(zhì)量問題,因此在使用數(shù)據(jù)前,需對該批海洋大數(shù)據(jù)進(jìn)行質(zhì)量檢驗(yàn)。但是,傳統(tǒng)的數(shù)據(jù)質(zhì)量檢驗(yàn)方法不能直接應(yīng)用于海洋大數(shù)據(jù)的質(zhì)量檢驗(yàn),其原因在于:(1)海洋數(shù)據(jù)屬于空間數(shù)據(jù)的一類,其空間位置數(shù)據(jù)與屬性數(shù)據(jù)具有對應(yīng)關(guān)系;(2)海洋數(shù)據(jù)采集周期為10分鐘,因此海洋數(shù)據(jù)具有動態(tài)性特征,且其量急劇積累;(3)由于各環(huán)境要素的獲取手段不同,其數(shù)據(jù)格式、精度要求等各不相同。

        本文的主要貢獻(xiàn)有:(1)利用超幾何分布模型給出了不同質(zhì)量檢驗(yàn)方案的殘差集合;(2)基于skyline的塊嵌套循環(huán)BNL(Block-Nested-Loops)算法選擇出最優(yōu)質(zhì)量檢驗(yàn)方案;(3)針對多源、多類、多維以及動態(tài)性海洋大數(shù)據(jù),快速確定其質(zhì)量檢驗(yàn)的優(yōu)化方案。

        2 相關(guān)工作

        質(zhì)量檢驗(yàn)是從一批海洋數(shù)據(jù)中隨機(jī)抽取一定量的數(shù)據(jù)進(jìn)行檢驗(yàn),來判斷該批數(shù)據(jù)質(zhì)量是否達(dá)到要求的精度[1]。針對數(shù)據(jù)質(zhì)量的問題,文獻(xiàn)[2]通過定義數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn),建立了數(shù)據(jù)質(zhì)量管理閉環(huán)過程。文獻(xiàn)[3]從數(shù)據(jù)的準(zhǔn)確性、完整性、代表性以及可比性方面對數(shù)據(jù)質(zhì)量進(jìn)行控制,同時(shí)用統(tǒng)計(jì)抽樣的方法對已有數(shù)據(jù)進(jìn)行檢驗(yàn)。文獻(xiàn)[4]將數(shù)據(jù)質(zhì)量衡量指標(biāo)分成客觀的數(shù)據(jù)質(zhì)量指示器和主觀的數(shù)據(jù)質(zhì)量參數(shù),用戶根據(jù)需要選擇不同指標(biāo)對數(shù)據(jù)工程中的數(shù)據(jù)進(jìn)行衡量。文獻(xiàn)[5]將數(shù)據(jù)質(zhì)量評估指標(biāo)分成四類:內(nèi)在質(zhì)量和可訪問質(zhì)量、上下文質(zhì)量、表達(dá)質(zhì)量,每個(gè)類又細(xì)分成具體的維度來評估,拓寬數(shù)據(jù)質(zhì)量的認(rèn)識。文獻(xiàn)[6]采取取樣計(jì)算的方法,對關(guān)系數(shù)據(jù)庫數(shù)據(jù)質(zhì)量的兩個(gè)重要維度即精確度和完整度進(jìn)行量化,并具體分析了數(shù)據(jù)質(zhì)量對四種常見的關(guān)系代數(shù)操作(選擇、投影、笛卡爾積、連接)的影響。

        以上的方法研究都是基于傳統(tǒng)數(shù)據(jù)的質(zhì)量檢驗(yàn)方法,海洋大數(shù)據(jù)不同于傳統(tǒng)數(shù)據(jù),有其自身的特點(diǎn):(1)海洋數(shù)據(jù)獲取難度大、成本高,因此大部分的海洋數(shù)據(jù)質(zhì)量檢驗(yàn)具有不可逆性;(2)海洋數(shù)據(jù)涵蓋區(qū)域廣、時(shí)空分布不均勻,因此如何根據(jù)海洋數(shù)據(jù)的不同批量范圍,快速給出其質(zhì)量檢驗(yàn)的優(yōu)化方案是海洋大數(shù)據(jù)質(zhì)量檢驗(yàn)的關(guān)鍵問題。針對海洋數(shù)據(jù)質(zhì)量的檢驗(yàn)研究較少,文獻(xiàn)[7]介紹了利用極值控制方法、檢驗(yàn)法、迪克遜(Dixon)檢驗(yàn)法等方法對海洋站的數(shù)據(jù)質(zhì)量進(jìn)行控制。文獻(xiàn)[8]針對GPS浮標(biāo)側(cè)波數(shù)據(jù)的間斷現(xiàn)象,采用了插值法和后續(xù)值前移的接續(xù)方法對海洋數(shù)據(jù)進(jìn)行質(zhì)量控制。文獻(xiàn)[9]以海流觀測技術(shù)LADCP(Lowered Acoustic Doppler Current Profiler)獲取的流速信息為例,通過實(shí)驗(yàn)說明了對流速信息進(jìn)行質(zhì)量控制前后的不同結(jié)果,并闡述了對海洋數(shù)據(jù)進(jìn)行質(zhì)量控制的重要性。這些學(xué)者針對不同類型的海洋數(shù)據(jù)進(jìn)行了質(zhì)量檢驗(yàn)研究,但是面對類型復(fù)雜的海洋大數(shù)據(jù)時(shí),如何確立其質(zhì)量檢驗(yàn)方案并對其質(zhì)量進(jìn)行控制的相關(guān)研究較少。

        近年來skyline計(jì)算[10]受到了眾多國內(nèi)外研究者的關(guān)注,文獻(xiàn)[11]將skyline計(jì)算應(yīng)用在集中靜態(tài)環(huán)境中,并利用空間索引技術(shù)快速進(jìn)行skyline查詢。文獻(xiàn)[12]基于簇結(jié)構(gòu)的思想提出了一種新的skyline算法,并將該算法用于無線傳感器網(wǎng)絡(luò)。skyline查詢是一個(gè)多目標(biāo)決策問題,可以使同一問題中的幾個(gè)不同的因素達(dá)到平衡,為用戶做出更好的決策。

        本文采用傳統(tǒng)的百分比方法給出待檢驗(yàn)海洋大數(shù)據(jù)的質(zhì)量檢驗(yàn)方案集,并根據(jù)超幾何分布模型計(jì)算所有質(zhì)量檢驗(yàn)方案的殘差集合,運(yùn)用skyline的塊嵌套循環(huán)算法對已有的質(zhì)量檢驗(yàn)方案集進(jìn)行優(yōu)化選擇。通過平衡檢驗(yàn)精度和費(fèi)用,快速給出該批海洋大數(shù)據(jù)的最優(yōu)質(zhì)量檢驗(yàn)方案。

        3 海洋大數(shù)據(jù)質(zhì)量檢驗(yàn)方案和方案殘差

        3.1 海洋大數(shù)據(jù)質(zhì)量檢驗(yàn)方案

        將海洋數(shù)據(jù)的質(zhì)量檢驗(yàn)記為S(N,n,c),其中,N為批量,即待檢驗(yàn)的海洋數(shù)據(jù)的總體數(shù)量;n為樣本量,即從批量中抽取的用來檢查的海洋數(shù)據(jù)樣本數(shù)量;c為接收數(shù),即樣本中允許出現(xiàn)的海洋數(shù)據(jù)不合格數(shù)的最大值。從待檢驗(yàn)海洋數(shù)據(jù)檢驗(yàn)批N中抽取n個(gè)樣本,逐一檢查其質(zhì)量;記海洋樣本數(shù)據(jù)中的不合格品數(shù)為d,若海洋數(shù)據(jù)不合格數(shù)小于或等于接收數(shù)c,則該批海洋數(shù)據(jù)達(dá)到了精度要求,待檢驗(yàn)海洋數(shù)據(jù)被認(rèn)為未發(fā)現(xiàn)質(zhì)量問題,反之則說明該批海洋數(shù)據(jù)存在質(zhì)量問題。

        本文使用檢驗(yàn)批的不合格品率來衡量海洋數(shù)據(jù)質(zhì)量水平的標(biāo)準(zhǔn),用海洋數(shù)據(jù)平均質(zhì)量水平來衡量數(shù)據(jù)的平均質(zhì)量。海洋數(shù)據(jù)不合格品率的計(jì)算如公式(1)所示,海洋數(shù)據(jù)平均質(zhì)量水平的計(jì)算如公式(2)所示:

        其中,di為對第i批海洋數(shù)據(jù)樣本逐個(gè)檢查時(shí),發(fā)現(xiàn)的不合格品數(shù)據(jù)的個(gè)數(shù);n為第i檢驗(yàn)批海洋數(shù)據(jù)中抽取的樣本量;m為待檢驗(yàn)海洋數(shù)據(jù)批量。

        3.2 海洋大數(shù)據(jù)質(zhì)量方案殘差

        針對每一批待檢驗(yàn)海洋數(shù)據(jù),其存在一個(gè)接收質(zhì)量限 AQL[13](Acceptance Quality Level)和極限質(zhì)量限 LQL[14](Limit Quality Level)。接收質(zhì)量限AQL是當(dāng)一批連續(xù)序列被提交驗(yàn)收檢驗(yàn)時(shí),可允許的最差過程平均質(zhì)量水平,它是可以接收和拒絕接收的過程平均界限值。在對一批海洋數(shù)據(jù)質(zhì)量檢驗(yàn)前,先根據(jù)所需數(shù)據(jù)質(zhì)量要求給出該次檢驗(yàn)過程的AQL值,即檢驗(yàn)批可允許的不合格品率p。極限質(zhì)量限LQL指為了抽樣檢驗(yàn),限制在某一低接收概率的質(zhì)量水平,它是在抽樣檢驗(yàn)中對不應(yīng)接收的批質(zhì)量的最小值。

        基于超幾何分布模型[15],質(zhì)量檢驗(yàn)方案的接收概率記為L()p:

        因此,基于AQL的接收質(zhì)量限接收概率殘差Ea和LQL的極限質(zhì)量限接收概率殘差Eb由下式給出:

        其中,α為生產(chǎn)方風(fēng)險(xiǎn),當(dāng)海洋數(shù)據(jù)的質(zhì)量達(dá)到質(zhì)量接收限AQL,其接收概率L(pa)應(yīng)在(1-α)附近,Ea為接收質(zhì)量限接收概率殘差;β為使用方風(fēng)險(xiǎn),當(dāng)質(zhì)量水平劣于極限質(zhì)量限LQL,其接收概率L(pb)應(yīng)在β附近,Eb為極限質(zhì)量限接收概率殘差。

        4 海洋大數(shù)據(jù)質(zhì)量檢驗(yàn)方案的優(yōu)化選擇算法

        塊嵌套循環(huán)BNL[16]是對具有兩類屬性值的數(shù)據(jù)點(diǎn)的兩兩比較方法的一種優(yōu)化算法,其本質(zhì)是多目標(biāo)決策算法。本文采用百分比質(zhì)量檢驗(yàn)方案對海洋數(shù)據(jù)的質(zhì)量檢驗(yàn)方案S(N,n,c)的數(shù)據(jù)進(jìn)行檢驗(yàn),運(yùn)用BNL對質(zhì)量檢驗(yàn)方案中的接收質(zhì)量限接收概率殘差Ea和極限質(zhì)量限接收概率殘差Eb進(jìn)行優(yōu)化選擇,在兼顧生產(chǎn)方風(fēng)險(xiǎn)和使用方風(fēng)險(xiǎn)的條件下,選出最優(yōu)化的質(zhì)量檢驗(yàn)方案。

        輸入:待檢驗(yàn)的海洋數(shù)據(jù)集O,|O|=N;

        輸出:最優(yōu)的海洋大數(shù)據(jù)質(zhì)量檢驗(yàn)方案S(N,n,c)。

        步驟1 求海洋大數(shù)據(jù)質(zhì)量檢驗(yàn)方案集Q,|Q|=N2;

        步驟2 for(i=1;i≤N;i++ ){

        利用公式(5)求殘差ai,并將其放入殘差集Ea中;

        利用公式(6)求殘差bi,并將其放入殘差集Eb中;

        //利用公式(5)和(6)求殘差集Ea和Eb;

        步驟3 將殘差集Ea和Eb作為輸入,調(diào)用skyline的塊嵌套循環(huán)算法,計(jì)算出最優(yōu)解(ak,bk)(0<k≤|Ea|);

        步驟4 根據(jù)(ak,bk)從方案集Q中選出最優(yōu)方案S(N,n,c)。

        算法分析:在該算法中,求海洋大數(shù)據(jù)質(zhì)量檢驗(yàn)方案集Q的時(shí)間復(fù)雜度為O(N2);求殘差集的時(shí)間復(fù)雜度為O(N2);塊嵌套循環(huán)算法的時(shí)間復(fù)雜度為O(N2);從方案集Q中選出最優(yōu)方案的時(shí)間復(fù)雜度為O(N)。因此,該算法的時(shí)間復(fù)雜度為O(N2)。

        5 實(shí)驗(yàn)分析

        5.1 實(shí)驗(yàn)數(shù)據(jù)

        Figure 1 Breed area distribution chart圖1 養(yǎng)殖區(qū)域分布圖

        以如圖1所示的某海域部分養(yǎng)殖區(qū)域監(jiān)測站點(diǎn)數(shù)據(jù)為例,來檢驗(yàn)本文所提方法的可行性。其中,研究區(qū)域內(nèi)包括監(jiān)測點(diǎn)位數(shù)據(jù)N為1 392個(gè),其每一點(diǎn)位包括三大類數(shù)據(jù),分別是空間位置數(shù)據(jù)、海洋要素?cái)?shù)據(jù)和養(yǎng)殖信息數(shù)據(jù),如表1所示(因需要將位置數(shù)據(jù)及典型要素?cái)?shù)據(jù)隱藏)。

        采用四種不同的抽樣比f對海洋數(shù)據(jù)進(jìn)行質(zhì)量檢驗(yàn),對于該批海洋數(shù)據(jù)的批量N,樣本量n分別取批量N 的5%、10%、15%和20%,接收數(shù)c取不同的值,表2所列為海洋數(shù)據(jù)的百分比質(zhì)量檢驗(yàn)方案。

        5.2 質(zhì)量檢驗(yàn)方案優(yōu)化選擇

        根據(jù)以上四種不同的百分比抽樣方法,利用超幾何分布模型,根據(jù)AQL和LQL對應(yīng)的不合格品率值,不合格品率分別取Pa=0.02,Pb=0.1,計(jì)算得出接收概率值L(Pa)和L(Pb),以及其對應(yīng)的殘差值Ea和Eb。百分比抽樣方案的接收概率值和殘差如表3所示。

        Table 1 Attribute information of the breed area distribution表1 養(yǎng)殖區(qū)分布屬性信息

        Table 2 List of the percentage sampling plan表2 百分比抽樣方案列表

        Table 3 Accept probability and residual of the percentage sampling plan表3 百分比質(zhì)量檢驗(yàn)方案接收概率值和殘差

        由表3可以看出:

        (1)抽樣比f=5%時(shí),質(zhì)量檢驗(yàn)方案的樣本量n為69,質(zhì)量檢驗(yàn)方案為S(1 392,69,c),其中接收數(shù)c從0開始取值,依次以1遞增;當(dāng)接收數(shù)c大于或等于4時(shí),其極限質(zhì)量限接收概率殘差小于0,如表中方案S(1 392,69,4)、S(1 392,69,5)、S(1 392,69,6)、S(1 392,69,7)的極限質(zhì)量限接收概率殘差分別為-0.062 1、-0.195 6,-0.359 9、-0.517 0,此時(shí)所有方案只顧及了生產(chǎn)方風(fēng)險(xiǎn),但沒有考慮使用方風(fēng)險(xiǎn),故此舍去。(2)當(dāng)抽樣比為f=10%,質(zhì)量檢驗(yàn)方案的樣本量n為139,質(zhì)量檢驗(yàn)方案為S(1 392,139,c)。當(dāng)接收數(shù)c大于或等于10時(shí),AQL的接受概率L(Pa)約等于1,即無論待檢驗(yàn)數(shù)據(jù)質(zhì)量如何,采用該方案對其進(jìn)行質(zhì)量檢驗(yàn),均可判為合格數(shù)據(jù),該現(xiàn)象不利于使用方。所以當(dāng)抽樣比為f=10%,接收數(shù)c大于或等于10的質(zhì)量檢驗(yàn)方案,不予考慮。同理,(3)當(dāng)抽樣比為f=15%,質(zhì)量檢驗(yàn)方案樣本量n為208,接收數(shù)c大于或等于13的質(zhì)量檢驗(yàn)方案,不予考慮。(4)當(dāng)抽樣比為f=20%,質(zhì)量檢驗(yàn)方案樣本量n為278,接收數(shù)c大于或等于15的質(zhì)量檢驗(yàn)方案,不予考慮。

        利用BNL算法對不同抽樣比產(chǎn)生的海洋數(shù)據(jù)質(zhì)量檢驗(yàn)方案進(jìn)行選擇。首先將海洋數(shù)據(jù)抽樣方案 殘 差 點(diǎn) 的 集 合 定 義 為 S = {S1(Ea1,Eb1),S2(Ea2,Eb2),…,Sn(Ean,Ebn)},對 所 有 質(zhì) 量 檢 驗(yàn)方案的殘差點(diǎn)集兩兩交互比較,從而篩選出平衡兩殘差的最優(yōu)解,即選出最優(yōu)化的質(zhì)量檢驗(yàn)方案,在保證使用方精度的同時(shí)考慮生產(chǎn)方的風(fēng)險(xiǎn)。

        抽樣比為f=5%時(shí),海洋數(shù)據(jù)質(zhì)量檢驗(yàn)方案為S(1 392,69,c)的接收概率殘差如圖2所示。

        Figure 2 Distribution of 5%quality inspection scheme residuals圖2 5%質(zhì)量檢驗(yàn)方案殘差集合

        圖2 給出了抽樣比為5%時(shí),各海洋數(shù)據(jù)質(zhì)量檢驗(yàn)方案的殘差集合,其中,橫坐標(biāo)表示接收質(zhì)量限接收概率殘差Ea,縱坐標(biāo)表示極限質(zhì)量限接收概率殘差Eb。由圖2可以看出,質(zhì)量檢驗(yàn)方案S(1 392,69,3)的殘差點(diǎn)S13(0.004 0,0.028 3)完全支配其它質(zhì)量檢驗(yàn)方案殘差點(diǎn),即該方案的接收質(zhì)量限接受概率殘差Ea和極限質(zhì)量限接收概率殘差Eb都優(yōu)于其它方案的殘差。故此,質(zhì)量檢驗(yàn)方案S(1 392,69,3)為抽樣比為5%時(shí)的最優(yōu)化海洋數(shù)據(jù)質(zhì)量檢驗(yàn)方案。

        抽樣比為f=10%時(shí),海洋數(shù)據(jù)質(zhì)量檢驗(yàn)方案為S(1 392,139,c)的接收概率殘差如圖3所示。

        Figure 3 Distribution of 10%quality inspection scheme residuals圖3 10%質(zhì)量檢驗(yàn)方案殘差集合

        圖3 給出了抽樣比為10%時(shí),各海洋數(shù)據(jù)質(zhì)量檢驗(yàn)方案的殘差集合。由圖3可以看出,質(zhì)量檢驗(yàn)方案為S(1 392,139,c)的殘差點(diǎn)S25(0.002 8,0.096 9)和S26(0.033 3,0.091 1)完全支配這組質(zhì)量檢驗(yàn)方案其它殘差點(diǎn),但是這兩個(gè)點(diǎn)并不相互支配,即這兩個(gè)方案的接收質(zhì)量限接收概率殘差Ea和極限質(zhì)量限接收概率殘差Eb都優(yōu)于其它方案的殘差,而這兩個(gè)方案之間各有優(yōu)劣。因此,S25(0.002 8,0.096 9)和 S26(0.033 3,0.091 1)同 為skyline集合點(diǎn),其所對應(yīng)的S(1 392,139,5)和S(1 392,139,6)為這組質(zhì)量檢驗(yàn)方案的最優(yōu)解。

        同樣的方法可以得出在抽樣比為15%和20%的兩組質(zhì)量檢驗(yàn)方案中,質(zhì)量檢驗(yàn)方案為S(1 392,208,c)的 殘 差 點(diǎn) S37(0.004 1,0.099 9)、S38(0.033 7,0.099 6)以及質(zhì)量檢驗(yàn)方案 S(1 392,278,c)的殘差點(diǎn)S48(0.037 2,0.100 0)、S49(0.012 8,0.100 0)分別完全支配所在組的其它質(zhì)量檢驗(yàn)方案殘差點(diǎn),因此 S37(0.004 1,0.099 9)、S38(0.033 7,0.099 6)以及 S48(0.037 2,0.100 0)、S49(0.012 8,0.100 0)分別為15%組和20%組的skyline集合點(diǎn)。同理,其所對應(yīng)的S(1 392,208,7)、S(1 392,208,8)以及S(1 392,278,8)、S(1 392,278,9)也分別為15%和20%這兩組質(zhì)量檢驗(yàn)方案的最優(yōu)解。

        然后將不同百分比的質(zhì)量檢驗(yàn)方案最優(yōu)解S(1 392,69,3)、S(1 392,139,5)、S(1 392,139,6)、S(1 392,208,7)、S(1 392,208,8)、S(1 392,278,8)和S(1 392,278,9)整合進(jìn)行二次BNL篩選比較,結(jié)果如表4和圖4所示。

        Table 4 Accept probability and residuals of different percentage quality inspection scheme表4 不同百分比最優(yōu)質(zhì)量檢驗(yàn)方案接收概率值和殘差

        Figure 4 Distribution of different percentage quality inspection scheme residuals圖4 不同百分比最優(yōu)質(zhì)量檢驗(yàn)方案殘差點(diǎn)集合

        圖4 給出了不同百分比最優(yōu)質(zhì)量檢驗(yàn)方案殘差點(diǎn)集合,通過BNL算法對不同百分比最優(yōu)質(zhì)量檢驗(yàn)方案的殘差點(diǎn)進(jìn)行比較,可以得出質(zhì)量檢驗(yàn)方案S(1 392,139,5)的殘差點(diǎn)S25(0.002 8,0.096 9)完全支配其他殘差點(diǎn),即該方案的接收質(zhì)量限接收概率殘差Ea和極限質(zhì)量限接收概率殘差Eb都優(yōu)于其它方案的殘差。因此,S25(0.002 8,0.096 9)為不同百分比最優(yōu)質(zhì)量檢驗(yàn)方案的殘差點(diǎn)的skyline集合點(diǎn),其所對應(yīng)的質(zhì)量檢驗(yàn)方案:f=10%,n=139,c=5為這批N=1 392的最優(yōu)質(zhì)量檢驗(yàn)方案,即S(1 392,139,5)為不同百分比的最優(yōu)質(zhì)量檢驗(yàn)方案。

        6 結(jié)束語

        本文將skyline思想引入海洋數(shù)據(jù)質(zhì)量優(yōu)化檢驗(yàn)方案的選擇。運(yùn)用超幾何分布模型求出殘差并通過塊嵌套循環(huán)算法選出最優(yōu)的海洋數(shù)據(jù)質(zhì)量檢驗(yàn)方案,實(shí)驗(yàn)驗(yàn)證了該方法的可行性,從而實(shí)現(xiàn)了快速海洋數(shù)據(jù)最優(yōu)質(zhì)量檢驗(yàn)方案的選擇,完善了海洋數(shù)據(jù)質(zhì)量檢驗(yàn)理論體系。

        [1] Han Jing-yu,Xu Li-zhen,Dong Yi-sheng.Data quality sur-vey[J].Computer Science,2008,35(2):1-120.(in Chinese)

        [2] Bao Yang,Qi Xuan.Large software systems data quality issues[J].Computer Engineering and Design,2011,32:963.(in Chinese)

        [3] Xu Zi-zhou,Song De-rui.The control method of marine environmental monitoring data quality[J].Marine Environmental Science,2009,28(3):329-3340.(in Chinese)

        [4] Wang R Y,Kon H B,Madnick S E.Data quality requirements analysis and modeling[C]∥Proc of the 9th ICDE’93,1993:670-677.

        [5] Rahm E,Do Hong-hai.Data cleaning:Problems and current approaches[J].IEEE Data Engineering Bulletin,2000,23(4):3-13.

        [6] Parssian A,Sarkar S,Jacob V S.Assessing information quality for the composite relational operation joins[C]∥Proc of the 7th International Conference on Information Quality,2002:225-237.

        [7] Shi Jing-tao,Zhou Zhi-hai.Ocean station data quality control technology[J].Marine Technology,2011,30(1):114-117.(in Chinese)

        [8] Zhang Suo-ping.Single point GPS wave research methods and data quality control[J].Marine Technology,2008,27(3):15-18.(in Chinese)

        [9] Xie Ling-ling,Xiong Xue-jun,Yang Qing-xuan.LADCP configuration files and data quality control parameter settings[J].Marine Technology,2009,28(1):19-23.(in Chinese)

        [10] Zhu Lin,Zhou Shui-geng.Skyline computation:Survey[J].Computer Engineering and Applications,2008,44(6):160-165.(in Chinese)

        [11] Bartolini I,Ciaccia P,Patella M.Efficient sort-based skyline evaluation[J].ACM Transactions on Database Systems(TODS),2008,33(4):1-49.

        [12] Wang Yan-jie.Research on skyline computation and application based on data stream[D].Zhenjiang:Jiangsu University,2011.(in Chinese)

        [13] Wang Zhen-hua.Principle,methods and application of sampling inspection for quality control of geospatial data [D].Shanghai:Tongji University,2011.(in Chinese)

        [14] Kuralmani V,Govindaraju K.Modified tables for the selection of double sampling attribute plan indexed by AQL and LQL[J].Communications in Statistics.Part A:Theory and Methods,1995,24(7):1897.

        [15] Wetherill.Sampling Inspection and Quality Control[M].Yu Shan-qi,translation.Beijing:Peiking University Press,1991.(in Chinese)

        [16] Borzsonyi S,Kossmann D,Stocker K.The skyline operator[C]∥Proc of the 17th International Conference on Data Engineering(ICDE),2001:421-430.

        附中文參考文獻(xiàn):

        [1] 韓京宇,徐立臻,董逸生.數(shù)據(jù)質(zhì)量研究綜述[J].計(jì)算機(jī)科學(xué),2008,35(2):1-12.

        [2] 包陽,齊璇.大型軟件系統(tǒng)數(shù)據(jù)質(zhì)量問題研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32:963.

        [3] 徐自舟,宋德瑞.海洋環(huán)境監(jiān)測數(shù)據(jù)質(zhì)量計(jì)算機(jī)控制方法研究[J].海洋環(huán)境科學(xué),2009,28(3):329-334.

        [7] 史靜濤,周智海.海洋站數(shù)據(jù)質(zhì)量控制技術(shù)探討[J].海洋技術(shù),2011,30(1):114-117.

        [8] 張鎖平.單點(diǎn)GPS浮標(biāo)測波方法與數(shù)據(jù)質(zhì)量控制研究[J].海洋技術(shù),2008,27(3):15-18.

        [9] 謝玲玲,熊學(xué)軍,楊慶軒.LADCP配置文件和數(shù)據(jù)質(zhì)量控制的參數(shù)設(shè)定[J].海洋技術(shù),2009,28(1):19-23.

        [10] 朱琳,周水庚.Skyline計(jì)算研究綜述[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(6):160-165.

        [12] 王艷杰.基于數(shù)據(jù)流的skyline計(jì)算及應(yīng)用研究[D].鎮(zhèn)江:江蘇大學(xué),2011.

        [13] 王振華.空間數(shù)據(jù)質(zhì)量抽樣檢驗(yàn)與控制的理論、方法和應(yīng)用[D].上海:同濟(jì)大學(xué),2011.

        [15] Wetherill.抽樣檢驗(yàn)與質(zhì)量控制[M].于善奇,譯.北京:北京大學(xué)出版社,1991.

        猜你喜歡
        質(zhì)量檢驗(yàn)百分比殘差
        質(zhì)量檢驗(yàn)在新一代運(yùn)載火箭總裝總測質(zhì)量控制中的作用
        基于雙向GRU與殘差擬合的車輛跟馳建模
        基于殘差學(xué)習(xí)的自適應(yīng)無人機(jī)目標(biāo)跟蹤算法
        建筑材料的質(zhì)量檢驗(yàn)與監(jiān)督標(biāo)準(zhǔn)構(gòu)建探索
        基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
        紡織品中的纖維質(zhì)量檢驗(yàn)分析
        普通照明用自鎮(zhèn)流LED燈閃爍百分比測量不確定度分析
        電子制作(2017年20期)2017-04-26 06:57:46
        上海種子質(zhì)量檢驗(yàn)管理信息系統(tǒng)的設(shè)計(jì)與應(yīng)用
        肝癌患者外周血Treg、Th17百分比及IL-17水平觀察
        平穩(wěn)自相關(guān)過程的殘差累積和控制圖
        河南科技(2015年8期)2015-03-11 16:23:52
        久久久久成人亚洲综合精品| 久久久久女人精品毛片| 精品粉嫩av一区二区三区| 国产 一二三四五六| 亚洲最大av网站在线观看| 麻豆果冻传媒在线观看| 日本黄页网站免费大全| 亚洲国产cao| 女优av福利在线观看| 一区二区三区在线观看人妖| 国产视频一区二区三区在线免费| 国产精品186在线观看在线播放| 日韩精品久久久肉伦网站| 日韩精品人妻系列无码专区免费| 98在线视频噜噜噜国产| 久久AⅤ无码精品色午麻豆| 在线观看视频国产一区二区三区 | 欧美大胆性生话| 久久人人爽人人爽人人片av东京热| 欧美亚洲精品一区二区| 国产综合久久久久影院| 日韩在线中文字幕一区二区三区| 亚洲国产日韩一区二区三区四区 | 性感熟妇被我玩弄到高潮| 青青草在线免费视频播放| 蜜桃视频无码区在线观看| 国产偷窥熟女精品视频| 成人无码网www在线观看| 亚洲国产黄色在线观看| 国产一区二区三区视频在线观看| 国产精品久久久久9999| 黑人大荫道bbwbbb高潮潮喷 | 男人天堂av在线成人av| 一级黄片草逼免费视频| av网站大全免费在线观看| 国产亚洲一区二区在线观看| 不卡高清av手机在线观看| 久久精品国产亚洲不av麻豆| 日韩av免费在线不卡一区 | 久久久诱惑一区二区三区| 国产视频在线观看一区二区三区 |