亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

面向不確定數(shù)據(jù)的概率障礙k聚集最近鄰查詢*

2018-02-05 03:46:20于嘉希張麗平

計算機與生活 2018年2期

于嘉希，李松，張麗平，劉蕾

哈爾濱理工大學(xué) 計算機科學(xué)與技術(shù)學(xué)院，哈爾濱 150080

1 引言

最近鄰查詢[1]問題是空間數(shù)據(jù)查詢研究的重要問題之一，即給定一個查詢點和數(shù)據(jù)點集，求解到該查詢點距離最近的一個數(shù)據(jù)點。為了滿足不同情況下的查詢需求，近年來對最近鄰查詢的研究已擴展到k最近鄰查詢[2]、組最近鄰查詢[3]、組障礙最近鄰查詢[4]、障礙k最近鄰查詢[5-6]、反向最近鄰查詢[7]、聚集最近鄰查詢[8]、可視最近鄰查詢[9]、不確定數(shù)據(jù)的最近鄰查詢[10]、不確定數(shù)據(jù)的反近鄰查詢[11]、不確定數(shù)據(jù)的組近鄰查詢[12]等方面。

聚集最近鄰查詢是最近鄰查詢的變體之一，在基于位置的服務(wù)中有著廣泛的應(yīng)用。給定數(shù)據(jù)點集P={p1,p2,…,pn}和查詢點集Q={q1,q2,…,qn}，通過計算數(shù)據(jù)點p到查詢點集Q的聚集距離，從而得到查詢結(jié)果。這里定義了3種聚集函數(shù)，分別為sum、max和min，聚集最近鄰的查詢結(jié)果依賴于不同的聚集函數(shù)，并且返回到查詢點集聚集距離最小的數(shù)據(jù)點。類似的，k聚集最近鄰查詢返回聚集距離最小的k個數(shù)據(jù)點的集合。

在實際應(yīng)用當(dāng)中，需要考慮一些真實環(huán)境下的限制因素?？臻g數(shù)據(jù)之間往往會存在無法穿過的障礙物，例如河流、建筑物等，這時兩點間距離不再是歐氏距離，因此需要計算障礙距離。而隨著技術(shù)的進(jìn)步和人們對采集和獲取數(shù)據(jù)技術(shù)逐漸深入，不確定數(shù)據(jù)得到了廣泛的重視，由于原始數(shù)據(jù)的不準(zhǔn)確、處理缺失值、粗細(xì)粒度的數(shù)據(jù)集合等原因，不確定數(shù)據(jù)廣泛存在于經(jīng)濟、軍事、物流、金融、電信、氣象、地理信息等領(lǐng)域[13]。不確定數(shù)據(jù)和障礙環(huán)境下的k聚集最近鄰查詢是一個新的問題。本文主要針對不確定數(shù)據(jù)的概率障礙k聚集最近鄰查詢問題進(jìn)行研究，提出基于不確定Voronoi圖的概率障礙k聚集最近鄰查詢方法，返回到查詢點集的聚集距離最小的k個數(shù)據(jù)點集，并保證其概率值大于給定閾值。

2 相關(guān)工作

傳統(tǒng)的近鄰查詢問題都是在理想的歐氏環(huán)境下進(jìn)行研究，但實際應(yīng)用當(dāng)中物體之間往往存在一些無法穿過的障礙物，因此需要考慮到障礙距離的計算。文獻(xiàn)[4]研究了障礙組最近鄰查詢問題，通過構(gòu)造剪枝區(qū)域去剪枝對障礙距離計算沒有影響的障礙，從而減少計算量，提高查詢效率。文獻(xiàn)[5]和文獻(xiàn)[6]利用障礙Voronoi圖的特性提出剪枝策略，減少了需要處理的數(shù)據(jù)點個數(shù)。

文獻(xiàn)[8]研究了聚集最近鄰查詢，提出了3種利用R樹處理聚集最近鄰查詢的方法：MQM（multiple query method）、SPM（single point method）和 MBM（minimum bounding method）。這3種方法中，MBM是最優(yōu)算法。文獻(xiàn)[14]研究了路網(wǎng)環(huán)境下移動對象的k聚集最近鄰查詢方法，通過剪枝得到候選集合的方法進(jìn)行求解。當(dāng)聚集最近鄰查詢的聚集函數(shù)為sum時，被稱為組最近鄰查詢。文獻(xiàn)[3]給出了3種基于R樹索引的處理組最近鄰查詢的方法，分別是MQM、SPM和MBM。文獻(xiàn)[15]提出了一種基于查詢點集Q中兩種最遠(yuǎn)點構(gòu)成的橢圓及其MBR（minimum bounding rectangle）對中間節(jié)點進(jìn)行剪枝的方法。文獻(xiàn)[16]針對無索引數(shù)據(jù)點集，提出了up-ANN算法和投影剪枝算法，有效提高了組近鄰查詢效率。

以上處理聚集最近鄰查詢的方法針對的都是確定數(shù)據(jù)，而現(xiàn)實應(yīng)用中往往要處理大量的不確定數(shù)據(jù)。文獻(xiàn)[17]對不確定數(shù)據(jù)的聚集最近鄰查詢進(jìn)行研究，并提出了空間剪枝和概率剪枝兩種方法，對數(shù)據(jù)點集進(jìn)行剪枝，有效提高了查詢效率。文獻(xiàn)[18]基于存在不確定數(shù)據(jù)，研究了范圍查詢、最近鄰查詢、反最近鄰查詢的解決方法。文獻(xiàn)[19-20]提出了不確定數(shù)據(jù)的組最近鄰查詢方法。

已有方法無法處理不確定數(shù)據(jù)的障礙k聚集最近鄰查詢問題，因此本文提出了基于不確定Voronoi圖的概率障礙k聚集最近鄰查詢方法。

3 基礎(chǔ)定義

本文研究位置不確定數(shù)據(jù)，并采用如下形式的不確定數(shù)據(jù)模型：給定不確定數(shù)據(jù)點集P={p1,p2,…,pn}，每個不確定數(shù)據(jù)在各自的不確定區(qū)域中任意分布，該區(qū)域可以為任意形狀，并以一個概率密度函數(shù)描述它在該區(qū)域內(nèi)的分布情況。本文假定不確定數(shù)據(jù)pi位于一個以Cpi為圓心，為半徑的不確定區(qū)域圓UR(pi)中。以O(shè)={O1,O2,…,On}描述障礙物集合，并假定各個障礙物之間互不相交，且障礙物與不確定數(shù)據(jù)的不確定區(qū)域互不重疊，以線段來表示障礙物。本文求解概率障礙k聚集最近鄰查詢問題使用不確定Voronoi圖，其相關(guān)定義在文獻(xiàn)[19,21]中已經(jīng)給出，本文在文獻(xiàn)[4]提出的可視性、障礙距離等基礎(chǔ)上，提出以下定義。

定義1（不確定數(shù)據(jù)的最小障礙距離與最大障礙距離）給定不確定數(shù)據(jù)點集合P={p1,p2,…,pn},對于不確定數(shù)據(jù)點pi,pj∈P，其不確定區(qū)域半徑分別為rpi、rpj，則pi到pj的最小障礙距離為，最大障礙距離為。

定義2（障礙聚集距離）給定數(shù)據(jù)點集P={p1,p2,…,pn}，查詢點集Q={q1,q2,…,qn}，障礙集合O={O1,O2,…,On}。數(shù)據(jù)點p到查詢點集Q的障礙聚集距離定義為：

其中，disto(p,qi)代表數(shù)據(jù)點p到查詢點qi的障礙距離。f代表聚集函數(shù)sum、max或min。根據(jù)不同的聚集函數(shù)，可根據(jù)如下方式計算其相應(yīng)的聚集距離：

定義3（障礙聚集最近鄰查詢）給定數(shù)據(jù)點集P={p1,p2,…,pn}，查詢點集Q={q1,q2,…,qn}，障礙集合O={O1,O2,…,On}，障礙聚集最近鄰查詢返回到查詢點集的障礙聚集距離adisto-f(p,Q)最小的數(shù)據(jù)點，即滿足：

定義4（概率障礙k聚集最近鄰查詢）給定不確定數(shù)據(jù)點集合P={p1,p2,…,pn}，查詢點集合Q={q1,q2,…,qn}，障礙集合O={O1,O2,…,On}，閾值T，則不確定數(shù)據(jù)的概率障礙k聚集最近鄰查詢返回形如{s,prob(s)}的查詢結(jié)果。其中s為數(shù)據(jù)點集合的子集，由到查詢點集的障礙聚集距離最小的k個數(shù)據(jù)點組成，prob(s)為該集合成為查詢點集Q的障礙k聚集最近鄰集合的概率值，且prob(s)＞T,T∈(0,1],i=1,2,…,k。prob(s)計算公式為：

其中，di(r)和Di(r)分別為pi到查詢點集的障礙聚集距離的概率密度函數(shù)和累計分布函數(shù)。

4 基于不確定Voronoi圖的概率障礙k聚集最近鄰查詢方法

4.1 查詢點集處理階段

聚集最近鄰查詢的難點為針對多個查詢點求解在不同聚集函數(shù)下的聚集最近鄰點，因此本節(jié)通過Min_Circle(Q)算法求解查詢點集的最小覆蓋圓，用該最小覆蓋圓的圓心O代表查詢點集的分布情況，以此作為查詢點中心q，將問題進(jìn)行簡化，方便后文的剪枝處理階段。本文采用增量法計算查詢點集的最小覆蓋圓，提出算法Min_Circle(Q)。首先做出前i-1個查詢點的最小覆蓋圓，再加入第i個點，如果它在圓內(nèi)或圓周上，則什么也不做；否則取距離當(dāng)前最小覆蓋圓圓心的最遠(yuǎn)點qm，得到新的最小覆蓋圓。重復(fù)以上過程依次遍歷查詢點集，直至所有查詢點都在圓中（或圓周上），則該圓就是所求的最小覆蓋圓。

如圖1為求解最小覆蓋圓的示例圖。首先任取兩點qi、qj，以兩點間距離dist(qi,qj)為直徑做圓，得到當(dāng)前最小覆蓋圓O1。對于Q中的點，判斷它是否在當(dāng)前最小覆蓋圓內(nèi)（或圓周上）。根據(jù)判斷結(jié)果，執(zhí)行相應(yīng)語句，找到與當(dāng)前最小覆蓋圓圓心距離最遠(yuǎn)的查詢點qm，不斷擴大最小覆蓋圓，最終使之覆蓋所有查詢點。所得到的圓就是覆蓋所有查詢點的最小覆蓋圓。

Fig.1 Example of minimum covered circle圖1 最小覆蓋圓示例圖

基于以上討論，給出算法1。

算法1 Min_Circle(Q)

4.2 過濾階段

過濾階段為了更好地過濾掉無關(guān)數(shù)據(jù)點，采用剪枝策略對數(shù)據(jù)點集P進(jìn)行剪枝處理，從而得到候選集合。為得到剪枝策略，首先給出如下定理。

定理1給定不確定數(shù)據(jù)點集合P={p1,p2,…,pn}，對于某一查詢點q，若它所在的不確定Voronoi區(qū)域生成點集合為M，則它的k最近鄰點必包含在M及M的k級鄰接生成點中。

證明由不確定Voronoi圖的性質(zhì)可知，若查詢點q落在不確定Voronoi區(qū)域UVP(pi)中，則q到生成點pi的距離小于q到其他生成點的距離。若該Voronoi區(qū)域為單生成點Voronoi區(qū)域SUV(pi),則pi一定是q的最近鄰點，故其k最近鄰點在pi的k級鄰接生成點中；若該Voronoi區(qū)域為多生成點Voronoi區(qū)域MUV(pi,pj)，q的最近鄰點一定在此區(qū)域的多生成點中，其k最近鄰點一定在多生點的k級鄰接生成點中。故該定理成立。 □

定理2[22]對于不確定Voronoi單元UVP(pi)內(nèi)任意一點q，則對q的第k+1個最近鄰qk+1有qk+1∈AG1(p)∪AG2(p)∪…∪AGk(p)(k為整數(shù)，k≥1)，即q的第k+1個最近鄰點在q的最近鄰前k級生成點中。

定理3若某數(shù)據(jù)點pi在不確定Voronoi圖中的所有鄰接生成點都被剪枝，則pi也被剪枝。

證明若某數(shù)據(jù)點pi的所有鄰接生成點都被剪枝，說明在其鄰接生成點所在層次范圍內(nèi)，已有數(shù)據(jù)點的障礙聚集距離小于該鄰接生成點，則pi不可能成為所求結(jié)果，故可被剪枝。 □

定理4對于某一不確定數(shù)據(jù)點p和查詢點q，記num(p,q)為p與q之間所有到q可視的點的個數(shù)，若num(p,q)≥k，則將p剪枝。

證明當(dāng)k=1時，設(shè)p與q之間經(jīng)過點p1，且p1與q可視，則p1到q的距離一定小于p到q的距離，故p一定不是所求，可將其剪枝；當(dāng)k＞1時，p與q經(jīng)過的數(shù)據(jù)點中已有超過k個與q可視，說明這些數(shù)據(jù)點到q的距離一定小于q到p的距離，則p一定不是所求，可將其剪枝。 □

定理5若某一數(shù)據(jù)點到查詢點集的最小障礙聚集距離大于adistk-o-max，則可將該數(shù)據(jù)點剪枝。其中，adistk-o-max表示數(shù)據(jù)點到查詢點集的最大障礙聚集距離中第k小的距離。

證明以第k小的最大障礙聚集距離為半徑做圓，其圓心為查詢點集的中心，則不確定區(qū)域與該圓無交集的數(shù)據(jù)點均可剪枝。這是由于這些點到查詢點的最小障礙聚集距離已經(jīng)大于第k小的最大距離adistk-o-max，說明在該圓范圍內(nèi)已經(jīng)至少存在k個數(shù)據(jù)點到查詢點的障礙聚集距離小于等于adistk-o-max，因此可將其剪枝。 □

過濾階段的具體剪枝規(guī)則根據(jù)不同的聚集函數(shù)有所不同，下面針對不同的聚集函數(shù)，分別給出相應(yīng)的剪枝規(guī)則。

4.2.1 聚集函數(shù)f=sum

當(dāng)聚集函數(shù)為sum時，求解到查詢點集的障礙距離之和最小的k個數(shù)據(jù)點。過濾階段采用算法1得到的中心點q代表查詢點集的分布。根據(jù)定理1至定理5，提出如下5項剪枝策略。

剪枝策略1只有查詢點中心q到生成點的個數(shù)小于或等于k的生成點才能放入候選集中。

剪枝策略2若某數(shù)據(jù)點pi在不確定Voronoi圖中的所有鄰接生成點都被剪枝，則pi也被剪枝。

剪枝策略3對于某一不確定數(shù)據(jù)點p和查詢點q，記num(p,q)為p與q之間所有到q可視的點的個數(shù)，若num(p,q)≥k，則將p剪枝。

剪枝策略4若某一數(shù)據(jù)點到查詢點的最小障礙距離大于distk-o-max，則可將該數(shù)據(jù)點剪枝。其中distk-o-max表示數(shù)據(jù)點到查詢點的最大障礙距離中第k小的距離，即distk-o-max=k-min{disto-max(q,Ci)}。

剪枝策略5用隊列H存儲元組(pi,disto-min(q,pi))，并按disto-min(q,pi)升序排列，使用剪枝策略4進(jìn)行剪枝。若某數(shù)據(jù)點p被剪枝，則p后的所有查詢點都被剪枝，過濾階段結(jié)束。

圖2為f=sum情況下的概率障礙k聚集最近鄰查詢剪枝階段示例圖。在對數(shù)據(jù)點集P進(jìn)行剪枝時，剪枝策略1根據(jù)定理2提出，要查找q的第i+1個最近鄰只需在q最近鄰的前i級鄰接生成點中進(jìn)行查詢，確保了查詢點集的障礙k聚集最近鄰點一定在候選集合中，且不會包含多余的點，保證了過濾算法的正確性。剪枝策略2根據(jù)定理3提出，對數(shù)據(jù)點集進(jìn)行剪枝，若某數(shù)據(jù)點pi的所有鄰接生成點都被剪枝，則說明在此區(qū)域中不會再有障礙聚集距離小于已獲得的障礙聚集距離，則可將其剪枝。剪枝策略3根據(jù)定理4提出，若q與pi之間存在超過k個可視的數(shù)據(jù)點，則可將pi剪枝。剪枝策略4根據(jù)定理5提出，通過求解第k小的最大障礙距離進(jìn)而剪枝不可能成為結(jié)果的數(shù)據(jù)點。剪枝策略5利用隊列H并將其元素排序，結(jié)合剪枝策略4，將不滿足查詢要求的數(shù)據(jù)一次性剪枝。

Fig.2 Example of pruning phase in case of f=sum圖2 f=sum情況下的剪枝階段示例圖

基于以上討論，給出算法2。

算法2 Sum_Can(Q,P,O,k)

4.2.2 聚集函數(shù)f=max

當(dāng)聚集函數(shù)為max時，求解使到查詢點集的障礙距離中最大值最小的k個數(shù)據(jù)點。過濾階段使用以下幾種剪枝策略對數(shù)據(jù)點集P進(jìn)行剪枝處理，以減少無關(guān)數(shù)據(jù)對結(jié)果計算的影響。根據(jù)定理1至定理5，提出以下4項剪枝策略。

剪枝策略1根據(jù)定理2，只有查詢點中心q到生成點的個數(shù)小于或等于k的生成點才能放入候選集中。

剪枝策略2根據(jù)定理3，若某數(shù)據(jù)點pi在不確定Voronoi圖中的所有鄰接生成點都被剪枝，則pi也被剪枝。

剪枝策略3根據(jù)定理4，對于某一不確定數(shù)據(jù)點p和查詢點q，記num(p,q)為p與q之間所有到q可視的點的個數(shù)，若num(p,q)≥k，則將p剪枝。

剪枝策略4根據(jù)定理5，若某一數(shù)據(jù)點到查詢點集的最小障礙聚集距離大于adistk-o-max，則可將該數(shù)據(jù)點剪枝。其中adistk-o-max表示第k小的最大障礙聚集距離，adistk-o-max=k-min{adisto-max(Q,pi)}。

基于以上討論，給出算法3。

算法3 Max_Can(P,Q,O,k)

4.2.3 聚集函數(shù)f=min

當(dāng)聚集函數(shù)為min時較為簡單，需求解到查詢點集合的最小障礙距離最小的k個數(shù)據(jù)點。由定理1可知，給定某一查詢點，確定它所在的不確定Voronoi區(qū)域，則它的k近鄰點一定在此區(qū)域的生成點及其k級鄰接生成點中，因此在過濾階段利用不確定Voronoi圖的性質(zhì)將查詢點集的生成點及鄰接生成點加入候選集合Min_Candidate。f=min情況下的剪枝規(guī)則由定理1給出，首先找到查詢點集中心q在不確定Voronoi圖中的位置，確定其所在的不確定Voronoi區(qū)域，將該不確定Voronoi區(qū)域的生成點及其k級鄰接生成點放入候選集合。

算法4 Min_Can(P,Q,O,k)

4.3 精煉階段

本文通過前兩個階段，對數(shù)據(jù)點集進(jìn)行了剪枝，移除了不可能成為查詢結(jié)果的數(shù)據(jù)點，并得到了候選集合。接下來在精煉階段，要對候選集合中的數(shù)據(jù)點進(jìn)行概率值求解，并與給定閾值進(jìn)行比較，得到結(jié)果集合。給出算法5。

算法5 POkANN(P,Q,O,k)

5 實驗與分析

通過實驗驗證本文提出的POkANN方法的性能。由于本文首次對概率障礙k聚集最近鄰查詢問題進(jìn)行研究，且現(xiàn)有的聚集最近鄰查詢算法沒有考慮障礙物存在對結(jié)果的影響，返回的查詢結(jié)果也只有一個，無法直接用于概率障礙k聚集最近鄰查詢，不能直接進(jìn)行比較，從而基于基本查詢技術(shù)，設(shè)計了兩個基本算法與本文算法進(jìn)行比較。第一個算法直接計算各個數(shù)據(jù)點到查詢點集的障礙聚集距離，計算其成為結(jié)果的概率值，返回形如{s,prob(s)}的查詢結(jié)果。其中s為數(shù)據(jù)點集合的子集，由到查詢點集的障礙聚集距離最小的k個數(shù)據(jù)點組成，prob(s)為該集合成為查詢點集Q的障礙k聚集最近鄰集合的概率值且滿足prob(s)＞T，將該算法稱為POkANN_Basic算法。第二個算法稱為POANN*算法，POANN*算法的主要思想是對文獻(xiàn)[12]中經(jīng)過改進(jìn)的POANN*算法加入障礙后重復(fù)調(diào)用k次來完成概率障礙k聚集最近鄰查詢?nèi)蝿?wù)。

實驗硬件環(huán)境為AMD雙核2.2 GHz處理器，2 GB內(nèi)存，Windows 7操作系統(tǒng)，使用Visual C++6.0實現(xiàn)。不確定數(shù)據(jù)點集P來自真實數(shù)據(jù)集Long Beach Road（http://www.rtreeportal.org），由53 144個矩形表示數(shù)據(jù)點，對于每個不確定數(shù)據(jù)，其不確定區(qū)域由矩形的中心為圓心，對角線的一半為半徑形成的區(qū)域圓來表示。查詢點集Q為隨機生成的點，并隨機生成障礙集合，采用UV-index對不確定Voronoi圖進(jìn)行索引，障礙集由線段表示。本實驗主要從k值、障礙物規(guī)模、查詢點集規(guī)模對查詢時間的影響及剪枝比率進(jìn)行驗證，并將POkANN_Basic算法和POANN*算法與本文提出的POkANN算法進(jìn)行對比實驗。實驗結(jié)果為執(zhí)行100次查詢結(jié)果取平均值得到。

圖3和圖4分別驗證了聚集函數(shù)sum和max情況下k值對查詢時間的影響。從圖中可以看出，在其他條件不變的情況下，隨著k值的增加，由于3種算法對于障礙聚集距離和概率值的計算量增加，導(dǎo)致查詢時間逐漸增長。但由于本文POkANN算法具有剪枝策略，去除了不可能成為結(jié)果的數(shù)據(jù)點，有效地減少了計算量，查詢時間優(yōu)于另外兩種算法。

Fig.3 Effect ofkon query time(f=sum)圖3 k值對查詢時間的影響（f=sum）

Fig.4 Effect ofkon query time(f=max)圖4 k值對查詢時間的影響（f=max）

圖5和圖6分別驗證了聚集函數(shù)sum和max情況下障礙物個數(shù)對查詢時間的影響。從圖中可以看出，在其他條件不變的情況下，隨著障礙物個數(shù)的增加，查詢時間也隨之增加，這是由于大量的障礙聚集距離計算量所導(dǎo)致的。隨著障礙物的增加，另兩種算法的查詢時間顯著增長，而本文POkANN算法優(yōu)勢在于過濾階段的剪枝策略將不可能成為查詢結(jié)果的數(shù)據(jù)點剪枝，有效減少了障礙聚集距離的計算量，因此POkANN算法略好于另兩種算法。

Fig.5 Effect of the number of obstacles on query time(f=sum)圖5 障礙物個數(shù)對查詢時間的影響（f=sum）

Fig.6 Effect of the number of obstacles on query time(f=max)圖6 障礙物個數(shù)對查詢時間的影響（f=max）

圖7和圖8分別驗證了聚集函數(shù)sum和max情況下查詢點集規(guī)模的變化對查詢時間的影響。從圖中可以看出，在其他條件不變的情況下，隨著查詢點數(shù)量的增加，3種算法的查詢時間都有所增加，這是由于查詢點的增加，導(dǎo)致了障礙聚集距離的計算量增大，數(shù)據(jù)點要分別計算到各個查詢點的障礙聚集距離。本文POkANN算法在查詢點集處理階段需要計算查詢點集的最小覆蓋圓，需要消耗一部分的查詢時間，因此在查詢點較少時，查詢時間多于POANN*算法，但隨著查詢點數(shù)量的增加，其優(yōu)勢逐漸顯現(xiàn)出來，在過濾階段，通過剪枝策略將不可能成為結(jié)果的數(shù)據(jù)點剪枝，因此會有效地減少障礙聚集距離的計算量。

Fig.7 Effect of query data set size on query time(f=sum)圖7 查詢點集規(guī)模對查詢時間的影響（f=sum）

Fig.8 Effect of query data set size on query time(f=max)圖8 查詢點集規(guī)模對查詢時間的影響（f=max）

6 結(jié)束語

本文提出了基于不確定Voronoi圖的概率障礙k聚集最近鄰查詢算法（POkANN）。結(jié)合聚集最近鄰查詢的特點，本文算法分為3個階段：首先通過求解最小覆蓋圓處理查詢點集；再通過不同的剪枝策略處理相應(yīng)聚集函數(shù)下的數(shù)據(jù)點集，得到候選集合；最后對候選集合中的數(shù)據(jù)進(jìn)行精煉，并與給定閾值進(jìn)行比較，返回結(jié)果集。通過實驗進(jìn)行驗證，本文算法具有較好的性能。未來的研究重點主要集中在以下兩點：

（1）存在級不確定數(shù)據(jù)k聚集最近鄰查詢問題；（2）不確定數(shù)據(jù)的可視聚集最近鄰查詢問題。

[1]Ling Ping,Rong Xiangsheng,Dong Yongquan.Clusteringbased nearest neighbor searching[J].Journal of Computers,2013,8(8):2085-2092.

[2]Kim H I,Chang J W.k-nearest neighbor query processing algorithms for a query region in road networks[J].Journal of Computer Science and Technology,2013,28(4):585-596.

[3]Papadias D,Shen Qiongmao,Tao Yufei,et al.Group nearest neighbor queries[C]//Proceedings of the 20th International Conference on Data Engineering,Boston,Mar 30-Apr 2,2004.Washington:IEEE Computer Society,2004:301-312.

[4]Yang Zexue,Hao Zhongxiao.Group obstacle nearest neighbor query in spatial database[J].Journal of Computer Research and Development,2013,50(11):2455-2462.

[5]Gu Yu,Yu Ge,Yu Xiaonan.Efficient method forknearest neighbor searching in obstructed spatial databases[J].Journal of Information Science&Engineering,2014,30(5):1569-1583.

[6]Yu Xiaonan,Gu Yu,Zhang Tiancheng,et al.A method forknearest-neighbor queries obstructed spaces[J].Chinese Journal of Computers,2011,34(10):1917-1925.

[7]Safar M,Ibrahimi D,Taniar D.Voronoi-based reverse nearest neighbor query processing on spatial networks[J].Multimedia Systems,2009,15(5):295-308.

[8]Papadias D,Tao Yufei,Mouratidis K,et al.Aggregate nearest neighbor queries in spatial databases[J].ACM Transactions on Database Systems,2005,30(2):529-576.

[9]Nutanong S,Tanin E,Zhang Rui.Incremental evaluation of visible nearest neighbor queries[J].IEEE Transactions on Knowledge and Data Engineering,2010,22(5):665-681.

[10]Liu Wenyuan,Du Ying,Chen Zijun.Nearest neighbor queries with range constrained on uncertain data[J].Journal of Chinese Computer Systems,2012,33(6):1189-1194.

[11]Lian Xiang,Chen Lei.Efficient processing of probabilistic reverse nearest neighbor queries over uncertain data[J].The VLDB Journal,2009,18(3):787-808.

[12]Lian Xiang,Chen Lei.Probabilistic group nearest neighbor queries in uncertain databases[J].IEEE Transactions on Knowledge and Data Engineering,2008,20(6):809-824.

[13]Zhou Aoying,Jin Cheqing,Wang Guoren,et al.A survey on the management of uncertain data[J].Chinese Journal of Computers,2009,32(1):1-16.

[14]Chen Wen.K-aggregate nearest neighbor query method of moving objects in road networks[J].International Journal of Database Theory andApplication,2016,9(4):151-160.

[15]Li Hongga,Lu Hua,Huang Bo,et al.Two ellipse-based pruning methods for group nearest neighbor queries[C]//Proceedings of the 13th International Workshop on Geographic Information System,Bremen,Nov 4-5,2005.New York:ACM,2005:192-199.

[16]Luo Yanmin,Chen Hanxiong,Furuse K,et al.Efficient mthods in finding aggregate nearest neighbor by projectionbased filtering[C]//LNCS 4707:Proceedings of the 2007 International Conference on Computational Science and Its Applications,Kuala Lumpur,Aug 26-29,2007.Berlin,Heidelberg:Springer,2007:821-833.

[17]Lian Xiang,Chen Lei.Probabilistic group nearest neighbor queries in uncertain databases[J].IEEE Transactions on Knowledge and Data Engineering,2008,20(6):809-824.

[18]Yiu M L,Mamoulis N,Dai Xiangyuan,et al.Efficient evaluation of probabilistic advanced spatial queries on existentially uncertain data[J].IEEE Transactions on Knowledge and Data Engineering,2009,21(1):108-122.

[19]Sun Dongpu,Hao Xiaohong,Gao Shuang,et al.Probabilistic group nearest neighbor queries based on uncertain Voronoi diagram[J].Journal of Beijing University of Agriculture,2013,28(4):73-75.

[20]Chen Mo,Jia Zixi,Gu Yu,et al.Group nearest neighbor queries over existentially uncertain data[J].Journal of Chinese Computer Systems,2012,33(4):684-687.

[21]Chen R,Xie Xike,Yiu M L,et al.UV-diagram:a Voronoi diagram for uncertain data[C]//Proceedings of the 26th International Conference on Data Engineering,Long Beach,Mar 1-6,2010.Washington:IEEE Computer Society,2010:796-807.

[22]Zhang Liping,Liu Lei,Li Song.Group reverseknearest neighbor query based on voronoi diagram in spatial databases[J].Journal of Frontiers of Computer Science and Technology,2016,10(10):1365-1375.

附中文參考文獻(xiàn)：

[4]楊澤雪,郝忠孝.空間數(shù)據(jù)庫中的組障礙最近鄰查詢研究[J].計算機研究與發(fā)展,2013,50(11):2455-2462.

[6]于曉楠,谷峪,張?zhí)斐?等.一種障礙空間中的反k最近鄰查詢方法[J].計算機學(xué)報,2011,34(10):1917-1925.

[10]劉文遠(yuǎn),杜穎,陳子軍.不確定數(shù)據(jù)上范圍受限的最近鄰查詢算法[J].小型微型計算機系統(tǒng),2012,33(6):1189-1194.

[13]周傲英,金澈清,王國仁,等.不確定性數(shù)據(jù)管理技術(shù)研究綜述[J].計算機學(xué)報,2009,32(1):1-16.

[19]孫冬璞,郝曉紅,高爽,等.基于不確定Voronoi圖的概率組最近鄰查詢[J].北京農(nóng)學(xué)院學(xué)報,2013,28(4):73-75.

[20]陳默,賈子熙,谷峪,等.面向存在不確定對象的組最近鄰查詢方法[J].小型微型計算機系統(tǒng),2012,33(4):684-687.

[22]張麗平,劉蕾,李松,等.空間數(shù)據(jù)庫中基于Voronoi圖的組反k最近鄰查詢[J].計算機科學(xué)與探索,2016,10(10):1365-1375.