南 楠
(三門峽職業(yè)技術(shù)學(xué)院,河南 三門峽 472000)
?
基于粒子濾波的RFID傳感器網(wǎng)絡(luò)中不確定數(shù)據(jù)清洗算法
南 楠
(三門峽職業(yè)技術(shù)學(xué)院,河南 三門峽 472000)
RFID技術(shù)利用互聯(lián)網(wǎng)將無線射頻識(shí)別系統(tǒng)與軟件連接可實(shí)現(xiàn)物品對(duì)象的跟蹤,具有可追溯性能力,廣泛地應(yīng)用在供應(yīng)鏈管理、資產(chǎn)跟蹤、假冒檢測(cè)等方面。然而,RFID閱讀器在大規(guī)模的數(shù)據(jù)識(shí)別網(wǎng)絡(luò)中由于環(huán)境和物理特性等所采集原始數(shù)據(jù)具有不確定性,嚴(yán)重影響其應(yīng)用結(jié)果,為獲取更準(zhǔn)確數(shù)據(jù)提出一種可追溯性框架處理不確定性數(shù)據(jù),應(yīng)用粒子濾波技術(shù)采集本地?cái)?shù)據(jù),有效解決原始數(shù)據(jù)漏讀、誤讀問題。實(shí)驗(yàn)結(jié)果表明,該算法可有效提高在大規(guī)模網(wǎng)絡(luò)中采樣的精確度與效率。
RFID;物聯(lián)網(wǎng);不確定數(shù)據(jù);粒子濾波
新一代產(chǎn)品信息網(wǎng)絡(luò)的建立如物聯(lián)網(wǎng)的形成,使RFID技術(shù)得到了廣泛的應(yīng)用,如供應(yīng)鏈管理、制造業(yè)、分銷物流、訪問控制和防偽等?;诨ヂ?lián)網(wǎng)有效的追蹤產(chǎn)品獲取相關(guān)信息,追溯其位置變化可以檢索歷史信息、存儲(chǔ)位置、時(shí)間、改變過程,提高對(duì)周圍事物的檢測(cè)能力,在無法到達(dá)現(xiàn)場(chǎng)的情況下為決策提供關(guān)鍵性支持。但RFID技術(shù)帶來利益的同時(shí),仍然存在很多問題,由于環(huán)境因素和物理干預(yù)導(dǎo)致RFID讀取數(shù)據(jù)通常是不完整、不準(zhǔn)確,甚至是誤讀[1]。
不確定性數(shù)據(jù)一般分為:多讀、漏讀和重復(fù)讀。通常處理的方法有兩種:一種是從數(shù)據(jù)庫中刪除不確定性數(shù)據(jù),對(duì)剩余數(shù)據(jù)進(jìn)行分析處理,但這種方法將導(dǎo)致分析結(jié)果的不準(zhǔn)確與不完整;另一種方法是采用過濾器的方法,基本思想是使用一個(gè)滑動(dòng)窗口預(yù)先設(shè)定閾值,讀數(shù)低于閾值讀數(shù)為假舍棄不用,但這種方法基本以實(shí)際經(jīng)驗(yàn)為基礎(chǔ),缺乏理論基礎(chǔ),不能得到廣泛應(yīng)用[2]。
本文提出了一種基于采樣的粒子濾波技術(shù)來捕獲原始射頻識(shí)別數(shù)據(jù),以概率分布為基礎(chǔ)降低識(shí)別對(duì)象的噪聲和等級(jí),對(duì)對(duì)象識(shí)別數(shù)據(jù)建立節(jié)點(diǎn)獲取數(shù)據(jù)。通過實(shí)驗(yàn)驗(yàn)證所提出的技術(shù)原型具有較高的有效性。
RFID系統(tǒng)的工作主要是將讀寫器采集數(shù)據(jù)存入后臺(tái)關(guān)系數(shù)據(jù)庫中,處理系統(tǒng)直接獲取數(shù)據(jù)進(jìn)行處理分析。但是很多RFID在應(yīng)用中都希望在海量的數(shù)據(jù)中發(fā)現(xiàn)異常數(shù)據(jù)給出提示,傳統(tǒng)的RFID系統(tǒng)只適合于處理已存在于數(shù)據(jù)庫的數(shù)據(jù),不適合對(duì)流動(dòng)的、實(shí)時(shí)數(shù)據(jù)進(jìn)行查詢。在供應(yīng)鏈管理、生產(chǎn)監(jiān)控等領(lǐng)域,流動(dòng)性數(shù)據(jù)的處理是目前最廣泛的應(yīng)用,時(shí)間和事件發(fā)生位置將成為主要獲取目標(biāo),這就造成了數(shù)據(jù)的不確定性。
在整個(gè)RFID構(gòu)成的網(wǎng)絡(luò)中,涉及到多個(gè)數(shù)據(jù)源,例如射頻識(shí)別器、傳感器和其他分布式數(shù)據(jù)源等,這些數(shù)據(jù)源產(chǎn)生大量的數(shù)據(jù)集包含與標(biāo)記對(duì)象相關(guān)聯(lián)的運(yùn)動(dòng)信息。標(biāo)簽和讀寫器之間的距離,或標(biāo)簽和讀寫器天線間的方向都會(huì)使傳感器獲取信息不準(zhǔn)確和不可靠[3]。這些都意味著對(duì)象的位置、時(shí)間、跟蹤信息成為推斷和估計(jì)原始射頻識(shí)別數(shù)據(jù)的關(guān)鍵基礎(chǔ)。基于上述情況總結(jié)出的射頻識(shí)別基本特性如下:
有序數(shù)據(jù)序列:原始的RFID讀取數(shù)據(jù)是以時(shí)間點(diǎn)進(jìn)行記錄的,表現(xiàn)形式為r={EPC,ID,Ti},其中EPC為電子產(chǎn)品代碼,ID為讀寫器ID,Ti為標(biāo)簽被檢測(cè)獲取數(shù)據(jù)的時(shí)間點(diǎn)。這些數(shù)據(jù)流記錄了檢測(cè)對(duì)象運(yùn)動(dòng)中所有信息的時(shí)間點(diǎn)。
不確定性數(shù)據(jù):RFID觀察到的數(shù)據(jù)是非常雜亂的,受到環(huán)境和標(biāo)簽與讀寫器距離的影響,RFID讀取準(zhǔn)確率往往無法達(dá)到100%,其中有些重要的數(shù)據(jù)都是不精確和不可靠的。
漏讀數(shù)據(jù):當(dāng)被標(biāo)記對(duì)象在一個(gè)讀寫器的檢測(cè)范圍內(nèi)時(shí),若讀寫器無法檢測(cè)到標(biāo)記對(duì)象則會(huì)出現(xiàn)漏讀現(xiàn)象。在這種情況下,讀寫器誤認(rèn)為標(biāo)簽的對(duì)象是不存在的,導(dǎo)致射頻識(shí)別數(shù)據(jù)的丟失。
誤讀數(shù)據(jù):當(dāng)標(biāo)記的對(duì)象超出了讀寫器的檢測(cè)范圍時(shí),可能會(huì)讀取到一個(gè)不可識(shí)別的錯(cuò)誤數(shù)據(jù),這種被稱為假陽性讀數(shù),對(duì)確定標(biāo)簽的實(shí)際位置影響很大,導(dǎo)致最終分析結(jié)果錯(cuò)誤。
基于上述分析出的RFID數(shù)據(jù)不確定問題,本文提出一種采用構(gòu)建可追溯性框架來處理不確定數(shù)據(jù)的方法。
2.1整體框架模型
對(duì)于RFID在供應(yīng)鏈中的追蹤應(yīng)用,本地應(yīng)用程序管理主要包括數(shù)據(jù)處理、粒子濾波和數(shù)據(jù)模型。在應(yīng)用程序中為了處理大量的原始射頻識(shí)別數(shù)據(jù),采用一個(gè)以采樣為基礎(chǔ)的推理技術(shù)——粒子濾波技術(shù),它可以捕捉到不確定的原始射頻識(shí)別數(shù)據(jù),從動(dòng)態(tài)和雜亂的原始數(shù)據(jù)中計(jì)算對(duì)象位置的概率分布情況。采樣計(jì)算和位置預(yù)測(cè)后,使用一種新的模式數(shù)據(jù)模型生成射頻識(shí)別的數(shù)據(jù),一旦所有原始數(shù)據(jù)處理、建模和存儲(chǔ)完成,高層次的追蹤應(yīng)用程序即可從數(shù)據(jù)庫中提取事件,實(shí)現(xiàn)數(shù)據(jù)查詢和挖掘。通過整個(gè)過程可以完成在可追溯網(wǎng)絡(luò)中對(duì)各個(gè)節(jié)點(diǎn)的數(shù)據(jù)采集,如圖1即可追溯網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)和功能圖。
2.2不確定數(shù)據(jù)概率模型
基于RFID技術(shù)的跟蹤產(chǎn)品應(yīng)用中獲取的數(shù)據(jù)往往具有不確定和不可靠性,例如產(chǎn)品被盜、被偽造、損壞等。由于捕捉數(shù)據(jù)的不確定性,這里選取一個(gè)連續(xù)的隨機(jī)變量來描述數(shù)據(jù),使用概率密度函數(shù)f(x)進(jìn)行描述隨機(jī)變量。對(duì)于RFID讀寫去獲取的不確定對(duì)象定義為變量x,它的位置信息應(yīng)該遵循設(shè)定的概率密度函數(shù)f(x)。
得出在所有射頻識(shí)別數(shù)據(jù)隨機(jī)變量x下的條件密度函數(shù)為[5]:
其中hn=∫Γ(x)f(x)dx是標(biāo)準(zhǔn)化常數(shù)。在這種情況下,位置變量x=(x1,……,xk)由邊緣驗(yàn)后密度函數(shù)計(jì)算而得[6]:
通過貝葉斯規(guī)則可計(jì)算出位置變量x,但隨著無線射頻識(shí)別數(shù)據(jù)的增加,計(jì)算時(shí)間復(fù)雜度幾何倍數(shù)增長(zhǎng),這時(shí)可引入一個(gè)以采樣為基礎(chǔ)的粒子濾波技術(shù)降低時(shí)間復(fù)雜度。
2.3粒子濾波處理不確定數(shù)據(jù)
粒子濾波處理不確定數(shù)據(jù)的基本思想是使用一組有限的隨機(jī)樣本近似估算后驗(yàn)概率密度,這些隨機(jī)樣本被稱為粒子。一個(gè)RFID的跟蹤應(yīng)用程序主要任務(wù)有兩個(gè):預(yù)測(cè)和更新。預(yù)測(cè)階段是構(gòu)建候選粒子集,更新階段是構(gòu)建合格的候選粒子集。粒子濾波技術(shù)可以有效地推斷出觀測(cè)數(shù)據(jù)的隱藏狀態(tài)(例如對(duì)象的位置)。
預(yù)測(cè)更新階段的具體算法描述如下:
輸出:預(yù)測(cè)對(duì)象樣本位置
步驟:
For?xi∈xdo
樣本xi位置+=運(yùn)動(dòng)軌跡;
樣本xi位置=擴(kuò)散率*隨機(jī)數(shù);
Endfor
測(cè)量概率p(樣本xi位置);
遞歸值計(jì)算;
For?xi∈xdo
xi測(cè)量概率p/=遞歸值;
計(jì)算xi的測(cè)量概率p;
Endfor
For?xi∈xdo
R=隨機(jī)數(shù)×給定系數(shù);
如果第一次的p1>=r給G;
將G的值賦給xi;
Endfor
采樣階段算法描述如下:
If漏讀檢測(cè)對(duì)象數(shù)據(jù)
For?xi∈xdo
搜索最近讀數(shù)(xi);
將最近傳感器位置信息與xi比較并賦值;
將xi于讀寫器距離賦值給d;
Endfor
Else
For?xi∈xdo
計(jì)算(xi-讀寫器距離)并賦值給變量d;
Endfor
Endif
實(shí)驗(yàn)以評(píng)估捕捉到的不確定性原始射頻識(shí)別數(shù)據(jù)采樣為基礎(chǔ),從動(dòng)態(tài)和低噪聲的低級(jí)別射頻識(shí)別數(shù)據(jù)中產(chǎn)生符合馬爾科夫的概率分布模型。試驗(yàn)中采用ST070-016全無源RFID芯片,該芯片工作范圍是860—960MHz,可適用于多種場(chǎng)合,系統(tǒng)主程序通過Java實(shí)現(xiàn)。實(shí)驗(yàn)主要目的是檢驗(yàn)基于粒子濾波方法的準(zhǔn)確性,使跟蹤應(yīng)用具有良好的精度。
實(shí)驗(yàn)環(huán)境設(shè)計(jì)為在一個(gè)倉庫內(nèi),記錄和處理無線射頻識(shí)別數(shù)據(jù)流跟蹤貨物位置信息,初始原始射頻識(shí)別讀數(shù)不包括位置信息,針對(duì)漏讀、誤讀等現(xiàn)象通過采用粒子濾波方法推斷出真實(shí)數(shù)據(jù)信息。具體為模擬兩個(gè)不確定數(shù)據(jù):位置不準(zhǔn)確和數(shù)據(jù)不準(zhǔn)確。模擬位置不準(zhǔn)確使用一個(gè)隨機(jī)變量表示移動(dòng)物體的運(yùn)行軌跡,并在RFID數(shù)據(jù)接收上添加2個(gè)單位高斯白噪聲標(biāo)準(zhǔn)差;模擬數(shù)據(jù)不準(zhǔn)確將隨機(jī)降低4%讀寫器的讀取數(shù)據(jù)。先將時(shí)鐘與數(shù)據(jù)接收系統(tǒng)時(shí)間同步,打開系統(tǒng)開始掃描對(duì)象標(biāo)簽,實(shí)驗(yàn)對(duì)象間隔均勻,設(shè)置每秒3個(gè)對(duì)象的掃描速度。將原始數(shù)據(jù)采集到系統(tǒng)中,進(jìn)行系統(tǒng)分析、模型建立和查詢處理。整個(gè)階段所處理的數(shù)據(jù)以元組R={TR,DR,LRPR}形式存儲(chǔ)在一張表中。通過Java編寫的應(yīng)用程序處理所有數(shù)據(jù)反饋結(jié)果。
實(shí)驗(yàn)中輸入5組數(shù)據(jù),每組100個(gè)數(shù)據(jù)記錄,設(shè)定漏讀率不同,每組數(shù)據(jù)運(yùn)行5次取平均數(shù),測(cè)試漏讀數(shù)據(jù)對(duì)位置準(zhǔn)確性的影響,最終實(shí)驗(yàn)結(jié)果如圖2所示。
圖2中的實(shí)驗(yàn)結(jié)果顯示,隨著漏讀數(shù)的增加位置精確度逐漸下降。當(dāng)漏讀數(shù)目為0時(shí),精確度接近100%;當(dāng)70%的數(shù)據(jù)漏讀時(shí),位置估測(cè)的精確度也能達(dá)到75%左右。這表明本文中所提出算法具有良好的預(yù)測(cè)效果。
實(shí)驗(yàn)過程中,還測(cè)試了優(yōu)化算法對(duì)運(yùn)行時(shí)間的影響,圖3給出的結(jié)果即為優(yōu)化算法與傳統(tǒng)算法運(yùn)行時(shí)間的對(duì)比。從圖中可以看出,當(dāng)檢測(cè)對(duì)象數(shù)達(dá)到200以后,優(yōu)化算法的運(yùn)行時(shí)間明顯減緩,優(yōu)化的算法可以減少接近總運(yùn)行時(shí)間的一半,與未優(yōu)化的算法相比,表現(xiàn)出卓越的時(shí)效性。
在射頻識(shí)別跟蹤網(wǎng)絡(luò)對(duì)象中管理不確定數(shù)據(jù)仍然是目前拓寬其應(yīng)用的挑戰(zhàn)。本文中,主要針對(duì)物聯(lián)網(wǎng)中獲取對(duì)象動(dòng)態(tài)信息,特別是處理獲取不確定的射頻識(shí)別數(shù)據(jù)進(jìn)行研究, 設(shè)計(jì)一個(gè)可追溯性清洗框架, 改進(jìn)現(xiàn)有清洗射頻識(shí)別原始數(shù)據(jù)技術(shù),提出一個(gè)基于采樣的推理技術(shù)即粒子濾波捕獲原始射頻識(shí)別不確定數(shù)據(jù),計(jì)算從動(dòng)態(tài)和雜亂底層RFID數(shù)據(jù)映射對(duì)象真實(shí)信息的概率分布,將RFID技術(shù)在無線傳感器網(wǎng)絡(luò)中的可追溯應(yīng)用變得更加準(zhǔn)確和高效。
[1]王霞,玄麗娟,夏秀峰.基于時(shí)序關(guān)系的RFID不確定數(shù)據(jù)清洗算法[J].遼寧大學(xué)學(xué)報(bào),2012,39(2):174—177.
[2]王同磊,張進(jìn)東.基于粒子濾波的RFID數(shù)據(jù)清洗方法研究[J].電子技術(shù)與軟件工程,2014,(4).
[3]夏秀峰,玄麗娟,李曉明.分流機(jī)制下的RFID不確定數(shù)據(jù)清洗策略[J].計(jì)算機(jī)科學(xué),2011,38(10A):22—24.
[4]崔紅娟.基于粒子濾波的RFID事件概率計(jì)算方法研究[D].沈陽:遼寧大學(xué),2012:58—79.
[5]王萬良,顧熙仁,趙燕偉.一種基于動(dòng)態(tài)標(biāo)簽的RFID不確定性數(shù)據(jù)清洗算法[J].計(jì)算機(jī)科學(xué),2014,41(6A):383—386.
[6]王妍,宋寶燕,付菡,等.引入卡爾曼濾波的RFID數(shù)據(jù)清洗方法[J].小型微型計(jì)算機(jī)系統(tǒng),2011,32(9):1 794—1 799.
[7]谷峪,于戈,李曉靜,等.基于動(dòng)態(tài)概率路徑事件模型的RFID數(shù)據(jù)填補(bǔ)算法[J].軟件學(xué)報(bào),2010,21(3):438—451.
責(zé)任編輯:柴造坡
10.3969/j.issn.1674-6341.2016.04.014
2016-03-30
南楠(1981—),女,河南洛陽人,碩士,講師。研究方向:計(jì)算機(jī)應(yīng)用、自動(dòng)化控制。
TP311
A
1674-6341(2016)04-0030-03