牛保超,王志剛,王憲臻,郭琦,公衍宇
(河北工業(yè)大學 信息工程學院,天津 300400)
隨著數(shù)字信息技術(shù)的飛速發(fā)展,針對各種傳感器數(shù)據(jù)的實時采集和處理在現(xiàn)代工業(yè)控制和科學研究中成為必不可少的部分。因此,不同數(shù)據(jù)采集手段的有效實施已成為測控設(shè)備可靠性和安全性的重要保障。在實際應用中,一般采用固定周期的數(shù)據(jù)采集算法,根據(jù)預先設(shè)定的采集速率,周期性地采集性能數(shù)據(jù)。但是隨著技術(shù)的日益成熟、應用領(lǐng)域的越加廣泛,為了控制實時性和精確性,實時測控領(lǐng)域?qū)?shù)據(jù)采集的頻率和精度需求越來越高。采樣頻率的升高導致系統(tǒng)負擔加重,處理能力大幅降低,并且大量的數(shù)據(jù)對存儲設(shè)備也提出了嚴峻的考驗。因而,如何平衡數(shù)據(jù)數(shù)量、提高數(shù)據(jù)質(zhì)量成了當前許多數(shù)據(jù)采集系統(tǒng)不得不面對的問題。
為了從根源上在保證數(shù)據(jù)質(zhì)量的同時減少采集數(shù)量,本文提出了一種方案,依靠已經(jīng)采集到的數(shù)據(jù),實時地進行分析,從而不斷地修正采樣周期,使得采樣周期能夠快速、準確地適應被測對象的動態(tài)變化。以保證在不丟失有價值數(shù)據(jù)的同時,也不搜集過多價值不大的數(shù)據(jù)。
在測控系統(tǒng)中,現(xiàn)實中的溫度、壓力、速度等模擬量通過各種類型的傳感器按一定規(guī)律變換成為電信號,以滿足信息傳輸、處理、存儲和控制等要求,因而數(shù)據(jù)的采集方法顯得尤為重要。圖1是藥物硬度檢測實驗過程中壓力傳感器隨時間采集到的數(shù)據(jù)。
由圖1可知,在0~25s的采集過程中,測得50個數(shù)據(jù),數(shù)據(jù)量基本都在第5~13s內(nèi),僅用了16次即采集完畢,很明顯,傳統(tǒng)數(shù)據(jù)采集方法存在著嚴重的弊端:在采集對象變化平緩時采樣次數(shù)過多,加大了系統(tǒng)壓力;在采集對象變化劇烈時采樣次數(shù)不足,不能準確反映采集對象的變化趨勢。
圖1 藥物硬度曲線
一般來說,有用信息往往來自數(shù)據(jù)的大幅度變化階段,因為大幅度變化階段往往是被測量發(fā)生質(zhì)變的征兆。因而新算法需要實現(xiàn)的功能是,在有限的采樣頻率和存儲容量下,更精確地記錄變化情況,得到更多有用信息。具體來說,就是在數(shù)據(jù)變化平滑穩(wěn)定時減少采集數(shù)據(jù)點數(shù),而在數(shù)據(jù)變動劇烈時加大采集的數(shù)據(jù)點數(shù)。采集策略如下:
① 當采集到的系統(tǒng)數(shù)據(jù)變化平穩(wěn)時,數(shù)據(jù)變化不明顯,采用最大采集周期Tmax,減少對價值不大的數(shù)據(jù)的采集。
② 當采集到的系統(tǒng)數(shù)據(jù)變動劇烈時,數(shù)據(jù)急劇變化,采用最小采集周期Tmin,提高系統(tǒng)對變化數(shù)據(jù)的捕捉能力。
③ 當采集到的數(shù)據(jù)存在潛在信息量時,實時調(diào)整平衡關(guān)系,使得最優(yōu)采樣周期實時適應數(shù)據(jù)變化。
當前有多種針對采樣周期調(diào)整采集數(shù)據(jù)的方法。如Bai等人在 NCS(Networked Control Systems)系統(tǒng)中,采用效用函數(shù)(utility function)建立系統(tǒng)性能與采樣周期間的關(guān)系,并基于該函數(shù)調(diào)整采樣周期,降低數(shù)據(jù)采集對系統(tǒng)性能的影響[1],但是沒有考慮降低采樣頻率會增大采樣失真度的問題。Choi等人采用隨機抽樣機制,并依據(jù)誤差邊界(Error Bound)自適應調(diào)整網(wǎng)絡(luò)數(shù)據(jù)包的采樣頻率[2],但是存在降低采樣頻率會增大誤差邊界,進而增大采樣失真度的問題。王亞沙等人采用一元線性回歸對歷史采樣點擬合一條直線,然后根據(jù)該直線計算線性偏差平均值比,并根據(jù)線性偏差平均值比調(diào)整采樣頻率,以減小采樣失真度[3],但是由于線性偏差平均值比只采用最近一次采樣點相對于擬合直線的線性偏差與采樣平均值作計算,存在誤判率高、穩(wěn)定性差的問題。蓋炳帥等人也是采用一元線性回歸對最近多個采樣點擬合一條直線[4],但是根據(jù)該直線計算抖動比用提高或降低一定量采樣周期的調(diào)整方式會存在采集變化速度可能跟不上系統(tǒng)信號的變化速度的弊端。
基于以上分析,本文在測控系統(tǒng)中提出了一種新的自適應的采集周期調(diào)整方法。該方法采用一元線性回歸對最近的有限個采樣點擬合一條直線,然后根據(jù)該直線的斜率大小,實時地調(diào)整采樣頻率。驗證實驗表明,該方法能夠在降低平均采樣頻率的前提下減小采樣失真度,且與同類方法相比失真度低,穩(wěn)定性高。
自適應數(shù)據(jù)采集算法在采集策略實現(xiàn)的情況下要保證以下兩點特性:
① 快速適應性。在采集數(shù)據(jù)的過程中,前后數(shù)據(jù)變化量必須迅速反映到采集周期上。
② 抗干擾性。能夠剔除采集數(shù)據(jù)中因為瞬時、短暫的外界沖擊而造成的變化。
假設(shè)y=f(t)[5]表示模擬量隨時間變化的曲線,S={(t1,y1),(t2,y2),…,(tn,yn)}表示采樣集合,其中t1<t2<t1<…<tn表示采樣時間。測控系統(tǒng)通過采樣到的各點的數(shù)據(jù)進行系統(tǒng)實時控制。用直線依次連接S中各點,得到采樣曲線y′=f′(t),y′=f′(t)和y=f(t)間的面積表示采樣失真度,則采樣失真度為:
本采集方法利用對最近采樣的N個點一元線性回歸,擬合成一條直線。用yi+1表示下一個采樣點的數(shù)值,yi,yi-1,yi-2,…,yi-N代表下次采樣前最近的 N 個采樣值,ti,ti-1,…,ti-N代 表 采 樣 時 刻,并 且 滿 足ti>ti-1> … >ti-N。以y=β0+β1t表示這N個點通過一元線性回歸擬合成的直線。由一元線性回歸可以求得β0和β1的最大自然估計:
表1 斜率和采樣間隔對應表
在實際數(shù)據(jù)采集中,經(jīng)常發(fā)現(xiàn)有些數(shù)據(jù)會在一段平滑的抖動之間出現(xiàn)個別一兩個數(shù)值的突變,而這種突變只是傳感器受到外界不可避免的瞬時干擾而形成的噪聲,不能代表被測量的變化趨勢,在算法預測下一個采集間隔的過程中應當被剔除。所以在本算法中可以適當?shù)丶哟笠辉€性回歸的回歸窗口,讓多一些點參加擬合過程,可以很好地消除跳躍點的影響。因此,在數(shù)據(jù)采集之前,應該先確定參數(shù)N,來平衡干擾和靈敏度之間的取舍。
采集流程如圖2所示。
圖2 數(shù)據(jù)采集流程圖
針對本文圖1中的實驗數(shù)據(jù),分別使用等間隔數(shù)據(jù)采集算法和自適應數(shù)據(jù)采集算法進行了仿真實驗,仿真結(jié)果如圖3所示。
圖3 兩種算法的仿真結(jié)果
圖3(a)和圖3(b)都有60個采樣點,不同的是圖3(a)采用的是等間隔采樣算法,采樣間隔為0.1s,圖3(b)采用的是自適應采樣算法,其中使用的系統(tǒng)參數(shù)如表2所列。
通過對比可以很清楚地看到,在圖3(a)中,所有的采樣數(shù)據(jù)點都是均勻分布在時間軸上,而圖3(b)中的采樣點則是不均勻的。測量開始,以最小周期采樣,采樣4個點過后自適應算法啟動。通過表3中兩種算法仿真結(jié)果比較的數(shù)據(jù),可以很明顯地看到自適應采集的優(yōu)勢。
表2 自適應算法參數(shù)表
表3 兩種算法仿真結(jié)果比較
傳統(tǒng)的等間隔數(shù)據(jù)采集方法并不能按需采集數(shù)據(jù),因此本文設(shè)計了一種自適應采集算法,在保證不丟失關(guān)鍵信息量的同時減少了采集數(shù)據(jù)的數(shù)量,提高了系統(tǒng)利用率。通過MATLAB仿真驗證,自適應采集方法較傳統(tǒng)的等間隔數(shù)據(jù)采集方法有一定的優(yōu)勢,是一種可行的代替方案。
本方案已經(jīng)在藥物硬度檢測機上進行了測試,效果良好。
[1] Bai Jia,Eyisi E P,Xue Yuan,et al.Distributed Sampling Rate Adaptation for Networked Control Systems[C]//The First International Workshop on Cyber-Physical Networking Systems.Shanghai:ACM/IEEE,2011:768-773.
[2] Choi B Y,Park J,Zhang Zhi Li.Adaptive Packet Sampling for Accurate and Scalable Flow Measurement[C]//Global Telecommu-nications Conference.Dallas:IEEE,2004:1448-1452.
[3] 王亞沙,王光興.網(wǎng)絡(luò)性能管理中一種數(shù)據(jù)采集算法的研究[J].計算機研究與發(fā)展,2002,9(39):1031-1037.
[4] 蓋炳帥,王勁林.網(wǎng)絡(luò)管理系統(tǒng)中一種自適應的采樣頻率調(diào)整方法[J].網(wǎng)絡(luò)新媒體技術(shù),2012(1).
[5] Christos Stathis,Basil Maglaris.Modelling the self-similar behaviour of network traffic computer networks[J].Computer Networks,2000,34(1):37-47.