李志鵬
(江西財經(jīng)大學,江西 南昌 330013)
電壓數(shù)據(jù)的檢測是為了保障電壓的穩(wěn)定運行。一些高精密的用電設(shè)備,需要范圍波動較小的電壓。不穩(wěn)定的電壓輸入,會縮短用電設(shè)備的使用壽命,如電視機的輸入電壓長期過高或過低,會嚴重影響電視機的使用壽命。當前,針對電壓數(shù)據(jù)進行檢測有多種方法,如賀東霞等人提出的自適應濾波算法[1],可有效地保護數(shù)據(jù)圖像的細節(jié);黃旭彬提出的基于大數(shù)據(jù)[2],融合興趣偏好等的協(xié)同過濾算法,可以更容易找到需要的數(shù)據(jù);李揚提出的動態(tài)閾值分段過濾算法[3]將數(shù)據(jù)分段,對數(shù)據(jù)過濾再過濾的方法,可以減少粗略的數(shù)據(jù)。
本文提出的是一種基于最小二乘法理論基礎(chǔ)的算法。最小二乘法思想就是盡可能地提高離散數(shù)據(jù)的準確性。有學者提出通過控制輸入輸出電壓的差值來控制電壓數(shù)據(jù)[4],通過最小二乘法的思想提高輸入信號的可靠性[5],減少數(shù)據(jù)的波動[6],減小預測誤差[7],便于提高數(shù)據(jù)的可靠性。
本文對檢測到的電壓數(shù)據(jù)進行分析,采用一元線性回歸模型,表達式為y=bx+a+e,其中,b為斜率參數(shù),a為截距參數(shù),e是y與bx+a之間的隨機誤差。隨機誤差產(chǎn)生的原因有電壓檢測設(shè)備不準、公網(wǎng)電壓值波動以及算法的計算精度不同等。通過建立模型,尋找一條適當?shù)闹本€,使數(shù)據(jù)點分布在這條直線上,或無限接近這條直線。
對于n個數(shù)據(jù)點(x1,y1),(x2,y2),…,(xn,yn),由yi=bxi+a+ei,i=1,2,3,…,n可 得ei=yi-(bxi+a),隨 機誤差ei(i=1,2,3,…,n)的平方和[8-9]為
式(1)可化為
在式(2)中,由于
則:
式(4)中各項均為非負數(shù)。若需Q最小,則,得到此時:
式(5)是關(guān)于b的二次函數(shù)。要使Q最小,需當且僅當a,b的值為
則回歸方程為
設(shè)標準的電壓為0.38 kV,6 kV,10 kV,35 kV,66 kV,110 kV。以10 kV電壓為例,根據(jù)組數(shù)設(shè)置坐標。若一組取10個數(shù)據(jù)點,將編號為1至5的數(shù)據(jù)點縱坐標設(shè)置為9.95 kV,編號為6至10的數(shù)據(jù)點縱坐標設(shè)置為10 kV。所選的縱坐標均符合設(shè)備承受范圍。
若一組取10個數(shù)據(jù)點,數(shù)據(jù)采集器收集到的10個電壓值分別為9.6,10.1,10.3,9.7,9.9,10.3,10.0,10.2,9.8,10.2。將這10個電壓值作為橫坐標,則對應的數(shù)據(jù)點分別為(9.6,9.95),(10.1,9.95),(10.3,9.95),(9.7,9.95),(9.9,9.95),(10.3,10),(10.0,10),(10.2,10),(9.8,10),(10.2,10)。
根據(jù)回歸方程y^=0.039 543 058x+9.579 174計算預測值。檢測值減去預測值稱為殘差,公式為
設(shè)置殘差范圍,將殘差平方均值d設(shè)為刪除范圍上限。d的計算公式為
式中:i為數(shù)據(jù)點編號,ci為編號i的殘差值。
根據(jù)式(8)、式(9)分別計算c,d,保留滿足c2≤d的數(shù)據(jù),刪除超出范圍的數(shù)據(jù)。編號1,3,4,6的數(shù)據(jù)點不滿足條件。具體計算結(jié)果如表1所示。
設(shè)置報警系數(shù)k,統(tǒng)計不滿足條件的數(shù)據(jù),被刪除數(shù)據(jù)波動值計算公式為
式中:xi為超過殘差平方范圍的不滿足條件的電壓值,Us是當前的標準電壓值,如檢測10 kV的數(shù)據(jù),則Us=10 kV。若h超過當前標準電壓k%的平方,即h>(k%)2,報警提示,若沒有超過則不做報警提示操作。
若k=3,則通過式(10)得出表1中被刪除數(shù)據(jù)波動值h=0.001 075,(k%)2=0.000 9,h>(k%)2,則報警處理。
表1 預測值、殘差、殘差平方、殘差平方均值的具體計算結(jié)果
以上步驟的流程如圖1所示。各參數(shù)的含義如表2所示。
圖1 數(shù)據(jù)處理流程圖
表2 各參數(shù)含義
以標準電壓10 kV為例。若一組取16個數(shù)據(jù)點,將編號為1至8的數(shù)據(jù)點縱坐標設(shè)置為9.98 kV,將編號為9至16的數(shù)據(jù)點縱坐標設(shè)置為10 kV,所選的縱坐標均符合設(shè)備承受范圍。通過數(shù)據(jù)采集器收集到16個數(shù)據(jù)分為9.96,9.94,9.93,9.89,10.07,10.13,10.09,9.95,9.88,10.13,10.06,10.11,10.09,9.86,10.19,10.02,則對應的坐標值分為(9.96,9.98),(9.94,9.98),(9.93,9.98),(9.89,9.98),(10.07,9.98),(10.13,9.98),(10.09,9.98),(9.95,9.98),(9.88,10),(10.13,10),(10.06,10),(10.11,10),(10.09,10),(9.86,10),(10.19,10),(10.02,10)。通過計算,求得y^=0.023 724 052x+9.752 314 656,從而計算出c2和d,具體數(shù)據(jù)如表3所示。
表3 檢測數(shù)據(jù)預測值、殘差、殘差平方、殘差平方均值的具體計算結(jié)果
表3中有6個不滿足條件的數(shù)據(jù),再使用是否報警處理的算法。假如設(shè)置的報警系數(shù)為k=2,則h=0.000 193 333,(2%)2=0.000 4,可得h≤(k%)2,不需要報警,刪除數(shù)據(jù)即可。
通過殘差圖也能直觀地看出偏離的數(shù)據(jù)。圖2是檢測到的16個數(shù)據(jù)的殘差分布圖,黑圓點是殘差對應值。
圖2 殘差分布圖
圖2中,橫坐標是數(shù)據(jù)點編號,縱坐標是各個數(shù)據(jù)點使用回歸方程后所對應的殘差值。通過殘差圖,可大致分析需要被刪除的數(shù)據(jù)點,可以通過c2≤d進一步檢驗。
將最小二乘法加入算法中,其優(yōu)點是可以更好地保留接近標準值的數(shù)據(jù),對于偏差較大的數(shù)據(jù)通過報警處理,提醒客戶及時檢查問題。不過,此算法也有不足之處,當采集的數(shù)據(jù)全部出現(xiàn)問題時,報警器會一直響動。