蔣吉發(fā),劉 飛
(四川省水文水資源勘測局,四川省成都市 610036)
A-D檢驗在取水戶水量在線監(jiān)測數(shù)據(jù)穩(wěn)定性分析的應用
蔣吉發(fā),劉 飛
(四川省水文水資源勘測局,四川省成都市 610036)
本文引入Anderson-Darling檢驗方法對國家水資源監(jiān)控能力建設項目取水戶水量在線監(jiān)測數(shù)據(jù)的正態(tài)性分布特征、置信度進行分析,確認監(jiān)測數(shù)據(jù)是否穩(wěn)定、可靠。
Anderson-Darling檢驗;水資源;水量監(jiān)測;正態(tài)性
為實施最嚴格水資源管理制度,國家啟動了水資源監(jiān)控能力建設項目,其中最重要的就是對規(guī)模以上取用水戶的取水量進行在線計量監(jiān)測,作為對取水戶用水量考核和水資源費征收的重要依據(jù)[1]。
根據(jù)調查,取水戶的取水方式既有泵站揚水,又有自流引水;計量設備既有安裝在引水管道上的,也有安裝在出水管道上的,還有安裝在凈水構筑物(設備)之間的;有的取水戶只安裝一個計量裝置,有的取水戶在不同取水管上分別安裝計量裝置;有的取水戶已裝有計量裝置,有的取水戶沒有安裝計量裝置。有的取水戶既有計量裝置還因人為調整,數(shù)據(jù)偏差較大。同時,取水戶的取水量根據(jù)其供水對象不同,也呈現(xiàn)不同變化規(guī)律。供城鎮(zhèn)生活用水的取水戶白天取水量大、夜晚取水量小,夏季取水量大、冬季取水量??;對于工業(yè)企業(yè)取水戶是隨著企業(yè)生產情況、生產規(guī)律以及設備運轉情況變化的。因此,安裝的計量設備采集的瞬時流量波動頻繁,在不同時段取水量也是不同的。
項目涉及取水戶取水量較大,計量管徑一般都在300~1000mm,較大的管徑達2000mm左右。計量器具雖然在出廠時進行了檢定,但受安裝現(xiàn)場邊界條件限制和安裝調試誤差影響,計量數(shù)據(jù)存在一定誤差。由于不能影響取水戶的生產,也無法拆下計量器具送回專業(yè)檢測機構進行檢測。在項目規(guī)劃建設時,又沒有考慮由國家法定計量檢測機構對新安裝的計量設備進行現(xiàn)場在線校準檢定。因此,如何判定安裝的計量裝置工作是否穩(wěn)定、其計量數(shù)據(jù)是否穩(wěn)定可靠,是取水戶、項目單位、各級水行政主管部門非常關心的問題。如果在同一工況、同一時段內的累計取水量概率分布呈正態(tài)性分布,且置信度滿足正態(tài)性檢驗要求,即可認為該監(jiān)測點的數(shù)據(jù)是穩(wěn)定可靠的。
在現(xiàn)有正態(tài)性檢驗方法中,χ2和KS檢驗最為常用[2]。χ2對樣本長度要求較高,通常在N>200情況下才能獲得比較理想的檢驗效果;在分布參數(shù)未知并需要從樣本估計的場合,KS檢驗的精度不高[3-5]。這些缺陷限制了傳統(tǒng)分布檢驗算法在水量監(jiān)測數(shù)據(jù)穩(wěn)定性檢驗中的應用。
Anderson-Darling檢驗是正態(tài)性檢驗的一種,能夠在較小樣本(N>5)的情況下,對數(shù)據(jù)擬合度進行分析檢驗。通過計算樣本分布函數(shù)(CDF)和經驗概率密度函數(shù)(EDF)之間的二次A-D距離來衡量樣本是否屬于某一特定分布族,即判斷原假設H0是否成立[6-8]。用F(χ)和Fn(χ)分別表示樣本序列CDF和EDF。原假設H0為真,則表示樣本χ1,χ2,…,χn同分布,且分布函數(shù)為F(χ;θ),θ為分布函數(shù)參數(shù)向量。
Anderson-Darling距離A2n為:
實際工程應用中,常用離散表達式(2)來計算Anderson-Darling距離,式中Zi=F(χi)為概率積分變換(PIT)函數(shù)。
其中,Zi為參考采樣xi對應的分布函數(shù)值(CDF)。將樣本帶入式(2)即可得到A-D檢驗值A2與相應的臨界值進行比較,若大于臨界值則在置信度水平α下拒絕原假設H0,反之則接受H0。
表1 A-D檢驗正態(tài)性檢驗臨界值
采用Anderson-Darling檢驗來分析成都2012年“國控”項目取水戶水量監(jiān)測數(shù)據(jù)的分布擬合程度,從而分析監(jiān)測數(shù)據(jù)的穩(wěn)定性規(guī)律。根據(jù)有關技術要求,水資源監(jiān)控能力流量計計量誤差為不大于±5%,因此,利用A-D檢驗時α=0.05。
四川省成都市2012年度“國控”項目涉及規(guī)模以上取用水戶31戶、74處水量監(jiān)測點,主要是工業(yè)及城鎮(zhèn)生活用水。該項目新裝流量傳感器41處、直接接入既有流量傳感器33處。取水戶水量在線監(jiān)測數(shù)據(jù)通過RTU每隔5min采集一次,再通過GPRS/GSM傳輸至四川省水資源管理信息中心平臺。2014年8月15日~10月30日,共計77天,監(jiān)測點有效數(shù)據(jù)70處(其余4處因取水戶停產沒有采集數(shù)據(jù)),單點總樣本量22176。
通過對樣本數(shù)據(jù)統(tǒng)計分析,受取水方式及取水系統(tǒng)工作運行方式的影響,單點瞬時流量和時段取水量會不斷發(fā)生變化。一天24h內每小時的取水量會不盡相同,在一年365天中每天的總用水量也不盡相同。
為了解不同時段的取水水量穩(wěn)定性,按1h、3h、6h、24h五種時間間隔分析10個監(jiān)測點水量數(shù)據(jù)正態(tài)性擬合程度,結果見表2。隨著對時間間隔的不斷增加,取水水量數(shù)據(jù)的分布程度越擬合于經驗函數(shù)(CDF)。以5101240005001監(jiān)測點為例分析的概率擬合度分布見圖1。
圖1 5101240005001監(jiān)測點監(jiān)測數(shù)據(jù)正態(tài)性檢驗擬合分布圖
表2 日變化檢驗分析(N=22176,α=0.05)
根據(jù)各取水戶取水工況變化,按照日水量時間間隔分析監(jiān)測站水量數(shù)據(jù)正態(tài)性擬合程度,結果見表3。
取水戶取水水量因受供用水需求、取水方式等因素影響,單位時間內的取水量會呈現(xiàn)數(shù)據(jù)區(qū)間離散,但區(qū)間內數(shù)據(jù)又呈現(xiàn)集中的分布情況,即離散—集中分布數(shù)據(jù),見圖2、圖3。對集中的區(qū)間數(shù)據(jù)進行正態(tài)性檢驗發(fā)現(xiàn),區(qū)間內數(shù)據(jù)滿足正態(tài)性檢驗。
表3 復雜工況下監(jiān)測數(shù)據(jù)檢驗分析(N=22176,α=0.05)
圖2 5101080006001 水量(0~30000m3)概率分布立方圖
圖3 5101080006001 水量(0~30000m3)正態(tài)性檢驗擬合分布圖
由于累計取水量計取時段過短(1h、3h、6h),其取水量相對來講不太穩(wěn)定,但也不是取水時段越長越好,因為時段加長后可能出現(xiàn)不同的取水工況,其取水量也不穩(wěn)定。本項目取水量數(shù)據(jù)按24h為時間間隔,且根據(jù)取水戶取水工況,進行正態(tài)性檢驗分析。通過對項目70處監(jiān)測點的分析,34處監(jiān)測點按整體工況分析通過檢驗,36處監(jiān)測點按分解工況分析通過檢驗,其計量誤差滿足要求。
(1)通過對日水量變化及取水工作方式變化的分析,將Anderson-Darling檢驗方法引入到水量在線監(jiān)測數(shù)據(jù)穩(wěn)定性分析是可行的。
(2)以24h取水量(時段累計水量)數(shù)據(jù)為分析樣本數(shù)據(jù),以取水戶不同工況為分析情況,進行數(shù)據(jù)擬合度的分析,其成果較為可靠,計量誤差滿足要求。
(3)如果樣本系列A-D檢驗滿足正態(tài)分布,且置信度達到95%,則可認為其取水量監(jiān)測數(shù)據(jù)是穩(wěn)定的。
[1] 蔡陽.國家水資源監(jiān)控能力建設項目及其進展[J].水利信息化,2013(6):5-10.
[2] 王斌會,徐勇勇.正態(tài)性檢驗的圖示方法及其應用[J].數(shù)理統(tǒng)計與應用概率,1996,(3):249-256.
[3] 周洪偉.正態(tài)性檢驗的幾種常用的方法[J].南京曉莊學院學報,2012,(5):13-18.
[4] 張維,于盛林,張弓.基于Anderson-Darling檢驗的恒虛警檢測[J].光電工程,2009,(2):39-44.
蔣吉發(fā)(1967—),男,高級工程師,四川省水文水資源勘測局總工程師,長期從事水文水資源管理技術工作。E-mail:776984707@qq.com
劉 飛(1989—),男,助理工程師,主要從事水資源分析評價工作。E-mail:2258430275@qq.com
A-D Detection in the Application of Stability Analysis on On-line Monitoring Data about Lntake Water Amount
JIANG Jifa,LIU Fei
(Hydrology and Water Resources Survey Bureau of Sichuan Province,Chengdu 610036,China)
In the paper,Anderson-Darling detection method is used to analyze normality distribution characteristics and confidence degree of on-line monitoring data about intake water amount in the National Water Resources monitoring capacitybuilding project,in order to confirm whether the monitoring data are stable and reliable.
Anderson-Darling detection;water resources;water amount monitoring;normality distribution characteristics