李建青 張云云 康健
摘 要:更換變壓器工程是生產(chǎn)技改工程的重要組成部分,分析工程造價合理性,往往需要參考已施過的工程造價數(shù)據(jù),在對過去樣本進行數(shù)據(jù)整理過程中,為獲得合理投資區(qū)間,需要對異常數(shù)值進行篩選剔除。本文通過3δ原則和箱線圖法對更換變壓器工程單位造價進行數(shù)據(jù)整理,獲得合理造價區(qū)間,為項目立項、投資計劃制定提供參考。
關鍵詞:更換變壓器工程;數(shù)據(jù)整理;3δ原則;箱線圖法
中圖分類號:TM73 文獻標識碼:A 文章編號:1671-2064(2018)23-0155-03
1 樣本情況
本次整理2014-2017年變壓器更換工程數(shù)據(jù)共21項,整理前各電壓等級單位造價樣本區(qū)間分別為35kV:43.15元/kVA-104.66元/kVA,110kV:52.10元/kVA-66.06元/kVA,220kV:37.26元/kVA,具體如表1所示。
由于110kV電壓等級和220kV電壓等級樣本均不大于5,本次不做區(qū)間整理,本次僅對35kV更換變壓器工程做整理分析。
電壓等級為35kV的樣本描述統(tǒng)計如表2所示。
數(shù)據(jù)散點圖如圖1所示。
2 整理方法
對所有技改造價數(shù)據(jù)進行的數(shù)據(jù)分析主要分為三個部分:(1)樣本的描述統(tǒng)計;(2)異常值剔除、異常數(shù)據(jù)分析;(3)總體的區(qū)間估計。
2.1 樣本的描述統(tǒng)計
統(tǒng)計樣本的均值、中位數(shù)、方差、標準差、極小值、極大值、范圍、四分位距、偏度、峰度、散點圖等。
軟件實現(xiàn):使用spss軟件進行描述性統(tǒng)計分析。
2.2 異常值剔除
篩除異常值的常用方法有3δ原則和箱線圖法。
3δ原則;首先,運用樣本數(shù)據(jù)來繪制頻率分布直方圖。
其次,根據(jù)頻率分布直方圖顯示結(jié)果來擬合出概率密度曲線,并得出相應的概率密度函數(shù)。當數(shù)據(jù)服從正態(tài)分布時,根據(jù)正態(tài)分布的定義可知,μ為樣本數(shù)據(jù)的均值,δ為樣本數(shù)據(jù)的偏差。而距離均值3δ之外的概率為P(|×-μ|>3δ)<=0.003,這屬于極小概率事件,在默認情況下我們可以認定,距離超過均值3δ之外的樣本是不存在的。因此當樣本數(shù)據(jù)距離平均值大于3δ時,則認為該樣本數(shù)據(jù)為異常值。當數(shù)據(jù)不服從正態(tài)分布時,可以通過遠離平均距離多少倍的標準差來判定,多少倍的取值需要根據(jù)經(jīng)驗和實際情況來決定,具體如圖2所示。
本報告數(shù)據(jù)整理采取箱線圖法。箱線圖由五部分構(gòu)成,分別是最小值、中位數(shù)、最大數(shù)和兩個四分位數(shù)Q1和Q2。而篩除異常值則是去除樣本中小于Q1-1.5IQR或大于Q2+1.5IQR的數(shù)值。
第一步,計算出樣本的第一個四分位數(shù)Q1,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字。
第二步,計算出樣本的中位數(shù)F,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。
第三步,計算出樣本的Q2,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字。
第四步,計算出樣本的四分位距IQR。
IQR=Q2-Q1
最后,計算出Q1-1.5IQR和Q2+1.5IQR的值,并剔除兩者區(qū)間外的異常值。
軟件實現(xiàn):使用spss、python和matlab進行繪圖與計算,箱線圖兩個胡須的末端并非準確的1.5倍箱子長度,而是不超過該長度的最遠的值,所以使用python/matlab計算異常值范圍,因為造價數(shù)據(jù)為正值,對于下限為負值的改為該區(qū)間的最小值,異常值的最終確定以spss輸出的箱線圖結(jié)果為準。
異常值選出后,還需要根據(jù)具體工程對異常值進行分析,分析異常發(fā)生的原因,以減少后續(xù)技改造價數(shù)據(jù)填報的異常率。
2.3 總體的區(qū)間估計
區(qū)間估計是從點估計值和抽樣標準誤出發(fā),按給定的概率值建立包含待估計參數(shù)的區(qū)間.其中這個給定的概率值稱為置信度或置信水平,這個建立起來的包含待估計函數(shù)的區(qū)間稱為置信區(qū)間,指總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)內(nèi)的概率。
因為很多數(shù)據(jù)的樣本量不大,總體分布未知,所以使用walsh平均順序統(tǒng)計量構(gòu)造對稱中心的置信區(qū)間,這一方法不依賴于總體分布,能較精確的估計置信區(qū)間。
設x1,x2,…,xn (1)
為原始數(shù)據(jù),是連續(xù)對稱的獨立同分布隨機樣本,θ為分布的對稱中心。首先計算walsh平均值:
W(·)=1≤i≤j≤n (2)
對walsh平均值升冪排列,記為W(1),W(2)W(N),N=n(n+1)。
如果給定置信度1-α,估計θ所在區(qū)間(),由下式確定
=W(N-K+1) (3)
其中:
K≈ (4)
這里Zα/2為正態(tài)隨機變量的α/2臨界值,若Φ(·)為標準正態(tài)分布函數(shù),則1-Φ(Zα/2)=。
在施行計算時,按下列步驟進行:
1)由α查正態(tài)分布表得到Zα/2;
2)由公式(4)計算出K及N-K+1;
3)把(1)由小到大排列,依次從小到大求出(2)的第K個值W(K),再從大到小求出(2)的從后向前的第K個值,即第N-K+1個值W(N-K+1);
4)由(3)式得到()。
軟件實現(xiàn):使用R軟件進行區(qū)間估計結(jié)果的計算。對于一些電壓樣本量較少,R無法計算出95%或99%的置信區(qū)間的等級與方案沒有給出區(qū)間估計的結(jié)果。
3 整理過程
3.1 異常值剔除
繪制35kV變壓器工程單位造價箱線圖并計算正常值范圍15.93元/kVA-101.8元/kVA,存在異常值1個,如圖3所示。
3.2 總體的區(qū)間估計
軟件計算結(jié)果為7.14元/kVA-72.37元/kVA(99%)。
3.3 異常數(shù)據(jù)分析
異常數(shù)據(jù)為國網(wǎng)安徽肥西縣供電有限責任公司2014年35kV嚴店變主變改造工程,該工程更換2臺35kV變壓器,設備費114.51萬元,而項目管理費卻高達85.3萬元,導致單位造價達到104.66元/kVA,與平均值63.22元/kVA偏離最多,應為其他費用拆分不當所致。在本次數(shù)據(jù)整理中予以剔除。
4 樣本整理結(jié)果
本次整理2014-2017年35kV更換變壓器單位造價數(shù)據(jù)共16項,整理后刪除異常數(shù)據(jù)1項,保留樣本數(shù)據(jù)15項,整理后35kV更換變壓器工程單位造價樣本區(qū)間為:43.15元/kVA -98.56元/kVA,如表3所示。
整理后35kV的樣本描述統(tǒng)計結(jié)果如表4所示。
35kV的總體區(qū)間估計如圖4所示。
剔除異常值后的樣本總體真值落在7.14元/kVA-72.37元/kVA的概率為99%。