潘鵬,楊曄,朱美,程琳儼
(1.環(huán)境保護部環(huán)境工程評估中心,北京 100012;2.國家環(huán)境保護環(huán)境影響評價數(shù)值模擬重點實驗室,北京 100012;3.中國寰球工程公司,北京 100012)
火電行業(yè)建設項目環(huán)評指標數(shù)據質量分析
潘鵬1,2,楊曄1,2,朱美1,2,程琳儼3
(1.環(huán)境保護部環(huán)境工程評估中心,北京 100012;2.國家環(huán)境保護環(huán)境影響評價數(shù)值模擬重點實驗室,北京 100012;3.中國寰球工程公司,北京 100012)
建設項目環(huán)評指標數(shù)據對于建設項目環(huán)境影響評價、技術評估、環(huán)境管理宏觀決策等具有重要支撐作用,因而其數(shù)據質量至關重要。通過開展火電行業(yè)建設項目環(huán)評指標數(shù)據質量研究,分析火電環(huán)評指標數(shù)據的主要內容,提出一套火電環(huán)評指標數(shù)據的質量評價指標體系和評價方法,開展指標數(shù)據的質量評價實踐,并提出改進后續(xù)火電環(huán)評指標數(shù)據質量的建議。
火電;環(huán)評指標;數(shù)據質量
環(huán)評基礎數(shù)據庫經過近年來的建設,已建立17套環(huán)評基礎數(shù)據庫標準規(guī)范,盤活了10年國家級環(huán)評核心數(shù)據,結構化了16個行業(yè)的環(huán)評指標數(shù)據,建成環(huán)評會商平臺,形成環(huán)評基礎數(shù)據共享平臺,并開展環(huán)評基礎數(shù)據庫的地方試點,已初步達到應用水平[1-2]。
火電環(huán)評指標數(shù)據是環(huán)評基礎數(shù)據庫建設的16個行業(yè)環(huán)評指標數(shù)據之一,是反映火電行業(yè)建設項目環(huán)評中所要考慮的關鍵因素的數(shù)據?;痣姯h(huán)評指標數(shù)據對于建設項目環(huán)境影響評價、技術評估、環(huán)境管理宏觀決策等具有重要支撐作用,因而其數(shù)據質量至關重要。開展火電環(huán)評指標數(shù)據的質量評價是保證環(huán)評指標信息真實性、準確性、可靠性的基礎,也是保證環(huán)評指標信息權威性的關鍵,對于保障環(huán)境影響評價和技術評估的客觀性、環(huán)境管理決策的科學性等具有積極意義。
本文主要對火電環(huán)評指標數(shù)據的質量開展研究,以期為提高環(huán)評基礎數(shù)據的質量,尤其是火電環(huán)評指標數(shù)據的質量提供參考,鞏固環(huán)評基礎數(shù)據庫建設成果,促進環(huán)評基礎數(shù)據庫更好地為環(huán)境管理服務。
火電環(huán)評指標數(shù)據是根據火電行業(yè)建設項目環(huán)評指標體系采集的、存儲于火電環(huán)評指標數(shù)據庫中的數(shù)據。從邏輯上來講,主要包括主題層、專題層和指標層3個層次的內容,如圖1所示。
圖1 火電行業(yè)建設項目環(huán)評指標體系Fig.1 The environmental impact assessment indicators in thermal power industry
(1)主題層是對火電建設項目環(huán)評主要方面的概括,包括項目概況、工程特征、專題評價等級、環(huán)境現(xiàn)狀、排放總量指標、污染防治措施、結論7個方面的內容。
(2)專題層是主題層分解后的關鍵要素,也是指標層具體指標公共屬性的概括,包括建設項目基本信息、建設規(guī)模、工程參數(shù)、資源消耗等19個方面的內容。
(3)指標層是火電建設項目環(huán)評關鍵要素的具體表達,共包括121項具體指標數(shù)據。根據重要性、穩(wěn)定性和系統(tǒng)性原則,將指標數(shù)據劃分為必選、條件必選、可選3類。重要性原則,即按照在環(huán)評中的重要程度對環(huán)評指標數(shù)據進行劃分,例如項目地理位置經緯度重要程度高,劃為必選指標,項目施工起止年份重要程度低,劃為可選指標。穩(wěn)定性原則,即在各類火電項目環(huán)評中都會體現(xiàn)并相對穩(wěn)定不變的環(huán)評指標數(shù)據可設為必選,例如項目名稱、總投資、評級等級等;只在某些特定情況下才會出現(xiàn)的指標設為條件必選,例如灰場面積。系統(tǒng)性原則,即必須要明確條件必選指標在什么條件下才是必選,如果某條件成立或不成立,涉及哪些指標為必選或可選,也就是要明確條件與指標之間的系統(tǒng)性關系。理想狀況下,火電環(huán)評指標數(shù)據包括必選指標80項、條件必選20項和可選指標21項。
數(shù)據質量是一個多維度的概念,可能涉及數(shù)據及其生產服務過程的多個方面,本身不可測度,通常將數(shù)據質量的認識分解為多個質量維度,并逐個識別來實現(xiàn)度量[3]。根據火電行業(yè)建設項目環(huán)評指標數(shù)據質量的需求,從基本層、準則層和指標層3個層次確定數(shù)據質量評價的指標,設計出火電環(huán)評指標數(shù)據質量指標體系架構,如圖2所示。
圖2 火電環(huán)評指標數(shù)據質量評價指標體系架構Fig.2 The data quality evaluation indicator system architecture of EIA indicators in thermal power industry
(1)基本層包括形式質量、內容質量和效用質量3個方面的指標[4]。其中,形式質量基于數(shù)據的基本結構要素來反映數(shù)據在形式方面的質量特征;內容質量考察數(shù)據對事物狀態(tài)的表述程度,進而反映數(shù)據在內容方面的質量特征;效用質量考察數(shù)據對用戶的效用和價值,即數(shù)據對用戶需求的滿足程度,從而反映數(shù)據在效用方面的質量特征。
(2)準則層包括一致性、準確性和完整性3個方面的必備指標[5]。其中,一致性是指數(shù)據結構要素屬性和它們之間的相互關系符合邏輯規(guī)則;準確性包括數(shù)據所指內容對數(shù)據所指對象的反應或表現(xiàn)是否準確、數(shù)據形式對數(shù)據內容的表述或表達是否準確兩層含義;完整性是指各個火電項目環(huán)評指標數(shù)據的完整性。
(3)指標層包含火電環(huán)評指標數(shù)據的具體質量指標。其中,一致性指標包括數(shù)據類型、數(shù)據精度、值域、計量單位、字典編碼、表達符號等;準確性指標包括源信息、符合性、誤差范圍、數(shù)據表述等;完整性指標包含必選指標完整性、條件必選指標完整性、可選指標完整性等。
進一步地,采用定量指標來表征環(huán)評指標數(shù)據的質量,定量指標是指描述數(shù)據集滿足預先設定的質量標準要求及指標的程度,并提供定量的質量信息[6],環(huán)評指標數(shù)據質量的定量指標包括一致率、準確率、完整率和優(yōu)質率,具體計算方法如下:
一致率的計算方法為:數(shù)據集中所有滿足條件(針對某個具體規(guī)則)的數(shù)據量/數(shù)據集中記錄總數(shù)×100%。
準確率的計算方法為:數(shù)據集中所有正確的數(shù)據量/數(shù)據集中記錄總數(shù)×100%。
完整率的計算方法為:數(shù)據集中所有滿足條件的數(shù)據量/數(shù)據集中記錄總數(shù)×100%。
此外,將同時符合一致性、準確性和完整性要求的火電行業(yè)建設項目環(huán)評指標數(shù)據定義為優(yōu)質數(shù)據,采用優(yōu)質率來反映環(huán)評指標數(shù)據的整體質量情況,其計算方法為:數(shù)據集中所有優(yōu)質的數(shù)據量/數(shù)據集中記錄總數(shù)×100%。
火電環(huán)評指標數(shù)據的質量評價技術路線如圖3所示,綜合采用經驗判定法、邏輯推理法、抽樣檢驗法和統(tǒng)計分析法來評價火電環(huán)評指標數(shù)據的質量。
圖3 火電環(huán)評指標數(shù)據質量評價技術路線Fig.3 The technology roadmap of data quality evaluation of EIA indicators in thermal power industry
其中,經驗判定法借助分析人員的專業(yè)知識判定數(shù)據的類型、精度和值域等是否合理,用于評價數(shù)據的一致性、準確性和完整性;邏輯推理法依據環(huán)評指標數(shù)據之間的邏輯關聯(lián)關系推理發(fā)現(xiàn)存在問題的數(shù)據,用于評價數(shù)據的準確性和完整性;抽樣檢驗法將抽樣出的待評價數(shù)據與環(huán)境影響報告書、環(huán)評審批登記表等假定為真實的數(shù)據進行比對,確定環(huán)評指標數(shù)據的準確性和完整性;統(tǒng)計分析法對經驗判定法、邏輯推理法和抽樣檢驗法的結果數(shù)據進行匯總統(tǒng)計,并分析得出數(shù)據質量評價結論。
4.1 指標數(shù)據質量評價
從環(huán)評基礎數(shù)據庫中抽取2000—2014年1123個項目的共計77 624個環(huán)評指標數(shù)據,采用上述方法對數(shù)據質量進行評價,并分別按指標數(shù)據性質、內容和類型3種方式對數(shù)據的一致率、準確率、完整率和優(yōu)質率4個維度的評價結果進行統(tǒng)計分析。
(1)按指標性質?;痣娊ㄔO項目指標數(shù)據具有必選、條件必選、可選3種不同性質。依據指標數(shù)據性質的不同,對數(shù)據質量評價結果進行統(tǒng)計,結果如表1所示。
表1 火電環(huán)評指標數(shù)據質量評價結果統(tǒng)計表(按性質)
(2)按指標內容?;痣娊ㄔO項目環(huán)評指標數(shù)據包括項目概況、工程特征等7個不同方面的內容。依據指標數(shù)據內容的不同,對數(shù)據質量評價結果進行統(tǒng)計,結果如表2所示。
(3)按指標類型?;痣娊ㄔO項目環(huán)評指標數(shù)據主要有數(shù)值型、文本型兩種類型。依據指標數(shù)據類型的不同,對火電環(huán)評指標數(shù)據質量評價結果進行統(tǒng)計,結果如表3所示。
表2 火電環(huán)評指標數(shù)據質量評價結果統(tǒng)計表(按內容)
表3 火電環(huán)評指標數(shù)據質量評價結果統(tǒng)計表(按類型)
4.2 評價結果分析
為進一步分析火電建設項目環(huán)評指標數(shù)據的質量,依據表1至表3中的數(shù)據,按照指標的性質、內容以及類型對指標數(shù)據分類處理,從數(shù)據的一致率、準確率、完整率和優(yōu)質率4個維度著手,得到圖4,并以此分析數(shù)據質量。
(1)從指標性質的角度分析,數(shù)據的一致率和準確率均較高(必選指標的準確率數(shù)值最小,為89.05%),但數(shù)據的完整率較一致率和準確率數(shù)值偏低,其中完整性按從高到低排序為:條件必選指標(88.11%)>必選指標(64.08%)>所有指標(61.54%)>可選指標(37.51%)。從數(shù)據完整率考慮,人們對條件必選指標的填報較為重視,對可選指標填報的重視度較低。數(shù)據的整體質量受一致率、準確率和完整率的綜合影響,在數(shù)據一致率和準確率較高的條件下,與完整率服從一致的變化趨勢。
(2)從指標內容的角度分析,各類指標的一致率和準確率均較高(數(shù)值最小的項目概況指標的準確率為85.78%)。指標數(shù)據的完整率和優(yōu)質率較其他兩個維度的數(shù)值偏低,其中評價結論指標的完整率最低,僅為9.65%,而環(huán)境現(xiàn)狀指標的完整率高達91.15%,其他指標的完整率介于61.23%~82.02%。由此可知,評價結論指標的完整率有待進一步提高。
圖4 火電行業(yè)環(huán)評指標數(shù)據質量雷達圖Fig.4 The radar map of data quality evaluation of EIA indicators in thermal power industry
(3)從指標類型的角度分析,數(shù)值型和文本型兩類指標的一致率和準確率均較高,完整率和優(yōu)質率依然表現(xiàn)較低。同時發(fā)現(xiàn),數(shù)值型數(shù)據的準確率(85.26%)低于文本型數(shù)據(94.79%),但完整率高于文本型數(shù)據(數(shù)值型68.62%,文本型58.25%)。
綜合以上分析可發(fā)現(xiàn),火電環(huán)評指標數(shù)據的準確率和一致率較高,指標數(shù)據的完整性成為制約數(shù)據整體質量的主要因素,尤其是可選指標和評價結論性指標的完整性亟待提高。
火電環(huán)評指標數(shù)據建設,其實質是從大量非結構化文本資料中抽取火電建設項目環(huán)評關鍵信息并映射到結構化數(shù)據庫中的過程,因此可從環(huán)評指標體系、數(shù)據庫設計、數(shù)據源質量控制、指標數(shù)據采集、數(shù)據質量管控體系5個方面采取措施,保障指標數(shù)據建設的質量。具體建議如下:
(1)優(yōu)化環(huán)評指標體系設計?;痣姯h(huán)評指標體系是火電環(huán)評指標數(shù)據庫設計、建設的依據,也是火電環(huán)評指標數(shù)據采集、管理的依據,直接影響到火電環(huán)評指標數(shù)據的質量,應在遵循科學性、實用性、規(guī)范性的原則下持續(xù)優(yōu)化。
(2)完善指標數(shù)據庫結構?;痣姯h(huán)評指標數(shù)據庫是火電環(huán)評指標數(shù)據存儲、管理的重要依托,應參照環(huán)境信息化標準規(guī)范的有關內容持續(xù)完善數(shù)據庫結構,為提升指標數(shù)據質量提供重要保障。
(3)控制來源數(shù)據的質量。環(huán)評指標數(shù)據的主要來源是環(huán)評報告書、審批登記表等,這些數(shù)據資料有不同來源、不同版本,應嚴格控制來源數(shù)據的質量,從源頭保障火電環(huán)評指標數(shù)據的質量。
(4)提高指標數(shù)據采集質量。建議從完善環(huán)評指標數(shù)據錄入模板、選用高素質的指標數(shù)據采集人員、加強數(shù)據校核檢驗3個方面,不斷提高環(huán)評指標數(shù)據采集質量,從而保障環(huán)評指標數(shù)據的質量。
(5)完善數(shù)據質量管控體系。高質量的數(shù)據來源于嚴格的數(shù)據質量控制與管理,建議建立嚴格的數(shù)據質量管理與控制體系,制定相應技術標準與規(guī)范,實施指標數(shù)據建設全過程質量控制,不斷改善環(huán)評指標數(shù)據質量。
[1] 趙曉宏, 丁峰, 李時蓓, 等. 環(huán)評基礎數(shù)據庫建設與展望[J]. 環(huán)境影響評價, 2014(4): 33- 35.
[2] 孫鈺. 互聯(lián)網+:創(chuàng)新環(huán)評決策監(jiān)管之道[J]. 環(huán)境影響評價, 2015, 37(5): 24- 26.
[3] 張勝. 數(shù)據質量評價指標和評價方法淺析[J]. 科技信息, 2014(2): 259- 259.
[4] 國家科技基礎條件平臺建設基礎科學數(shù)據共享網項目組. 數(shù)據質量評測方法與指標體系[R]. 2011.
[5] 陳鳳蘭, 王秀勤. 統(tǒng)計數(shù)據質量的現(xiàn)狀及對策[J]. 統(tǒng)計教育, 2005(6): 56- 57.
[6] 丁海龍, 徐宏炳. 數(shù)據質量分析及應用[J]. 計算機技術與發(fā)展, 2007, 17(3): 236- 238.
Research on Data Quality of EIA Indicators in Thermal Power Construction Projects
PAN Peng1,2, YANG Ye1,2, ZHU Mei1,2, CHENG Lin-yan3
(1.Appraisal Center for Environment and Engineering, Ministry of Environmental Protection, Beijing 100012, China; 2.State Environmental Protection Key Laboratory of Numerical Modeling for Environment Impact Assessment, Beijing 100012, China; 3.China Huanqiu Contracting & Engineering Corporation, Beijing 100012, China)
The environmental impact assessment indicators in thermal power construction projects play an important role in environmental impact assessment and technical review, as well as macroscopic environmental management decision-making. Therefore, the data quality of indicators is of vital importance. In this paper, the indicator system of thermal power construction projects and evaluation methods were built up by analyzing the main contents in EIA for thermal power and studying the data quality. Some suggestions were further put forward to improve the data quality of environmental impact assessment indicators in thermal power construction projects.
thermal power; environmental impact assessment indicators; data quality
2016-07-22
環(huán)境保護部財政預算項目(14402400000015001-2)
潘鵬(1985—),男,助理研究員,博士,主要從事數(shù)據集成共享理論與技術方法研究,E-mail:panpeng@acee.org.cn
楊曄(1975—),女,正高級工程師,博士,主要從事環(huán)境影響評估及技術政策研究,E-mail:yeyang@acee.org.cn
10.14068/j.ceia.2017.01.006
X820.3
A
2095-6444(2017)01-0023-05