李效利,于 淦
(1.國家無線電監(jiān)測中心云南監(jiān)測站,云南 昆明 650000;2.國家無線電監(jiān)測中心,北京 100037)
《科學(xué)數(shù)據(jù)管理辦法》(以下簡稱辦法)于2018年3月由國務(wù)院辦公廳印發(fā)施行?!掇k法》明確了我國科學(xué)數(shù)據(jù)管理的總體原則、主要職責(zé)、數(shù)據(jù)采集匯交與保存、共享利用、保密與安全等方面內(nèi)容,著重從五個(gè)方面提出了具體管理措施,其中對(duì)數(shù)據(jù)質(zhì)量也做了明確要求,比如建立監(jiān)測數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)制度、建立監(jiān)測數(shù)據(jù)質(zhì)量控制體系、建立監(jiān)測數(shù)據(jù)質(zhì)量保存制度、建立監(jiān)測數(shù)據(jù)評(píng)價(jià)和考核制度,這些提高數(shù)據(jù)質(zhì)量的辦法同樣適合無線電監(jiān)測數(shù)據(jù)質(zhì)量管理。
無線電監(jiān)測數(shù)據(jù)是無線電監(jiān)測行業(yè)的核心資產(chǎn),在數(shù)據(jù)浪潮中,若通過采用一些方法措施,提升了監(jiān)測數(shù)據(jù)質(zhì)量,鞏固了監(jiān)測設(shè)施建設(shè)成果,解決了建設(shè)成果更好的滿足業(yè)務(wù)需求問題,發(fā)揮了監(jiān)測數(shù)據(jù)決策支撐能力,對(duì)提升無線電管理能力會(huì)起到很好的作用。
數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn)在不同的組織有不同的定義。美國國家統(tǒng)計(jì)科學(xué)研究所( NISS)關(guān)于數(shù)據(jù)質(zhì)量研究的主要觀點(diǎn)在于:數(shù)據(jù)質(zhì)量是指在業(yè)務(wù)環(huán)境下,數(shù)據(jù)符合數(shù)據(jù)消費(fèi)者的使用目的,能滿足業(yè)務(wù)場景具體需求的程度。
根據(jù)數(shù)據(jù)質(zhì)量的定義,無線電監(jiān)測數(shù)據(jù)質(zhì)量可以定義為:無線電監(jiān)測數(shù)據(jù)質(zhì)量是指在無線電管理應(yīng)用中,能有效支撐無線電管理者管理應(yīng)用頻譜資源,能滿足對(duì)頻率劃分、分配、指配,臺(tái)(站)管理等業(yè)務(wù)需求的程度。
目前,無線電監(jiān)測部門已積累了大量的監(jiān)測數(shù)據(jù),從數(shù)據(jù)生產(chǎn)使用周期分析監(jiān)測數(shù)據(jù)質(zhì)量,發(fā)現(xiàn)存在如下類別問題。
一類是:一些數(shù)據(jù)質(zhì)量問題是比較簡單而明顯的,可以使用自動(dòng)化工具檢測到的。比如監(jiān)測數(shù)據(jù)的完整性、一致性、惟一性和有效性。不需要有很多的背景知識(shí),或者數(shù)據(jù)分析經(jīng)驗(yàn)。只要按照數(shù)據(jù)屬性驗(yàn)證它的存在,結(jié)合數(shù)據(jù)要素特性,就可以判定它錯(cuò)誤的。
另一類是:一些數(shù)據(jù)質(zhì)量問題是非常隱秘的,大家都知道它是存在的,但它看不見摸不著,更處理不了,因?yàn)樗枰旁谔厥馇榫诚虏拍鼙粰z測到。比如數(shù)據(jù)集成共享存在的困難,源于數(shù)據(jù)采集端廠家標(biāo)準(zhǔn)不一,不能集體共享,形成了信息孤島問題;缺少數(shù)據(jù)全面評(píng)價(jià)管理制度對(duì)數(shù)據(jù)進(jìn)行持續(xù)維護(hù)、提升;對(duì)數(shù)據(jù)的開發(fā)應(yīng)用能力不足等問題。解決這些數(shù)據(jù)質(zhì)量問題的關(guān)鍵就是需要一個(gè)復(fù)雜的、策略化的方法,而非孤立的、片面的來看問題。一旦數(shù)據(jù)質(zhì)量不好,我們就需要尋求自動(dòng)化與人工的雙重方式才能解決這類問題了。
這些問題彼此之間是相互關(guān)聯(lián)的,一環(huán)扣一環(huán),對(duì)這兩類問題出現(xiàn)的原因需做進(jìn)一步分析。
監(jiān)測數(shù)據(jù)的采集和管理是一個(gè)專業(yè)且復(fù)雜的工程,涵蓋了監(jiān)測業(yè)務(wù)梳理、標(biāo)準(zhǔn)制定、元數(shù)據(jù)管理、數(shù)據(jù)模型管理、數(shù)據(jù)匯聚、清洗加工、中心存儲(chǔ)、資源目錄編制、共享交換、數(shù)據(jù)維護(hù)、數(shù)據(jù)失效等過程。在任何一個(gè)環(huán)節(jié)中出錯(cuò),都將導(dǎo)致數(shù)據(jù)的錯(cuò)誤。甚至,源頭數(shù)據(jù)本身就是錯(cuò)誤的。所以,數(shù)據(jù)質(zhì)量問題不僅僅是一個(gè)技術(shù)問題,它也可能出現(xiàn)在監(jiān)測業(yè)務(wù)和管理的過程中。圖1對(duì)數(shù)據(jù)質(zhì)量出現(xiàn)的問題,從技術(shù)、業(yè)務(wù)、管理三方面做列舉。
圖1 數(shù)據(jù)質(zhì)量在技術(shù)、業(yè)務(wù)、管理的問題
通過對(duì)監(jiān)測數(shù)據(jù)質(zhì)量問題及出現(xiàn)問題的原因分析,從事前預(yù)防、事中監(jiān)控、事后改善三個(gè)階段探討改善監(jiān)測數(shù)據(jù)質(zhì)量的方法。如圖2所示。
圖2 數(shù)據(jù)質(zhì)量改善方法
(1)制定質(zhì)量管理機(jī)制:基于數(shù)據(jù)管理的復(fù)雜性和誘因的多重性特點(diǎn),解決數(shù)據(jù)質(zhì)量問題僅僅依靠一個(gè)技術(shù)工具是不夠的,需要建立長效工作機(jī)制。即根據(jù)無線電監(jiān)測機(jī)構(gòu)特點(diǎn),制定符合各監(jiān)測部門自身環(huán)境的工作制度,制定每個(gè)監(jiān)測環(huán)節(jié)的工作流程,規(guī)定各個(gè)參與方的責(zé)任,建立“誰出數(shù)誰負(fù)責(zé)、誰簽字誰負(fù)責(zé)”的責(zé)任追溯制度。無線電監(jiān)測機(jī)構(gòu)及其負(fù)責(zé)人對(duì)其監(jiān)測數(shù)據(jù)的真實(shí)性和準(zhǔn)確性負(fù)責(zé)。確定各項(xiàng)數(shù)據(jù)的權(quán)威部門,制定數(shù)據(jù)質(zhì)量指標(biāo),制定數(shù)據(jù)質(zhì)量修復(fù)流程等。
(2)制定數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn):監(jiān)測數(shù)據(jù)標(biāo)準(zhǔn)成功定義與否,直接決定了數(shù)據(jù)建設(shè)的成果和數(shù)據(jù)質(zhì)量的高低,需要在融合國家標(biāo)準(zhǔn)、監(jiān)測行業(yè)標(biāo)準(zhǔn)和地方標(biāo)準(zhǔn)的基礎(chǔ)上,結(jié)合組織自身的業(yè)務(wù)特色制定數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)。無線電監(jiān)測工作相關(guān)標(biāo)準(zhǔn)和規(guī)范,包括數(shù)據(jù)庫服務(wù)接口、數(shù)據(jù)庫結(jié)構(gòu)技術(shù)規(guī)范、監(jiān)測系統(tǒng)操作規(guī)范、監(jiān)測檢測方法、監(jiān)測任務(wù)流程、頻譜評(píng)估技術(shù)標(biāo)準(zhǔn)、監(jiān)測設(shè)備運(yùn)行維護(hù)規(guī)范等都需要制定標(biāo)準(zhǔn)規(guī)范等。
(3)制定質(zhì)量監(jiān)測模型:監(jiān)測數(shù)據(jù)質(zhì)量模型代表監(jiān)測業(yè)務(wù)需求,它是從業(yè)務(wù)需求的角度而描述出來的質(zhì)量需求。根據(jù)無線電監(jiān)測業(yè)務(wù)對(duì)頻率劃分、分配、指配,臺(tái)(站)管理,制定監(jiān)測定位、干擾排查等業(yè)務(wù)監(jiān)測模型。
(4)制定質(zhì)量監(jiān)測規(guī)則:數(shù)據(jù)監(jiān)測規(guī)則代表的具體的質(zhì)量檢測手段,它是從技術(shù)角度來描述數(shù)據(jù)質(zhì)量要求是如何被滿足的,包括規(guī)范性、完整性、準(zhǔn)確性、致性、時(shí)效性、可訪問性等,通過制定質(zhì)量監(jiān)測規(guī)則,確保監(jiān)測數(shù)據(jù)的時(shí)間連續(xù)性、頻譜完整性、精準(zhǔn)可靠性等。
(1)監(jiān)控原始數(shù)據(jù)質(zhì)量:監(jiān)測數(shù)據(jù)采集工作從數(shù)據(jù)源頭獲取最原始的數(shù)據(jù),在數(shù)據(jù)采集過程中將數(shù)據(jù)分為“好數(shù)據(jù)”和“壞數(shù)據(jù)”,“好數(shù)據(jù)”入庫,“壞數(shù)據(jù)”則反饋給源頭修復(fù),因?yàn)閿?shù)據(jù)來源部門最了解這些數(shù)據(jù),也最能在源頭上把數(shù)據(jù)問題徹底修復(fù)。
(2)監(jiān)控?cái)?shù)據(jù)中心質(zhì)量:經(jīng)過各種采集、清洗、加工過程,監(jiān)測數(shù)據(jù)被存入數(shù)據(jù)倉庫中,這些數(shù)據(jù)也將被業(yè)務(wù)部門使用,所以,對(duì)于這些成果數(shù)據(jù)的質(zhì)量監(jiān)控和修復(fù)則猶為重要。對(duì)于這類數(shù)據(jù)問題,可以使用簡單的空值檢查、規(guī)范性檢查、值域檢查、邏輯檢查、一致性檢查等規(guī)則進(jìn)行檢查,也可以通過諸如多源比較、數(shù)據(jù)佐證、數(shù)據(jù)探索、波動(dòng)檢查、離群檢查等方法進(jìn)行檢查。
(3)反饋數(shù)據(jù)質(zhì)量問題:數(shù)據(jù)質(zhì)量監(jiān)控過程中,會(huì)發(fā)現(xiàn)兩類問題,一類是源頭的數(shù)據(jù)質(zhì)量問題,另一類是數(shù)據(jù)中心的數(shù)據(jù)質(zhì)量問題,數(shù)據(jù)質(zhì)量團(tuán)隊(duì)需要將這些問題及時(shí)反饋給源頭部門和數(shù)據(jù)倉庫建設(shè)團(tuán)隊(duì)。
(4)考核數(shù)據(jù)質(zhì)量:數(shù)據(jù)質(zhì)量的考核是為了能夠引起各個(gè)參與部門和參與團(tuán)隊(duì)對(duì)數(shù)據(jù)質(zhì)量的重視,需要及時(shí)統(tǒng)計(jì)分析各種數(shù)據(jù)質(zhì)量問題,并制訂出相應(yīng)的應(yīng)對(duì)措施。
(1)修復(fù)數(shù)據(jù)質(zhì)量問題:發(fā)現(xiàn)質(zhì)量問題不是最終的目標(biāo),仍要建立相關(guān)的流程和工具,通過手工、自動(dòng)化等手段將質(zhì)量問題修復(fù),從而為業(yè)務(wù)創(chuàng)新提供可靠的數(shù)據(jù)支撐。
(2)收集數(shù)據(jù)質(zhì)量需求:通過建立通暢的數(shù)據(jù)質(zhì)量反饋通道,讓各個(gè)部門參與到數(shù)據(jù)質(zhì)量的再次完善中來,從而形成建設(shè)、應(yīng)用和反饋的良性循環(huán)。
(3)完善質(zhì)量管理制度:制度和流程的建設(shè)不是一蹴而就的,要在數(shù)據(jù)建設(shè)和質(zhì)量完善的過程中,結(jié)合監(jiān)測組織結(jié)構(gòu)和業(yè)務(wù)特色,不斷完善質(zhì)量管理制度。
(4)完善數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn):針對(duì)無線電行業(yè)不斷涌現(xiàn)新的業(yè)務(wù)形態(tài),原有的業(yè)務(wù)也在不斷的變化,要緊跟業(yè)務(wù)的變化,不斷完善符合業(yè)務(wù)需求的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)。
(5)完善質(zhì)量監(jiān)測模型:如前所述,監(jiān)測模型代表業(yè)務(wù)需求,業(yè)務(wù)形態(tài)的變化、數(shù)據(jù)標(biāo)準(zhǔn)的變化和質(zhì)量新需求的出現(xiàn),同樣要求監(jiān)測模型能夠作出相應(yīng)的變化。
(6)完善質(zhì)量監(jiān)測規(guī)則:信息化技術(shù)發(fā)展日新月異,不斷引入各種新技術(shù)來更加智能地發(fā)現(xiàn)和修復(fù)數(shù)據(jù)質(zhì)量問題。隨著無線電新業(yè)務(wù)的出現(xiàn),根據(jù)業(yè)務(wù)特點(diǎn),利用新技術(shù)新設(shè)備完善更新監(jiān)測規(guī)則,以確保監(jiān)測覆蓋全,數(shù)據(jù)質(zhì)量有保障。
本文引入了滿足無線電管理需求程度的無線電監(jiān)測數(shù)據(jù)質(zhì)量定義,并對(duì)監(jiān)測數(shù)據(jù)存在的問題及原因進(jìn)行分析,為提高無線電監(jiān)測數(shù)據(jù)質(zhì)量,重點(diǎn)提出了從監(jiān)測數(shù)據(jù)的事前預(yù)防、事中監(jiān)控、事后改善的質(zhì)量改善方法。