王 鈺,黃少平
(江西省氣象信息中心,330096,南昌)
紙質(zhì)氣象記錄檔案是氣象檔案的重要資源,其中壓、溫、濕、風(fēng)、降水自記紙是數(shù)量最多、時間分辨率較高的氣象記錄檔案,但早期受檔案載體及信息技術(shù)限制利用率較低,特別是自記跡線中包含的分鐘級數(shù)據(jù)沒有得到充分應(yīng)用。隨著計算機圖像識別技術(shù)的發(fā)展,降水自記紙、EL型電接風(fēng)自記紙先后開始自記跡線數(shù)字化提取[1-3],獲取了分鐘級降水?dāng)?shù)據(jù)、風(fēng)向風(fēng)速自記數(shù)據(jù),并為各地城市暴雨強度公式計算、風(fēng)能資源評價提供了高時間分辨率的基礎(chǔ)數(shù)據(jù)支持。
雖然自記紙數(shù)字化提取的每個步驟都進(jìn)行了數(shù)據(jù)質(zhì)量控制,但數(shù)字化成果完整、系統(tǒng)地質(zhì)量控制一直未開展。由此,2018年中國氣象局“關(guān)于做好2018年氣象業(yè)務(wù)檔案相關(guān)工作的通知”中下達(dá)EL型電接風(fēng)自記紙數(shù)字化成果質(zhì)量控制軟件研發(fā)任務(wù),旨在通過質(zhì)量控制提升EL型電接風(fēng)自記紙數(shù)字化成果的精確性。本文從軟件的技術(shù)規(guī)則、功能設(shè)計與應(yīng)用實效等方面進(jìn)行闡述,以期EL型風(fēng)自記紙數(shù)字化成果得到使用者的廣泛應(yīng)用及更進(jìn)一步的信賴。
風(fēng)自記紙數(shù)字化提取數(shù)據(jù)質(zhì)量控制依據(jù)《地面氣象觀測規(guī)范》和風(fēng)跡線提取數(shù)據(jù)質(zhì)量控制技術(shù)規(guī)則(表1),采取公司級、省級和國家級三級質(zhì)量控制方式。其中公司級質(zhì)量控制采用逐張自記紙質(zhì)量檢查,核對跡線提取數(shù)據(jù)是否正確;省級質(zhì)量控制采用通過省級風(fēng)跡線提取數(shù)據(jù)篩選技術(shù)規(guī)則(表2),對與A6文件中數(shù)據(jù)差異超過一定界限值、跡線異常處理等自記紙進(jìn)行檢查,判斷公司級人員處理是否正確;國家級質(zhì)量檢查采用通過國家級風(fēng)跡線提取數(shù)據(jù)篩選技術(shù)規(guī)則(表2),對省級可能出錯的自記紙進(jìn)行檢查,判斷風(fēng)跡線提取數(shù)據(jù)是否正確、數(shù)字化成果是否完整等。
表1 風(fēng)跡線提取數(shù)據(jù)質(zhì)量控制技術(shù)規(guī)則
表2 風(fēng)跡線提取數(shù)據(jù)篩選技術(shù)規(guī)則
軟件結(jié)構(gòu)與數(shù)據(jù)流程如圖1所示。因軟件需要大量重復(fù)操作,重點考慮了軟件的穩(wěn)定性、通用性、實用性,故軟件采用C/S結(jié)構(gòu),不需要環(huán)境配置、插件安裝,兼容Windows XP、Windows 7、Windows10操作系統(tǒng),并具有“記憶”功能無需重復(fù)輸入。
圖1 EL型風(fēng)自記紙數(shù)字化成果質(zhì)量控制軟件結(jié)構(gòu)與數(shù)據(jù)流程
公司提取人員完成一個站全部風(fēng)自記紙跡線提取工作后,將預(yù)處理后圖像文件(jpg文件)、風(fēng)自記跡線文件(gal文件)、提取效果文件(png文件)、數(shù)據(jù)庫文件(db文件)、風(fēng)自記紙跡線分鐘數(shù)據(jù)文件(Fm文件)、小時數(shù)據(jù)文件(Fh文件)等6種數(shù)據(jù)文件嚴(yán)格按照《EL型電接風(fēng)自記紙數(shù)據(jù)提取技術(shù)規(guī)定》中“數(shù)據(jù)存儲目錄結(jié)構(gòu)”規(guī)定存儲后,移交公司質(zhì)量控制人員開始公司級質(zhì)量控制工作。
2.1.1 軟件自動檢查
1)數(shù)據(jù)文件完整性檢查,檢查風(fēng)自記紙?zhí)崛∵^程中形成的數(shù)據(jù)文件是否完整、存放路徑是否正確。
2)數(shù)據(jù)質(zhì)量檢查,檢查風(fēng)自記跡線文件、數(shù)據(jù)庫文件、風(fēng)自記分鐘和小時數(shù)據(jù)文件格式,檢查提取數(shù)據(jù)的值域、一致性、完整性和邏輯性的質(zhì)量,相關(guān)技術(shù)指標(biāo)詳見氣象行業(yè)標(biāo)準(zhǔn)《風(fēng)自記紙記錄數(shù)字化 EL型》(QXT 156—2021),逐條核實檢查出來的疑誤信息并備注說明。
2.1.2 人工回放檢查 軟件自動檢查后,利用風(fēng)自記跡線提取數(shù)據(jù)定位、圖像疊加技術(shù),對全部自記跡線提取的數(shù)據(jù)進(jìn)行逐張回放檢查:1)逐時A6數(shù)據(jù)是否完整;2)網(wǎng)格開始時間、結(jié)束時間設(shè)置是否正確,即網(wǎng)格提取時間與自記紙原始網(wǎng)格起止時間應(yīng)重合;3)風(fēng)速跡線開始、結(jié)束位置是否正確,風(fēng)速跡線開始、結(jié)束時間的錄入值與自記紙上標(biāo)注的時間是否相符;4)風(fēng)速、風(fēng)向跟蹤線與自記紙跡線是否重合,即風(fēng)速跟蹤跡線保持在紙面跡線中心位置,每張自記紙風(fēng)向漏跟蹤劃數(shù)<15根;5)根據(jù)軟件提示判斷風(fēng)向缺失是否屬實;6)根據(jù)軟件提示,對提取的逐時風(fēng)向風(fēng)速與A系列文件中對應(yīng)時次記錄差異較大的進(jìn)行檢查確認(rèn),根據(jù)檢查情況予以備注說明,如無備注公司質(zhì)檢人員應(yīng)補充;7)自記紙跡線異常時,應(yīng)檢查提取人員異常處理是否正確,并備注異常自記紙,備注內(nèi)容包括自記紙的年月日,站名,區(qū)站號。
2.1.3 數(shù)據(jù)提交 公司完成質(zhì)量控制后,將全部數(shù)據(jù)文件向省級氣象資料業(yè)務(wù)部門提交。
省級質(zhì)量控制與公司級質(zhì)量控制步驟基本一致,在公司級質(zhì)量控制的基礎(chǔ)上,對質(zhì)量控制軟件依據(jù)省級篩選技術(shù)規(guī)則(表2)篩查出的自記紙逐張進(jìn)行回放檢查,檢查要求同2.1.2。
省級完成質(zhì)量控制后,將全部數(shù)據(jù)文件向國家級氣象資料業(yè)務(wù)部門提交。
國家級質(zhì)量控制與省級質(zhì)量控制步驟基本一致,在省級質(zhì)量控制的基礎(chǔ)上,對質(zhì)量控制軟件依據(jù)國家級篩選技術(shù)規(guī)則(表2)篩查出的自記紙,需在29吋顯示器上全屏顯示自記紙的狀態(tài)逐張進(jìn)行回放檢查,檢查要求同2.1.2。
國家級依據(jù)質(zhì)量控制結(jié)果填寫“疑誤信息查詢單”向省級查詢;省級反饋后國家級最后根據(jù)質(zhì)量控制結(jié)果和反饋信息給出每個站數(shù)字化成果質(zhì)量檢查結(jié)論,編制數(shù)字化成果質(zhì)量評估報告。
江西省應(yīng)用質(zhì)檢軟件完成82個站風(fēng)自記紙跡線提取數(shù)據(jù)的質(zhì)量控制。各站風(fēng)自記紙總數(shù)量雖有差異,但質(zhì)量控制軟件依據(jù)篩選技術(shù)規(guī)則均按30%的比例自動篩選風(fēng)自記紙進(jìn)行質(zhì)量檢查,平均每站抽檢3 173張。剔除人工誤判的8個站點,從74個站點國家級質(zhì)量控制結(jié)果來分析(圖2),各站存在疑誤的風(fēng)自記紙在2~243張之間,經(jīng)國家級質(zhì)檢后省級確認(rèn)為錯誤的自記紙各站在0~243張之間,確認(rèn)比例各站在53.9%~100.0%之間,其中只有1個站點的確認(rèn)率0%,54個站點的確認(rèn)率達(dá)100%,平均確認(rèn)比例達(dá)94.8%,從平均確認(rèn)比例分析,軟件起到了風(fēng)自記紙跡線提取數(shù)據(jù)質(zhì)量控制的作用,有效提高了EL型電接風(fēng)自記紙數(shù)字化成果的質(zhì)量。
圖2 風(fēng)跡線提取數(shù)據(jù)國家級質(zhì)量控制結(jié)果
1)該軟件采取公司級、省級和國家級三級質(zhì)量控制方式,其中公司級采用逐張自記紙回放檢查,核對跡線提取數(shù)據(jù)是否正確;省級和國家級采用篩選技術(shù)規(guī)則,對超過一定界限值、跡線異常處理等自記紙進(jìn)行檢查,分別對公司級處理是否正確、省級可能出錯進(jìn)行檢查,判斷風(fēng)跡線提取數(shù)據(jù)是否正確、數(shù)字化成果是否完整等。
2)軟件采用自動檢查、人工回放檢查相結(jié)合的方式,篩選出不符合技術(shù)規(guī)定的風(fēng)自記紙,再逐張人工回放檢查,不僅減少了重復(fù)檢查時間,而且提高檢查效率。
3)通過已完成國家級質(zhì)量控制74個站質(zhì)量情況看,軟件均按30%的比例自動篩選風(fēng)自記紙進(jìn)行質(zhì)量檢查;各站存在疑誤的風(fēng)自記紙在2~243張之間,經(jīng)省級確認(rèn)為錯誤的自記紙各站在0~243張之間,確認(rèn)比例各站在53.9%~100.0%之間,平均確認(rèn)比例為94.8%,疑誤100%確認(rèn)的站點達(dá)54個,確認(rèn)比例高,說明質(zhì)控軟件起到了風(fēng)自記紙跡線提取數(shù)據(jù)質(zhì)量控制的作用。