應(yīng)軒宇,蔡 強(qiáng),紀(jì) 偉
(浙江清華長三角研究院,浙江嘉興 314006)
食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)是指市場(chǎng)監(jiān)督管理部門結(jié)合食品生產(chǎn)經(jīng)營者的食品類別、業(yè)態(tài)規(guī)模、管理能力、記錄情況等,按照指標(biāo)量化評(píng)價(jià),動(dòng)態(tài)劃分食品生產(chǎn)經(jīng)營者風(fēng)險(xiǎn)等級(jí),統(tǒng)籌監(jiān)管資源與能力,對(duì)食品生產(chǎn)經(jīng)營者實(shí)施差異化、精準(zhǔn)化監(jiān)督管理,有助于強(qiáng)化食品生產(chǎn)經(jīng)營風(fēng)險(xiǎn)管理,優(yōu)化監(jiān)管資源配置,科學(xué)有效地實(shí)施監(jiān)管,落實(shí)食品安全監(jiān)管責(zé)任,保障食品安全[1-2]。但食品安全風(fēng)險(xiǎn)因素復(fù)雜、生產(chǎn)經(jīng)營主體數(shù)量多、情況參差不齊,導(dǎo)致食品安全數(shù)據(jù)量大、更新快、覆蓋面廣,分析難度較大。同時(shí),地方監(jiān)管部門專業(yè)人力相對(duì)有限,存在現(xiàn)有的信息呈現(xiàn)方式較為單一低效、食品安全后評(píng)價(jià)缺失等問題。2020年8月出版的《中國食品安全現(xiàn)狀、問題和對(duì)策戰(zhàn)略研究(第二輯)》中提到:要強(qiáng)化食品安全風(fēng)險(xiǎn)信息采集、統(tǒng)計(jì)、挖掘與應(yīng)用,推動(dòng)食品安全風(fēng)險(xiǎn)分級(jí)管理[3]。
近年來,數(shù)據(jù)科學(xué)與可視化技術(shù)的發(fā)展為風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)的分析提供了新的思路和手段。在數(shù)理統(tǒng)計(jì)的基礎(chǔ)上,借助可視化技術(shù)加強(qiáng)信息呈現(xiàn),直觀、快速、交互地對(duì)多維度、高復(fù)雜度、大數(shù)據(jù)量的風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)進(jìn)行生動(dòng)、豐富、高效的展示,以深入探索單因素的分布及多因素間的關(guān)系[4]。
在公共衛(wèi)生學(xué)界,R是一種流行的開源編程語言[5]。R語言提供數(shù)據(jù)科學(xué)工作的交互式環(huán)境,是各領(lǐng)域應(yīng)用最廣的數(shù)理統(tǒng)計(jì)工具。得益于ggplot2等知名的數(shù)據(jù)可視化包,R語言的一個(gè)重要特征在于強(qiáng)大的數(shù)據(jù)可視化能力,可實(shí)現(xiàn)基于圖形語法(Grammar of Graphic,GoG)的數(shù)據(jù)展示[6]。利用可視化技術(shù),將食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)通過坐標(biāo)軸、顏色、透明度、形狀以及大小等特征進(jìn)行展示,可以直觀全面地描述風(fēng)險(xiǎn)的特征及分布、變化及相關(guān)關(guān)系,實(shí)現(xiàn)地方重點(diǎn)區(qū)域、重點(diǎn)行業(yè)、重點(diǎn)企業(yè)、重點(diǎn)風(fēng)險(xiǎn)項(xiàng)的識(shí)別、排序和自定義情景的風(fēng)險(xiǎn)比較,簡(jiǎn)化風(fēng)險(xiǎn)評(píng)價(jià)的難度。通過動(dòng)態(tài)數(shù)據(jù)可視化,可以更加有效地進(jìn)行交互式數(shù)據(jù)分析。動(dòng)態(tài)讀取數(shù)據(jù)并自由選擇所需展示的圖例類別以及所選用的可視化形式,更符合風(fēng)險(xiǎn)評(píng)價(jià)工作中探索性數(shù)據(jù)分析的需求。此外,通過R語言內(nèi)嵌的數(shù)學(xué)模型還可以支持地方監(jiān)管部門針對(duì)轄區(qū)內(nèi)產(chǎn)生的生產(chǎn)經(jīng)營檢查數(shù)據(jù)進(jìn)一步開展數(shù)據(jù)挖掘,如主成分分析、關(guān)聯(lián)分析、差異顯著性比較等。這響應(yīng)了原國家食品藥品監(jiān)管總局于2016年印發(fā)的《食品生產(chǎn)經(jīng)營風(fēng)險(xiǎn)分級(jí)管理辦法(試行)》[1]的信息化倡議,契合國家市場(chǎng)監(jiān)督管理總局于2022年起草的《食品生產(chǎn)企業(yè)風(fēng)險(xiǎn)分級(jí)管理辦法(征求意見稿)》[2]的信息化工作要求。
根據(jù)基層監(jiān)管需求和分級(jí)評(píng)價(jià)經(jīng)驗(yàn),設(shè)計(jì)區(qū)域整體狀況、主體風(fēng)險(xiǎn)信息、風(fēng)險(xiǎn)識(shí)別、時(shí)間趨勢(shì)比較共4個(gè)模塊,每個(gè)模塊均包括豐富的靜態(tài)圖形和基于HTML的動(dòng)態(tài)交互式圖形兩種實(shí)現(xiàn)方式[7],以快速、動(dòng)態(tài)、直觀地反映區(qū)域各類風(fēng)險(xiǎn)信息。此外,在各模塊中設(shè)計(jì)若干基于數(shù)據(jù)識(shí)別和用于自動(dòng)數(shù)據(jù)篩選的選項(xiàng)按鈕,以實(shí)現(xiàn)自定義數(shù)據(jù)范圍的可視化。
根據(jù)設(shè)計(jì)方案,基于R 4.3.0及RStudio 2023.03.0集成開發(fā)環(huán)境(Integrated Development Environment,IDE),結(jié)合ggplot2、plotly、shiny、rmarkdown等擴(kuò)展包,開發(fā)支持風(fēng)險(xiǎn)等級(jí)自動(dòng)計(jì)算的食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)可視化系統(tǒng)并進(jìn)行應(yīng)用。
根據(jù)原國家食品藥品監(jiān)督管理總局于2016年印發(fā)的《食品生產(chǎn)經(jīng)營風(fēng)險(xiǎn)分級(jí)管理辦法(試行)》[1]中用于各類業(yè)態(tài)靜態(tài)風(fēng)險(xiǎn)和動(dòng)態(tài)風(fēng)險(xiǎn)量化評(píng)分表的數(shù)據(jù)結(jié)構(gòu),模擬生成同一縣域內(nèi)食品生產(chǎn)企業(yè)、食品銷售主體、一般餐飲、中央廚房、學(xué)校食堂、單位食堂共6類業(yè)態(tài)92家主體在2019—2023年連續(xù)5年的檢查和量化評(píng)分結(jié)果,并建立模擬數(shù)據(jù)庫,以支持實(shí)時(shí)數(shù)據(jù)的可視化。部分主體一年內(nèi)還有多次檢查結(jié)果,以模擬不同風(fēng)險(xiǎn)等級(jí)主體每年不同的檢查頻次。
靜態(tài)圖形提供了特定的信息。例如,散點(diǎn)圖和地理空間分布圖中的點(diǎn)的大小反映了生產(chǎn)經(jīng)營者的規(guī)模。交互圖則能在光標(biāo)移動(dòng)到特定位置時(shí)顯示名稱、評(píng)分等額外信息,并支持整體圖像或選定圖像區(qū)域的縮放。此外,點(diǎn)擊不同的圖例還可在交互圖中隱藏或顯示對(duì)應(yīng)的類別,以幫助篩選和更直觀地傳遞信息。
食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)可視化系統(tǒng)區(qū)域整體狀況界面見圖1,反映了縣域內(nèi)各業(yè)態(tài)中不同風(fēng)險(xiǎn)等級(jí)生產(chǎn)經(jīng)營者的占比情況及其隨年度的變化,并可選擇不同的自然年以切換數(shù)據(jù)。交互圖還顯示了不同業(yè)態(tài)或風(fēng)險(xiǎn)評(píng)分的生產(chǎn)經(jīng)營者在縣域內(nèi)的空間分布,比較了縣域內(nèi)各生產(chǎn)經(jīng)營者的靜態(tài)風(fēng)險(xiǎn)與動(dòng)態(tài)風(fēng)險(xiǎn),在時(shí)間維度上自動(dòng)尋找風(fēng)險(xiǎn)評(píng)分變化最大的生產(chǎn)經(jīng)營者并顯示其歷次檢查的變化情況。
圖1 食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)可視化系統(tǒng)區(qū)域整體狀況界面
除了整體的狀況,還可以查看記錄內(nèi)單一生產(chǎn)經(jīng)營者單次檢查的風(fēng)險(xiǎn)信息,包括一級(jí)風(fēng)險(xiǎn)因子、主要二級(jí)風(fēng)險(xiǎn)因子。食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)可視化系統(tǒng)主體風(fēng)險(xiǎn)信息界面見圖2。交互圖還記錄了所選生產(chǎn)經(jīng)營者在歷次檢查中的得分變化。
圖2 食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)可視化系統(tǒng)主體風(fēng)險(xiǎn)信息界面
風(fēng)險(xiǎn)識(shí)別界面(圖3)利用交互的箱型圖整理了各風(fēng)險(xiǎn)項(xiàng)在區(qū)域內(nèi)生產(chǎn)經(jīng)營者中的評(píng)分均值、四分位數(shù)等,據(jù)此劃分嚴(yán)重項(xiàng)、重點(diǎn)項(xiàng)和非重點(diǎn)項(xiàng),從而識(shí)別主要風(fēng)險(xiǎn)。交互式熱圖也顯示了各生產(chǎn)經(jīng)營者在各風(fēng)險(xiǎn)項(xiàng)上的評(píng)分情況,便于用戶直觀地發(fā)現(xiàn)主要風(fēng)險(xiǎn)項(xiàng)和高風(fēng)險(xiǎn)主體。由此,可以觀察高風(fēng)險(xiǎn)項(xiàng)在區(qū)域內(nèi)的空間分布和可能的集中情況。此外,該界面還提供探索性的相關(guān)性分析,包括可用于觀察高風(fēng)險(xiǎn)項(xiàng)與主要統(tǒng)計(jì)項(xiàng)關(guān)系的自定義散點(diǎn)圖、風(fēng)險(xiǎn)因子的自動(dòng)主成分分析和相關(guān)矩陣等。
圖3 食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)可視化系統(tǒng)風(fēng)險(xiǎn)識(shí)別界面
時(shí)間趨勢(shì)比較界面實(shí)現(xiàn)了兩不同年度間數(shù)據(jù)的比較(圖4)。系統(tǒng)首先自動(dòng)篩選出指定業(yè)態(tài)在指定兩年度間評(píng)分差異顯著的風(fēng)險(xiǎn)項(xiàng),并以列表的形式給出。此時(shí),交互式的密度圖和克利夫蘭點(diǎn)圖便可以分別比較指定風(fēng)險(xiǎn)項(xiàng)(如差異顯著項(xiàng))在兩年度間的評(píng)分?jǐn)?shù)據(jù)分布和各生產(chǎn)經(jīng)營者的評(píng)分變化。各生產(chǎn)經(jīng)營者風(fēng)險(xiǎn)項(xiàng)兩次評(píng)分的差值通過交互的排序柱狀圖進(jìn)行統(tǒng)計(jì),也反映在交互的空間分布圖上。
圖4 食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)可視化系統(tǒng)時(shí)間趨勢(shì)比較界面
數(shù)據(jù)可視化技術(shù)可以動(dòng)態(tài)、快速、直觀地開展食品生產(chǎn)經(jīng)營主體風(fēng)險(xiǎn)分級(jí)數(shù)據(jù)的多維度分析和展示,有助于強(qiáng)化風(fēng)險(xiǎn)表征、輔助監(jiān)管決策,為解放地方監(jiān)管人力、提高監(jiān)管效能、強(qiáng)化食品安全風(fēng)險(xiǎn)管理提供技術(shù)和工具支撐。下一步,可以構(gòu)建和應(yīng)用更多的數(shù)學(xué)模型以支持?jǐn)?shù)據(jù)分析,如機(jī)器學(xué)習(xí),還應(yīng)針對(duì)每一種分級(jí)信息的展示方式進(jìn)行規(guī)范化及標(biāo)準(zhǔn)化研究,建立統(tǒng)一的數(shù)據(jù)字典和可視化標(biāo)準(zhǔn)。