亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        2000-2017 年聯(lián)合國各成員國的SDGs 指標(biāo)對(duì)相關(guān)性系數(shù)數(shù)據(jù)集

        2021-04-15 10:34:58高天張麗麗黎建輝
        關(guān)鍵詞:方向國家

        高天,張麗麗,黎建輝*

        1.中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190

        2.中國科學(xué)院大學(xué),北京 100049

        引 言

        聯(lián)合國可持續(xù)發(fā)展目標(biāo)(Sustainable Development Goals,SDGs)是聯(lián)合國在《2030 議程》中提出的一系列新的發(fā)展目標(biāo)[1],全球發(fā)達(dá)國家和發(fā)展中國家均將其作為社會(huì)經(jīng)濟(jì)協(xié)調(diào)發(fā)展的重要指導(dǎo),來保障人類社會(huì)的長期穩(wěn)定和健康發(fā)展。由于SDGs 的3 級(jí)指標(biāo)主要支撐2 級(jí)具體目標(biāo)的落實(shí),且用于評(píng)估《2030 年議程》未來的落實(shí)情況[2],學(xué)界已經(jīng)廣泛地展開關(guān)于SDGs 目標(biāo)和指標(biāo)之間關(guān)聯(lián)性的研究。

        可持續(xù)發(fā)展目標(biāo)的相關(guān)性分析需要以統(tǒng)計(jì)的指標(biāo)數(shù)據(jù)為基礎(chǔ)。《可持續(xù)發(fā)展報(bào)告2020》[3](以下簡(jiǎn)稱報(bào)告)中提供的聯(lián)合國全體193 個(gè)成員國的統(tǒng)計(jì)數(shù)據(jù)包括了每項(xiàng)指標(biāo)從2000-2020 年的具體數(shù)值,但有些指標(biāo)的數(shù)據(jù)不完整,個(gè)別年份存在缺失。且指標(biāo)的時(shí)間序列數(shù)據(jù)只能反映指標(biāo)本身隨年份變化的結(jié)果,而無法看出與其他指標(biāo)之間的關(guān)聯(lián)性。因此,基于報(bào)告中已統(tǒng)計(jì)的元數(shù)據(jù),通過分析計(jì)算得出指標(biāo)的關(guān)聯(lián)性數(shù)據(jù),不僅可以直觀反映出SDGs 整體指標(biāo)框架之間的聯(lián)系,還可以為各國的政策實(shí)施和完善提供方法學(xué)的支持。

        本文涉及的SDGs 的3 級(jí)指標(biāo)數(shù)據(jù)包含基于對(duì)比分析所得的最優(yōu)相關(guān)分析算法——MIC 算法計(jì)算得出的指標(biāo)對(duì)之間的相關(guān)系數(shù)和基于Spearman 算法計(jì)算得到的指標(biāo)對(duì)相關(guān)方向,全面地描述了SDGs 指標(biāo)數(shù)據(jù)之間的關(guān)聯(lián)性,為聯(lián)合國各成員國未來進(jìn)一步研究和實(shí)施可持續(xù)發(fā)展目標(biāo)提供了可靠的數(shù)據(jù)支撐。

        1 數(shù)據(jù)采集和處理方法

        1.1 數(shù)據(jù)來源

        基于數(shù)據(jù)的規(guī)律性和可用性,本文所使用的SDGs 指標(biāo)的時(shí)間序列數(shù)據(jù)來自于《可持續(xù)發(fā)展報(bào)告2020》數(shù)據(jù)[3]。其中包含聯(lián)合國成員國家一共193 個(gè),時(shí)間跨度為2000-2020 年共21 年,指標(biāo)從SDG1 到SDG17 共包含85 項(xiàng)。

        1.2 數(shù)據(jù)處理方法

        數(shù)據(jù)處理方法一共有4 階段:數(shù)據(jù)預(yù)處理,相關(guān)性算法對(duì)比,基于最優(yōu)相關(guān)性算法MIC 的指標(biāo)對(duì)相關(guān)系數(shù)的計(jì)算,和基于Spearman 算法的指標(biāo)對(duì)相關(guān)方向的計(jì)算,以及南半球20 個(gè)國家的SDGs指標(biāo)對(duì)系數(shù)可視化,整體流程如圖1 所示。

        1.2.1 數(shù)據(jù)預(yù)處理

        (1)代碼名稱統(tǒng)一規(guī)范化

        本文首先對(duì)原始數(shù)據(jù)中不一致的指標(biāo)代碼進(jìn)行名稱統(tǒng)一。原始數(shù)據(jù)中共有3 處指標(biāo)代碼不一致,統(tǒng)一后的結(jié)果為:“sdg2_stunting”修改為“sdg2_stuntihme”,“sdg2_wasting”修改為“sdg2_wasteihme”,“sdg5_familypl”修改為“sdg5_fplmodel”。

        (2)數(shù)據(jù)組織

        按照國家將指標(biāo)數(shù)據(jù)分別進(jìn)行存儲(chǔ),對(duì)每個(gè)國家的指標(biāo)進(jìn)行處理。

        ①完整性查驗(yàn)與預(yù)處理

        處理規(guī)則為:a.對(duì)于21 年之中超過5 年以上沒有數(shù)據(jù)的指標(biāo)進(jìn)行直接刪除;b.根據(jù)每個(gè)國家每年的數(shù)據(jù)缺失率,最終選定了2000-2017 年的指標(biāo)數(shù)據(jù)。

        ② 數(shù)據(jù)補(bǔ)全與存儲(chǔ)

        a.對(duì)于有一些年份缺失數(shù)據(jù)的指標(biāo)利用Python 的Sklearn 庫中KNNImputer 函數(shù)進(jìn)行補(bǔ)全,其中k 的參數(shù)設(shè)為3;b.最后將每個(gè)國家預(yù)處理好的數(shù)據(jù)存儲(chǔ)成CSV 格式的文件,方便未來對(duì)于數(shù)據(jù)的計(jì)算。

        圖1 SDGs 指標(biāo)數(shù)據(jù)處理流程

        1.2.2 相關(guān)性算法性能對(duì)比分析和選擇

        有代表性的相關(guān)性算法有以下4 種,其各自的優(yōu)缺點(diǎn)如表1 所示。

        表1 4 種相關(guān)性算法對(duì)比

        SDGs 指標(biāo)數(shù)據(jù)存在多種函數(shù)和非函數(shù)關(guān)系,由表1 可知,MIC 在與其他相關(guān)性算法相比之下,可以探測(cè)到更多的相關(guān)關(guān)系。無論兩個(gè)變量是線性、立方、指數(shù)、周期,還是非線性關(guān)系,MIC 都可以探測(cè)出來,且可以給到較高的分?jǐn)?shù)[7]。因此本文先將MIC 作為探測(cè)SDGs 指標(biāo)對(duì)之間相關(guān)性的最優(yōu)算法測(cè)度。但MIC 無法檢測(cè)到相關(guān)方向,因此我們選取Spearman 相關(guān)系數(shù)來補(bǔ)充衡量指標(biāo)對(duì)之間的相關(guān)方向。

        1.2.3 基于MIC 算法的指標(biāo)對(duì)相關(guān)系數(shù)計(jì)算

        本研究利用MIC 算法,對(duì)193 個(gè)聯(lián)合國成員國的共62 項(xiàng)可實(shí)際使用指標(biāo)進(jìn)行了相關(guān)系數(shù)的計(jì)算。根據(jù)每個(gè)國家的指標(biāo)對(duì),將每項(xiàng)指標(biāo)兩兩配對(duì),共有1766 個(gè)指標(biāo)對(duì)。分別對(duì)每個(gè)國家的指標(biāo)對(duì)進(jìn)行MIC 的相關(guān)系數(shù)計(jì)算,每個(gè)國家的數(shù)據(jù)為一列,對(duì)193 個(gè)國家的數(shù)據(jù)進(jìn)行合并存儲(chǔ)。

        1.2.4 基于Spearman 算法的指標(biāo)對(duì)相關(guān)方向計(jì)算

        由MIC 的定義和性質(zhì)可知,MIC 系數(shù)的范圍在0-1 之間,本質(zhì)上提供了相關(guān)程度的參考,而對(duì)于相關(guān)方向,其并無法表示。Spearman 算法可以衡量2 個(gè)變量之間的單調(diào)性,且不受變量的分布和樣本容量影響。因此本研究利用Spearman 算法,對(duì)每個(gè)指標(biāo)對(duì)進(jìn)行相關(guān)方向的判定,輸出結(jié)果1 表示正相關(guān),?1 表示負(fù)相關(guān)(1 和?1 與Spearman 的相關(guān)系數(shù)取值無關(guān),僅為相關(guān)方向的符號(hào)),作為MIC 算法的補(bǔ)充。每個(gè)國家的處理過程和1.2.3 一樣,最終結(jié)果存儲(chǔ)到一個(gè)CSV 格式的文件中。

        1.2.5 南半球20 個(gè)國家的SDGs 指標(biāo)對(duì)系數(shù)可視化

        SDGs 指標(biāo)對(duì)相關(guān)系數(shù)可用于缺失數(shù)據(jù)補(bǔ)全,提供SDGs 實(shí)施方向指南,發(fā)掘SDGs 發(fā)展進(jìn)程,有助于對(duì)SDGs 問題的及時(shí)發(fā)現(xiàn)與政策校準(zhǔn),這在發(fā)展中國家的意義尤為突出。由于地理位置和歷史原因,南半球的國家絕大部分都是發(fā)展中國家,其更應(yīng)該受到國際的關(guān)注。因此本研究根據(jù)南半球各國的指標(biāo)數(shù)量,選取聯(lián)合國成員國南半球國家中數(shù)據(jù)完整性前20 的國家,以熱力圖形式按國別展示其SDGs 指標(biāo)對(duì)的相關(guān)關(guān)系,圖片存儲(chǔ)在數(shù)據(jù)集中。(注:圖片中為顯示出指標(biāo)對(duì)的相關(guān)方向的顏色差異,因此將負(fù)相關(guān)的MIC 系數(shù)取負(fù),負(fù)號(hào)僅代表相關(guān)方向。)

        2 數(shù)據(jù)樣本描述

        本數(shù)據(jù)包括2000-2017 年間,共193 個(gè)聯(lián)合國成員國的SDGs 的指標(biāo)對(duì)的MIC 相關(guān)系數(shù),以及相關(guān)方向。為方便計(jì)算和應(yīng)用,本研究將數(shù)據(jù)存儲(chǔ)名為Correlation coefficient of Indicator pairs.csv 的文件,橫軸代表國家,縱軸代表指標(biāo)對(duì)相關(guān)系數(shù)的和得分。原始數(shù)據(jù)集由文獻(xiàn)[3]所提供,該數(shù)據(jù)集包括About、Overview、Codebook、SDR2020 Data、Raw Trend Data 4 共5 張子表。其中Codebook表中詳細(xì)描述了每一項(xiàng)指標(biāo)的特征,Raw Trend Data 是193 個(gè)國家2000-2020 年的指標(biāo)原始數(shù)據(jù)集。根據(jù)預(yù)處理后所得數(shù)據(jù)集,最終一共有62 項(xiàng)可用指標(biāo),經(jīng)無重復(fù)互相配對(duì)后共有1766 個(gè)指標(biāo)對(duì)。為展示數(shù)據(jù)集樣本,此節(jié)隨機(jī)選取南半球的一個(gè)成員國“安哥拉(Angola)”的數(shù)據(jù)集以及其可視化結(jié)果,如表2 和圖2 所示。整體數(shù)據(jù)集內(nèi)指標(biāo)對(duì)出現(xiàn)的國家數(shù)量和缺失國家部分結(jié)果見表3。

        表2 SDGs 指標(biāo)對(duì)相關(guān)系數(shù)和相關(guān)方向(Angola,前15 個(gè)指標(biāo)對(duì))

        圖2 SDGs 指標(biāo)對(duì)相關(guān)系數(shù)熱力圖(Angola)

        表3 SDGs 指標(biāo)對(duì)出現(xiàn)國家數(shù)量和缺失國家(部分)

        3 數(shù)據(jù)質(zhì)量控制和評(píng)估

        本數(shù)據(jù)集的質(zhì)量控制體現(xiàn)在兩方面:一是數(shù)據(jù)預(yù)處理中對(duì)原始指標(biāo)時(shí)間序列的名稱統(tǒng)一、刪減和補(bǔ)全;二是對(duì)選取MIC 算法進(jìn)行實(shí)際的驗(yàn)證。

        3.1 數(shù)據(jù)預(yù)處理控制

        對(duì)于原始數(shù)據(jù)的預(yù)處理是后期SDGs 指標(biāo)數(shù)據(jù)相關(guān)性分析的必須前提,名稱不統(tǒng)一和缺失的數(shù)據(jù)會(huì)對(duì)后續(xù)的分析產(chǎn)生很大影響。其中名稱統(tǒng)一詳見第1.2.1 節(jié)。Olga Troyanskaya 和Michael Cantor等人[8]基于無噪聲的時(shí)間序列、有噪聲的時(shí)間序列和非時(shí)間序列3 組基因微矩陣的數(shù)據(jù)集,利用KNN算法、SVD 算法和行平均算法進(jìn)行對(duì)比驗(yàn)證,證實(shí)了KNN 算法在估算缺失值方面具有更好的穩(wěn)定性和健壯性。因此本文選用KNN 填補(bǔ)法對(duì)SDGs 指標(biāo)數(shù)據(jù)進(jìn)行缺失值估算填充。

        3.2 MIC 算法的質(zhì)量檢驗(yàn)

        由于國家數(shù)量較多,本研究依據(jù)每個(gè)大洲的GDP 排名[9],選取了排名靠前的20%的國家(共43個(gè))的指標(biāo)數(shù)據(jù)對(duì)4 種相關(guān)性算法進(jìn)行了對(duì)比實(shí)驗(yàn)。對(duì)SDGs 指標(biāo)數(shù)據(jù)的相關(guān)性研究從根本上是要探索和發(fā)現(xiàn)指標(biāo)之間更多的關(guān)聯(lián)性,在此基礎(chǔ)上本文提出了兩種評(píng)價(jià)維度用來評(píng)價(jià)4 種相關(guān)性算法的優(yōu)劣。43 個(gè)國家的名字如表4 所示。

        表4 43 個(gè)國家(排名不分先后)

        兩種評(píng)價(jià)維度:公式(1)代表廣度覆蓋,公式(2)、(3)代表深度覆蓋[10]。

        其中,Sa代表利用Ma算法對(duì)相關(guān)系數(shù)矩陣進(jìn)行閾值λ(|λ|∈[0,1])篩選后得到的指標(biāo)對(duì)集合(其中不包含同一指標(biāo)與本身的相關(guān)性得分),Sb同理。S代表總指標(biāo)對(duì)的集合。廣度覆蓋表示在Ma方法下探測(cè)到的有效的指標(biāo)對(duì)占總體指標(biāo)對(duì)的比例;深度覆蓋表示在Ma和Mb方法都能探測(cè)到的有效指標(biāo)對(duì)中,分別占Ma方法下的指標(biāo)對(duì)和Mb方法下的指標(biāo)對(duì)的比例。

        43 個(gè)國家的總指標(biāo)對(duì)數(shù)量如圖3 所示。

        圖3 43 個(gè)國家的總指標(biāo)對(duì)數(shù)量

        對(duì)于前3 種傳統(tǒng)的統(tǒng)計(jì)學(xué)相關(guān)性算法進(jìn)行顯著性檢驗(yàn),Pearson、Spearman、Kendall 在顯著性水平α=0.05的條件下,分別查表[11-12]得到相關(guān)系數(shù)臨界值為:rp=0.468,rs=0.503,rk=0.317,自由度均為18-2=16。根據(jù)3 種測(cè)度算法的相關(guān)系數(shù)臨界值,可以計(jì)算指標(biāo)對(duì)在3 種算法測(cè)度下的相關(guān)系數(shù)滿足|rp|>0.468,|rs|>0.503,|rk|>0.317 (包括了正相關(guān)和負(fù)相關(guān)兩種相關(guān)方向)的條件下,指標(biāo)對(duì)之間拒絕零假設(shè),存在相關(guān)關(guān)系。

        MIC 和其他3 種相關(guān)性算法測(cè)度的廣度覆蓋和深度覆蓋分別如圖4 和圖5 所示。從圖中分布可以看出,對(duì)于兩種評(píng)價(jià)維度,MIC 對(duì)于其他3 種測(cè)度的覆蓋,明顯優(yōu)于其他3 種測(cè)度對(duì)MIC 的覆蓋。這說明MIC 可以探測(cè)到更廣泛的相關(guān)關(guān)系,因此選取MIC 算法作為SDGs 指標(biāo)數(shù)據(jù)相關(guān)性分析的最優(yōu)算法。

        圖4 43 個(gè)國家廣度覆蓋評(píng)價(jià)維度對(duì)比結(jié)果

        圖5 43 個(gè)國家深度評(píng)價(jià)維度對(duì)比結(jié)果

        4 數(shù)據(jù)價(jià)值

        SDGs 的目標(biāo)涵蓋了經(jīng)濟(jì)、政治、人文等多個(gè)領(lǐng)域,截止到2020 年,SDGs 共有17 個(gè)總體目標(biāo),169 個(gè)相關(guān)目標(biāo)和230 多個(gè)用來監(jiān)測(cè)實(shí)施進(jìn)展情況的指標(biāo)。從出現(xiàn)國家次數(shù)排名前20 的總指標(biāo)對(duì)中可以看出,科技期刊論文數(shù)量、與能源相關(guān)的二氧化碳排放量和物種生存指數(shù)紅色名單這3 個(gè)指標(biāo)均被所有國家統(tǒng)計(jì),這意味著這些指標(biāo)對(duì)所有國家都具有廣泛的影響效應(yīng)??梢愿顚哟蔚胤从吵?,各國對(duì)于科技、能源和生物的重視應(yīng)不亞于經(jīng)濟(jì)發(fā)展的重視。對(duì)于出現(xiàn)次數(shù)較少的指標(biāo)如sdg9_netacc〔Gap in internet access by income (percentage points)〕和sdg10_adjgini(Gini coefficient adjusted for top income)等,可能與數(shù)據(jù)缺失量較大有關(guān)。需要各國政府進(jìn)一步加強(qiáng)對(duì)這些問題的關(guān)注,督促有關(guān)部門盡快制定和完善監(jiān)測(cè)工作和統(tǒng)計(jì)方案,以保障從各個(gè)方面推進(jìn)可持續(xù)發(fā)展議程的實(shí)質(zhì)進(jìn)展。

        本數(shù)據(jù)集包括聯(lián)合國193 個(gè)成員國的2000-2017 年的SDGs 62 項(xiàng)可利用指標(biāo)對(duì)相關(guān)系數(shù)和相關(guān)方向,以及南半球數(shù)據(jù)量排名前20 的國家的相關(guān)系數(shù)可視化結(jié)果。數(shù)據(jù)集存儲(chǔ)在CAB 格式的文件中。相關(guān)系數(shù)和相關(guān)方向包含了SDGs 指標(biāo)數(shù)據(jù)較為有價(jià)值的相關(guān)性信息,其中相關(guān)系數(shù)反映了指標(biāo)之間的相關(guān)程度,進(jìn)而反映了指標(biāo)之間影響作用的大小;相關(guān)方向反映了指標(biāo)之間互相影響的方向,揭示了SDGs 指標(biāo)之間的促進(jìn)和制約關(guān)系。本數(shù)據(jù)集為SDGs 指標(biāo)監(jiān)測(cè)和實(shí)施提供了一定的參考價(jià)值,用戶既可用來分析SDGs 指標(biāo)之間促進(jìn)和制約的關(guān)系,亦可參考制定相應(yīng)政策。

        致 謝

        感謝基金項(xiàng)目對(duì)于本研究的支持,以及感謝Sachs J、Schmidt-Traub 等人提供的原始數(shù)據(jù)。

        數(shù)據(jù)作者分工職責(zé)

        高天(1995—),男,內(nèi)蒙古呼和浩特市人,在讀碩士研究生,研究方向?yàn)榇髷?shù)據(jù)挖掘與應(yīng)用。主要承擔(dān)工作:數(shù)據(jù)處理、論文撰寫。

        張麗麗(1984—),女,高級(jí)工程師,研究方向?yàn)殚_放科學(xué)、開放數(shù)據(jù)技術(shù)政策,信息經(jīng)濟(jì)學(xué)。主要承擔(dān)工作:數(shù)據(jù)校核、質(zhì)量控制。

        黎建輝(1973—),男,研究員,研究方向?yàn)榇髷?shù)據(jù)資源開放共享、大數(shù)據(jù)管理技術(shù)、大數(shù)據(jù)計(jì)算與分析技術(shù)等。主要承擔(dān)工作:文章框架和方向的把握。

        猜你喜歡
        方向國家
        國家公祭日
        2022年組稿方向
        2022年組稿方向
        2021年組稿方向
        2021年組稿方向
        2021年組稿方向
        國家
        能過兩次新年的國家
        把國家“租”出去
        奧運(yùn)會(huì)起源于哪個(gè)國家?
        中文精品久久久久中文| 朝鲜女人大白屁股ass| 中文无码制服丝袜人妻av| 神马不卡一区二区三级| 亚洲国产精品一区二区| 狠狠cao日日橹夜夜十橹| 国产精品制服| 亚洲AV无码国产成人久久强迫| 极品少妇被后入内射视| 少妇高潮在线精品观看| 久久久www成人免费精品| 国产区福利| 精品人妻一区二区三区av| 91久久精品色伊人6882| 国产精品久久久久久婷婷| 亚洲精品一二区| 国产精品亚洲最新地址| 美女窝人体色www网站| 人妻中文字幕在线一二区 | 亚洲欧洲成人精品香蕉网| 欧美aa大片免费观看视频| 亚洲AV秘 无码一区二区三区| 国产免费人成视频在线观看播放播 | 91精品国产92久久久| 久久久久国产一区二区| 国产麻豆一精品一AV一免费软件| 手机在线中文字幕av| 无码国产成人午夜电影在线观看| 欧美亚洲国产片在线播放| аⅴ天堂一区视频在线观看| 国产av剧情精品麻豆| 精品无码国产自产拍在线观看| 84pao强力打造免费视频34| 中文熟女av一区二区| 女同视频一区二区在线观看| 国内精品人妻无码久久久影院导航| 午夜视频网址| 在线视频一区二区国产| 中文字幕在线日亚洲9| 久久久久久人妻精品一区百度网盘| 精品蜜桃在线观看一区二区三区|