亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        對(duì)中國(guó)各行業(yè)年平均工資的函數(shù)性數(shù)據(jù)分析

        2014-05-10 06:54:22孟銀鳳梁吉業(yè)
        關(guān)鍵詞:增長(zhǎng)速度平均工資工資

        孟銀鳳,梁吉業(yè)

        (1.山西大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,山西 太原 030006;2.山西大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)

        0 引言

        年平均工資(簡(jiǎn)記為平均工資)體現(xiàn)了企業(yè)的盈利程度及行業(yè)的發(fā)展程度,也反映了居民的收入水平。隨著我國(guó)國(guó)民經(jīng)濟(jì)的飛速發(fā)展,各行業(yè)就業(yè)人員的平均工資都有所提高,與此同時(shí),行業(yè)間的工資差距也呈現(xiàn)不斷擴(kuò)大的趨勢(shì)。這已經(jīng)引起了全社會(huì)的廣泛關(guān)注,并對(duì)行業(yè)自身的發(fā)展、人們的擇業(yè)觀念、社會(huì)風(fēng)氣和社會(huì)穩(wěn)定等方面都帶來(lái)了不良影響。為了幫助政府在制定縮小收入差距的政策時(shí)提供一定的參考,本文搜集了中國(guó)2003到2011年間19個(gè)行業(yè)就業(yè)人員的平均工資[1],并根據(jù)這些數(shù)據(jù)比較各行業(yè)的工資差距。其中這19個(gè)行業(yè)包括農(nóng)林牧漁業(yè)(F1采礦業(yè)(F2制造業(yè)(F3電燃?xì)馑墓?yīng)業(yè)(F4建筑業(yè)(F5運(yùn)輸倉(cāng)儲(chǔ)和郵政業(yè)(F6);計(jì)算機(jī)服務(wù)和軟件業(yè)(F7);批發(fā)和零售業(yè)(F8);住宿和餐飲業(yè)(F9);金融業(yè)(F10);房地產(chǎn)業(yè)(F11);租賃和商務(wù)服務(wù)業(yè)(F12);科研和地質(zhì)勘察業(yè)(F13);水利環(huán)境公共設(shè)施業(yè)(F14);服務(wù)業(yè)(F15);教育(F16);衛(wèi)生和社會(huì)福利業(yè)(F17);文化體育和娛樂業(yè)(F18);公共管理和社會(huì)組織(F19)。

        不同行業(yè)的平均工資均對(duì)應(yīng)一個(gè)時(shí)間序列,因而從函數(shù)數(shù)據(jù)的角度去分析更加合理。就目前的研究文獻(xiàn)來(lái)看,函數(shù)性數(shù)據(jù)分析方法的研究雖然在國(guó)外已經(jīng)取得了豐碩的成果[2-5],但總體來(lái)看還處于起步階段,且很少用于經(jīng)濟(jì)數(shù)據(jù)的分析。國(guó)內(nèi)在函數(shù)性數(shù)據(jù)方面的研究?jī)H處于介紹和學(xué)習(xí)階段[6-8]。不同于其他論文[5,8],本文對(duì)平均工資這一函數(shù)數(shù)據(jù)分別運(yùn)用函數(shù)性主成分分析和聚類分析兩個(gè)方法研究它的行業(yè)分類狀況。為此首先對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,即將離散觀測(cè)數(shù)據(jù)轉(zhuǎn)化為函數(shù)數(shù)據(jù),然后將處理后的函數(shù)數(shù)據(jù)用于主成分分析和聚類分析,其中聚類分析采用L2距離。

        1 函數(shù)性數(shù)據(jù)的預(yù)處理

        1.1 預(yù)處理的理論知識(shí)

        對(duì)于一組二維數(shù)據(jù),即平面上的n個(gè)點(diǎn)(xi,yi),i=1,2,…n,諸xi互不相同。尋求一個(gè)函數(shù)(曲線)^y=f(x),使f(x)在某種準(zhǔn)則下與所有數(shù)據(jù)點(diǎn)最為接近,即曲線擬合的最好。首先,確定所求曲線的形式(經(jīng)驗(yàn)公式),而線性最小二乘法是解決曲線擬合最常用的方法之一[2,6]。令

        其中:rk(x)是事先選定的一組基函數(shù),ak是待定系數(shù)(k=1,2,…,m,m<n)。擬合的準(zhǔn)則是使點(diǎn)(xi,yi),i=1,2,…,n與其擬合值^y=f(xi)的距離δi的平方和(SSE)最小,稱為最小二乘準(zhǔn)則。進(jìn)而得到關(guān)于a1,a2,…,am的線性方程組。其中

        1.2 預(yù)處理的分析

        這里我們采用多項(xiàng)式基對(duì)表1中的數(shù)據(jù)進(jìn)行預(yù)處理,得到各行業(yè)就業(yè)人員平均工資的平滑曲線 及其速度變化曲線。

        從圖1可以看出:我國(guó)各行業(yè)就業(yè)人員平均工資在2003到2011年之間均呈現(xiàn)增長(zhǎng)趨勢(shì),但增長(zhǎng)速度各有不同。F7、F10、F13一直是各行業(yè)中的高薪產(chǎn)業(yè),并且增長(zhǎng)速度也快于其他產(chǎn)業(yè)。同時(shí),金融行業(yè)在這幾年間增長(zhǎng)速度一直最快,使得它成為從2008年以后的“最高薪”行業(yè)。F2、F4、F6、F11、F12、F16、F17、F18、F19等幾個(gè)行業(yè)的工資雖沒有前面三個(gè)行業(yè)的工資那么高,增長(zhǎng)速度也沒那么快,但整體來(lái)說也一直是薪資不錯(cuò)的行業(yè),這與國(guó)家的政策也一致,因?yàn)閲?guó)家一直大力支持文教、衛(wèi)生、社會(huì)福利業(yè),以滿足人民日益增長(zhǎng)的精神需求。而在工資的比較中,F(xiàn)1、F3、F5、F8、F9、F14、F15等行業(yè)的工資屬于薪資最低的,并且增長(zhǎng)速度也是最慢的,這與我國(guó)屬于勞動(dòng)密集型的現(xiàn)狀不無(wú)關(guān)系。

        表1 中國(guó)2003年到2011年間19個(gè)行業(yè)就業(yè)人員的平均工資(元)Table 1 Average wage of employed persons in various industries in China from 2003 to 2011(yuan)

        Fig.1 Smoothing curve and velocity curve of average wage for various industry employment圖1 各行業(yè)就業(yè)人員的平均工資平滑曲線及速度曲線

        Fig.2 Mean curve and standard deviation curve of average wage in various industries圖2 各行業(yè)平均工資的均值曲線和標(biāo)準(zhǔn)差曲線

        圖2描述了我國(guó)各行業(yè)平均工資的均值曲線和標(biāo)準(zhǔn)差曲線。從均值曲線可以明顯地看出我國(guó)各行業(yè)工資的平均變化趨勢(shì)是逐年遞增的,并且增長(zhǎng)速度不斷加快。由標(biāo)準(zhǔn)差曲線可以看出,各行業(yè)平均工資之間的差異隨著時(shí)間的變化也越來(lái)越大。

        2 函數(shù)性主成分分析及應(yīng)用

        2.1 主成分分析的理論知識(shí)

        在函數(shù)性數(shù)據(jù)分析中,函數(shù)型變量記錄了每一個(gè)觀測(cè)對(duì)象的同一個(gè)變量某個(gè)區(qū)間上很多個(gè)時(shí)刻的數(shù)據(jù)信息,如果將時(shí)間看作與多元數(shù)據(jù)對(duì)應(yīng)的變量(變化因素),則發(fā)現(xiàn)函數(shù)性數(shù)據(jù)分析面臨著更大的“維度災(zāi)”。基于這種特點(diǎn),可以將多元主成分分析技術(shù)引入到函數(shù)性數(shù)據(jù)分析中,稱為函數(shù)性主成分分析[4-6]。其基本思想如下:

        設(shè)xi(s)(s∈T),i=1,2,…,N 為區(qū)間T 上的中心化后的平方可積函數(shù),s對(duì)應(yīng)多元主成分分析中的j,s是連續(xù)的而j是離散的。將區(qū)間T上的x(s)綜合為一個(gè)變量

        其中β(s)為加權(quán)系數(shù),對(duì)應(yīng)于多元主成分分析中的βj。第k主成分需滿足下面的約束條件下的最大值問題[9]:

        實(shí)踐中,Var(fi)通常用樣本方差取代 。記變量x(s)和x(t)的協(xié)方差為ν(s,t),有

        求函數(shù)性主成分的權(quán)重函數(shù)β(s)的過程相當(dāng)于解以下的特征方程[3-4]

        其中λ為特征值。

        函數(shù)性主成分的選擇思想和多元主成分的相同[10-11],也是確定累計(jì)貢獻(xiàn)率。選擇合適的K 使得達(dá)到所確定的累計(jì)貢獻(xiàn)率,一般要求累計(jì)貢獻(xiàn)率不小于85%。

        2.2 函數(shù)性主成分分析的應(yīng)用

        基于Matlab軟件,先將本文中擬合后的函數(shù)數(shù)據(jù)中心化,然后對(duì)中心化后的數(shù)據(jù)進(jìn)行主成分分析,其前三個(gè)主成分的權(quán)重函數(shù)如圖3。

        第一主成分的貢獻(xiàn)率是96.6%,即第一主成分能反映樣本數(shù)據(jù)的96.6%的信息。同理,第二主成分的貢獻(xiàn)率是3.2%,第一主成分和第二主成分的累計(jì)貢獻(xiàn)率是99.8%。因此,前兩個(gè)主成分能夠反映樣本數(shù)據(jù)信息的99.8%。所以可以將原來(lái)的高維數(shù)據(jù)降到2維。使用前兩個(gè)主成分上的得分向量來(lái)代表樣本數(shù)據(jù),既能降維,又去除冗余信息。為了直觀起見,給出各行業(yè)的散點(diǎn)圖如圖4。根據(jù)第一主成分的得分情況,可將各行業(yè)的平均工資水平大致分為三類(見圖4)。

        Fig.3 Weight function of different principal components圖3 各主成分權(quán)重函數(shù)

        Fig.4 Scattered point diagram of PC1 score and PC2 score圖4 前兩個(gè)主成分得分的散點(diǎn)圖

        3 函數(shù)性聚類分析及應(yīng)用

        3.1 聚類分析理論知識(shí)

        在數(shù)據(jù)挖掘中,函數(shù)性數(shù)據(jù)聚類分析算法是一種常用的數(shù)據(jù)分析方法,它通過發(fā)掘函數(shù)性數(shù)據(jù)集中潛在的類結(jié)構(gòu),將分析對(duì)象分組成為由類似對(duì)象組成的多個(gè)類的過程,使類內(nèi)的對(duì)象彼此相似,不同類的對(duì)象彼此相異。聚類問題的關(guān)鍵在于相似性測(cè)度方法。對(duì)曲線軌跡相似性測(cè)度的研究已有很多成果,主要可分為基于曲線數(shù)值模式和曲線形狀模式的相似性測(cè)度[4,8,12]。使用聚類分析可以更好地研究數(shù)據(jù)信息,提取出對(duì)人們生活有利的信息。

        在聚類算法中,對(duì)象與對(duì)象之間的距離的計(jì)算方法有很多種,本文中只利用L2距離:

        而類間距采用類平均法。

        3.2 函數(shù)性聚類分析的應(yīng)用

        利用Matlab編寫時(shí)間序列下各行業(yè)工資相似性的聚類分析程序,對(duì)構(gòu)成我國(guó)19個(gè)不同行業(yè)就業(yè)人員平均工資及其增長(zhǎng)速度的數(shù)據(jù)曲線進(jìn)行聚類分析。聚類結(jié)果見圖5和圖6。圖5的結(jié)構(gòu)顯示,可以將19個(gè)行業(yè)聚為平均工資收入明顯不同的3類,各類行業(yè)平均工資曲線如圖7所示。由圖7可見:第1類屬于薪資最高的一類,包括F7、F10、F13等3個(gè)行業(yè)。第2類屬于薪資最低的一類,包括F1、F3、F5、F8、F9、F14、F15等7個(gè)行業(yè)。第3類的薪資居于前兩類之間,包括F2、F4、F6、F11、F12、F16、F17、F18、F19等9個(gè)行業(yè)。事實(shí)上,這與主成分分析的結(jié)果一致(見圖4)。

        Fig.5 Average wage clustering diagram of 19 industries圖5 19個(gè)行業(yè)平均工資的聚類圖

        Fig.6 Average wage growth speed clustering diagram of 19 industries圖6 19個(gè)行業(yè)的平均工資增長(zhǎng)速度聚類圖

        實(shí)踐中,對(duì)某些時(shí)間序列的分析而言,序列的速度變化趨勢(shì)也是有用的深層次信息和研究的重要內(nèi)容。因而我們對(duì)各行業(yè)的工資增長(zhǎng)速度也進(jìn)行了數(shù)據(jù)挖掘。根據(jù)圖6,將速度曲線大致可以分為四類,見圖8。第1類增長(zhǎng)速度最快,包括F10。第2類速度次之,包括F2、F7、F13。第3類速度比第2類又稍緩,包括F4、F6F8F11F12F16F17F18F19等。第4類速度最緩,包括F1F3F5F9F14F15等。

        Fig.7 Classification diagram for average wage curves in different industries圖7 不同行業(yè)平均工資曲線的分類圖

        Fig.8 Classification diagram for the growth speed curves of average wage in different industries圖8 不同行業(yè)平均工資增長(zhǎng)速度曲線的分類圖

        4 結(jié)論

        本文運(yùn)用兩種函數(shù)性數(shù)據(jù)分析方法(函數(shù)性主成分分析和聚類分析)研究了我國(guó)各行業(yè)就業(yè)人員的平均工資數(shù)據(jù)。從聚類分析結(jié)果可知,我國(guó)科研和地質(zhì)勘查業(yè),金融業(yè),計(jì)算機(jī)服務(wù)和軟件業(yè)這3個(gè)行業(yè)屬于高薪行業(yè),并且增長(zhǎng)速度相較于其他行業(yè)也是最快的;電燃?xì)馑墓?yīng)業(yè),采礦業(yè),公共管理和社會(huì)組織業(yè),教育,房地產(chǎn)業(yè),文化體育娛樂業(yè),租賃和商務(wù)服務(wù)業(yè),衛(wèi)生社會(huì)福利業(yè)以及運(yùn)輸倉(cāng)儲(chǔ)郵政業(yè)這9個(gè)行業(yè)的工資次之;住宿餐飲業(yè),水利環(huán)境公共設(shè)施業(yè),建筑業(yè),批發(fā)和零售業(yè),服務(wù)業(yè),制造業(yè)以及農(nóng)林牧漁業(yè)7個(gè)行業(yè)屬于工資最低一類,其增長(zhǎng)速度相較于其他行業(yè)也比較慢。這與主成分分析的結(jié)果保持一致。說明我國(guó)目前各行業(yè)就業(yè)人員的平均工資基本呈現(xiàn)該特點(diǎn)。

        [1] 歷年中國(guó)統(tǒng)計(jì)年鑒[Z].北京:中國(guó)統(tǒng)計(jì)出版社,2012.

        [2] Cardot H,F(xiàn)erraty F,Sarda P.Spline Estimators for the Functional Linear Model[J].Statistica Sinica,2003,13:571-591.

        [3] Ramsay J O.When the Data Are Functions[J].Psychometrika,1982,47(4):379-396.

        [4] Ramsay J O,Silverman B W.Functional Data Analysis[M].Second Edition.Springer,2005.

        [5] Lee H J.Functional data analysis:Classification and Regression[D].Texas A & M University,2004.

        [6] 嚴(yán)明義.函數(shù)性數(shù)據(jù)的統(tǒng)計(jì)分析:思想、方法和應(yīng)用[J].統(tǒng)計(jì)研究,2007,2:87-94.

        [7] 嚴(yán)明義.經(jīng)濟(jì)數(shù)據(jù)分析:一種基于數(shù)據(jù)的函數(shù)性視角的分析方法[J].當(dāng)代經(jīng)濟(jì)科學(xué),2007b,1:108-113.

        [8] 靳劉蕊.函數(shù)性數(shù)據(jù)分析方法及應(yīng)用研究[D].廈門:廈門大學(xué),2008.

        [9] 孟銀鳳,梁吉業(yè),原曦曦.函數(shù)性數(shù)據(jù)分析中的主成分分析[J].山西大學(xué)學(xué)報(bào):自然科學(xué)版,2011,34(1):21-25.

        [10] 朱建平.應(yīng)用多元統(tǒng)計(jì)分析[M].北京:科學(xué)出版社,2006.

        [11] 雷欽禮.經(jīng)濟(jì)管理多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,2002.

        [12] 朱建平,陳民懇.面板數(shù)據(jù)的聚類分析及其應(yīng)用[J].統(tǒng)計(jì)研究,2007,2:11-14.

        猜你喜歡
        增長(zhǎng)速度平均工資工資
        No.6 2021年平均工資出爐
        這種情況下未續(xù)訂勞動(dòng)合同是否應(yīng)當(dāng)支付二倍工資
        國(guó)家財(cái)政收支總額及增長(zhǎng)速度(包括國(guó)內(nèi)外債務(wù)部分)
        國(guó)家財(cái)政收支總額及增長(zhǎng)速度(不包括國(guó)內(nèi)外債務(wù)部分)
        說說索要工資那些事
        不用干活,照領(lǐng)工資
        山東青年(2016年2期)2016-02-28 14:25:45
        圖解:數(shù)說2014年平均工資
        文苑(2015年7期)2015-07-06 11:58:54
        經(jīng)濟(jì)增長(zhǎng)速度與產(chǎn)業(yè)結(jié)構(gòu)關(guān)系研究——對(duì)中國(guó)不同區(qū)域經(jīng)濟(jì)增長(zhǎng)速度趨勢(shì)性變化的分析
        “大多數(shù)”商機(jī)在哪里?
        讓績(jī)效工資“陽(yáng)光”起來(lái)
        狠狠色噜噜狠狠狠8888米奇| 亚洲欧美另类日本久久影院| 成人在线视频自拍偷拍| 国产实拍日韩精品av在线| 老师露出两个奶球让我吃奶头 | 亚洲熟女精品中文字幕| 国精品无码一区二区三区在线| 8av国产精品爽爽ⅴa在线观看| 国产精品丝袜美腿诱惑| 天天综合天天爱天天做| 亚洲美腿丝袜 欧美另类| 国产精品无码久久久一区蜜臀| 日本高清在线一区二区三区| 26uuu在线亚洲欧美| 又粗又硬又黄又爽的免费视频| 2021国内精品久久久久精免费| 女同另类一区二区三区| 丝袜人妻一区二区三区| 久久人人妻人人做人人爽| 国产精品久久婷婷婷婷| 国产精品麻豆一区二区三区 | 久久国产精品懂色av| 日韩精品无码一区二区三区| 欧美日韩国产成人高清视频| 久久婷婷色香五月综合激情| 亚洲97成人精品久久久| 97精品国产一区二区三区| 久久国产精品久久精品国产| 精品视频在线观看一区二区有| 国产亚洲精品视频一区二区三区| 最新亚洲人成网站在线观看| 久久免费区一区二区三波多野在| 成年人视频在线播放麻豆| 精品无码av一区二区三区不卡| 国产96在线 | 欧美| 中文国产日韩欧美二视频| 高清国产一级毛片国语| 亚洲熟女天堂av一区二区三区| 国产精品久久久久久福利| 亚洲乱码视频在线观看| 国产99视频一区二区三区|