吳云霞, 康 娜, 陳紅娟, 劉 靜
(1.河北地質(zhì)大學(xué), 河北 石家莊 050031;2.安徽省地質(zhì)礦產(chǎn)勘察局322地質(zhì)隊(duì), 安徽 馬鞍山 243000)
?
基于主成分分析法的河北省人口文化素質(zhì)綜合評(píng)估
吳云霞1,康娜1,陳紅娟1,劉靜2
(1.河北地質(zhì)大學(xué), 河北 石家莊050031;2.安徽省地質(zhì)礦產(chǎn)勘察局322地質(zhì)隊(duì), 安徽 馬鞍山243000)
摘要:采用主成分分析方法對(duì)河北省的11個(gè)設(shè)區(qū)市進(jìn)行人口文化素質(zhì)綜合評(píng)估。石家莊、秦皇島、唐山、廊坊高中以上教育較好,專業(yè)技術(shù)人員的比例較高。而邯鄲、邢臺(tái)、滄州、衡水這四個(gè)城市高學(xué)歷人才要相對(duì)少一些。衡水、邢臺(tái)、保定、石家莊9年義務(wù)教育推行實(shí)現(xiàn)的相對(duì)更好,張家口、承德、邯鄲的基礎(chǔ)教育發(fā)展較為薄弱。綜合評(píng)估結(jié)果與河北省11個(gè)設(shè)區(qū)市的經(jīng)濟(jì)、社會(huì)等綜合發(fā)展水平基本相一致。
關(guān)鍵詞:主成分分析; 人口文化素質(zhì);spss軟件; 綜合評(píng)估
0引言
人口文化素質(zhì)是衡量人口素質(zhì)的重要標(biāo)志之一[1]。目前,國內(nèi)對(duì)于人口文化素質(zhì)的綜合評(píng)估方法都借鑒人口素質(zhì)PQLI及HDI的構(gòu)建方法構(gòu)建人口文化素質(zhì)綜合評(píng)估模型[2-6]。文中采用主成分分析方法,在選取指標(biāo)相類似的情況下對(duì)河北省人口文化素質(zhì)進(jìn)行綜合評(píng)估,試圖找到文化素質(zhì)高低的原因,并進(jìn)行聚類分析,對(duì)11個(gè)設(shè)區(qū)市進(jìn)行歸類,針對(duì)不同類別人口文化素質(zhì)發(fā)展存在的問題指出對(duì)策。
1主成分分析的原理和步驟
主成分分析就是把原有的多個(gè)指標(biāo)轉(zhuǎn)化成少數(shù)幾個(gè)代表性較好的綜合指標(biāo),這少數(shù)幾個(gè)指標(biāo)能夠反映原來指標(biāo)大部分的信息(85%以上),并且各個(gè)指標(biāo)之間保持獨(dú)立,避免出現(xiàn)重疊信息。它們通常表示為原始變量的某種線性組合。主成分分析主要起著降維和簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)的作用[7-10]。
設(shè)有p個(gè)指標(biāo),把這p個(gè)指標(biāo)看作p個(gè)隨機(jī)變量,記為x1,x2,…,xp,主成分分析就是要把這p個(gè)指標(biāo)的問題轉(zhuǎn)變?yōu)橛懻搈個(gè)新的指標(biāo)F1,F2,…,Fm(m
使其滿足每個(gè)主成分的系數(shù)平方和為1,主成分之間相互獨(dú)立且方差依次遞減,重要性依次遞減。在SPSS中,主成分分析經(jīng)常被嵌入到因子分析過程之中。
主成分系數(shù)計(jì)算方法為成分矩陣中的數(shù)據(jù)除以主成分相對(duì)應(yīng)的特征值開平方根,便得到主成分中每個(gè)指標(biāo)所對(duì)應(yīng)的系數(shù)。
2指標(biāo)選擇與數(shù)據(jù)來源
人口文化素質(zhì)各因素指標(biāo)的選擇從國際通用的人口素質(zhì)的評(píng)估模型來看,關(guān)于文化素質(zhì)方面一般都是以文化普及率或識(shí)字率來反映,而在HDI模型中,則增加了平均受教育年限指標(biāo)來反映知識(shí)變量。因此,選取文盲率來反映文盲人口比例,選取研究生及以上文化程度、大學(xué)生、高中、初中及小學(xué)文化程度的人口比例來反映人口的文化結(jié)構(gòu)狀況;此外,從人口文化素質(zhì)的涵義及構(gòu)成來看,構(gòu)建的指標(biāo)體系還必須包含技術(shù)方面的因素,因此,選取各級(jí)各類專業(yè)技術(shù)人口的比例來反映人口的技術(shù)狀況。這些指標(biāo)基本上能從三個(gè)不同的方面較全面地反映人口的文化素質(zhì)狀況[2-3]。
文中數(shù)據(jù)來自河北省統(tǒng)計(jì)局第六次人口普查辦公室,所選指標(biāo)見表1[11]。
表1 河北省11個(gè)設(shè)區(qū)市人口文化素質(zhì)各因素指標(biāo)數(shù)據(jù) %
注:小學(xué)、初中、高中、大學(xué)專科、大學(xué)本科、研究生文化程度比例分別是占全省6歲以上總?cè)丝诘谋壤晃拿ぢ适俏拿ず桶胛拿と丝谡?5歲及15歲以上人口的比例;各級(jí)各類專業(yè)技術(shù)人口比例指各級(jí)各類專業(yè)技術(shù)人口占16歲及16歲以上就業(yè)人口的比例。
3計(jì)算結(jié)果
利用SPSS19.0 軟件首先將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理
對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)作統(tǒng)計(jì)分析,提取了相關(guān)系數(shù)矩陣中兩個(gè)主成分,它們對(duì)方差的貢獻(xiàn)率分別是65.986% 和23.402%,見表2。
表2 特征值及主成分貢獻(xiàn)率和累計(jì)貢獻(xiàn)率 %
表2中,總貢獻(xiàn)率高達(dá)89.388%, 超過85%, 適合用主成分分析法。其中第一主成分對(duì)應(yīng)的特征值為5.279,第二主成分對(duì)應(yīng)的特征值為1.872,因子載荷矩陣見表3。
表3 因子載荷矩陣
由成分系數(shù)矩陣得主成分表達(dá)式為:
(1)
(2)
利用SPSS軟件分析可知,f1和f2的貢獻(xiàn)率分別是65.986%和23.402%,因此可以得加權(quán)得分公式為:
(3)
4綜合分析
從因子載荷矩陣(見表3)可知,利用SPSS19.0提取了2 個(gè)主要成分。高中文化程度比例(x3)、大學(xué)??莆幕潭缺壤?x4)、大學(xué)本科文化程度比例(x5)、研究生文化程度比例(x6)、專業(yè)技術(shù)人員比例(x8)標(biāo)準(zhǔn)化后的變量在f1上都有較大的載荷,而其他的文化素質(zhì)指標(biāo)在f1上的載荷較小,即f1主要反映高中及高中以上教育和專業(yè)技術(shù)人員比例對(duì)文化素質(zhì)的影響,分值越高反映的文化素質(zhì)越高;在f2上小學(xué)文化程度比例(x1),初中文化程度比例(x2),文盲率(x7)載荷較大,即在f2上主要反映初中及初中以下教育對(duì)文化素質(zhì)的影響,分值越低文化素質(zhì)越高。
根據(jù)式(1)~式(3)計(jì)算得到各地區(qū)主成分得分及因子排名情況見表5。
表5 各地區(qū)因子得分排名情況
注:第一主成分(f1)和加權(quán)綜合按得分從高到低排序,第二主成分(f2)按得分從低到高排序。
從表5我們發(fā)現(xiàn),石家莊、秦皇島、唐山、廊坊在f1得分較高,排名靠前,說明這些區(qū)市高中以上教育較好,專業(yè)技術(shù)人員的比例較高。而邯鄲、邢臺(tái)、滄州、衡水這四個(gè)城市在f1排名較為靠后,說明這些設(shè)區(qū)市的高學(xué)歷人才要相對(duì)較少。衡水、邢臺(tái)、保定、石家莊在f2上排名靠前,說明河北省這幾個(gè)設(shè)區(qū)市9年義務(wù)教育推行實(shí)現(xiàn)的相對(duì)更好,張家口、承德、邯鄲的基礎(chǔ)教育發(fā)展較為薄弱。
2005年6月6日,河北省委、省政府正式出臺(tái)的《關(guān)于實(shí)施“一線兩廂”區(qū)域經(jīng)濟(jì)發(fā)展戰(zhàn)略的指導(dǎo)意見》,意見的核心是抓“一線”,推“兩廂”。抓“一線”,就是充分利用石家莊、保定、廊坊、唐山、秦皇島五市經(jīng)濟(jì)基礎(chǔ)比較雄厚的優(yōu)勢(shì),發(fā)揮“領(lǐng)跑”作用;推“兩廂”,就是積極推進(jìn)南部邯鄲、邢臺(tái)、衡水、滄州四市這一廂,大力扶持北部張家口、承德這一廂,逐步形成“一線兩廂”區(qū)域經(jīng)濟(jì)共同發(fā)展的大格局。把表5與“一線兩廂”政策中的城市劃分相比較,發(fā)現(xiàn)其與f的排名不謀而合,f排名前四位城市屬于“一線兩廂”的一線城市,f排名后四位城市與南廂的四個(gè)城市相一致,張家口與承德在f排名中處于中間位置,屬于北廂的兩個(gè)城市。由此發(fā)現(xiàn)基于主成分分析方法進(jìn)行的河北省人口文化素質(zhì)的綜合評(píng)估與河北省的區(qū)域經(jīng)濟(jì)發(fā)展戰(zhàn)略是相一致的,吻合的較好,說明文中的評(píng)估方法具有實(shí)際應(yīng)用價(jià)值。
特別關(guān)注一下保定,保定屬于“一線兩廂”的一線城市,但是其人口文化素質(zhì)在f上排在承德之后,人口文化素質(zhì)與其經(jīng)濟(jì)發(fā)展不一致,也就是其人口文化發(fā)展與其經(jīng)濟(jì)、社會(huì)發(fā)展相比是相對(duì)滯后的[12]。
5聚類分析
平均聯(lián)接(組間)的樹狀圖如圖1所示。
利用平均距離聚類分析方法對(duì)河北省11個(gè)設(shè)區(qū)市作合理的聚類,根據(jù)聚類分析結(jié)果(見表1)將河北省11個(gè)設(shè)區(qū)市分為四類:
第1類,人口文化素質(zhì)綜合水平較高型:石家莊、秦皇島,在河北省屬于人口文化素質(zhì)最高的水平。
第2類,環(huán)京津經(jīng)濟(jì)型:唐山、廊坊,在河北省屬于人口文化素質(zhì)較高的水平,是河北省人口文化素質(zhì)中等偏上的城市。
第3類,地理區(qū)位限制型:張家口、承德,屬于河北省人口文化素質(zhì)中等水平。
第4類,高學(xué)歷人才發(fā)展滯后型:邢臺(tái)、滄州、邯鄲、保定、衡水是河北省人口文化素質(zhì)水平相對(duì)較低的城市。
圖1平均聯(lián)接(組間)的樹狀圖
6結(jié)語
1)所選指標(biāo)對(duì)人口文化素質(zhì)的影響主要體現(xiàn)在兩個(gè)方面,即高中及高中以上教育和專業(yè)技術(shù)人員比例對(duì)文化素質(zhì)的影響,分值越高反映的文化素質(zhì)越高;初中及初中以下教育對(duì)文化素質(zhì)的影響,分值越低文化素質(zhì)越高。
2)石家莊、秦皇島、唐山、廊坊高中以上教育較好,專業(yè)技術(shù)人員的比例較高。這些城市分別是省會(huì)、沿海和環(huán)京津城市,屬于人口文化素質(zhì)綜合水平較高型。衡水、邢臺(tái)、保定、石家莊在9年義務(wù)教育推行實(shí)現(xiàn)的相對(duì)更好[13]。
3)衡水、滄州、邢臺(tái)、邯鄲高學(xué)歷人才和專業(yè)技術(shù)人才要相對(duì)較少。屬于高學(xué)歷人才發(fā)展滯后型。張家口、承德的基礎(chǔ)教育發(fā)展較為薄弱,屬于地理區(qū)位限制型。保定人口文化素質(zhì)發(fā)展滯后與經(jīng)濟(jì)、社會(huì)發(fā)展,屬于人口文化素質(zhì)與經(jīng)濟(jì)發(fā)展不協(xié)調(diào)型[14-15]。
4)采用主成分分析方法對(duì)河北省人口文化素質(zhì)進(jìn)行綜合評(píng)估的結(jié)果與河北省區(qū)域經(jīng)濟(jì)發(fā)展戰(zhàn)略相一致,吻合度高,說明文中的評(píng)估方法具有實(shí)際應(yīng)用價(jià)值,在其他省市以及全國可以嘗試進(jìn)行數(shù)據(jù)分析,找到不同地區(qū)人口文化素質(zhì)發(fā)展的癥結(jié)。
7建議
人口文化素質(zhì)綜合排名基本由第一主成分決定,即河北省如果想進(jìn)一步提升人口文化素質(zhì)需要加大教育投入力度,全面提升教育水平,特別是提高高中及高中以上和專業(yè)技術(shù)人員的教育。
針對(duì)高學(xué)歷人才發(fā)展滯后型,河北省需優(yōu)化區(qū)域布局結(jié)構(gòu),支持這些地區(qū)發(fā)展高等教育,發(fā)揮省屬重點(diǎn)骨干大學(xué)的示范、輻射和帶動(dòng)作用,對(duì)口支援薄弱高校。同時(shí)通過產(chǎn)學(xué)結(jié)合的辦學(xué)模式大力發(fā)展職業(yè)技術(shù)教育[16]。
針對(duì)地理區(qū)位限制型地方政府應(yīng)加大基礎(chǔ)教育投入力度,克服地理區(qū)位的問題,制定符合當(dāng)?shù)匦枨蟮恼撸柟獭捌占熬拍曛屏x務(wù)教育”,不斷提高農(nóng)村地區(qū)適齡人口的小學(xué)和初中入學(xué)率、畢業(yè)率,減少青少年文盲半文盲比例,解決好當(dāng)?shù)厝丝诘南乱淮芙逃龁栴}[17]。
文中是主成分分析方法在人口文化素質(zhì)綜合評(píng)價(jià)中的首次應(yīng)用,研究結(jié)果清晰反映了河北省不同地區(qū)人口文化素質(zhì)的優(yōu)勢(shì)和劣勢(shì),特別是存在的問題,有助于河北省教育、人才管理部門從總體設(shè)計(jì)層面,到具體的教育階段制定合理的人口文化素質(zhì)提高計(jì)劃,綜合提高河北省的人口文化素質(zhì)。
參考文獻(xiàn):
[1]景躍軍,謝喆.中國人口文化程度的影響因素研究.人口學(xué)刊,1995(1):26-29.
[2]張霞,蘇為華.人口文化素質(zhì)綜合評(píng)估[J].統(tǒng)計(jì)應(yīng)用,2004(1):37-40.
[3]張鳴宇,李輝.吉林省人口文化素質(zhì)研究[D].長(zhǎng)春:吉林大學(xué),2011.
[4]段力剛.基于群決策:層次分析和PQLI法的人口素質(zhì)與經(jīng)濟(jì)發(fā)展問題研究[D].保定:河北大學(xué),2009.
[5]趙秋成.PQLI法的不足及其改進(jìn)[J].上海統(tǒng)計(jì),1998(1):32-34.
[6]朱計(jì)生,錢金平.人口素質(zhì)的綜合評(píng)判方法[J].系統(tǒng)工程理論與實(shí)踐,1992(5):45-50.
[7]葉曉楓,王志良.主成分分析法在水資源評(píng)價(jià)中的應(yīng)用[J].河南大學(xué)學(xué)報(bào):自然科學(xué)版,2007,37(3):276-279.
[8]漆勇方.主成分分析法在環(huán)境污染評(píng)估中的應(yīng)用[J].萍鄉(xiāng)高等??茖W(xué)校學(xué)報(bào),2012,29(3):40-44.
[9]劉濤.基于主成分分析的山東省產(chǎn)業(yè)結(jié)構(gòu)變動(dòng)影響因素研究[J].山東大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2011(3):107-112.
[10]楊賓峰,寧欣.主成分分析在數(shù)字圖像特征提取中的應(yīng)用[J].微計(jì)算機(jī)信息,2007,23(6):282-283.
[11]河北省統(tǒng)計(jì)局.河北省2010年第六次全國人口普查主要數(shù)據(jù)公報(bào)[EB/OL].(2011-05-08)[2015-01-13].http://www.hetj.gov.cn/hetj/tjgbtg/101374627640719.html.
[12]申亞民.陜西人口素質(zhì)與經(jīng)濟(jì)發(fā)展[J].西安文理學(xué)院學(xué)報(bào):自然科學(xué)版,2003,18(2):51-55.
[13]賈玲玲.河北省城市化水平綜合評(píng)價(jià)研究[D].太原:山西師范大學(xué),2010.
[14]李生志,張水龍,常春平,等.河北省人口素質(zhì)與環(huán)境關(guān)系的研究[J].河北師范大學(xué)學(xué)報(bào):自然科學(xué)版,1996(1):89-97.
[15]王霞,張連瑞.河北省人口文化素質(zhì)淺析[J].河北成人教育學(xué)院學(xué)報(bào),2005,7(4):70-71.
[16]張志強(qiáng).我國人口素質(zhì)水平的統(tǒng)計(jì)分析[J].山西財(cái)經(jīng)大學(xué)學(xué)報(bào),2001,23(2):102-104.
[17]李亞麗,于懷昌.GIS支持下的河南省人口素質(zhì)空間動(dòng)態(tài)特征研究[J].南陽師范學(xué)院學(xué)報(bào),2007(6):61-64.
Evaluationofpopulationculturequalitybasedonprincipalcomponentanalysismethod
WUYunxia,KANGNa,CHENHongjuan,LIUJing
(1.HebeiGEOUniversity,Shijiazhuang050031,China;2.BureauofGeologyandMineralExplorationofAnhuiProvince-322GeologicalTeam,Ma’anshan243000,China)
Abstract:Principalcomponentanalysisisusedtomakethecomprehensiveassessmentofpopulationculturalqualityinelevenmunicipal-levelcitiesinHebeiProvince.High-schooleducationlevelishigherinShijiazhuang,Qinhuangdao,TangshanandLangfangwithhigherproportionofprofessionalandtechnicalpersonnel.ThenumberofpeoplewithhigheracademicqualificationsisrelativelylowerinHandan,Xingtai,CangzhouandHengshui.Nine-yearcompulsoryeducationiswellcarriedoutinHengshui,Xingtai,BaodingandShijiazhuang,butrelativelyweakinZhangjiakou,ChengdeandHandan.Theassessmentresultsarematchedwiththeeconomicandsocialdevelopmentinthecorrespondingareas.
Keywords:principalcomponentanalysis;demographicandculturalquality;spsssoftware;comprehensiveassessment.
收稿日期:2016-01-13
基金項(xiàng)目:2015年度河北省社會(huì)科學(xué)發(fā)展研究重點(diǎn)課題(2015020211); 河北省第六次全國人口普查招標(biāo)課題(RKPC-HY05)
作者簡(jiǎn)介:吳云霞(1978-),女,漢族,河北石家莊人,河北地質(zhì)大學(xué)講師,碩士,主要從事人口與地理信息系統(tǒng)方面的研究,E-mail:wuyunxia2006@163.com.
DOI:10.15923/j.cnki.cn22-1382/t.2016.3.04
中圖分類號(hào):C922
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1674-1374(2016)03-0224-06