曹奇
(常州紡織服裝職業(yè)技術(shù)學(xué)院 江蘇常州 213164)
根據(jù)教育部的統(tǒng)計(jì),2022屆我國(guó)普通高校畢業(yè)生規(guī)模首次突破千萬(wàn),達(dá)到了1076萬(wàn)人,加之中小企業(yè)困難增多,吸納能力下降,同時(shí)近兩年來(lái)受多重因素影響,畢業(yè)生擇業(yè)時(shí)更加求穩(wěn)求優(yōu),不就業(yè)、緩就業(yè)、慢就業(yè)的現(xiàn)象尤為突出。國(guó)際外部環(huán)境更趨復(fù)雜多變,國(guó)內(nèi)新冠疫情多點(diǎn)爆發(fā),防控工作更是難度增加,經(jīng)濟(jì)社會(huì)的發(fā)展面臨著極為繁重的任務(wù),李克強(qiáng)總理多次強(qiáng)調(diào)就業(yè)不僅是民生問(wèn)題,也是發(fā)展問(wèn)題[1],教育部在2022年實(shí)施高校畢業(yè)生就業(yè)創(chuàng)業(yè)促進(jìn)行動(dòng)[2],推動(dòng)就業(yè)創(chuàng)業(yè)工作提質(zhì)增效。
百度指數(shù)是根據(jù)網(wǎng)絡(luò)用戶對(duì)關(guān)鍵詞的關(guān)注情況和不斷變化程度,以海量搜索開發(fā)出的網(wǎng)絡(luò)信息平臺(tái),通過(guò)科學(xué)分析各個(gè)關(guān)鍵詞在百度網(wǎng)頁(yè)搜索中搜索頻次的加權(quán),具有多種數(shù)據(jù)種類、高效處理速度的特征,綜合搜索指數(shù),根據(jù)數(shù)據(jù)來(lái)源分為PC端指數(shù)和移動(dòng)端指數(shù)。在經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、心理學(xué)、教育學(xué)領(lǐng)域,學(xué)者主要對(duì)百度搜索的大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘、趨勢(shì)預(yù)測(cè)、輿情監(jiān)測(cè)研究[3]。
目前,在就業(yè)領(lǐng)域中互聯(lián)網(wǎng)指數(shù)運(yùn)用研究相對(duì)較少:彭賡等(2013)利用谷歌指數(shù)建立了三個(gè)回歸模型預(yù)測(cè)失業(yè)率[4],張應(yīng)劍等(2017)基于網(wǎng)絡(luò)搜索數(shù)據(jù)構(gòu)造的指數(shù)模型對(duì)陜西互聯(lián)網(wǎng)企業(yè)進(jìn)行了統(tǒng)計(jì)監(jiān)測(cè)和趨勢(shì)預(yù)判[5],肖周燕(2021)通過(guò)百度指數(shù)對(duì)城市群未來(lái)城際人口遷移態(tài)勢(shì)進(jìn)行了研判[6]。
高校就業(yè)態(tài)勢(shì)百度指數(shù)除了含有長(zhǎng)時(shí)間跨度的趨勢(shì)成分,由于受到年度政策調(diào)整、國(guó)家經(jīng)濟(jì)變化、搜索模糊錯(cuò)誤等影響,還包括整年期、半年期等季節(jié)性波動(dòng)成分。利用百度指數(shù)大數(shù)據(jù)平臺(tái),搜索關(guān)鍵詞“高校大學(xué)生”和“找工作”采集2010年12月27日—2021年8月23日共10年8個(gè)月的綜合指數(shù)(移動(dòng)端+PC端)數(shù)據(jù),基于小波分析算法對(duì)就業(yè)態(tài)勢(shì)指數(shù)的周期振蕩成分進(jìn)行識(shí)別分析,解析近10年來(lái)我國(guó)高校大學(xué)生群體時(shí)頻域上的求職特征,并根據(jù)識(shí)別結(jié)果對(duì)高校就業(yè)工作部門提供政策建議,從而促進(jìn)高校畢業(yè)生高質(zhì)量就業(yè)。
小波分析(Wave analysis)是由Morle在20世紀(jì)80年代初提出的一種具有時(shí)頻多分辨率功能的方法[7],主要適用于信號(hào)降噪濾波、多維時(shí)間尺度特征識(shí)別,在地學(xué)領(lǐng)域、氣象領(lǐng)域廣泛應(yīng)用[8]。對(duì)于就業(yè)態(tài)勢(shì)數(shù)據(jù)這種非平穩(wěn)時(shí)間序列分析建模,需要時(shí)段信息與頻段信息相對(duì)應(yīng),僅從時(shí)域或頻域單個(gè)分析很難解決問(wèn)題,小波分析能夠有效對(duì)就業(yè)態(tài)勢(shì)數(shù)據(jù)進(jìn)行降噪濾波、分形維數(shù)與信號(hào)系數(shù)的計(jì)算和多維時(shí)間尺度振蕩成分識(shí)別分析。
小波分析通過(guò)小波簇函數(shù)系來(lái)無(wú)限接近時(shí)間序列,所以小波函數(shù)能起到關(guān)鍵作用,其特征是波動(dòng)振蕩性能快速接近到零的一種函數(shù),用符號(hào)ψ(t)∈L2(R)表示基小波函數(shù),公式為:
ψ(t)經(jīng)壓縮尺度與移動(dòng)時(shí)間軸處理組成相應(yīng)簇函數(shù)系為:
式(2)中:ψa,b(t)表示子小波或基小波;a為反映周期長(zhǎng)度的尺度因子;b為平移因子。
在對(duì)就業(yè)態(tài)勢(shì)數(shù)據(jù)進(jìn)行分析時(shí),由于不同的基小波函數(shù)處理結(jié)果往往不太一致,需要根據(jù)處理對(duì)象不同合理選用基小波函數(shù),可以用比較不同基小波函數(shù)處理的結(jié)果與給定數(shù)據(jù)的精準(zhǔn)度來(lái)評(píng)判其適用性。
若ψa,b(t)是由式(2)給出的基小波函數(shù),根據(jù)能量有限信號(hào)f(t)∈L2(R),其連續(xù)小波變換(Continue WaveletTransform CWT,)為:
式(3)和式(4)即為小波分析方法基本原理。可以調(diào)節(jié)伸縮尺度a和平移參數(shù)b得到坐標(biāo)時(shí)間序列的低頻或者高頻信息,通過(guò)觀察頻域信息可對(duì)時(shí)間序列的不同時(shí)間尺度和空間局部特征進(jìn)行分析研究。在通過(guò)小波分析方法處理時(shí)間序列時(shí),最常使用小波變換方程中的小波系數(shù)來(lái)分析其序列的時(shí)域與頻域變化特征。
小波方差為小波系數(shù)的平方值在平移參數(shù)b上積分,公式為:
式(5)中:小波方差在時(shí)間尺度a域中的分布狀況叫做小波方差圖。由式(5)可知,小波方差圖表示信號(hào)波動(dòng)的能量隨時(shí)間尺度a的變化情況,故可通過(guò)不同時(shí)間尺度擾動(dòng)的強(qiáng)弱情況來(lái)識(shí)別提取信號(hào)中的主周期。
選取適用的基小波函數(shù)是運(yùn)用小波分析理論來(lái)識(shí)別就業(yè)態(tài)勢(shì)時(shí)間序列周期振蕩成分的前提,常用的基小波函數(shù)有墨西哥帽(Mexican Hat)、Haar、Morlet及Meyer基小波等。通過(guò)Morlet基小波函數(shù)來(lái)識(shí)別就業(yè)態(tài)勢(shì)數(shù)據(jù)的多時(shí)間尺度周期振蕩成分,公式為:
式(6)中:kψ是常數(shù),用于確定基小波的高斯波包寬度,為使Morlet小波被適用,kψ應(yīng)大于等于6。當(dāng)kψ增加時(shí),高斯波包寬度增加,小波系數(shù)時(shí)間分辨率下降,為得到最優(yōu)時(shí)間分辨率,應(yīng)取允許最小值6。
圖1為小波分析方法應(yīng)用于識(shí)別就業(yè)態(tài)勢(shì)數(shù)據(jù)時(shí)間序列周期振蕩成分流程。首先利用多項(xiàng)式函數(shù)擬合對(duì)就業(yè)態(tài)勢(shì)數(shù)據(jù)分量進(jìn)行周期振蕩成分提??;由于就業(yè)態(tài)勢(shì)數(shù)據(jù)時(shí)間序列長(zhǎng)度有限,在其序列兩端也許存在“邊際效應(yīng)”,可通過(guò)算法延展兩端時(shí)間序列來(lái)去除或減弱開始與結(jié)束端處的“邊際效應(yīng)”;開始小波變換處理,消去兩端延展多余的小波變換系數(shù),僅留存原就業(yè)態(tài)勢(shì)數(shù)據(jù)時(shí)間域中的小波系數(shù)進(jìn)行后續(xù)步驟分析;選擇Morle基小波函數(shù)計(jì)算其復(fù)小波系數(shù)實(shí)部值;進(jìn)行小波時(shí)間尺度的判斷,如果顯示的等值線圖不能正常識(shí)別主周期振蕩成分則需要重新計(jì)算小波系數(shù);在選擇合適的小波時(shí)間尺度后,繪制就業(yè)態(tài)勢(shì)時(shí)間分量周期項(xiàng)成分小波系數(shù)實(shí)部等值曲線圖與小波方差圖,用來(lái)識(shí)別和分析就業(yè)態(tài)勢(shì)數(shù)據(jù)時(shí)間序列在長(zhǎng)時(shí)間跨度內(nèi)的周期振蕩成分。
圖1 小波分析方法識(shí)別周期振蕩成分流程
高校就業(yè)態(tài)勢(shì)指數(shù)屬于非平穩(wěn)時(shí)間序列[9],這些指數(shù)序列中可能含有因季節(jié)變化導(dǎo)致的周期性趨勢(shì)。其處理流程一般是根據(jù)原始序列的大致趨勢(shì)用多項(xiàng)式函數(shù)(階數(shù)N<5)擬合,保證曲線光滑。因高校就業(yè)態(tài)勢(shì)指數(shù)有明顯的趨向性,離散程度不是很高,采用4階函數(shù)進(jìn)行大致擬合y=6 ×10-9x4-0.0011x3+67.419x2-2 ×106x+2 ×106決定系數(shù)R2=0.5274,說(shuō)明擬合效果良好。圖2為2010—2021年就業(yè)態(tài)勢(shì)時(shí)間序列全景分布。從趨勢(shì)成分可以看出:求職高峰在每年的3、4月和7月,分別為春季和大學(xué)生畢業(yè)季;2010—2018年就業(yè)態(tài)勢(shì)總體保持平穩(wěn),受2018年貿(mào)易摩擦影響,2018—2020年就業(yè)態(tài)勢(shì)序列振蕩較為異常,存在綜合搜索指數(shù)春節(jié)前開始增高的現(xiàn)象,這也說(shuō)明高校應(yīng)加強(qiáng)學(xué)生先就業(yè)后擇業(yè)的就業(yè)觀,開拓就業(yè)門路,在2020年之后的時(shí)間段內(nèi)謹(jǐn)防學(xué)生出現(xiàn)不就業(yè)、慢就業(yè)、頻繁跳槽現(xiàn)象,保證就業(yè)穩(wěn)定。
圖2 2010—2021年就業(yè)態(tài)勢(shì)時(shí)間序列全景分布(點(diǎn)線為趨勢(shì)項(xiàng)成分)
從圖2就業(yè)態(tài)勢(shì)原始坐標(biāo)時(shí)間序列可見,除了趨勢(shì)成分外,還具有明顯的振蕩行為。通過(guò)Morlet基小波對(duì)就業(yè)態(tài)勢(shì)序列周期項(xiàng)成分進(jìn)行小波變換來(lái)更加細(xì)致地分析就業(yè)態(tài)勢(shì)特征的時(shí)間尺度和周期性特征。圖3為就業(yè)態(tài)勢(shì)時(shí)間分量周期項(xiàng)成分Morlet小波系數(shù)實(shí)部等值線,小波系數(shù)實(shí)部值代表了不同時(shí)間尺度的變化周期在時(shí)間域上的能量密度分布情況,時(shí)間尺度上周期振蕩強(qiáng)度與相應(yīng)的系數(shù)實(shí)部值呈正相關(guān);等值線中黑實(shí)線表示小波系數(shù)實(shí)部值為正,表示上升偏移,紅實(shí)線表示小波系數(shù)實(shí)部值為負(fù),代表下沉偏移。
圖3 就業(yè)態(tài)勢(shì)時(shí)間分量周期項(xiàng)成分小波系數(shù)實(shí)部等值曲線
小波方差圖能夠顯示就業(yè)態(tài)勢(shì)分量的波動(dòng)能量強(qiáng)度隨尺度days的變化狀況,可用來(lái)確定就業(yè)態(tài)勢(shì)在長(zhǎng)時(shí)間受到季節(jié)性、政策、國(guó)民經(jīng)濟(jì)、模糊搜索、搜索失誤、惡意搜索影響變化中存在的主周期,圖4為2010—2021年就業(yè)態(tài)勢(shì)周期項(xiàng)成分小波方差曲線。
圖4 周期項(xiàng)成分小波方差曲線
從圖3可知,2010—2021年就業(yè)態(tài)勢(shì)在整個(gè)時(shí)間演變過(guò)程中存在多時(shí)間尺度周期振蕩特征,并且具有明顯的年際變化,其存在明顯的主周期,存在全域性的90~140d的小尺度的周期變化規(guī)律,其主周期振蕩頻率主要受到3~4個(gè)月周期尺度的影響。
圖4小波方差圖中存在至少3個(gè)較為顯著的峰值,按峰值的大小可以對(duì)應(yīng)為第一、第二、第三等主周期,最大峰值的時(shí)間尺度對(duì)應(yīng)最強(qiáng)周期振蕩,并且這些主周期的波動(dòng)控制著整個(gè)就業(yè)態(tài)勢(shì)在2010年12月27日—2021年8月23日時(shí)間域內(nèi)的周期變化特征。從圖中峰值情況分析就業(yè)態(tài)勢(shì)分量的主要振蕩周期為14d、143d、249d、74d,可利用這些數(shù)據(jù)建立三角函數(shù)擬合模型,結(jié)合趨勢(shì)項(xiàng)模型可對(duì)2021年之后的就業(yè)態(tài)勢(shì)變形規(guī)律進(jìn)行預(yù)測(cè)預(yù)報(bào)。
以“高校大學(xué)生”和“找工作”為關(guān)鍵詞,利用百度搜索平臺(tái)構(gòu)造高校就業(yè)態(tài)勢(shì)需求指數(shù),及時(shí)有效地反映了2010—2021年大學(xué)生就業(yè)的周期性特點(diǎn)及市場(chǎng)供需變化趨勢(shì);通過(guò)多項(xiàng)式擬合模型實(shí)現(xiàn)了對(duì)高校就業(yè)態(tài)勢(shì)的趨勢(shì)成分提取,分析發(fā)現(xiàn):2010—2021年就業(yè)態(tài)勢(shì)平穩(wěn),2018年以來(lái)存在就業(yè)態(tài)勢(shì)劇烈振蕩現(xiàn)象。
基于小波分析方法對(duì)就業(yè)態(tài)勢(shì)數(shù)據(jù)進(jìn)行周期振蕩成分提取分析,探析近10年來(lái)我國(guó)高校大學(xué)生群體時(shí)頻域上的求職特征,探析藏匿于時(shí)間序列中的14d、143d、249d、74d的多周期變化,并且明顯存在季節(jié)性變化,定性評(píng)估出就業(yè)態(tài)勢(shì)指數(shù)的發(fā)展趨勢(shì)。