曹奇
(常州紡織服裝職業(yè)技術(shù)學(xué)院 江蘇常州 213164)
根據(jù)教育部的統(tǒng)計,2022屆我國普通高校畢業(yè)生規(guī)模首次突破千萬,達(dá)到了1076萬人,加之中小企業(yè)困難增多,吸納能力下降,同時近兩年來受多重因素影響,畢業(yè)生擇業(yè)時更加求穩(wěn)求優(yōu),不就業(yè)、緩就業(yè)、慢就業(yè)的現(xiàn)象尤為突出。國際外部環(huán)境更趨復(fù)雜多變,國內(nèi)新冠疫情多點爆發(fā),防控工作更是難度增加,經(jīng)濟(jì)社會的發(fā)展面臨著極為繁重的任務(wù),李克強(qiáng)總理多次強(qiáng)調(diào)就業(yè)不僅是民生問題,也是發(fā)展問題[1],教育部在2022年實施高校畢業(yè)生就業(yè)創(chuàng)業(yè)促進(jìn)行動[2],推動就業(yè)創(chuàng)業(yè)工作提質(zhì)增效。
百度指數(shù)是根據(jù)網(wǎng)絡(luò)用戶對關(guān)鍵詞的關(guān)注情況和不斷變化程度,以海量搜索開發(fā)出的網(wǎng)絡(luò)信息平臺,通過科學(xué)分析各個關(guān)鍵詞在百度網(wǎng)頁搜索中搜索頻次的加權(quán),具有多種數(shù)據(jù)種類、高效處理速度的特征,綜合搜索指數(shù),根據(jù)數(shù)據(jù)來源分為PC端指數(shù)和移動端指數(shù)。在經(jīng)濟(jì)學(xué)、社會學(xué)、心理學(xué)、教育學(xué)領(lǐng)域,學(xué)者主要對百度搜索的大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘、趨勢預(yù)測、輿情監(jiān)測研究[3]。
目前,在就業(yè)領(lǐng)域中互聯(lián)網(wǎng)指數(shù)運用研究相對較少:彭賡等(2013)利用谷歌指數(shù)建立了三個回歸模型預(yù)測失業(yè)率[4],張應(yīng)劍等(2017)基于網(wǎng)絡(luò)搜索數(shù)據(jù)構(gòu)造的指數(shù)模型對陜西互聯(lián)網(wǎng)企業(yè)進(jìn)行了統(tǒng)計監(jiān)測和趨勢預(yù)判[5],肖周燕(2021)通過百度指數(shù)對城市群未來城際人口遷移態(tài)勢進(jìn)行了研判[6]。
高校就業(yè)態(tài)勢百度指數(shù)除了含有長時間跨度的趨勢成分,由于受到年度政策調(diào)整、國家經(jīng)濟(jì)變化、搜索模糊錯誤等影響,還包括整年期、半年期等季節(jié)性波動成分。利用百度指數(shù)大數(shù)據(jù)平臺,搜索關(guān)鍵詞“高校大學(xué)生”和“找工作”采集2010年12月27日—2021年8月23日共10年8個月的綜合指數(shù)(移動端+PC端)數(shù)據(jù),基于小波分析算法對就業(yè)態(tài)勢指數(shù)的周期振蕩成分進(jìn)行識別分析,解析近10年來我國高校大學(xué)生群體時頻域上的求職特征,并根據(jù)識別結(jié)果對高校就業(yè)工作部門提供政策建議,從而促進(jìn)高校畢業(yè)生高質(zhì)量就業(yè)。
小波分析(Wave analysis)是由Morle在20世紀(jì)80年代初提出的一種具有時頻多分辨率功能的方法[7],主要適用于信號降噪濾波、多維時間尺度特征識別,在地學(xué)領(lǐng)域、氣象領(lǐng)域廣泛應(yīng)用[8]。對于就業(yè)態(tài)勢數(shù)據(jù)這種非平穩(wěn)時間序列分析建模,需要時段信息與頻段信息相對應(yīng),僅從時域或頻域單個分析很難解決問題,小波分析能夠有效對就業(yè)態(tài)勢數(shù)據(jù)進(jìn)行降噪濾波、分形維數(shù)與信號系數(shù)的計算和多維時間尺度振蕩成分識別分析。
小波分析通過小波簇函數(shù)系來無限接近時間序列,所以小波函數(shù)能起到關(guān)鍵作用,其特征是波動振蕩性能快速接近到零的一種函數(shù),用符號ψ(t)∈L2(R)表示基小波函數(shù),公式為:
ψ(t)經(jīng)壓縮尺度與移動時間軸處理組成相應(yīng)簇函數(shù)系為:
式(2)中:ψa,b(t)表示子小波或基小波;a為反映周期長度的尺度因子;b為平移因子。
在對就業(yè)態(tài)勢數(shù)據(jù)進(jìn)行分析時,由于不同的基小波函數(shù)處理結(jié)果往往不太一致,需要根據(jù)處理對象不同合理選用基小波函數(shù),可以用比較不同基小波函數(shù)處理的結(jié)果與給定數(shù)據(jù)的精準(zhǔn)度來評判其適用性。
若ψa,b(t)是由式(2)給出的基小波函數(shù),根據(jù)能量有限信號f(t)∈L2(R),其連續(xù)小波變換(Continue WaveletTransform CWT,)為:
式(3)和式(4)即為小波分析方法基本原理。可以調(diào)節(jié)伸縮尺度a和平移參數(shù)b得到坐標(biāo)時間序列的低頻或者高頻信息,通過觀察頻域信息可對時間序列的不同時間尺度和空間局部特征進(jìn)行分析研究。在通過小波分析方法處理時間序列時,最常使用小波變換方程中的小波系數(shù)來分析其序列的時域與頻域變化特征。
小波方差為小波系數(shù)的平方值在平移參數(shù)b上積分,公式為:
式(5)中:小波方差在時間尺度a域中的分布狀況叫做小波方差圖。由式(5)可知,小波方差圖表示信號波動的能量隨時間尺度a的變化情況,故可通過不同時間尺度擾動的強(qiáng)弱情況來識別提取信號中的主周期。
選取適用的基小波函數(shù)是運用小波分析理論來識別就業(yè)態(tài)勢時間序列周期振蕩成分的前提,常用的基小波函數(shù)有墨西哥帽(Mexican Hat)、Haar、Morlet及Meyer基小波等。通過Morlet基小波函數(shù)來識別就業(yè)態(tài)勢數(shù)據(jù)的多時間尺度周期振蕩成分,公式為:
式(6)中:kψ是常數(shù),用于確定基小波的高斯波包寬度,為使Morlet小波被適用,kψ應(yīng)大于等于6。當(dāng)kψ增加時,高斯波包寬度增加,小波系數(shù)時間分辨率下降,為得到最優(yōu)時間分辨率,應(yīng)取允許最小值6。
圖1為小波分析方法應(yīng)用于識別就業(yè)態(tài)勢數(shù)據(jù)時間序列周期振蕩成分流程。首先利用多項式函數(shù)擬合對就業(yè)態(tài)勢數(shù)據(jù)分量進(jìn)行周期振蕩成分提?。挥捎诰蜆I(yè)態(tài)勢數(shù)據(jù)時間序列長度有限,在其序列兩端也許存在“邊際效應(yīng)”,可通過算法延展兩端時間序列來去除或減弱開始與結(jié)束端處的“邊際效應(yīng)”;開始小波變換處理,消去兩端延展多余的小波變換系數(shù),僅留存原就業(yè)態(tài)勢數(shù)據(jù)時間域中的小波系數(shù)進(jìn)行后續(xù)步驟分析;選擇Morle基小波函數(shù)計算其復(fù)小波系數(shù)實部值;進(jìn)行小波時間尺度的判斷,如果顯示的等值線圖不能正常識別主周期振蕩成分則需要重新計算小波系數(shù);在選擇合適的小波時間尺度后,繪制就業(yè)態(tài)勢時間分量周期項成分小波系數(shù)實部等值曲線圖與小波方差圖,用來識別和分析就業(yè)態(tài)勢數(shù)據(jù)時間序列在長時間跨度內(nèi)的周期振蕩成分。
圖1 小波分析方法識別周期振蕩成分流程
高校就業(yè)態(tài)勢指數(shù)屬于非平穩(wěn)時間序列[9],這些指數(shù)序列中可能含有因季節(jié)變化導(dǎo)致的周期性趨勢。其處理流程一般是根據(jù)原始序列的大致趨勢用多項式函數(shù)(階數(shù)N<5)擬合,保證曲線光滑。因高校就業(yè)態(tài)勢指數(shù)有明顯的趨向性,離散程度不是很高,采用4階函數(shù)進(jìn)行大致擬合y=6 ×10-9x4-0.0011x3+67.419x2-2 ×106x+2 ×106決定系數(shù)R2=0.5274,說明擬合效果良好。圖2為2010—2021年就業(yè)態(tài)勢時間序列全景分布。從趨勢成分可以看出:求職高峰在每年的3、4月和7月,分別為春季和大學(xué)生畢業(yè)季;2010—2018年就業(yè)態(tài)勢總體保持平穩(wěn),受2018年貿(mào)易摩擦影響,2018—2020年就業(yè)態(tài)勢序列振蕩較為異常,存在綜合搜索指數(shù)春節(jié)前開始增高的現(xiàn)象,這也說明高校應(yīng)加強(qiáng)學(xué)生先就業(yè)后擇業(yè)的就業(yè)觀,開拓就業(yè)門路,在2020年之后的時間段內(nèi)謹(jǐn)防學(xué)生出現(xiàn)不就業(yè)、慢就業(yè)、頻繁跳槽現(xiàn)象,保證就業(yè)穩(wěn)定。
圖2 2010—2021年就業(yè)態(tài)勢時間序列全景分布(點線為趨勢項成分)
從圖2就業(yè)態(tài)勢原始坐標(biāo)時間序列可見,除了趨勢成分外,還具有明顯的振蕩行為。通過Morlet基小波對就業(yè)態(tài)勢序列周期項成分進(jìn)行小波變換來更加細(xì)致地分析就業(yè)態(tài)勢特征的時間尺度和周期性特征。圖3為就業(yè)態(tài)勢時間分量周期項成分Morlet小波系數(shù)實部等值線,小波系數(shù)實部值代表了不同時間尺度的變化周期在時間域上的能量密度分布情況,時間尺度上周期振蕩強(qiáng)度與相應(yīng)的系數(shù)實部值呈正相關(guān);等值線中黑實線表示小波系數(shù)實部值為正,表示上升偏移,紅實線表示小波系數(shù)實部值為負(fù),代表下沉偏移。
圖3 就業(yè)態(tài)勢時間分量周期項成分小波系數(shù)實部等值曲線
小波方差圖能夠顯示就業(yè)態(tài)勢分量的波動能量強(qiáng)度隨尺度days的變化狀況,可用來確定就業(yè)態(tài)勢在長時間受到季節(jié)性、政策、國民經(jīng)濟(jì)、模糊搜索、搜索失誤、惡意搜索影響變化中存在的主周期,圖4為2010—2021年就業(yè)態(tài)勢周期項成分小波方差曲線。
圖4 周期項成分小波方差曲線
從圖3可知,2010—2021年就業(yè)態(tài)勢在整個時間演變過程中存在多時間尺度周期振蕩特征,并且具有明顯的年際變化,其存在明顯的主周期,存在全域性的90~140d的小尺度的周期變化規(guī)律,其主周期振蕩頻率主要受到3~4個月周期尺度的影響。
圖4小波方差圖中存在至少3個較為顯著的峰值,按峰值的大小可以對應(yīng)為第一、第二、第三等主周期,最大峰值的時間尺度對應(yīng)最強(qiáng)周期振蕩,并且這些主周期的波動控制著整個就業(yè)態(tài)勢在2010年12月27日—2021年8月23日時間域內(nèi)的周期變化特征。從圖中峰值情況分析就業(yè)態(tài)勢分量的主要振蕩周期為14d、143d、249d、74d,可利用這些數(shù)據(jù)建立三角函數(shù)擬合模型,結(jié)合趨勢項模型可對2021年之后的就業(yè)態(tài)勢變形規(guī)律進(jìn)行預(yù)測預(yù)報。
以“高校大學(xué)生”和“找工作”為關(guān)鍵詞,利用百度搜索平臺構(gòu)造高校就業(yè)態(tài)勢需求指數(shù),及時有效地反映了2010—2021年大學(xué)生就業(yè)的周期性特點及市場供需變化趨勢;通過多項式擬合模型實現(xiàn)了對高校就業(yè)態(tài)勢的趨勢成分提取,分析發(fā)現(xiàn):2010—2021年就業(yè)態(tài)勢平穩(wěn),2018年以來存在就業(yè)態(tài)勢劇烈振蕩現(xiàn)象。
基于小波分析方法對就業(yè)態(tài)勢數(shù)據(jù)進(jìn)行周期振蕩成分提取分析,探析近10年來我國高校大學(xué)生群體時頻域上的求職特征,探析藏匿于時間序列中的14d、143d、249d、74d的多周期變化,并且明顯存在季節(jié)性變化,定性評估出就業(yè)態(tài)勢指數(shù)的發(fā)展趨勢。