摘"要:隨著信息技術(shù)的迅猛發(fā)展,計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的人才培養(yǎng)面臨著新的挑戰(zhàn)和機(jī)遇。本文旨在提出一種通過(guò)大數(shù)據(jù)分析的方法緊跟計(jì)算機(jī)行業(yè)發(fā)展需求制訂人才培養(yǎng)方案的思路。首先,通過(guò)抓取國(guó)內(nèi)大型招聘網(wǎng)站上的招聘信息,再對(duì)抓取的信息進(jìn)行清洗,保留有效信息。其次,通過(guò)統(tǒng)計(jì)和分析招聘信息中的崗位名稱、技能要求、素質(zhì)要求等關(guān)鍵信息,將分析統(tǒng)計(jì)結(jié)果運(yùn)用可視化等手段進(jìn)行展示,獲得計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)領(lǐng)域所涵蓋的崗位及專業(yè)技能要求和素質(zhì)能力要求。最后,結(jié)合學(xué)校人才培養(yǎng)定位、專業(yè)自身特點(diǎn)、畢業(yè)生崗位信息反饋及行業(yè)專家建議,科學(xué)精準(zhǔn)地定位人才培養(yǎng)目標(biāo)。
關(guān)鍵詞:大數(shù)據(jù)分析;人才培養(yǎng);招聘信息;數(shù)據(jù)爬取
中圖分類號(hào):G424""文獻(xiàn)標(biāo)識(shí)碼:A
隨著信息技術(shù)的迅猛發(fā)展,特別是近年來(lái)人工智能大模型呈現(xiàn)出快速增長(zhǎng)的態(tài)勢(shì),導(dǎo)致計(jì)算機(jī)技術(shù)領(lǐng)域技術(shù)不斷推陳出新。計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)已成為當(dāng)今社會(huì)的熱門專業(yè)之一,這對(duì)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的人才提出了更高的要求。如何科學(xué)精準(zhǔn)地定位人才培養(yǎng)目標(biāo),以滿足市場(chǎng)的不斷變化和需求,是當(dāng)前高校面臨的重要問(wèn)題。傳統(tǒng)的人才培養(yǎng)模式往往側(cè)重于理論知識(shí)的傳授,而忽視了市場(chǎng)需求導(dǎo)向的專業(yè)技能、實(shí)踐能力的培養(yǎng)。高校參考社會(huì)招聘信息對(duì)人才的要求進(jìn)行人才培養(yǎng)是培養(yǎng)應(yīng)用型人才的重要途徑,很多學(xué)校和專業(yè)都對(duì)此做了研究和嘗試,取得了很好的效果[13]。本文通過(guò)基于大數(shù)據(jù)分析技術(shù)對(duì)招聘網(wǎng)站上的數(shù)據(jù)進(jìn)行抓取和分析,旨在探討計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的人才市場(chǎng)需求和定位,為學(xué)校的人才培養(yǎng)提供有益的參考。
一、總體研究思路
本文綜合參考了對(duì)大型招聘網(wǎng)站信息提取、處理、利用的相關(guān)文獻(xiàn)后[46],結(jié)合本校本專業(yè)的特點(diǎn),制定了主要研究思路,具體包括以下五個(gè)方面的內(nèi)容。
(一)數(shù)據(jù)抓取與處理
在國(guó)內(nèi)大型招聘網(wǎng)站上抓取關(guān)于計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的招聘信息。通過(guò)使用Python語(yǔ)言編寫(xiě)爬蟲(chóng)程序進(jìn)行數(shù)據(jù)采集,獲取大量的招聘信息數(shù)據(jù)。然后對(duì)抓取的數(shù)據(jù)進(jìn)行清洗和預(yù)處理,去除重復(fù)、無(wú)效和錯(cuò)誤的數(shù)據(jù),確保數(shù)據(jù)的準(zhǔn)確性和可靠性。
(二)數(shù)據(jù)分析與挖掘
采用大數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等手段,對(duì)清洗后的數(shù)據(jù)進(jìn)行深入分析。通過(guò)統(tǒng)計(jì)和分析招聘信息中的崗位名稱、技能要求、素質(zhì)要求等關(guān)鍵信息,揭示計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)領(lǐng)域所涵蓋的崗位類型、技能要求以及素質(zhì)要求的特征和規(guī)律。
(三)可視化展示與深入分析
將各項(xiàng)分析結(jié)果通過(guò)柱形圖、折線圖、詞云圖等可視化的方法展示出來(lái)。通過(guò)對(duì)可視化結(jié)果進(jìn)行深入分析,我們可以更加直觀地了解計(jì)算機(jī)科學(xué)與技術(shù)人才的市場(chǎng)需求和定位,并對(duì)崗位進(jìn)行分類和歸納。
(四)人才培養(yǎng)目標(biāo)定位
結(jié)合學(xué)?!皯?yīng)用型人才”培養(yǎng)定位、計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)自身特點(diǎn)、畢業(yè)生崗位信息反饋和行業(yè)專家建議,對(duì)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的人才培養(yǎng)目標(biāo)進(jìn)行科學(xué)精準(zhǔn)的定位。通過(guò)對(duì)比市場(chǎng)需求和當(dāng)前人才培養(yǎng)模式的差異,提出改進(jìn)和優(yōu)化人才培養(yǎng)方案的建議。
二、數(shù)據(jù)抓取與處理研究思路
選擇國(guó)內(nèi)大型招聘網(wǎng)站作為主要數(shù)據(jù)來(lái)源,通過(guò)編寫(xiě)爬蟲(chóng)程序作為數(shù)據(jù)采集工具,獲取招聘網(wǎng)站上的計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)相關(guān)招聘信息。在數(shù)據(jù)抓取過(guò)程中,遵守網(wǎng)站的爬蟲(chóng)協(xié)議和法律法規(guī),確保數(shù)據(jù)的合法性和合規(guī)性,注重?cái)?shù)據(jù)的完整性和準(zhǔn)確性,確保所抓取的信息能夠真實(shí)反映市場(chǎng)對(duì)該專業(yè)人才的需求。抓取到的數(shù)據(jù)通常包括崗位名稱、工作地點(diǎn)、薪資待遇、學(xué)歷要求、技能要求、素質(zhì)要求等多個(gè)字段。然而,原始數(shù)據(jù)中往往存在重復(fù)、無(wú)效和錯(cuò)誤的數(shù)據(jù),如過(guò)期職位、非計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)職位等。因此,需要對(duì)抓取的數(shù)據(jù)進(jìn)行清洗和預(yù)處理,通過(guò)去除重復(fù)數(shù)據(jù)、填補(bǔ)缺失值、糾正錯(cuò)誤數(shù)據(jù)等方法,確保數(shù)據(jù)的準(zhǔn)確性和可靠性。在數(shù)據(jù)處理過(guò)程中,使用Python中的Pandas庫(kù)進(jìn)行數(shù)據(jù)的清洗和整理。Pandas提供了高效的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具,使得我們能夠方便地對(duì)數(shù)據(jù)進(jìn)行處理和分析。本研究需要重點(diǎn)關(guān)注企業(yè)對(duì)有5年工作經(jīng)驗(yàn)的計(jì)算機(jī)專業(yè)人才的技能要求、素質(zhì)要求,以此對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的處理和轉(zhuǎn)換,以便后續(xù)的分析和挖掘能更好地支撐人才培養(yǎng)目標(biāo)的確立。
三、數(shù)據(jù)分析與挖掘研究思路
在數(shù)據(jù)清洗的基礎(chǔ)上,采用大數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等手段,對(duì)有5年工作經(jīng)驗(yàn)的計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的招聘信息進(jìn)行深入分析。首先,對(duì)職位名稱進(jìn)行了聚類分析,以識(shí)別出該專業(yè)領(lǐng)域所涵蓋的主要崗位。通過(guò)聚類分析,我們發(fā)現(xiàn)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的崗位主要包括軟件開(kāi)發(fā)工程師、Web前端工程師、數(shù)據(jù)分析師、網(wǎng)絡(luò)安全工程師等。接著,對(duì)職位描述和技能要求進(jìn)行了文本挖掘,提取出各崗位所需的專業(yè)技能和素質(zhì)能力要求。在文本挖掘過(guò)程中,使用Python中的NLTK庫(kù)進(jìn)行自然語(yǔ)言處理,通過(guò)分詞、詞性標(biāo)注等手段,提取出職位描述和技能要求中的關(guān)鍵詞和短語(yǔ),進(jìn)而分析出各崗位所需的專業(yè)技能和素質(zhì)能力要求。通過(guò)文本挖掘,發(fā)現(xiàn)不同崗位對(duì)專業(yè)技能和素質(zhì)能力的要求各不相同。例如,軟件開(kāi)發(fā)工程師需要熟練掌握編程語(yǔ)言、具備算法與數(shù)據(jù)結(jié)構(gòu)理解能力、熟悉軟件開(kāi)發(fā)工具等;而數(shù)據(jù)分析師則需要具備數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)可視化等能力。同時(shí),還發(fā)現(xiàn)所有崗位對(duì)求職者的綜合素質(zhì)也有較高的要求,如溝通能力、團(tuán)隊(duì)合作能力、創(chuàng)新能力等。
四、可視化展示與深入分析部分研究思路
為了更直觀地展示分析結(jié)果,采用了柱形圖、折線圖、詞云圖等可視化的方法。通過(guò)柱形圖,展示了各崗位的招聘數(shù)量和占比,以了解市場(chǎng)的熱門崗位和冷門崗位。通過(guò)折線圖,可以展示各崗位的技能要求和素質(zhì)能力要求的變化趨勢(shì),以把握市場(chǎng)的變化和發(fā)展趨勢(shì)。通過(guò)詞云圖,可以展示各崗位的關(guān)鍵詞和技能要求,以更直觀地了解崗位的特點(diǎn)和要求。
第一,通過(guò)柱形圖,展示了各崗位的招聘數(shù)量和占比,以了解市場(chǎng)的熱門崗位和冷門崗位。在Python中,使用Matplotlib庫(kù)來(lái)繪制柱形圖,將各崗位的招聘數(shù)量和占比這些數(shù)據(jù)存儲(chǔ)在Python的列表中。開(kāi)始繪圖時(shí),先導(dǎo)入Matplotlib庫(kù)中的pyplot模塊。然后使用pyplot中的bar函數(shù)來(lái)創(chuàng)建柱形圖,將崗位的列表作為x軸的數(shù)據(jù),將招聘數(shù)量的列表作為y軸的數(shù)據(jù)。為了增強(qiáng)圖表的可讀性,可以添加標(biāo)題、x軸和y軸的標(biāo)簽以及圖例。最后使用pyplot的show函數(shù)來(lái)顯示圖表。這樣,就可以直觀地看到各崗位的招聘數(shù)量和占比。通過(guò)柱形圖,可以清晰地對(duì)比不同崗位之間的招聘熱度,從而更準(zhǔn)確地把握市場(chǎng)的熱門崗位和冷門崗位,這為后續(xù)的深入分析和決策提供了有力的數(shù)據(jù)支持。
第二,通過(guò)折線圖,展示了各崗位的技能要求和素質(zhì)能力要求的變化趨勢(shì),把握市場(chǎng)的變化和發(fā)展趨勢(shì)。在繪制折線圖時(shí),選擇了使用Matplotlib庫(kù),它提供了靈活的繪圖接口,能夠方便地繪制出各崗位技能要求和素質(zhì)能力要求的變化曲線。在具體的繪制過(guò)程中,首先,使用已經(jīng)抓取并整理后的各崗位的技能要求和素質(zhì)能力要求的數(shù)據(jù),這些數(shù)據(jù)包括不同時(shí)間點(diǎn)或不同條件下的數(shù)值變化。其次,利用Matplotlib庫(kù)中的pyplot模塊的plot函數(shù)繪制折線圖。將時(shí)間點(diǎn)或條件設(shè)置為x軸的數(shù)據(jù),技能要求或素質(zhì)能力要求的數(shù)值設(shè)置為y軸的數(shù)據(jù)。為了提升折線圖的可讀性和直觀性,可以添加標(biāo)題、x軸和y軸的標(biāo)簽、圖例以及數(shù)據(jù)點(diǎn)的標(biāo)簽。最后,通過(guò)pyplot的show函數(shù)來(lái)展示折線圖。通過(guò)觀察折線圖,可以直觀地分析出各崗位的技能要求和素質(zhì)能力要求的變化趨勢(shì),從而更好地理解市場(chǎng)的變化和發(fā)展方向,這為接下來(lái)的分析和決策提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
第三,通過(guò)詞云圖,展示了各崗位的關(guān)鍵詞和技能要求,以便直觀地了解崗位的特點(diǎn)和要求。在Python中,使用WordCloud庫(kù)來(lái)生成詞云圖。WordCloud庫(kù)能夠根據(jù)文本中詞語(yǔ)的出現(xiàn)頻率生成相應(yīng)的詞云圖,能夠直觀地看到各崗位的關(guān)鍵詞和技能要求。具體生成詞云圖的過(guò)程中,首先,準(zhǔn)備好已經(jīng)抓取并整理后的各崗位的職位描述或技能要求文本數(shù)據(jù)。其次,使用WordCloud庫(kù)中的WordCloud類來(lái)創(chuàng)建一個(gè)詞云對(duì)象,并將文本數(shù)據(jù)傳遞給它。在這個(gè)過(guò)程中,可以設(shè)置一些參數(shù)來(lái)調(diào)整詞云圖的外觀,比如背景顏色、字體大小、最大詞語(yǔ)數(shù)量等。最后,調(diào)用詞云對(duì)象的generate方法來(lái)根據(jù)文本數(shù)據(jù)生成詞云圖,生成后可以使用Matplotlib庫(kù)來(lái)顯示這個(gè)詞云圖,或者將其保存為圖片文件。通過(guò)觀察詞云圖,我們可以直觀地看到各崗位中最重要、最頻繁的關(guān)鍵詞和技能要求,從而更深入地了解崗位的特點(diǎn)和要求,這為專業(yè)崗位分析和職業(yè)規(guī)劃提供了有力的數(shù)據(jù)支持。
通過(guò)深入分析,發(fā)現(xiàn)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)人才的市場(chǎng)需求呈現(xiàn)出多元化和差異化的特點(diǎn)。不同崗位對(duì)專業(yè)技能和素質(zhì)能力的要求各不相同,且隨著技術(shù)的發(fā)展和市場(chǎng)的變化而不斷變化。因此,學(xué)校需要根據(jù)市場(chǎng)需求和定位,科學(xué)精準(zhǔn)地定位人才培養(yǎng)目標(biāo)。在這個(gè)過(guò)程中,Python的可視化工具提供了強(qiáng)大的支持,能夠更直觀地展示分析結(jié)果,為人才培養(yǎng)目標(biāo)的定位提供更客觀有力的依據(jù)。
五、人才培養(yǎng)目標(biāo)定位的建議
結(jié)合學(xué)校的應(yīng)用型人才培養(yǎng)定位以及計(jì)算機(jī)專業(yè)方向?yàn)橐苿?dòng)互聯(lián)、數(shù)據(jù)可視化、網(wǎng)絡(luò)安全的特色,參考行業(yè)企業(yè)專家給出的建議及畢業(yè)生反饋的信息,對(duì)人才培養(yǎng)目標(biāo)進(jìn)行了科學(xué)精準(zhǔn)的定位。
首先,注重培養(yǎng)學(xué)生的實(shí)踐能力和創(chuàng)新能力。通過(guò)校企合作進(jìn)行項(xiàng)目實(shí)踐、實(shí)習(xí)實(shí)訓(xùn)等方式,將企業(yè)實(shí)際的項(xiàng)目經(jīng)驗(yàn)引入人才培養(yǎng)中,可以提高學(xué)生的實(shí)際操作能力和解決問(wèn)題的能力,這將有助于學(xué)生更好地適應(yīng)市場(chǎng)需求,提高就業(yè)競(jìng)爭(zhēng)力。
其次,注重培養(yǎng)學(xué)生的跨學(xué)科融合能力。在掌握計(jì)算機(jī)技術(shù)的同時(shí),我們鼓勵(lì)學(xué)生結(jié)合其他學(xué)科知識(shí)進(jìn)行創(chuàng)新和應(yīng)用,鼓勵(lì)學(xué)生積極參加學(xué)科競(jìng)賽,特別是跨學(xué)科的競(jìng)賽活動(dòng),這將有助于學(xué)生拓寬視野,提高綜合素質(zhì),為未來(lái)的職業(yè)發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。
最后,注重培養(yǎng)學(xué)生的持續(xù)學(xué)習(xí)和適應(yīng)變化能力。計(jì)算機(jī)技術(shù)發(fā)展迅速,市場(chǎng)需求也在不斷變化。因此,我們鼓勵(lì)學(xué)生緊跟技術(shù)前沿,進(jìn)行先進(jìn)技術(shù)的在線學(xué)習(xí),不斷提升自我,以適應(yīng)計(jì)算機(jī)行業(yè)不斷更新的技術(shù)發(fā)展和變化。
基于上面的結(jié)果分析,對(duì)人才培養(yǎng)目標(biāo)做出了如下建議:
(1)優(yōu)化課程設(shè)置:根據(jù)市場(chǎng)需求和技術(shù)發(fā)展,不斷更新和完善課程設(shè)置。納入最新的技術(shù)和應(yīng)用,確保學(xué)生掌握最新的知識(shí)和技能。這將有助于學(xué)生更好地適應(yīng)市場(chǎng)需求,提高就業(yè)競(jìng)爭(zhēng)力。
(2)加強(qiáng)與企業(yè)合作:與知名企業(yè)建立合作關(guān)系,共同開(kāi)展人才培養(yǎng)和項(xiàng)目實(shí)訓(xùn)。這將有助于學(xué)生更好地了解市場(chǎng)需求和行業(yè)動(dòng)態(tài),提高實(shí)踐能力和創(chuàng)新能力。同時(shí),企業(yè)也可以為學(xué)生提供更多的實(shí)習(xí)和實(shí)踐機(jī)會(huì),使學(xué)生能夠更好地適應(yīng)市場(chǎng)需求。
(3)注重培養(yǎng)學(xué)生的綜合素質(zhì)和能力:除了專業(yè)技能和知識(shí)外,還需要注重培養(yǎng)學(xué)生的溝通能力、團(tuán)隊(duì)合作能力、創(chuàng)新能力等非技術(shù)性能力。這將有助于學(xué)生更好地適應(yīng)市場(chǎng)需求和職業(yè)發(fā)展要求,提高綜合素質(zhì)和競(jìng)爭(zhēng)力。
結(jié)語(yǔ)
本文介紹了基于大數(shù)據(jù)分析的高校應(yīng)用型人才培養(yǎng)定位的研究思路,利用網(wǎng)絡(luò)公開(kāi)的招聘數(shù)據(jù)資源,采用計(jì)算機(jī)爬蟲(chóng)技術(shù)、數(shù)據(jù)分析技術(shù)及數(shù)據(jù)可視化技術(shù),跟蹤行業(yè)、企業(yè)對(duì)計(jì)算機(jī)專業(yè)人才的最新需求,獲得計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)領(lǐng)域所涵蓋的崗位、專業(yè)技能要求以及素質(zhì)能力要求數(shù)據(jù)。再結(jié)合學(xué)校的人才培養(yǎng)定位及企業(yè)專家建議和畢業(yè)生就業(yè)崗位情況反饋,利用多角度的數(shù)據(jù)構(gòu)建科學(xué)的人才培養(yǎng)方案的研究方法,為高校人才培養(yǎng)定位研究提供了一種有意義的參考。
參考文獻(xiàn):
[1]郝琳琳.招聘大數(shù)據(jù)分析在優(yōu)化人才培養(yǎng)方案中的應(yīng)用[J].河北軟件職業(yè)技術(shù)學(xué)院學(xué)報(bào),2024,26(01):2729.
[2]孫學(xué)軍,齊俊景,闞曲欣.基于招聘數(shù)據(jù)挖掘的高職人才培養(yǎng)方案構(gòu)建研究:以物流類專業(yè)為例[J].職教論壇,2019(08):159164.
[3]張曉玲,倪月犁.基于招聘信息的電商數(shù)據(jù)運(yùn)營(yíng)人才培養(yǎng)路徑研究[J].商場(chǎng)現(xiàn)代化,2024(17):2628.
[4]常逢佳,李宗花,文靜,等.基于Python的招聘數(shù)據(jù)爬蟲(chóng)設(shè)計(jì)與實(shí)現(xiàn)[J].軟件導(dǎo)刊,2019,18(12):130133.
[5]潘成花,王丹.基于Selenium+PyECharts的智聯(lián)招聘數(shù)據(jù)采集與可視化[J].科技創(chuàng)新與生產(chǎn)力,2024,45(07):130132.
[6]許丹亞,賈雨瀟.網(wǎng)絡(luò)招聘信息抽取與分析系統(tǒng)設(shè)計(jì)[J].無(wú)線互聯(lián)科技,2022,19(21):8285.
基金項(xiàng)目:2021年度省高等教育教學(xué)改革研究項(xiàng)目:基于大數(shù)據(jù)分析的人才培養(yǎng)定位研究與實(shí)踐(項(xiàng)目編號(hào):SJGY20210747);2021年度黑龍江工程學(xué)院教育教學(xué)改革研究項(xiàng)目:基于大數(shù)據(jù)分析的人才培養(yǎng)定位研究與實(shí)踐(項(xiàng)目編號(hào):JG202109)
作者簡(jiǎn)介:曲天偉(1976—"),女,漢族,黑龍江綏化人,碩士,副教授,研究方向:計(jì)算機(jī)應(yīng)用技術(shù)、高等教育。