亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Python的涉農(nóng)職位招聘信息爬取與可視化分析

        2023-02-23 01:26:30張晨祥馮明歌
        計(jì)算機(jī)時(shí)代 2023年2期
        關(guān)鍵詞:可視化經(jīng)驗(yàn)分析

        張晨祥,寧 璐,馮明歌

        (1.北京農(nóng)學(xué)院計(jì)算機(jī)與信息工程學(xué)院,北京 102206;2.北京農(nóng)學(xué)院圖書館)

        0 引言

        2022 年中央一號文件發(fā)布,已經(jīng)連續(xù)19 年聚焦“三農(nóng)”,國家為我國農(nóng)業(yè)發(fā)展提供了許多優(yōu)惠政策。近年來,越來越多的涉農(nóng)人才準(zhǔn)備投身于農(nóng)業(yè)領(lǐng)域,許多涉農(nóng)求職者在瀏覽招聘網(wǎng)站時(shí),看到紛繁的招聘信息,無法高效地找到自己心儀地職位。為了解決這些求職遇到的問題。研究基于Python 爬蟲獲取涉農(nóng)職位招聘數(shù)據(jù),旨在幫助涉農(nóng)畢業(yè)生快速獲取涉農(nóng)崗位信息,并且對職位數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,以可視化的方式展示給涉農(nóng)職位求職者,助力求職者找到心儀的崗位[1]。

        1 數(shù)據(jù)爬取

        用戶在招聘網(wǎng)站瀏覽職位信息時(shí)需要不斷點(diǎn)擊頁面獲取信息,而各大招聘網(wǎng)站有海量的招聘信息,相對而言用戶逐個(gè)瀏覽的效率是比較低的。用戶可以采用網(wǎng)絡(luò)爬蟲的方法批量獲取信息,即模擬瀏覽器發(fā)送網(wǎng)絡(luò)請求并接收響應(yīng),按照一定的規(guī)則抓取互聯(lián)網(wǎng)信息。這樣能節(jié)省時(shí)間,提高效率。爬蟲程序采用Python 語言,集成開發(fā)環(huán)境使用Pycharm,程序需要導(dǎo)入相關(guān)庫來支持爬蟲的運(yùn)行,包括:通過正則表達(dá)式進(jìn)行文字匹配的re庫,還有制定URL 獲取網(wǎng)頁數(shù)據(jù)的urllib庫,以及對Excel進(jìn)行操作的xlwt庫[2]。

        1.1 發(fā)起請求

        在爬蟲程序中要模擬瀏覽器的行為進(jìn)行獲取數(shù)據(jù),首先為請求構(gòu)造headers,招聘網(wǎng)站識別為用戶發(fā)起訪問,順利進(jìn)行下一步,爬蟲程序還需要請求的地址URL,本文中為了便于獲取用戶想要的數(shù)據(jù),將搜索目的的關(guān)鍵詞item 封裝在URL 地址里,將item 字符串轉(zhuǎn)成十六進(jìn)制編碼,便于機(jī)器識別,在爬取多個(gè)網(wǎng)頁信息時(shí),需要將地址進(jìn)行拼接,然后發(fā)起請求。網(wǎng)絡(luò)爬蟲提高獲取數(shù)據(jù)的效率。

        1.2 獲取響應(yīng)內(nèi)容

        當(dāng)服務(wù)器正常響應(yīng),返回結(jié)果將得到一個(gè)Response,這便是所要獲取的信息,利用請求包中的方法,請求該地址即可得到請求結(jié)果,之后讀取源代碼并轉(zhuǎn)為Unicode 格式。這個(gè)過程就是服務(wù)器接收客戶端的請求,獲取響應(yīng)的內(nèi)容[3]。

        1.3 解析內(nèi)容

        抓取到的信息是包含許多數(shù)據(jù),既有公司信息,又有工資薪酬,學(xué)歷要求等等,需要使用正則表達(dá)式進(jìn)行匹配,挑選出不同類別的屬性,放在同一個(gè)就業(yè)職位的信息里面。程序?qū)雔xml模塊,調(diào)用etree對象中的xpath方法并結(jié)合著xpath表達(dá)式實(shí)現(xiàn)標(biāo)簽的定位和內(nèi)容的捕獲。這一步相當(dāng)于瀏覽器將服務(wù)器端的文件進(jìn)行解析并且展現(xiàn)出來。

        1.4 保存數(shù)據(jù)

        保存涉農(nóng)職位數(shù)據(jù)的方式即將獲取的網(wǎng)絡(luò)數(shù)據(jù)存為文本,相當(dāng)于用戶在瀏覽網(wǎng)頁時(shí)下載了網(wǎng)頁上的文本信息。為了方便清洗涉農(nóng)職位數(shù)據(jù),這里將職位信息保存為Excel 文件,如圖1 所示,也便于后期通過數(shù)據(jù)分析工具處理分析涉農(nóng)職位數(shù)據(jù)。

        圖1 爬取涉農(nóng)職位信息截圖

        1.5 清洗數(shù)據(jù)

        在爬蟲程序?qū)隤andas庫、xlwt庫和re庫后,首先讀取Excel 表內(nèi)容,然后新建表格空間,讀取Excel表格數(shù)據(jù)代碼(如圖2),清洗表格的異常數(shù)據(jù),如關(guān)鍵信息缺失,則將信息內(nèi)多余的符號替換為空,去掉與農(nóng)林牧漁不相關(guān)的職位。然后將數(shù)據(jù)保存至新建立的表格空間。清洗數(shù)據(jù)核心代碼如圖3所示。

        圖2 讀取Excel表數(shù)據(jù)代碼

        圖3 清洗Excel表數(shù)據(jù)代碼

        2 數(shù)據(jù)分析

        在分析涉農(nóng)職位數(shù)據(jù)過程中用到Pyecharts 庫以及Tableau 軟件,Echarts 是一個(gè)數(shù)據(jù)可視化的圖表控件工具,它憑借著良好的交互性,精巧的圖表設(shè)計(jì),得到許多開發(fā)者的青睞。而Python 語言可以用于數(shù)據(jù)分析,適合用來處理數(shù)據(jù)[4]。Pyecharts 將Python與Echarts巧妙融合在一起,可以將圖表生成HTML 文件,便于用戶瀏覽。Tabeau 是一款數(shù)據(jù)可視化工具,具有易用、快速、靈活、精美等特點(diǎn),能夠快速地將數(shù)據(jù)圖表展示出來,易于操作,功能強(qiáng)大[5]。

        2.1 涉農(nóng)職位數(shù)量分析

        從圖4 可以得到:涉農(nóng)職位需求最多的是農(nóng)業(yè)技術(shù)員,其次是獸醫(yī),然后是農(nóng)藝師以及農(nóng)業(yè)項(xiàng)目經(jīng)理,隨后是農(nóng)機(jī)銷售崗位,后面銷售總監(jiān)、生態(tài)農(nóng)業(yè)項(xiàng)目專員、農(nóng)業(yè)規(guī)劃師以及農(nóng)險(xiǎn)專員需求數(shù)量基本持平。圖4可為涉農(nóng)畢業(yè)生求職提供參考,讓畢業(yè)生了解就業(yè)市場的需求,幫助其做好求職準(zhǔn)備,提高求職成功率。

        圖4 涉農(nóng)職位數(shù)量排行榜

        2.2 學(xué)歷要求分析

        篩選出1300余條就業(yè)職位信息用于分析,對學(xué)歷要求環(huán)形圖如圖5所示。涉農(nóng)職位學(xué)歷要求最多的是本科和???,其次是碩士及中專學(xué)歷,對博士學(xué)歷的需求量最少,學(xué)歷的要求和就業(yè)職位地區(qū)以及工作內(nèi)容相關(guān)性較大。通過爬蟲程序獲取的職位數(shù)據(jù)為近期招聘數(shù)據(jù),可以看出大專與本科學(xué)歷依舊在崗位學(xué)歷要求中占比很高。

        圖5 學(xué)歷要求環(huán)形圖

        2.3 工作經(jīng)驗(yàn)要求分析

        從工作經(jīng)驗(yàn)可以看出,絕大部分單位對工作經(jīng)驗(yàn)要求一般為一年、兩年以及三四年經(jīng)驗(yàn)居多,緊接著是無需經(jīng)驗(yàn),工作經(jīng)驗(yàn)要求分布圖中占比低的有十年以上經(jīng)驗(yàn)、八九年經(jīng)驗(yàn),這部分需求量較少,這和部分職位操作內(nèi)容難度及熟練度相關(guān)性大。建議涉農(nóng)求職者要加強(qiáng)自己的實(shí)踐能力,有一定工作經(jīng)驗(yàn)?zāi)軌蛟谇舐殨r(shí)占據(jù)優(yōu)勢。

        圖6 工作經(jīng)驗(yàn)要求分布圖

        2.4 涉農(nóng)單位地區(qū)分析

        從圖7、圖8 可以看出,長三角、珠三角、成渝地區(qū)和華中地區(qū)對于涉農(nóng)人才需求量較大,在涉農(nóng)單位數(shù)量排行榜上,廣州地區(qū)的涉農(nóng)單位招聘人數(shù)最多,其次是成都、上海[6]??傮w看來東部沿海地區(qū)以及南方地區(qū)需求的涉農(nóng)人才數(shù)量較多,求職者可以根據(jù)自身情況進(jìn)行選擇。

        圖7 涉農(nóng)職位需求分布圖

        圖8 涉農(nóng)單位地區(qū)排行榜

        2.5 學(xué)歷與薪資關(guān)系分析

        通過圖9 學(xué)歷與薪資關(guān)系圖,可以得到學(xué)歷層次與薪資的分布情況,職位數(shù)量需求占比最大的是本科與大專學(xué)歷,在本科學(xué)歷層次的職位中,薪資區(qū)間是0.8~1 萬/月的職位數(shù)量占比最高。在大專學(xué)歷層次的職位中,職位數(shù)量占比高的薪資區(qū)間有6~8 千/月、0.8~1 萬/月。其次是碩士學(xué)歷層次的職位,薪資區(qū)間是1~1.5萬/月的職位數(shù)量占比最高。而在中專學(xué)歷層次的職位中,薪資區(qū)間是6~8千/月的職位數(shù)量占比最高。在高中學(xué)歷層次的職位中,薪資區(qū)間是4.5~6 千/月的職位數(shù)量占比最高。綜上,對學(xué)歷層次的職位分析,學(xué)歷與薪資高低有一定的聯(lián)系。此外薪資水平還與其他因素有關(guān),比如工作經(jīng)驗(yàn)以及工作地區(qū)。

        圖9 學(xué)歷與薪資關(guān)系圖

        2.6 繪制福利待遇詞云

        福利待遇詞云圖主要由爬取的職位待遇等數(shù)據(jù)繪制,首先將Excel 里薪資待遇轉(zhuǎn)為文本文件,導(dǎo)入Jieba、WordCloud 庫,程序讀取薪資待遇文本內(nèi)容,使用Jieba 分詞提取薪資待遇詞頻,然后WordCloud 對處理過的分詞以及詞頻繪制出所需的薪資待遇詞云圖。其中,五險(xiǎn)一金、績效獎(jiǎng)金、年終獎(jiǎng)金是福利待遇熱門的話題。求職者可以在求職過程中,了解單位的福利待遇如何,找到自己心儀的職位。

        圖10 福利待遇詞云圖

        3 結(jié)論

        本研究針對廣大涉農(nóng)畢業(yè)生難以找到心儀工作問題,通過Python 程序獲取涉農(nóng)職位招聘信息并進(jìn)行可視化分析,有助于涉農(nóng)畢業(yè)生快速獲取大量與本專業(yè)相關(guān)的就業(yè)信息,避免花費(fèi)大量時(shí)間來瀏覽與職位無關(guān)的信息,提高求職者的求職效率。本研究將獲取的職位數(shù)據(jù)進(jìn)行可視化分析,針對畢業(yè)生關(guān)注的職位信息進(jìn)行分析,例如分析工作經(jīng)驗(yàn)、學(xué)歷要求,以及涉農(nóng)職位排行榜、涉農(nóng)單位地區(qū)排行榜、學(xué)歷薪資關(guān)系圖、福利待遇詞云等,為涉農(nóng)求職者提供就業(yè)參考。建議涉農(nóng)求職者要合理利用網(wǎng)絡(luò)信息技術(shù),高效獲取職位信息數(shù)據(jù),對職位數(shù)據(jù)進(jìn)行多維度比較、分析,選擇適合自己的職位。

        猜你喜歡
        可視化經(jīng)驗(yàn)分析
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        2021年第20期“最值得推廣的經(jīng)驗(yàn)”評選
        黨課參考(2021年20期)2021-11-04 09:39:46
        隱蔽失效適航要求符合性驗(yàn)證分析
        基于CGAL和OpenGL的海底地形三維可視化
        “融評”:黨媒評論的可視化創(chuàng)新
        傳媒評論(2019年4期)2019-07-13 05:49:14
        經(jīng)驗(yàn)
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        2018年第20期“最值得推廣的經(jīng)驗(yàn)”評選
        黨課參考(2018年20期)2018-11-09 08:52:36
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢分析
        精品亚洲国产亚洲国产| 中文字幕高清在线一区二区三区| 在线观看免费午夜大片| 香港三级午夜理论三级| 国产又爽又粗又猛的视频| 中文字幕无码不卡免费视频| 美女超薄透明丝袜美腿| 老司机在线免费视频亚洲| 成年女人免费v片| 亚洲午夜精品久久久久久人妖 | 一区二区三区日韩亚洲中文视频| 不卡a v无码在线| 亚洲精品中文字幕一二| 久久精品熟女亚洲av麻| 性欧美老人牲交xxxxx视频| 中文无码精品一区二区三区| 在线无码免费看黄网站| 精品一区二区av在线| 99国产精品99久久久久久| 亚洲欧洲精品无码av| 亚洲国产精品国自产电影| 特黄三级一区二区三区| 二区视频在线免费观看| 天堂网在线最新版www| 国产性猛交╳xxx乱大交| 久久国产免费观看精品| 女同另类专区精品女同| 综合五月激情二区视频| 日本亚洲国产一区二区三区| 无码熟妇人妻av在线c0930| 二区视频在线免费观看| 成人网站免费看黄a站视频| 真实国产乱视频国语| 精品国产污黄网站在线观看| 精品日韩一级免费视频| 无码成人一区二区| 久久久久久久中文字幕| 在线亚洲精品免费视频| 国产免费三级av在线| 全球av集中精品导航福利| 欧美日本视频一区|