王梅源 劉天穎 沃秋爽
(中南民族大學 管理學院,湖北 武漢 430074)
隨著人才質(zhì)量的提升和信息網(wǎng)絡技術的發(fā)展,網(wǎng)絡招聘已經(jīng)成為國內(nèi)眾多企業(yè)首選的人才募集方式,越來越多的求職者在網(wǎng)絡問答社區(qū)中產(chǎn)生和分享求職信息[1]。相對傳統(tǒng)招聘渠道,網(wǎng)絡招聘不僅擁有更便捷的操作方式,而且信息的時效性和廣泛性也可以得到保證,有效提高了招聘效率[2]。但對于招聘企業(yè)和求職者來說,在龐大的信息流中找尋并辨識相關招聘和求職信息并非易事。近幾年,網(wǎng)絡問答社區(qū)作為特殊的社交平臺走進大眾的視線,在平臺上,用戶既是信息的傳遞者,也是信息的使用者,在創(chuàng)造問題的同時解決問題[3]。突破傳統(tǒng)搜索引擎和工具的局限,幫助求職者高效獲取所需知識和信息。
用戶持續(xù)使用問答社區(qū)往往是由于他們對高質(zhì)量、高相關性和易獲得性信息與知識的需求,不斷拓展自身的知識深度與廣度。Phang[4]通過虛擬社區(qū)的用戶參與度分析發(fā)現(xiàn),易使用性和可信賴性是用戶進行搜尋答案行為的重要影響指標,而對于回答者而言,促使他們持續(xù)進行平臺知識貢獻的主要原因是更高的社會參與度。
近年來隨著文本挖掘技術的廣泛應用,很多研究者將以文本挖掘技術為代表的智能化處理手段應用于網(wǎng)絡社區(qū)的文本處理中。夏立新等學者[6]通過對網(wǎng)絡社區(qū)中與就業(yè)問題有關的文本進行挖掘,構建就業(yè)知識需求關系,為高校就業(yè)率的提升和發(fā)展提供建議。Macias等學者[7]在24個常用健康網(wǎng)絡論壇中選擇了791個與健康信息相關的帖子,發(fā)現(xiàn)需求建議、個人病情簡介及病情恢復是討論最多的話題。宋學峰等學者[8]使用內(nèi)容分析法和社會網(wǎng)絡分析法對知乎平臺中在線教育話題進行編碼分析,發(fā)現(xiàn)答案多數(shù)都是針對問題進行解釋和辨別,較少有評估、反思和共識。黃魯成等學者[9]在通過抓取知乎上關于老年人關鍵詞的相關問題并進行詞頻統(tǒng)計分析后,找尋到現(xiàn)今老年人健康話題關注和發(fā)展的重點。
目前國內(nèi)外學者對求職者行為的研究主要集中在求職動機[10-11]、求職意向影響因素[2,12-13]等方面;問答社區(qū)的研究主要集中在運營模式[14]、用戶體驗[15]、社區(qū)內(nèi)容答案質(zhì)量[16-17]等方面;將文本挖掘技術運用到問答社區(qū)的研究則多為問答評價[18]、答案模型預測[19-20]、話題內(nèi)容分析和識別[21]等;應用領域多為醫(yī)療健康[9]和學科體系評價[22]方面。而對于求職者在問答社區(qū)中討論和關注話題的研究較少。且以往對求職者行為的研究多采用訪談或問卷調(diào)查的實證研究方法[23-24],這類方法受主觀影響較大,無法保證數(shù)據(jù)源文本的多樣性和隨機性,很難勝任大數(shù)據(jù)量、非結構化環(huán)境下的文本內(nèi)容分析。將文本挖掘技術運用到網(wǎng)絡問答社區(qū)中,使用求職者真實的話題內(nèi)容分析其關注行為的研究較少。
本文將文本挖掘方法運用到網(wǎng)絡問答社區(qū)求職者關注行為研究中,利用爬蟲技術從網(wǎng)絡問答社區(qū)互動平臺抽取大量求職者提問和相關回答,借助分詞技術對數(shù)據(jù)進行處理和分析,構建求職者關注高頻詞云圖和關注話題互動分布圖,分析求職者在當今招聘環(huán)境中的關注行為,從而為招聘企業(yè)的發(fā)展和求職者能力提升提供參考。
本文使用數(shù)據(jù)挖掘、文本分析、可視化分析等文本挖掘方法,試圖在更充足和真實的數(shù)據(jù)樣本中提煉求職者關注行為,并分析其特點與應用價值。
“知乎”如今是國內(nèi)參與數(shù)和流量最大的中文開放社區(qū),比起歷史更為悠久的“百度知道”,知乎的成功主要在于對問題的深度探討,鼓勵回答的延展性,其專業(yè)嚴謹?shù)纳鐓^(qū)內(nèi)容、理性融洽的交流氛圍和廣泛效率的傳播理念深受網(wǎng)民認可[9]。截至2018年8月,知乎的個人注冊用戶量已超過2億,日活躍用戶達2600萬,其中,求職話題下的關注量達30萬左右。企業(yè)信息、企業(yè)社會輿論熱點與評價較充足,且越來越多的企業(yè)HR選擇在相關企業(yè)互動區(qū)域下方留下最新招聘信息,為合適的求職者提供機會。其討論話題遍布就業(yè)規(guī)劃、發(fā)展前景、求職知識提升等各方面,參與者多為求職或潛在求職人員。
“看準網(wǎng)”相比知乎問答社區(qū),由于加入了企業(yè)點評和問答欄目,與求職者的關系和信息聯(lián)系更為密切。求職者可以針對所選公司提出問題,并可收到來自其他用戶的反饋信息?;卮鹫咧灰煜は嚓P公司的對應提問,都可公開發(fā)表自己的見解,其身份包括對應公司職員、參與求職人員及已離職的老員工。累計的問答信息可以為更多后續(xù)求職者提供寶貴的參考意見和建議。
知乎和看準網(wǎng)對求職話題相關的關注和討論及求職問答功能契合本文研究,本文選取知乎和看準網(wǎng)求職問答社區(qū)的大量隨機問題作為研究數(shù)據(jù)源,通過Node.js網(wǎng)絡爬蟲隨機獲取用戶對于各公司的提問與回答數(shù)據(jù),包括提問內(nèi)容與數(shù)量、回答內(nèi)容與數(shù)量等原始文本數(shù)據(jù),既可排除同行業(yè)領域求職關注問題單一的可能,又可細化求職熱門領域關注問題的區(qū)別與聯(lián)系。
目前數(shù)據(jù)采集主要有系統(tǒng)日志采集、數(shù)據(jù)庫采集和網(wǎng)絡數(shù)據(jù)采集三類。其中,網(wǎng)絡數(shù)據(jù)采集面向非結構化和半結構化數(shù)據(jù),通過網(wǎng)絡爬蟲和網(wǎng)站平臺提供的公共API(如Twitter和新浪微博API)將網(wǎng)站上獲取的網(wǎng)頁數(shù)據(jù)提取出來,將其清洗后轉(zhuǎn)換成結構化數(shù)據(jù),并將其存儲為統(tǒng)一的本地文件數(shù)據(jù)。其特點是采集效率高并能保證數(shù)據(jù)的真實性[25]。
本文專注于評論型內(nèi)容研究,適合選用網(wǎng)絡數(shù)據(jù)采集方法。
目前網(wǎng)絡上多使用request + cheerio來進行爬蟲開發(fā),request為http請求庫,用于發(fā)起一個http請求,在開發(fā)爬蟲的過程中,主要用于使用get方式,將目標頁面的代碼進行抓取,然后使用cheerio解析頁面元素,獲取目標數(shù)據(jù)。知乎和看準網(wǎng)平臺都有一個共同特點,即頁面內(nèi)數(shù)據(jù)都使用ajax進行請求并渲染到頁面上。ajax是一種網(wǎng)頁上常用的無刷新讀取技術,主要用于前端向后端請求數(shù)據(jù)。具有這種特點的網(wǎng)頁,目標數(shù)據(jù)默認是沒有渲染在頁面中的,也就意味著request庫抓取到的代碼并不包含我們所需要的目標元素。
因此,本文使用puppeteer來實現(xiàn)爬蟲。puppeteer 是谷歌官方出品的一個通過DevTools協(xié)議控制Headless Chrome的node.js庫,庫的內(nèi)部封裝了一系列對Chrome的操作API,開發(fā)者可以通過這些API對Chrome進行模擬用戶行為、自動化測試、爬蟲等操作。為了使爬蟲中的異步操作更簡單直觀,采用11版本的node.js,支持async/await的方式處理異步,避免陷入回調(diào)地獄,且11版本可以使用更新的JavaScript規(guī)范的語法,對于開發(fā)效率有顯著提升。
puppeteer可以通過瀏覽器的API,控制程序監(jiān)聽到ajax請求,等到數(shù)據(jù)成功渲染到頁面上,再對目標數(shù)據(jù)進行爬取,將獲取數(shù)據(jù)的步驟封裝成一個函數(shù)kanzhunGet,該函數(shù)的傳入?yún)?shù)page和url,其中,page為上一步操作實例化的page對象,url為要爬取數(shù)據(jù)的頁面的地址。
(1)調(diào)用page實例的goto方法,操作page實例進入要爬取數(shù)據(jù)的頁面;
(2)調(diào)用page的evaluate方法,將操作環(huán)境進入到瀏覽器內(nèi),將代碼的執(zhí)行上下文指向page對象所打開的頁面,從而保證對頁面內(nèi)元素的操作不會產(chǎn)生跨域行為,再定義一個getNum方法,用于匹配回答數(shù)中的數(shù)字,得出回復數(shù)結果;
(3)根據(jù)上述對頁面結構的分析,定義askWrap變量,用于保存所有問答的列表,通過遍歷該列表,對所有問答元素的內(nèi)容進行解析,生成一個包含question和answer鍵的對象,并將該對象追加到定義好的res結果數(shù)組中,最終返回給函數(shù)的調(diào)用方。
兩個網(wǎng)站在爬取機制上有所不同,“知乎”通過滾動頁面到最底部以后,由前端向后端發(fā)起請求,并將后端返回的數(shù)據(jù)繼續(xù)追加到頁面的底部來實現(xiàn)大量數(shù)據(jù)展示,其對接口的請求做鑒權處理,每次請求會對訪問來源進行校驗?!翱礈示W(wǎng)”通過分頁的方式展現(xiàn)大量數(shù)據(jù),每頁共十條數(shù)據(jù),共十頁,通過頁面請求抓取,可以得到頁面請求數(shù)據(jù)時所調(diào)用的后端數(shù)據(jù)接口,對接口請求頭及請求體進行解析發(fā)現(xiàn),接口并未做鑒權處理,即不需要登錄同樣可以獲取到數(shù)據(jù)。
兩個網(wǎng)站在獲取數(shù)據(jù)上也有所不同,對于知乎數(shù)據(jù),使用puppeteer通過模擬真實用戶訪問的方式獲取數(shù)據(jù)。
(1)選擇求職相關的話題,對頁面中的元素進行分析,發(fā)現(xiàn)每條數(shù)據(jù)的問題可以通過ContentItem-title來獲取,而評論數(shù)的標識與贊同數(shù)的標識只能通過元素的兄弟元素來辨別。對獲取單條數(shù)據(jù)的方式進行封裝后,需要對頁面進行自動滾動處理,自動滾動的操作使用了puppeteer中的evaluate方法。
(2)使用JavaScript進行頁面滾動條的操作,先獲取當前頁面的總高度,后操作滾動條滾動到頁面的最底部,即可觸發(fā)頁面加載更多事件。經(jīng)過多次嘗試后發(fā)現(xiàn),當頁面元素過多時,會導致爬蟲程序進入假死狀態(tài),導致抓取的數(shù)據(jù)丟失,且由于知乎加載新數(shù)據(jù)的方式比較特殊,每次請求的數(shù)據(jù)條數(shù)無法確定。
(3)對爬蟲程序進行修改,在每次進行頁面滾動之前,將上次加載時抓取到的數(shù)據(jù)存儲到本地文件中,這樣可以保證即使爬蟲程序假死后,也可以通過手動終止的方式結束程序,而又不會導致崩潰前所抓取到的數(shù)據(jù)丟失。
對于看準網(wǎng)數(shù)據(jù),則選擇postman請求工具對接口進行測試,發(fā)現(xiàn)無法獲取正確數(shù)據(jù),后端返回數(shù)據(jù)為請求錯誤,進一步測試后發(fā)現(xiàn),后端對請求中的referer做了限制,在對referer進行模擬后,成功獲取到數(shù)據(jù)。由于無需從頁面中抓取數(shù)據(jù)而直接從接口獲取數(shù)據(jù),雖然頁面中前端對總頁數(shù)做了10頁的限制,但是通過直接調(diào)用接口的方式,可以獲取共55頁數(shù)據(jù)。
經(jīng)過數(shù)據(jù)爬取,最終獲取兩個平臺的問題數(shù)據(jù)源共1781條,回答共97732個。
從知乎和看準網(wǎng)采集的求職問題信息是非結構化的文本內(nèi)容,含有一定的雜質(zhì),需要進行數(shù)據(jù)預處理后再進行分詞。
(1)數(shù)據(jù)初步篩選和清洗,借助哈爾濱工業(yè)大學信息檢索中心發(fā)布的停用詞表擴展板與問答社區(qū)中提問語句的特點,將為什么、怎么、有沒有、哪些、怎么辦、什么等詞加入到停用詞表,并在統(tǒng)計結果中去掉虛詞、介詞、連詞、助詞及標點符號。
(2)使用node.js中文分詞包jieba對獲取的1781條問題數(shù)據(jù)進行分詞,jieba對自然語言分析及文本分析的支持較為友好,其采用的算法及策略使得分詞結果精準可靠。目前常見的分詞方法主要分為基于字符串匹配的分詞方法和全切分的方法。前者按照不同的掃描方式,逐個查找詞庫進行分詞。后者則首先切分出與詞庫匹配的所有可能的詞,再運用統(tǒng)計語言模型決定最優(yōu)的切分結果。它的優(yōu)點在于可以解決分詞中的歧義問題。本文選擇使用全切分的方式進行分詞,通過計算高頻詞的相關回答數(shù)和出現(xiàn)次數(shù)的權重,得到根據(jù)權重大小排列的分詞結果,部分結果如表1所示,權重是指與上下文主旨相關性較高的詞語,問答中出現(xiàn)次數(shù)多少并不能直接反映出權重的高低,通過算法計算權重排名,更貼近文章所講述的內(nèi)容;“相關問答數(shù)”指出現(xiàn)該關鍵詞的問答數(shù)量;“出現(xiàn)次數(shù)”指在相關問答中關鍵詞出現(xiàn)的詞頻。
根據(jù)文本分詞結果,可得到各關鍵話題詞的詞頻和特征詞“問題-回答”對應的互動頻率,針對該數(shù)據(jù)結果進行可視化分析,可以直觀有效地反映求職者討論話題熱點。
從1781個關于求職的問題中,通過數(shù)據(jù)處理和文本分詞,得到初步的詞匯頻率排布,然后對這些詞匯做權重判斷,并取權重前100的詞,過濾掉與求職信息無關或特定公司名稱等與求職關注行為研究無關的詞語后,得到的關鍵詞即具有高權重、高頻率、高相關度的詞。關鍵詞云圖如圖1所示,字體越大者代表該詞詞頻越高。這些高權重的高頻特征詞反映了當下在擁有求職問答功能的在線問答社區(qū)中,求職者討論和關注的主要話題內(nèi)容。
表1 部分分詞結果
通過高頻特征詞及詞頻可初步看出,求職者在求職過程中對于如何順利通過考核最為關心,如“面試”“簡歷”“HR”“面試官”“Offer”“技巧”等。對于求職者的學歷和經(jīng)驗在意程度比較高,如“應屆生”“研究生”“經(jīng)驗”“畢業(yè)生”“碩士”“考研”等。針對求職公司的雇主品牌吸引力關注程度較高,如“管理”“專業(yè)”“工資”“薪資”“待遇”“加班”等。且從用戶使用角色來看,使用網(wǎng)絡問答社區(qū)參與求職關注行為討論的求職者以年輕求職者居多,高校畢業(yè)生占主導地位,如“兼職”“實習”“應屆生”“大學生”“畢業(yè)生”“校招”等。
圖1 關鍵詞云圖
特征詞話題互動分布可以區(qū)分關注話題的廣泛受眾度和潛在受眾度。根據(jù)表1中各特征詞的出現(xiàn)次數(shù)、回答數(shù)和權重進行標準化處理,制作關注點特征詞互動分布四象限氣泡圖,如圖2所示。其中四象限的橫坐標代表回答數(shù),縱坐標表示出現(xiàn)該問題的詞頻數(shù),氣泡的大小代表權重。根據(jù)特征詞所對應的位置,分為四種話題類型:①輿論焦點區(qū)(第一象限):此區(qū)域代表詞頻較高且回答數(shù)較高的話題;②關注焦點區(qū)(第二象限):此區(qū)域代表詞頻較高但回答數(shù)較低的話題;③潛在熱點區(qū)(第四象限):此區(qū)域代表詞頻較低但回答數(shù)較高的話題;④沉默區(qū)(第三象限):此區(qū)域代表詞頻和回答數(shù)都較低的話題。
圖2 特征詞話題互動分布氣泡圖
2.2.1 輿論焦點區(qū)(第一象限)
圖2中,“面試”“簡歷”“HR”三個特征詞的提問量與回答量都非常高,這說明這組問題是目前求職者關注與討論的重點和熱點。綜合來看,這三個特征詞反映的都是作為求職者進入心儀公司的必經(jīng)考核方式。
(1)在如今企業(yè)高速發(fā)展、人才兼?zhèn)涞男畔r代,企業(yè)招聘變得越發(fā)嚴格,不僅涉獵專業(yè)知識、團隊協(xié)作等多方面能力考查,且形式也更為多樣化。將溝通表達、邏輯思維、團隊合作、壓力承受、職業(yè)規(guī)劃等全部列入考核范圍,使得廣大求職者,特別是應屆畢業(yè)生在求職過程中更加有壓力和學習的動力,在求職的各個環(huán)節(jié)都需要認真準備。
(2)求職者的簡歷作為求職的“敲門磚”,需要突出專業(yè)能力,重點挖掘崗位匹配信息并盡可能數(shù)據(jù)化表達。
(3)面試準備則除了長期積累的專業(yè)知識外,對應聘企業(yè)的企業(yè)文化、發(fā)展理念、主要產(chǎn)品等也都應提前了解。
(4)通過網(wǎng)絡招聘問答社區(qū)的交流互動,已經(jīng)歷求職過程或已入職人員的經(jīng)驗分享,不僅可以讓更多將要參與面試的求職者找到現(xiàn)階段努力的方向,修改更新個人簡歷,還可以增強潛在求職者對心儀企業(yè)的深入了解,更加有針對性地完善求職目標,這也正是此類話題成為輿論熱點的重要原因。
2.2.2 關注焦點區(qū)(第二象限)
圖2中,“應屆生”“求職”“offer”“加班”“經(jīng)驗”“實習”及薪資福利類特征詞的提問量都比較高但是回答數(shù)相對較少,說明此類問題亟待解決且有較高的發(fā)展空間。另外,“工資”“待遇”“薪資”三個關鍵詞雖在氣泡圖中分布于沉默區(qū),但考慮到語義理解,其含義基本相同,故將此類話題的詞頻和回答數(shù)合并計算。
(1)企業(yè)招聘員工看重其十分出色的勝任力和執(zhí)行力,由于眾多民營企業(yè)和創(chuàng)業(yè)型小微企業(yè)的快速發(fā)展,其在新人培訓階段更加關注企業(yè)文化和綜合素質(zhì)的提升,而對于不同崗位不同工作內(nèi)容的指導培訓卻相對弱化,這就需要求職者有較好的項目經(jīng)驗和學習能力。
(2)越來越多的招聘人員看重求職者的崗位與技能匹配度,特別對應屆畢業(yè)生來說,僅靠在學校掌握的專業(yè)知識無法直接勝任招聘要求,想要快速實現(xiàn)從校園到職場的轉(zhuǎn)變,需要求職者更早地參與到企業(yè)實踐中,因此實習經(jīng)驗的積累成為眾多求職者關注的重點。
(3)目前,眾多著名企業(yè)在校園招聘階段專門開設實習生招聘模塊,其考核制度也更加嚴格規(guī)范,有些甚至不低于對正式員工的要求,因此,實習生的含金量也逐年增加,一份優(yōu)秀的實習經(jīng)驗在正式求職時常常能起到至關重要的作用。
(4)實習經(jīng)驗與正式求職已逐漸成為一種互利共存的關系。針對此類話題回答數(shù)相對較少的原因主要是應屆生與需要實習經(jīng)驗的求職者一般是首次進入求職圈的用戶群,他們關注此類問題,但是難以向他人提供經(jīng)驗分享,而參與社會招聘的資深求職者又很少參與此類話題討論。這也反映出使用網(wǎng)絡招聘問答社區(qū)的用戶群更為廣泛,不受年齡和資質(zhì)的約束,更多資歷豐富和年長的求職者也在互聯(lián)網(wǎng)高速發(fā)展的今天參與到平臺互動中。
(5)招聘企業(yè)的雇主吸引力也是關注焦點。文獻研究中,雇主吸引力評價通常采用六維模型,包括工作本身、管理風格、團隊合作、薪酬福利、職業(yè)發(fā)展和組織實力。本研究中,薪資福利、屬于工作本身范疇的加班均出現(xiàn)在高頻詞中,說明雇主吸引力也是求職者選擇企業(yè)的重要指標。
眾多民營企業(yè)和創(chuàng)業(yè)型公司在其發(fā)展上升期通常業(yè)務繁忙,相對傳統(tǒng)企業(yè)更加繁忙,對員工的業(yè)務效率和產(chǎn)品熟悉度要求更高。無論是新入職的零經(jīng)驗求職者,還是已有資歷但剛剛跳槽試圖找尋新機會的有經(jīng)驗求職者來說,在還未熟練掌握崗位工作要領卻面臨高強度壓力和要求的情況下,加班成了普遍的工作狀態(tài)。薪酬福利是求職者所能獲得的最直觀的報酬和評價,它反映了員工的工作勝任能力和企業(yè)對員工的重視程度,因此,求職者對薪酬福利的關注程度較高。
綜合來看,求職者對于雇主吸引力相關因素的重點關注體現(xiàn)了當今求職雇主-員工的雙向匹配性,求職者不再被動等待企業(yè)的選擇,而是擁有了主觀選擇企業(yè)的權利,因此,招聘企業(yè)需要不斷提升自身的實力和品牌吸引力,才能在人才招募中占得先機。
根據(jù)回答內(nèi)容語義分析顯示,此類關注焦點話題的回答數(shù)相對較少的原因主要有兩方面,一是使用網(wǎng)絡招聘問答社區(qū)的用戶更多為準備或正在進行求職的潛在員工,已入職的企業(yè)內(nèi)部員工參與相對較少,因此無法給該類問題提供充足的回答建議;二是即使有部分企業(yè)內(nèi)部員工參與討論,但因其所在企業(yè)、部門、崗位等的不同而無法提供廣泛適用性參考建議。
2.2.3 潛在熱點區(qū)(第三象限)
2.1.3 二維相關光譜 將人參、紅參、西洋參3種配方顆粒壓片后,在室溫狀態(tài)下放置,間隔10~30 min測定紅外光譜并進行基線校正,將獲得的數(shù)量足夠的紅外光譜導入清華大學的TD4.2二維分析軟件,即可獲得二維相關紅外光譜圖,并可根據(jù)需要選取不同波數(shù)范圍進行分析。
圖2中,“管理”出現(xiàn)詞頻雖少但討論數(shù)卻多,說明該類話題可能會成為以后關注的重點。管理在求職社區(qū)中主要有兩層含義,一是指管理工作本身,例如從企業(yè)角度來說,企業(yè)內(nèi)部的管理架構、管理模式和管理內(nèi)容都在不同角度反映企業(yè)的社會價值和發(fā)展空間,擁有良好的管理制度和管理決策不僅能讓企業(yè)在激烈的市場競爭中找到適合自身持續(xù)發(fā)展的道路,還能更好地吸引優(yōu)質(zhì)人才;二是從學科專業(yè)角度來說,管理類相關專業(yè)歷經(jīng)數(shù)十年發(fā)展,已經(jīng)形成了良好的專業(yè)體系,近幾年又與眾多熱門前沿領域進行學科交叉,使得管理及交叉專業(yè)畢業(yè)生的求職機會逐年增加。這也進一步推動了高校管理類及相關專業(yè)人才培養(yǎng)的改革,要求高校在培養(yǎng)方案、目標設置和知識能力結構等方面均應緊跟發(fā)展趨勢,及時修正和完善理論和實踐教學體系,為企業(yè)培育和輸送更多復合型專業(yè)人才。
2.2.4 沉默區(qū)(第四象限)
圖2中,該區(qū)域的數(shù)據(jù)相對其它區(qū)域其提問數(shù)和回答數(shù)都相對較少,但經(jīng)過大數(shù)據(jù)樣本后仍舊出現(xiàn)較高權重,說明該部分詞仍有研究價值,并可能會成為未來討論熱點。沉默區(qū)中與學歷及薪資待遇相關的話題詞較多,學歷雖不是求職的硬性門檻,但是眾多招聘反饋顯示,用人單位對于求職者的學歷重視程度依然不減。尤其隨著人才質(zhì)量平均水平的提高、各高校每年招生人數(shù)的擴張等,學歷的含金量也在不斷提升。之所以討論話題較少,最大的可能是站在求職者角度,很難判定企業(yè)對求職者學歷是否會真正考量?,F(xiàn)在許多企業(yè)為了廣招人才,在招聘信息中并不明確規(guī)定學歷限制,但在真實考評中是否參考卻很難判定。
薪資福利類話題占比較少的原因主要是目前民營、私企數(shù)量增多,薪資模式不同于以往的“同工同酬”,多數(shù)采用“差異化薪資模式”,即根據(jù)每個人的能力或價值細分成不同的待遇。即便是一同進入公司的同一個崗位,也會有所區(qū)別,其目的還是為了更好地激勵員工實現(xiàn)更大的價值?!安町惢劫Y”在求職話題領域?qū)儆谙鄬λ矫艿脑掝},也很難在開放社區(qū)得到真實答案。
分析求職者關注行為的目的在于為提升企業(yè)招聘質(zhì)量和效率、為求職者提高競爭實力和求職滿意度提出意見和建議,以期建立企業(yè)與求職者互利共贏的新型求職關系。通過對網(wǎng)絡問答社區(qū)求職者關注行為的分析,不僅讓求職者可以在海量招聘企業(yè)中更清晰、全面地了解心儀公司,以便更有針對性地準備自己的求職過程,還幫助企業(yè)在使用網(wǎng)絡招聘社區(qū)進行企業(yè)宣傳、人才招募過程中更好地掌握求職者的內(nèi)在驅(qū)動力,及時改進企業(yè)內(nèi)部和外部的資質(zhì)條件,從而在人才競爭中取勝。
對于招聘企業(yè)來說,想要招聘到合適,高素質(zhì)的員工無疑是企業(yè)發(fā)展最重要的一環(huán),想要打贏人才爭奪戰(zhàn),分別要從內(nèi)在和外在兩方面入手。
3.1.1 充分識別求職者群體關注行為特征
一個城市的發(fā)展離不開經(jīng)濟增長和人均GDP的提高,這些增長來源于企業(yè)的發(fā)展,城市內(nèi)擁有的優(yōu)秀企業(yè)越多,經(jīng)濟增長就越快,留住人才的機率也越大。近幾年各大經(jīng)濟競爭力較強的城市都紛紛出臺了相應的人才優(yōu)惠政策:2017年初,武漢市“五年內(nèi)留住百萬大學生”計劃打響了爭奪人才第一槍;2018年3月,北京市宣布建立人才引進“綠色通道”;同月,上海也提出打造“人才高峰”。2018年,全國超過100個城市發(fā)布了人才政策。2019年一開年,各地爭奪人才政策集中發(fā)布,其中購房和生活補貼是兩大最主要也是最常見的吸引人才手段。數(shù)據(jù)說明,人才吸引政策的背后,正是對求職者尤其是高素質(zhì)求職者的看重。
3.1.2 努力實現(xiàn)雇主品牌吸引力的提升
當今時代的求職者學習能力較強,目標定位和自我追求都比較高,企業(yè)只有盡力滿足高素質(zhì)求職者的期望條件,才能成為優(yōu)秀人才的求職目標。
招聘企業(yè)應重視自身品牌吸引力的提升,從而為任何一個有上進心并不斷提升自我的求職者帶來最大程度的就業(yè)滿意度。綜合國內(nèi)外學者對雇主品牌吸引力的研究以及求職者關注話題數(shù)據(jù)可知,雇主品牌的功能性、象征性和發(fā)展性對潛在員工有重要的影響作用。其中,功能性主要強調(diào)企業(yè)承諾的工作本身,包括提供真實、完整的崗位職責和工作內(nèi)容供求職者參考,最大限度地解決信息不對稱而造成的擇業(yè)困難問題等。象征性強調(diào)企業(yè)展示的品牌形象,包括企業(yè)的聲譽、名譽以及外在形象等反映企業(yè)內(nèi)在精神力量等因素。發(fā)展性則側重企業(yè)提供的職業(yè)發(fā)展前景,包括良好的職業(yè)發(fā)展路徑、完善的晉升體制、充分的職業(yè)培訓等。
以阿里巴巴集團為例,公司十分注重發(fā)掘員工的潛能,同時也關注員工的成長。其內(nèi)部招聘和輪崗制度給很多員工提供了新崗位、新機會,使員工在職業(yè)發(fā)展路徑上可以得到持續(xù)發(fā)展。阿里巴巴推出的“青橙計劃”“百年阿里系列培訓”“領導力發(fā)展”“阿里夜校”等一系列員工培訓措施,為員工提供了更多自我提升平臺。阿里深知在競爭文化中,企業(yè)的信譽、形象、品牌和知名度都是企業(yè)不可估量的無形資產(chǎn),員工的思想、行為和心態(tài)也會受其影響和熏陶。于是,讓企業(yè)所有成員從進入公司的那一刻起,就擁有金庸武俠人物的名號,不僅讓武俠文化中的正義感影響到公司每一個員工,也為員工營造出一種輕松愉悅的工作氛圍,使員工能夠拋開壓力,更加團結,也更加愿意為組織實現(xiàn)共同的價值而奮斗。
對于求職者來說,應充分利用線上線下各類知識渠道和資源,不斷豐富閱歷,掌握面試要領,注重思考和經(jīng)驗總結,全面提升崗位勝任力。
3.2.1 充分利用網(wǎng)絡求職社區(qū)的各類資源和信息
互聯(lián)網(wǎng)時代,掌握更多的信息就意味著掌握更大的主動權和選擇權。求職者可以在網(wǎng)絡問答社區(qū)匿名討論求職問題,傳達行業(yè)知識,實現(xiàn)全方位信息交流和人際網(wǎng)絡互動,還可以利用平臺了解企業(yè)非公開化信息,加深崗位職責了解,熟悉業(yè)內(nèi)薪資水平,掌握面試技巧,不斷完善自己的知識儲備,更好地進行規(guī)劃對比分析,從而選擇更適合自己的公司。
除了知乎和看準網(wǎng)平臺之外,信息資源較為豐富且用戶活躍度較高的還有國內(nèi)的拉勾網(wǎng)、脈脈、實習僧等,國外的Linkedln等,這些平臺利用其社交媒介特性與招聘指導相融合,最大化幫助求職者實現(xiàn)滿意就業(yè)。
以2018年10月剛完成D輪融資的社交招聘新秀“脈脈”來看,一旦求職者選定了自己的職業(yè)領域,求職者在脈脈平臺上看到的內(nèi)容、可以接觸的人幾乎全部與這個職業(yè)有關。如該職業(yè)其他人的實名或匿名動態(tài)、人脈推薦、職業(yè)資訊推薦等等。這種聚焦垂直領域的組織方法,強化了職場人群因行業(yè)相通而帶來的內(nèi)部凝結,讓行業(yè)內(nèi)部信息的交流溝通變得更加方便快捷,使得求職過程中求職者與企業(yè)雙方并不完全信息對等的關系變得更加透明,從而讓求職者有更多的機會和方式去了解企業(yè)更深層次的信息。
3.2.2 多渠道高效提升崗位勝任力
對求職者來說,想要順利進入理想企業(yè),就必須在眾多優(yōu)秀競爭者中脫穎而出。學歷文憑早已不再是企業(yè)挑選人才的唯一指標,只要擁有求職崗位的專業(yè)技能,都有機會獲得工作機會。開放性的招聘環(huán)境帶給了求職者更多的職業(yè)選擇,但同時也增加了競爭難度。在招聘過程中,企業(yè)更加看重的是求職者的崗位優(yōu)勢、核心競爭力等綜合素質(zhì)。
除了在求學期間系統(tǒng)扎實地學習專業(yè)知識、提高專業(yè)技能之外,求職者還可充分利用企業(yè)針對求職者實習實踐能力提升的渠道和途徑。目前,眾多企業(yè)都在開放實習生招錄計劃,可以讓職場新人提前得到鍛煉的機會,零距離接觸實際工作內(nèi)容,提升就業(yè)技能。
以普華永道為例,每年1月和7月,其審計部、管理部、風險及控制服務部、稅務部均會開放實習生機會。實習期間,學生不僅可以親身體驗在專業(yè)服務公司里的真實客戶項目工作,還可學到各種基本職業(yè)技能,從而提高專業(yè)能力。若實習期間表現(xiàn)優(yōu)異,還可以獲得畢業(yè)后優(yōu)先錄用的機會。
在線上付費平臺和虛擬社群方面,以當今較為火熱的互聯(lián)網(wǎng)人在線大學“三節(jié)課”平臺為例,該平臺以專業(yè)輔導互聯(lián)網(wǎng)產(chǎn)品和運營崗位相關技能為切入點,主打互聯(lián)網(wǎng)熱點人物事件專業(yè)分析解讀。并通過內(nèi)容入口集聚粉絲,開展多層次的互聯(lián)網(wǎng)職業(yè)培訓,以提升職業(yè)能力為目標,倡導終生學習。平臺關注和強調(diào)從“知識獲得”到“能力提升”的轉(zhuǎn)化過程,提供“設計體系化課程+高強度實戰(zhàn)練習+專家助教1對1點評+班主任深度服務”的線上教學模式。不僅讓求職者省去了線下課程成本,可以更加自由靈活地安排學習時間,有針對性地完善崗位專業(yè)知識,而且能在不斷學習中迭代技能體系,利用集聚效應,提升應聘競爭優(yōu)勢。
本文將文本挖掘方法運用于網(wǎng)絡問答社區(qū)求職者關注行為的研究中,利用Node.js爬蟲的方式從知乎求職話題圈和看準網(wǎng)求職專業(yè)互動平臺抽取大量求職者提問和相關回答,并借助分詞詞典和Node.js中的jieba技術對數(shù)據(jù)進行處理和分析,構建求職者關注高頻詞云圖和關注話題互動分布圖,分析求職者在當今招聘環(huán)境中的關注行為。
研究結果表明:①使用網(wǎng)絡問答社區(qū)參與求職關注行為討論的求職者以年輕人居多,其中高校畢業(yè)生占比最大,管理類專業(yè)人才和崗位需求相比數(shù)量更多。②求職者對于如何順利通過考核最為關注,討論熱度也最強,開放的問答社區(qū)使得用戶參與和知識分享更為便捷,求職者可化被動為主動,提前了解更多考核信息并針對性地學習和準備。③雇主的吸引力是求職者擇業(yè)最先考慮的因素,這其中包括企業(yè)內(nèi)部競爭力和外部競爭力,內(nèi)部競爭力體現(xiàn)在企業(yè)發(fā)展、晉升機制、企業(yè)文化和創(chuàng)新是否滿足人才需求,外部競爭力主要體現(xiàn)在薪資待遇等物質(zhì)條件方面,但由于目前各公司相同崗位的待遇沒有統(tǒng)一的標準,且該類問題私密性較強,所以較難在開放社區(qū)得到充足的反饋。④工作經(jīng)驗也成為求職者更為在意的話題,因為企業(yè)目前更傾向于經(jīng)驗豐富,實踐能力強的優(yōu)質(zhì)人才,即便針對應屆畢業(yè)生,也更加看重實習或綜合實訓的技能培養(yǎng)。
因此,招聘企業(yè)需要在提高自身競爭力的同時更加了解求職者的關注行為。求職者需要充分利用線上線下各渠道和資源,豐富閱歷,提高專業(yè)技能,實現(xiàn)更理想的人-崗匹配。
本文在數(shù)據(jù)來源的選取上存在一定的局限性,僅選擇了知乎和看準網(wǎng)兩大問答社區(qū),在后續(xù)的研究中可以增設更多的平臺驗證數(shù)據(jù)結果。另外,對于問答發(fā)表者的用戶畫像沒有很完善的判定,可在以后的研究中增設相關內(nèi)容,更加豐富求職者關注行為研究的準確性。