□劉 耘 袁 華
[1. 四川交通職業(yè)技術(shù)學(xué)院 成都 611130;2. 電子科技大學(xué) 成都 611731]
領(lǐng)英(LinkedIn)是全球最大的職業(yè)社交網(wǎng)站,其創(chuàng)始人及產(chǎn)品管理副總裁Allen Blue認(rèn)為,創(chuàng)新正在以前所未有的速度在全球范圍內(nèi)展開,各國的教育體系都在加緊腳步以適應(yīng)這種巨變,以彌補(bǔ)在所有產(chǎn)業(yè)中員工自身的職業(yè)能力與企業(yè)所需之間的差距[1]。
2014年教育部等六部門組織編制了《現(xiàn)代職業(yè)教育體系建設(shè)規(guī)劃(2014~2020年)》,該規(guī)劃指出職業(yè)教育應(yīng)堅(jiān)持以服務(wù)發(fā)展為宗旨,以促進(jìn)就業(yè)為導(dǎo)向[2]。2015年修訂的《普通高等學(xué)校高等職業(yè)教育(專科)專業(yè)目錄》在進(jìn)行專業(yè)劃分和調(diào)整時(shí),原則上專業(yè)大類對應(yīng)產(chǎn)業(yè),專業(yè)類對應(yīng)行業(yè),專業(yè)對應(yīng)崗位群[3]。然而職業(yè)技術(shù)學(xué)院在制訂專業(yè)的人才培養(yǎng)方案時(shí),要比較準(zhǔn)確地把握某一類別崗位的能力需求特征又存在一定的難度,傳統(tǒng)上都是使用問卷調(diào)查和專家訪談等方法。這些方法存在樣本小、費(fèi)時(shí)費(fèi)力等缺點(diǎn),并且調(diào)研結(jié)果往往具有較大的局限性。
世界銀行旗下的研究機(jī)構(gòu)Education Global Practice Group在其《走向勞動(dòng)力市場政策2.0》一文中提出了利用大數(shù)據(jù)來實(shí)現(xiàn)“需求驅(qū)動(dòng)的職業(yè)能力培養(yǎng)”的思想,該文作者Nomura等通過對互聯(lián)網(wǎng)上的招聘信息進(jìn)行文本分析,更加深入地了解企業(yè)對員工的職業(yè)能力的需求[4]。后續(xù)的研究與之類似,都把重點(diǎn)放在如何利用大數(shù)據(jù)獲取需求上,鮮有進(jìn)一步探討需求怎樣驅(qū)動(dòng)職業(yè)能力的培養(yǎng)。
本文將這種基于大數(shù)據(jù)的方法用于輔助職業(yè)技術(shù)學(xué)院制訂專業(yè)的人才培養(yǎng)方案,幫助他們“主動(dòng)適應(yīng)、服務(wù)發(fā)展”[2],特別是當(dāng)這些專業(yè)面向的是新興或快速發(fā)展的產(chǎn)業(yè)時(shí)。本文的方法由兩部分組成,第一部分是從互聯(lián)網(wǎng)上海量的招聘信息中獲取某一類別崗位的能力需求特征;第二部分是在制訂人才培養(yǎng)方案時(shí)遵循崗位類別—能力需求特征—知識(shí)結(jié)構(gòu)、能力結(jié)構(gòu)和素質(zhì)結(jié)構(gòu)的路徑來設(shè)計(jì)培養(yǎng)目標(biāo)和培養(yǎng)規(guī)格,從而實(shí)現(xiàn)需求驅(qū)動(dòng)的職業(yè)能力的培養(yǎng)。
本文首先對相關(guān)研究進(jìn)行文獻(xiàn)回顧,然后詳細(xì)介紹本文提出的方法,接下來分析軟件技術(shù)專業(yè)所針對的崗位類別(軟件工程師)的能力需求特征,并且對四川交通職業(yè)技術(shù)學(xué)院制訂的人才培養(yǎng)方案進(jìn)行修訂,結(jié)果表明我們的方法具有相當(dāng)程度的實(shí)用性,最后,進(jìn)行總結(jié)和展望。
與在報(bào)紙上刊登招聘廣告不同,企業(yè)在招聘網(wǎng)站發(fā)布信息不需要按字付費(fèi),這樣就能夠更詳細(xì)地反映它們要求的技能[5]?;ヂ?lián)網(wǎng)上的招聘信息不僅樣本量大,還具有實(shí)時(shí)性和動(dòng)態(tài)性,因此能夠用來分析那些傳統(tǒng)數(shù)據(jù)無法分析的問題[6]。數(shù)據(jù)的獲取也更加靈活、快速、簡單和低廉[7]。
C h a n等從1 9 9 9年5月~2 0 0 0年1月在australianjobsearch.com上抓取與電子商務(wù)有關(guān)的招聘信息,通過描述性統(tǒng)計(jì)分析闡述了不同崗位類別的職責(zé)和需要掌握的技能[8]。Wade等同時(shí)在兩家貿(mào)易雜志和五家招聘網(wǎng)站上共抓取了800個(gè)招聘信息,其崗位類別為網(wǎng)站管理員。采用內(nèi)容分析法得到的結(jié)果顯示企業(yè)對該崗位類別的技能要求是多層面的,包括專業(yè)技能和組織技能,而且對專業(yè)技能的要求高于對組織技能的要求[9]。這兩個(gè)研究比較類似,都是采用人工的方法對招聘信息的文本進(jìn)行分析。
Capiluppi等認(rèn)為,企業(yè)希望員工具備的不是籠統(tǒng)的IT技能,而是像“Java、.NET、C++”這樣具體的技能。他們從monster. com上抓取了48000個(gè)與IT有關(guān)的招聘信息,接著從招聘信息中抽取出崗位需求,然后使用一個(gè)專業(yè)術(shù)語詞典和一系列正則表達(dá)式識(shí)別出30個(gè)最常出現(xiàn)的詞[10]。
Wowczko著重描述了利用大數(shù)據(jù)進(jìn)行分析的步驟。他從2014年1月~2014年12月在irishjobs.ie上抓取了7090個(gè)與IT有關(guān)的招聘信息。在經(jīng)過一系列數(shù)據(jù)預(yù)處理后分別得到了崗位名稱和崗位需求兩個(gè)語料庫,接下來在文本分析時(shí)首先把崗位名稱語料庫中最常出現(xiàn)的詞挑選出來作為崗位類別,然后在崗位需求語料庫中增加一個(gè)標(biāo)簽列,該列的值來自于崗位名稱語料庫,但是根據(jù)崗位類別進(jìn)行了合并和去重。就這樣確定了崗位需求語料庫中4755個(gè)的類別,接下來利用K-最近鄰分類算法對剩下的2228個(gè)進(jìn)行分類。最后得到了7個(gè)不同類別崗位的前20個(gè)常用技能。Wowczko認(rèn)為,只使用崗位名稱存在不少局限,好的方法是同時(shí)利用崗位需求中豐富的信息[11]。
為了理解大數(shù)據(jù)的技能需求,Mauro等從dice.com上抓取了包含 “big data”的2786個(gè)招聘信息。在進(jìn)行文本分析時(shí),首先把崗位名稱語料庫中相鄰的兩個(gè)詞(Bigram)按照頻次排序,再由專家評(píng)選,確定4個(gè)崗位群(例如數(shù)據(jù)科學(xué)家崗位群包括了數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和數(shù)據(jù)分析師3個(gè)崗位)。然后建立隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型對崗位需求語料庫進(jìn)行聚類,得到了9個(gè)技能組(例如項(xiàng)目管理技能組包括了風(fēng)險(xiǎn)管理、計(jì)劃等技能)。最后通過模型分析崗位群與技能組的相關(guān)性,揭示出9個(gè)技能組在每個(gè)崗位群中的重要程度[12]。
Nomura等認(rèn)為企業(yè)很少直接詢問求職者有關(guān)非認(rèn)知技能的問題,因?yàn)槿狈饬窟@些技能的客觀標(biāo)準(zhǔn)。但是在對專家進(jìn)行訪談或做問卷調(diào)查時(shí),可以了解到他們存在這種需求。而分析招聘信息可以得到對需求的更準(zhǔn)確的描述[4]。
由于缺乏數(shù)據(jù),國內(nèi)的研究還處于探索階段。程茜等從校園網(wǎng)獲取招聘信息,由于招聘信息是以文本的形式發(fā)布,所以他們采用人工的方法對其進(jìn)行分析[13]。鐘曉旭等使用網(wǎng)絡(luò)爬蟲從“新安人才網(wǎng)”抓取招聘信息,但他們只對崗位類別、學(xué)歷等屬性進(jìn)行了分析[14]。只有彭金蓮等對招聘信息中的崗位需求進(jìn)行了文本分析,但從中只識(shí)別出40個(gè)與網(wǎng)絡(luò)工程有關(guān)的術(shù)語[15]。
要獲取崗位的能力需求特征,關(guān)鍵是對招聘信息進(jìn)行文本分析。有關(guān)步驟如圖1所示。
圖1 獲取崗位的能力需求特征的步驟
1. 抓取招聘信息
為了從互聯(lián)網(wǎng)上抓取招聘信息,我們開發(fā)了網(wǎng)絡(luò)爬蟲系統(tǒng)。這個(gè)系統(tǒng)可以定時(shí)到招聘網(wǎng)站下載網(wǎng)頁,然后對網(wǎng)頁進(jìn)行解析,從中抽取出招聘信息。
一條招聘信息中包含了崗位名稱、崗位類別、公司名稱、公司性質(zhì)、公司規(guī)模、所屬行業(yè)、招聘人數(shù)、發(fā)布日期、崗位職責(zé)和崗位需求等屬性,其中的崗位名稱和崗位需求都是文本,需要進(jìn)行下面的數(shù)據(jù)預(yù)處理。
2. 數(shù)據(jù)預(yù)處理
(1)中文分詞
在進(jìn)行文本分析前,需要進(jìn)行中文分詞。本文選擇的是IKAnalyzer,在分詞的同時(shí)進(jìn)行了大小寫轉(zhuǎn)換。
(2)拼寫檢查
崗位需求中常常會(huì)出現(xiàn)拼寫錯(cuò)誤的詞,本文采用編輯距離算法來發(fā)現(xiàn)這些錯(cuò)誤的詞。
(3)同義詞替換
在糾正了拼寫錯(cuò)誤后,還要進(jìn)行同義詞替換可以降低數(shù)據(jù)的維度。
經(jīng)過以上預(yù)處理,就得到了崗位名稱語料庫和崗位需求語料庫。這兩個(gè)語料庫分別有兩列,一列是ID,代表招聘信息;另一列是崗位名稱或崗位需求在預(yù)處理后的文本。
3. 文本分析
(1)打標(biāo)簽
把崗位名稱語料庫中的所有詞按照頻次排序,再由專家評(píng)選,確定崗位類別。接下來在崗位需求語料庫中增加一個(gè)標(biāo)簽列,該列的值來自于崗位名稱語料庫,但是根據(jù)崗位類別進(jìn)行了合并和去重。標(biāo)簽列的值可能有多個(gè),也可能沒有。
(2)建立PLDA模型
招聘網(wǎng)站上的招聘信息都有崗位類別這個(gè)屬性,但是不夠精確。例如,崗位類別為軟件工程師的招聘信息,其崗位名稱可以具體為Java軟件工程師。所以,我們認(rèn)為崗位類別應(yīng)該進(jìn)一步細(xì)分。
在上面打標(biāo)簽之后,崗位需求語料庫中保存的是帶標(biāo)簽的預(yù)處理后的文本,這樣就可以采用有監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)分類算法來得到不同類別的崗位對應(yīng)的能力需求特征。由于一個(gè)招聘信息可能同時(shí)針對多個(gè)類別的崗位,所以這是一個(gè)多標(biāo)簽分類問題。而主題模型(Topic Model)就是一種多標(biāo)簽分類的概率生成模型。
主題模型的起源是隱性語義分析(Latent Semantic Analyzing,LSA)/隱性語義索引(Latent Semantic Indexing,LSI)。在LSA/LSI的基礎(chǔ)上,Hofmann提出了概率隱性語義索引(probabilistic Latent Semantic Indexing,pLSI),該模型被看成是第一個(gè)真正意義上的主題模型。而Blei等人提出的LDA則在pLSI的基礎(chǔ)上進(jìn)行了擴(kuò)展,得到一個(gè)更為完全的概率生成模型。
主題模型中的一個(gè)重要假設(shè)是詞袋(bag of words)假設(shè),文本被看作是無序的詞集合,忽略語法甚至是詞的順序,其維度可能是數(shù)萬。通過模型的訓(xùn)練,最終聚類得到K個(gè)主題[16]。
LDA本質(zhì)上是一種無監(jiān)督的機(jī)器學(xué)習(xí)模型,將高維詞空間表示為低維主題空間,忽略了跟文本相關(guān)的標(biāo)簽信息[17]。由于LDA模型僅是一個(gè)數(shù)據(jù)降維和聚類算法,所以經(jīng)常產(chǎn)生不可解釋的主題。如果強(qiáng)行將這些主題與文本的標(biāo)簽進(jìn)行匹配會(huì)造成類別判定的精度下降[18]。因此,為了解決分類等有監(jiān)督機(jī)器學(xué)習(xí)問題,人們開始研究有監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)的LDA模型[19]。
半附加類別標(biāo)簽的主題模型(Partially Labeled Dirichlet Allocation,PLDA)就是其中的一個(gè)。PLDA與LDA的區(qū)別在于,在訓(xùn)練模型時(shí)只使用那些與文本可觀察的標(biāo)簽集相對應(yīng)的主題[20]。除此之外,還假設(shè)有一個(gè)共享的、全局的潛在(Latent)主題,它與任何現(xiàn)有的標(biāo)簽沒有關(guān)聯(lián),是作為針對所有文本的背景標(biāo)簽存在的[21]。
我們把能力需求特征區(qū)分為知識(shí)、技能(比如學(xué)習(xí)能力、解決問題的能力、表達(dá)能力等)和素質(zhì)(比如責(zé)任心、積極等),文獻(xiàn)回顧中提到的組織技能、非認(rèn)知技能都屬于這里的技能。
針對某些崗位類別,對技能和素質(zhì)的要求是大同小異的。本文基于PLDA模型對招聘信息進(jìn)行文本分析的原因在于,希望用這樣一個(gè)共享的、全局的潛在(Latent)主題來描述共同的技能和素質(zhì)。
我們的做法是使用帶有標(biāo)簽的預(yù)處理后的文本訓(xùn)練PLDA模型,建立起主題與標(biāo)簽之間的一一映射的關(guān)系,獲得主題-詞矩陣和文本-主題矩陣。由于每個(gè)主題的種子詞反映了能力需求,所以我們可以得到特定類別的崗位的能力需求特征。
(3)特征重排序
在上面的主題-詞矩陣中,可以發(fā)現(xiàn)有的詞在各個(gè)主題中出現(xiàn)的概率都很高。TF-IDF認(rèn)為,詞的重要性隨著它在文本中出現(xiàn)的次數(shù)成正比增加,但同時(shí)會(huì)隨著它在語料庫中出現(xiàn)的頻率成反比下降。所以,需要使用TF-IDF對主題-詞矩陣進(jìn)行重排序。計(jì)算公式如為[22~24]:
經(jīng)過重排序后,我們選擇每個(gè)主題的前20個(gè)詞作為種子詞,它們就是特定類別崗位的能力需求特征。
人才培養(yǎng)方案是根據(jù)專業(yè)培養(yǎng)目標(biāo)和培養(yǎng)規(guī)格所制定的實(shí)施人才培養(yǎng)活動(dòng)的具體方案。傳統(tǒng)上要確定培養(yǎng)目標(biāo)和培養(yǎng)規(guī)格,或者是廣泛開展企業(yè)調(diào)研,對接職業(yè)標(biāo)準(zhǔn),或者是深入開展校企合作,召開實(shí)踐專家研討會(huì)。而本文提出的需求驅(qū)動(dòng)的職業(yè)能力培養(yǎng)則是在獲取某一崗位類別的能力需求特征后,遵循崗位類別—能力需求特征—知識(shí)結(jié)構(gòu)、能力結(jié)構(gòu)和素質(zhì)結(jié)構(gòu)的路徑來設(shè)計(jì)培養(yǎng)目標(biāo)和培養(yǎng)規(guī)格,具體結(jié)構(gòu)如圖2所示。
圖2 需求驅(qū)動(dòng)的職業(yè)能力培養(yǎng)
在明確培養(yǎng)目標(biāo)時(shí),關(guān)鍵是找準(zhǔn)專業(yè)人才培養(yǎng)所針對的崗位類別。這是一個(gè)反復(fù)斟酌的過程,當(dāng)職業(yè)技術(shù)學(xué)院本身的師資條件滿足不了時(shí),需要重新選擇崗位類別。
一旦確定崗位類別,就可以按照其能力需求特征設(shè)計(jì)培養(yǎng)規(guī)格—根據(jù)知識(shí)設(shè)計(jì)知識(shí)結(jié)構(gòu),根據(jù)技能設(shè)計(jì)能力結(jié)構(gòu),根據(jù)素質(zhì)設(shè)計(jì)素質(zhì)結(jié)構(gòu)。
培養(yǎng)目標(biāo)與培養(yǎng)規(guī)格解決了“培養(yǎng)什么樣的人”的問題,而課程體系則是他們的具體化。接下來,職業(yè)技術(shù)學(xué)院可以圍繞培養(yǎng)規(guī)格構(gòu)建課程體系,解決“如何培養(yǎng)”的問題。
下面本文以一個(gè)實(shí)際的案例具體說明如何利用大數(shù)據(jù)實(shí)現(xiàn)需求驅(qū)動(dòng)的職業(yè)能力培養(yǎng)。
2016年3月6日我們使用網(wǎng)絡(luò)爬蟲系統(tǒng)從前程無憂抓取了40000條招聘信息,其中崗位類別為軟件工程師的有1236條。經(jīng)過數(shù)據(jù)預(yù)處理,得到了1027條招聘信息的崗位名稱語料庫和崗位需求語料庫。
在文本分析時(shí),首先是打標(biāo)簽。崗位需求語料庫的1027個(gè)文本中,738個(gè)有標(biāo)簽,289個(gè)沒有標(biāo)簽。接下來,使用帶有標(biāo)簽的738個(gè)文本訓(xùn)練PLDA模型。標(biāo)簽的種類為30個(gè),但在PLDA模型的參數(shù)設(shè)置時(shí)指定過濾掉只在很少的(<10)文本中出現(xiàn)的標(biāo)簽,最后實(shí)際用到的標(biāo)簽是11種,即.net、java、php、前端、android、c、ios、c++、測試、嵌入式、大數(shù)據(jù)。這些標(biāo)簽對應(yīng)了PLDA模型中的11個(gè)主題。
重排序后得到的11個(gè)主題的種子詞就是崗位類別為軟件工程師的11個(gè)方向的能力需求特征。下面我們使用詞云對共同的技能和素質(zhì)、Java方向、前端方向和Android方向進(jìn)行可視化。
正如前面指出,軟件工程師有一些共同的技能和素質(zhì)需求,包含在一個(gè)共享的、全局的潛在(Latent)主題中——比如學(xué)習(xí)、溝通、經(jīng)驗(yàn)、獨(dú)立工作、撰寫文檔、分析問題、英語、管理、協(xié)調(diào)等技能和團(tuán)隊(duì)精神、責(zé)任心、合作、積極、嚴(yán)謹(jǐn)、踏實(shí)等素質(zhì)。另外,還有l(wèi)inux、操作系統(tǒng)、java、數(shù)據(jù)庫、互聯(lián)網(wǎng)等知識(shí),這些知識(shí)往往代表了一個(gè)方向或是很多方向共同要求的,如圖3所示。
Java方向的基礎(chǔ)是java,框架選擇j2ee(實(shí)際上是架構(gòu))或開源的struts、spring、hibernate(持久層也可以是mybatis、ibatis),數(shù)據(jù)庫以oracle和mysql為主,web服務(wù)器常用tomcat或jboss,服務(wù)器端腳本語言是jsp,servlet用于開發(fā)擴(kuò)展web服務(wù)器的應(yīng)用程序,如圖4所示。
前端方向與web開發(fā)密切相關(guān),前端的基礎(chǔ)是javascript、html、css,處理各種瀏覽器的兼容性是一個(gè)重要的方面,并且要懂布局優(yōu)化,流行的框架有jquery、bootstrap和angularjs,ajax使網(wǎng)頁實(shí)現(xiàn)異步更新,node.js讓javascript運(yùn)行在服務(wù)器端,dom是w3c組織推薦的處理xml的標(biāo)準(zhǔn)編程接口,前端多應(yīng)用于網(wǎng)站等,注重用戶體驗(yàn),了解微信開發(fā)更佳,如圖5所示。
圖3 共同的技能和素質(zhì)
圖4 Java方向
圖5 前端方向
Android方向需要有c和c++基礎(chǔ),了解網(wǎng)絡(luò)以及tcp/ip協(xié)議和http協(xié)議,擅長ui,熟悉架構(gòu),強(qiáng)調(diào)解決問題和按照編碼規(guī)范進(jìn)行開發(fā)。除此之外,android還要求有java基礎(chǔ),懂socket編程,使用jni與其他語言通信,熟悉ndk,了解各種框架,會(huì)動(dòng)畫,能夠獨(dú)立工作,有經(jīng)驗(yàn),善于合作,如圖6所示。
圖6 Android方向
下面根據(jù)以上能力需求特征對四川交通職業(yè)技術(shù)學(xué)院軟件技術(shù)專業(yè)制訂的人才培養(yǎng)方案進(jìn)行修訂。
1. 問題
軟件技術(shù)專業(yè)創(chuàng)建于2003年,是四川交通職業(yè)技術(shù)學(xué)院國家示范重點(diǎn)建設(shè)的專業(yè)之一,該專業(yè)培養(yǎng)學(xué)生的目標(biāo)是成為軟件工程師。表1是針對2017級(jí)和2018級(jí)學(xué)生制訂的人才培養(yǎng)方案中主要就業(yè)的崗位類別、典型工作任務(wù)和核心能力。
表1 主要就業(yè)的崗位類別、典型工作任務(wù)和核心能力
該方案的優(yōu)點(diǎn)是針對崗位類別和強(qiáng)調(diào)核心能力,缺點(diǎn)是核心能力不夠具體。為了將它與軟件工程師的能力需求特征進(jìn)行比較,我們進(jìn)一步研究了人才培養(yǎng)方案中對核心課程的描述,從中發(fā)現(xiàn)要求掌握哪些知識(shí)點(diǎn)。
軟件工程師這個(gè)崗位類別下有11個(gè)方向,如果定位不明確,有可能口徑寬但是針對性不強(qiáng)。就人才培養(yǎng)方案目前實(shí)施的情況,我們選擇Java、前端、Android方向來比較。
圖7是比較的結(jié)果。由于人才培養(yǎng)方案是2015年制訂的,沿用至今。所以,我們可以看到要求掌握的知識(shí)點(diǎn)只占了3個(gè)方向所需要的知識(shí)、技能和素質(zhì)的一小部分,如圖7 中加粗的斜體顯示。
圖7 人才培養(yǎng)方案中的問題
2. 對策
在目前人才培養(yǎng)方案的實(shí)施中,我們也認(rèn)識(shí)到這個(gè)問題,增加了開源的框架struts、spring、hibernate的學(xué)習(xí),數(shù)據(jù)庫一般為mysql,web服務(wù)器常用tomcat。但是,我們的認(rèn)識(shí)仍然與這3個(gè)方向的能力需求特征存在一定的偏差。在以下對人才培養(yǎng)方案的修訂中,我們保留Java和Android方向,舍棄前端方向,然后遵循崗位類別—能力需求特征—知識(shí)結(jié)構(gòu)、能力結(jié)構(gòu)和素質(zhì)結(jié)構(gòu)的路徑來重新設(shè)計(jì)培養(yǎng)目標(biāo)和培養(yǎng)規(guī)格。
培養(yǎng)目標(biāo):軟件工程師崗位類別下的Java和Android方向。
能力需求特征:顯示在圖7 中。
知識(shí)結(jié)構(gòu):根據(jù)圖7揭示出來的Java和Android方向應(yīng)該掌握的知識(shí),我們繪制了圖8的知識(shí)結(jié)構(gòu)(網(wǎng)頁設(shè)計(jì)、系統(tǒng)分析和設(shè)計(jì)以及數(shù)據(jù)結(jié)構(gòu)這3個(gè)知識(shí)是我們增加的)。
能力結(jié)構(gòu):通用能力即圖3中共同的技能—學(xué)習(xí)、溝通、經(jīng)驗(yàn)、獨(dú)立工作、撰寫文檔、分析問題、英語、管理、協(xié)調(diào)等;除了上述通用能力,Android方向的專業(yè)能力更強(qiáng)調(diào)解決問題和按照編碼規(guī)范編程。
素質(zhì)結(jié)構(gòu):團(tuán)隊(duì)精神、責(zé)任心、合作、積極、嚴(yán)謹(jǐn)、踏實(shí)等。
在此基礎(chǔ)上,可以很容易地把圖8中的知識(shí)點(diǎn)轉(zhuǎn)換成相應(yīng)的課程。除了用虛線圈起來的部分(建議設(shè)計(jì)成包含了多個(gè)知識(shí)的課程),其他的方框則可以各自對應(yīng)一門課程。接下來就可以按照內(nèi)在的邏輯順序和學(xué)生認(rèn)知規(guī)律及職業(yè)成長規(guī)律,由淺入深、先易后難、先專項(xiàng)后綜合、循序漸進(jìn)地進(jìn)行排序,構(gòu)建課程體系。第一學(xué)年注重學(xué)生專業(yè)基礎(chǔ)能力培養(yǎng);第二學(xué)年注重學(xué)生專業(yè)能力訓(xùn)練;第三學(xué)年注重學(xué)生職業(yè)綜合能力和創(chuàng)新能力培養(yǎng)。
圖8 崗位類別為軟件工程師(Java和Android方向)的知識(shí)結(jié)構(gòu)
職業(yè)技術(shù)學(xué)院以往在制訂人才培養(yǎng)方案時(shí)需要花費(fèi)大量的人力、物力,而上面的案例展示了大數(shù)據(jù)帶來的好處,方案更令人信服、過程更快速、成本更低。
職業(yè)技術(shù)學(xué)院在修改和更新人才培養(yǎng)方案時(shí),通常小心翼翼、甚至裹足不前,造成的結(jié)果就是人才供給與需求的錯(cuò)配。而本文提出的基于大數(shù)據(jù)的方法,可以幫助職業(yè)技術(shù)院校實(shí)現(xiàn)需求驅(qū)動(dòng)的職業(yè)能力培養(yǎng)。該方法有以下兩個(gè)創(chuàng)新,一是在獲取某一崗位類別的能力需求特征時(shí),基于PLDA模擬對招聘信息進(jìn)行文本分析,同時(shí)對建模結(jié)果進(jìn)行重排序,提高了主題種子詞的準(zhǔn)確性。二是提出了設(shè)計(jì)培養(yǎng)目標(biāo)和培養(yǎng)規(guī)格的新路徑:從崗位類別到能力需求特征,再到知識(shí)結(jié)構(gòu)、能力結(jié)構(gòu)和素質(zhì)結(jié)構(gòu)。本文的案例研究雖然針對的是軟件技術(shù)專業(yè),但是該方法可以方便地推廣到其他專業(yè)。
我們也發(fā)現(xiàn)招聘信息中的崗位職責(zé)能夠反映典型的工作任務(wù),所以我們將來的工作是對崗位職責(zé)進(jìn)行文本分析,這樣就可以通過深入了解典型的工作任務(wù),完善培養(yǎng)規(guī)格中對能力結(jié)構(gòu)的設(shè)計(jì)。今后我們還要繼續(xù)研究如何把基于大數(shù)據(jù)的方法與問卷調(diào)查、專家訪談等傳統(tǒng)方法相結(jié)合,以便更好地為職業(yè)技術(shù)學(xué)院的專業(yè)設(shè)置和建設(shè)提供輔助決策。
[1] 金輝. 《2016全球人力資本報(bào)告》: 第四次工業(yè)革命催生人力資本新需求[N]. 經(jīng)濟(jì)參考網(wǎng), 2016-06-29.
[2] 民政部職業(yè)技能鑒定指導(dǎo)中心(中民民政職業(yè)能力建設(shè)中心). 現(xiàn)代職業(yè)教育體系建設(shè)規(guī)劃(2014-2020年)[N/OL].(2014-06-30). http://jnjd.mca.gov.cn/article/zyjd/zcwj/201406/20140600660060.shtml
[3] 教育部. 普通高等學(xué)校高等職業(yè)教育(專科)專業(yè)目錄(2015年)[N/OL]. (2015-10-26). http://www.moe.edu.cn/srcsite/A07/moe_953/201511/t20151105_217877.html
[4] NOMURA S, IMAIZUMI S, AREIAS A C, et al. Toward Labor Market Policy 2.0: The Potential for Using Online Job-Portal Big Data to Inform Labor Market Policies in India[Z].Policy Research Working Paper, 2017.
[5] GALLIVAN M J, TRUEX D P, KVASNY L. Changing Patterns in IT Skill Sets 1988-2003: A Content Analysis of Classified Advertising[J]. Acm Sigmis Database, 2004, 35(3):64-87.
[6] KUHN P. The Internet as a Labor Market Matchmaker:How Effective are Online Methods of Worker Recruitment and Job Search?[J]. IZA World of Labor, 2014, 18(5): 1-10.
[7] BEBLAVY M, FABO B, LENAERTS K. Skills Requirements for the 30 Most-Frequently Advertised Occupations in the United States: An Analysis Based on Online Vacancy Data[Z]. Ceps Papers, 2016.
[8] CHAN E S K, SWATMAN P M C. Electronic Commerce Careers: A Preliminary Survey of the Online Marketplace[A].Proceedings of the 13th Bled Electronic Commerce Conference[C].Bled, Slovenia: BECC, 2000: 19-21.
[9] WADE M R, PARENT M. Relationships between Job Skills and Performance: A Study of Webmasters[J]. Journal of Management Information Systems, 2002, 18(3): 71-96.
[10] CAPILUPPI A, BARAVALLE A. Matching Demand and Offer in On-line Provision: A Longitudinal Study of Monster.com[C]. 12th IEEE International Symposium on Web Systems Evolution, 2010:13-21.
[11] WOWCZKO I A. Skills and Vacancy Analysis with Data Mining Tech-niques[J]. Informatics, 2015, 2(4): 31-49.
[12] MAURO A D, GRECO M, GRIMALDI M, et al.Beyond Data Scientists: a Review of Big Data Skills and Job Families[C]. Ifkad: International Forum on Knowledge Asset Dynamics, 2016.
[13] 程茜, 易烽, 鄒奕. 數(shù)據(jù)挖掘在高校畢業(yè)生就業(yè)指導(dǎo)上的應(yīng)用[J]. 科技信息, 2012(10): 233-233.
[14] 鐘曉旭, 胡學(xué)鋼. 基于數(shù)據(jù)挖掘的Web招聘信息相關(guān)性分析[J]. 安徽建筑工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版), 2010, 18(4): 93-96.
[15] 彭金蓮, 胡祝華, 鄭兆華, 陳顯毅, 鐘杰卓, 李淑. 網(wǎng)絡(luò)工程專業(yè)“3+1”模塊化課程體系的創(chuàng)新研究[J]. 海南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 31(1): 74-79.
[16] 徐戈, 王厚峰. 自然語言處理中主題模型的發(fā)展[J].計(jì)算機(jī)學(xué)報(bào), 2011, 34(8): 1423-1436.
[17] 張群, 王紅軍, 王倫文. 詞向量與LDA相融合的短文本分類方法[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2016, 32(12): 27-35.
[18] 江雨燕, 李平, 王清. 用于多標(biāo)簽分類的改進(jìn)Labeled LDA模型[J]. 南京大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 49(4): 30-37.
[19] 鄭世卓, 崔曉燕. 基于半監(jiān)督LDA的文本分類應(yīng)用研究[J]. 軟件, 2014(1): 46-48.
[20] RAMAGE D, HALL D, NALLAPATI R, et al. Labeled LDA: A Supervised Topic Model for Credit Attribution in Multi-labeled Corpora[C]. Singapore: Conference on Empirical Methods in Natural Language Processing, 2009: 248-256.
[21] RAMAGE D, MANNING C D, DUMAIS S. Partially Labeled Topic Models for Interpretable Text Mining[C]. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2011: 457-465.
[22] 寇宛秋, 李芳. 基于種子詞匯的話題標(biāo)簽抽取研究[J]. 中文信息學(xué)報(bào), 2013, 27(5): 114-121.
[23] 閆澤華. 基于LDA的新聞線索抽取研究[D]. 上海:上海交通大學(xué), 2012.
[24] SONG Y, PAN S, LIU S, et al. Topic and Keyword Re-ranking for LDA-based Topic Modeling [C]. Hong Kong:ACM Conference on Information and Knowledge Management,2009: 1757-1760.