摘 要:就業(yè)信息系統(tǒng)運(yùn)用到學(xué)生就業(yè)中產(chǎn)生了質(zhì)的飛躍,畢業(yè)生越來越多,就業(yè)壓力也越來越大,在這樣的情況下,系統(tǒng)積聚了大量的信息就業(yè)數(shù)據(jù),以前的統(tǒng)計(jì)學(xué)方法已經(jīng)滿足不了現(xiàn)在的需求。然而數(shù)據(jù)挖掘技術(shù)對(duì)就業(yè)信息的分析有很大的幫助。本文基于數(shù)據(jù)挖掘技術(shù)對(duì)學(xué)生就業(yè)信息分析、處理及有效數(shù)據(jù)的運(yùn)用進(jìn)行研究。從就業(yè)信息分析中,獲取有價(jià)值的數(shù)據(jù),為人才培養(yǎng)、就業(yè)市場(chǎng)、就業(yè)指導(dǎo)等科學(xué)決策打下基礎(chǔ),切實(shí)為學(xué)校辦學(xué)提供有效的數(shù)據(jù)支持。促進(jìn)學(xué)生充分就業(yè)。
關(guān)鍵詞:就業(yè)信息;數(shù)據(jù)分析;挖掘技術(shù);研究
中圖分類號(hào):TP311.13
隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展和數(shù)據(jù)管理的廣泛運(yùn)用,數(shù)據(jù)信息中存在著大量的決策意義,但是數(shù)據(jù)利用很低,局限于就業(yè)率的統(tǒng)計(jì)等。學(xué)生大學(xué)期間,順利就業(yè)是一個(gè)非常重要的環(huán)節(jié)。對(duì)學(xué)生就業(yè)的指導(dǎo)是當(dāng)今學(xué)校所面臨的主要課題。在信息數(shù)據(jù)中找出規(guī)律,直接反映一定時(shí)期內(nèi)的整個(gè)社會(huì)的就業(yè)狀況、職業(yè)動(dòng)態(tài)及其發(fā)展趨勢(shì)。供職業(yè)指導(dǎo)人員指導(dǎo)就業(yè)工作和擇業(yè)者選擇職業(yè)的重要依據(jù)。
1 數(shù)據(jù)挖掘的定義和傳統(tǒng)數(shù)據(jù)的區(qū)別
大量數(shù)據(jù)中挖掘或者提取的知識(shí),也就是說把人們數(shù)據(jù)中潛在隱含的數(shù)據(jù)中有用的信息轉(zhuǎn)化為知識(shí)的過程來運(yùn)用。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析都是查詢、報(bào)表、聯(lián)機(jī)運(yùn)用分析,但是,他們不同的區(qū)別在于沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)信息、發(fā)現(xiàn)其中隱含的知識(shí),所得到的信息應(yīng)該是具體實(shí)用有效的信息。數(shù)據(jù)挖掘通過預(yù)測(cè)未來趁勢(shì)以及行為,做出前瞻的,基于知識(shí)的決策[1]。
2 了解數(shù)據(jù)挖掘的基本步驟
數(shù)據(jù)挖掘的基本步驟主要有以下幾個(gè)方面,分別是收集數(shù)據(jù):收集可以從多個(gè)數(shù)據(jù)源中去收集,并獲取資料,然后對(duì)數(shù)據(jù)進(jìn)行整合;數(shù)據(jù)選擇:分析所有收集到的數(shù)據(jù),并決定選擇數(shù)據(jù)和排除數(shù)據(jù)中無效,無利用價(jià)值的數(shù)據(jù);數(shù)據(jù)清洗:檢查收集的數(shù)據(jù)是否滿足挖掘的條件,目的是將數(shù)據(jù)質(zhì)量提升到符合所選擇的分析的需求上去,從而保證數(shù)據(jù)信息的正確性和一致性;數(shù)據(jù)的轉(zhuǎn)換:將已有的數(shù)據(jù)根據(jù)挖掘信息分析的要求進(jìn)行分析和邏輯性的轉(zhuǎn)換;建立模型:選擇合適的算法進(jìn)行合理而準(zhǔn)確的驗(yàn)證;結(jié)果分析:對(duì)挖掘結(jié)果進(jìn)行解釋與實(shí)際現(xiàn)狀相結(jié)合進(jìn)行可視化的分析;知識(shí)同化:將分析所得到的知識(shí)集成到就業(yè)信息的運(yùn)用當(dāng)中去,進(jìn)行決策供畢業(yè)生參考。
3 數(shù)據(jù)挖掘中的應(yīng)用
3.1 數(shù)據(jù)挖掘在WEB中的應(yīng)用
數(shù)據(jù)挖掘使用就業(yè)網(wǎng)站功能開發(fā)是通過就業(yè)網(wǎng)頁內(nèi)容的挖掘,主要是針對(duì)文本的內(nèi)容進(jìn)行挖掘,實(shí)現(xiàn)對(duì)網(wǎng)頁內(nèi)容的聚類整合,達(dá)到對(duì)就業(yè)信息的分類瀏覽和檢索[2]。對(duì)用戶所提的問題和歷史的記錄進(jìn)行有效的分析擴(kuò)展,從而提高檢索的效率性。運(yùn)用數(shù)據(jù)的挖掘技巧進(jìn)行關(guān)鍵詞改進(jìn)和加權(quán)算法,這樣就可提高就業(yè)信息的傳播效果。利用數(shù)據(jù)挖掘的技術(shù)效果建立更深的訪客量并加以進(jìn)行精準(zhǔn)的預(yù)測(cè)模式,從而達(dá)到真正智能型的個(gè)性化網(wǎng)絡(luò)服務(wù)。
數(shù)據(jù)的收集是一個(gè)比較復(fù)雜的過程所涉及的東西也比較廣泛,這對(duì)于就業(yè)信息的挖掘是一件比較困難的事情,從而我們就要學(xué)會(huì)應(yīng)用數(shù)據(jù)應(yīng)用流程,掌握挖掘的流程并學(xué)會(huì)運(yùn)用。數(shù)據(jù)挖掘流程應(yīng)用流程如圖1所示。
圖1 數(shù)據(jù)挖掘流程圖
這一流程圖有利于針對(duì)就業(yè)問題的提出問題進(jìn)行分析,從而發(fā)現(xiàn)學(xué)生整體就業(yè)情況和學(xué)生的成績(jī)、專業(yè)、區(qū)域等相關(guān)信息數(shù)據(jù)的關(guān)聯(lián)。為數(shù)據(jù)準(zhǔn)備打下基礎(chǔ),根據(jù)不同的數(shù)據(jù)可以顯示不同的問題,采用數(shù)據(jù)倉庫進(jìn)行選擇,通過選擇、抽樣和匯總等方式來選擇符合就業(yè)條件的子集,最終建構(gòu)特定的數(shù)據(jù)庫挖掘。
3.2 就業(yè)市場(chǎng)預(yù)測(cè)
數(shù)據(jù)挖掘的主要價(jià)值在于通過數(shù)據(jù)信息從中提取有效的信息內(nèi)容,從中找其規(guī)律,為就業(yè)者提供參考數(shù)據(jù)和借鑒的效果,通過歷史就業(yè)信息數(shù)據(jù)的顯示作為參考,針對(duì)不同專業(yè)的就業(yè)率、升學(xué)率、行業(yè)分布比例、地域分布比例等與其他院校進(jìn)行數(shù)據(jù)上的比較并進(jìn)行就業(yè)形勢(shì)的綜合分析,從中發(fā)現(xiàn)值得總結(jié)的信息。另外對(duì)歷史數(shù)據(jù)的總結(jié)和對(duì)用人單位信息的記錄,對(duì)每年就業(yè)率數(shù)據(jù)的橫向比較,結(jié)合歷史數(shù)據(jù)的縱向比較,通過對(duì)歷年的就業(yè)地域進(jìn)行分析情況及其就業(yè)層次分布情況,從而做到全面的觀察就業(yè)的發(fā)展?fàn)顩r,形成對(duì)市場(chǎng)發(fā)展?fàn)顩r進(jìn)行全面的監(jiān)控,并為今后的工作提供參考數(shù)據(jù)。
3.3 畢業(yè)生分類信息挖掘
由于傳統(tǒng)的數(shù)據(jù)無法滿足大家的需求,所以我們就要對(duì)數(shù)據(jù)進(jìn)行分析提取,學(xué)生數(shù)據(jù)中存在著大量情況,利用這些數(shù)據(jù)結(jié)合當(dāng)今社會(huì)就業(yè)的就業(yè)形勢(shì),以通過數(shù)據(jù)挖掘的技術(shù)對(duì)畢業(yè)生資料進(jìn)行構(gòu)建。統(tǒng)一進(jìn)行數(shù)據(jù)化發(fā)布畢業(yè)信息資料、并針對(duì)性別、專業(yè)、特長(zhǎng)、技能、就業(yè)意向等因素進(jìn)行分門別類,形成一套可視化信息圖系統(tǒng),從而方便用人單位進(jìn)行面向主體的信息抽選,最終提高就業(yè)效率[3]。
3.4 數(shù)據(jù)挖掘中的反饋進(jìn)行教學(xué)改革
學(xué)生的就業(yè)不僅僅就意味著教學(xué)工作的結(jié)束,也是對(duì)教學(xué)工作的最后一次檢驗(yàn)。是通過就業(yè)總結(jié)來發(fā)現(xiàn)教學(xué)中出現(xiàn)的問題,從而分析對(duì)教學(xué)的反饋?zhàn)饔眉畜w現(xiàn)了數(shù)據(jù)的挖掘的教學(xué)價(jià)值和技術(shù)性價(jià)值。
為實(shí)現(xiàn)教學(xué)與人才市場(chǎng)相結(jié)合,從而保證并充分就業(yè),有必要進(jìn)行人才培養(yǎng)模式教學(xué)內(nèi)容、教學(xué)方法和教學(xué)手段進(jìn)行全方位的調(diào)整和改革,進(jìn)行統(tǒng)一和機(jī)制改革[4]。專業(yè)設(shè)置和社會(huì)需求的有機(jī)結(jié)合、社會(huì)適應(yīng)性與崗位針對(duì)性的統(tǒng)一結(jié)合,主動(dòng)學(xué)習(xí)與社會(huì)實(shí)踐的有機(jī)結(jié)合,整體的穩(wěn)定性與適當(dāng)?shù)撵`活性相結(jié)合,建立完善的專業(yè)預(yù)警制度。
4 數(shù)據(jù)挖掘中應(yīng)注意的問題
數(shù)據(jù)挖掘的目的是把隱含的一大批看來無用雜亂無章的數(shù)據(jù)集中起來,取其精華,去其糟粕的進(jìn)行合理的運(yùn)用與判斷。在實(shí)際運(yùn)用中,進(jìn)行數(shù)據(jù)挖掘并做出準(zhǔn)確的判斷。如果信息收集的不全就會(huì)導(dǎo)致部分?jǐn)?shù)據(jù)錯(cuò)誤,影響到分析的情況,這樣就會(huì)違背數(shù)據(jù)挖掘的原則[5]。因此就要實(shí)現(xiàn)數(shù)據(jù)的科學(xué)化、專業(yè)化,但是在這個(gè)的前提條件下還需要注意幾個(gè)小問題。(1)確保決策的目標(biāo)性和科學(xué)性。決策目標(biāo)是指在一定的環(huán)境下和內(nèi)部條件下,在市場(chǎng)調(diào)查和研究中的基礎(chǔ)上要預(yù)測(cè)出所要達(dá)到的效果、目的。(2)合理的進(jìn)行數(shù)據(jù)的維護(hù),數(shù)據(jù)挖掘得到的結(jié)果全部靠數(shù)據(jù)的提供,由于數(shù)據(jù)結(jié)構(gòu)的復(fù)雜性,因此對(duì)數(shù)據(jù)挖掘要進(jìn)行探索、分析變量、這樣就可解決問題。分析數(shù)據(jù)中隱含的趁勢(shì),在具體的就業(yè)數(shù)據(jù)分析中要對(duì)這個(gè)趁勢(shì)進(jìn)行應(yīng)有的考慮看其是否有探討價(jià)值并進(jìn)行評(píng)價(jià)。(3)進(jìn)行科學(xué)的抽樣,面對(duì)如此龐大而復(fù)雜的數(shù)據(jù),只能對(duì)數(shù)據(jù)進(jìn)行抽樣選取,并進(jìn)行探討分析,不同的人對(duì)同樣的數(shù)據(jù)進(jìn)行分析會(huì)產(chǎn)生不一樣的結(jié)果,將大家的數(shù)據(jù)進(jìn)行綜合才可進(jìn)行保障就業(yè)的可靠性。(4)注重?cái)?shù)據(jù)的私有,安全性、以及專業(yè)性,數(shù)據(jù)在挖掘的過程中要涉及到數(shù)據(jù)的私有安全和安全度,數(shù)據(jù)挖掘的結(jié)果是不確定性的,要和專業(yè)知識(shí)相結(jié)合才可確保數(shù)據(jù)提供的準(zhǔn)確內(nèi)容。
5 結(jié)論
數(shù)據(jù)挖掘技術(shù)的應(yīng)用在不斷的擴(kuò)展中,也受到了學(xué)術(shù)界的廣泛運(yùn)用,當(dāng)前的就業(yè)形勢(shì)越來越嚴(yán)峻,尤其是針對(duì)應(yīng)屆畢業(yè)生,將數(shù)據(jù)挖掘運(yùn)用到就業(yè)信息分析上,可以給就業(yè)者提供準(zhǔn)確的就業(yè)內(nèi)容,減少就業(yè)者從業(yè)的盲目性,促進(jìn)教育、就業(yè)、社會(huì)三者關(guān)系的有機(jī)融合,從而達(dá)到可持續(xù)發(fā)展。數(shù)據(jù)挖掘技術(shù)要想得到有效的運(yùn)用,就必須掌握其內(nèi)涵,分析數(shù)據(jù)的技巧,從而能夠更好的為學(xué)生服務(wù)。
參考文獻(xiàn):
[1]王曉燕,何月順,楊文強(qiáng).基于數(shù)據(jù)挖掘技術(shù)的高校教學(xué)方法研究[J].科技經(jīng)濟(jì)市場(chǎng),2009(02).
[2]董蕓.數(shù)據(jù)挖掘與統(tǒng)計(jì)分析[J].統(tǒng)計(jì)與決策,2010(09).
[3]陳樹冬.論開拓高校畢業(yè)生就業(yè)市場(chǎng)[J].經(jīng)濟(jì)研究導(dǎo)刊,2011(19).
[4]康振華,周金剛.數(shù)據(jù)挖掘在高校就業(yè)工作建設(shè)中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī),2009(05).
[5]辛立章,陳春香.數(shù)據(jù)挖掘技術(shù)在高校畢業(yè)生就業(yè)指導(dǎo)中的應(yīng)用[J].電腦知識(shí)與技術(shù)(學(xué)術(shù)交流),2007(13).