摘 要:頂崗實習培養(yǎng)職業(yè)學院畢業(yè)生的專業(yè)技能和職業(yè)素養(yǎng),縮小學校教學與用人單位要求,取得了比較好的教育和社會效益。如何將頂崗實習不斷積累的實踐知識進行整理歸類發(fā)掘并運用于學校實踐教學是很重要的。本文以會計畢業(yè)生的頂崗實習數(shù)據(jù)及其相關(guān)的數(shù)據(jù)作為研究對象,利用大數(shù)據(jù)技術(shù)對其進行分析評價,找出將頂崗知識運用于會計教學的方法和途徑。
關(guān)鍵詞:大數(shù)據(jù);頂崗實習;工作單位
1 頂崗實習
頂崗實習是高職學生在最后半年,通過聯(lián)系企業(yè)找到合適的崗位,進行為期近半年的企業(yè)頂崗實習,積累實踐經(jīng)驗的過程。期間學生需要提交相應(yīng)的實習資料比如企業(yè)資料,位置信息等。其中主要需要將學生自己的企業(yè)工作經(jīng)歷經(jīng)驗以每周為單位記錄,然后由企業(yè)和學校老師共同評分,合格學生給予通過該科成績。高職院校的頂崗實習系統(tǒng)一般是第三方公司研發(fā)的,各學校系統(tǒng)平臺不同,但都是幫助學生記錄頂崗實習整個過程,協(xié)助學生完成頂崗實習的要求。
1.1 大數(shù)據(jù)來源及分析整理
我校于2016年開始使用由會計專業(yè)最先使用頂崗實習系統(tǒng),已經(jīng)積累了13和14兩個年級的頂崗實習資料。本文提取的是會計專業(yè)是三年制???3級和14級共200余人次的頂崗實習記錄。采用的數(shù)據(jù)庫軟件微軟sql server和大數(shù)據(jù)編程軟件python。
1.2 頂崗實習產(chǎn)生的數(shù)據(jù)
在頂崗實習過程中,學生在企業(yè)頂崗過程中對專業(yè)的見解、認識、心得等記錄下來,形成實習周志、實習總結(jié)報告等是本文研究的重點。頂崗實習主要產(chǎn)生結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩種類型的數(shù)據(jù)。
1.2.1 非結(jié)構(gòu)化數(shù)據(jù)
周記:學生每周寫一次本周的實習內(nèi)容和心得,學校指導教師進行評價,評分。要求學生總共寫夠18周。寫周記的目的一個是學校老師能夠知道學生在這一周里主要做了些什么工作。同時也是學生進行知識和心理整理的平臺,會被系統(tǒng)保留下來。這些內(nèi)容在系統(tǒng)里面是以文本的形式存儲,是我們分析的主要數(shù)據(jù)。
1.2.2 結(jié)構(gòu)化數(shù)據(jù)
企業(yè)信息:由學生自己錄入系統(tǒng),包括名稱、單位性質(zhì)、行業(yè)、單位類型等信息。企業(yè)信息的錄入能夠確保學校及老師能夠依照學生的資料進行核實,另外一個用途就是為以后的學生提供了頂崗實習的企業(yè)資源。
學生信息:頂崗學生自身信息包括學生自己信息:班級、姓名、性別、學號等。以便確認每一位學生情況。
實習情況信息:實習單位、實習崗位校外教師、校外指導教師電話、薪酬標準、實習性質(zhì)、專業(yè)對應(yīng)、安排方式、是否提前參加實習、是否解鎖實習結(jié)束日期、實習開始日期、實習結(jié)束日期。實習情況信息能夠?qū)γ恳晃粚W生的實習情況進行了解。
2 大數(shù)據(jù)的分析整理過程
這個分析過程大致可以分為三步:第一,系統(tǒng)自動讀入所有數(shù)據(jù),進行python的jieba分詞數(shù)據(jù)清洗,去掉無用的詞語及標點符號。第二,使用LDA主題模型對數(shù)據(jù)進行的語義挖掘。對有用數(shù)據(jù)進行關(guān)聯(lián)分析,分類分析,聚類分析,文本挖掘等。同時為了程序能自動學習,需要人工對示例數(shù)據(jù)分類和有用性標記。第三,系統(tǒng)自動對會計課程的應(yīng)用標記。利用大數(shù)據(jù)的分析判斷,如果是教科書沒有的新認識或者比書上有更深入的理解對該內(nèi)容做“有用”標記。一旦該學生的某條周記被標記為有用就可以針對學生的實習單位,實習工作及所有的周記進行分析,看是否真的確定為該生的此次實習經(jīng)驗對學校教師以后教學對課程標準的制定具有指導意義。如果真的有,那么整理入研究報告做保存歸檔,以便將來使用,這是我們的最終目的。
2.1 數(shù)據(jù)清洗
取的原始記錄共39704條,其中13級10258條,14級29446條。首先對數(shù)據(jù)進行清洗,需要對評論內(nèi)容進行如下的預處理操作:去掉重復數(shù)據(jù),很短的評論數(shù)據(jù),沒有一個“會計”“稅法”“審計”等會計專業(yè)詞匯的,去除停用詞,去除符號和阿拉伯數(shù)字:去除數(shù)據(jù)集中的符號如[!"#$%&\\'()*+,-./:;<=>?@[\\]^_`{|}~]+等以及阿拉伯數(shù)字。同時增加了一個分類的字段,存儲的是需要將學生評論按照會計課程內(nèi)容進行分類,F(xiàn)10是有用性評價,如果評價為有用為“1”否則無用位“0”。在以下表1中給出對每個字段的描述(以SQLSERVER2008為例):
2.2 中文分詞
jieba中文分詞用于中文分詞、詞性標注和關(guān)鍵詞的抽取。有三種模式:第一,將字符串進行最精確地切分的精確模式,它盡可能地獲取所有的分詞可能的全模式;在精確模式獲得的分詞結(jié)果之上,對較長的分詞結(jié)果進行二次切分的搜索引擎模式。同時對于那些不存在于前綴詞典中的未登錄詞,則使用了Viterbi算法構(gòu)建HMM模型,得到最終的切分形式。
3 基于主題模型的語義挖掘
LDA主理模型概念主題是一系列相關(guān)聯(lián)詞語的集合,與主題關(guān)聯(lián)度越高的詞,它歸屬于該主題的可能性越大,也就是數(shù)學條件概率大,所以主題是一種基于詞匯的條件概率分布。一段文本往往包含了多個主題,而主題模型正是針對這些隱含主題構(gòu)建出來的一種建模方法?;谶@樣的思路,文本中每個詞出現(xiàn)的概率可如公式(1)所示:
p(詞語|文本)=S主題P(詞語丨主題)xp(主題|文本)(1)
若表現(xiàn)為矩陣,則是公式(2)所示:
“文本—詞語”矩陣=“主題—詞語”矩陣x“文本—主題”矩陣(2)
其中,“文本—詞語”矩陣為文本中詞出現(xiàn)的概率矩陣,“主題—詞語”矩陣為主題中詞出現(xiàn)的概率矩陣,“文本—主題”矩陣為文本中主題出現(xiàn)的概率矩陣。針對一個己知的文本集,使用分詞工具對文本集中的文本進行分詞操作,基于分詞結(jié)果可以計算出文本中每個詞的詞頻,進而得到概率公式左邊的“文本—詞語”矩陣,而所謂主題模型,就是通過對“文本—詞語”矩陣的訓練學習出“主題—詞語”矩陣和“文本—主題”矩陣,從而獲得文本中的隱含主題信息。
4 數(shù)據(jù)分析結(jié)果
對于學生頂崗有用周記的分類構(gòu)成有如下表2的數(shù)據(jù):
我們通過研究發(fā)現(xiàn)學生頂崗很大部分工作崗位是報稅,對報稅需要加大學習力度。另外出納,審計,電算化等也比較多。這個結(jié)論與實際相符合的,因為對于會計專業(yè)來說內(nèi)容變化更新最多的是稅法知識,所以占的比重最大。
對于學生頂崗所在行業(yè)的統(tǒng)計有如下表3所得的數(shù)據(jù):
從所在行業(yè)來看,商業(yè)、金融業(yè)、制造業(yè)占了吸收學生的前3強。第三產(chǎn)業(yè)對人員的需求強勁,占了三分之一強。
對于學生頂崗單位性質(zhì)的統(tǒng)計有如下表4所得的數(shù)據(jù):
從上表的數(shù)據(jù)可以看出,機關(guān)事業(yè)單位也占了近12%,這個跟我們以前直覺應(yīng)該更低,有一定的不同。
對于學生頂崗單位國企機關(guān)事業(yè)單位學生分布的統(tǒng)計有如下表5所得的數(shù)據(jù):
從上表的數(shù)據(jù)可以看出,(3+2)的學生更能獲得國企機關(guān)事業(yè)單位工作,而統(tǒng)招班學生獲得這樣機會就大大減少。
對于學生頂崗單位性質(zhì)的統(tǒng)計有如下表6所得的數(shù)據(jù):
從上表的數(shù)據(jù)可以看出,校外實訓基地也發(fā)揮了一定的作用。
小結(jié):通過以上數(shù)據(jù)綜合分析,我們可以得到:學生平時所學知識在實際崗位上對學生影響最大的是稅法,因為稅法的實際應(yīng)用最強,對企業(yè)影響也比較大而且經(jīng)常調(diào)整;批發(fā)零售金融是服務(wù)業(yè)需要人員比傳統(tǒng)生產(chǎn)企業(yè)多,在人才培養(yǎng)上需要更多的傾向服務(wù)業(yè)會計業(yè)務(wù)的學習;機關(guān)事業(yè)單位越來越受到(3+2)學生的關(guān)注,在他們的課程設(shè)置上也需要相應(yīng)的涉及;對于統(tǒng)招學生多關(guān)注實際技能的培養(yǎng)。
5 結(jié)論及應(yīng)用
對于最后得到的有用數(shù)據(jù),教研室的老師要進行專門的教研活動,對此結(jié)果進行吸收和提出建議,此建議保留,返回給頂崗分析系統(tǒng)進行改進。對于這些有用的知識,還可以按照不同行業(yè)的特點,對其進行行業(yè)劃分,分行業(yè)進行知識的積累形成知識體系。吸收的知識融入老師平時實訓課的內(nèi)容中,針對高年級學生的綜合實訓課程相關(guān)教師更是應(yīng)該注意學習和吸收里面的新知識,逐步提升會計專業(yè)實踐教學能力。
參考文獻:
[1]陳少烽,高南林.“校中有廠廠中有?!表攳弻嵙暷J匠跆絒J].廣東交通職業(yè)技術(shù)學院學報,2009(01).
[2]陳義.文本挖掘在網(wǎng)購用戶評論中的應(yīng)用研究[D].浙江工商大學碩士論文,2018.
[3]吳俊杰,秦晨.基于文本處理的指標數(shù)據(jù)提取[J].科技創(chuàng)新導報,2019(02).
[4]任之蓉.大數(shù)據(jù)視角下頂崗實習系統(tǒng)評價分析對會計課程的應(yīng)用——以成都農(nóng)業(yè)科技職業(yè)學院為例[J].經(jīng)貿(mào)實踐,2018(14).
作者簡介:任之蓉(1978— ),女,四川西充人,碩士研究生,研究方向:財務(wù)會計。