劉赟
摘要:隨著教育體制的改革,國家對職業(yè)教育的發(fā)展更加重視。為了滿足社會上對職業(yè)技能人才的需求,職業(yè)院校與社會企業(yè)之間建立的共同教育的模式,通過校企合作來為學生提供更多的實訓機會?;谠萍夹g開發(fā)的實訓云平臺,能夠為職業(yè)教育提供新的教學方式,通過實訓云平臺的開發(fā)與設計,優(yōu)化數(shù)據(jù)挖掘算法,提高實訓管理水平。
關鍵詞:職業(yè)教育;實訓云平臺;開發(fā);算法
在職業(yè)教育的實訓管理中,需要綜合考慮到院校方面、學生方面以及企業(yè)方面的需求,在設計開發(fā)實訓云平臺時,要堅持校企教育的實踐性,強化實訓信息的統(tǒng)一管理,并以實訓云平臺為紐帶,增強職業(yè)院校、學生以及企業(yè)的溝通,也讓職業(yè)院校能夠更加全面準確地評估實訓效果。
1基于實訓云平臺系統(tǒng)開發(fā)設計
1.1院系管理模塊設計
基于實訓云平臺的開發(fā),需要在職業(yè)學校統(tǒng)一管理下,構建起有效的運行模式。由于現(xiàn)代職業(yè)教育發(fā)展中,校企合作發(fā)揮著重要的作用,在安排學生開展實訓時,學校教務負責人,要對整個實訓過程進行全面的了解和掌握,才能夠更加深入地評價整個實訓過程的效果,以便職業(yè)院??梢苑e累實訓經驗,提高實訓管理水平,完善實訓管理機制,為學生提供積極有效的實訓指導[1]。在院系管理模塊設計中,需要從學生實訓的目標以及流程的角度,去安排實訓方案,如學生實訓的條件、環(huán)境、壓力以及后續(xù)的合同簽訂等,這些都是院系管理模塊所必須包括的內容。
1.2學生實訓模塊設計
1.2.1學生實訓云報名
實訓云平臺的主要服務對象是職業(yè)院校的學生,因此在學生實訓模塊設計中,應當以學生需求為核心,從學生報名到學生參與實訓,以及最后的學生實訓成績等方面,要通過詳細的實訓業(yè)務流程來進行說明和指導,如讓學生在實訓云平臺上先詳細查詢并了解企業(yè)的相關信息,在選擇適當?shù)膶嵱柶髽I(yè)后,再選擇實訓崗位,最后進行實訓報名及確認[2]。
1.2.2 學生實訓的云平臺管理
學生實訓模塊設計,還要綜合考慮到實訓報告管理、實訓質量評估、實訓問題交流等內容。在實訓報告的管理中,應當能夠為學生提供實訓報告模塊,學生根據(jù)自身的實訓情況,對實訓環(huán)節(jié)進行闡述,并對實訓結論進行總結。學生實訓模塊中的實訓報告,可以在云平臺上進行錄入和提交,而實訓老師則可以在云平臺上瀏覽學生的實訓報告,并進行評價打分,學生的實訓報告以及評分會統(tǒng)一存儲于云平臺中,以便后期對學生進行數(shù)據(jù)分析實現(xiàn)綜合評定[3]。
1.3信息云公告模塊設計
實訓云平臺的信息云公告模塊設計,需要具備及時性,能夠將職業(yè)院校以及企業(yè)需要發(fā)布的信息,及時準確地呈現(xiàn)在實訓云平臺上,使學生能夠了解最新的實訓信息。在信息云公告發(fā)布前,需要提前創(chuàng)建好信息模板[5]。信息云公告模塊設計中,應當能夠提高信息發(fā)布時間的選擇功能,在系統(tǒng)中設定發(fā)布日期、公告性質等,并面向所有的實訓參與者。
2校企合作模式下的實訓云平臺功能實現(xiàn)
2.1實訓云平臺服務器環(huán)境
校企合作模式下的實訓云平臺,需要有一個基于互聯(lián)網的服務器集群,能夠完成平臺上的邏輯處理指令。根據(jù)實訓云平臺服務器類型,可以分為集群化云服務器和數(shù)據(jù)庫服務器。云服務器作為主要的實訓信息處理核心,應能具有操作系統(tǒng)以及數(shù)據(jù)庫的信息調用能力,并通過代碼解析來完成數(shù)據(jù)處理。
2.2實訓云平臺各功能實現(xiàn)
2.2.1實訓云平臺登錄功能實現(xiàn)
在實訓平臺管理中,擁有登錄權限的使用者,需要向平臺系統(tǒng)提出登錄申請。登錄申請轉化為指令形式后,傳輸至服務器。服務器會根據(jù)預先設置的參數(shù),對申請進行判斷。如果申請信息包含了參數(shù)中沒有的內容,那么請求會被拒絕,反之申請會被接受,用戶即可進入實訓平臺系統(tǒng)。
2.2.2 實訓云平臺信息功能實現(xiàn)
職業(yè)院校在校企合作中,主要是將企業(yè)所提供的實訓崗位信息等,錄入到平臺上以供學生進行選擇,并將學生的實訓信息反映在平臺上。實訓云平臺功能實現(xiàn),將建立數(shù)據(jù)信息之間的連接,通過將操作代碼附加在動態(tài)數(shù)據(jù)之上。在實訓信息構建中,通過系統(tǒng)參數(shù)和查詢對象的對應關系,可以對學生實訓的信息進行編輯和存儲。
3實訓云平臺數(shù)據(jù)挖掘的算法優(yōu)化
3.1實訓云平臺數(shù)據(jù)挖掘的作用
3.1.1 概念描述
并非對數(shù)據(jù)進行簡單枚舉,而是泛化數(shù)據(jù)的一種形式。通過采用準確的、匯總的及精煉的模式對數(shù)據(jù)進行描述。
3.1.2關聯(lián)分析
通常情況下,數(shù)據(jù)倉庫中各種數(shù)據(jù)都存在一定的關聯(lián)關系,這些管理常常錯綜復雜,乃至蘊藏在表層信息之下。通過關聯(lián)分析發(fā)掘各數(shù)據(jù)間各類隱含的信息,就能夠有效提升數(shù)據(jù)的利用價值。對事務數(shù)據(jù)庫實施關聯(lián)規(guī)則挖掘時,用戶合理設置挖掘參數(shù),就可從大量數(shù)據(jù)中挖掘出有價值的數(shù)據(jù)項之間的相關關系,從而分析出一些蘊藏的有用信息。
3.1.3 分類與預測
分類目標就是建立具有區(qū)分數(shù)據(jù)庫且給予描述的模型,以此對未知對象類進行區(qū)分與標記。通過分析或者使用訓練集建立一個描述,對數(shù)據(jù)或概念進行預先定義,然后采用分類器對未知數(shù)據(jù)類進行分析。
3.2 K-means算法的優(yōu)化
數(shù)據(jù)挖掘有多種算法方式,主要有K-means、KNN、EM及Naive Bayes等各種算法,在這些算法中,K-means屬于最經典更是使用最廣泛的方法。因此,本文選用K-means算法的優(yōu)化進行研究具有代表性。
傳統(tǒng)K-means算法運行過程中,用戶要提前提供出聚類數(shù)目K,通常情況下,需要針對相關數(shù)據(jù)的分析結果及經驗,確定一個比較合適的k值,如果先驗經驗缺失,可以交叉驗證的方式確定k值。
待k值個數(shù)確定之后,應當選擇k個初始化質心??紤]到本研究中用到的是啟發(fā)式的方法,因此運行時間及最后的聚類結果將會受到相關數(shù)量初始化質心具體位置的影響。因此,要對質心數(shù)量k的合理性進行評估,并且確保相關質心不能過近。
以傳統(tǒng)的K-Means算法流程來看:
首先輸入樣本集D={x1,x2,...,xm}D={x1,x2,...,xm},其中最大迭代次數(shù)為N,聚類的簇樹為k,再輸出簇劃分C={C1,C2,...,Ck}C={C1,C2,...,Ck}
1)在數(shù)據(jù)集D當中,隨機選擇k個樣本,并以其作為初始的k個質心向量:{μ1,μ2,...,μk}
2)對于n=1,2,...,N
a)將簇劃分C初始化為Ct=φt=1,2,...,k
b)針對i=1,2,...,m,計算樣本xi與各個質心向量μj(j=1,2,...,k)的距離:dij=∥xi?μj∥2/2;將xi標記最小的為dij所對應的類別λi,此時更新Cλi=Cλi∪{xi}
c)針對j=1,2,...,m,對Cj當中全部樣本點,重新計算新質心μj=1/∣cj∣∑x∈cj
d)在研究當中,若發(fā)現(xiàn)所有k個質心向量都保持不變,則可以進行下一計算環(huán)節(jié)。
3)輸出簇劃分C={C1,C2,...,Ck}C={C1,C2,...,Ck}
3.3 優(yōu)化后的elkan K- Means與Mini Batch K-Means算法
在以往的K-Means算法當中,在每個環(huán)節(jié)迭代時,需要對所有樣本點到質心間的距離進行計算,往往會花費較多的時間和精力。為此,專業(yè)人士致力于尋求更簡便的計算方法,而elkan K-Means算法則是實踐證明比較好用的方法之一,有助于減少冗余的距離計算流程。
具體來講,elkan K-Means在減少距離計算方面,沖利用了以下兩點三角形性質:其一,兩邊之和大于等于第三邊;其二,兩邊之差小于第三邊。該性質的應用,可以有效減少距離的計算流程,達到簡化計算的目的。其主要規(guī)律及原理如下。
規(guī)律一,主要是針對一個樣本點x以及兩個質心μj1,μj2。在計算研究之前,可以先計算出兩個質心的距離:D(j1,j2),在計算期間若發(fā)現(xiàn)2D(x,j1)≤D(j1,j2),便可以分析出以下結論:D(x,j1)≤D(x,j2)。為此,無須再對 D(x,j2)進行計算,減少了計算步驟。
規(guī)律二,主要是針對一個樣本點x以及兩個質心μj1,μj2。通過計算可與得出D(x,j2)≥max{0,D(x,j1)?D(j1,j2)},而該規(guī)律是從三角形任意一邊大于等于其他兩邊之差這一性質中得出的。
根據(jù)以上兩個重要規(guī)律,通過優(yōu)化后的elkan K-Means迭代速度顯然有明顯提升。
顯然,傳統(tǒng)K-Means算法在應用過程當中,計劃計算所有的樣本點到質心的距離時如果發(fā)現(xiàn)樣本量過大,尤其是達到10萬級以上時,顯然傳統(tǒng)的K-Means算法費時費力,同時elkan K-Means優(yōu)化之后也無法保證效率。而在如今大數(shù)據(jù)時代當中,出現(xiàn)這種情況的概率更大,所以Mini Batch K-Means的應用十分有必要。
Mini Batch K-Means研究并應用了Mini Batch(分批處理)法,來計算數(shù)據(jù)點之間的距離。Mini Batch的突出優(yōu)勢在于計算過程中不必調用全部的數(shù)據(jù)樣本,可以根據(jù)實際情況和需求,從多種樣本中抽取一部分,以此作為類型代表,開展進行計算。這樣一來,得益于較少的計算樣本量,可以有效減少系統(tǒng)運行壓力,但是該方法的缺陷在于會降低準確度。
返回x與離得最近的中心的歐式距離,可以運用梯度下降法收斂到局部最優(yōu)值,同時為了提升計算準確度,通??梢远噙\行幾次Mini Batch K-Means算法,以此來通過多次隨機采樣得到多種聚類簇,再對其進行研究分析,確定最佳聚類簇。
在實訓云平臺評測過程中,采用K-means算法主要是應用其聚類分析特征,先確定好初始中心,然后把學生評測數(shù)據(jù)和初始數(shù)據(jù)實行核對,通過這種核對來分析教師行為,分析這些行為是否可以提高學生滿意度。
4結束語
校企合作的學生實訓云平臺開發(fā)與設計,是依托于云計算技術的一種新型職業(yè)教育模式。在實訓系統(tǒng)的設計中,需要綜合院系管理模塊設計、學生實訓模塊設計、企業(yè)信息管理設計、信息云公告模塊設計等,以便使實訓系統(tǒng)滿足職業(yè)教育的需要。由于實訓云平臺的功能復雜,為了更好地實現(xiàn)各種功能,需要對服務器以及數(shù)據(jù)庫的性能進行有效實現(xiàn),以使實訓云平臺成為校企合作的職業(yè)教育媒介。
參考文獻:
[1] 鄭闊,李長青,薄志毅,等.結合物聯(lián)網與云技術的測繪實訓管理平臺設計與實現(xiàn)[J].測繪通報,2019(1):132-137.
[2] 王東云.“互聯(lián)網+”在職業(yè)教育教學、實訓、管理、服務方面應用的調查研究——以天津市信息工程學校為例[J].天津職業(yè)院校聯(lián)合學報,2018,20(12):89-94.
[3] 鄭義海,馮澤,余思東,等.室內設計信息化過程中虛擬仿真教學實訓管理網絡軟件難點解析[J].文化創(chuàng)新比較研究,2018,2(28):84-85.
[4] 冀鋼.基于Strust2+Hibernate+Spring框架的生產性實訓平臺的開發(fā)與應用[J].科技視界,2017(15):92-95.
[5] 何理瑞,王建軍,桑迎平.基于生命周期的應用型本科院校實訓管理平臺建設[J].浙江水利水電學院學報,2016,28(5):88-90.
【通聯(lián)編輯:光文玲】