張恩昊
(大連電子學校,遼寧 大連 116100)
近年來隨著國家和各級政府的持續(xù)不斷的大力投入,中等職業(yè)教育得到了長足發(fā)展,但制約中等職業(yè)教育實現(xiàn)高質量可持續(xù)發(fā)展的掣肘還存在,關鍵痛點未得到有效解決。中等職業(yè)教育的受眾群主要來自九年制義務教育的階段綜合評定成績后45%—55%的學生,普遍存在學習習慣有缺陷,學習方法不科學,多門學科學習基礎不牢固的頑疾,年齡普遍處于15—18歲的未成年人,進入中等職業(yè)教育體系后,既面臨繼續(xù)提高綜合人文素養(yǎng)的艱巨任務,同時還處于豐富健全完善人生觀和世界觀的關鍵期,更具有挑戰(zhàn)的是直接進入未來就業(yè)崗位技能培訓階段,在中等職業(yè)教育階段,既要塑造合格的高素質的社會公民,又要培養(yǎng)適應社會發(fā)展的高技能的合格就業(yè)者,這就要求充分掌握中等職業(yè)教育受眾群的大量相關數(shù)據(jù),通過數(shù)據(jù)挖掘和分析,實現(xiàn)個性化教學,因材施教。
傳統(tǒng)中等職業(yè)教育主要關注對受眾群學習成績的評價,而忽略對學習過程的分析,缺乏受眾群歷史數(shù)據(jù)的掌握和分析,而大數(shù)據(jù)技術通過對受眾群相關學習行為、興趣、習慣等數(shù)據(jù)的留存和深度挖掘,學習行為評價和評估,教師可以根據(jù)大數(shù)據(jù)技術分析和挖掘出的學習過程中的相關規(guī)律,根據(jù)個受眾群個人的學習數(shù)據(jù),制定相應的學習計劃和輔導,而不再基于自己的教學經(jīng)驗分析學生的學習偏好、難點和共同點。通過對企業(yè)的工程案例庫中面向工作過程的知識庫的挖掘和分析,能夠準確和高效地挖掘出相關崗位專業(yè)技能對應的知識點,可以實現(xiàn)中等職業(yè)教育受眾群的精準培訓和教學,從而完成學校和就業(yè)崗位的無縫銜接和融合。
中等職業(yè)教育在基于5G通信技術實時傳輸和物聯(lián)網(wǎng)高速信息采集的大數(shù)據(jù)技術和數(shù)據(jù)挖掘相關算法的大規(guī)模應用下,通過不斷持續(xù)建設基于大數(shù)據(jù)技術的個性化教育社區(qū),中等職業(yè)教育可以實現(xiàn)彈性學習、個性化學習、按需學習、終生學習[1]。
該系統(tǒng)為中職教育受眾群的專業(yè)技能領域的個性化學習,提供數(shù)據(jù)和數(shù)據(jù)挖掘技術支持。系統(tǒng)將面向工作過程的各專業(yè)的專業(yè)知識,根據(jù)數(shù)據(jù)特點和應用特點將數(shù)據(jù)資源歸類為標準資源庫和主題信息庫。
標準資源庫主要用于存放經(jīng)過清洗后的資源數(shù)據(jù)。標準資源庫中,將靜態(tài)數(shù)據(jù)進行歸納,形成行業(yè)共享共建的基礎數(shù)據(jù)庫,將動態(tài)數(shù)據(jù)整合形成業(yè)務數(shù)據(jù)庫。
主題信息庫是基于標準資源庫數(shù)據(jù),通過對支撐不同分項主題的數(shù)據(jù),既包括常用統(tǒng)計及分析,也包括根據(jù)專業(yè)崗位而制定的不同主題、不同維度的統(tǒng)計及分析數(shù)據(jù),進行數(shù)據(jù)建模和組織并結合聚類、序列分析、相關性分析等機器學習算法組成的強大數(shù)據(jù)挖掘引擎,按照從初學者、高級初學者、有能力者、熟練者到專家的職業(yè)能力規(guī)律,挖掘各專業(yè)崗位工作邏輯對應的知識邏輯,構建符合發(fā)展邏輯的各專業(yè)的教學內容,根據(jù)相關職業(yè)能力等級,建立從低級到高級的難點遞增的,面向工作過程的專業(yè)知識數(shù)據(jù)庫,該數(shù)據(jù)庫既可以完成中等職業(yè)教育受眾群的專業(yè)技能進階培訓,也用于專業(yè)能力等級測試和劃分,受眾群個體的專業(yè)能力畫像生成,為后續(xù)的個性化教學,分層次教學、分就業(yè)崗位教學提高數(shù)據(jù)支持和分析服務。
人文素養(yǎng)知識庫的數(shù)據(jù)是由人文綜合素養(yǎng)領域形成的各種與文化素養(yǎng)本身相關的數(shù)據(jù),及外圍所形成的數(shù)據(jù)綜合匯聚而形成的。其數(shù)據(jù)來源既包括數(shù)字圖書館等數(shù)字化的數(shù)據(jù),也包括公眾在社交網(wǎng)絡上搜索或者發(fā)布的自媒體等相關數(shù)據(jù)如語音、短視頻、公眾號等數(shù)字化數(shù)據(jù)。
通過對人文大數(shù)據(jù)的挖掘,可以提供各種統(tǒng)計分析服務,如基于相關人文素養(yǎng)大數(shù)據(jù)資源訪問熱度的分析、基于大數(shù)據(jù)訪問時段、訪問數(shù)據(jù)類型如漫畫、短視頻、電影、直播等的統(tǒng)計分析等,用戶行為分析主要對大數(shù)據(jù)平臺的用戶在搜索、瀏覽內容、瀏覽時間、討論等所有行為數(shù)據(jù)進行建模與分析,通過對用戶行為分析,挖掘什么類型的人文數(shù)據(jù)資源最受歡迎,以達到根據(jù)用戶的歷史行為記錄分析用戶的愛好和興趣等目的,為此后的個性化推薦提供理論依據(jù)[2]。
用戶畫像系統(tǒng),其核心是用計算機理解的詞語,去描述一個人,一般用標簽+權重來做用戶畫像。用戶相關的數(shù)據(jù),分為靜態(tài)和動態(tài)兩種。用戶靜態(tài)數(shù)據(jù)主要是指其個人標簽,屬性如年齡、性別、愛好等。用戶動態(tài)數(shù)據(jù)主要是指行為數(shù)據(jù),常見要素是時間、地點、行為等。
當用戶畫像系統(tǒng)建立后,通過與專業(yè)知識數(shù)據(jù)庫系統(tǒng)結合后,通過收集并記錄用戶的相關專業(yè)知識的掌握情況、興趣點等數(shù)據(jù),送到數(shù)據(jù)分析系統(tǒng),實時挖掘分析用戶的專業(yè)特長、短板、專業(yè)技能升級路線圖等,并實時將個性化的專業(yè)學習關聯(lián)信息推送給用戶。通過與人文素養(yǎng)知識數(shù)據(jù)庫結合后,可以找到更符合用戶興趣、適合用戶特性的人文素養(yǎng)知識、并對知識的呈現(xiàn)形式進行針對性的調整和優(yōu)化。
專業(yè)知識個性化推薦系統(tǒng)通過學生與教育的應用軟件、手機APP等互動,通過大數(shù)據(jù)分析的得到以下需求:我的專業(yè)優(yōu)勢、劣勢、提高學習成績的障礙、勝任的工作、推薦的專業(yè)學習計劃、專業(yè)技能提升路線圖等。
人文大數(shù)據(jù)個性化推薦主要通過對海量文化大數(shù)據(jù)和用戶行為對比分析來實現(xiàn)。對用戶行為和興趣點進行精確描述,將包括訪問特征、用戶特征及用戶社交信息在內的用戶行為數(shù)據(jù)引入到推薦系統(tǒng),以提升個性化推薦的效果,構建一套個性化的推薦系統(tǒng)。
傳統(tǒng)課堂教學很難根據(jù)學生個體特點有針對性地進行教學,而基于大數(shù)據(jù)的教育平臺系統(tǒng)可以針對每個學生的學習情況,實現(xiàn)個性化教學。通過對教育大數(shù)據(jù)的分析,找出每個學生的學習興趣點、學習難點、學習行為、喜愛的學習方式、喜歡的課程、潛在的天賦,幫助學生依據(jù)個體的情況提高學習的收獲量。
將學生的一切學習行為和相關數(shù)據(jù)均記錄下來,相關教育的原始數(shù)據(jù)主要包括學生信息、教師信息、電子輔助授課資料、電子試卷、學習記錄、考試記錄、學習筆記、教師批改記錄、教師授課視頻及互動留言等。以學生做題為例,題的難度、考察的知識點、答題時間、正確率都是需要采集的指標。通過數(shù)據(jù)分析和挖掘,獲取和掌握學生的愛好、興趣、對知識點的掌握程度等信息,教師可以有針對性地調整相關教學要素,因材施教。通過數(shù)據(jù)的積累和數(shù)據(jù)挖掘,形成學生的用戶畫像、興趣圖譜、學科偏好、學習軌跡,大數(shù)據(jù)能夠幫助教師實時了解學生的學習狀況、對學生進行分類、因材施教、實現(xiàn)知情教學。
通過大數(shù)據(jù)分析教師與教育應用軟件、手機APP等互動,可以分析出教師的教學優(yōu)勢、教學劣勢、優(yōu)化的教學手段、推薦的教學計劃、學生成績評估分析與反饋、課件的智能評估與反饋等相關提高教師教學質量的影響因素。
數(shù)據(jù)采集是實現(xiàn)大數(shù)據(jù)分析的基礎,一般來說,采集的數(shù)據(jù)類型分為三類,結構化、半結構化、非結構化數(shù)據(jù)。結構化數(shù)據(jù)是存儲在數(shù)據(jù)庫里,能用二維表結構邏輯表達實現(xiàn)的數(shù)據(jù),常用于記錄客戶信息等方面的數(shù)據(jù),半結構化數(shù)據(jù)具有可被理解的邏輯流程和格式,但格式不友好,分析起來比結構化數(shù)據(jù)復雜,如網(wǎng)絡流量、APP日活躍用戶數(shù)、登錄用戶數(shù)、停留時間等。非結構化數(shù)據(jù)是處理難度最高的大數(shù)據(jù),比如圖像、語音、音頻,以及文本信息如聊天記錄、文檔、電子郵件等多媒體類的非結構化數(shù)據(jù)。
在中職教育中,應該優(yōu)先挖掘出大數(shù)據(jù)之間的相關性,通過對專業(yè)知識大數(shù)據(jù)的相關性分析,可以挖掘對進階到高端崗位的控制性技能和知識,影響崗位工作效率和能力的關鍵參數(shù),相關控制性技能和知識點的進階次序;不同控制性技能和知識集合對應的就業(yè)崗位,影響個體崗位技能提高的短板項;通過對人文素養(yǎng)知識大數(shù)據(jù)的相關性分析,可以挖掘影響個體人文素質提高的制約因素,適合不同個體、不同受眾群的人文知識呈現(xiàn)形式和方式、適合不同個體、不同受眾群的人文素養(yǎng)提高路線圖。通過對教師教學大數(shù)據(jù)的相關性分析,不僅可以挖掘出相關受眾群的學習規(guī)律,還可以挖掘出提高教學質量和水平的教學規(guī)律。
大數(shù)據(jù)技術通過5G通信技術、物聯(lián)網(wǎng)等技術手段將自然、社會、人類的一切狀態(tài)、行為記錄存儲下來,這些數(shù)據(jù)通過網(wǎng)絡和云技術對外開放和共享,對數(shù)據(jù)權益、數(shù)據(jù)隱私和人性自由帶來了極大的影響和挑戰(zhàn)。
中等職業(yè)教育大數(shù)據(jù)從個人、相關企業(yè)采集而來,數(shù)據(jù)產(chǎn)權歸屬權是數(shù)據(jù)采集者、被采集對象、還是數(shù)據(jù)存儲者,誰擁有對這些數(shù)據(jù)的所有權、使用權、存儲權和刪除權;來自企業(yè)的技術數(shù)據(jù)和項目數(shù)據(jù)是否會導致企業(yè)的商業(yè)機密泄露,被第三方采集,用于惡意的商業(yè)競爭;同時大數(shù)據(jù)對思想、行為預測結果的非正常泄露是否會對中等職業(yè)教育未成年人受眾群和監(jiān)護人的行為意志、職業(yè)規(guī)劃、自我認知等領域產(chǎn)生不可控的干擾,這些事項需要做好規(guī)劃和設計,否則會引發(fā)隱私保護危機。
對于中職教育的數(shù)據(jù)利益相關方,因其多數(shù)為未成年人,應該保證數(shù)據(jù)被采集者的知情權和所采集數(shù)據(jù)的知識產(chǎn)權,同時對挖掘出的公共知識,應該面向數(shù)據(jù)利益相關方公開,對涉及被采集者的可能影響其未來正常學習和生活、人生成長的數(shù)據(jù)應該進行脫敏,盡可能地降低對其的影響。