堯雪莉
(南昌交通學院,江西 南昌 330100)
近幾年來,高職院校應用型人才培養(yǎng)得到了各個行業(yè)的重視,創(chuàng)新創(chuàng)業(yè)教育成為職業(yè)教育人才培養(yǎng)的主流趨勢[1-2]。在教育過程中將創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)進行有效的分類對教育方案的制定具有重要意義。但是由于市場需求的變化,應用型高校對學生創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)的分類結果無法達到預期的標準,需要設計更加靈活、多變的數(shù)據(jù)分類方法[3-4]。
數(shù)據(jù)挖掘對于龐大數(shù)據(jù)的處理效果更佳,處理形式也較為靈活。本文基于數(shù)據(jù)挖掘技術提出應用型高校創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)分類方法。與傳統(tǒng)的數(shù)據(jù)分類模式相比,本文所設計的數(shù)據(jù)分類方式創(chuàng)新性地在復雜的處理環(huán)境之下,明確劃定數(shù)據(jù)處理區(qū)域;結合所設立的創(chuàng)新創(chuàng)業(yè)執(zhí)行目標,核定更加精準的分類結果;在數(shù)據(jù)挖掘的輔助支持之下,提升了整體的數(shù)據(jù)分類處理效果。
在對應用型高校創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)進行挖掘分類之前,需要先進行數(shù)據(jù)分布的預處理[5]。結合應用型高職院校的創(chuàng)新創(chuàng)業(yè)實際情況,劃定具體的數(shù)據(jù)處理區(qū)域,提取數(shù)據(jù)的分布特征,在預設的標準以及范圍之內(nèi),進行融合歸類[6]。構建的對應的分布處理結構如圖1所示。
圖1 數(shù)據(jù)分布預處理結構圖示
根據(jù)圖1,可以建立數(shù)據(jù)分布預處理結構。依據(jù)該結構,結合數(shù)據(jù)挖掘技術,進行分布目標的關聯(lián);在合理的分布范圍之內(nèi),完成對數(shù)據(jù)分類目標的項集預處理。
在完成數(shù)據(jù)分布預處理之后,需要設定特征數(shù)據(jù)的分類目標[7]。特征數(shù)據(jù)分類目標是指通過提取數(shù)據(jù)特征劃定具體的分類層級。需要注意的是,數(shù)據(jù)分類層級一般由分類目標驅動,結合挖掘指令,形成對應的分類任務[8]。此時,結合上述內(nèi)容計算創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)特征分布權系數(shù):
通過上述計算得出實際的數(shù)據(jù)特征分布權系數(shù),排除存在的差異值,設定具體的應用數(shù)據(jù)分類目標,為后續(xù)挖掘處理奠定基礎。
基于上節(jié)設定的特征數(shù)據(jù)分類目標,設計模糊數(shù)據(jù)挖掘分類結構。先結合數(shù)據(jù)的實際數(shù)量,預設數(shù)據(jù)的實際分類范圍,將測定數(shù)據(jù)的模糊特征分布集設為在[-1,1]的區(qū)間之內(nèi),劃定數(shù)據(jù)挖掘的實際應用范圍。
同時,根據(jù)特征模板,設定分類控制指數(shù),在特征權重回歸分析的基礎之上,構建多層級、多目標的自適應分類結構;結合分類目標,完成模糊數(shù)據(jù)挖掘分類結構設計。
根據(jù)模糊數(shù)據(jù)挖掘分類結構,構建雙向關聯(lián)數(shù)據(jù)挖掘分類模型。劃定基礎的分類條件與處理標準,計算數(shù)據(jù)分類模型的雙向挖掘比:
基于雙向關聯(lián)規(guī)則,對數(shù)據(jù)進行模糊統(tǒng)計;設定高層級的數(shù)據(jù)分類序列,在每一個分類處理序列之間劃定允許出現(xiàn)的誤差標準為0.15。數(shù)據(jù)分類自適應度函數(shù)計算如下:
基于雙向關聯(lián)數(shù)據(jù)挖掘分類模型,采用特征重構法實現(xiàn)應用型高校創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)的分類?;跀?shù)據(jù)挖掘技術,設定重構邊緣范圍,同時制定重構分類邊緣值,具體如表1所示。
表1 重構數(shù)據(jù)分類邊緣值標準設定表
根據(jù)表1設定重構數(shù)據(jù)分類邊緣值標準,實現(xiàn)數(shù)據(jù)挖掘技術下應用型高校創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)的分類。
驗證數(shù)據(jù)挖掘下應用型高校創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)分類方法的分類效果,設定3個測試組進行對比測試。測試組1為傳統(tǒng)的線性回歸數(shù)據(jù)分類處理方法;測試組2為傳統(tǒng)的物元數(shù)據(jù)分類處理方法;測試組3為本文設計方法。
選取R高職院校作為實驗對象,設定P高職院校的4個班級作為測試對比小組。采用Matlab和C++的混合處理方式進行數(shù)據(jù)初始分類架構的設計與構建,并計算出實際的互動限制比:
結合限制比,設定對應的初始測試區(qū)域。結合數(shù)據(jù)分類樣本,計算出控制權重系數(shù):
在測試之前,根據(jù)測定的范圍和創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)的數(shù)量,設定數(shù)據(jù)分類的迭代次數(shù)為650,測定周期為6周,標準完成比為T=0.25。在數(shù)據(jù)挖掘的輔助支持之下,設定數(shù)據(jù)的分類目標。將整合的P高職院校4個班級創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)依據(jù)種類添加在不同的處理層級。
結合數(shù)據(jù)挖掘模式,構建二次數(shù)據(jù)分布的不規(guī)則空間聚類數(shù)據(jù)處理模型,構建模糊的數(shù)據(jù)分類環(huán)境,計算出具體的數(shù)據(jù)挖掘模糊系數(shù):
在搭建的測試環(huán)境之中,根據(jù)數(shù)據(jù)挖掘所覆蓋的范圍,進行空間聚集分類測定。先獲取相應的聚類數(shù)據(jù)處理信息,同時建立對應的分類結構,進行數(shù)據(jù)聚類收斂比的計算:
根據(jù)圖2,可以完成對創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)波動變化的掌握。隨后,結合R高職院校的實際數(shù)據(jù)分類要求,以及創(chuàng)新創(chuàng)業(yè)的變化范圍,計算出實際的誤分率:
圖2 數(shù)據(jù)波動變化圖示
式中, 表示實際的誤分率; 表示迭代挖掘次數(shù); 表示模糊分類均值。通過上述計算,最終得出3個測試組的實際誤分率結果如表2所示。
表2 測試結果對比分析表
根據(jù)表2,與傳統(tǒng)測試組相比,本文所設計方法得出的誤分率相對較低,表明其對于P高職院校的創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)的分類效果更佳,具有實際的應用效果。
為了提高應用型高校創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)的分類效果,本文設計基于數(shù)據(jù)挖掘的應用型高校創(chuàng)新創(chuàng)業(yè)數(shù)據(jù)分類方法。設定具體的分類目標,結合應用型高職院校的創(chuàng)新創(chuàng)業(yè)需求與標準,制定相應的分類處理方案,優(yōu)化數(shù)據(jù)分類結構。實驗結果表明本文方式更加靈活,可以在復雜的創(chuàng)新創(chuàng)業(yè)環(huán)境之下,提升數(shù)據(jù)處理的效果,推動創(chuàng)新創(chuàng)業(yè)目標更快實現(xiàn)?!?/p>