劉 晨
(安徽建筑大學(xué) 公共管理學(xué)院,安徽 合肥 230601)
高校學(xué)生體質(zhì)狀況直接影響人才的培養(yǎng),對國家未來的發(fā)展也有重要影響。借助決策樹算法來管理大學(xué)生體能測試數(shù)據(jù),能夠深度分析不同體測項目中大學(xué)生體質(zhì)健康檢測成績,能夠更好地指導(dǎo)大學(xué)生體能測試訓(xùn)練。構(gòu)建大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng),結(jié)合計算機信息化管理和優(yōu)化分類算法,進行大學(xué)生體能測試數(shù)據(jù)分類管理和信息融合存儲,優(yōu)化大學(xué)生體能測試數(shù)據(jù)管理,對提高大學(xué)生體能測試數(shù)據(jù)管理能力方面具有重要意義[1],相關(guān)的大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)設(shè)計研究受到人們的極大關(guān)注。
大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)是建立在對體測數(shù)據(jù)的優(yōu)化調(diào)度和信息融合的基礎(chǔ)上,建立大學(xué)生體能測試數(shù)據(jù)結(jié)構(gòu),通過分類算法和決策樹尋優(yōu)算法,進行大學(xué)生體能測試數(shù)據(jù)管理[2,3]。目前已有相關(guān)領(lǐng)域?qū)W者對大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)進行了設(shè)計,(曲泉穎等,2019)提出了基于模糊信息融合的大學(xué)生體能測試數(shù)據(jù)管理方法,結(jié)合特征提取和信息融合,進行大學(xué)生體能測試數(shù)據(jù)管理[4]。(于光華,2018)提出基于關(guān)聯(lián)特征分析的大學(xué)生體能測試數(shù)據(jù)管理模型,結(jié)合關(guān)聯(lián)特征檢測和相關(guān)特征提取,進行大學(xué)生體能測試數(shù)據(jù)管理和數(shù)據(jù)庫設(shè)計[5]。
本文為提高大學(xué)生體能測試數(shù)據(jù)管理能力,提出基于ID3決策樹算法的大學(xué)生體能測試數(shù)據(jù)管理方法。構(gòu)建大學(xué)生體能測試數(shù)據(jù)挖掘及特征提取模型,在ID3決策樹設(shè)計大學(xué)生體能測試數(shù)據(jù)的分支體系,進行學(xué)生體能測試數(shù)據(jù)管理水平評價的熵權(quán)指標(biāo)參數(shù)分析,結(jié)合軟件交叉編譯設(shè)計,完成大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)的設(shè)計,并通過仿真測試分析,驗證了本文方法在提高大學(xué)生體能測試數(shù)據(jù)管理水平方面的優(yōu)越性能。
1.大學(xué)生體能測試數(shù)據(jù)挖掘
為了實現(xiàn)大學(xué)生體能測試數(shù)據(jù)管理,基于大學(xué)體育部主管課程老師所管理的大學(xué)生體測成績,構(gòu)建大學(xué)生體能測試數(shù)據(jù)挖掘及特征提取模型,保證數(shù)據(jù)資料的精確性。采用決策樹尋優(yōu)方法進行大學(xué)生體能測試數(shù)據(jù)的特征分類檢測[6,7],決策樹技術(shù)需通過離散化模式來處理最終體測數(shù)據(jù)。
設(shè)計大學(xué)生體能測試數(shù)據(jù)的分布維數(shù)為N×m維,得到大學(xué)生體能測試數(shù)據(jù)的量化評價空間分布矩陣X:
(1)
考慮到大學(xué)生體能測試數(shù)據(jù)的分布關(guān)聯(lián)系數(shù)J(m),J(N),通過對第i個節(jié)點存儲的大學(xué)生體能測試數(shù)據(jù)進行加權(quán)融合,得到學(xué)生體能測試數(shù)據(jù)管理水平評價的模糊度參數(shù):
δxi+1=J(m),J(N)δxi
(2)
式中,δ表示模糊特征向量,獲取大學(xué)生體能測試數(shù)據(jù)的存儲空間,對存儲空間進行優(yōu)化調(diào)度,實現(xiàn)學(xué)生體能測試數(shù)據(jù)管理的水平量化跟蹤[8],得到大學(xué)生體能測試數(shù)據(jù)的標(biāo)準(zhǔn)量化參數(shù),用xi∈X,i∈1,2,…,N表示,求得大學(xué)生體能測試數(shù)據(jù)量化參數(shù)的關(guān)聯(lián)系數(shù)表示為:
(3)
2.大學(xué)生體能測試數(shù)據(jù)信息融合
利用訓(xùn)練集建立大學(xué)生體能測試數(shù)據(jù)管理決策樹模型[9],根據(jù)數(shù)據(jù)特征構(gòu)建大學(xué)生體能測試數(shù)據(jù)的相似度分布集為:
(4)
在ID3決策樹模型下對大學(xué)生體能測試數(shù)據(jù)的屬性分類,提取大學(xué)生體能測試數(shù)據(jù)的粗糙集和相似度特征量,對于大學(xué)生體能測試數(shù)據(jù)管理水平評價集[10],通過標(biāo)準(zhǔn)化調(diào)度進行數(shù)據(jù)的分類決策,采用零階補償和信息融合方法,通過互信息相關(guān)算法進行大學(xué)生體能測試數(shù)據(jù)管理和資源優(yōu)化調(diào)度[11]。建立大學(xué)生體能測試數(shù)據(jù)的決策指標(biāo)函數(shù)為:
(5)
其中,p(xi,j)表示相似度,根據(jù)學(xué)生體能測試數(shù)據(jù)特征分析,進行量化分解,通過標(biāo)準(zhǔn)的參考矩陣分解,得到大學(xué)生體能測試數(shù)據(jù)量化特征分解值為:
(6)
其中,大學(xué)生體能測試數(shù)據(jù)分布的嵌入維為m,時延參數(shù)為τ。通過子空間聚類和信息融合,提取大學(xué)生體能測試數(shù)據(jù)的關(guān)聯(lián)特征解,通過模糊度測試,進行大學(xué)生體能測試數(shù)據(jù)的優(yōu)化挖掘和分類管理[12]。
3.大學(xué)生體能測試數(shù)據(jù)管理優(yōu)化
決策樹算法作為一種分類器,能夠針對無規(guī)則和無序的樣本進行類別標(biāo)號,并可以對決策樹分類規(guī)則進行倒推。借助決策樹技術(shù)開展成績數(shù)據(jù)研究活動,能夠更加直觀化、全面化呈現(xiàn)數(shù)據(jù)研究結(jié)果。在ID3決策樹算法下,小型決策樹相對于大決策樹的分類性能更優(yōu),通過ID3決策樹算法來對大學(xué)生體能測試數(shù)據(jù)管理優(yōu)化,能夠顯著改善數(shù)據(jù)管理效率。
(1)ID3決策樹算法
在ID3決策樹中設(shè)計大學(xué)生體能測試數(shù)據(jù)的分支體系,進行大學(xué)生體能測試數(shù)據(jù)管理水平評價的熵權(quán)指標(biāo)參數(shù)分析,決策樹模型如圖1所示。
圖1 大學(xué)生體能測試數(shù)據(jù)管理的ID3決策樹模型
在圖1所示的大學(xué)生體能測試數(shù)據(jù)管理的ID3決策樹模型中,通過綜合決策和特征判決,得到判決式為:
(7)
上述公式中,fx(xi,j),fθ(xi,j),gx(xi,j)和gθ(xi,j)分別表示大學(xué)生體能測試數(shù)據(jù)管理水平評價的相似度系數(shù),基于ID3決策樹進行數(shù)據(jù)分類尋優(yōu),得到ID3決策樹的關(guān)聯(lián)函數(shù)C(τ)定義為:
(8)
上式表示t和t+τ時刻大學(xué)生體能測試數(shù)據(jù)量化管理的模糊度系數(shù),根據(jù)標(biāo)準(zhǔn)量化分布式融合,進行ID3決策樹尋優(yōu)控制,得到大學(xué)生體能測試數(shù)據(jù)管理的三階量化參數(shù):
(9)
(10)
根據(jù)大學(xué)生體能測試數(shù)據(jù)的ID3決策樹融合結(jié)果,進行主特征建模,建立底層數(shù)據(jù)庫進行信息融合和決策判斷。構(gòu)建大學(xué)生體能測試數(shù)據(jù)管理的ID3決策樹模型,能夠更好的迎合高校管理工作需求,大大提高對大學(xué)生體測數(shù)據(jù)的管理效率。
(2)數(shù)據(jù)分類提取及優(yōu)化存儲
基于上述構(gòu)建的大學(xué)生體能測試數(shù)據(jù)管理的ID3決策樹模型,開展數(shù)據(jù)分類提取、數(shù)據(jù)優(yōu)化存儲等相關(guān)操作。依托決策樹模型進行大學(xué)生體能測試數(shù)據(jù)管理水平評價的熵權(quán)指標(biāo)參數(shù)分析,提取學(xué)生體能測試數(shù)據(jù)管理的熵權(quán)特征量,具體表示如下:
(11)
通過對大學(xué)生體能測試數(shù)據(jù)的熵特征進行決策樹分叉加權(quán)管理,得到大學(xué)生體能測試數(shù)據(jù)存儲的空間分布函數(shù),表示為:
(12)
在tn+1時刻和tn時刻分別對大學(xué)生體能測試數(shù)據(jù)進行信息融合,能夠得到大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)存儲節(jié)點k及候選節(jié)點j的差異性,通過條件概率分析,可以得知學(xué)生體能測試數(shù)據(jù)的條件概率密度特征,如下述公式所示:
(13)
(14)
(15)
通過上式實現(xiàn)對大學(xué)生體能測試數(shù)據(jù)的分類管理,顯著改善了數(shù)據(jù)管理效率。
為驗證基于ID3決策樹算法的大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)的有效性,設(shè)計仿真對比實驗。以文獻(xiàn)[4]方法、文獻(xiàn)[5]方法作為實驗對比方法,在Matlab Simulink 軟件下,進行大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)的仿真實驗,驗證本研究中ID3決策樹算法及兩個文獻(xiàn)算法的分類準(zhǔn)確性。本研究采集2000名大學(xué)生的體能測試數(shù)據(jù)作為研究對象,數(shù)據(jù)總量共為500MB,采集時間為2020年第一季度,體能項目主要有大學(xué)生短跑、長跑、立定跳遠(yuǎn)以及球類等相關(guān)運動數(shù)據(jù),大學(xué)生體能測試數(shù)據(jù)詳細(xì)分布見表1。
表1 大學(xué)生體能測試數(shù)據(jù)分布
結(jié)合上述數(shù)據(jù)研究樣本,開展大學(xué)生體能測試數(shù)據(jù)管理工作,能夠得到所有數(shù)據(jù)的測試集分布,如圖2所示。
圖2 大學(xué)生體能數(shù)據(jù)測試集
對上述大學(xué)生體能測試數(shù)據(jù)進行進一步的優(yōu)化管理和自適應(yīng)調(diào)度,可以得到大學(xué)生體能測試數(shù)據(jù)管理優(yōu)化輸出結(jié)果,如圖3所示。
圖3 大學(xué)生體能測試數(shù)據(jù)管理優(yōu)化輸出
分析圖3得知,基于文獻(xiàn)[4]和[5]中的對比方法進行大學(xué)生體能測試數(shù)據(jù)管理的輸出波動較大,而本研究所提出的ID3決策樹算法,在進行大學(xué)生體能測試數(shù)據(jù)管理的輸出穩(wěn)定性較好,且尋優(yōu)能力也較強,顯著提高了大學(xué)生體能測試數(shù)據(jù)的分類管理和信息融合水平。上述實驗結(jié)果表明ID3決策樹算法對的大學(xué)生體能測試數(shù)據(jù)的管理能力優(yōu)于文獻(xiàn)[4]和[5]的算法,具有較高的實用價值。
在此基礎(chǔ)上,可以借助ID3決策樹算法的大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng),測試不同方法對大學(xué)生體能測試數(shù)據(jù)分類管理的準(zhǔn)確性,得到實驗對比結(jié)果如圖4所示。
分析圖4可知,采用文獻(xiàn)[4]方法得到的大學(xué)生體能測試數(shù)據(jù)分類準(zhǔn)確性為74.5%,采用文獻(xiàn)[5]方法得到的大學(xué)生體能測試數(shù)據(jù)分類準(zhǔn)確性為70.5%,而采用本文ID3決策樹算法得到的大學(xué)生體能測試數(shù)據(jù)分類準(zhǔn)確性為95.5%。由此可見,本文所設(shè)計系統(tǒng)能夠?qū)崿F(xiàn)對大學(xué)生體能測試數(shù)據(jù)的準(zhǔn)確分類。
圖4 大學(xué)生體能測試數(shù)據(jù)管理優(yōu)化輸出
分別設(shè)置系統(tǒng)迭代次數(shù)為100、200、300、400,測試不同迭代次數(shù)下,測試ID3決策樹算法下大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)在管理500MB大學(xué)生體能測試數(shù)據(jù)過程中的時間開銷,得到對比結(jié)果見表2。
表2 時間開銷測試(單位:ms)
分析表2得知,采用文獻(xiàn)[4]方法得到的時間開銷平均值為84ms,采用[5]方法得到的時間開銷平均值為69.75ms,采用本文方法得到的時間開銷平均值為3.25ms,由此可見,本文方法進行大學(xué)生體能測試數(shù)據(jù)管理的時間開銷較短。本文系統(tǒng)對大學(xué)生體能測試數(shù)據(jù)管理的輸出穩(wěn)定性較好,數(shù)據(jù)分類準(zhǔn)確性較好,且管理耗時較短,證明了所設(shè)計系統(tǒng)的可靠性。
本文提出基于ID3決策樹算法的大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng),采用決策樹尋優(yōu)方法進行大學(xué)生體能測試數(shù)據(jù)的特征分類檢測,提取大學(xué)生體能測試數(shù)據(jù)的粗糙集和相似度特征量,通過標(biāo)準(zhǔn)的參考矩陣分解進行數(shù)據(jù)特征分解。根據(jù)大學(xué)生體能測試數(shù)據(jù)的ID3決策樹融合結(jié)果,進行主特征建模,建立底層數(shù)據(jù)庫進行信息融合和數(shù)據(jù)優(yōu)化管理。通過實驗分析能夠得出結(jié)論如下:
(1)本文所設(shè)計的基于ID3決策樹算法的大學(xué)生體能測試數(shù)據(jù)管理系統(tǒng)對大學(xué)生體能測試數(shù)據(jù)管理的輸出穩(wěn)定性較好,尋優(yōu)能力較強,能夠有效提升體測數(shù)據(jù)的分類管理及信息融合水平。
(2)所設(shè)計系統(tǒng)能夠?qū)崿F(xiàn)對大學(xué)生體能測試數(shù)據(jù)的準(zhǔn)確分類,提升了系統(tǒng)管理性能。
(3)所設(shè)計系統(tǒng)在進行大學(xué)生體能測試數(shù)據(jù)管理時的耗時較短,管理效率也較好。