朱 春
(蕪湖職業(yè)技術(shù)學(xué)院 體育教學(xué)部,安徽 蕪湖 241003)
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中所要遵循的重要規(guī)則,關(guān)聯(lián)規(guī)則以原始資料作為處理對(duì)象,在高頻項(xiàng)目組的控制下,利用項(xiàng)目組中的高頻項(xiàng)建立規(guī)則,并結(jié)合不同的最小支持度,逐步搜索形成數(shù)據(jù)項(xiàng)目組[1].關(guān)聯(lián)規(guī)則能夠使用已知的數(shù)據(jù)推算出其他與其有關(guān)聯(lián)的數(shù)據(jù),并以此為對(duì)比標(biāo)準(zhǔn),構(gòu)建形成一個(gè)科學(xué)化的判斷過程[2].
在計(jì)算機(jī)技術(shù)的參與下,大學(xué)生體質(zhì)測試模式逐漸發(fā)展,進(jìn)而形成一個(gè)健康數(shù)據(jù)分析系統(tǒng),將學(xué)生各項(xiàng)體質(zhì)測試指標(biāo)輸入該系統(tǒng)后,系統(tǒng)能夠以特定的健康數(shù)值,生成個(gè)體或總體的身體健康分析結(jié)果,校方據(jù)此調(diào)整實(shí)際的教學(xué)方向,增強(qiáng)大學(xué)生的身體素質(zhì)[3].
在境外,分析大學(xué)生體質(zhì)測試健康數(shù)據(jù)的研究起步較早,其大多應(yīng)用了數(shù)據(jù)挖掘算法后,數(shù)據(jù)分析系統(tǒng)逐漸向精準(zhǔn)化、關(guān)聯(lián)化發(fā)展,可高效分析大學(xué)生群體的體質(zhì)健康狀況[4-7];而我國,相關(guān)數(shù)據(jù)分析系統(tǒng)起步較晚,文獻(xiàn)[8]以學(xué)生體質(zhì)健康測試區(qū)塊鏈為研究對(duì)象,在"省級(jí)-地級(jí)-縣級(jí)"的三級(jí)結(jié)構(gòu)下,從矯正利害相關(guān)者的關(guān)注點(diǎn)出發(fā),從平臺(tái)架構(gòu)、應(yīng)用前景與現(xiàn)實(shí)挑戰(zhàn)3個(gè)向度對(duì)學(xué)生體質(zhì)健康測試現(xiàn)狀進(jìn)行分析.文獻(xiàn)[9]采用聚類分析法評(píng)價(jià)醫(yī)學(xué)院校學(xué)生體質(zhì)健康成績結(jié)構(gòu)特征,揭示學(xué)生體質(zhì)結(jié)構(gòu)特征的內(nèi)在聯(lián)系,為醫(yī)學(xué)院校學(xué)生體質(zhì)健康科學(xué)訓(xùn)練工作提供理論依據(jù),有助于快速提高體質(zhì)健康成績.
綜合各國的研究現(xiàn)狀來看,設(shè)計(jì)一種基于關(guān)聯(lián)規(guī)則的大學(xué)生體質(zhì)測試健康數(shù)據(jù)分析系統(tǒng)是很有必要的.因?yàn)槠湓隗w質(zhì)測試指標(biāo)輸入后,通過給定的最小置信度,在每個(gè)最大頻繁項(xiàng)集中尋找置信度不小于設(shè)定的最小置信度的關(guān)聯(lián)規(guī)則,便于確定數(shù)據(jù)項(xiàng)數(shù)量數(shù)值、降低迭代次數(shù)、減少實(shí)際響應(yīng)時(shí)間.
在構(gòu)建分析系統(tǒng)的硬件層結(jié)構(gòu)時(shí),選擇數(shù)據(jù)采集設(shè)備和上位機(jī)作為主要組成部分,在獲取實(shí)際的大學(xué)生體質(zhì)物理量數(shù)據(jù)后(如身高、體重等),通過傳感器將其傳輸?shù)接布?硬件層采用NI Compact RIO機(jī)箱作為數(shù)據(jù)采集核心器件,搭建形成的硬件層結(jié)構(gòu)如圖1所示.
在圖1所示的硬件層結(jié)構(gòu)下,控制數(shù)據(jù)采集模塊內(nèi)設(shè)置1個(gè)FPGA芯片,芯片外部連接1個(gè)可拆卸的工業(yè)I/O模塊后,外部串聯(lián)1個(gè)嵌入式控制器NI cRIO-9075,配置1個(gè)4通道的電壓輸入模塊NI9215后,外部串聯(lián)1個(gè)8通道的電流輸入模塊NI9275.在控制器內(nèi)形成同步采樣電壓過程,緩沖處理硬件結(jié)構(gòu)中的模數(shù),形成模數(shù)轉(zhuǎn)換器,在模擬輸入通道的控制下,在硬件結(jié)構(gòu)內(nèi)形成一個(gè)數(shù)據(jù)傳輸通道,實(shí)現(xiàn)對(duì)大學(xué)生體側(cè)數(shù)據(jù)的傳輸.
圖1 搭建的硬件層結(jié)構(gòu)
設(shè)置NI cRIO-9075設(shè)備的工作溫度范圍為40~-30 ℃之間,固定其工作頻率為300 MHz后,在設(shè)備上放置1個(gè)4槽接口并連接1個(gè)串行端口.在I/O串口功能的支持下,實(shí)現(xiàn)硬件結(jié)構(gòu)的定時(shí)功能,設(shè)定的工作參數(shù)如表1所示.
表1 設(shè)定的器件工作參數(shù)
在表1所示的器件工作參數(shù)下,在硬件層結(jié)構(gòu)外部設(shè)定無線WIFI感應(yīng)器,控制感應(yīng)器內(nèi)集成數(shù)據(jù)信號(hào)監(jiān)聽、數(shù)據(jù)預(yù)處理以及數(shù)據(jù)通信3個(gè)模塊.數(shù)據(jù)信號(hào)監(jiān)聽模塊內(nèi)部放置一個(gè)1GB、支持RAM功能的四核處理器,利用處理器板上的USB端口,外部連接一個(gè)LPDDR2 SDRAM作為儲(chǔ)存預(yù)處理數(shù)據(jù)的元件,元件外部連接一個(gè)微型天線,接收體測過程產(chǎn)生的各項(xiàng)數(shù)據(jù).
采用光電傳感器( EE-SX1042,深圳中勤拓展實(shí)業(yè)有限公司)作為數(shù)據(jù)采集電路的核心,光電傳感器將激光束用偏振片遮擋后,串聯(lián)一個(gè)放大器,形成的信號(hào)采集電路結(jié)構(gòu)如圖2所示.
在圖2所示的信號(hào)采集電路結(jié)構(gòu)下,以控制電路中的無線傳輸芯片(NRF24L01)為核心,并在其內(nèi)部集成晶振和頻率合成器.為了控制芯片的發(fā)射功率,在頻率合成器外部連接一個(gè)調(diào)制器后,控制芯片的工作電流在10 mA左右,并在芯片上配置1個(gè)天線,同時(shí)調(diào)控相同接收數(shù)據(jù)頻道內(nèi)的數(shù)據(jù)信號(hào).在外圍電路內(nèi)設(shè)定10個(gè)元器件后,控制器件的工作電壓為3.3V.通信器件采用單邊天線,調(diào)控采集電路中產(chǎn)生的電感與電容間的參數(shù)值.
圖2 設(shè)計(jì)得到的信號(hào)采集電路結(jié)構(gòu)
為了控制硬件電路的功率輸出,在信號(hào)采集電路外部并聯(lián)1個(gè)橋式電路結(jié)構(gòu),電路內(nèi)部設(shè)定3個(gè)二極管和2個(gè)濾波電容.實(shí)際控制硬件結(jié)構(gòu)時(shí),通過控制二極管間接控制數(shù)據(jù)采集電路中的電流大小,形成的橋式電路結(jié)構(gòu)如圖3所示.
圖3 構(gòu)建得到的橋式電路結(jié)構(gòu)
在圖3所示的橋式電路結(jié)構(gòu)下,當(dāng)電阻R4輸入高電平時(shí),控制Q1接口流入電流,在線圈U-V的控制下,電流流經(jīng)Q4端口流入到地端,定義上述電流流經(jīng)過程為正方向.定義VCC為電容C3的充電電源后,將C9電容作為繼電器的調(diào)和電容.控制電容C8工作時(shí)兩端充電,將電路中的碰撞滑塊直接發(fā)射到碰撞銅板上,在RV1接口上調(diào)節(jié)電壓的輸出.在上述硬件結(jié)構(gòu)的控制下,設(shè)計(jì)數(shù)據(jù)分析系統(tǒng)的軟件結(jié)構(gòu).
在構(gòu)建體質(zhì)測試健康數(shù)據(jù)關(guān)聯(lián)規(guī)則時(shí),以硬件結(jié)構(gòu)采集得到的初始體質(zhì)數(shù)據(jù)作為處理對(duì)象[10],設(shè)定I={I1,I2,...,Im}是m個(gè)測試項(xiàng)目的數(shù)據(jù)集合,此時(shí)體質(zhì)測試項(xiàng)目為Ik,也就是長度為k的項(xiàng)集.假設(shè)數(shù)據(jù)集合中存在一個(gè)健康數(shù)據(jù)子集T,此時(shí)子集在測試集上的映射就可定義為關(guān)聯(lián)性,關(guān)聯(lián)性數(shù)量關(guān)系可表示為:
(1)
其中,|D|表示事務(wù)總數(shù)量;σ(Ik∪k)表示存在的健康數(shù)據(jù)數(shù)量.在上述數(shù)量關(guān)系下,構(gòu)建健康數(shù)據(jù)在體質(zhì)測試數(shù)據(jù)中出現(xiàn)的概率,數(shù)值關(guān)系可表示為:
(2)
其中,sup_count(Ik∪k)表示包含數(shù)據(jù)長度的事件,sup_count(k)表示含有健康數(shù)據(jù)的體測事物數(shù).根據(jù)上述計(jì)算公式,概率值可以反映大學(xué)生體質(zhì)測試健康數(shù)據(jù)在總數(shù)據(jù)集中的比例.當(dāng)概率數(shù)據(jù)值較大時(shí),可作為健康數(shù)據(jù)之間相互規(guī)則的最小置信度.以最小置信度為篩選準(zhǔn)則,對(duì)數(shù)據(jù)中的數(shù)據(jù)項(xiàng)進(jìn)行反復(fù)篩選,然后對(duì)健康數(shù)據(jù)進(jìn)行檢驗(yàn).將健康數(shù)據(jù)不斷集成到一個(gè)健康數(shù)據(jù)集中,設(shè)置身體素質(zhì)情況判斷的體質(zhì)測試指標(biāo),逐步提取滿足要求的規(guī)則,作為健康數(shù)據(jù)的篩選規(guī)則.如圖4所示.
圖4 體質(zhì)測試健康數(shù)據(jù)間的對(duì)應(yīng)關(guān)系示意圖
圖4中,構(gòu)造關(guān)聯(lián)規(guī)則后,對(duì)體質(zhì)測試數(shù)據(jù)輸出的關(guān)聯(lián)結(jié)果進(jìn)行分類,形成健康數(shù)據(jù)測試組,將其分為訓(xùn)練數(shù)據(jù)組和驗(yàn)證數(shù)據(jù)組.在數(shù)據(jù)比例的控制下,構(gòu)建數(shù)據(jù)訓(xùn)練模型,對(duì)項(xiàng)目的預(yù)測數(shù)據(jù)進(jìn)行測量,并按照過程構(gòu)建實(shí)際的健康函數(shù)[11].為了控制評(píng)價(jià)形成的分類函數(shù)精度,采用二元模型將算法模型、計(jì)算出的數(shù)據(jù)劃分為不同類型的數(shù)據(jù),在確保都是真實(shí)類數(shù)據(jù)的情況下,即可保證數(shù)據(jù)訓(xùn)練模型的實(shí)際精度滿足要求.
大學(xué)生體質(zhì)測試數(shù)據(jù)的種類較為復(fù)雜,所以在實(shí)現(xiàn)其數(shù)據(jù)分析功能時(shí),將其劃分為登錄模塊、數(shù)據(jù)管理模塊、數(shù)據(jù)分析模塊以及數(shù)據(jù)回調(diào)模塊等.在JAVA語言工具的幫助下,用戶登錄模塊設(shè)定用戶賬號(hào)以及用戶密碼,當(dāng)密碼與賬號(hào)間符合設(shè)定的代碼邏輯關(guān)系時(shí),開放數(shù)據(jù)分析系統(tǒng)內(nèi)部設(shè)定的權(quán)限[12].數(shù)據(jù)管理模塊的主要功能是更新或更正大學(xué)生個(gè)人信息和體質(zhì)測試數(shù)據(jù),按照當(dāng)前大學(xué)生體質(zhì)測試項(xiàng)目名稱作為數(shù)據(jù)管理批次.數(shù)據(jù)分析模塊主要對(duì)分析系統(tǒng)硬件中的健康數(shù)據(jù)進(jìn)行采集、壓縮和存儲(chǔ),方便高校對(duì)大學(xué)生體質(zhì)數(shù)據(jù)進(jìn)行調(diào)用與分析[13].數(shù)據(jù)回調(diào)模塊以構(gòu)建的分析模塊作為基礎(chǔ).具體實(shí)現(xiàn)過程如下:
第1步,在上述所示的模塊劃分下,據(jù)實(shí)際測試的大學(xué)生體質(zhì)數(shù)據(jù)選擇健康數(shù)據(jù)值,建立相同測試批次的數(shù)據(jù)分析任務(wù),同時(shí)配合學(xué)生自身體質(zhì)參數(shù),一定程度上增加或是刪除操作[14].根據(jù)設(shè)定的關(guān)聯(lián)規(guī)則,在線分析體質(zhì)測試數(shù)據(jù)在健康標(biāo)準(zhǔn)中所處的位置,計(jì)算得到體測數(shù)據(jù)項(xiàng)的流形程度,計(jì)算公式可表示為:
(3)
其中,Lift(k?T)表示體測數(shù)據(jù)在健康數(shù)據(jù)關(guān)聯(lián)關(guān)系中形成的提升度,在提升度數(shù)值的控制下,方便體育教師對(duì)學(xué)生的體測數(shù)據(jù)進(jìn)行體質(zhì)健康數(shù)據(jù)分析.
第2步,進(jìn)入健康數(shù)據(jù)分析模塊后,選擇不同種類的體質(zhì)測試通道,采集獲取得到大學(xué)生體質(zhì)測試數(shù)據(jù),控制此時(shí)對(duì)數(shù)據(jù)信號(hào)的壓縮以及分析,使用壓縮處理后的信號(hào)進(jìn)行數(shù)據(jù)回調(diào)分析,同時(shí)實(shí)現(xiàn)體測數(shù)據(jù)的在線健康分析過程.
第3步,在數(shù)據(jù)信號(hào)的獲取過程中,選定數(shù)據(jù)分析模塊的回調(diào)功能時(shí),要壓縮實(shí)際獲取的體質(zhì)數(shù)據(jù)信號(hào),并結(jié)合實(shí)際的數(shù)據(jù)分析要求,生成實(shí)際所需的健康數(shù)據(jù)分析規(guī)則[15],實(shí)現(xiàn)對(duì)大學(xué)生體質(zhì)測試健康數(shù)據(jù)的分析.
綜合上述軟、硬件的設(shè)計(jì),最終完成對(duì)基于關(guān)聯(lián)規(guī)則的大學(xué)生體質(zhì)測試健康數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì).
為測試數(shù)據(jù)分析系統(tǒng)的性能,采用文獻(xiàn)資料法、數(shù)理統(tǒng)計(jì)法和比較分析法,全面了解某大學(xué)學(xué)生體質(zhì)健康現(xiàn)狀[16].以該學(xué)校期末工作總結(jié)報(bào)告中提供的學(xué)生體質(zhì)健康狀況量化數(shù)據(jù)為數(shù)據(jù)樣本,設(shè)定其為采集得到的大學(xué)生體質(zhì)測試健康數(shù)據(jù)集,采集得到的數(shù)據(jù)集結(jié)果如表2所示.
表2 實(shí)驗(yàn)采集得到的數(shù)據(jù)集
使用表2準(zhǔn)備的實(shí)驗(yàn)數(shù)據(jù)集下,使用文獻(xiàn)[3]、[8]中以及設(shè)計(jì)的分析系統(tǒng)進(jìn)行實(shí)驗(yàn),對(duì)比3種數(shù)據(jù)分析系統(tǒng)的性能.
在上述實(shí)驗(yàn)準(zhǔn)備下,控制3種數(shù)據(jù)分析系統(tǒng)在相同的時(shí)間段處理準(zhǔn)備的大學(xué)生體質(zhì)健康數(shù)據(jù),以時(shí)間段內(nèi)可處理的數(shù)據(jù)峰值作為統(tǒng)計(jì)目標(biāo),將10組數(shù)據(jù)集作為處理對(duì)象,最終3種數(shù)據(jù)分析系統(tǒng)分析數(shù)據(jù)的峰值結(jié)果如表3所示.
表3 3種數(shù)據(jù)分析系統(tǒng)可處理的最大數(shù)據(jù)量結(jié)果
根據(jù)表3所示的最大數(shù)據(jù)量結(jié)果可知,在相同的實(shí)驗(yàn)環(huán)境下控制3種數(shù)據(jù)分析系統(tǒng)同時(shí)處理相同數(shù)據(jù)集,文獻(xiàn)[3]中數(shù)據(jù)分析系統(tǒng)可處理的最大數(shù)據(jù)量在300項(xiàng)左右,實(shí)際可處理的數(shù)據(jù)項(xiàng)數(shù)量較少;文獻(xiàn)[8]中的數(shù)據(jù)分析系統(tǒng)可處理的最大數(shù)據(jù)量在與實(shí)驗(yàn)準(zhǔn)備的數(shù)據(jù)量少50項(xiàng),可處理的最大數(shù)據(jù)量較大;而設(shè)計(jì)的數(shù)據(jù)分析系統(tǒng)幾乎能夠處理實(shí)驗(yàn)準(zhǔn)備的所有體質(zhì)測試數(shù)據(jù)項(xiàng),數(shù)據(jù)處理能力最強(qiáng).
保持上述實(shí)驗(yàn)環(huán)境不變,控制3種數(shù)據(jù)分析系統(tǒng)采集數(shù)據(jù)的頻率為500 Hz,將實(shí)驗(yàn)數(shù)據(jù)集中的數(shù)據(jù)項(xiàng)作為數(shù)據(jù)分析中的最小網(wǎng)(mm),統(tǒng)計(jì)在不同采樣速度下,3種數(shù)據(jù)分析系統(tǒng)能分辨數(shù)據(jù)項(xiàng)的個(gè)數(shù),實(shí)驗(yàn)結(jié)果如表4所示.
表4 3種數(shù)據(jù)分析系統(tǒng)分辨數(shù)據(jù)項(xiàng)結(jié)果
在3種數(shù)據(jù)分析系統(tǒng)控制下,將實(shí)驗(yàn)數(shù)據(jù)集中的數(shù)據(jù)項(xiàng)視為不同的數(shù)據(jù)網(wǎng)格.根據(jù)表中數(shù)值,文獻(xiàn)[3]中數(shù)據(jù)分析系統(tǒng)可分辨的數(shù)據(jù)項(xiàng)在20項(xiàng)左右,可分辨健康數(shù)據(jù)項(xiàng)的數(shù)量最多;文獻(xiàn)[8]中的數(shù)據(jù)分析系統(tǒng)可分辨的數(shù)據(jù)項(xiàng)要少于實(shí)際健康數(shù)據(jù)5項(xiàng)左右,實(shí)際可分辨的健康數(shù)據(jù)集數(shù)量較多;設(shè)計(jì)的數(shù)據(jù)分析系統(tǒng)可分辨的數(shù)據(jù)項(xiàng)數(shù)量與實(shí)際的健康數(shù)據(jù)項(xiàng)數(shù)值相等,可分辨的數(shù)據(jù)項(xiàng)數(shù)量最多.這是因?yàn)楸疚膽?yīng)用關(guān)聯(lián)規(guī)則算法,最高精準(zhǔn)度地確定了數(shù)據(jù)項(xiàng)數(shù)量數(shù)值,為響應(yīng)時(shí)間的減少奠定基礎(chǔ).
保持上述實(shí)驗(yàn)環(huán)境不變,設(shè)定數(shù)據(jù)分析系統(tǒng)內(nèi)的功能項(xiàng),設(shè)定觀測的操作項(xiàng)名稱如表5所示.
在表5設(shè)定的操作下,控制3種數(shù)據(jù)分析系統(tǒng)處理表中的操作,定義操作在數(shù)據(jù)分析系統(tǒng)中表現(xiàn)與預(yù)期效果一致時(shí),表示數(shù)據(jù)分析系統(tǒng)完成一次數(shù)據(jù)分析過程.統(tǒng)計(jì)并分析不同操作產(chǎn)生的響應(yīng)時(shí)間,并將其作為系統(tǒng)的響應(yīng)時(shí)間,3種數(shù)據(jù)分析系統(tǒng)的響應(yīng)時(shí)間結(jié)果如表6所示.
表5 設(shè)定的觀測操作項(xiàng)名稱
表6 3種數(shù)據(jù)分析系統(tǒng)對(duì)操作的響應(yīng)時(shí)間
控制3種數(shù)據(jù)分析系統(tǒng)同時(shí)處理設(shè)定的操作后,根據(jù)統(tǒng)計(jì)得到的響應(yīng)時(shí)間可知,文獻(xiàn)[3]中數(shù)據(jù)分析系統(tǒng)實(shí)際的響應(yīng)時(shí)間在5.5s左右,系統(tǒng)的響應(yīng)時(shí)間最長;文獻(xiàn)[8]中的數(shù)據(jù)分析系統(tǒng)的響應(yīng)時(shí)間在4.2 s左右,系統(tǒng)的響應(yīng)時(shí)間較長;而設(shè)計(jì)的分析系統(tǒng)對(duì)操作的響應(yīng)時(shí)間在1.3 s左右,與兩種文獻(xiàn)中的數(shù)據(jù)分析相比,設(shè)計(jì)得到的數(shù)據(jù)分析系統(tǒng)的響應(yīng)時(shí)間最短.綜合上述系統(tǒng)測試結(jié)果可知,與現(xiàn)有數(shù)據(jù)分析系統(tǒng)相比,設(shè)計(jì)得到的數(shù)據(jù)分析系統(tǒng)的性能最佳.這是因?yàn)楸疚姆椒▽⒄麄€(gè)系統(tǒng)軟件部分的數(shù)據(jù)分析功能模塊化處理,根據(jù)設(shè)定的關(guān)聯(lián)規(guī)則,在線分析體質(zhì)測試數(shù)據(jù)在健康標(biāo)準(zhǔn)中所處的位置,計(jì)算得到體測數(shù)據(jù)項(xiàng)的流形程度,有針對(duì)性地生成實(shí)際所需的健康數(shù)據(jù)分析規(guī)則,提高響應(yīng)時(shí)間.
在關(guān)聯(lián)規(guī)則的支持下,設(shè)計(jì)一種大學(xué)生體質(zhì)測試健康數(shù)據(jù)分析系統(tǒng),在硬件優(yōu)化的基礎(chǔ)上,將大學(xué)生體質(zhì)測試健康數(shù)據(jù)分析系統(tǒng)劃分為登錄模塊、數(shù)據(jù)管理模塊、數(shù)據(jù)分析模塊以及數(shù)據(jù)回調(diào)模塊等.根據(jù)設(shè)定的關(guān)聯(lián)規(guī)則,以最小置信度為篩選準(zhǔn)則,對(duì)數(shù)據(jù)中的數(shù)據(jù)項(xiàng)進(jìn)行反復(fù)篩選,設(shè)置身體素質(zhì)情況判斷的體質(zhì)測試指標(biāo),在線分析體質(zhì)測試數(shù)據(jù)在健康標(biāo)準(zhǔn)中所處的位置,有針對(duì)性地生成實(shí)際所需的健康數(shù)據(jù)分析規(guī)則,確定了數(shù)據(jù)項(xiàng)數(shù)量數(shù)值,能夠改善現(xiàn)有數(shù)據(jù)分析系統(tǒng)響應(yīng)時(shí)間過長的問題,為今后判斷大學(xué)生體測數(shù)據(jù)健康狀態(tài)提供一定的理論參考.