摘要:在體育訓練中,針對不同類型的運動員制定正確的訓練計劃和執(zhí)行方案至關重要.模糊建模與免疫算法 相結(jié)合的機器學習方法可用于優(yōu)化游泳運動員的訓練.綜合考慮游泳運動員的能力水平、體能狀況、技術(shù)熟練 程度以及訓練目標等多種因素,實驗中建立了12個屬性的數(shù)據(jù)集,這些屬性被分為離散型和連續(xù)型兩類.在數(shù) 據(jù)收集過程中,考慮到個體差異和訓練過程中的不確定性,對每個屬性進行了差異化和連續(xù)化處理.使用機器 學習方法對游泳訓練進行建模,可以更好地理解和指導運動員的訓練過程. 關鍵詞:機器學習;游泳訓練;水中感受預測模型
中圖分類號:G861.1
文獻標志碼:A
Research on Swimming Training Method Based on Machine Learning
GAO Xue-bo1, YANG Ji-hong2
(1. Northern Anhui Health Vocational College, Suzhou 234000, Anhui, China;
2. Anhui University of Science and Technology, Huainan 232001, Anhui, China)
Abstract:In sports training, it is very important to make correct training plans and implementation plans for different types of athletes. The machine learning method combining fuzzy modeling and immune algorithm can be used to optimize the training of swimmers. Considering the ability level, physical condition, technical proficiency and training objectives of swimmers, a data set of 12 attributes is established in the experiment, which are divided into two categories: discrete and continuous. In the process of data collection, each attribute is differentiated and continuous to consider individual differences and uncertainties in the training process. By using machine learning method to model swimming training, we can better understand and guide the training process of athletes.
Key words; machine learning; swimming training; data collection; modeling; instructing training
0 引言
在運動領域中, 制訂和執(zhí)行正確的訓練計劃至關重要. 特別是在游泳這種高效率的體育運動中, 在適當時間給予每個運動員準確刺激的方法顯得尤為重要. 當訓練組涉及不同類型的運動員和專業(yè)時, 這一挑戰(zhàn)變得更加復雜.目前, 數(shù)字體育和智能訓練成為了國內(nèi)外體育領域的研究熱點. 吳彰忠等[ 1]指出信息化時代數(shù)字與體育將會繼續(xù)相互加持, 不斷開拓中國式現(xiàn)代化體育新道路, 楊國慶[ 2]指出能以算法自動生成個性化訓練指導方案, 霍波等[ 3]研究了人工智能技術(shù)在體育領域的應用現(xiàn)狀及未來發(fā)展趨勢, 蘇宴鋒等[ 4]探討了人工智能如何提升運動表現(xiàn)以及構(gòu)建人工智能體育化的理論支撐與政策環(huán)境的優(yōu)化策略, 胡海旭等[ 5]指出機器學習為賦能個性化、 瞬時動態(tài)、 反饋等精準訓練方法提供了強力支撐. 國外的研究表明, 智能運動訓練( S S T) 領域中常用的智能數(shù)據(jù)分析方法—S S T 方法已比較成熟[ 6], 提出了一種用于適應人類運動的教學系統(tǒng)的機器學習方法, 利用在線分類的運動信號,以選擇適當?shù)慕虒W算法的自動系統(tǒng)的原型[ 7]. 從近年來的研究文獻來看, 機器學習在體育運動訓練中的應用將是未來體育訓練方法研究的熱點,但國內(nèi)關于機器學習在游泳運動訓練中應用的研究很少.
本文旨在研究如何將模糊建模與免疫算法相結(jié)合的機器學習方法應用于游泳運動訓練中. 這種方法基于對訓練刺激和運動員反應的模糊理解, 同時考慮到個體差異和訓練過程中的不確定性. 通過將這種機器學習技術(shù)與傳統(tǒng)的訓練方法相結(jié)合, 希望能夠為教練做訓練決策提供一種有效的工具, 改善運動員的訓練效果.
1 實驗設計
1.1 實驗數(shù)據(jù)收集
通過調(diào)研和咨詢游泳部門的教練, 建立了1 2個獨立的屬性來模擬游泳訓練, 如表1所列. 這些屬性被分為兩類: 離散型( D) 和連續(xù)型( C) . 離散型屬性包括性別、 刺激因素、 水上訓練次數(shù)、 地面訓練次數(shù)、 體驗和感受, 而連續(xù)屬性包括年齡、 時刻、 睡眠時長、 睡眠前后脈搏數(shù)差、 時間、 距離. 其中, 刺激因素屬性又包含: 無訓練( B) 、 維持訓練( A 1) 、 有氧訓練( A 2) 、 閾訓練( T) 、 最大攝氧量訓練( VO2) 、 無氧訓練酸乳-速率訓練( AN 1) 、 無氧訓練酸乳-乳酸耐受( AN 2) 、 無氧訓練非酸乳( S) . “ 體驗和感受” 屬性分為5種: 非常差( VB) 、差( B) 、 中等( M) 、 好( G) 、 非常好( VG) .
在處理數(shù)據(jù)時, 針對每個人可能有不同的感受和體驗進行個性化處理. 例如, 男性醒來后的脈搏可能與女性的完全不同, 因此在處理這些數(shù)據(jù)時需要考慮到個體的差異[ 8]. 在處理“ 時刻” 屬性時, 例如被檢查的人會在夜里睡覺, 由于數(shù)據(jù)的連續(xù)性問題, 所以某些時刻的小時值要加上2 4, 并將以分鐘為單位的值轉(zhuǎn)換為小時的小數(shù)部分. 這樣做是為了保持數(shù)據(jù)的連續(xù)性, 并使系統(tǒng)能夠正確理解入睡時間. 同樣, 將“ 時刻” 屬性中的分鐘轉(zhuǎn)換為十進制值也是為了將數(shù)據(jù)轉(zhuǎn)換為計算機系統(tǒng)可以理解的形式. 這些預處理步驟的目的是減少數(shù)據(jù)集中的屬性數(shù)量, 提高數(shù)據(jù)的質(zhì)量和一致性,以便后續(xù)的機器學習或數(shù)據(jù)分析工作能夠更有效地進行.
將數(shù)據(jù)收集以電子表格形式分發(fā)給游泳運動員, 在兩個月內(nèi)完成表格的填寫. 表2中收集了各種屬性, 包括性別、 年齡、 訓練時刻、 睡眠時長、 睡眠前/后脈搏數(shù)差、 站立前/后脈搏數(shù)差、 刺激因素、 刺激持續(xù)時間、 水上訓練次數(shù)、 地面訓練次數(shù)、白天游泳距離以及在常規(guī)熱身后下午訓練中的感受. 對收集的數(shù)據(jù)進行處理, 并將特定屬性的值進行了統(tǒng)一. 在收集的數(shù)據(jù)中存在著一些不完整的記錄, 對于某些缺失的數(shù)據(jù), 允許游泳運動員填寫“ -” . 在4 8 0條數(shù)據(jù)記錄中, 只有1 3 6條是合格的( 沒有任何缺失值) . 本文使用分布平衡分層交叉驗證進行實驗, 將數(shù)據(jù)集劃分為多個折時提供平衡的組內(nèi)分布來提高估計質(zhì)量. 然后, 利用 KL散度( K u l l b a c k - L e i b l e rd i v e r g e n c e ) 計算數(shù)據(jù)集中每個屬性的信息增益, 并利用配對t檢驗對所得結(jié)果進行統(tǒng)計學分析. 通過這些分析, 可以了解哪些屬性對于預測或解釋游泳運動員的訓練體驗和感受最有價值, 從而為優(yōu)化訓練方案和提高運動員表現(xiàn)提供依據(jù).
1.2 機器學習算法
模糊邏輯通過使用模糊集來定義重疊的類定義來改進分類任務[ 9]. 這種數(shù)據(jù)挖掘算法發(fā)現(xiàn)了一組形式為“ I F( 模糊條件) THEN( 類) ” 的規(guī)則,其解釋為: 如果一個實例的屬性值滿足模糊條件,則該實例屬于該規(guī)則所預測的類. 已經(jīng)通過不同的技術(shù)實現(xiàn)了從數(shù)據(jù)中自動構(gòu)造模糊分類規(guī)則,例如神經(jīng)模糊方法, 基于遺傳算法的規(guī)則選擇以及模糊聚類與其他方法的組合, 例如模糊關系和遺傳算法優(yōu)化. 其中的一個方法是集成人工免疫系統(tǒng)( A I S) 和模糊系統(tǒng), 一種基于 A I S的模糊規(guī)則挖掘方法是I F RA I S( 人工免疫系統(tǒng)模糊規(guī)則歸納) , 使用順序覆蓋和克隆 選擇來 學習I F -THEN模糊規(guī)則. I F RA I S的速度和有效性分別通過緩沖規(guī)則, 使用初始均勻種群和模糊分區(qū)學習得到顯著提高. 基于 A I S的挖掘I F - THEN 規(guī)則的算法之一是基于用遺傳算法擴展否定選擇算法. 另一種主要集中在克隆選擇和所謂的提升機制, 以適應迭代中訓練實例的分布. 本文旨在使用改進的I F RA I S方法進行運動訓練建模.I F RA I S是一種模糊規(guī)則歸納方法, 是將人工免疫系統(tǒng)的進化機制應用于模糊規(guī)則的學習.該方法將訓練集視為抗原, 模糊規(guī)則視為抗體, 通過克隆選擇算法來選擇最佳的模糊規(guī)則進行學習. 在克隆選擇算法中, 首先創(chuàng)建一個初始的抗體群體, 然后對每個抗體進行適應度計算, 適應度計算是根據(jù)抗體與訓練集的匹配程度來確定的. 然后進行選擇、 交叉和變異操作, 以產(chǎn)生新的抗體群體. 這個過程反復進行, 直到滿足終止條件. 在I F RA I S中, 每個模糊規(guī)則的前件是由模糊條件的合取構(gòu)成的, 每個模糊條件對應一個屬性. 在開始時, 所有屬性( 包括離散屬性和連續(xù)屬性) 都會通過隸屬函數(shù)進行模糊化處理. 在學習過程中,I F RA I S使用順序覆蓋作為主要的學習算法. 首先, 一組規(guī)則被初始化為空集; 然后, 對于每個待預測的類, 算法會使用所有訓練樣本對訓練集進行訓練, 并以當前訓練集和待預測的類為參數(shù)迭代調(diào)用克隆選擇過程, 克隆選擇過程返回一個發(fā)現(xiàn)的規(guī)則; 接下來將該規(guī)則添加到規(guī)則集, 并從當前訓練集中刪除已被進化規(guī)則正確覆蓋的示例,對于所有未覆蓋的示例, 分配在完整訓練集中最常見的類.
2 模型驗證實驗
為了驗證所提模型的有效性, 進行了水中感受預測模型實驗和水中感受預測與規(guī)則優(yōu)化實驗.
2.1 水中感受預測模型實驗( 實驗一)
實驗主要測試模型是否能夠傳遞訓練單元、如何影響受訓者第二天在水中的感受. 為了解決這個問題, 通過設置模型的參數(shù)、 執(zhí)行模糊分區(qū)的學習、 檢查接收到的規(guī)則的有效性, 并咨詢訓練員和游泳者接收到的結(jié)果. 所有實驗重復1 0次, 使用5倍交叉驗證, 運行環(huán)境為2. 8 0GH z的奔騰與2. 0 0G B的 RAM. 改進后的I F RA I S在 NE T2. 0環(huán)境下用C#語言實現(xiàn). 分頻因子r=3, 抗體的初始群體大小等于5 0, 并且激活閾值L 設定為0. 1.
本實驗的目的是研究所提出的負荷訓練模型和機器學習工具是否能夠幫助游泳者找到控制他們在水中感覺的規(guī)則. 改進的I F RA I S預測的類是“ 體驗和感受” 屬性, 學習的規(guī)則集由7個規(guī)則組成, 如表3所列, 每個規(guī)則包括與合取詞和類的預測值相連接的條件列表. 在實驗中, 接收到的規(guī)則與模糊屬性完全的有效性提高了5 3. 2 1%. 這是一個相當?shù)偷慕Y(jié)果( 接近隨機) , 但接收到的規(guī)則的可用性仍然值得考慮.
通過規(guī)則可以看到, 規(guī)則缺少 V B值, 原因是這個值從未在學習集中使用過. 另一個結(jié)論是, 類M 和G的兩個值有一個以上的規(guī)則生成. 然而,這些是來自“ 體驗和感受” 屬性的標度中心的值,并且對于受訓者來說并不那么重要. 考慮到量表中最重要值的集合的最后一條規(guī)則, 在被測游泳運動員小組中, 受訓者在以下情況下的感受最好:①游泳者在前一天晚上1 0點到凌晨2點半之間睡覺; ②訓練前一天入睡前的脈搏與醒來后的脈搏之間的差異約1. 5~2. 9; ③站立后的脈搏與醒后的脈搏之差大于5; ④訓練前一天的刺激持續(xù)時間不長于4 5m i n; ⑤訓練之前的游泳里程不大于1 1. 5k m, 在此期間游泳者具有非常好的感覺,滿足某些條件可以增加游泳者在水中的良好感覺, 但考慮到規(guī)則集的有效性, 可能存在很多例外. 這種低效率的原因是, 學員們根據(jù)自己的主觀感覺調(diào)整尺度來適應每個價值, 而且每個游泳運動員的感覺范圍可能不同, 這無疑對機器學習產(chǎn)生了影響. 此外, 輸入數(shù)據(jù)的3個屬性( 涉及受訓者的性別、 水中的培訓次數(shù)和地面的培訓次數(shù)) 是明確和客觀的, 但沒有出現(xiàn)在任何規(guī)則中.
2.2 水中感受預測與規(guī)則優(yōu)化實驗( 實驗二)
水中感受預測與規(guī)則優(yōu)化實驗與水中感受預測模型實驗類似, 但改變了對游泳者感受的描述方式. 最終結(jié)果是由推斷的模糊分區(qū)的屬性和學習的模糊規(guī)則集所呈現(xiàn)的. 這些結(jié)果可以提供關于訓練單元如何影響受訓者第二天在水中的感受的重要信息. 水中感受預測與規(guī)則優(yōu)化實驗是為了驗證一個假設, 即簡化感受量表可以提高推斷規(guī)則的質(zhì)量( 有效性) . 預測屬性量表的變化旨在概括感受, 并消除因受訓者的個性化感受量表而產(chǎn)生的差異. 對這種修改的數(shù)據(jù)集進行研究, 將先前實驗中預測屬性中相同的兩個值是否涉及到不同的感覺.
實驗后接收的規(guī)則集由6個規(guī)則組成, 如表4所列. 學習規(guī)則集的有效性提高了6 8. 5 6%. 它比之前實驗的有效性高出1 5. 3 5%. 減少預測屬性中的值減少了由多個值重疊的區(qū)域的數(shù)量, 因此增加了類別的可預測性. 此外, 規(guī)則的數(shù)量也有所減少, 從水中感受預測模型實驗中改進的I F -RA I S推斷出7條規(guī)則, 而這個實驗結(jié)束時只有6條規(guī)則.
需要注意的是, 在學習規(guī)則中忽略了4個屬性, 即性別、 睡眠時長、 站立前/后脈搏數(shù)差、 地面訓練. 兩個實驗中從未使用過兩個屬性. 這些屬性涉及受訓者的性別和在當?shù)亟邮芘嘤柕拇螖?shù). 根據(jù)培訓師和參加研究的學員的意見, 似乎假設是真實的, 但假設需要進一步研究. 另外兩個屬性睡眠時長、 站立前/后脈搏數(shù)差在水中感受預測與規(guī)則優(yōu)化實驗中被規(guī)則集忽略, 在水中感受預測模型實驗中學習的規(guī)則使用了這兩個屬性. 這可能是水中感受預測模型實驗中規(guī)則對學習集過度調(diào)整的結(jié)果, 這是由于缺乏預測類的給定值的語義后果造成的.
為了使受訓者在水中感覺良好( 類值 G) , 在解釋實驗結(jié)果時必須滿足以下3個規(guī)則之一: ①規(guī)則4: 在前一天午夜前或凌晨3點后睡覺; 達到訓練當天醒來后的脈搏與從床上站起來后的脈搏之間的差異, 該差異必須低于2或大于6; 在訓練前一天游泳不超過9. 5k m. ②規(guī)則5: 不遲于午夜半時入睡; 實現(xiàn)訓練當天醒來后的脈搏與當天從床上起床后的脈搏之間的差異, 差異必須高于2且低于6; 在水中進行兩次訓練或根本不進行水中訓練. ③規(guī)則6: 達到訓練當天醒來后的脈搏與當天起床后的脈搏之間的差值, 差值必須高于1 . 5且低于5; 參加訓練, 在此期間所進行的刺激將持續(xù)不少于3 0m i n; 在訓練前一天游泳不超過2 . 5k m.
2.3 不同機器學習算法的準確性比較
不同機器學習算法在分類問題上的表現(xiàn)及其機理各不相同, 現(xiàn)將改進的I F RA I S算法與傳統(tǒng)分類器算法的性能進行比較. 支持向量機( s u p -p o r tv e c t o rm a c h i n e , S VM) 算法通過支持向量機進行分類, 它通過找到一個最優(yōu)的超平面, 將不同類別的數(shù)據(jù)分隔開. 樸素貝葉斯( n a i v eb a y e s ,N B) 算法的原理是基于貝葉斯定理進行分類的,假設屬性之間是獨立的, 通過計算每個屬性的條件概率以及類條件概率, 來預測樣本所屬的類別[ 1 0]. K S t a r算法是一個基于實例的分類器, 通過分析數(shù)據(jù)集的特征之間的關系, 建立一棵決策樹, 并使用這棵樹對新的樣本進行分類. 元結(jié)束( M e t aEND) 算法則是將每個分類器的判斷表示為特征向量, 并再次進行分類, 由元分類器做出最終決策. 超管道( H y p e rP i p e) 算法則是通過構(gòu)建超管道來進行分類的, 每個超管道包含了來自某個類中的所有屬性值, 通過比較樣本與超管道的相似度來進行分類. 不同機器學習算法在兩個數(shù)據(jù)集上的準確率如表5所列, 結(jié)果顯示改進的I F RA I S方法的結(jié)果在水中感受預測模型實驗和水中感受預測與規(guī)則優(yōu)化實驗中分別是5 2. 7 8±2. 7 4、 6 8. 5 9±1. 9 6, 顯著高于其他機器學習算法,改進的I F RA I S方法在分類精度上具有優(yōu)越性.
3 結(jié)語
本文提出的將模糊建模與免疫算法相結(jié)合的機器學習方法, 為游泳訓練提供了新的視角和工具. 基于 A I S的模糊規(guī)則挖掘方法I F RA I S是一種有效的數(shù)據(jù)挖掘方法, 適合處理復雜的分類問題. 比較不同的機器學習算法在兩個實驗中的效果, 可以看出, 改進的I F RA I S方法的結(jié)果在兩個實驗中的準確率分別是5 2. 7 8±2. 7 4、 6 8. 5 9±1 . 9 6, 明顯高于其他傳統(tǒng)算法. 說明使用機器學習方法對游泳訓練進行建模, 可以更好地指導運動員的訓練過程, 可以幫助教練根據(jù)運動員的反應和適應情況調(diào)整訓練計劃, 從而優(yōu)化訓練效果. 改進的I F RA I S機器學習算法為運動科學領域的發(fā)展提供了新的思路和方法, 為提高運動員的訓練效果提供借鑒.
參考文獻:
[1]吳彰忠,鐘亞平,張立,等.中國式現(xiàn)代化體育新道路: 數(shù)字體育的使命與路向[J].體育科學,2023,43(6): 3-12.
[2]楊國慶.整合分期:當代運動訓練模式變革的新思維 [J].體育科學,2020,40(4):3-14.
[3]霍波,李彥鋒,高騰,等.體育人工智能領域關鍵技術(shù) 的研究現(xiàn)狀和發(fā)展方向[J].首都體育學院學報,2023,35(3):223-256.
[4]蘇宴鋒,趙生輝,李文浩,等.人工智能提升運動表現(xiàn) 的前沿進展、困境反思與優(yōu)化策略[J].上海體育學院 學報,2023,47(2):104-118.
[5]胡海旭,金成平.智能化時代的個性化訓練一機器學 習應用研究進展與數(shù)字化未來[J].體育學研究,2021,35(4):9-19.
[6] RAJSP A,F(xiàn)ISTER I. A systematic literature review of intelligent data analysis methods for smart sport training[J]. Applied Sciences,2020,10(9) :3013.
[7] WOJCIK K, PIEKARCZYK M. Machine learning method-ology in a system applying the adaptive strategy for teaching human motions[J]. Sensors,2020,20(1):105-112.
[8]李海鵬,陳小平,何衛(wèi),等.科技助力競技體育:運動訓 練中可穿戴設備的應用與發(fā)展[J].成都體育學院學 報,2020,46(3):19-25.
[9]宋群,袁青霞,王俊江.基于自動機器學習的運動過程 心電檢測算法[J].西北大學學報(自然科學版),2023,53(5):771-781.
[10]黃小杰,劉芝秀,鄧梓楊,等.基于Gauss分布和Gram-Schmidt正交化的樸素貝葉斯分類算法[J].南昌大學學報(理科版),2023,47(3):213-217.
[責任編輯:紀彩虹]