摘要:人工智能技術(shù)(AI)作為一項(xiàng)現(xiàn)代信息技術(shù),在各行各業(yè)中的應(yīng)用日益廣泛。在體育領(lǐng)域,人工智能技術(shù)在群眾體育參與、運(yùn)動(dòng)隊(duì)訓(xùn)練和競(jìng)技體育對(duì)抗等方面滲透日益深入,人工智能驅(qū)動(dòng)體育已成為現(xiàn)代體育發(fā)展的一項(xiàng)全新課題。2017年,伴隨著AlphaGo戰(zhàn)勝韓國(guó)著名棋手李世石在世界范圍內(nèi)引發(fā)轟動(dòng),人工智能對(duì)現(xiàn)代圍棋運(yùn)動(dòng)的影響進(jìn)入到一個(gè)新的階段。圍棋作為一項(xiàng)復(fù)雜的智力運(yùn)動(dòng),AlphaGo借助人工智能技術(shù)對(duì)職業(yè)棋手和業(yè)余高段棋手的棋譜進(jìn)行學(xué)習(xí),并通過(guò)直覺(jué)獲取、搜索驗(yàn)證和優(yōu)化選擇戰(zhàn)勝世界頂尖棋手,展示出人工智能技術(shù)強(qiáng)大的學(xué)習(xí)能力和計(jì)算能力。本研究運(yùn)用案例研究法、文獻(xiàn)法等研究方法,基于人工智能技術(shù),以促進(jìn)現(xiàn)代圍棋運(yùn)動(dòng)發(fā)展為目標(biāo),通過(guò)對(duì)AlphaGo核心方法及對(duì)弈策略進(jìn)行分析,探討人工智能技術(shù)在現(xiàn)代圍棋運(yùn)動(dòng)教學(xué)與訓(xùn)練實(shí)踐中的運(yùn)用。研究結(jié)果表明:人工智能技術(shù)在現(xiàn)代競(jìng)技體育數(shù)據(jù)分析和比賽預(yù)測(cè)、視頻分析和輔助裁判、運(yùn)動(dòng)員運(yùn)動(dòng)表現(xiàn)分析和改善、競(jìng)技體育訓(xùn)練和運(yùn)動(dòng)康復(fù)、比賽直播和娛樂(lè)體驗(yàn)等方面均具有涉獵,AlphaGo基于人工智能“深度學(xué)習(xí)”原理,運(yùn)用深度神經(jīng)網(wǎng)絡(luò)的棋感直覺(jué)訓(xùn)練和蒙特卡洛樹(shù)搜索的搜索驗(yàn)證計(jì)算方法對(duì)棋局的預(yù)判已遠(yuǎn)超職業(yè)圍棋選手的思考深度,在人機(jī)對(duì)弈中具有極大的優(yōu)勢(shì)。
關(guān)鍵詞:圍棋 "人機(jī)大戰(zhàn) "人工智能 "競(jìng)技體育
中圖分類(lèi)號(hào):G80 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8902-(2024)-07-184-3-ZL
1、人工智能技術(shù)概述
人工智能技術(shù)(AI),又稱(chēng)為機(jī)器智能,它的目標(biāo)是使計(jì)算機(jī)能夠執(zhí)行類(lèi)似于人類(lèi)的智能任務(wù),是現(xiàn)代信息技術(shù)與經(jīng)濟(jì)社會(huì)各領(lǐng)域深度融合的產(chǎn)物。人工智能技術(shù)通過(guò)模擬人類(lèi)智能行為和思維過(guò)程的計(jì)算機(jī)系統(tǒng)和算法,通過(guò)訓(xùn)練模型使用大量數(shù)據(jù)來(lái)讓計(jì)算機(jī)自動(dòng)學(xué)習(xí)和改進(jìn)性能。現(xiàn)代信息技術(shù)的發(fā)展,極大地促進(jìn)了人工智能技術(shù)與經(jīng)濟(jì)社會(huì)發(fā)展的融合,并為海量數(shù)據(jù)處理、復(fù)雜決策制定提供了可行性方案,并在社會(huì)經(jīng)濟(jì)各個(gè)領(lǐng)域得以廣泛應(yīng)用,極大地促進(jìn)了現(xiàn)代社會(huì)的發(fā)展和生產(chǎn)生活效率的提升。人工智能技術(shù)作為現(xiàn)代信息技術(shù)的產(chǎn)物,其與體育領(lǐng)域結(jié)合日益緊密,在運(yùn)動(dòng)訓(xùn)練、競(jìng)技體育、休閑體育等方面不斷拓展其功能與應(yīng)用范圍,在提高運(yùn)動(dòng)訓(xùn)練的科學(xué)性、競(jìng)技體育的對(duì)抗性和休閑體育的娛樂(lè)性等方面產(chǎn)生了巨大影響,對(duì)于促進(jìn)現(xiàn)代體育運(yùn)動(dòng)發(fā)展,引領(lǐng)健康生活方式具有重要意義。
2、人工智能技術(shù)與現(xiàn)代競(jìng)技體育的耦合
2021年8月,國(guó)家委員會(huì)發(fā)布《全民健身計(jì)劃(2021-2025)年》,指出“促進(jìn)數(shù)據(jù)賦能智能體育等”,明確提出:“鼓勵(lì)互聯(lián)網(wǎng)、區(qū)塊鏈、物聯(lián)網(wǎng)、虛擬現(xiàn)實(shí)、人工智能等技術(shù)在體育運(yùn)動(dòng)方面的創(chuàng)新應(yīng)用?!比斯ぶ悄茉隗w育中的研發(fā)應(yīng)用已經(jīng)上升為國(guó)家意志,對(duì)于我國(guó)體育強(qiáng)國(guó)目標(biāo)的實(shí)現(xiàn)具有至關(guān)重要的戰(zhàn)略意義。
體育作為人類(lèi)文化的重要組成部分,自人類(lèi)的產(chǎn)生便應(yīng)運(yùn)而生。體育作為一種人類(lèi)有意識(shí)、有目的的文化活動(dòng),其產(chǎn)生具有深刻的文化基礎(chǔ)和社會(huì)物質(zhì)基礎(chǔ)。原始社會(huì)人類(lèi)最基本的走、跑、跳躍、投擲、攀登、爬越等行為便是現(xiàn)代體育運(yùn)動(dòng)的萌芽,而其作為原始人類(lèi)一種最基本的生產(chǎn)勞動(dòng)和日常生活的技能,也具有深刻的社會(huì)物質(zhì)基礎(chǔ)。由此可見(jiàn),體育作為上層建筑的一種,其依賴(lài)于社會(huì)物質(zhì)基礎(chǔ)。現(xiàn)代信息技術(shù)的發(fā)展,在促進(jìn)競(jìng)技社會(huì)飛速發(fā)展的同時(shí),也對(duì)體育的發(fā)展具有深刻影響。2014年,美國(guó)谷歌公司首先將現(xiàn)代計(jì)算機(jī)技術(shù)與體育相結(jié)合,開(kāi)發(fā)AlphaGo計(jì)算機(jī)程序,旨在將人工智能技術(shù)運(yùn)用于圍棋運(yùn)動(dòng)。由此開(kāi)始,人工智能技術(shù)開(kāi)始與體育深度結(jié)合,并向諸多領(lǐng)域滲透,“人工智能+體育”便應(yīng)運(yùn)而生。競(jìng)技體育作為現(xiàn)代體育運(yùn)動(dòng)的排頭兵,人工智能技術(shù)在競(jìng)技體育方面的應(yīng)用主要包括運(yùn)動(dòng)員訓(xùn)練輔助、訓(xùn)練及比賽數(shù)據(jù)采集、人工智能輔助裁判等方面,主要運(yùn)用方向如下:
2.1、數(shù)據(jù)分析和比賽預(yù)測(cè)
因數(shù)據(jù)挖掘的廣度性和深度性,人工智能已被廣泛運(yùn)用于現(xiàn)代競(jìng)技比賽數(shù)據(jù)搜集、分析與預(yù)測(cè)等方面。通過(guò)對(duì)大量的比賽數(shù)據(jù)進(jìn)行深度挖掘與分析,提取關(guān)鍵信息,可幫助教練和運(yùn)動(dòng)員制定訓(xùn)練計(jì)劃和比賽戰(zhàn)術(shù)。此外,通過(guò)機(jī)器學(xué)習(xí)算法,人工智能還可以預(yù)測(cè)比賽結(jié)果和個(gè)人表現(xiàn)。
2.2、視頻分析和輔助裁判
人工智能技術(shù)具有強(qiáng)大的視頻采集和視頻傳輸功能,可通過(guò)慢鏡頭回放和多角度攝像頭對(duì)比賽進(jìn)行實(shí)時(shí)監(jiān)控,幫助裁判做出正確判罰。同時(shí),人工智能可以通過(guò)對(duì)比賽視頻進(jìn)行分析,識(shí)別和追蹤運(yùn)動(dòng)員的動(dòng)作和位置,幫助裁判員判斷爭(zhēng)議性決定,例如判定足球比賽中的越位和進(jìn)球是否有效。
2.3、運(yùn)動(dòng)員運(yùn)動(dòng)表現(xiàn)分析和改善
借助人工智能的數(shù)據(jù)挖掘功能,可為運(yùn)動(dòng)員運(yùn)動(dòng)表現(xiàn)提供更精確和全面的分析結(jié)果。現(xiàn)階段,人工智能技術(shù)已廣泛運(yùn)用于運(yùn)動(dòng)員運(yùn)動(dòng)技術(shù)分析和運(yùn)動(dòng)比賽模擬等方面,通過(guò)運(yùn)動(dòng)員在訓(xùn)練及比賽中的生物力學(xué)數(shù)據(jù)進(jìn)行系統(tǒng)監(jiān)測(cè)和分析,如運(yùn)動(dòng)姿勢(shì)、步態(tài)和肌肉活動(dòng),可幫助運(yùn)動(dòng)員提高運(yùn)動(dòng)技術(shù)和優(yōu)化運(yùn)動(dòng)表現(xiàn)。
2.4、競(jìng)技體育訓(xùn)練和運(yùn)動(dòng)康復(fù)
運(yùn)用人工智能技術(shù)對(duì)運(yùn)動(dòng)員生理數(shù)據(jù)和訓(xùn)練負(fù)荷進(jìn)行監(jiān)控和分析,為運(yùn)動(dòng)員提供實(shí)時(shí)的訓(xùn)練負(fù)荷評(píng)估,避免過(guò)度訓(xùn)練和受傷風(fēng)險(xiǎn)。同時(shí),通過(guò)分析運(yùn)動(dòng)員的訓(xùn)練歷史和生理數(shù)據(jù),人工智能可為運(yùn)動(dòng)員推薦適當(dāng)?shù)挠?xùn)練強(qiáng)度和休息周期,設(shè)計(jì)個(gè)性化的訓(xùn)練計(jì)劃和康復(fù)方案。
2.5、比賽直播和娛樂(lè)體驗(yàn)
在現(xiàn)代競(jìng)技體育比賽中,將人工智能技術(shù)運(yùn)用到競(jìng)技體育轉(zhuǎn)播中,可實(shí)時(shí)提供比賽數(shù)據(jù)和技術(shù)分析,幫助觀(guān)眾更好地理解比賽進(jìn)程和結(jié)果。此外,人工智能還可以根據(jù)觀(guān)眾體育興趣和收視偏好,個(gè)性化推薦體育比賽視頻和相關(guān)定制內(nèi)容,為觀(guān)眾提供個(gè)性化體育賽事服務(wù)和豐富體育娛樂(lè)體驗(yàn)。
由以上可知,伴隨著現(xiàn)代計(jì)算機(jī)技術(shù)的發(fā)展,科技與體育結(jié)合越來(lái)越緊密,人工智能技術(shù)已經(jīng)滲透到運(yùn)動(dòng)員選材、訓(xùn)練、比賽等競(jìng)技體育這一縱向序列每個(gè)環(huán)節(jié)。人工智能技術(shù)依托于現(xiàn)代計(jì)算機(jī)技術(shù),通過(guò)對(duì)運(yùn)動(dòng)員的能量消耗、速度、跳躍高度等各項(xiàng)數(shù)據(jù)的抓取、存儲(chǔ)、處理、應(yīng)用,得出運(yùn)動(dòng)員/球隊(duì)技戰(zhàn)術(shù)選擇、戰(zhàn)略戰(zhàn)術(shù)制定等相關(guān)信息,并指導(dǎo)教練員有針對(duì)性地調(diào)整訓(xùn)練策略,改變戰(zhàn)略戰(zhàn)術(shù),避免教練員或運(yùn)動(dòng)員由于主觀(guān)經(jīng)驗(yàn)所帶來(lái)的盲目性;通過(guò)計(jì)算機(jī)的智能算法對(duì)運(yùn)動(dòng)員的動(dòng)作進(jìn)行關(guān)鍵點(diǎn)識(shí)別和分析,分析運(yùn)動(dòng)員人體運(yùn)動(dòng)力學(xué)數(shù)據(jù)和動(dòng)作優(yōu)缺點(diǎn),對(duì)運(yùn)動(dòng)員技術(shù)動(dòng)作進(jìn)行評(píng)估和改進(jìn);通過(guò)對(duì)運(yùn)動(dòng)員能量消耗、速度和心率等數(shù)據(jù)進(jìn)行評(píng)估和預(yù)測(cè),并根據(jù)實(shí)際情況對(duì)模型進(jìn)行修正,深入挖掘數(shù)據(jù)背后的規(guī)律,用于輔助運(yùn)動(dòng)員訓(xùn)練和競(jìng)賽,提高運(yùn)動(dòng)員/運(yùn)動(dòng)隊(duì)訓(xùn)練質(zhì)量和訓(xùn)練效果,提高教練員和運(yùn)動(dòng)員的決策水平。
3、AlphaGo的產(chǎn)生背景及工作原理
阿爾法圍棋(AlphaGo)是第一個(gè)擊敗人類(lèi)職業(yè)圍棋選手、第一個(gè)戰(zhàn)勝?lài)迨澜绻谲姷娜斯ぶ悄軝C(jī)器人,由Alphabet Inc.(谷歌的母公司)的子公司DeepMind Technologies開(kāi)發(fā)的計(jì)算機(jī)程序,旨在將人工智能技術(shù)運(yùn)用于現(xiàn)代圍棋競(jìng)賽。AlphaGo其主要工作原理是“深度學(xué)習(xí)”,具體計(jì)算方法包括基于深度神經(jīng)網(wǎng)絡(luò)的棋感直覺(jué)訓(xùn)練和基于蒙特卡洛樹(shù)搜索的搜索驗(yàn)證。
2016年,AlphaGo與圍棋世界冠軍李世石進(jìn)行了5局比賽,并在5局中贏(yíng)了4局,展現(xiàn)出人工智能技術(shù)對(duì)于人類(lèi)智能的挑戰(zhàn),在世界范圍內(nèi)造成轟動(dòng)。圍棋作為一項(xiàng)具有高度狀態(tài)復(fù)雜度與博弈復(fù)雜度的智力游戲,其計(jì)算方法復(fù)雜、棋形變化多樣,具有超過(guò)10170種狀態(tài)復(fù)雜空間,并涉及邏輯推理、形象思維、優(yōu)化選擇等多種人類(lèi)智能思維,AlphaGo的此次勝利促使人類(lèi)對(duì)人工智能的作用進(jìn)行重新審視。
對(duì)AlphaGo計(jì)算與學(xué)習(xí)方法進(jìn)行分析可知,AlphaGo使用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù),通過(guò)對(duì)人類(lèi)數(shù)千年圍棋棋譜進(jìn)行分析,以及與自己對(duì)弈以進(jìn)一步提高其技能。并運(yùn)用包括深度神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹(shù)搜索,用于評(píng)估和制定對(duì)弈的戰(zhàn)略行動(dòng)。通過(guò)對(duì)AlphaGo棋形進(jìn)行分析可知,AlphaGo展現(xiàn)了獨(dú)特的圍棋風(fēng)格,并具有優(yōu)秀的大局觀(guān)和強(qiáng)大的總體把握能力,其簡(jiǎn)明直接的局部定型,在最大限度地降低棋形復(fù)雜性的同時(shí),也將計(jì)算機(jī)強(qiáng)大的計(jì)算能力得到最大化。
AlphaGo的成功對(duì)人工智能和機(jī)器學(xué)習(xí)領(lǐng)域產(chǎn)生了重大影響。它展示出深度學(xué)習(xí)技術(shù)在解決復(fù)雜問(wèn)題方面的巨大潛力,并為人工智能系統(tǒng)在競(jìng)技體育等多個(gè)領(lǐng)域超越人類(lèi)開(kāi)辟了新的可能性。
4、AlphaGo計(jì)算方法分析
4.1、基于深度神經(jīng)網(wǎng)絡(luò)的棋感直覺(jué)訓(xùn)練
棋感直覺(jué),是高水平圍棋棋手對(duì)弈的首要要素,其反映出職業(yè)棋手長(zhǎng)期學(xué)習(xí)、訓(xùn)練、對(duì)弈的經(jīng)驗(yàn)積累。通過(guò)對(duì)圍棋對(duì)弈軟件進(jìn)行分析可知,雖然目前軟件市場(chǎng)圍棋對(duì)弈軟件眾多,但是否具有棋感直覺(jué)是區(qū)分圍棋軟件棋力是否具有競(jìng)爭(zhēng)力的核心所在。部分圍棋軟件通過(guò)計(jì)算機(jī)算法將每一步走法通過(guò)適配圍棋規(guī)則進(jìn)行模式化設(shè)置,導(dǎo)致圍棋棋形模式化嚴(yán)重,競(jìng)爭(zhēng)力較低,不具備圍棋的棋感直覺(jué)。AlphaGo通過(guò)深度神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí),獲得圍棋棋感直覺(jué),并且通過(guò)高強(qiáng)度訓(xùn)練以獲得遠(yuǎn)超專(zhuān)業(yè)棋手的個(gè)人能力。
(1)策略網(wǎng)絡(luò):落子棋感。
策略網(wǎng)絡(luò)是一種基于神經(jīng)網(wǎng)絡(luò)的人工智能模型,通過(guò)學(xué)習(xí)歷史數(shù)據(jù)和棋局特征,能夠預(yù)測(cè)并選擇最佳的落子位置。AlphaGo借助深度神經(jīng)網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)功能,在數(shù)據(jù)采集階段獲取大量的棋局?jǐn)?shù)據(jù),通過(guò)學(xué)習(xí)職業(yè)棋手和業(yè)余高段棋手的棋譜的數(shù)十萬(wàn)份棋譜和上億數(shù)量級(jí)的落子方式,通過(guò)大規(guī)模數(shù)據(jù)的迭代訓(xùn)練,不斷優(yōu)化使策略網(wǎng)絡(luò)。通過(guò)策略網(wǎng)絡(luò)的訓(xùn)練,可使模型對(duì)不同棋局的落子情況進(jìn)行準(zhǔn)確預(yù)測(cè),并根據(jù)當(dāng)前的棋局狀態(tài)和歷史數(shù)據(jù),通過(guò)模型的并行計(jì)算,評(píng)估每個(gè)落子位置的勝率和潛在價(jià)值,為棋手提供最優(yōu)的決策建議,快速地進(jìn)行棋盤(pán)評(píng)估并使棋手能夠即刻做出決策。這種訓(xùn)練方式類(lèi)似于專(zhuān)業(yè)棋手在日常圍棋訓(xùn)練中的打譜和復(fù)盤(pán)練習(xí),通過(guò)高強(qiáng)度和高重復(fù)性的打譜與棋形練習(xí),獲得在圍棋棋盤(pán)上落子的棋感。
(2)價(jià)值網(wǎng)絡(luò):勝負(fù)棋感。
勝負(fù)棋感是指在棋類(lèi)對(duì)弈中,玩家通過(guò)推演、策略和決策,獲得勝利或者遭受失敗時(shí)所產(chǎn)生的一種獨(dú)特感受。勝負(fù)感作為運(yùn)動(dòng)員對(duì)于參與競(jìng)技體育運(yùn)動(dòng)所產(chǎn)生的的一種獲得成功與失敗主觀(guān)體驗(yàn),對(duì)于運(yùn)動(dòng)員激發(fā)自我潛能,修正比賽策略,積累比賽信心具有重要作用。AlphaGo通過(guò)價(jià)值網(wǎng)絡(luò)模擬人類(lèi)決策過(guò)程,實(shí)現(xiàn)在棋類(lèi)對(duì)弈中達(dá)到對(duì)人工智能勝負(fù)棋感培養(yǎng)的目標(biāo),其作為一種深度神經(jīng)網(wǎng)絡(luò)的增強(qiáng)型學(xué)習(xí)工具,是人工智能領(lǐng)域的重要研究方向?;趧儇?fù)棋感的價(jià)值網(wǎng)絡(luò)運(yùn)行邏輯是通過(guò)計(jì)算機(jī)的自我博弈,對(duì)計(jì)算機(jī)的每一次落子在不同盤(pán)面下的勝負(fù)情況進(jìn)行估算,并通過(guò)計(jì)算機(jī)深度學(xué)習(xí)的方法對(duì)勝負(fù)棋感模擬,從而獲取在圍棋盤(pán)面的勝負(fù)棋感,并通過(guò)對(duì)每一次落子的勝負(fù)棋感進(jìn)行積累,使計(jì)算機(jī)在每一次落子時(shí)都可模擬人類(lèi)決策過(guò)程,對(duì)每一次落子的勝負(fù)棋感進(jìn)行評(píng)估,從而形成類(lèi)似于人類(lèi)的勝負(fù)棋感,使計(jì)算機(jī)具有人類(lèi)的思維感知和對(duì)于棋局的判斷能力,從而提高計(jì)算機(jī)的決策質(zhì)量和效率。
4.2、基于蒙特卡洛樹(shù)搜索的搜索驗(yàn)證
在圍棋對(duì)弈中,沒(méi)有棋感直覺(jué)不行,完全依賴(lài)棋感直覺(jué)也不行。而棋感直覺(jué)的形成需要通過(guò)嚴(yán)格的數(shù)學(xué)模型和計(jì)算方法,對(duì)棋感直覺(jué)進(jìn)行驗(yàn)證。隨著互聯(lián)網(wǎng)的快速發(fā)展,采用蒙特卡洛樹(shù)搜索對(duì)落子棋感和勝負(fù)感進(jìn)行計(jì)算驗(yàn)證,在搜索驗(yàn)證中展現(xiàn)出巨大潛力和優(yōu)勢(shì)。蒙特卡洛樹(shù)搜索作為一種用于找到最優(yōu)解的算法,它在許多棋類(lèi)游戲中表現(xiàn)出色,包括圍棋、五子棋等。它基于模擬游戲的方式來(lái)評(píng)估每個(gè)落子位置的價(jià)值,并通過(guò)多次模擬游戲來(lái)確定最佳的落子策略。在使用蒙特卡洛樹(shù)搜索進(jìn)行計(jì)算驗(yàn)證時(shí),通常采用以下步驟:
(1)構(gòu)建游戲樹(shù)。
根據(jù)當(dāng)前的棋局狀態(tài),構(gòu)建一個(gè)游戲樹(shù)。游戲樹(shù)的根節(jié)點(diǎn)代表當(dāng)前的棋局狀態(tài),每個(gè)節(jié)點(diǎn)表示一個(gè)可能的落子位置,通過(guò)節(jié)點(diǎn)模擬棋手落子的位置,構(gòu)建游戲樹(shù)。
(2)模擬游戲。
從根節(jié)點(diǎn)開(kāi)始,使用隨機(jī)策略進(jìn)行多次模擬游戲。在每次模擬中,通過(guò)選擇一個(gè)未被訪(fǎng)問(wèn)過(guò)的節(jié)點(diǎn),然后隨機(jī)選擇一個(gè)合法的落子位置進(jìn)行擴(kuò)展,直到模擬游戲結(jié)束,得到最終的勝負(fù)結(jié)果。
(3)更新節(jié)點(diǎn)價(jià)值。
根據(jù)模擬游戲的結(jié)果,對(duì)游戲樹(shù)每個(gè)節(jié)點(diǎn)的價(jià)值進(jìn)行評(píng)估。例如,將勝利的模擬游戲分?jǐn)?shù)加“1”,將失敗的模擬游戲分?jǐn)?shù)減“1”,將平局的模擬游戲分?jǐn)?shù)置為“0”。
(4)選擇最佳落子位置。
在對(duì)節(jié)點(diǎn)價(jià)值進(jìn)行評(píng)估的基礎(chǔ)上,模擬棋局對(duì)弈,根據(jù)節(jié)點(diǎn)的價(jià)值選擇最佳的落子位置,選擇在合法位置上價(jià)值最高的節(jié)點(diǎn)作為最佳落子位置,從而確定最佳落子點(diǎn)。
通過(guò)多次模擬游戲和對(duì)節(jié)點(diǎn)價(jià)值的驗(yàn)證,蒙特卡洛樹(shù)搜索可以通過(guò)對(duì)棋局勝負(fù)進(jìn)行數(shù)學(xué)驗(yàn)證和建立勝負(fù)評(píng)估模型,根據(jù)最佳落子位置的準(zhǔn)確度、勝率等指標(biāo),逐漸找到最佳的落子策略。在實(shí)際運(yùn)用中,相較于其他算法,蒙特卡洛樹(shù)搜索能夠運(yùn)用平衡探索和信息利用在未知的狀態(tài)中進(jìn)行主動(dòng)探索,又能夠根據(jù)已知的信息進(jìn)行利用與加工,可最大限度地平衡計(jì)算機(jī)在學(xué)習(xí)過(guò)程中探索與利用之間的矛盾,通過(guò)搜索最優(yōu)的落子點(diǎn),即搜索次數(shù)最多的、信心最大的、勝率最高的落子點(diǎn),對(duì)落子棋感進(jìn)行驗(yàn)證。在一般情況下,基于蒙特卡洛樹(shù)搜索可對(duì)未來(lái)28步落子序列進(jìn)行搜索,其對(duì)棋局的預(yù)判已遠(yuǎn)遠(yuǎn)超出圍棋職業(yè)選手的搜索深度,在人機(jī)對(duì)弈中具有極大的優(yōu)勢(shì)。
5、圍棋人機(jī)大戰(zhàn)之后的人工智能展望
圍棋人機(jī)大戰(zhàn)的結(jié)果展示出人工智能在復(fù)雜智力運(yùn)動(dòng)中的巨大潛力,也引發(fā)人們對(duì)于人工智能在其他競(jìng)技體育領(lǐng)域的展望。圍棋作為一種非常復(fù)雜的棋類(lèi)游戲,要求玩家具備極高的智力和戰(zhàn)略思維能力。AlphaGo作為一個(gè)基于深度學(xué)習(xí)的人工智能系統(tǒng),AlphaGo在圍棋人機(jī)大戰(zhàn)中的勝利表明,人工智能具備超越人類(lèi)的決策能力。這將促使人工智能在其他智力運(yùn)動(dòng)中的使用,如國(guó)際象棋、五子棋、圍棋等,人工智能在體育領(lǐng)域的應(yīng)用將進(jìn)一步得到拓展。
雖然人工智能技術(shù)與體育聯(lián)系越來(lái)越緊密,但人工智能技術(shù)與現(xiàn)代競(jìng)技體育的結(jié)合仍有待進(jìn)一步提升。一方面,人工智能技術(shù)依賴(lài)于海量數(shù)據(jù),但現(xiàn)代競(jìng)技體育對(duì)抗瞬息萬(wàn)變,難以對(duì)比賽對(duì)抗全部數(shù)據(jù)進(jìn)行采集,且所采集數(shù)據(jù)的信度與效度仍有待進(jìn)一步提升;另一方面,現(xiàn)代競(jìng)技體育比賽分工越來(lái)越細(xì)化,不同球員在場(chǎng)上的定位與職責(zé)不同,其球場(chǎng)表現(xiàn)難以以統(tǒng)一標(biāo)準(zhǔn)進(jìn)行衡量。上述問(wèn)題也對(duì)人工智能在現(xiàn)代競(jìng)技體育中的運(yùn)用提出了更高的要求,迫切需要人工智能技術(shù)與現(xiàn)代競(jìng)技體育進(jìn)行深度融合。
參考文獻(xiàn):
[1]謝標(biāo)祎.客觀(guān)功效·現(xiàn)實(shí)問(wèn)題·國(guó)內(nèi)對(duì)策:人工智能在足球運(yùn)動(dòng)領(lǐng)域應(yīng)用的研究[D].江西師范大學(xué),2022.
[2]呂兆峰,宋思萱.融合與創(chuàng)新:“人工智能+”體育產(chǎn)業(yè)的發(fā)展策略研究[J].體育科技,2020,41(02).
[3]孫立.體育應(yīng)用人工智能的價(jià)值、困境與對(duì)策研究——李世石完敗于A(yíng)lphaGo的啟示[J].南京體育學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2017,31(05).
[4]蘇宴鋒,趙生輝,李文浩,等.人工智能提升運(yùn)動(dòng)表現(xiàn)的前沿進(jìn)展、困境反思與優(yōu)化策略[J].上海體育學(xué)院學(xué)報(bào),2023,47(02).
[5]李帥帥,楊尚劍.數(shù)字體育、智能體育與智慧體育的概念特征、關(guān)系厘正及應(yīng)用探析[J].西安體育學(xué)院學(xué)報(bào),2023,40(03).
[6]劉正統(tǒng),馬進(jìn).基于人工智能的智慧體育訓(xùn)練輔助系統(tǒng)設(shè)計(jì)[J].文體用品與科技,2024(03).