亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        游戲內(nèi)外
        ——AI 強化學(xué)習(xí)的圍城

        2023-01-05 19:50:03何友
        智能系統(tǒng)學(xué)報 2022年2期
        關(guān)鍵詞:現(xiàn)實深度人類

        何友

        2016 年,谷歌AlphaGo 4∶1擊敗圍棋世界冠軍李世石使得深度強化學(xué)習(xí)的概念走進大眾視野,由此人們逐漸開始憧憬在圍棋中戰(zhàn)勝人類的AI 強化學(xué)習(xí)算法能夠給人類生活帶來重要影響。但時過五年多,AI 強化學(xué)習(xí)似乎只在游戲內(nèi)大放異彩,而在游戲外卻應(yīng)用寥寥。

        人工智能自誕生就與游戲結(jié)下不解之緣。1950 年,圖靈提出著名的圖靈測試,該測試就可以看作為一個欺騙提問者的游戲。隨后,在計算智能的不斷突破下,五子棋、國際象棋等棋類游戲都逐漸被AI 征服。當(dāng)AI 開始挑戰(zhàn)更高層次的圍棋游戲時,發(fā)現(xiàn)傳統(tǒng)搜索方法在時空復(fù)雜度上完全不可行,由此深度強化學(xué)習(xí)成為研究的主流。在挑戰(zhàn)成功圍棋、撲克這類回合制游戲后,谷歌、OpenAI、騰訊又逐漸把焦點轉(zhuǎn)移到星際爭霸、王者榮耀等即時策略游戲上。與圍棋相比,即時策略游戲需要AI 學(xué)習(xí)在不完全信息和即時動態(tài)環(huán)境下如何進行推理、決策、規(guī)劃、協(xié)作以及平衡短中長期收益,相關(guān)研究推動了多智能體強化學(xué)習(xí)理論和算法的發(fā)展。

        電子游戲具有諸多特點使其在AI 強化學(xué)習(xí)研究過程備受青睞。首先,玩電子游戲必然要在與環(huán)境及他人的交互中進行決策和博弈,而決策和博弈也是人類日常生活的重要行為;其次,電子游戲具有真實模擬和無損探索的特點,可以比較容易地通過不斷試錯的方式獲得各類場景及情況的樣本和標注信息,從而對AI 算法進行大規(guī)模訓(xùn)練和測試。因此,電子游戲是AI 強化學(xué)習(xí)天然的訓(xùn)練場,在游戲中訓(xùn)練AI 是公認模擬現(xiàn)實世界的最有效方法之一。AI 算法不斷在星際爭霸、王者榮耀、足球、捉迷藏等游戲中達到或超過人類玩家水平,并時常意外地開發(fā)出一些人類玩家都未曾想到的戰(zhàn)術(shù)和策略。電子游戲正以非常接近現(xiàn)實世界的方式加快著AI 算法研究,讓人們看到AI 走出游戲、落地現(xiàn)實的曙光。

        然而在游戲中大放異彩的深度強化學(xué)習(xí)算法在游戲外仍應(yīng)用寥寥,一方面是目前深度強化學(xué)習(xí)算法樣本利用率低和缺乏可信度,更重要的原因是游戲世界與現(xiàn)實世界仍存在巨大鴻溝。首先,游戲環(huán)境是封閉的而現(xiàn)實環(huán)境是開放的,開放環(huán)境中的多智能體對抗博弈面臨著環(huán)境更加復(fù)雜、決策空間更加巨大等問題,這導(dǎo)致在游戲內(nèi)開發(fā)的AI 模型在現(xiàn)實世界應(yīng)用受限;其次,游戲環(huán)境對問題的假設(shè)通常較為理想,如多智能體間的通信通常假設(shè)是完美的,但現(xiàn)實世界中多智能體的通信卻經(jīng)常受限;最后,游戲環(huán)境對現(xiàn)實世界的模擬還遠遠不夠,在場景真實度和信息獲取維度上都有所欠缺。

        不斷推動AI 算法從游戲邁向現(xiàn)實對于機器人群智能協(xié)作和博弈領(lǐng)域的發(fā)展意義重大。美國計算機社區(qū)聯(lián)盟發(fā)布的2020 版機器人路線圖重點強調(diào)了機器人在復(fù)雜、動態(tài)環(huán)境下主動感知、規(guī)劃及控制。我國在《新一代人工智能發(fā)展規(guī)劃》中也著重強調(diào)了無人自主系統(tǒng)的發(fā)展。為推動開放環(huán)境下機器人群智的發(fā)展,需要在學(xué)習(xí)理論上實現(xiàn)突破的同時在環(huán)境模擬上更加真實。相信隨著多智能體強化學(xué)習(xí)和遷移學(xué)習(xí)等理論發(fā)展,以及平行智能、數(shù)字孿生及元宇宙等技術(shù)興起,在游戲內(nèi)大放異彩的AI 算法也將走出圍城,在游戲外的現(xiàn)實世界產(chǎn)生重大影響。

        猜你喜歡
        現(xiàn)實深度人類
        人類能否一覺到未來?
        我對詩與現(xiàn)實的見解
        文苑(2020年11期)2021-01-04 01:53:20
        深度理解一元一次方程
        人類第一殺手
        好孩子畫報(2020年5期)2020-06-27 14:08:05
        1100億個人類的清明
        深度觀察
        深度觀察
        深度觀察
        一種基于Unity3D+Vuforia的增強現(xiàn)實交互App的開發(fā)
        人類正在消滅自然
        奧秘(2015年2期)2015-09-10 07:22:44
        亚洲精品无码久久毛片| 丝袜美腿av在线观看| 激情乱码一区二区三区| 国产精品一区二区熟女不卡| 亚洲精品视频中文字幕| 精品国产粉嫩内射白浆内射双马尾| 欧美日韩视频在线第一区| 天躁夜夜躁狼狠躁| 93精91精品国产综合久久香蕉| 人妻少妇精品视中文字幕国语| 成人全视频在线观看免费播放| 加勒比东京热中文字幕| 国产揄拍国产精品| 国产成人av 综合 亚洲| 夜夜综合网| 免费 无码 国产精品| 人妻少妇无乱码中文字幕| 亚洲不卡高清av网站| 女人被狂c躁到高潮视频| 日本亚洲欧美在线观看| av天堂在线免费播放| 偷拍综合在线视频二区日韩| 久久无码高潮喷水抽搐| 少妇高清精品毛片在线视频| 午夜AV地址发布| 色综合久久久久综合999| 中文字幕日韩精品中文字幕| 精品偷自拍另类在线观看| 国产麻传媒精品国产av| 永久国产盗摄一区二区色欲| 久久夜色精品亚洲天堂| 国产精品亚洲专区无码不卡| 少妇无码一区二区三区| 久久久久久AV无码成人| 久久精品国产亚洲av成人文字| 国产尤物av尤物在线观看| 亚洲AⅤ永久无码精品AA| 亚洲中文字幕av一区二区三区人 | 青青视频一区| 免费一级a毛片在线播出| 青青草免费在线视频久草|