亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        什么是深度強化學習:人工智能和深度學習的下一步

        2018-03-30 11:28:22JamesKobielus楊勇
        計算機世界 2018年10期
        關鍵詞:開發(fā)人員代理架構

        James Kobielus 楊勇

        強化學習非常適合于監(jiān)督學習或者無監(jiān)督學習技術不能勝任的自主決策環(huán)境。

        在人工智能領域,強化學習一直處于小眾地位。但是,強化學習過去幾年中已經(jīng)開始在很多人工智能項目中發(fā)揮出了很大的作用。其最佳應用點是在環(huán)境情境化決策場景中計算出代理應采取的最優(yōu)措施。

        強化學習使用試錯方法來最大限度地實現(xiàn)算法獎勵函數(shù),因此,非常適合IT運營管理、能源、醫(yī)療、商業(yè)、金融、交通運輸和金融等領域的很多自適應控制和多代理自動化應用。它被用來在機器人、游戲和仿真等傳統(tǒng)關注的領域中訓練人工智能,也用于邊緣分析、自然語言處理、機器翻譯、計算機視覺和數(shù)字助理等新一代人工智能解決方案。

        強化學習也是物聯(lián)網(wǎng)自主邊緣應用開發(fā)的基礎。對于工業(yè)、交通運輸、醫(yī)療和消費類應用,大部分邊緣應用開發(fā)都涉及到在動態(tài)環(huán)境下,開發(fā)出能夠在不同程度自治情形下運行的人工智能機器人。

        強化學習是怎樣工作的

        在這樣的應用領域,由于缺少預先存在的“完全真實”的訓練數(shù)據(jù)集,邊緣設備的人工智能大腦必須依靠強化學習,目的是最大限度地實現(xiàn)累積獎勵函數(shù),例如,根據(jù)規(guī)范中包含的一組標準來裝配制造組件。這與其他類型的人工智能學習方式形成了對比,其他類型的人工智能通過(例如有監(jiān)督學習)最小化基于完全真實數(shù)據(jù)的算法損失函數(shù),或者(例如無監(jiān)督學習)最小化數(shù)據(jù)點之間的距離函數(shù)來進行學習。

        然而,這些人工智能學習方法并不一定是相互孤立的。最有趣的人工智能發(fā)展趨勢之一是強化學習與有監(jiān)督和無監(jiān)督學習在更高級應用中的融合。人工智能開發(fā)人員在應用中混合了這些方法,因為沒有一種單一的學習方法能滿足需求。

        例如,如果沒有帶標簽的訓練數(shù)據(jù),監(jiān)督學習本身是無用的,自動駕駛等應用中經(jīng)常沒有帶標簽的數(shù)據(jù),每一次環(huán)境的瞬間變化基本上都是沒有標簽的,也是唯一的。同樣的,無監(jiān)督學習——使用了聚類分析來檢測傳感器饋入數(shù)據(jù)和其他復雜的無標簽數(shù)據(jù)中的模式,并不適合用于確定智能端點在實際決策場景中應采取的最佳措施。

        什么是深度強化學習

        還有深度強化學習,在這種前沿的技術中,自治代理使用強化學習的試錯算法和累積獎勵函數(shù)來加速神經(jīng)網(wǎng)絡設計。這些設計對依賴于有監(jiān)督和/或無監(jiān)督學習的人工智能應用有著強大的推動作用。

        深度強化學習是人工智能開發(fā)和訓練流水線自動化的核心研究領域。深度學習、機器學習和其他人工智能模型的設計人員在確定各種架構、節(jié)點類型、連接、超參數(shù)設置,以及其他選項時,使用深度強化學習驅(qū)動的代理能夠幫助他們迅速弄清楚這些設置的優(yōu)缺點。

        例如,研究人員使用深度強化學習,快速確定哪一種深度學習卷積神經(jīng)網(wǎng)絡(CNN)架構最適合解決特征工程、計算機視覺和圖像分類等應用中的各種難題。人工智能工具使用通過深度強化學習得出的結果,自動生成最優(yōu)CNN,針對具體任務,可以使用TensorFlow、MXNet和PyTorch等深度學習開發(fā)工具。

        在這方面,令人鼓舞的是出現(xiàn)了強化學習開發(fā)和培訓的開放框架。當你研究深度強化學習時,表中列出的強化學習框架可以供你參考,這些框架與TensorFlow以及其他深度學習和機器學習建模工具有接口,利用并擴展了這些得到廣泛應用的工具。

        人工智能開發(fā)人員需要的強化學習技能

        展望未來,人工智能開發(fā)人員自己也應該沉浸在這些以及其他框架中實現(xiàn)的各種強化學習算法中。還需要加深對多代理強化學習架構的理解,其中很多架構充分利用了已經(jīng)建立起來的博弈論研究成果。還應該熟悉深度強化學習,將其作為一種工具來識別計算機視覺應用中與“模糊”這種攻擊方法相關的安全漏洞。

        猜你喜歡
        開發(fā)人員代理架構
        基于FPGA的RNN硬件加速架構
        功能架構在電子電氣架構開發(fā)中的應用和實踐
        汽車工程(2021年12期)2021-03-08 02:34:30
        Semtech發(fā)布LoRa Basics 以加速物聯(lián)網(wǎng)應用
        代理圣誕老人
        代理手金寶 生意特別好
        LSN DCI EVPN VxLAN組網(wǎng)架構研究及實現(xiàn)
        電信科學(2017年6期)2017-07-01 15:45:17
        復仇代理烏龜君
        學生天地(2016年23期)2016-05-17 05:47:15
        讓Windows 10進入開發(fā)者模式
        電腦迷(2015年12期)2015-04-29 23:22:51
        一種基于FPGA+ARM架構的μPMU實現(xiàn)
        后悔了?教你隱藏開發(fā)人員選項
        電腦愛好者(2015年6期)2015-04-03 01:20:56
        99久久精品免费看国产情侣| 国产成人亚洲精品无码青| 国产福利视频在线观看| 亚洲熟妇色xxxxx欧美老妇y| 亚洲成AV人在线观看网址| 女主播国产专区在线观看| 无码国产精品一区二区av| 成人网站免费大全日韩国产| аⅴ天堂一区视频在线观看| 中文字幕人妻av一区二区| 国产成人综合日韩精品无码| 国产人妻无码一区二区三区免费| 国产激情一区二区三区成人免费| 国产亚洲中文字幕久久网| 人妻少妇乱子伦无码视频专区| 欧美国产日韩a在线视频| 国产香蕉尹人在线视频你懂的| 国产黄色三级一区二区三区四区| 欧美成人猛交69| 国产麻豆精品一区二区三区v视界| 日韩精品一区二区三区在线观看的| 久久精品国产亚洲av不卡国产| 中文字幕丰满伦子无码| 中文字幕在线日韩| 亚洲女同高清精品一区二区99| 精品卡一卡二卡3卡高清乱码| 国产亚洲av片在线观看18女人| 亚洲无码毛片免费视频在线观看| 加勒比日韩视频在线观看| 夜夜添夜夜添夜夜摸夜夜摸| 亞洲綜合一區二區三區無碼| 国产一区二区三区在线观看免费版 | 国产一区二区三区精品毛片| 日本少妇浓毛bbwbbwbbw| 91精品一区国产高清在线gif| 成人免费毛片内射美女-百度 | 国产精品爽爽v在线观看无码| 澳门精品无码一区二区三区| 日本一曲二曲三曲在线| 免费大片黄国产在线观看| 婷婷四房色播|