国产精品不卡在线观看_日本va欧美va欧美va精品_亚洲精品久久久久久国产精华液 _欧美r级电影在线观看_久久久久99精品一区_欧美日韩精品欧美日韩精品一综合_成人国产电影网_成人一区二区三区视频在线观看_日韩精品一区二区三区视频在线观看 _成人av网站在线_在线免费av一区_国产日韩欧美不卡_婷婷六月综合亚洲_精品一区二区av_国产aⅴ综合色_欧美三级视频在线播放

Internet Develppment
互聯(lián)網(wǎng)開發(fā)& 推廣服務(wù)提供商

我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。

歡迎瀏覽我們的案例。

首頁 > 新聞中心 > 新聞動態(tài) > 正文

DeepMind開源TRFL,又一個(gè)強(qiáng)化學(xué)習(xí)復(fù)現(xiàn)、創(chuàng)新好幫手

發(fā)布時(shí)間:2018-10-19 11:36:20來源:雷鋒網(wǎng)

  繼今年 8 月谷歌開源發(fā)布了專為學(xué)術(shù)研究人員設(shè)計(jì)的簡單但魯棒的強(qiáng)化學(xué)習(xí)框架「多巴胺」(Dopamine)之后,早已被谷歌母公司收購但保持獨(dú)立運(yùn)營的 DeepMind 也把自己日常使用的代碼庫拿出來開源,繼續(xù)為領(lǐng)域內(nèi)的研究人員們提供功能豐富、高可復(fù)現(xiàn)性及高可拓展性的實(shí)驗(yàn)工具。雷鋒網(wǎng) AI 科技評論介紹如下。

  今天 DeepMind 宣布開源一個(gè)用于在 TensorFlow 環(huán)境中開發(fā)強(qiáng)化學(xué)習(xí)智能體的代碼庫,打包了許多有用的基礎(chǔ)組件。它的名字是 TRFL(讀作「truffle」) 。

  DeepMind 自己用來開發(fā) DQN、DDPG 以及 IMPALA(重要性加權(quán)行動者-學(xué)習(xí)者架構(gòu))等知名強(qiáng)化學(xué)習(xí)技術(shù)的許多關(guān)鍵算法組件都包含在其中。

  另一種開源路線

  一個(gè)典型的深度強(qiáng)化學(xué)習(xí)智能體需要包含一組數(shù)目眾多的互動組件:首先起碼需要包括一個(gè)環(huán)境以及某種能表示值或者策略的深度神經(jīng)網(wǎng)絡(luò),然后很多時(shí)候還會包含學(xué)習(xí)到的環(huán)境的模型、偽反饋函數(shù)甚至一個(gè)回放系統(tǒng)等等。

  這些組件互相之間的影響很微妙(而且如 Henderson 和他的同事在 https://arxiv.org/pdf/1709.06560.pdf 中指出,論文中常常并不會詳細(xì)說明這些影響是怎么樣的),從而當(dāng)計(jì)算圖變得很大的時(shí)候一旦出現(xiàn) bug 就很難進(jìn)行定位并解決。OpenAI 近期的一篇博客也著重研究了這個(gè)問題,他們分析了某些最熱門的強(qiáng)化學(xué)習(xí)智能體的開源實(shí)現(xiàn),發(fā)現(xiàn) 10 個(gè)中的 6 個(gè)都「由社區(qū)成員發(fā)現(xiàn)了微小的 bug 并得到了作者本人的確認(rèn)」。

  要解決這種問題,并幫助整個(gè)研究社區(qū)中的人順利復(fù)現(xiàn)論文中的結(jié)果,其中一種方法就是開源智能體的全套完整實(shí)現(xiàn)。比如,DeepMind 最近就開源了基于 IMPALA 的 v-trace 智能體的可拓展分布式實(shí)現(xiàn)。這種大規(guī)模的代碼庫對于研究結(jié)果的復(fù)現(xiàn)固然有幫助,但同時(shí)也難以修改并拓展。

  另一種有所不同并且能起到補(bǔ)充作用的方法是提供可靠的、經(jīng)過充分測試的通用基礎(chǔ)組件的實(shí)現(xiàn),同一個(gè)構(gòu)件也就可以在許多不同的強(qiáng)化學(xué)習(xí)智能體中反復(fù)使用。另一方面,在單個(gè)代碼庫中囊括了所有這些組件的抽象,然后可以用統(tǒng)一的 API 調(diào)用,也就讓研究人員可以更方便地組合不同文獻(xiàn)中閱讀到的不同的想法。

  全功能的基礎(chǔ)組件

  TRFL 庫包含了許多功能,可以實(shí)現(xiàn)經(jīng)典強(qiáng)化學(xué)習(xí)算法以及更現(xiàn)代的算法。其中的損失函數(shù)以及許多其他操作都是完全在 TensorFlow 中實(shí)現(xiàn)的。它們并不是完整的算法,而是構(gòu)建具有完整功能的強(qiáng)化學(xué)習(xí)智能體時(shí)必要的、也是強(qiáng)化學(xué)習(xí)專用的數(shù)學(xué)操作的代碼實(shí)現(xiàn)。

  對于基于值的強(qiáng)化學(xué)習(xí),DeepMind 的研究人員們也在 TRFL 庫中提供了各種 TensorFlow 操作,便于在離散的行動空間中學(xué)習(xí),比如 TD 學(xué)習(xí)、Sarsa、Q-learning 以及它們的變體;當(dāng)然也包括了用于實(shí)現(xiàn) DPG 之類的連續(xù)控制算法的操作。TRFL 庫中還包括了學(xué)習(xí)值分布函數(shù)的操作。這些操作支持批量計(jì)算,并且返回的損失值可以送入 TensorFlow 優(yōu)化器進(jìn)行最小化。有一些損失值是針對不同的批之間的變化進(jìn)行計(jì)算的(比如 Sarsa 和 Q-learning 等),也有一些損失是針對成批的軌跡的(比如 Q-lambda、Retace 等)。

  對于基于策略的方法,TRFL 庫中也同時(shí)提供了可以簡易實(shí)現(xiàn) A2C 等在線學(xué)習(xí)方法以及 v-trace 等離線策略校正方法的工具。TRFL 也支持連續(xù)動作空間中的策略梯度的計(jì)算。最后,TRFL 還提供了一個(gè) Unreal 引擎中使用的輔助偽反饋函數(shù)的實(shí)現(xiàn),DeepMind 的研究人員發(fā)現(xiàn)它能在許多不同的任務(wù)中提高數(shù)據(jù)效率。

  宣告開源顯然并不是這個(gè)項(xiàng)目的終點(diǎn)。由于這個(gè)庫在 DeepMind 內(nèi)部有著廣泛的應(yīng)用,他們也會持續(xù)不斷地對它進(jìn)行維護(hù),并逐步增加新的功能。DeepMind 也非常期待強(qiáng)化學(xué)習(xí)社區(qū)中的更多人也參與到這個(gè)項(xiàng)目的貢獻(xiàn)中來。
  (邯鄲建站


最新資訊
? 2018 河北碼上網(wǎng)絡(luò)科技有限公司 版權(quán)所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權(quán)所有.
国产精品不卡在线观看_日本va欧美va欧美va精品_亚洲精品久久久久久国产精华液 _欧美r级电影在线观看_久久久久99精品一区_欧美日韩精品欧美日韩精品一综合_成人国产电影网_成人一区二区三区视频在线观看_日韩精品一区二区三区视频在线观看 _成人av网站在线_在线免费av一区_国产日韩欧美不卡_婷婷六月综合亚洲_精品一区二区av_国产aⅴ综合色_欧美三级视频在线播放

              欧美日韩免费在线视频| 日韩激情视频| 九九**精品视频免费播放| 天堂影院一区二区| 看电视剧不卡顿的网站| 六月婷婷色综合| 国产精品资源在线| 成人ar影院免费观看视频| 成人小视频免费在线观看| 国产91在线观看| 91在线免费看| 国产欧美日韩视频一区二区三区| 久久精品国产99久久6| 精品中文字幕一区二区| 国产丶欧美丶日本不卡视频| 国产白丝网站精品污在线入口| 国内久久精品视频| 成人午夜激情视频| 国产自产在线视频一区| 亚洲精品高清视频| 日韩专区欧美专区| 狠狠久久亚洲欧美| 91视频www| 日韩欧美视频一区二区| 欧美影院精品一区| 欧美不卡123| 亚洲欧美日韩国产成人精品影院| 亚洲精品免费播放| 久久福利资源站| 99久久国产综合精品色伊| 另类欧美小说| 欧美精品乱码久久久久久 | 欧美色欧美亚洲另类七区| 在线精品日韩| 欧美精品一区二区三区视频| 亚洲精品日产精品乱码不卡| 激情小说亚洲一区| 国产精品一区二区三区四区五区| 日本一区二区三区视频在线观看 | 亚洲国产一区二区三区在线| 欧美精品色综合| 中文字幕中文字幕一区| 蜜桃久久久久久| 国产精品裸体一区二区三区| 91福利视频网站| 欧美国产日韩亚洲一区| 日韩电影在线一区二区三区| 波多野结衣一区二区三区| 欧美二区在线看| 日韩一级免费观看| 一区二区免费看| 成人av网站在线观看免费| 亚洲精品乱码久久久久久蜜桃91| 欧美一区二区三区视频免费| 亚洲免费视频成人| 成人黄色免费短视频| 中文字幕一区二区三区精彩视频 | 亚洲精品人成| 久久久久国产精品人| 日本女人一区二区三区| av一本久道久久波多野结衣| 欧美亚洲综合在线| 亚洲欧洲精品一区二区精品久久久 | 国产乱码精品一区二区三区日韩精品 | 久久精品水蜜桃av综合天堂| 午夜精品福利久久久| 99久久精品免费看国产免费软件| 久久久久久草| 亚洲精品在线观看网站| 蓝色福利精品导航| 日本一区二区三区免费观看 | 久久久777精品电影网影网 | 国产精品国产精品国产专区不蜜| 久久国产人妖系列| 日韩欧美一区二区在线观看 | 一本色道久久99精品综合| 久久久久国产精品人| 国产在线一区二区| 一本色道久久综合亚洲二区三区| 欧美国产精品中文字幕| 国产jizzjizz一区二区| 欧洲一区二区三区在线| 午夜欧美在线一二页| 久久99九九| 国产精品国产三级国产aⅴ原创| 国产成人av一区二区三区在线 | 日韩激情一区二区| 视频一区视频二区视频三区高| 久久九九久精品国产免费直播| 另类小说图片综合网| 影音先锋在线亚洲| 亚洲午夜av在线| 日本视频一区在线观看| 日韩美女精品在线| 精品日产一区2区三区黄免费| 日韩欧美国产三级电影视频| 国产一区二区h| 欧美精品乱码久久久久久按摩| 日韩不卡在线观看日韩不卡视频| 久久久综合香蕉尹人综合网| 中文字幕中文字幕在线一区| 国新精品乱码一区二区三区18| 欧美变态口味重另类| 国产999精品久久久久久绿帽| 亚洲一卡二卡三卡四卡无卡网站在线看 | 三级成人在线视频| 三区精品视频观看| 一区二区久久久久久| 亚洲成色最大综合在线| 亚洲午夜激情网站| 亚洲mv在线看| 日韩精品一区第一页| 91成人网在线| 国产在线麻豆精品观看| 日韩一二在线观看| 99久久免费视频.com| 日本一区二区综合亚洲| 久久综合久久久| 三级影片在线观看欧美日韩一区二区| 国产精品手机视频| 亚洲天堂网中文字| 亚洲 日韩 国产第一区| 久久精品国产成人一区二区三区| 欧美专区日韩专区| 成人免费视频免费观看| 中文无字幕一区二区三区| 欧美另类一区| 日韩精品免费视频人成| 欧美精品精品一区| 91在线观看成人| 亚洲欧美视频在线观看视频| 在线成人性视频| 国产精品亚洲一区二区三区妖精| 3atv一区二区三区| 91成人免费视频| 亚洲成人自拍网| 欧美精品丝袜中出| 国产精品毛片va一区二区三区| 亚洲另类春色校园小说| 亚洲视频小说| 成人免费电影视频| 亚洲精选免费视频| 色诱亚洲精品久久久久久| 丁香亚洲综合激情啪啪综合| 亚洲欧洲一区二区在线播放| 91久久精品国产91性色tv| 成人aa视频在线观看| 亚洲激情成人在线| 欧美精品黑人性xxxx| 国产精品二区在线观看| 日韩va亚洲va欧美va久久| 精品少妇一区二区三区在线视频| 97中文在线| 丝袜美腿亚洲色图| 精品国产青草久久久久福利| 欧美日韩最好看的视频| 国产精品亚洲人在线观看| 亚洲欧美日韩国产成人精品影院| 在线观看日韩高清av| 国产成人精品福利一区二区三区| 一区二区三区免费观看| 日韩一卡二卡三卡四卡| 奇米精品在线| 99视频一区二区| 日韩专区欧美专区| 国产精品视频一区二区三区不卡| 在线观看欧美亚洲| 91老师片黄在线观看| 日本aⅴ免费视频一区二区三区| 精品久久国产老人久久综合| 亚洲精品在线免费看| 91免费版黄色| 精品一区二区久久| 亚洲午夜羞羞片| 久久九九99视频| 欧美欧美午夜aⅴ在线观看| 欧美日韩在线高清| 91碰在线视频| 国内精品视频666| 亚洲午夜在线视频| 中文一区在线播放| 日本成人在线一区| 不卡av在线网| 国产欧美精品一区| 日韩影视精品| 丝袜美腿成人在线| 在线视频国内一区二区| 久久er99热精品一区二区| 亚洲色图在线看| www国产亚洲精品久久麻豆| 在线观看一区不卡| 亚欧精品在线| 久久精品日产第一区二区三区乱码| 蜜桃视频在线观看一区| 一个色在线综合| **欧美大码日韩| 国产精品系列在线| 久久久亚洲精品石原莉奈| 欧美精品粉嫩高潮一区二区| 欧美视频日韩视频|