Google 开放训练用强化学习框架:用于训练 AI 模型(

Google 在人工智能上掌握了不少技术,而他们亦愿意跟人分享。近日 Google 宣布,将强化学习框架放在 GitHub 上开源提供,让其他的开发者也可以使用这个技术并参与研发。

Google 开放训练用强化学习框架:用于训练 AI 模型

这次的强化学习框架是 Google 子公司核心部分 DeepMind 的深度 Q-network(DQN),可以在多个工作人员中分配学习,例如,在Atari 2600游戏中实现“超人”性能。不过要使用强化学习框架来训练相当花时间,而且稳定性不高。

Google 今次在 GitHub 开放的强化学习框架则是基于 TensorFlow 机器学习库之上开发,让开发者可以利用这个开源工具,令人工智能可以拥有更好的训练方式。

Google Brain Team 的研究员 Pablo Samuel Castro 和 Marc G. Bellemare 在网誌中表示,这个工具的灵感来自大脑奖励动机行为的主要组成部分,反映了神经科学与强化学习研究之间强大的连结。这次公开强化学习框架,是希望能协助研究,促进更大型的新发现。这强化学习框架的主要特点为弹性、稳定性以及可再现性,解决在开发过程中面对的主要问题。

他们和 Google Brain 团队开发了强化框架,其中考虑了三个原则:灵活性,稳定性和可重複性。

为此,它包括一套包括15个Python文件的代码、用视频游戏评估AI技术的平台,以及四种不同的机器学习模型。

除了增强框架的发布,谷歌还推出了一个网站,允许开发人员快速可视化多个代理的培训运行。它还提供经过训练的模型,原始统计日誌和TensorFlow事件文件,用于TensorBoard绘图,TensorBoard是Mountain View公司的TensorFlow程序可视化工具套件。

Google 开放训练用强化学习框架:用于训练 AI 模型(

Google 方面已经把这个强化学习框架投入到不同範畴的人工智能研究之中,据称在使用过程中,他们发现可以更弹性去让他们实现不同的想法。Google 希望未来在开源之后,可以看到开发者社群应用这个工具,为人工智能带来更多的新发展。

有兴趣的可以自己到 Github 参考原始码。

上一篇: 下一篇:
相关阅读