上周,我和我的两个同事,佩德罗·昆塔斯和佩德罗·卡尔代拉做了一些实验,使用的是Unity的ml -agents,我认为这是一个伟大的时刻,与社区分享我们的结果,并向你展示如何扩展你的强化学习知识。
ml-agent 《玩具帝国》的人机AI采用的是Unity的ml-agent,通过强化学习训练能够进行长周期复杂决策的人机AI。原来写决策树很痛苦,现在可以直接挂机炼丹。 ml-agent里给的实例都算是比较简单的决策问题,一次任务的周期也很短,《玩具帝国》的就比较长,决策也很复杂,所以我们使用了“即时奖励”和“预测奖励”进行长周期决策AI的训练。 ml-agent里默认的决策间隔非常短,但毕竟《玩具帝国》里不需要每时每刻都进行决策,所以我人为地把间隔时间拉长了,这样也能更好地让AI把自己的决策和结果关联起来。 具有很强的倾向性: 由于《玩具帝国》需要在移动平台实时运行,起初我还很担心ml-agent在移动平台上跑不动,后来证明我的担心是多余的。 在小米10上以最高画质运行基于ml-agent的极难AI,也能维持在45FPS左右。
今天,Unity宣布推出Unity Machine Learning Agent(ML-Agent),将游戏引擎连接到谷歌TensorFlow等机器学习框架中。 Unity开发者Arthur Juliani表示,Unity的ML-Agent将帮助增加游戏的可玩性。 △ Unity工程师自述ML-Agent在游戏开发中的意义 过去,开发人员需要手工编写代码,让训练环境中的相互作用逐步训练Agent,典型场景是一个单一环境+紧密耦合的Agent。
该环境使用Unity ml-agent建立。其中包含一个固定大小的竞技场,和一个已经训练好的模型。 竞技场中包含各种物体,包括正负奖励(绿色、黄色和红色球体)、障碍物、雷区、不同的地形等。 Linux系统可能需要先运行一行代码: chmod +x env/AnimalAI.x86_64 Animal-AI包里面是一个Unity环境交互应用接口,包括一个gym环境、一个扩展Unity ml-agent
download.csdn.net/download/ilypl/10030403 /×当然,在github上也可以下载×/ python版本:3.6(我的python环境是直接安装anaconda,anaconda会自动搭建) ML-agent
目前Unity已经发布了测试版ML-Agent SDK。 对Unity的ML-Agent SDK感兴趣的开发者,可以访问其Github页面获得更详细的消息。
准备阶段 在开始正式训练前,先检查下自己是不是准备好了下面这些工具: 模拟篮球和物理环境Unity 用于训练模型的Node.js和TensorFlow.js 通过ML-agent asset包将模型嵌入
AI 科技评论按:近期,Unity 发布了版本 0.4 的机器学习智能体工具包(ML-Agent toolkit v0.4),其中最为突出的新功能是通过额外的基于好奇心的内在激励进行智能体的训练。
AI 研习社按:近期,Unity 发布了版本 0.4 的机器学习智能体工具包(ML-Agent toolkit v0.4),其中最为突出的新功能是通过额外的基于好奇心的内在激励进行智能体的训练。
Unity的Alessia Nigrettif在原来的博客中描述了如何将ML-Agent集成到2D游戏中。
., 2025) — https://arxiv.org/abs/2505.01441 ML-Agent: Reinforcing LLM Agents for Autonomous Machine Learning