2023.23-02 Minecraft 成为AI的试炼场
2023年第23周(06-05 ~ 06-11) Minecraft 成为AI的试炼场,探索 agent 自主应对开放世界的挑战。 (图片取自 minedojo.org) 2019年,MineRL 项目,开放了数据集,并设立了挑战赛,以促进使用深度强化学习(deep RL)应对开放世界的各种挑战。 2023年2月,北京大学 Zihao Wang 领导的团队发表了“第一个能够稳健地完成70+个Minecraft任务的多任务代理”。 2023年5月 来自 Nvida 和多家大学联合研究团队发表的 Voyager —— 具有大型语言模型的开放式具身代理,与其他自动化代理的比较,在完成新任务方面速度明显更快,并且是迄今为止唯一可以解锁珍贵的钻石级工具的 Minecraft 自动化代理。 2023年6月,OpenAI 花费16万美元邀请 Minecraft 玩家,以便捕获人类玩家的游戏视频片段,用于开发/训练AI来玩此游戏。 OpenAI 该项目主页:通过视频预训练学习玩《我的世界》 Voyager 玩 Minecraft 以三种方式使用到 GPT-4 以下内容摘录自文章 How Nvidia uses GPT-4 to make AI better at Minecraft 第一种,生成挑战任务 GPT-4被用于根据Minecraft中当前的物品清单,提出新的挑战任务给Voyager程序。 Voyager 通过格式化的自然语言提示,向GPT-4提供一个物品清单描述,例如: Inventory (5/36): {'oak_planks': 3, 'stick': 4, 'crafting_table': 1, 'stone': 3, 'wooden_pickaxe': 1}, GPT-4 将输出一个关于新挑战的自然语言描述,并解释为什么这是一个合适的新任务,例如: Reasoning: Since you have a wooden pickaxe and some stones, it would be beneficial to upgrade your pickaxe to a stone pickaxe for better efficiency. Task: Craft 1 stone pickaxe. 第二种,生成下一步操作代码 GPT-4 根据输入新的挑战任务,生成用于在Minecraft中进行下一步操作的代码(LLM的编程能力),每段代码都会在Minecraft中进行测试,然后反馈信息被送回GPT-4进行代码的改进。 ...