激光网3月14日消息,在 AlphaStar 成功的基础上,Google DeepMind 推出了 Scalable Instructable Multiworld Agent,这是一款用于 3D 虚拟设置的通用人工智能代理。多功能人工智能系统可以根据自然语言指令在不同的视频游戏环境中执行任务,从而在人工智能游戏研究中向通用方法转变。
SIMA已经接受了多款游戏的训练,包括与八家游戏工作室的合作,并在九款不同的视频游戏上进行了测试,例如Hello Games的《No Man's Sky》和Tuxedo Labs的《Teardown》。SIMA产品组合中的每款游戏都开辟了一个新的互动世界,包括一系列需要学习的技能,从简单的导航和菜单使用到采矿资源、驾驶宇宙飞船或制作头盔。
Google DeepMind还与四个研究环境合作,包括一个使用Unity构建的新环境,称为建筑实验室。在这种环境中,智能体必须用积木构建雕塑,测试他们的对象操作和对物理世界的直观理解。
该代理包含预先训练的视觉模型和配备内存的中央模型,该模型可以解释图像和语言输入,以生成用于游戏的键盘和鼠标操作。
SIMA 对 600 项基本技能的评估表明,他们在导航、对象交互和菜单使用方面的熟练程度,重点是可以在短时间内完成的任务。与为单个游戏训练的专业代理不同,SIMA 通过在多个环境中推广知识并展示在看不见的游戏中的能力,表现更好。
在对照测试中,智能体对语言能力的依赖是显而易见的,其中语言输入显着影响行为。SIMA 遵循指令的能力通过近 1500 个独特的游戏内任务进行评估,并由人类评委参与评估。
SIMA的开发旨在开创一种由语言输入驱动的新型通才人工智能代理,促进它们在在线和现实世界场景中的各种任务中的实用性。
虽然还处于早期阶段,但这项研究为人工智能系统的未来增强奠定了基础。它旨在弥合虚拟环境和实际应用之间的差距,最终培育出更有用和适应性更强的人工智能解决方案。