谷歌旗下人工智能研究机构 DeepMind 推出了一款名为 Genie 2 的模型,可以生成各种可玩的 3D 世界。该模型可以根据图像和文字描述生成实时交互场景,用户可以使用鼠标或键盘进行跳跃和游泳等操作。Genie 2 能够模拟物体交互、动画、光照、物理效果以及“NPC”的行为,其生成的许多模拟场景看起来像 3A 级电子游戏。
DeepMind 表示 Genie 2 可以生成不同视角的连续世界,最长可达一分钟,并可准确渲染场景中曾经不可见的部分。目前该模型主要用于研究和创意工具,用于原型设计和评估 AI 智能体。
TechCrunch