Genie - Google发布的从互联网视频中学习的基础世界模型
AI ToolsGenie是一个基于互联网视频训练的基础世界模型,能够通过单张图片提示生成无尽种类的可玩(可通过行动控制)世界,这些图片可以是合成图像、照片乃至素描。Genie的独特之处在于其能够只通过观看互联网视频学习精细的控制能力,而这些视频通常不包含关于正在执行的动作的标签,甚至不明确哪部分图像应该被控制。尽管如此,Genie不仅学会了哪些观察部分通常是可控的,还推断出了在生成环境中一致的多种潜在动作。
Genie - Google发布的从互联网视频中学习的基础世界模型
Genie是一个基于互联网视频训练的基础世界模型,能够通过单张图片提示生成无尽种类的可玩(可通过行动控制)世界,这些图片可以是合成图像、照片乃至素描。Genie的独特之处在于其能够只通过观看互联网视频学习精细的控制能力,而这些视频通常不包含关于正在执行的动作的标签,甚至不明确哪部分图像应该被控制。尽管如此,Genie不仅学会了哪些观察部分通常是可控的,还推断出了在生成环境中一致的多种潜在动作。