🤖

Genie - Google发布的从互联网视频中学习的基础世界模型

AI Tools

Genie是一个基于互联网视频训练的基础世界模型,能够通过单张图片提示生成无尽种类的可玩(可通过行动控制)世界,这些图片可以是合成图像、照片乃至素描。Genie的独特之处在于其能够只通过观看互联网视频学习精细的控制能力,而这些视频通常不包含关于正在执行的动作的标签,甚至不明确哪部分图像应该被控制。尽管如此,Genie不仅学会了哪些观察部分通常是可控的,还推断出了在生成环境中一致的多种潜在动作。

📅 添加于: 2025-01-01
🏷️ AI Tools

Genie - Google发布的从互联网视频中学习的基础世界模型

Genie是一个基于互联网视频训练的基础世界模型,能够通过单张图片提示生成无尽种类的可玩(可通过行动控制)世界,这些图片可以是合成图像、照片乃至素描。Genie的独特之处在于其能够只通过观看互联网视频学习精细的控制能力,而这些视频通常不包含关于正在执行的动作的标签,甚至不明确哪部分图像应该被控制。尽管如此,Genie不仅学会了哪些观察部分通常是可控的,还推断出了在生成环境中一致的多种潜在动作。

链接