📦

Lumiere-视频生成的时空扩散模型

AI/ML

Lumiere是一个由谷歌研究院开发的时空扩散模型,旨在合成具有逼真、多样和连贯动作的视频。该模型引入了一种称为空间时间U-Net的架构,通过一次传递生成整个视频的整个时间段,从而与现有的视频模型形成鲜明对比。此外,Lumiere通过同时部署空间和时间下采样和上采样,并利用预训练的文本到图像扩散模型,学会了通过多个时空尺度处理全帧速率、低分辨率视频。实验结果展示了最先进的文本到视频生成结果,并表明该模型的设计轻松支持广泛的内容创作任务和视频编辑应用,包括图像到视频、视频修复和风格化生成。

📅 添加于: 2025-01-01
🏷️ AI/ML

Lumiere-视频生成的时空扩散模型

Lumiere是一个由谷歌研究院开发的时空扩散模型,旨在合成具有逼真、多样和连贯动作的视频。该模型引入了一种称为空间时间U-Net的架构,通过一次传递生成整个视频的整个时间段,从而与现有的视频模型形成鲜明对比。此外,Lumiere通过同时部署空间和时间下采样和上采样,并利用预训练的文本到图像扩散模型,学会了通过多个时空尺度处理全帧速率、低分辨率视频。实验结果展示了最先进的文本到视频生成结果,并表明该模型的设计轻松支持广泛的内容创作任务和视频编辑应用,包括图像到视频、视频修复和风格化生成。

链接