Wan2.2

Wan2.2 Wan2.2，：（MoE），，。（T2V）、（I2V）-...

2024-01-01 1 分钟阅读

Wan2.2

Wan2.2作为一个开放且先进的大规模视频生成模型，其核心功能和亮点体现在：它创新性地采用了高效的混合专家（MoE）架构，在不增加计算成本的前提下显著提升了模型容量，从而能够生成具备电影级别美学和复杂运动表现的高质量视频。项目中包含专门用于文本到视频（T2V）、图像到视频（I2V）以及高效混合文本-图像到视频（TI2V）的模型，其中TI2V-5B模型尤其突出，它通过高压缩率的Wan2.2-VAE，实现了在消费级GPU上以720P@24fps分辨率快速生成视频，是目前同类模型中的佼佼者。Wan2.2还支持通过AI模型进行智能提示词扩展，以进一步丰富生成视频的细节；并通过FSDP和DeepSpeed Ulysses技术优化了多GPU推理效率。该模型已集成到ComfyUI和Diffusers等主流平台，并在性能对比中展现出超越领先商业模型的卓越能力，全面满足工业界和学术界对先进视频生成技术的需求。

Wan2.2

本指南使用到的工具