Qwen-Image

Qwen-Image Qwen-Image MMDiT

1 分钟阅读

Qwen-Image

Qwen-Image是一款20B规模的MMDiT图像基础模型,其核心能力在于卓越的图像生成与编辑,尤其擅长高保真文本渲染,能精准无缝地将中英文本融入各种图像风格。该模型不仅支持从逼真到多种艺术风格的通用图像生成,还提供包括风格迁移、对象操作、细节增强以及图像内文本和人体姿态调整等高级编辑功能。此外,它还整合了目标检测、语义分割等图像理解任务,将其视为智能图像编辑的延伸。为优化用户体验和部署,项目提供了由Qwen-Plus驱动的提示词增强工具和支持多GPU并行处理的本地API服务器,并通过AI Arena开放基准测试平台持续评估模型性能,旨在成为一个综合性的智能视觉创作与操作解决方案。