Hunyuan-A13B

Hunyuan-A13B Hunyuan-A13B MoE

1 分钟阅读

Hunyuan-A13B

Hunyuan-A13B是一个创新且开源的大语言模型,它基于细粒度MoE架构,旨在以130亿活跃参数(总计800亿参数)提供高效且可扩展的尖端性能,特别适用于资源受限环境下的高级推理和通用应用。其核心功能包括支持快慢思维的混合推理模式、原生256K超长上下文理解能力、以及在智能体任务上的卓越表现。该模型通过Grouped Query Attention (GQA) 和多量化格式实现高效推理,并且已开源预训练、指令微调、FP8和INT4量化版本。其在多项基准测试(包括数学、科学、编码、推理和智能体领域)中展现出强大的竞争力,并提供了使用Hugging Face Transformers进行交互、模型训练指南,以及通过TensorRT-LLM、vLLM和SGLang进行部署的详细支持,包括预构建的Docker镜像和量化模型部署方案。