Hunyuan-A13B

Hunyuan-A13B Hunyuan-A13B MoE

2024-01-01 1 分钟阅读

Hunyuan-A13B

Hunyuan-A13B是一个创新且开源的大语言模型，它基于细粒度MoE架构，旨在以130亿活跃参数（总计800亿参数）提供高效且可扩展的尖端性能，特别适用于资源受限环境下的高级推理和通用应用。其核心功能包括支持快慢思维的混合推理模式、原生256K超长上下文理解能力、以及在智能体任务上的卓越表现。该模型通过Grouped Query Attention (GQA) 和多量化格式实现高效推理，并且已开源预训练、指令微调、FP8和INT4量化版本。其在多项基准测试（包括数学、科学、编码、推理和智能体领域）中展现出强大的竞争力，并提供了使用Hugging Face Transformers进行交互、模型训练指南，以及通过TensorRT-LLM、vLLM和SGLang进行部署的详细支持，包括预构建的Docker镜像和量化模型部署方案。

Hunyuan-A13B

本指南使用到的工具