Hunyuan 7B Hunyuan 7B Hunyuan 7B

Hunyuan 7B Hunyuan 7B Hunyuan-A13B

2024-01-01 1 分钟阅读

Hunyuan 7B

Hunyuan 7B是腾讯开源的高效大型语言模型系列，专为多样的计算环境设计，从边缘设备到高并发生产系统，提供先进的量化支持和超长上下文能力，确保在各种场景下实现最佳性能。该项目发布了0.5B到7B参数规模的预训练及指令微调模型，继承了Hunyuan-A13B的强劲性能特性，并支持灵活部署。其核心功能体现在支持快思与慢思的混合推理模式、原生256K超长上下文理解、为Agent任务优化的领先能力以及借助GQA和多量化格式实现的高效推理。项目在多项基准测试中展现了卓越性能，并支持通过Hugging Face Transformers库灵活集成，提供详细的微调数据格式指导和LLaMA-Factory训练方案。为实现高效部署，Hunyuan 7B利用AngelSlim工具进行FP8和INT4等多种量化压缩，且兼容TensorRT-LLM、vLLM、SGLang等主流推理框架，提供预构建的Docker镜像和详细的API服务启动指南，确保了在不同部署需求下的高效性和灵活性。

Hunyuan 7B

本指南使用到的工具