Hunyuan 7B Hunyuan 7B Hunyuan 7B
Hunyuan 7B Hunyuan 7B Hunyuan-A13B
Hunyuan 7B
Hunyuan 7B是腾讯开源的高效大型语言模型系列,专为多样的计算环境设计,从边缘设备到高并发生产系统,提供先进的量化支持和超长上下文能力,确保在各种场景下实现最佳性能。该项目发布了0.5B到7B参数规模的预训练及指令微调模型,继承了Hunyuan-A13B的强劲性能特性,并支持灵活部署。其核心功能体现在支持快思与慢思的混合推理模式、原生256K超长上下文理解、为Agent任务优化的领先能力以及借助GQA和多量化格式实现的高效推理。项目在多项基准测试中展现了卓越性能,并支持通过Hugging Face Transformers库灵活集成,提供详细的微调数据格式指导和LLaMA-Factory训练方案。为实现高效部署,Hunyuan 7B利用AngelSlim工具进行FP8和INT4等多种量化压缩,且兼容TensorRT-LLM、vLLM、SGLang等主流推理框架,提供预构建的Docker镜像和详细的API服务启动指南,确保了在不同部署需求下的高效性和灵活性。