DeepResearch

DeepResearch DeepResearch Tongyi DeepResearch

1 分钟阅读

DeepResearch

DeepResearch项目推出了通义深研(Tongyi DeepResearch),这是一个由通义实验室专为长周期、深度信息检索任务设计和开发的智能体大语言模型。该模型拥有305亿总参数,每token激活33亿,其核心优势在于采用全自动化合成数据生成管道进行智能体预训练、有监督微调及强化学习,并利用大规模智能体数据进行持续预训练以扩展能力、保持时效性并强化推理表现。通义深研通过基于定制Group Relative Policy Optimization框架的端到端强化学习进行优化,并支持ReAct和IterResearch两种推理范式,以实现核心能力的严格评估或最大化性能。该项目在多项智能体搜索基准测试中展现出卓越的性能,并作为阿里巴巴-NLP“深研智能体家族”系列研究的关键组成部分。