WideSearch

WideSearch WideSearch Seed

1 分钟阅读

WideSearch

WideSearch是由字节跳动Seed团队开发的一个基准测试项目,专注于评估代理在处理大规模、重复性高的“宽泛”信息收集任务时的能力。该项目与传统强调深度搜索或报告合成的“深度”任务不同,其核心在于解决因信息量巨大而导致的工作效率瓶颈,要求代理能够系统化地查找并将海量信息整理成结构化输出,从而侧重于实现任务的详尽性和数据的高保真度。WideSearch提供了一个实验框架,支持测试单代理和多代理模式,并允许用户自定义搜索工具和模型参数,以严谨评估自动化过程中可能出现的幻觉和不完整性等挑战。