GraphRAG-Bench
GraphRAG-Bench GraphRAG-Bench GraphRAG
GraphRAG-Bench
GraphRAG-Bench项目是一个全面的基准测试平台,旨在评估图检索增强生成(GraphRAG)模型,其核心功能包括提供针对文学/虚构内容(Novel)和医疗/健康内容(Medical)的两个领域特定排行榜,通过准确性、ROUGE-L、覆盖率和事实得分等指标,在事实检索、复杂推理、语境摘要和创意生成等多个维度上量化模型性能。该项目致力于探究GraphRAG与传统RAG的区别,以明确GraphRAG在哪些场景下更具优势,并提供从简单事实查询到复杂创意叙事等四个不同难度的任务范例来全面评估模型能力。