Paper2Video
Paper2Video Paper2Video PaperTalker
Paper2Video
Paper2Video是一个旨在自动化科研论文演示视频生成并提供专业评估的开源项目。其核心功能分为两大部分:PaperTalker代理能够根据LaTeX论文源文件、参考图像和音频,自动生成包含幻灯片、字幕、光标定位、语音合成和数字人(talking-head)渲染的完整演示视频,并支持多种LLM/VLM模型进行内容处理;同时,Paper2Video还提供了一套专门设计的评估基准,包含Meta Similarity、PresentArena、PresentQuiz和IP Memory等创新指标,用以衡量生成视频在忠实传达论文核心思想、面向多样受众的可访问性以及提升作者学术贡献和作品影响力方面的表现,而非传统视频合成的视觉保真度。该项目致力于通过自动化和专业评估解决学术演示中的痛点,优化科研成果的传播效果。