Paper2Web: Let's Make Your Paper Alive!

作者: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen

分类: cs.CL, cs.CV

发布日期: 2025-10-17

备注: Under Review. Check https://github.com/YuhangChen1/Paper2All for the unified platform to streamline all academic presentation

💡 一句话要点

Paper2Web：提出学术网页自动生成框架PWAgent，提升论文传播效果

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 学术网页生成 自主Agent 多维度评估 人机交互 内容呈现

📋 核心要点

现有学术网页生成方法难以兼顾布局感知、交互性与美观性，缺乏综合评估标准。
Paper2Web提出自主流程PWAgent，通过迭代优化内容和布局，将论文转化为交互式网页。
实验表明，PWAgent在网页质量和成本控制方面均优于现有基线方法，实现帕累托最优。

📝 摘要（中文）

学术项目网站通过清晰地呈现核心内容并实现直观的导航和交互，可以更有效地传播研究成果。然而，目前的方法，如直接使用大型语言模型（LLM）生成、模板或直接HTML转换，难以生成具有布局感知和交互性的网站。此外，也缺乏针对此任务的综合评估体系。本文介绍了Paper2Web，一个用于评估学术网页生成的基准数据集和多维度评估框架。它包含基于规则的指标（如连通性、完整性）和人工验证的LLM-as-a-Judge（涵盖交互性、美观性和信息性），以及PaperQuiz，用于衡量论文级别的知识保留。我们进一步提出了PWAgent，一个将科学论文转换为交互式和多媒体学术主页的自主流程。该Agent通过MCP工具迭代地改进内容和布局，从而增强重点、平衡和呈现质量。实验表明，PWAgent始终优于基于模板的网页和arXiv/alphaXiv版本等端到端基线，同时保持较低的成本，在学术网页生成中实现了帕累托最优。

🔬 方法详解

问题定义：现有学术网页生成方法，如直接使用LLM、模板或HTML转换，无法有效生成布局感知和交互性强的网页。同时，缺乏一个全面的评估框架来衡量生成网页的质量，导致难以系统性地改进现有方法。现有方法在内容呈现、用户交互和美观性方面存在不足，影响了研究成果的有效传播。

核心思路：Paper2Web的核心思路是构建一个自主的网页生成流程，该流程能够理解论文的内容和结构，并将其转化为具有良好布局、交互性和美观性的网页。通过迭代优化内容和布局，PWAgent旨在最大化网页的信息传递效率和用户体验。这种方法避免了对单一LLM的过度依赖，而是采用模块化的方式，利用不同的工具来处理不同的任务。

技术框架：PWAgent的技术框架包含以下几个主要模块：1) 论文解析模块：负责解析论文的结构和内容，提取关键信息。2) 内容生成模块：利用LLM生成网页的文本内容，例如摘要、介绍等。3) 布局设计模块：根据论文的结构和内容，设计网页的布局，例如标题、段落、图片的位置。4) 交互设计模块：添加交互元素，例如链接、按钮、动画等，提高用户体验。5) 迭代优化模块：通过MCP工具，迭代地改进内容和布局，直到达到预期的效果。

关键创新：Paper2Web的关键创新点在于提出了一个自主的、迭代的网页生成流程PWAgent。与传统的端到端方法相比，PWAgent能够更好地控制生成网页的质量和风格。此外，Paper2Web还提出了一个多维度的评估框架，用于衡量生成网页的质量，包括连通性、完整性、交互性、美观性和信息性。这个评估框架可以帮助研究人员更好地理解现有方法的优缺点，并指导未来的研究方向。

关键设计：PWAgent的关键设计包括：1) 使用MCP工具进行迭代优化，平衡内容和布局。2) 设计了PaperQuiz，用于衡量论文级别的知识保留，确保网页能够有效地传递论文的核心内容。3) 采用了LLM-as-a-Judge的方法，利用LLM来评估生成网页的交互性、美观性和信息性，从而避免了人工评估的成本和主观性。

📊 实验亮点

PWAgent在学术网页生成任务中显著优于现有基线方法，包括基于模板的网页和arXiv/alphaXiv版本。实验结果表明，PWAgent在网页质量（包括连通性、完整性、交互性、美观性和信息性）和成本控制方面均实现了帕累托最优，表明其在学术网页生成方面具有显著优势。

🎯 应用场景

该研究成果可应用于学术论文的自动网页生成，帮助研究者更有效地展示和传播其研究成果。通过提升学术网页的质量和用户体验，可以促进学术交流和知识共享。此外，该方法还可以扩展到其他类型的文档，例如技术报告、产品手册等，实现文档的自动化网页化。

📄 摘要（原文）

Academic project websites can more effectively disseminate research when they clearly present core content and enable intuitive navigation and interaction. However, current approaches such as direct Large Language Model (LLM) generation, templates, or direct HTML conversion struggle to produce layout-aware, interactive sites, and a comprehensive evaluation suite for this task has been lacking. In this paper, we introduce Paper2Web, a benchmark dataset and multi-dimensional evaluation framework for assessing academic webpage generation. It incorporates rule-based metrics like Connectivity, Completeness and human-verified LLM-as-a-Judge (covering interactivity, aesthetics, and informativeness), and PaperQuiz, which measures paper-level knowledge retention. We further present PWAgent, an autonomous pipeline that converts scientific papers into interactive and multimedia-rich academic homepages. The agent iteratively refines both content and layout through MCP tools that enhance emphasis, balance, and presentation quality. Our experiments show that PWAgent consistently outperforms end-to-end baselines like template-based webpages and arXiv/alphaXiv versions by a large margin while maintaining low cost, achieving the Pareto-front in academic webpage generation.

Paper2Web: Let's Make Your Paper Alive!

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册