斯坦福新研究：将学术论文定义成 AI Agent-机器人产业网

导读：近日，斯坦福大学发布关于 Paper2Agent 的论文，探索将学术论文转换为 AI Agent的自动化框架。传统的研究论文需要读者投入大量精力去理解论文的代码、数据和方法，并将其应用到自己的工作中，这给论文的传播和重用带来了障碍。Paper2Agent 将研究成果从被动的产物转化为主动的系统，从而...

近日，斯坦福大学发布关于 Paper2Agent 的论文，探索将学术论文转换为 AI Agent的自动化框架。

传统的研究论文需要读者投入大量精力去理解论文的代码、数据和方法，并将其应用到自己的工作中，这给论文的传播和重用带来了障碍。Paper2Agent 将研究成果从被动的产物转化为主动的系统，从而加速研究的使用、采用和发现。

斯坦福研究团队使用多个 Agent 系统地分析论文及其相关代码库，构建模型上下文协议 (MCP) 服务器，然后迭代生成并运行测试，以优化和增强生成的 MCP。这些论文 MCP 可以灵活地连接到聊天代理（例如 Claude Code），通过自然语言执行复杂的科学查询，同时调用原始论文中的工具和工作流程。

Paper2Agent 创建了一个利用 AlphaGenome 解析基因组变异的代理，以及基于 ScanPy 和 TISSUE 进行单细胞和空间转录组学分析的 Agent。这些 Agent 能够重现原始论文的结果，并能正确执行用户提出的新问题。通过将静态论文转化为动态、交互式的 AI 代理，Paper2Agent 为知识传播引入了一种新的范式，并为 AI 合作科学家的协作生态系统奠定了基础。

自动化的工作流程

Paper2Agent 将静态论文转化成动态的 AI Agent，使每个 Agent 都充当相应论文的互动专家，能够演示、应用并调整其方法以应用于新项目。

其工作流程如下：

Paper2Agent 通过构建包含工具、资源和提示的远程 MCP 服务器，将研究论文转化为交互式 AI 代理。将 AI 代理连接到服务器，即可创建针对不同任务的论文专用代理；

Paper2Agent 通过提取代码库，然后设置自动化环境以实现可重复性。核心分析功能被包装为 MCP 工具，然后通过迭代测试进行验证。最终生成的 MCP 服务器被远程部署并与 AI 代理集成，从而实现与论文方法和分析的自然语言交互。

转换过程包括：

识别论文的关键贡献（数据集、方法、模型或工作流）；

通过 MCP 服务器封装这些贡献，定义输入、输出和使用说明；

将 MCP 服务器连接到基于 LLM 的代理，实现自然语言查询和自主执行。然后，用户可以通过提问、请求演示或将方法应用于新数据来与论文进行交互。

与之前的研究相比，Paper2Agent 将研究成果从编码知识的文档或代码库转变为可执行和对话的知识实体。

三个研究案例

AlphaGenome 基因组数据解释 Agent

AlphaGenome 是一个人工智能模型，旨在预测人类 DNA 序列中单核苷酸变异或突变对各种调控过程的影响。Paper2Agent 将 AlphaGenome 论文转化为一个交互式 AlphaGenome Agent，从而实现基因组数据的自动解读。

通过自然语言查询，用户可以利用该代理对疾病相关变异的致病基因进行优先级排序，阐明单个变异的调控影响，并为具有特定调控功能的合成 DNA 的设计提供参考。

用于不确定性感知单细胞空间转录组学分析的 TISSUE Agent

TISSUE 是一篇近期发表的论文，它开发了一种新的不确定性感知单细胞空间转录组学分析方法。Paper2Agent 通过为各种论文自动生成即用型代理，并提供问答支持来指导输入准备并阐明该方法的功能，从而解决了这些挑战。

用于单细胞数据预处理的 Scanpy Agent

Scanpy 是一个广泛使用的综合软件包，用于分析大规模单细胞转录组数据。在实践中，单细胞数据分析中的许多工作流程可能仅依赖于 Scanpy 的部分功能。为了解决这个问题，Paper2Agent 不仅支持将整个方法转换为工具，还支持将论文方法的特定部分转换为工具，从而使 AI 代理能够仅显示与给定分析最相关的功能。

限制与展望

并非每篇论文都能无缝地转化为强大的代理。如果原始代码库不完整、文档记录不全或包含未解决的错误，Paper2Agent 就无法可靠地将其转化为功能强大的工具。

为了更好地量化这种可重复性和智能体的易用性，斯坦福团队引入了一种基准测试方法，该方法基于论文中手动评估的示例以及旨在测试泛化能力的新示例。这种方法可以证明 AlphaGenome 智能体能够以 100% 的准确率执行基于教程的查询和新查询。然而，这种方法受限于专家对论文和方法的了解以及手动执行和审查。未来的方向是通过额外的智能体框架（例如 LLM-as-judge 评估）进一步简化这一流程。

另一个限制因素是代理化的规模。论文并不是 Agent 化的最佳单位，每篇论文都会带来改进、基准或应用。在这种情况下，最有用的 Agent 可能并非代表一篇论文，而是一系列相关研究成果的集合。这些研究成果被聚合成一个连贯的界面，一个 MCP 可以封装多篇相关论文。基于这个因素，团队未来还计划扩展 Paper2Agent，以灵活地适应更广泛的应用范围。

最后，一旦知识被编码到主动代理而非静态构件中，其潜力将超越个人用途。代理之间可以相互交互，将方法与数据集关联，或整合来自不同领域的洞见。Paper2Agent 对未来的洞见是：科学交流不仅在于描述结果，还在于创建能够体现和扩展研究成果的交互式协作实体。

更多技术细节请查阅论文：https://arxiv.org/pdf/2509.06917

【免责声明】本站所刊内容仅代表作者本人观点，与机器人网站无关。机器人网站对文中陈述、观点判断保持中立。本网转载自其它媒体的信息，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如有侵权，请联系我们删除。
本文地址：http://www.jiqiren.org.cn/tt/1169.html