/ 目录 / 演练场 / arXiv
● 社区 blazickjp ⚡ 即开即用

arXiv

作者 blazickjp · blazickjp/arxiv-mcp-server

在 arXiv 上搜索、下载论文,让 Claude 阅读和总结它们——为最新预印本提供的轻量级研究助手。

arxiv-mcp-server 让 Claude 能按关键词、类别、日期搜索 arXiv,下载 PDF,提取文本在对话中阅读。无需 API 密钥;arXiv 完全公开。适合进行文献综述、论文总结,以及跟进快速发展的 ML、物理和 CS 领域。

为什么要用

核心特性

实时演示

实际使用效果

arxiv.replay ▶ 就绪
0/0

安装

选择你的客户端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

打开 Claude Desktop → Settings → Developer → Edit Config。保存后重启应用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

Cursor 使用与 Claude Desktop 相同的 mcpServers 格式。项目级配置优先于全局。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

点击 Cline 侧栏中的 MCP Servers 图标,然后选 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  }
}

格式与 Claude Desktop 相同。重启 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "arxiv",
      "command": "uvx",
      "args": [
        "arxiv-mcp-server"
      ]
    }
  ]
}

Continue 使用服务器对象数组,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "arxiv": {
      "command": {
        "path": "uvx",
        "args": [
          "arxiv-mcp-server"
        ]
      }
    }
  }
}

加入 context_servers。Zed 保存后热重载。

claude mcp add arxiv -- uvx arxiv-mcp-server

一行命令搞定。用 claude mcp list 验证,claude mcp remove 卸载。

使用场景

实战用法: arXiv

为小众主题构建迷你文献综述

👤 研究人员、研究生、好奇的工程师 ⏱ ~25 min intermediate

何时使用: 你正在开始某个主题的工作(例如'推测式解码'),想要前 10 篇最相关的最新论文及其总结。

前置条件
  • 本地缓存目录可写 — 默认在用户主目录下;可通过 ARXIV_STORAGE_PATH 覆盖
步骤
  1. 策略性搜索
    在 cs.CL 或 cs.LG 中搜索 arXiv 的'推测式解码',最近 12 个月,按相关性排序。前 20 篇。✓ 已复制
    → arxiv id 列表 + 标题 + 摘要
  2. 下载排名靠前的候选论文
    本地下载前 10 篇论文。✓ 已复制
    → 论文已缓存;返回本地路径
  3. 用一段话总结每一篇
    对每篇已下载的论文,提取文本并写一份 4 行总结:问题、方法、结果、局限。保留 arxiv id。✓ 已复制
    → 带引用的结构化总结

结果: 一份 10 篇论文的综述表,可用于相关工作部分或博客文章。

注意事项
  • arXiv 的相关性排序较弱;你会错过其他排序方式下的重要论文 — 也可按 submittedDate 降序搜索;通过 Semantic Scholar / Google Scholar 的引用数交叉验证
搭配使用: filesystem · qdrant

深度阅读单篇论文并进行问答

👤 阅读复杂论文的任何人 ⏱ ~20 min beginner

何时使用: 你有一篇特定的论文(比如 FlashAttention-3 论文),想要理解它而无需独自阅读整个 PDF。

步骤
  1. 下载论文
    下载 arxiv 论文 2405.12345。报告页数和总字数。✓ 已复制
    → 文件已缓存 + 统计信息
  2. 按部分总结
    读论文。给我一份分部分总结。每个部分:目标、关键点、任何值得理解的方程(用通俗英文)。✓ 已复制
    → 结构化讲解
  3. 提出针对性问题
    具体问题:[你的问题]。仅根据论文回答;引用部分和任何方程编号。✓ 已复制
    → 带引用的有根据的答案

结果: 在 20 分钟内达到论文级别的理解,而不是 2 小时。

注意事项
  • PDF 提取会破坏方程和表格 — 对于数学密集的论文,让 Claude 注意'方程提取可能不可靠'并根据 PDF 交叉检查关键公式

你所在领域的每周新论文摘要

👤 学者、追踪某个领域的 ML 工程师 ⏱ ~15 min beginner

何时使用: 周一早上:'最近 7 天在 cs.CL 中提交的新论文有哪些值得一读?'

步骤
  1. 获取最近的提交
    搜索最近 7 天的 arXiv cs.CL 提交。按相关性或任意顺序返回前 50 篇。✓ 已复制
    → 最近论文列表
  2. 按你关心的关键词筛选
    仅保留标题或摘要提到 [你的关键词] 的论文。去重。✓ 已复制
    → 缩小的候选列表
  3. 摘要消化
    对每篇保留的论文,从摘要中生成 2 行'为什么它可能重要'。标记 3 篇为必读。✓ 已复制
    → 每周摘要

结果: 一份精选的周阅读清单,不用在 arxiv-sanity 上无尽地滚动。

注意事项
  • 摘要过度宣传;'必读'标签可能有误 — 把标签视为自己读摘要的提示,而不是认可
搭配使用: notion

组合

与其他 MCP 搭配,撬动十倍杠杆

arxiv + qdrant

构建一个可搜索的论文库用于语义检索

下载关于'混合专家'的前 30 篇论文。将每个块索引到 Qdrant 集合 papers_moe 中。稍后回答:'MoE 论文使用什么技巧来进行负载均衡?'✓ 已复制
arxiv + filesystem

编写带有内联引用的 markdown 综述文件

下载关于主题 X 的 10 篇论文,将总结保存到 /research/survey-X.md,并附上 [arxiv:id] 链接。✓ 已复制
arxiv + notion

将每周论文摘要发布到 Notion 研究数据库

运行 cs.CL 的每周摘要,创建一个 Notion 页面,将 5 篇必读论文作为行。✓ 已复制

工具

此 MCP 暴露的能力

工具输入参数何时调用成本
search_papers query: str, category?, max_results?, date_range? 按查询、类别、日期发现相关论文 free
download_paper paper_id 本地缓存 PDF 用于提取 free
read_paper paper_id 从缓存论文中提取文本用于阅读/问答 free
list_papers 查看已下载的内容以避免重新获取 free

成本与限制

运行它的成本

API 配额
arXiv 查询 API 建议 ~1 req/3s;更高的请求率可能会被限流
每次调用 Token 数
搜索:500–2000 tokens。论文文本:每篇论文 5k–30k tokens。
费用
免费
提示
积极缓存;论文下载后再次阅读其提取的文本是免费的。

安全

权限、密钥、影响范围

凭据存储: 无需凭据存储
数据出站: 查询到 export.arxiv.org;从 arxiv.org 下载 PDF

故障排查

常见错误与修复

对于明显存在的主题搜索结果为空

arXiv 搜索对引用字符串进行关键词精确匹配;尝试更广泛的术语和正确的类别前缀(cs.CL vs cs.AI)。

下载失败 / PDF 不可用

非常罕见;某些撤回的论文返回 404。在 arxiv.org/abs/<id> 上确认 id。

提取的文本是乱码

某些数学密集的论文有非标准 PDF;如果可用,尝试源版本,否则记下限制。

替代方案

arXiv 对比其他方案

替代方案何时用它替代权衡
Semantic Scholar MCP你需要引用计数和影响力指标不是 arXiv 专用;覆盖范围不同
Papers with Code MCP你想要与代码实现相关联的论文目录较小,专注于 ML

更多

资源

📖 阅读 GitHub 上的官方 README

🐙 查看未解决的 issue

🔍 浏览全部 400+ MCP 服务器和 Skills